Sunteți pe pagina 1din 33

statisticafeaa.weebly.

com
BAZELE STATISTICII
- anul universitar 2012-2013-
statisticafeaa.weebly.com
Programa analitic
1. Noiuni introductive
2. Analiza unei serii statistice unidimensionale, folosind
metode grafice i numerice (variabile numerice sau
cantitative: indicatori ai tendinei centrale, indicatori ai
dispersiei i indicatori ai formei; variabile nenumerice
sau calitative).
3. Analiza unei serii statistice bidimensionale.
4. Indicatori ai seriilor de timp.
statisticafeaa.weebly.com
Programa analitic
5. Probabiliti i distribuii teoretice
6. Estimarea parametrilor unei populaii
7. Testarea statistic
statisticafeaa.weebly.com
2. Analiza unei serii statistice
unidimensionale
2.1. Variabile cantitative
A. Variabil discret
A.1. Prezentarea seriei (distribuiei) statistice
- seria simpl X:(x
i
), cu i=1,m , cnd n
1
=n
2
= =n
i
.
- seria cu frecvene diferite X: , cnd n
i
n
j
.
X: , cu f
i
=n
i
/n.

i
i
n
x

i
i
f
x
statisticafeaa.weebly.com
Frecvene absolute cumulate cresctor (N
i
)
sau descresctor (N
i
)
- exprim numrul de uniti statistice cumulate pn la
sau peste nivelul considerat al caracteristicii, adic
valori x
i
, respectiv x
i
.

= + =
i
h
h i i i
n n N N
1
1

=
+
= + =
m
i h
h i i i
n n N N
1
statisticafeaa.weebly.com
Frecvene relative cumulate cresctor (F
i
)
sau descresctor (F
i
)
- exprim ponderea unitilor statistice cumulate pn
la sau peste nivelul considerat al caracteristicii, adic
valori x
i
, respectiv x
i
.

= + =
i
h
h i i i
f f F F
1
1

=
+
= + =
m
i h
h i i i
f f F F
1
statisticafeaa.weebly.com
A.2. Analiza seriei folosind metode numerice
Presupune calculul indicatorilor statisticii descriptive,
cunoscui i sub denumirea de caracteristici numerice ale
unei distribuii.
A.2.1. Indicatori ai tendinei centrale (mrimi medii)
a. Definire:
- mediile sunt acele valori n jurul crora se repartizeaz
unitile unei populaii.
- cele mai importante mrimi medii sunt media aritmetic,
modul i mediana.
statisticafeaa.weebly.com
A.2. Analiza seriei folosind metode numerice
b. Media aritmetic ( )
- Media aritmetic este valoarea pe care am observa-o dac
unitile statistice ar nregistra aceleai valori ale variabilei
(dac nu ar exista variaii ale valorilor nregistrate de
unitile statistice).
x
statisticafeaa.weebly.com
Mod de calcul n cazul seriilor simple i seriilor cu frecvene
diferite (variabil discret).
Media simpl:
Media ponderat.
sau
Observaie:
Media aritmetic este sensibil la prezena valorilor extreme
(outliers).
n
x
x
i
i

=
i
i
i
i
i
n
n x
x
i
i
i
f x x

=
statisticafeaa.weebly.com
Cele mai importante proprieti ale mediei aritmetice:
1. Media unei distribuii este o valoare intern:
x
min
x
max.
2. Media este o mrime normal: suma abaterilor valorilor
individuale ale unei variabile X de la media lor este egal cu
zero.
x
statisticafeaa.weebly.com
c. Modul (Mo)
este valoarea variabilei cea mai frecvent observat ntr-o
distribuie, adic valoarea x
i
care corespunde frecvenei
maxime (n
imax
).
Observaie:
modul poate fi aflat doar n cazul seriilor cu frecvene
diferite.
o distribuie poate avea una, dou sau mai multe valori
modale (serii unimodale, bimodale sau plurimodale).
Interpretare: Cele mai multe uniti nregistreaz valoarea
modal.
statisticafeaa.weebly.com
d. Mediana (Me)
- este acea valoare a variabilei unei serii ordonate, cresctor sau
descresctor, pn la care i peste care sunt distribuite n
numr egal unitile colectivitii: jumtate din uniti (50%)
au valori mai mici dect mediana, iar jumtate (50%) au valori
mai mari dect mediana.
- corespunde locului unitii mediane calculate astfel:
2
1 n
U
Me
+
=
statisticafeaa.weebly.com
Aflarea medianei se face diferit n funcie de tipul seriei:
1. Serii simple:
- numr impar de termeni.
- numr par de termeni.
2. Serii cu frecvene diferite
- se calculeaz unitatea median (U
Me
).
- se calculeaz
- se afl prima valoare
- valoarea x
i
corespunztoare acesteia este Me.
Observaie:
mediana nu este influenat de valorile extreme.

i
N
Me
i
U N
statisticafeaa.weebly.com
f. Quartilele
- sunt valori ale variabilei care mpart volumul eantionului n 4 pri
egale.
- reprezentare grafic i mod de calcul ( Q
1
, Q
2
, Q
3
).
g. Decile
- sunt valori ale variabilei care mpart volumul eantionului n 10 pri
egale.
- decila unu (D
1
) i decila 9 (D
9
).
statisticafeaa.weebly.com
A.2.2. Indicatori ai dispersiei (variaiei)
Definire:
- dispersia exprim gradul de variaie a valorilor individuale
ale unei variabile fa de nivelul mediu.
- aprecierea fenomenului de dispersie al unei distribuii
permite identificarea gradului de reprezentativitate a mediei
unei distribuii.
statisticafeaa.weebly.com
Indicatori sintetici ai dispersiei:
1. Abaterea medie liniar
, respectiv
arat cu ct variaz, n medie, valorile x
i
ale variabilei fa
de nivelul mediu al distribuiei, n sens pozitiv i negativ.


=
i
i
i
i
i
n
n x x
d
n
x x
d
i
i

=
statisticafeaa.weebly.com
2. Variana
, respectiv
Variana este ntotdeauna pozitiv, nu are unitate de
msur i nu se interpreteaz.
Prin ridicarea la ptrat a abaterilor valorilor x
i
fa
de medie crete influena valorilor extreme
asupra nivelului varianei.


=
i
i
i
i
i
n
n x x
s
2
2
) (
n
x x
s
i
i

=
2
2
) (
statisticafeaa.weebly.com
3. Abaterea standard (s)
arat cu ct variaz, n medie, valorile x
i
ale variabilei fa
de nivelul mediu al distribuiei, n sens pozitiv i negativ.
se calculeaz ca radical din varian.
se exprim n aceeai unitate de msur cu cea a variabilei.
,
) (
2
n
x x
s
i
i

=


=
i
i
i
i
i
n
n x x
s
2
) (
statisticafeaa.weebly.com
4. Coeficientul de variaie (v)
se exprim n procente.
valori ridicate ale acestui coeficient (v>50%) arat o
distribuie eterogen, care se caracterizeaz printr-o
variaie mare a valorilor x
i
fa de nivelul mediu i o medie
nereprezentativ.
este sensibil fa de valoarea mediei: cu ct media este mai
apropiat de zero, cu att coeficientul de variaie este mai
dificil de folosit (tinde spre infinit).
100
x
s
v =
statisticafeaa.weebly.com
5. Intervalul interquartilic
I
Q
=Q
3
-Q
1
.
- cuprinde 50% din volumul eantionului.
n mod sintetic, cele mai importante caracteristici numerice
ale unei distribuii pot fi cuplate astfel:
media - abaterea standard - coeficientul de variaie;
mediana - intervalul interquartilic.
statisticafeaa.weebly.com
A.2.3. Indicatori ai formei
1. Asimetria:
- reprezint o deviere de la forma simetric a unei distribuii.
Asimetria poate fi apreciat:
- pe cale grafic: curba frecvenelor, diagrama box-plot.
- pe cale numeric: - prin calculul indicatorilor de asimetrie
(Skewness).
Coeficientul de asimetrie Fisher: , cu
3
3
1
s

=
n
x x
i
i
3
3
) (


=
statisticafeaa.weebly.com
Relaii ntre cele trei mrimi medii
Arat forma unei distribuii:
1. Cnd distribuia este simetric.
2. Cnd distribuia este asimetric la
dreapta (asimetrie pozitiv).
3. Cnd distribuia este asimetric la
stnga (asimetrie negativ).
Me Mo x = =
Mo Me x > >
Mo Me x < <
statisticafeaa.weebly.com
2. Boltirea
- este definit prin compararea distribuiei empirice cu
distribuia normal din punctul de vedere al variaiei
variabilei X i a frecvenei n
i
.
Boltirea poate fi apreciat:
pe cale grafic: curba frecvenelor.
- numeric: prin calculul indicatorilor boltirii (kurtosis).
Coeficientul de boltire Fisher:
, cu
3 3
4
4
2
2
4
2
= =
s

n
x x
i
i
4
4
) (


=
statisticafeaa.weebly.com
A.3. Analiza seriei folosind metode grafice
a. Poligonul frecvenelor:
- construirea acestuia presupune gsirea locului geometric al
punctelor A
i
de coordonate (x
i
,n
i
) sau (x
i
,f
i
) i unirea
acestora prin segmente de dreapt.
- aproximeaz forma unei distribuii.
b. Histograma
c. Curba frecvenelor
- presupune ajustarea printr-o linie curb, continu a
histogramei.
- aproximeaz mai bine forma de distribuie a colectivitii
dup variabila considerat, comparativ cu histograma.
statisticafeaa.weebly.com
statisticafeaa.weebly.com
d. Reprezentarea diagramei box-plot sau box-and-whiskers
Forma diagramei (D
1
, Q
1
, Q
2
, Q
3,
D
9
);
Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei i
asimetriei unei distribuiei;
- faciliteaz compararea mai multor distribuii (prin
reprezentarea simultan a diagramelor).
statisticafeaa.weebly.com
Diagrama box-plot
Analysis weighted by NRSTUD
NOTA
11 10 9 8 7 6 5 4 3
1
statisticafeaa.weebly.com
identificarea valorilor extreme i analiza influenei lor asupra
rezultatelor statistice (diagrama box-plot).
statisticafeaa.weebly.com
Indicatorii statisticii descriptive n Excel
Column1
Mean 8.6
Standard Error 0.347735
Median 8
Mode 10
Standard Deviation 1.904622
Sample Variance 3.627586
Kurtosis -0.14315
Skewness -0.40554
Range 8
Minimum 4
Maximum 12
Sum 258
Count 30
statisticafeaa.weebly.com
B. Variabil continu
B.1. Prezentarea seriei statistice
- gruparea unitilor statistice este realizat pe intervale de
variaie.
Observaie:
- Gruparea pe intervale de variaie duce la pierderea unei pri
a informaiei iniiale.
B.2. Prelucrarea seriei statistice folosind metode grafice
a. Histograma
statisticafeaa.weebly.com
b. Poligonul frecvenelor
c. Curba frecvenelor
B.3. Indicatori ai statisticii descriptive
- se calculeaz n mod identic, prin discretizarea variabilei
(calculul mijlocului intervalelor de variaie).
statisticafeaa.weebly.com
2. Analiza unei serii univariate
2.2. Variabil calitativ
I. Tipuri de variabile
A. Variabile nominale
B. Variabile ordinale
statisticafeaa.weebly.com
II. Indicatori specifici si reprezentare grafic
a) Variabile nominale:
Pentru a reprezenta structura pe categorii la nivelul unui
eantion se calculeaz frecvene relative.
Reprezentarea frecvenelor pentru un eantion se realizeaz
folosind diagramele: Bar Chart sau Pie Chart.
Indicatori specifici: modul.
b) Variabile ordinale:
Reprezentarea frecvenelor pentru un eantion se realizeaz
folosind diagramele: Bar Chart sau Pie Chart.
Frecvene absolute i relative.
Indicatori specifici: modul i quartilele.

S-ar putea să vă placă și