Documente Academic
Documente Profesional
Documente Cultură
Cuprins
2.1 Analiza grafică
2.2 Analiza numerică. Indicatori ai statisticii descriptive
2.3 Aplicaţie în SPSS
Obiective
- prezentarea tipurilor de frecvenţe utilizate în analiza uunei serii discrete
- prezentarea tipurilor de grafice specifice unei serii discrete
- definirea indicatorilor descriptivi, a proprietăţilor, a modului de calcul şi a interpretării acestora
- realizarea de exemple cu date reale
- prezentarea modului de analiză gafică şi numerică a unei serii discrete în SPSS
Competenţe
- însuşirea principalelor metode de analiză grafică şi numerică a unei serii discrete
- dezvoltarea abilităţilor practice de prelucrare şi interpretare a datelor statistice sistematizate într-o
serie discretă
- dezvoltarea capacităţii de utilizare a softului statistic pentru prelucrarea automată a datelor
- capacitatea de a realiza o sinteză a informaţiei statistice, având la dispoziţie rezultatele analizei
grafice şi numerice
Termen mediu: 4 h
Bibliografie
1. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
2. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
3. Jaba, E., Pintilescu, C., Statistică. Teste grilă şi probleme, Editura Sedcom Libris, Iaşi, 2005.
4. Jaba, E., Grama, A., Analiza statistică cu SPSS sub Windows, Ed. Polirom, Iaşi, 2004
5. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
6. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
7. McNabb, D., Research methods in public administration and nonprofit management : quantitative
and qualitative approaches, Armonk, M.E. Sharpe, 2002
8. Rosental, C. and C. Frémontier-Murphy, Introduction aux méthodes quantitatives en sciences
humaines et sociales, Paris, Dunod, 2001
9. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti, 1969.
10. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
Analiza unei serii statistice discrete se realizează cu ajutorul metodelor grafice şi numerice.
În continuare prezentăm câteva coordonate ale acestor tipuri de analiză.
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Tabelul 2.1. Distribuţia studenţilor unei serii
după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210
Rezolvare
Frecvenţe absolute cumulate crescător( Ni↓)
Frecvenţele absolute cumulate crescător se calculează după relaţia:
i
N i N i 1 ni nh .
h 1
Pentru exemplul dat, avem:
N 1 n1 10 ;
N 2 N 1 n2 10 25 35;
N 3 N 2 n3 35 40 75 etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:
Interpretare
Numărul studenţilor care au obţinut nota 4 la examen este de 10 studenţi. Numărul
studenţilor care au obţinut cel mult nota 5 este de 35 persoane. Numărul studenţilor care au obţinut
cel mult nota 6 este de 75 persoane. În mod similar, se interpretează celelalte rezultate.
Observaţie
În calculul frecvenţelor absolute cumulate crescător, ultima valoare Ni↓ este întotdeauna
egală cu volumul total al eşantionului observat. În exemplul dat, avem N7↓=n=210.
Interpretare
Numărul studenţilor care au obţinut nota 10 la examen este de 5 studenţi. Numărul
studenţilor care au obţinut peste nota 9 este de 25 persoane. Numărul studenţilor care au obţinut
peste nota 8 este de 80 persoane. În mod similar, se interpretează celelalte rezultate.
Interpretare
Ponderea studenţilor care au obţinut nota 4 la examen este de 4,76% din numărul total de
studenţi. Ponderea studenţilor care au obţinut nota 5 este de 11,91%, iar ponderea studenţilor care
au obţinut nota 6 este de 19,05%. În mod similar, se interpretează celelalte rezultate.
Frecvenţe relative cumulate crescător ( Fi )
Frecvenţele relative cumulate crescător se calculează după relaţia:
i
Fi Fi 1 f i f h .
h 1
Pentru exemplul dat, avem:
F1 f 1 4 ,76% ;
F2 F1 f 2 4 ,76 11,91 16 ,67%;
F3 F2 f 3 16 ,67 19,05 35,72% etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:
Interpretare
Ponderea studenţilor care au obţinut nota 4 la examen este de 4,76% din numărul total de
studenţi. Ponderea studenţilor care au obţinut cel mult nota 5 este de 16,67%. Ponderea studenţilor
care au obţinut cel mult nota 6 este de 35,72%. În mod similar, se interpretează celelalte rezultate.
Poligonul frecvenţelor
Construirea poligonului frecvenţelor presupune găsirea locului geometric al punctelor Ai de
coordonate (xi , ni) sau (xi , fi) şi unirea acestora prin segmente de dreaptă. Poligonul frecvenţelor
aproximează forma unei distribuţii.
Alura poligonului frecvenţelor este reprezentată în figura de mai jos:
Curba frecvenţelor
Construirea curbei frecvenţelor presupune ajustarea printr-o linie curbă, continuă a
poligonului frecvenţelor. Curba frecvenţelor aproximează mai bine forma de distribuţie a
colectivităţii după variabila considerată.
Alura curbei frecvenţelor este reprezentată în figura de mai jos:
Curba frecvenţelor pentru distribuţia dată se compară cu forma curbei frecvenţelor pentru o
distribuţie normală, cunoscută sub denumirea de Clopotul lui Gauss. Această curbă este o curbă
simetrică faţă de nivelul mediu: jumătate din unităţi au valori mai mici decât nivelul mediu, iar
jumătate au valori mai mari.
În urma prelucrării datelor la nivelul unui eşantion, pot fi obţinute următoarele forme ale
distribuţiei unităţilor:
a. Media aritmetică ( x )
Media aritmetică pentru o serie statistică după o variabilă discretă se calculează după
relaţiile:
xi
x i , pentru o serie simplă de valori;
n
x i ni
x i , pentru o serie cu frecvenţe ni.
ni
i
2. Pentru o serie cu frecvenţe, media aritmetică este plasată între valorile extreme, oscilând în jurul
valorii cu frecvenţa dominantă.
Media este considerată în statistică un punct de echilibru, similar centrului de greutate în
fizică. Dacă o serie nu prezintă o asimetrie pronunţată, atunci media va fi în apropierea valorii cu
frecvenţa cea mai mare.
3. Media este o mărime normală, adică suma abaterilor valorilor individuale ale unei variabile X de
la media lor este egală cu zero:
( xi x ) 0 , pentru o serie simplă de valori;
i
Exemple
1. Vânzările unei firme (mil. Lei) înregistrate timp de cinci zile sunt: 10, 9, 8 7, 7. Se cere să
se calculeze media aritmetică.
Rezolvare
Media aritmetică pentru o serie simplă de valori se calculează după relaţia:
xi
x i .
n
Pentru exemplul dat, obţinem:
xi 10 9 8 7 7
x i 8 ,2 mil. Lei.
n 5
Interpretare
Nivelul mediu al vânzărilor zilnice ale firmei este de 8,2 mil. Lei.
2. Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie
2009 se prezintă astfel:
Rezolvare
Media aritmetică pentru o serie statistică cu frecvenţe se calculează după relaţia
x i ni
x i .
ni
i
Elementele pentru calculul mediei aritmetice sunt prezentate în tabelul de mai jos:
Tabelul 2.8. Elementele pentru calculul mediei aritmetice
xi ni x i ni
4 10 40
5 25 125
6 40 240
7 55 385
8 60 480
9 15 135
10 5 50
TOTAL ni 210 xi ni
i i
1455
b. Modul (Mo)
Modul este valoarea variabilei cea mai frecvent observată într-o distribuţie, adică valoarea xi
care corespunde frecvenţei maxime (nimax).
Aflarea modului presupune identificarea valorii xi corespunzătoare frecvenţei maxime
(nimax).
Exemple
1. Vânzările unei firme A (mil. Lei) înregistrate timp de cinci zile sunt: 10, 9, 8 7, 7. Se cere
să se afle modul.
Rezolvare
Pentru aflarea modului, trebuie identificată valoarea xi corespunzătoare frecvenţei maxime
(nimax). Frecvenţa maximă este nimax=2, iar valoarea xi corespunzătoare este xi=7. Pentru seria dată,
modul este: Mo=7 mil. Lei.
Interpretare
Valoarea vânzărilor cea mai frecvent înregistrată de firma A este de 7 mil. Lei pe zi.
2. Vânzările unei firme A (mil. Lei) înregistrate timp de cinci zile sunt: 10, 8, 8 7, 7. Se cere
să se afle valoarea modului.
Rezolvare
Pentru aflarea modului, trebuie identificată valoarea xi corespunzătoare frecvenţei maxime
(nimax). Frecvenţa maximă este nimax=2, iar valorile xi corespunzătoare sunt xi=7 şi xi=8. Seria dată
este o serie bimodală, valorile modului fiind de 7 mil. Lei şi de 8 mil. Lei.
Interpretare
Valorile vânzărilor cele mai frecvente sunt de 7 mil. Lei şi de 8 mil. Lei pe zi .
3. Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie
2009 se prezintă astfel:
Tabelul 2.9. Distribuţia studenţilor unei serii
după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
Mo=8 60
9 15
10 5
TOTAL 210
Rezolvare
Pentru aflarea modului, se află frecvenţa maximă: nimax=60. Valoarea xi care corespunde
acestei frecvenţe maxime este xi=8. Pentru seria dată, modul este: Mo=8.
Interpretare
Cei mai mulţi studenţi au luat la examenul din sesiunea iunie 2009 nota 8.
c. Mediana (Me)
Mediana reprezintă acea valoare a variabilei care împarte seria ordonată crescător în două
părţi egale: jumătate din unităţi au valori mai mici decât mediana, iar jumătate au valori mai mari
decât mediana.
Aflarea medianei se realizează diferit în funcţie de tipul seriei:
Exemplu
Se consideră seria reprezentată de valorile 10, 9, 11, 6, 7, 8. Pentru aflarea medianei, şirul
valorilor se ordonează în sens crescător: 6, 7, 8, 9, 10, 11. Mediana este reprezentată de media
aritmetică simplă a celor doi termeni centrali ai seriei ordonate crescător, respectiv
89
Me 8 ,5 .
2
cu număr impar de termeni, mediana este reprezentată de termenul central al seriei ordonate
crescător.
Exemplu
Se consideră seria reprezentată de valorile 10, 9, 11, 6, 7. Pentru aflarea medianei, şirul
valorilor se ordonează în sens crescător: 6, 7, 9, 10, 11. Mediana este reprezentată de termenul
central al seriei ordonate crescător, respectiv Me 9 .
2. Pentru o serie cu frecvenţe după o variabilă discretă
Aflarea medianei presupune parcurgerea următoarelor etape:
se calculează unitatea mediană:
ni
Me
- atunci când n 100 , unitatea mediană este : U i ;
2
ni 1
Me
- atunci când n 100 , unitatea mediană este U i .
2
se calculează frecvenţele absolute cumulate crescător, Ni↓;
se află prima valoare Ni↓≥UMe;
valoarea xi corespunzătoare acestei frecvenţe Ni↓≥UMe este mediana.
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen, în sesiunea iunie 2009,
se prezintă astfel:
Rezolvare
Etape pentru aflarea medianei:
ni
210
Me i
se calculează unitatea mediană: U 105 ;
2 2
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Interpretare
Jumătate din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă
de până la 7, iar jumătate au luat peste 7.
Observaţie
Locul medianei într-o distribuţie depinde de forma acesteia. Doar în cazul unei distribuţii
simetrice mediana este termenul central al seriei.
Exemplu
Se consideră distribuţiile a două serii, prezentate în tabelele de mai jos:
Seria I
xi ni
1 20
2 40
3 20
4 15
5 5
TOTAL 100
Seria II
xi ni
1 10
2 20
3 40
4 20
5 10
TOTAL 100
Rezolvare
Pentru seria I, aflarea medianei presupune parcurgerea următoarelor etape:
ni 100
Me
se calculează unitatea mediană: U i 50 ;
2 2
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Tabelul 2.12. Frecvenţele absolute cumulate crescător
pentru seria I
xi ni Ni
1 20 20
Me=2 40 60
3 20 80
4 15 95
5 5 100
TOTAL 100 -
prima valoare Ni↓≥UMe este N i 60 U Me 50 .
valoarea xi corespunzătoare frecvenţei Ni↓≥UMe este Me=2.
Se observă că poziţia medianei pentru cele două distribuţii diferă, deşi volumul colectivităţii
este acelaşi, n=100. Seria I este o serie asimetrică, spre deosebire de seria II care este o distribuţie
simetrică. În acest ultim caz, mediana este reprezentată de termenul central al seriei.
1. Quartilele
Quartilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în 4 părţi
egale.
Poziţia celor trei quartile într-o distribuţie simetrică este prezentată în figura de mai jos:
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen, în sesiunea iunie 2009,
se prezintă astfel:
Rezolvare
Quartila unu
210
ni
Q1 i
se calculează unitatea quartilică unu: U 52,5 ;
4 4
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Tabelul 2.15. Frecvenţele absolute cumulate crescător
xi ni N1
4 10 10
5 25 35
Q1=6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -
Interpretare
25% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 6, iar 75% au luat peste 6.
Quartila trei
3 ni
Q3 3 210
i
se calculează unitatea quartilică trei: U 157,5 ;
4 4
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
se află prima valoare Ni↓≥UQ3. Pentru exemplul dat, N i 190 U Q3 157 ,5.
valoarea xi corespunzătoare primei frecvenţe Ni↓≥UQ3 este quartila trei. Pentru exemplul dat,
Q3=8.
Interpretare
75% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 8, iar 25% au luat peste 8.
2. Decilele
Decilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în 10 părţi
egale. Cele mai importante decile sunt decila unu şi decila nouă.
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Rezolvare
Decila unu
210
ni
D1 i
se calculează unitatea decilică unu: U 21 ;
10 10
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Interpretare
10% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 5, iar 90% au luat peste 5.
Decila nouă
9 ni
D9 i 9 210
se calculează unitatea decilică nouă: U 189 ;
10 10
se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Interpretare
90% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 8, iar 10% au luat peste 8.
D1 Q1 Q2 Q3 D9
b. Indicatorii dispersiei
Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaţie
Amplitudinea de variaţie măsoară distanţa dintre nivelul maxim şi nivelul minim al unei
variabile. Se calculează pe baza relaţiei:
A xmax xmin .
Acest indicator permite aprecierea întinderii domeniului de variaţie al variabilei X.
Dezavantajul acestui indicator constă în faptul că nu „pătrunde” în interiorul distribuţiei, respectiv
între cele două valori extreme ale variabilei.
2. Varianţa
Varianţa este media pătratelor abaterilor valorilor xi de la nivelul mediu şi poate fi calculată
pe baza relaţiei:
( xi x ) 2
s2 i , pentru o serie simplă;
n
( x i x ) 2 ni
s2 i , pentru o serie cu frecvenţe.
ni
i
Varianţa nu are unitate de măsură şi nu se interpretează.
4. Coeficientul de variaţie
Întrucât abaterea standard şi media se exprimă în aceeaşi unitate de măsură cu cea a
variabilei X, aceşti indicatori nu pot fi folosiţi pentru a compara două serii de date care sunt
exprimate în unităţi de măsură diferite. Pentru a înlătura acest inconvenient, se calculează
coeficientul de variaţie, după relaţia:
s
v 100 .
x
Prin evaluarea acestui coeficient se poate aprecia gradul de reprezentativitate a mediei unei
distribuţii. În general, o valoare a coeficientului de variaţie mai mică de 50% arată că media este
reprezentativă.
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Rezolvare
Cei mai importanţi indicatori ai dispersiei sunt: amplitudinea de variaţie, varianţa, abaterea
standard şi coeficientul de variaţie.
Amplitudinea de variaţie
Amplitudinea de variaţie se calculează pe baza relaţiei:
A xmax xmin 10 4 6 .
Interpretare
Diferenţa dintre nivelul maxim şi nivelul minim al variabilei X este egală cu 6.
Varianţa
Varianţa se calculează pe baza relaţiei:
( x i x ) 2 ni
s2 i . Pentru această distribuţie, media este x 6 ,93 .
ni
i
Elementele de calcul ale varianţei sunt prezentate în tabelul de mai jos:
Tabelul 2.21. Elemente de calcul ale varianţei
xi ni xi x ( xi x ) 2 ( x i x ) 2 ni
4 10 -2,93 8,58 85,85
5 25 -1,93 3,72 93,12
6 40 -0,93 0,86 34,60
7 55 0,07 0,00 0,27
8 60 1,07 1,14 68,69
9 15 2,07 4,28 64,27
10 5 3,07 9,42 47,12
TOTAL 210 - - 393,93
Abaterea standard
Abaterea standard se calculează pe baza relaţiei:
s s 2 1,876 1,37 .
Interpretare
Notele obţinute de studenţii din seria dată variază, în medie, faţă de nota medie cu 1,37~1
punct, în sens pozitiv şi negativ.
Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s 1,37
v 100 100 19,77% .
x 6 ,93
Interpretare
Valoarea coeficientului de variaţie arată că distribuţia studenţilor după nota obţinută la un
examen în sesiunea iunie 2009 este o distribuţie omogenă, caracterizată printr-o dispersie mică
(v<50%). Media este reprezentativă pentru această distribuţie.
Reprezentarea grafică a două distribuţii caracterizate prin aceeaşi medie şi dispersii diferite
este realizată în figura de mai jos:
0 0.01 0.05
0
0.1
0.2
1 0,341
1.1 0,375
Pe prima coloană sunt valorile lui z, întregul şi prima zecimală, iar valorile din următoarele
coloane reprezintă a doua zecimală a valorii zi. Valorile din interiorul tabelul arată proporţia
unităţilor care înregistrează valori cuprinse între nivelul mediu şi scorul z corespunzător.
De exemplu, pentru o valoare zi=1,15, se citeşte 0,375. Această valoare arată că aproximativ
37,5% din unităţile distribuţiei înregistrează valori cuprinse între nivelul mediu şi valoarea zi=1,15.
În Tabelul Z nu sunt valori negative pentru zi, însă distribuţia normală este o distribuţie
simetrică, deci aria suprafeţei cuprinse între nivelul mediu şi valoarea pozitivă sau negativă a lui Z
este aceeaşi.
Exemple
1. Pentru o distribuţie normală de medie, x , şi abatere standard, s, să se afle proporţia
unităţilor care înregistrează valori cuprinse în intervalele ( x s ), ( x 2 s ) şi ( x 3 s ).
Rezolvare
Pentru a afla proporţia unităţilor care înregistrează valori cuprinse în intervalul
( x s; x s ) , se calculează scorul Z, astfel:
x x xsx
z1 1 1
s s
x x xsx
z2 2 1 .
s s
Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=1, şi anume 0,341.
0 0.01 0.05
0
0.1
0.2
1 0,341
1.1 0,375
Această valoare, 0,341, reprezintă aria suprafeţei cuprinse între nivelul mediu şi zi=1.
Proporţia unităţilor care înregistrează valori cuprinse în intervalul ( x s; x s ) este:
2 0 ,341 0 ,682 sau 68,2%.
0 0.05
0
0.1
0.2
2 0,477
0 0.05
0
0.1
0.2
3 0,499
2. Distribuţia unor studenţi după nota obţinută la un test urmează o lege normală şi se
caracterizează prin următoarele rezultate: x 7 şi s=2. Se cere să se afle proporţia studenţilor care
au luat note mai mici decât 6.
Rezolvare
Valoarea Zi care corespunde unei valori xi=6 se calculează astfel:
x x 67
zi i 0,5
s 2
Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=0,5, egală cu 0,191.
0 0.01 0.05
0
0.1
0.2
0,5 0,191
Proporţia studenţilor care au luat note mai mici decât 6 este f=0,5-0,191=0,309 sau 30,9%.
Observaţie
Aria suprafeţei reprezentate în figura de mai sus este egală cu unu (după cum am precizat
anterior, suma proporţiilor este egală cu 1 sau 100%). Distribuţia normală este o distribuţie
simetrică, deci proporţia unităţilor care au valori mai mari decât nivelul mediu este de 0,5.
3. Distribuţia unor persoane după vârstă urmează o lege normală şi se caracterizează prin
următoarele rezultate: x 30 ani şi s=4 ani. Se cere să se afle proporţia persoanelor care au o
vârstă cuprinsă între 27 ani şi 35 ani.
Rezolvare
Valorile lui Z corespunzătoare lui x1=27 şi x2=35 sunt:
x x 27 30
z1 1 0 ,75
s 4
x x 35 30
z2 2 1,25 .
s 4
Din tabelul Z se citesc valorile corespunzătoare lui z1=-0,75 şi z2=+1,25, astfel:
0 0.05
0
0.1
0.2
0,7 0,273
1,2 0,394
Rezolvare
Această problemă poate fi prezentată grafic astfel:
Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat anterior: se
cunoaşte proporţia (95%) şi trebuie să aflăm valoarea zi care corespunde acestei proporţii.
Pentru a afla valoarea zi, se calculează aria suprafeţei cuprinsă între nivelul mediu şi z, care
95%
este egală cu 47 ,5% sau 0,475.
2
0 0.06
0
0.1
0.2
1,9 0,475
Prin urmare, într-o distribuţie normală, 95% din unităţi au valori cuprinse în intervalul
x 1,96 s; x 1,96 s.
Observaţie
În estimarea parametrilor unei populaţii, problematică prezentată în partea a doua, obiectivul
urmărit este de a afla limitele unui interval care acoperă media unei populaţii, în 95% din cazuri, de
exemplu.
a. Asimetria
O distribuţie este simetrică dacă valorile frecvenţelor sunt egal dispersate faţă de valoarea
centrală a seriei. Distribuţia normală este exemplul clasic al unei repartiţii simetrice. Graficul
densităţii de repartiţie în cazul unei distribuţii normale are forma unui clopot simetric, cu axa de
simetrie reprezentată de media seriei. O deviere de la forma simetrică a unei distribuţii evidenţiază
fenomenul de asimetrie.
Alura curbei frecvenţelor în cazul unei distribuţii simetrice, a unei distribuţii asimetrice la
dreapta sau la stânga este reprezentată grafic în figurile de mai jos:
50
40
Frequency
30
20
10
0 Mean = 7,00
Std. Dev. =
4,00 6,00 8,00 10,00 1,54303
N = 190
Nota
50
Frequency
40
30
20
10
0 Mean = 6,4737
Std. Dev. =
4,00 6,00 8,00 10,00 1,43163
N = 190
Nota
60
50
Frequency
40
30
20
10
Mean = 7,5263
Std. Dev. =
0 1,43163
N = 190
4,00 6,00 8,00 10,00
Nota
Nota
( x i x ) 2 ni
2 i
s 2 reprezintă momentul centrat de ordinul 2, adică varianţa.
ni
i
Acest indicator este întotdeauna pozitiv. Sensul asimetriei este dat de semnul lui µ3. Atunci
când µ3>0, distribuţia este asimetrică la dreapta. Atunci când µ3<0, distribuţia este asimetrică la
stânga.
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Rezolvare
Indicatorii asimetriei sunt:
1. Asimetria în mărime absolută
As x Mo 6 ,93 8 1,07 .
Interpretare
Valoarea indicatorului de asimetrie arată că distribuţia studenţilor dintr-o serie după nota
obţinută la un examen în sesiunea iunie 2009 prezintă o asimetrie la stânga (As<0).
( x i x ) 2 ni
2 i
s 2 reprezintă momentul centrat de ordinul 2, adică varianţa.
ni
i
Elementele de calcul sunt prezentate în tabelul de mai jos:
( x i x ) 3 ni 112,20
i
3 0 ,534
ni 210
i
Înlocuind în relaţia de mai sus, se obţine:
2 ( 0 ,534 ) 2 0 ,2852
1 33 0 ,0432 .
2 1,876 3 6 ,6023
Interpretare
Valoarea coeficientului de asimetrie Pearson arată că distribuţia dată se caracterizează
printr-o asimetrie ( 1 0 ) la stânga (µ3<0).
b. Boltirea
Boltirea este definită prin compararea distribuţiei statistice cu distribuţia normală din
punctul de vedere al variaţiei variabilei X şi a frecvenţei ni.
Boltirea poate fi apreciată pe cale grafică prin reprezentarea curbei frecvenţelor. Alura
curbei frecvenţelor în cazul unei distribuţii normale (mezocurtice) sau care prezintă un accentuat
fenomen de boltire este reprezentată în figura de mai jos:
Figura 20. Boltirea unei distribuţii
Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Tabelul 2.24. Distribuţia studenţilor unei serii
după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210
Rezolvare
Indicatorii boltirii sunt:
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
2 42 44 , unde:
2 s
( x i x ) 4 ni
i
4 reprezintă momentul centrat de ordinul 4.
ni
i
Elementele de calcul sunt prezentate în tabelul de mai jos:
Interpretare
Valoarea coeficientului de boltire Pearson arată că distribuţia studenţilor după nota obţinută
la examen în sesiunea iunie 2009 este o distribuţie platicurtică ( 2 3 ) .
Folosind programul informatic SPSS (Statistical Package for Social Sciences), se cere să se
determine şi să se interpreteze mărimile medii, quartila 1 şi quartila 3, decila 1 şi decila 9,
indicatorii dispersiei şi indicatorii formei unei distribuţii.
Rezolvare
Valorile indicatorilor descriptivi sunt prezentate în tabelul 2.27.
Tabelul 2.26. Distribuţia judeţelor României după numărul de terenuri de sport, în anul 2010
Valorile indicatorilor sunt:
- media aritmetică (Mean) este 107.7073 terenuri;
- mediana (Median) este 98 terenuri;
- modul (Mode) este 59 terenuri;
- abaterea standard (Std. Deviation) este 44.55626 terenuri;
- varianţa (Variance) este 1985.262;
- coeficientul de asimetrie Fisher (Skewness) este 0.991;
- coeficientul de boltire Fisher (Kurtosis) este 0.450;
- amplitudinea variaţiei (Range) este 175 terenuri;
- decila 1 (Percentile 10) este 59.4 tereuri;
- quartila 1 (Percentile 25) este 69.5 terenuri);
- quartila 3 (Percentile 75) este 133 terenuri;
- decila 9 (Percentile 90) este 187.2 terenuri.
Interpretare
Media aritmetică arată că, în medie, un judeţ are aproximativ 108 terenuri de sport.
Mediana arată că 50% dintre judeţe au mai puţin de 98 terenuri de sport incusiv, iar 50%
dintre judeţe au mai mult de 98 terenuri de sport, inclusiv.
Modul arată că cel mai frecvent, judeţele au 59 de terenuri de sport.
Abaterea standard arată că, în medie, numărul de terenuri de sport al unui judeţ se abate de
la numărul mediu de terenuri/judeţ cu aproximativ 45 terenuri de sport.
Coeficientul de asimetrie Fisher arată că distribuţia este asimetrică la dreapta.
Coeficientul de boltire Fisher arată că distribuţia este leptocurtică.
Amplitudinea variaţiei arată că diferenţa maximă dintre numărul de terenuri de sport a
oricăror două judeţe este de 175 terenuri.
Decila 1 arată că 10% dintre judeţe au mai puţin de 59 terenuri inclusiv, iar 90% dintre
judeţe au mai mult de 59 terenuri, inclusiv.
Quartila 1 arată că 25% dintre judeţe au mai puţin de 70 terenuri incusiv, iar 75% dintre
judeţe au mai mult de 70 terenuri, inclusiv.
Quartila 3 arată că 75% dintre judeţe au mai puţin de 133 terenuri inclusiv, iar 25% dintre
judeţe au mai mult de 133 terenuri, inclusiv.
Decila 9 arată că 90% dintre judeţe au mai puţin de 187 terenuri inclusiv, iar 10% dintre
judeţe au mai mult de 187 terenuri, inclusiv.
Teste1
3) Distribuţia unei serii de studenţi după nota a examen este prezentată în tabelul de mai jos:
Nota Nr. studenţi
4 15
5 10
7 25
9 10
10 10
TOTAL 70
Au loc răspunsurile:
a) 10 studenţi au luat până în cinci la examen
b) 20 de studenţi auu luat peste nouă
c) majoritatea au luat sub şapte, inclusiv
4) Repartiţia unui eşantion de 100 studenţi după nota la un examen este prezentată mai jos.
4 5 6 8 10
X :
10 20 40 25 5 . Pentru această repartiţie, 80% dintre studenţi au obţinut o notă mai
mică de:
a)
b) 10
c) 8
1
Răspunsuri: 1 – b; 2 – a,c; 3 – b,c; 4 – c; 5 – b; 6 – b; 7 – a,b,c; 8 – a,b.
7) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00
8) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00