Sunteți pe pagina 1din 41

US 2.

ANALIZA UNEI SERII STATISTICE DISCRETE

Cuprins
2.1 Analiza grafică
2.2 Analiza numerică. Indicatori ai statisticii descriptive
2.3 Aplicaţie în SPSS

Obiective
- prezentarea tipurilor de frecvenţe utilizate în analiza uunei serii discrete
- prezentarea tipurilor de grafice specifice unei serii discrete
- definirea indicatorilor descriptivi, a proprietăţilor, a modului de calcul şi a interpretării acestora
- realizarea de exemple cu date reale
- prezentarea modului de analiză gafică şi numerică a unei serii discrete în SPSS

Competenţe
- însuşirea principalelor metode de analiză grafică şi numerică a unei serii discrete
- dezvoltarea abilităţilor practice de prelucrare şi interpretare a datelor statistice sistematizate într-o
serie discretă
- dezvoltarea capacităţii de utilizare a softului statistic pentru prelucrarea automată a datelor
- capacitatea de a realiza o sinteză a informaţiei statistice, având la dispoziţie rezultatele analizei
grafice şi numerice

Termen mediu: 4 h

Bibliografie

1. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
2. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
3. Jaba, E., Pintilescu, C., Statistică. Teste grilă şi probleme, Editura Sedcom Libris, Iaşi, 2005.
4. Jaba, E., Grama, A., Analiza statistică cu SPSS sub Windows, Ed. Polirom, Iaşi, 2004
5. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
6. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
7. McNabb, D., Research methods in public administration and nonprofit management : quantitative
and qualitative approaches, Armonk, M.E. Sharpe, 2002
8. Rosental, C. and C. Frémontier-Murphy, Introduction aux méthodes quantitatives en sciences
humaines et sociales, Paris, Dunod, 2001
9. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti, 1969.
10. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
Analiza unei serii statistice discrete se realizează cu ajutorul metodelor grafice şi numerice.
În continuare prezentăm câteva coordonate ale acestor tipuri de analiză.

2.1 Analiza grafică


Pentru reprezentarea grafică a unei serii după o variabilă discretă se folosesc următoarele
diagrame: poligonul frecvenţelor, curba frecvenţelor sau curba frecvenţelor cumulate. Indicatorii
numerici prin care poate fi caracterizată o serie statistică după o variabilă discretă pot fi grupaţi în
indicatori ai tendinţei centrale (mărimi medii), indicatori ai dispersiei, indicatori ai asimetriei şi
boltirii.

2.1.1. Frecvenţe absolute cumulate crescător (Ni↓ ) sau descrescător (Ni↑ )


Frecvenţele absolute cumulate crescător (Ni↓) sau descrescător (Ni↑) exprimă numărul de
unităţi statistice cumulate “până la” sau “peste” un anumit nivel al variabilei, adică valori ≤ xi,
respectiv ≥ xi.
Relaţiile de calcul sunt:
i
N i  N i 1   ni   nh , respectiv
h 1
m
N i  N i 1  ni   nh .
h i

2.1.2. Frecvenţe relative cumulate crescător (Fi↓) sau descrescător (Fi↑)


Frecvenţele relative cumulate crescător (Fi↓) sau descrescător (Fi↑) exprimă ponderea
unităţilor statistice cumulate “până la” sau “peste” un anumit nivel al caracteristicii, adică valori ≤
xi , respectiv ≥ xi.
Relaţiile de calcul sunt:
i
Fi  Fi 1   f i   f h , respectiv
h 1
m
Fi  Fi 1   f i   f h , unde fi reprezintă frecvenţele relative.
h i

Frecvenţele relative, fi , exprimă ponderea unităţilor ni în volumul total al unităţilor


observate, n, şi se calculează după relaţiile:
n n
 f i  i  i , atunci când frecvenţele sunt exprimate sub formă de coeficient. În acest
 ni n
i
caz,  fi  1.
i
ni n
 fi   100  i  100 , atunci când frecvenţele sunt exprimate sub formă de procente
 ni n
i
(%). În acest caz,  fi  100%.
i

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Tabelul 2.1. Distribuţia studenţilor unei serii
după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze frecvenţele absolute şi relative cumulate crescător sau descrescător.

Rezolvare
Frecvenţe absolute cumulate crescător( Ni↓)
Frecvenţele absolute cumulate crescător se calculează după relaţia:
i
N i  N i 1   ni   nh .
h 1
Pentru exemplul dat, avem:
N 1  n1  10 ;
N 2  N 1   n2  10  25  35;
N 3  N 2   n3  35  40  75 etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.2. Frecvenţele absolute cumulate crescător


xi ni Ni 
4 10 10
5 25 35
6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -

Interpretare
Numărul studenţilor care au obţinut nota 4 la examen este de 10 studenţi. Numărul
studenţilor care au obţinut cel mult nota 5 este de 35 persoane. Numărul studenţilor care au obţinut
cel mult nota 6 este de 75 persoane. În mod similar, se interpretează celelalte rezultate.

Observaţie
În calculul frecvenţelor absolute cumulate crescător, ultima valoare Ni↓ este întotdeauna
egală cu volumul total al eşantionului observat. În exemplul dat, avem N7↓=n=210.

Frecvenţe absolute cumulate descrescător ( N i  )


Frecvenţele absolute cumulate descrescător se calculează după relaţia:
m
N i  N i 1  ni   nh .
h i
Pentru exemplul dat, avem:
N 7  N 8   n7  5 ;
N 6  N 7   n6  5  15  20;
N 5  N 6   n5  20  60  80 etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.3. Frecvenţele absolute cumulate descrescător


xi ni Ni 
4 10 210
5 25 200
6 40 175
7 55 135
8 60 80
9 15 20
10 5 5
TOTAL 210 -

Interpretare
Numărul studenţilor care au obţinut nota 10 la examen este de 5 studenţi. Numărul
studenţilor care au obţinut peste nota 9 este de 25 persoane. Numărul studenţilor care au obţinut
peste nota 8 este de 80 persoane. În mod similar, se interpretează celelalte rezultate.

Frecvenţe relative (fi)


Frecvenţele relative se calculează după relaţia:
n n
f i  i  100  i  100 .
 ni n
i
Pentru exemplul dat, avem:
n 10 n 25
f 1  1  100   100  4 ,76% ; f 2  2  100   100  11,90% etc.
 ni 210  ni 210
i i

Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.4. Frecvenţele relative


xi ni fi (%)
4 10 4,76
5 25 11,91
6 40 19,05
7 55 26,19
8 60 28,57
9 15 7,14
10 5 2,38
TOTAL 210 100,00

Interpretare
Ponderea studenţilor care au obţinut nota 4 la examen este de 4,76% din numărul total de
studenţi. Ponderea studenţilor care au obţinut nota 5 este de 11,91%, iar ponderea studenţilor care
au obţinut nota 6 este de 19,05%. În mod similar, se interpretează celelalte rezultate.
Frecvenţe relative cumulate crescător ( Fi  )
Frecvenţele relative cumulate crescător se calculează după relaţia:
i
Fi  Fi 1   f i   f h .
h 1
Pentru exemplul dat, avem:
F1  f 1  4 ,76% ;
F2  F1   f 2  4 ,76  11,91  16 ,67%;
F3  F2   f 3  16 ,67  19,05  35,72% etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.5. Frecvenţele relative cumulate crescător


xi ni fi (%) Fi  (%)
4 10 4,76 4,76
5 25 11,91 16,67
6 40 19,05 35,72
7 55 26,19 61,91
8 60 28,57 90,48
9 15 7,14 97,62
10 5 2,38 100,00
TOTAL 210 100 -

Interpretare
Ponderea studenţilor care au obţinut nota 4 la examen este de 4,76% din numărul total de
studenţi. Ponderea studenţilor care au obţinut cel mult nota 5 este de 16,67%. Ponderea studenţilor
care au obţinut cel mult nota 6 este de 35,72%. În mod similar, se interpretează celelalte rezultate.

Frecvenţe relative cumulate descrescător ( Fi  )


Frecvenţele relative cumulate descrescător se calculează după relaţiile:
m
Fi  Fi 1   f i   f h .
h i
Pentru exemplul dat, avem:
F7  F8   f 7  2 ,38%; ;
F6  F7   f 6  2 ,38  7 ,14  9 ,52%;
F5  F6   f 5  9 ,52  28,57  38,09% etc.

Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.6. Frecvenţele relative cumulate crescător


xi ni fi (%) Fi  (%)
4 10 4,76 100,00
5 25 11,91 95,24
6 40 19,05 83,33
7 55 26,19 64,28
8 60 28,57 38,09
9 15 7,14 9,52
10 5 2,38 2,38
TOTAL 210 100 -
Interpretare
Ponderea studenţilor care au obţinut nota 10 la examen este de 2,38%. Ponderea studenţilor
care au obţinut peste nota 9 este de 9,52%. Ponderea studenţilor care au obţinut peste nota 8 este de
38,09%. În mod similar, se interpretează celelalte rezultate.

2.1.3. Tipuri de grafice


O distribuţie statistică după o variabilă numerică discretă poate fi reprezentată grafic
folosind poligonul frecvenţelor, curba frecvenţelor şi curba frecvenţelor cumulate.

Poligonul frecvenţelor
Construirea poligonului frecvenţelor presupune găsirea locului geometric al punctelor Ai de
coordonate (xi , ni) sau (xi , fi) şi unirea acestora prin segmente de dreaptă. Poligonul frecvenţelor
aproximează forma unei distribuţii.
Alura poligonului frecvenţelor este reprezentată în figura de mai jos:

Figura 1. Poligonul frecvenţelor

Curba frecvenţelor
Construirea curbei frecvenţelor presupune ajustarea printr-o linie curbă, continuă a
poligonului frecvenţelor. Curba frecvenţelor aproximează mai bine forma de distribuţie a
colectivităţii după variabila considerată.
Alura curbei frecvenţelor este reprezentată în figura de mai jos:

Figura 2. Curba frecvenţelor

Curba frecvenţelor pentru distribuţia dată se compară cu forma curbei frecvenţelor pentru o
distribuţie normală, cunoscută sub denumirea de Clopotul lui Gauss. Această curbă este o curbă
simetrică faţă de nivelul mediu: jumătate din unităţi au valori mai mici decât nivelul mediu, iar
jumătate au valori mai mari.
În urma prelucrării datelor la nivelul unui eşantion, pot fi obţinute următoarele forme ale
distribuţiei unităţilor:

Figura 3. Curbă asimetrică la dreapta

Figura 4. Curbă asimetrică la stânga

În exemplele prezentate în Figura 3 şi Figura 4 se observă o concentrare a frecvenţelor ni


spre valorile mici (Figura 3), respectiv spre valorile mari ale variabilei X (Figura 4).

Curba frecvenţelor cumulate


Construirea curbei frecvenţelor cumulate presupune reprezentarea grafică a funcţiei de
repartiţie a frecvenţelor unei variabile: F(X  xi).
Alura curbei frecvenţelor cumulate crescător este reprezentată în figura de mai jos:

Figura 5. Curba frecvenţelor cumulate crescător


Alura curbei frecvenţelor cumulate desccrescător este reprezentată în figura de mai jos:

Figura 6. Curba frecvenţelor cumulate descrescător

2.2. Analiza numerică. Indicatori ai statisticii descriptive


Cei mai importanţi indicatori ai statisticii descriptive pot fi grupaţi în indicatori ai tendinţei
centrale, indicatori ai dispersiei, indicatori ai asimetriei şi boltirii.

2.2.1. Indicatori ai tendinţei centrale (mărimi medii)


Indicatorii tendinţei centrale sunt indicatori prin care pot fi caracterizate în mod sintetic
unităţile statistice observate după o variabilă X. Principalele mărimi medii folosite în caracterizarea
unei serii statistice sunt media aritmetică, modul şi mediana.

a. Media aritmetică ( x )
Media aritmetică pentru o serie statistică după o variabilă discretă se calculează după
relaţiile:
 xi
x i , pentru o serie simplă de valori;
n
 x i  ni
x i , pentru o serie cu frecvenţe ni.
 ni
i

Principalele proprietăţi ale mediei aritmetice sunt:


1. Media aritmetică se înscrie în intervalul de variaţie al variabilei X:
xmin  x  xmax .

2. Pentru o serie cu frecvenţe, media aritmetică este plasată între valorile extreme, oscilând în jurul
valorii cu frecvenţa dominantă.
Media este considerată în statistică un punct de echilibru, similar centrului de greutate în
fizică. Dacă o serie nu prezintă o asimetrie pronunţată, atunci media va fi în apropierea valorii cu
frecvenţa cea mai mare.
3. Media este o mărime normală, adică suma abaterilor valorilor individuale ale unei variabile X de
la media lor este egală cu zero:
 ( xi  x )  0 , pentru o serie simplă de valori;
i

 ( xi  x )  ni  0 , pentru o serie cu frecvenţe.


i

Exemple
1. Vânzările unei firme (mil. Lei) înregistrate timp de cinci zile sunt: 10, 9, 8 7, 7. Se cere să
se calculeze media aritmetică.

Rezolvare
Media aritmetică pentru o serie simplă de valori se calculează după relaţia:
 xi
x i .
n
Pentru exemplul dat, obţinem:
 xi 10  9  8  7  7
x i   8 ,2 mil. Lei.
n 5

Interpretare
Nivelul mediu al vânzărilor zilnice ale firmei este de 8,2 mil. Lei.

2. Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie
2009 se prezintă astfel:

Tabelul 2.7. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze media aritmetică.

Rezolvare
Media aritmetică pentru o serie statistică cu frecvenţe se calculează după relaţia
 x i  ni
x i .
 ni
i
Elementele pentru calculul mediei aritmetice sunt prezentate în tabelul de mai jos:
Tabelul 2.8. Elementele pentru calculul mediei aritmetice
xi ni x i  ni
4 10 40
5 25 125
6 40 240
7 55 385
8 60 480
9 15 135
10 5 50
TOTAL  ni  210  xi  ni 
i i
1455

Înlocuind în relaţia de mai sus, se obţine :


 xi  ni 1455
x i   6 ,93 .
 ni 210
i
Interpretare
Nota medie obţinută de studenţii din eşantionul observat la examen este de 6,93~7.

b. Modul (Mo)
Modul este valoarea variabilei cea mai frecvent observată într-o distribuţie, adică valoarea xi
care corespunde frecvenţei maxime (nimax).
Aflarea modului presupune identificarea valorii xi corespunzătoare frecvenţei maxime
(nimax).

Exemple
1. Vânzările unei firme A (mil. Lei) înregistrate timp de cinci zile sunt: 10, 9, 8 7, 7. Se cere
să se afle modul.

Rezolvare
Pentru aflarea modului, trebuie identificată valoarea xi corespunzătoare frecvenţei maxime
(nimax). Frecvenţa maximă este nimax=2, iar valoarea xi corespunzătoare este xi=7. Pentru seria dată,
modul este: Mo=7 mil. Lei.

Interpretare
Valoarea vânzărilor cea mai frecvent înregistrată de firma A este de 7 mil. Lei pe zi.

2. Vânzările unei firme A (mil. Lei) înregistrate timp de cinci zile sunt: 10, 8, 8 7, 7. Se cere
să se afle valoarea modului.

Rezolvare
Pentru aflarea modului, trebuie identificată valoarea xi corespunzătoare frecvenţei maxime
(nimax). Frecvenţa maximă este nimax=2, iar valorile xi corespunzătoare sunt xi=7 şi xi=8. Seria dată
este o serie bimodală, valorile modului fiind de 7 mil. Lei şi de 8 mil. Lei.

Interpretare
Valorile vânzărilor cele mai frecvente sunt de 7 mil. Lei şi de 8 mil. Lei pe zi .

3. Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie
2009 se prezintă astfel:
Tabelul 2.9. Distribuţia studenţilor unei serii
după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
Mo=8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze modul.

Rezolvare
Pentru aflarea modului, se află frecvenţa maximă: nimax=60. Valoarea xi care corespunde
acestei frecvenţe maxime este xi=8. Pentru seria dată, modul este: Mo=8.

Interpretare
Cei mai mulţi studenţi au luat la examenul din sesiunea iunie 2009 nota 8.

c. Mediana (Me)
Mediana reprezintă acea valoare a variabilei care împarte seria ordonată crescător în două
părţi egale: jumătate din unităţi au valori mai mici decât mediana, iar jumătate au valori mai mari
decât mediana.
Aflarea medianei se realizează diferit în funcţie de tipul seriei:

1. Pentru o serie simplă:


 cu număr par de termeni, mediana este reprezentată de media aritmetică simplă a celor doi
termeni centrali ai seriei ordonate crescător.

Exemplu
Se consideră seria reprezentată de valorile 10, 9, 11, 6, 7, 8. Pentru aflarea medianei, şirul
valorilor se ordonează în sens crescător: 6, 7, 8, 9, 10, 11. Mediana este reprezentată de media
aritmetică simplă a celor doi termeni centrali ai seriei ordonate crescător, respectiv
89
Me   8 ,5 .
2

 cu număr impar de termeni, mediana este reprezentată de termenul central al seriei ordonate
crescător.

Exemplu
Se consideră seria reprezentată de valorile 10, 9, 11, 6, 7. Pentru aflarea medianei, şirul
valorilor se ordonează în sens crescător: 6, 7, 9, 10, 11. Mediana este reprezentată de termenul
central al seriei ordonate crescător, respectiv Me  9 .
2. Pentru o serie cu frecvenţe după o variabilă discretă
Aflarea medianei presupune parcurgerea următoarelor etape:
 se calculează unitatea mediană:
 ni
Me
- atunci când n  100 , unitatea mediană este : U  i ;
2
 ni  1
Me
- atunci când n  100 , unitatea mediană este U  i .
2
 se calculează frecvenţele absolute cumulate crescător, Ni↓;
 se află prima valoare Ni↓≥UMe;
 valoarea xi corespunzătoare acestei frecvenţe Ni↓≥UMe este mediana.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen, în sesiunea iunie 2009,
se prezintă astfel:

Tabelul 2.10. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze mediana.

Rezolvare
Etape pentru aflarea medianei:
 ni
210
Me i
 se calculează unitatea mediană: U   105 ;

2 2
 se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:

Tabelul 2.11. Frecvenţele absolute cumulate crescător


xi ni N1 
4 10 10
5 25 35
6 40 75
Me=7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -
 se află prima valoare Ni↓≥UMe. Pentru exemplul dat, N i  130  U Me  105 .
 valoarea xi corespunzătoare primei frecvenţe Ni↓≥UMe este mediana. Pentru exemplul dat,
Me=7.

Interpretare
Jumătate din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă
de până la 7, iar jumătate au luat peste 7.

Observaţie
Locul medianei într-o distribuţie depinde de forma acesteia. Doar în cazul unei distribuţii
simetrice mediana este termenul central al seriei.

Exemplu
Se consideră distribuţiile a două serii, prezentate în tabelele de mai jos:

Seria I
xi ni
1 20
2 40
3 20
4 15
5 5
TOTAL 100

Seria II
xi ni
1 10
2 20
3 40
4 20
5 10
TOTAL 100

Să se afle şi să se compare valorile medianei pentru cele două distribuţii.

Rezolvare
Pentru seria I, aflarea medianei presupune parcurgerea următoarelor etape:
 ni 100
Me
 se calculează unitatea mediană: U  i   50 ;
2 2
 se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Tabelul 2.12. Frecvenţele absolute cumulate crescător
pentru seria I
xi ni Ni 
1 20 20
Me=2 40 60
3 20 80
4 15 95
5 5 100
TOTAL 100 -
 prima valoare Ni↓≥UMe este N i  60  U Me  50 .
 valoarea xi corespunzătoare frecvenţei Ni↓≥UMe este Me=2.

Pentru seria II se obţin următoarele rezultate:

Tabelul 2.13. Frecvenţele absolute cumulate crescător


pentru seria II
xi ni Ni 
1 10 10
2 20 30
Me=3 40 70
4 20 90
5 10 100
TOTAL 100 -

În acest caz, valoarea medianei este Me=3.

Se observă că poziţia medianei pentru cele două distribuţii diferă, deşi volumul colectivităţii
este acelaşi, n=100. Seria I este o serie asimetrică, spre deosebire de seria II care este o distribuţie
simetrică. În acest ultim caz, mediana este reprezentată de termenul central al seriei.

d. Relaţii între cele trei mărimi medii fundamentale


Relaţia dintre cele trei mărimi medii fundamentale evidenţiază forma unei distribuţii:

 atunci când x  Mo  Me , distribuţia este simetrică;

Figura 7. Distribuţie simetrică

 atunci când x  Me  Mo , distribuţia este asimetrică la dreapta;

Figura 8. Distribuţie asimetrică la dreapta


 atunci când x  Me  Mo , distribuţia este asimetrică la stânga.

Figura 9. Distribuţie asimetrică la stânga

e. Comparaţii între cele trei mărimi medii fundamentale


Interpretarea valorilor obţinute pentru cele trei mărimi medii fundamentale poate releva
aspecte importante privind unităţile statistice din distribuţia analizată.
De exemplu, să considerăm că în urma prelucrării datelor privind salariul lunar (lei) obţinut
de către salariaţii unei firme, s-au obţinut următoarele rezultate:
x  1500 lei; Mo  700 lei; Me  800 lei .
Aceste valori arată că salariul mediu obţinut de salariaţii firmei este de 1500 lei/lună, însă
cei mai mulţi salariaţi câştigă 700 lei/lună, iar jumătate din numărul total al salariaţilor câştigă până
la 800 lei/lună, iar jumătate câştigă peste 800 lei/lună. Distribuţia salariaţilor firmei observate este o
distribuţie puternic asimetrică la dreapta.
Aceste rezultate pot fi explicate prin diferenţe mari înregistrate între valorile salariului
obţinut de salariaţii din firma considerată. Media aritmetică este o mărime influenţată de valorile
extreme, aberante. De aceea, este deosebit de utilă şi interpretarea celorlalte mărimi medii
fundamentale.

f. Generalizarea medianei: quantilele


Quantilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în r părţi
egale. Cele mai folosite quantile sunt:

1. Quartilele
Quartilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în 4 părţi
egale.
Poziţia celor trei quartile într-o distribuţie simetrică este prezentată în figura de mai jos:

Figura 10. Poziţia quartilelor într-o distribuţie

Quartila unu ( Q1)


Aflarea quartilei unu presupune parcurgerea următoarelor etape:
 ni
Q1
 se calculează unitatea quartilică unu: U  i ;
4
 se calculează frecvenţele absolute cumulate crescător, Ni↓;
 se află prima valoare Ni↓≥UQ1;
 valoarea xi corespunzătoare frecvenţei Ni↓≥UQ1 este quartila unu.

Quartila doi ( Q2)


Aflarea quartilei doi presupune parcurgerea următoarelor etape:
2   ni  ni
Q2
 se calculează unitatea quartilică doi: U  i
 i  U Me . Quartila doi este, deci,
4 2
mediana.

Quartila trei ( Q3)


Aflarea quartilei trei presupune parcurgerea următoarelor etape:
3   ni
Q3 i
 se calculează unitatea quartilică trei: U  ;
4
 se calculează frecvenţele absolute cumulate crescător, Ni↓;
 se află prima valoare Ni↓≥UQ3;
 valoarea xi corespunzătoare frecvenţei Ni↓≥UQ3 este quartila trei.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen, în sesiunea iunie 2009,
se prezintă astfel:

Tabelul 2.14. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze quartila unu şi quartila trei.

Rezolvare
Quartila unu

210
 ni
Q1 i
 se calculează unitatea quartilică unu: U   52,5 ;

4 4
 se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:
Tabelul 2.15. Frecvenţele absolute cumulate crescător
xi ni N1 
4 10 10
5 25 35
Q1=6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -

 se află prima valoare Ni↓≥UQ1. Pentru exemplul dat, N i  75  U Q1  52 ,5 ;


 valoarea xi corespunzătoare primei frecvenţe Ni↓≥UMe este quartila unu. Pentru exemplul
dat, Q1=6.

Interpretare
25% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 6, iar 75% au luat peste 6.

Quartila trei
3   ni
Q3 3  210
i
 se calculează unitatea quartilică trei: U   157,5 ;

4 4
 se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:

Tabelul 2.16. Frecvenţele absolute cumulate crescător


xi ni N1 
4 10 10
5 25 35
6 40 75
7 55 130
Q3=8 60 190
9 15 205
10 5 210
TOTAL 210 -

 se află prima valoare Ni↓≥UQ3. Pentru exemplul dat, N i  190  U Q3  157 ,5.
 valoarea xi corespunzătoare primei frecvenţe Ni↓≥UQ3 este quartila trei. Pentru exemplul dat,
Q3=8.

Interpretare
75% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 8, iar 25% au luat peste 8.

2. Decilele
Decilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în 10 părţi
egale. Cele mai importante decile sunt decila unu şi decila nouă.

Decila unu ( D1)


Aflarea decilei unu presupune parcurgerea următoarelor etape:
 ni
D1 i
 se calculează unitatea decilică unu: U  ;
10
 se calculează frecvenţele absolute cumulate crescător, Ni↓;
 se află prima valoare Ni↓≥UD1;
 valoarea xi corespunzătoare frecvenţei Ni↓≥UD1 este decila unu.

Decila nouă (D9)


Aflarea decilei nouă presupune parcurgerea următoarelor etape:
9   ni
D9 i
 se calculează unitatea decilică nouă: U  ;
10
 se calculează frecvenţele absolute cumulate crescător, Ni↓;
 se află prima valoare Ni↓≥UD9;
 valoarea xi corespunzătoare ifrecvenţei Ni↓≥UD9 este decila nouă.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:

Tabelul 2.17. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze decila unu şi decila nouă.

Rezolvare
Decila unu

210
 ni
D1 i
 se calculează unitatea decilică unu: U   21 ;

10 10
 se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:

Tabelul 2.18. Frecvenţele absolute cumulate crescător


xi ni N1 
4 10 10
D1=5 25 35
6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -
 se află prima valoare Ni↓≥UD1. Pentru exemplul dat, N i  35  U D1  21 .
 valoarea xi corespunzătoare primei frecvenţe Ni↓≥UD1 este decila unu. Pentru exemplul dat,
D1=5.

Interpretare
10% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 5, iar 90% au luat peste 5.
Decila nouă
9   ni
D9 i 9  210
 se calculează unitatea decilică nouă: U    189 ;
10 10
 se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt prezentate în
tabelul de mai jos:

Tabelul 2.19. Frecvenţele absolute cumulate crescător


xi ni N1 
4 10 10
5 25 35
6 40 75
7 55 130
D9=8 60 190
9 15 205
10 5 210
TOTAL 210 -

 se află prima valoare Ni↓≥UD9. Pentru exemplul dat, N i  190  U D9  189 .


 valoarea xi corespunzătoare primei frecvenţe Ni↓≥UD9 este decila nouă. Pentru exemplul dat,
D9=8.

Interpretare
90% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o notă de
până la 8, iar 10% au luat peste 8.

g. Reprezentarea diagramei „box-and-whiskers” sau „box-plot”


Construirea diagramei „box-and-whiskers” presupune reprezentarea următoarelor valori ale
tendinţei centrale: quartila unu, mediana, quartila trei, decila unu şi decila nouă. Forma generală a
diagramei „box-and-whiskers” este prezentată în figura de mai jos:

4,00 5,00 6,00 7,00 8,00 9,00 10,00

D1 Q1 Q2 Q3 D9

Figura 11. Diagrama „box-and-whiskers”


Diagrama „box-and-whiskers” este utilă în cercetarea statistică deoarece oferă informaţii cu
privire la indicatorii tendinţei centrale, la forma unei distribuţii, dar şi cu privire la gradul de
dispersie al distribuţiei (fenomen prezentat în capitolul următor). Într-o distribuţie perfect simetrică,
valorile decilei unu şi nouă, respectiv ale quartilei unu şi trei, sunt reprezentate la aceeaşi distanţă
faţă de mediană. Această situaţie este reprezentată în Figura 11.

2.2.2. Indicatori ai dispersiei


Pentru caracterizarea unităţilor unei distribuţii nu este suficientă doar folosirea indicatorilor
tendinţei centrale. Pentru o caracterizare corectă a unei distribuţii trebuie să se ia în considerare
gradul de variaţie a valorilor variabilei X faţă de nivelul mediu. O colectivitate caracterizată printr-o
dispersie mare a valorilor xi ale unei variabile faţă de nivelul mediu este o colectivitate eterogenă iar
media nu este reprezentativă pentru distribuţie.

a. Definirea fenomenului de dispersie


Aprecierea variabilităţii valorilor unei variabile faţă de nivelul mediu se poate realiza prin
aprecierea fenomenului de dispersie. Dispersia exprimă gradul de împrăştiere a valorilor individuale
ale unei variabile faţă de nivelul mediu. Aprecierea fenomenului de dispersie al unei distribuţii
permite identificarea gradului de reprezentativitate a mediei unei distribuţii.

b. Indicatorii dispersiei
Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaţie
Amplitudinea de variaţie măsoară distanţa dintre nivelul maxim şi nivelul minim al unei
variabile. Se calculează pe baza relaţiei:
A  xmax  xmin .
Acest indicator permite aprecierea întinderii domeniului de variaţie al variabilei X.
Dezavantajul acestui indicator constă în faptul că nu „pătrunde” în interiorul distribuţiei, respectiv
între cele două valori extreme ale variabilei.

2. Varianţa
Varianţa este media pătratelor abaterilor valorilor xi de la nivelul mediu şi poate fi calculată
pe baza relaţiei:
 ( xi  x ) 2
s2  i , pentru o serie simplă;
n
 ( x i  x ) 2  ni
s2  i , pentru o serie cu frecvenţe.
 ni
i
Varianţa nu are unitate de măsură şi nu se interpretează.

3. Abaterea medie pătratică (abaterea standard)


Abaterea medie pătratică sau abaterea standard este rădăcina mediei pătratelor abaterilor
valorilor xi de la nivelul mediu şi poate fi calculată pe baza relaţiei:
 ( xi  x ) 2
s  s2  i
, pentru o serie simplă;
n
 ( x i  x ) 2  ni
s  s2  i
, pentru o serie cu frecvenţe.
 ni
i
Abaterea standard se exprimă în aceeaşi unitate de măsură cu cea a variabilei X. Arată cu cât
variază, în medie, valorile variabilei X de la nivelul mediu, în sens negativ şi pozitiv.

4. Coeficientul de variaţie
Întrucât abaterea standard şi media se exprimă în aceeaşi unitate de măsură cu cea a
variabilei X, aceşti indicatori nu pot fi folosiţi pentru a compara două serii de date care sunt
exprimate în unităţi de măsură diferite. Pentru a înlătura acest inconvenient, se calculează
coeficientul de variaţie, după relaţia:
s
v   100 .
x
Prin evaluarea acestui coeficient se poate aprecia gradul de reprezentativitate a mediei unei
distribuţii. În general, o valoare a coeficientului de variaţie mai mică de 50% arată că media este
reprezentativă.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:

Tabelul 2.20. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze indicatorii dispersiei.

Rezolvare
Cei mai importanţi indicatori ai dispersiei sunt: amplitudinea de variaţie, varianţa, abaterea
standard şi coeficientul de variaţie.

Amplitudinea de variaţie
Amplitudinea de variaţie se calculează pe baza relaţiei:
A  xmax  xmin  10  4  6 .
Interpretare
Diferenţa dintre nivelul maxim şi nivelul minim al variabilei X este egală cu 6.

Varianţa
Varianţa se calculează pe baza relaţiei:
 ( x i  x ) 2  ni
s2  i . Pentru această distribuţie, media este x  6 ,93 .
 ni
i
Elementele de calcul ale varianţei sunt prezentate în tabelul de mai jos:
Tabelul 2.21. Elemente de calcul ale varianţei
xi ni xi  x ( xi  x ) 2 ( x i  x ) 2  ni
4 10 -2,93 8,58 85,85
5 25 -1,93 3,72 93,12
6 40 -0,93 0,86 34,60
7 55 0,07 0,00 0,27
8 60 1,07 1,14 68,69
9 15 2,07 4,28 64,27
10 5 3,07 9,42 47,12
TOTAL 210 - - 393,93

Înlocuind în relaţia de mai sus, se obţine:


 ( xi  x )2  ni 393,93
s2  i   1,876 .
 ni 210
i

Abaterea standard
Abaterea standard se calculează pe baza relaţiei:
s  s 2  1,876  1,37 .
Interpretare
Notele obţinute de studenţii din seria dată variază, în medie, faţă de nota medie cu 1,37~1
punct, în sens pozitiv şi negativ.

Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s 1,37
v   100   100  19,77% .
x 6 ,93
Interpretare
Valoarea coeficientului de variaţie arată că distribuţia studenţilor după nota obţinută la un
examen în sesiunea iunie 2009 este o distribuţie omogenă, caracterizată printr-o dispersie mică
(v<50%). Media este reprezentativă pentru această distribuţie.

c. Compararea fenomenului de dispersie pentru mai multe distribuţii


Pentru două colectivităţi se înregistrează vârsta persoanelor şi se obţin următoarele rezultate:
x1  15 ani, s1  2 ani ;
x2  50 ani, s2  2 ani .
Aceste rezultate arată că ambele colectivităţi se caracterizează printr-o dispersie mică a
vârstei persoanelor faţă de vârsta medie. Vârsta medie pentru unităţile din prima colectivitate este,
însă, mult mai mică decât vârsta medie pentru unităţile din cea de-a doua colectivitate. Aceasta
arată că prima colectivitate este formată din persoane foarte tinere, spre deosebire de persoanele din
cea de-a doua colectivitate.
Reprezentarea grafică a două distribuţii caracterizate prin medii diferite şi aceeaşi dispersie
este realizată în figura de mai jos:
Figura 12. Curba frecvenţelor pentru două distribuţii

Reprezentarea grafică a două distribuţii caracterizate prin aceeaşi medie şi dispersii diferite
este realizată în figura de mai jos:

Figura 13. Curba frecvenţelor pentru două distribuţii

d. Abaterea standard şi distribuţia normală


Cunoscând nivelul mediu şi abaterea standard pentru o distribuţie, putem afla care este
proporţia unităţilor care înregistrează valori mai mari, de exemplu, decât ( x  s ).
Pentru aceasta, se calculează valori ale unei variabile standardizat Z, cunoscută şi sub
denumirea de scor Zi, după relaţia:
x x
zi  i . Această mărime arată poziţia unei unităţi faţă de nivelul mediu ( x ), folosind ca
s
„unitate de măsură” abaterea standard. Variabila Z este o variabilă de medie 0 şi varianţă egală cu 1.
De exemplu, pentru o distribuţie caracterizată printr-o medie de x  100 şi o abatere
140  100
standard de s  20 , pentru xi=140 putem afla valoarea zi, astfel: z i   2 . Aceasta arată
20
că unitatea care înregistrează valoarea xi=140 se găseşte la o distanţă faţă de nivelul mediu egală cu
de două ori abaterea standard.
Odată calculată valoarea z, putem afla proporţia unităţilor care înregistrează valori mai mari
decât 140, de exemplu. Aceste valori sunt calculate pentru o distribuţie normală şi sunt tabelate
(Anexa 1).
Tabelul care prezintă aceste rezultate este de forma:

0 0.01  0.05 
0
0.1
0.2

1 0,341
1.1 0,375

Pe prima coloană sunt valorile lui z, întregul şi prima zecimală, iar valorile din următoarele
coloane reprezintă a doua zecimală a valorii zi. Valorile din interiorul tabelul arată proporţia
unităţilor care înregistrează valori cuprinse între nivelul mediu şi scorul z corespunzător.

De exemplu, pentru o valoare zi=1,15, se citeşte 0,375. Această valoare arată că aproximativ
37,5% din unităţile distribuţiei înregistrează valori cuprinse între nivelul mediu şi valoarea zi=1,15.
În Tabelul Z nu sunt valori negative pentru zi, însă distribuţia normală este o distribuţie
simetrică, deci aria suprafeţei cuprinse între nivelul mediu şi valoarea pozitivă sau negativă a lui Z
este aceeaşi.

Exemple
1. Pentru o distribuţie normală de medie, x , şi abatere standard, s, să se afle proporţia
unităţilor care înregistrează valori cuprinse în intervalele ( x  s ), ( x  2  s ) şi ( x  3  s ).

Rezolvare
Pentru a afla proporţia unităţilor care înregistrează valori cuprinse în intervalul
( x  s; x  s ) , se calculează scorul Z, astfel:
x x xsx
z1  1   1
s s
x x xsx
z2  2   1 .
s s
Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=1, şi anume 0,341.

0 0.01  0.05 
0
0.1
0.2

1 0,341
1.1 0,375

Această valoare, 0,341, reprezintă aria suprafeţei cuprinse între nivelul mediu şi zi=1.
Proporţia unităţilor care înregistrează valori cuprinse în intervalul ( x  s; x  s ) este:
2  0 ,341  0 ,682 sau 68,2%.

În mod similar, se obţin valorile zi=±2, pentru limitele intervalului ( x  2  s ).


Din tabelul Z, se citeşte valoarea care corespunde unui nivel zi=2, de 0,477.

0  0.05 
0
0.1
0.2

2 0,477

Proporţia unităţilor care înregistrează valori cuprinse în intervalul ( x  2  s; x  2  s ) este:


2  0 ,477  0 ,954 sau 95,4%.

Pentru intervalul ( x  3  s ), se obţin valorile zi=±3:

Pentru zi=±3, se citeşte valoarea corespunzătoare 0,499.

0  0.05 
0
0.1
0.2

3 0,499

Proporţia unităţilor care înregistrează valori cuprinse în intervalul ( x  3  s; x  3  s ) este:


2  0 ,499  0 ,998 sau 99,8%.
Interpretare
Într-o distribuţie normală, în intervalul ( x  s ) sunt cuprinse 68,2% din unităţi, în intervalul
( x  2  s ) sunt cuprinse 95,4% din unităţi şi în intervalul ( x  3  s ) sunt cuprinse 99,8% din unităţi.

2. Distribuţia unor studenţi după nota obţinută la un test urmează o lege normală şi se
caracterizează prin următoarele rezultate: x  7 şi s=2. Se cere să se afle proporţia studenţilor care
au luat note mai mici decât 6.

Rezolvare
Valoarea Zi care corespunde unei valori xi=6 se calculează astfel:
x  x 67
zi  i   0,5
s 2
Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=0,5, egală cu 0,191.

0 0.01  0.05 
0
0.1
0.2

0,5 0,191

Proporţia studenţilor care au luat note mai mici decât 6 este f=0,5-0,191=0,309 sau 30,9%.

Observaţie
Aria suprafeţei reprezentate în figura de mai sus este egală cu unu (după cum am precizat
anterior, suma proporţiilor este egală cu 1 sau 100%). Distribuţia normală este o distribuţie
simetrică, deci proporţia unităţilor care au valori mai mari decât nivelul mediu este de 0,5.
3. Distribuţia unor persoane după vârstă urmează o lege normală şi se caracterizează prin
următoarele rezultate: x  30 ani şi s=4 ani. Se cere să se afle proporţia persoanelor care au o
vârstă cuprinsă între 27 ani şi 35 ani.

Rezolvare
Valorile lui Z corespunzătoare lui x1=27 şi x2=35 sunt:
x  x 27  30
z1  1   0 ,75
s 4
x  x 35  30
z2  2   1,25 .
s 4
Din tabelul Z se citesc valorile corespunzătoare lui z1=-0,75 şi z2=+1,25, astfel:

0  0.05 
0
0.1
0.2

0,7 0,273
 
1,2 0,394
 

Proporţia persoanelor care au o vârstă cuprinsă între 27 ani şi 35 ani este:


f=0,273+0,394=0,667 sau 66,7%.

4. Pentru o distribuţie normală de medie x , şi abatere standard s, să se afle limitele


intervalului care include 95% din unităţile statistice observate.

Rezolvare
Această problemă poate fi prezentată grafic astfel:
Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat anterior: se
cunoaşte proporţia (95%) şi trebuie să aflăm valoarea zi care corespunde acestei proporţii.
Pentru a afla valoarea zi, se calculează aria suprafeţei cuprinsă între nivelul mediu şi z, care
95%
este egală cu  47 ,5% sau 0,475.
2

Pentru această proporţie egală cu 0,475, se citeşte valoarea zi corespunzătoare, de 1,96.

0  0.06 
0
0.1
0.2

1,9 0,475
 

Prin urmare, într-o distribuţie normală, 95% din unităţi au valori cuprinse în intervalul
x  1,96  s; x  1,96  s.
Observaţie
În estimarea parametrilor unei populaţii, problematică prezentată în partea a doua, obiectivul
urmărit este de a afla limitele unui interval care acoperă media unei populaţii, în 95% din cazuri, de
exemplu.

2.2.4. Indicatori ai formei unei distribuţii

a. Asimetria
O distribuţie este simetrică dacă valorile frecvenţelor sunt egal dispersate faţă de valoarea
centrală a seriei. Distribuţia normală este exemplul clasic al unei repartiţii simetrice. Graficul
densităţii de repartiţie în cazul unei distribuţii normale are forma unui clopot simetric, cu axa de
simetrie reprezentată de media seriei. O deviere de la forma simetrică a unei distribuţii evidenţiază
fenomenul de asimetrie.

Asimetria poate fi apreciată pe cale grafică prin reprezentarea poligonului şi curbei


frecvenţelor, şi prin reprezentarea diagramei “box-and-whiskers”.

Alura curbei frecvenţelor în cazul unei distribuţii simetrice, a unei distribuţii asimetrice la
dreapta sau la stânga este reprezentată grafic în figurile de mai jos:
50

40
Frequency

30

20

10

0 Mean = 7,00
Std. Dev. =
4,00 6,00 8,00 10,00 1,54303
N = 190
Nota

Figura 14. Distribuţie simetrică


60

50

Frequency
40

30

20

10

0 Mean = 6,4737
Std. Dev. =
4,00 6,00 8,00 10,00 1,43163
N = 190
Nota

Figura 15. Distribuţie asimetrică la dreapta

60

50
Frequency

40

30

20

10
Mean = 7,5263
Std. Dev. =
0 1,43163
N = 190
4,00 6,00 8,00 10,00

Nota

Figura 16. Distribuţie asimetrică la stânga

Alura diagramei “box-and-whiskers” în cazul unei distribuţii simetrice, a unei distribuţii


asimetrice la dreapta sau la stânga este reprezentată grafic în figurile de mai jos:

4,00 5,00 6,00 7,00 8,00 9,00 10,00

Figura 17. Distribuţie simetrică


Nota

4,00 5,00 6,00 7,00 8,00 9,00 10,00

Figura 18. Distribuţie asimetrică la dreapta

Nota

4,00 5,00 6,00 7,00 8,00 9,00 10,00

Figura 19. Distribuţie asimetrică la stânga

Cei mai importanţi indicatori ai asimetriei sunt:


1. Asimetria în mărime absolută
Asimetria în mărime absolută poate fi calculată pe baza relaţiei:
As  x  Mo .
O valoare pozitivă a acestui indicator arată o asimetrie la dreapta a distribuţiei, iar o valoare
negativă arată o asimetrie la stânga. O valoare nulă arată o distribuţie simetrică.

2. Coeficientul de asimetrie Pearson


Coeficientul de asimetrie Pearson se calculează pe baza relaţiei:
2
 1  33 , unde:
2
 ( x i  x ) 3  ni
i
3  reprezintă momentul centrat de ordinul 3;
 ni
i

 ( x i  x ) 2  ni
2  i
 s 2 reprezintă momentul centrat de ordinul 2, adică varianţa.
 ni
i
Acest indicator este întotdeauna pozitiv. Sensul asimetriei este dat de semnul lui µ3. Atunci
când µ3>0, distribuţia este asimetrică la dreapta. Atunci când µ3<0, distribuţia este asimetrică la
stânga.

3. Coeficientul de asimetrie Fisher


Coeficientul de asimetrie Fisher se calculează pe baza relaţiei:

 1  33 .
s
Interpretarea valorii acestui coeficient este similară coeficientului de asimetrie Pearson.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:

Tabelul 2.22. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze indicatorii asimetriei.

Rezolvare
Indicatorii asimetriei sunt:
1. Asimetria în mărime absolută
As  x  Mo  6 ,93  8  1,07 .

Interpretare
Valoarea indicatorului de asimetrie arată că distribuţia studenţilor dintr-o serie după nota
obţinută la un examen în sesiunea iunie 2009 prezintă o asimetrie la stânga (As<0).

2. Coeficientul de asimetrie Pearson


Coeficientul de asimetrie Pearson se calculează pe baza relaţiei:
2
 1  33 , unde:
2
 ( x i  x ) 3  ni
i
3  reprezintă momentul centrat de ordinul 3;
 ni
i

 ( x i  x ) 2  ni
2  i
 s 2 reprezintă momentul centrat de ordinul 2, adică varianţa.
 ni
i
Elementele de calcul sunt prezentate în tabelul de mai jos:

Tabelul 2.23. Elemente de calcul


xi ni ( xi  x ) ( xi  x ) 2 ( x i  x ) 2  ni ( xi  x )3 ( x i  x ) 3  ni
4 10 -2,93 8,58 85,85 -25,15 -251,54
5 25 -1,93 3,72 93,12 -7,19 -179,73
6 40 -0,93 0,86 34,60 -0,80 -32,17
7 55 0,07 0,00 0,27 0,00 0,02
8 60 1,07 1,14 68,69 1,23 73,50
9 15 2,07 4,28 64,27 8,87 133,05
10 5 3,07 9,42 47,12 28,93 144,67
TOTAL 210 - - 393,93 - -112,20

Momentele centrate de ordinul doi şi trei sunt:


 ( xi  x )2  ni 393,93
2  i   1,876
 ni 210
i

 ( x i  x ) 3  ni  112,20
i
3    0 ,534
 ni 210
i
Înlocuind în relaţia de mai sus, se obţine:
 2 ( 0 ,534 ) 2 0 ,2852
 1  33    0 ,0432 .
2 1,876 3 6 ,6023

Interpretare
Valoarea coeficientului de asimetrie Pearson arată că distribuţia dată se caracterizează
printr-o asimetrie (  1  0 ) la stânga (µ3<0).

3. Coeficientul de asimetrie Fisher


Coeficientul de asimetrie Fisher se calculează pe baza relaţiei:
  0 ,534
 1  33   0 ,208 .
s 1,37 3

b. Boltirea
Boltirea este definită prin compararea distribuţiei statistice cu distribuţia normală din
punctul de vedere al variaţiei variabilei X şi a frecvenţei ni.
Boltirea poate fi apreciată pe cale grafică prin reprezentarea curbei frecvenţelor. Alura
curbei frecvenţelor în cazul unei distribuţii normale (mezocurtice) sau care prezintă un accentuat
fenomen de boltire este reprezentată în figura de mai jos:
Figura 20. Boltirea unei distribuţii

În cazul unei distribuţii leptocurtice, se înregistrează o variaţie mică a valorilor variabilei X


şi o variaţie mare a frecvenţelor absolute, ni. În cazul unei distribuţii platicurtice, se înregistrează o
variaţie mare a variabilei X şi o variaţie mică a frecvenţelor absolute, ni.

Boltirea poate fi apreciată pe cale numerică prin calculul indicatorilor boltirii:


1. Coeficientul de boltire Pearson
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
 
 2  42  44 , unde:
2 s
 ( x i  x ) 4  ni
i
4  reprezintă momentul centrat de ordinul 4.
 ni
i
O valoare a coeficientului de boltire Pearson  2  3 arată o distribuţie mezocurtică. O
valoare  2  3 arată o distribuţie leptocurtică iar o valoare  2  3 arată o distribuţie platicurtică.

2. Coeficientul de boltire Fisher


Coeficientul de boltire Fisher se calculează pe baza relaţiei:
 2  2  3 .
O valoare a coeficientului de boltire Fisher  2  0 arată o distribuţie mezocurtică. O valoare
 2  0 arată o distribuţie leptocurtică iar o valoare  2  0 arată o distribuţie platicurtică.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea iunie 2009
se prezintă astfel:
Tabelul 2.24. Distribuţia studenţilor unei serii
după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze indicatorii boltirii.

Rezolvare
Indicatorii boltirii sunt:
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
 
 2  42  44 , unde:
2 s
 ( x i  x ) 4  ni
i
4  reprezintă momentul centrat de ordinul 4.
 ni
i
Elementele de calcul sunt prezentate în tabelul de mai jos:

Tabelul 2.25. Elemente de calcul


xi ni ( xi  x ) ( xi  x )4 ( x i  x ) 4  ni
4 10 -2,93 -2,93000 73,70051
5 25 -1,93 -1,93000 13,87488
6 40 -0,93 -0,93000 0,74805
7 55 0,07 0,07000 0,00002
8 60 1,07 1,07000 1,31080
9 15 2,07 2,07000 18,36037
10 5 3,07 3,07000 88,82874
TOTAL 210 - - 1911,99746

Momentul centrat de ordinul patru este:


 ( xi  x )4  ni 1911,99746
4  i   9 ,105
 ni 210
i
Înlocuind în relaţia de mai sus, se obţine:
 9 ,105
 2  42   2 ,59 .
 2 1,876 2

Interpretare
Valoarea coeficientului de boltire Pearson arată că distribuţia studenţilor după nota obţinută
la examen în sesiunea iunie 2009 este o distribuţie platicurtică (  2  3 ) .

Coeficientul de boltire Fisher se calculează pe baza relaţiei:


 2   2  3  2,59  3  0 ,41 .
Interpretare
Valoarea coeficientului de boltire Fisher arată că distribuţia studenţilor după nota obţinută la
examen în sesiunea iunie 2009 este o distribuţie platicurtică (  2  0 ).

2.3. Aplicaţie în SPSS


Se consideră distribuţia judeţelor României după numărul de terenuri de sport, în anul 2010,
prezentată în tabelul 2.26.

Folosind programul informatic SPSS (Statistical Package for Social Sciences), se cere să se
determine şi să se interpreteze mărimile medii, quartila 1 şi quartila 3, decila 1 şi decila 9,
indicatorii dispersiei şi indicatorii formei unei distribuţii.

Rezolvare
Valorile indicatorilor descriptivi sunt prezentate în tabelul 2.27.

Tabelul 2.27. Indicatorii statisticii descriptive, obţinuţi cu ajutorul programului SPSS

Tabelul 2.26. Distribuţia judeţelor României după numărul de terenuri de sport, în anul 2010
Valorile indicatorilor sunt:
- media aritmetică (Mean) este 107.7073 terenuri;
- mediana (Median) este 98 terenuri;
- modul (Mode) este 59 terenuri;
- abaterea standard (Std. Deviation) este 44.55626 terenuri;
- varianţa (Variance) este 1985.262;
- coeficientul de asimetrie Fisher (Skewness) este 0.991;
- coeficientul de boltire Fisher (Kurtosis) este 0.450;
- amplitudinea variaţiei (Range) este 175 terenuri;
- decila 1 (Percentile 10) este 59.4 tereuri;
- quartila 1 (Percentile 25) este 69.5 terenuri);
- quartila 3 (Percentile 75) este 133 terenuri;
- decila 9 (Percentile 90) este 187.2 terenuri.

Interpretare
Media aritmetică arată că, în medie, un judeţ are aproximativ 108 terenuri de sport.
Mediana arată că 50% dintre judeţe au mai puţin de 98 terenuri de sport incusiv, iar 50%
dintre judeţe au mai mult de 98 terenuri de sport, inclusiv.
Modul arată că cel mai frecvent, judeţele au 59 de terenuri de sport.
Abaterea standard arată că, în medie, numărul de terenuri de sport al unui judeţ se abate de
la numărul mediu de terenuri/judeţ cu aproximativ 45 terenuri de sport.
Coeficientul de asimetrie Fisher arată că distribuţia este asimetrică la dreapta.
Coeficientul de boltire Fisher arată că distribuţia este leptocurtică.
Amplitudinea variaţiei arată că diferenţa maximă dintre numărul de terenuri de sport a
oricăror două judeţe este de 175 terenuri.
Decila 1 arată că 10% dintre judeţe au mai puţin de 59 terenuri inclusiv, iar 90% dintre
judeţe au mai mult de 59 terenuri, inclusiv.
Quartila 1 arată că 25% dintre judeţe au mai puţin de 70 terenuri incusiv, iar 75% dintre
judeţe au mai mult de 70 terenuri, inclusiv.
Quartila 3 arată că 75% dintre judeţe au mai puţin de 133 terenuri inclusiv, iar 25% dintre
judeţe au mai mult de 133 terenuri, inclusiv.
Decila 9 arată că 90% dintre judeţe au mai puţin de 187 terenuri inclusiv, iar 10% dintre
judeţe au mai mult de 187 terenuri, inclusiv.
Teste1

1) Sunt discrete următoarele variabile:


a) sexul persoanelor, starea civilă, domiciliul
b) numărul de membri ai unei gospodării, numărul de angajaţi ai unei firme
c) salariul lunar, speranţa de viaţă, vârsta

2) Cu ajutorul coeficientului de variaţie se caracterizează:


a) dispersia unei distribuţii
b) normalitatea unei distribuţii
c) reprezentativitatea mediei unei distribuţii

3) Distribuţia unei serii de studenţi după nota a examen este prezentată în tabelul de mai jos:
Nota Nr. studenţi
4 15
5 10
7 25
9 10
10 10
TOTAL 70
Au loc răspunsurile:
a) 10 studenţi au luat până în cinci la examen
b) 20 de studenţi auu luat peste nouă
c) majoritatea au luat sub şapte, inclusiv

4) Repartiţia unui eşantion de 100 studenţi după nota la un examen este prezentată mai jos.
4 5 6 8 10 
X :  
 10 20 40 25 5  . Pentru această repartiţie, 80% dintre studenţi au obţinut o notă mai
mică de:

a)
b) 10
c) 8

5) Pentru o serie statistică se cunosc rezultatele: Q3 = 4, Q1 = 1, Q2 = 1. În aceste condiţii, seria este:


a) asimetrică la stânga
b) asimetrică la dreapta
c) simetrică

6) Pentru o colectivitate de firme, repartizate după nivelul investiţiilor, se cunosc următoarele


rezultate:  xi2 ni  1000 ,  xi ni  300 mld. lei,  ni  100 . Se poate considera că populaţia
i i i
firmelor este:
a) strict omogenă
b) omogenă
c) neomogenă

1
Răspunsuri: 1 – b; 2 – a,c; 3 – b,c; 4 – c; 5 – b; 6 – b; 7 – a,b,c; 8 – a,b.
7) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics

Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00

Sunt valabile interpretările:

a) în medie, un angajat câştigă anual 28000$


b) alariul cel mai frecvent este 30500$
c) un sfert dintre angajaţi au salariul între 24000 şi 28000$

8) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics

Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00

Sunt valabile interpretările:

a) media nu este reprezentativă


b) populaţia nu este omogenă după salariu
c) majoritatea câştigă 30500 dolari

S-ar putea să vă placă și