Sunteți pe pagina 1din 118

UNIVERSITATEA „ALEXANDRU IOAN CUZA” IAŞI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA


AFACERILOR

CARMEN PINTILESCU

STATISTICĂ
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

CUPRINS

INTRODUCERE ................................................................................................................ 3
1. Statistică descriptivă şi statistică inferenţială ......................................................... 3
2. Variabile statistice ................................................................................................... 3
PARTEA ÎNTÂI ................................................................................................................. 7
CAPITOLUL 1. DISTRIBUŢII STATISTICE .............................................................. 7
1.1. Distribuţii statistice pentru variabile numerice discrete....................................... 7
1.2. Distribuţii statistice pentru variabile numerice continue ..................................... 8
1.3. Distribuţii statistice pentru variabile categoriale ............................................... 10
CAPITOLUL 2. CARACTERIZAREA UNEI SERII STATISTICE DUPĂ O
VARIABILĂ NUMERICĂ DISCRETĂ ...................................................................... 13
2.1. Frecvenţe absolute cumulate crescător (Ni↓ ) sau descrescător (Ni↑ ) ............... 13
2.2. Frecvenţe relative cumulate crescător (Fi↓) sau descrescător (Fi↑) ................... 13
2.3. Caracterizarea seriei statistice folosind metode grafice ..................................... 18
2.4. Caracterizarea seriei folosind indicatori ai statisticii descriptive ...................... 21
CAPITOLUL 3. CARACTERIZAREA UNEI SERII STATISTICE DUPĂ O
VARIABILĂ NUMERICĂ CONTINUĂ .................................................................... 57
3.1. Frecvenţe absolute şi relative cumulate crescător sau descrescător................... 57
3.2. Caracterizarea seriei folosind metode grafice .................................................... 59
3.3. Caracterizarea seriei folosind indicatori ai statisticii descriptive ...................... 61
CAPITOLUL 4. CARACTERIZAREA UNEI SERII STATISTICE DUPĂ O
VARIABILĂ CATEGORIALĂ ................................................................................... 75
4.1. Caracterizarea seriei folosind metode grafice .................................................... 75
4.2. Caracterizarea seriei folosind indicatori ai statisticii descriptive ...................... 76
PARTEA A DOUA........................................................................................................... 81
Capitolul 5. Noţiuni şi notaţii folosite în inferenţa statistică ........................................ 81
5.1. Populaţie şi eşantion .......................................................................................... 81
5.2. Parametri şi estimaţii.......................................................................................... 81
5.3. Distribuţia de selecţie a mediei .......................................................................... 82
Capitolul 6. Estimarea parametrilor unei populaţii ....................................................... 87
6.1. Estimarea mediei unei populaţii ( µ ) ................................................................. 87
6.2. Estimarea proporţiei unei populaţii (p) .............................................................. 89
CAPITOLUL 7. TESTAREA IPOTEZELOR STATISTICE ...................................... 93
7.1. Testarea ipotezelor cu privire la un parametru .................................................. 93
7.2 Testarea ipotezelor cu privire la doi parametri ................................................. 104
7.3. Estimare versus testare ..................................................................................... 112
ANEXE ........................................................................................................................... 113
BIBLIOGRAFIE ............................................................................................................. 117

2
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

INTRODUCERE

Termenul de “statistică” a evoluat din momentul în care a apărut pentru prima


oară în lucrarea lui Gottfried Achenwall, publicată în 1746, până în zilele noastre. În acea
perioadă, prin termenul de statistică se înţelegea un ansamblu de informaţii despre
lucrurile remarcabile cu privire la colectivitatea numită stat, expuse într-o anumită ordine.
În prezent, prin statistică se înţelege un ansamblu de metode folosite pentru culegerea,
prezentarea şi analiza datelor înregistrate pentru o colectivitate statistică.

1. Statistică descriptivă şi statistică inferenţială

Datele obţinute în urma observării statistice sunt prelucrate cu ajutorul metodelor


statisticii descriptive şi a statisticii inferenţiale. Statistica descriptivă are ca obiectiv
prezentarea sintetică a datelor statistice, folosind metode de reprezentare grafică şi prin
calculul diferiţilor indicatori statistici (indicatori ai tendinţei centrale, indicatori ai
dispersiei, indicatori ai asimetriei şi boltirii). Statistica inferenţială are ca obiectiv
caracterizarea unei populaţii prin prelucrarea datelor înregistrate pentru un eşantion extras
din aceasta. Problemele statisticii inferenţiale sunt, astfel, estimarea parametrilor
populaţiei (a mediei, varianţei şi proporţiei) şi testarea ipotezelor statistice.

2. Variabile statistice

2.1. Definire şi notaţii


Variabila statistică este o caracteristică, o însuşire a unor unităţi statistice, care
înregistrează o anumită valoare, pentru fiecare unitate statistică observată.
Exemple
- dacă se consideră ansamblul firmelor din judeţul Iaşi care desfăşoară activitate
de producţie, variabilele statistice care pot reprezenta un interes pentru cercetarea
statistică sunt: valoarea vânzărilor, numărul de salariaţi, cifra de afaceri, mărimea firmei
etc.
- dacă se consideră ansamblul studenţilor unei serii, variabilele statistice care pot
fi supuse analizei statistice sunt: vârsta studenţilor, sexul persoanei etc.

O variabilă statistică este notată cu X. Valorile sau variantele variabilei X se


notează cu xi. Din punct de vedere formal, avem: X : ( xi ), cu i = 1, m .

3
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

2.2. Clasificarea variabilelor statistice


Variabilele statistice pot fi clasificate după mai multe criterii:
1. După modul de exprimare, distingem:
- variabile cantitative sau numerice sunt acele variabile pentru care valorile
sunt exprimate numeric.
Exemple: vârsta persoanelor, câştigul salarial, înălţimea etc.

- variabile nenumerice, calitative sau categoriale sunt acele variabile pentru


care valorile sunt exprimate prin cuvinte.
Exemple: sexul persoanei (masculin şi feminin), starea civilă (celibatar, căsătorit,
văduv, divorţat), mediul de rezidenţă (urban, rural) etc.
Pentru analiza statistică, valorilor variabilei categoriale li se atribuie un cod
numeric. Variabilele categoriale pot fi nominale sau ordinale.
Variabilele nominale sunt acele variabile pentru care ordinea acordării codurilor
nu are un sens.
Exemple: pentru variabila X: Sexul persoanei, se pot acorda codurile 1 pentru
varianta Masculin şi 2 pentru varianta Feminin, fără să se poată stabili o relaţie de ordine
între aceste două valori.

Variabilele ordinale sunt acele variabile în care există o relaţie de ordine între
unităţile din categoriile variabilei. Ordinea acordării codurilor diferitelor categorii ale
variabilei X are, în acest caz, un sens.
Exemple: pentru variabila X: Preferinţa pentru un produs, cu variantele Foarte
bun, Bun, Nici bun-nici rău, Foarte rău, Rău, ordinea acordării codurilor are un sens.
Valorile variabilei X sunt 1- Foarte bun, 2- Bun, 3- Nici bun-nici rău, 4 - Foarte rău, 5-
Rău.

2. După numărul de valori ale variabilei, distingem:


- variabile dichotomice sau binare sunt acele variabile care înregistrează două
valori.
Exemple: dacă se înregistrează rata şomajului în diferite ţări ale Uniunii Europene
se pot defini două categorii de ţări: o categorie formată din ţările cu o rată a şomajului
mai mică decât nivelul mediu înregistrat pentru ansamblul ţărilor UE şi o categorie
formată din ţările cu o rată a şomajului mai mare.

- variabile care înregistrează trei sau mai multe valori.


Exemple: pentru variabila X: „vârsta”, valorile care pot fi înregistrate pentru o
populaţie sunt: (xi)=(0, 1, 2, ...) ani.

3. După modul de manifestare a variaţiei lor, distingem:


- variabile discrete sunt acele variabile care nu pot lua decât valori finite din
domeniul de valori al variabilei.
Exemple: variabilele Numărul de angajaţi, Numărul de şomeri, Numărul de copii
pe familie etc.

4
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

- variabile continue sunt acele variabile care pot lua o infinitate de valori din
domeniul de valori al variabilei.
Exemple: variabilele Înălţimea, Greutatea, Viteza etc.

2.3. Scale de măsurare


În vederea măsurării unei variabile pentru o unitate statistică, valorilor unei
variabile li se atribuie coduri sau numere. Scala este reprezentată de aceste coduri sau
numere atribuite valorilor unei variabile X.
În statistică se folosesc patru tipuri de scale:
1. scale pentru măsurarea variabilelor categoriale: scala nominală şi scala
ordinală;
2. scale pentru măsurarea variabilelor numerice: scala interval şi scala raport.

Scala nominală este o scală care presupune atribuirea de coduri variantelor unei
variabile categoriale nominale. Aceste coduri nu au decât rolul de a realiza o separare a
unităţilor statistice pe clase sau grupe. Ordinea acordării acestor coduri nu are un sens. Pe
această scală de măsurare, nu este posibilă realizarea operaţiilor de adunare, scădere etc.

Exemplu
- pentru variabila Sexul persoanei, codurile care se atribuie valorilor acestei
variabile sunt, de exemplu, 1 - pentru unităţile statistice de sex masculin, 2-
pentru unităţile statistice de sex feminin. Ordinea acordării acestor coduri nu
are un sens, ceea ce înseamnă că se poate atribui codul 1 - pentru unităţile
statistice de sex feminin şi codul 2- pentru unităţile statistice de sex masculin.
Pentru această variabilă statistică, singurele operaţii care pot fi realizate
privesc doar frecvenţele sau numărul de unităţi statistice. De exemplu, poate fi
identificată categoria care are frecvenţa cea mai mare, însă nu poate fi
calculată media aritmetică, deoarece valorile codurilor sunt arbitrare.

Scala ordinală este o scală care presupune atribuirea de coduri variantelor unei
variabile categoriale ordinale. Scala ordinală introduce relaţia de ordine între valorile
acestor coduri. Pe această scală de măsurare, este posibilă realizarea operaţiilor specifice
variabilelor nominale, dar şi a operaţiilor care au la bază relaţia de ordine.

Exemplu
- pentru variabila Nivelul de educaţie cu variantele Studii primare, Studii
gimnaziale, Studii liceale, Studii superioare, codurile care se atribuie valorilor
acestei variabile sunt, de exemplu, 1 - Studii primare, 2 - Studii gimnaziale, 3
- Studii liceale, 4 - Studii superioare. Ordinea acordării acestor coduri are, în
acest caz, un sens. Pentru această variabilă statistică, poate fi identificată
categoria care are frecvenţa cea mai mare, dar şi numărul de unităţi care au
studii primare, gimnaziale şi liceale.

5
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Scala interval este o scală care se foloseşte pentru o variabilă numerică.


Diferenţa dintre două valori are, în acest caz, un sens. Scala interval se caracterizează
printr-o valoare zero, fixată, însă, arbitrar: valoarea zero nu arată absenţa unui fenomen,
ci doar trecerea de la o stare la alte. De aceea, raportul dintre două valori nu are sens în
cazul scalei interval.

Exemplu
Dacă se consideră temperatura exprimată în grade Celsius, diferenţa dintre
valorile 200 şi 100 are aceeaşi semnificaţie ca diferenţa dintre valorile 300 şi 200.
Temperatura de 200 de grade, de exemplu, nu arată însă faptul că aceasta este o
temperatură de două ori mai mare decât temperatura de 100. De aceea, raportul dintre
două valori în cazul scalei interval nu are sens.

Scala raport este folosită pentru variabilele numerice şi are ca proprietate faptul
că posedă un zero absolut. Valoarea zero arată, în acest caz, absenţa unui fenomen. În
cazul acestei scale sunt posibile toate operaţiile aritmetice.

Exemplu
Dacă se consideră greutatea unor persoane, diferenţa şi raportul dintre două valori
au un sens. O greutate de 50 kg este de două ori mai mare decât greutatea de 25 de kg.
Valoarea zero arată faptul absenţa greutăţii pentru unitatea respectivă.

6
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

PARTEA ÎNTÂI
STATISTICĂ DESCRIPTIVĂ

CAPITOLUL 1. DISTRIBUŢII STATISTICE

Plecând de la un şir de valori ale unei variabile X înregistrate pentru un ansamblu


format din m unităţi, se poate realiza o grupare a acestor valori, prin construirea unei
distribuţii de frecvenţă.
O distribuţie sau o serie statistică presupune ordonarea valorilor variabilei X şi
determinarea frecvenţei de apariţie, a numărului de unităţi pentru fiecare valoare xi a
variabilei. Frecvenţa de apariţie este notată cu ni.

1.1. Distribuţii statistice pentru variabile numerice discrete


Distribuţia statistică pentru o variabilă discretă presupune realizarea unei grupări a
valorilor variabilei X pe variante de variaţie şi determinarea frecvenţei de apariţie a
fiecărei variante xi.
Forma de prezentare a unei distribuţii statistice pentru o variabilă discretă este
prezentată în tabelul de mai jos:

Tabelul 1.1. Forma generală a unei distribuţii


pentru o variabilă discretă
xi ni
x1 n1
x2 n2
M M
xi ni
M M
xm nm
TOTAL n = ∑ ni
i

Exemplu
Pentru un ansamblu format din 20 de studenţi se înregistrează nota obţinută la un
examen în sesiunea iunie 2009 şi se obţin următoarele rezultate: 9, 6, 5, 5, 6, 7, 6, 7, 9,
10, 7, 8, 4, 5, 8, 8, 7, 7, 6, 8. Se cere să se formeze distribuţia de frecvenţă.

7
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Rezolvare
Variabila statistică X este reprezentată de Nota obţinută la examen, iar variantele
variabilei X sunt valorile xi: (4, 5, 6, 7, 8, 9, 10).
Pentru formarea distribuţiei de frecvenţă, se ordonează valorile variabilei X: Nota
obţinută la examen în sens crescător şi se determină frecvenţa de apariţie, ni, a fiecărei
variante xi. Rezultatele sunt prezentate în tabelul de mai jos:

Tabelul 1.2. Distribuţia studenţilor după nota obţinută la un examen


în sesiunea iunie 2009
xi Frecvenţa de apariţie ni
4 I 1
5 III 3
6 IIII 4
7 IIIII 5
8 IIII 4
9 II 2
10 I 1
TOTAL - 20

1.2. Distribuţii statistice pentru variabile numerice continue


Pentru construirea unei distribuţii statistice după o variabilă continuă, de regulă,
se definesc intervale de variaţie (xi-1, xi). Considerând cazul intervalelor egale de variaţie,
pentru formarea distribuţiei de frecvenţă se parcurg următoarele etape:
• se calculează mărimea intervalelor de grupare, după relaţia:
A x − x min
l = = max , unde:
k k
A este amplitudinea de variaţie a variabilei X, adică diferenţa dintre nivelul maxim
şi nivelul minim al variabilei: A=xmax-xmin;
k este numărul de grupe în care se grupează datele.
Dacă se obţine un număr zecimal, mărimea intervalului de grupare se rotunjeşte
întotdeauna în plus.

• se formează intervalele de grupare;


• se determină frecvenţa de apariţie, ni, corespunzătoare fiecărui interval de variaţie.

Forma de prezentare a unei distribuţii statistice pentru o variabilă continuă este


realizată în tabelul de mai jos:

8
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 1.3. Forma generală a unei distribuţii


pentru o variabilă continuă
xi-1-xi ni
xo-x1 n1
x1-x2 n2
M M
xi-1-xi ni
M M
xm-1-xm nm
TOTAL n = ∑ ni
i

Observaţie
În cazul variabilelor discrete care prezintă un număr mare de valori, pentru o
prezentare sintetică a distribuţiei unităţilor statistice, se realizează, de regulă, gruparea
acestora pe intervale de variaţie.

Exemplu
Pentru un ansamblu format din 30 de firme se înregistrează valoarea vânzărilor
(mil. Lei) obţinute în luna decembrie 2008 şi se obţin următoarele rezultate: 11, 9, 15, 16,
18, 20, 22, 12, 9, 6, 5, 5, 6, 7, 6, 7, 9, 10, 7, 8, 7, 5, 8, 8, 21, 22, 7, 7, 6, 8. Se cere să se
formeze distribuţia de frecvenţă pe intervale de variaţie egale, considerând 5 intervale de
grupare.

Rezolvare
Variabila statistică X este reprezentată de Valoarea vânzărilor.
Pentru formarea distribuţiei de frecvenţă pe intervale de variaţie egale, se parcurg
următoarele etape:
• se calculează mărimea intervalelor de grupare, după relaţia:
A x − xmin 22 − 5
l = = max = = 3 ,4 . Mărimea intervalelor de variaţie este
k k 5
l = 3 ,4 ≈ 4.
• se formează intervalele de grupare. Primul interval de variaţie este intervalul (5-
9), al doilea interval este (9-13) etc.

• se determină frecvenţa de apariţie corespunzătoare fiecărui interval de variaţie.

Rezultatele centralizării datelor sunt prezentate în tabelul de mai jos:

9
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 1.4. Distribuţia firmelor după valoarea vânzărilor (mil. Lei)


în luna decembrie 2008
xi-1-xi ni
5-9 20
9-13 3
13-17 2
17-21 3
21-25 2
TOTAL 30
*Notă: Limita superioară a fiecărui interval este inclusă în intervalul respectiv.

Observaţie
Pentru gruparea datelor pe intervale de variaţie, există mai multe variante
posibile. Dacă limita superioară a unui interval coincide cu limita inferioară a altui
interval, se precizează printr-o notă unde a fost inclusă acea valoare. În exemplul de mai
sus, firmele cu vânzări de 9, 13, 17, 21 mil. Lei au fost incluse în intervalele în care
aceste valori sunt limite superioare.

1.3. Distribuţii statistice pentru variabile categoriale


Distribuţia statistică pentru o variabilă categorială presupune prezentarea
categoriilor variabilei X şi determinarea frecvenţei de apariţie a fiecărei variante.
Forma de prezentare a unei distribuţii statistice pentru o variabilă categorială este
prezentată în tabelul de mai jos:

Tabelul 1.5. Forma generală a unei distribuţii


pentru o variabilă categorială
xi ni
x1 n1
x2 n2
M M
xm nm
TOTAL n = ∑ ni
i

Exemplu
Pentru un ansamblu format din 10 persoane se înregistrează mediul de rezidenţă
(urban, rural) şi se obţin următoarele rezultate: urban, urban, urban, urban, rural, rural,
urban, urban, rural, urban. Se cere să se formeze distribuţia de frecvenţă.

Rezolvare
Variabila statistică X este reprezentată de Mediul de rezidenţă, variabilă
categorială nominală, iar variantele variabilei X sunt xi: (urban, rural).
Rezultatele sunt prezentate în tabelul de mai jos:

10
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 1.6. Distribuţia persoanelor după mediul de rezidenţă


xi ni
Urban 7
Rural 3
TOTAL 10

11
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

12
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

CAPITOLUL 2. CARACTERIZAREA UNEI SERII


STATISTICE DUPĂ O VARIABILĂ NUMERICĂ DISCRETĂ

Caracterizarea unităţilor statistice observate după o variabilă discretă se realizează


folosind metode grafice sau numerice. Pentru reprezentarea grafică a unei serii după o
variabilă discretă se folosesc următoarele diagrame: poligonul frecvenţelor, curba
frecvenţelor sau curba frecvenţelor cumulate. Indicatorii numerici prin care poate fi
caracterizată o serie statistică după o variabilă discretă pot fi grupaţi în indicatori ai
tendinţei centrale (mărimi medii), indicatori ai dispersiei, indicatori ai asimetriei şi
boltirii.

2.1. Frecvenţe absolute cumulate crescător (Ni↓ ) sau descrescător


(Ni↑ )
Frecvenţele absolute cumulate crescător (Ni↓) sau descrescător (Ni↑) exprimă
numărul de unităţi statistice cumulate “până la” sau “peste” un anumit nivel al variabilei,
adică valori ≤ xi, respectiv ≥ xi.
Relaţiile de calcul sunt:
i
N i ↓= N i −1 ↓ + ni = ∑ nh , respectiv
h =1
m
N i ↑= N i +1 ↑ + ni = ∑ n h .
h =i

2.2. Frecvenţe relative cumulate crescător (Fi↓) sau descrescător (Fi↑)


Frecvenţele relative cumulate crescător (Fi↓) sau descrescător (Fi↑) exprimă
ponderea unităţilor statistice cumulate “până la” sau “peste” un anumit nivel al
caracteristicii, adică valori ≤ xi , respectiv ≥ xi.
Relaţiile de calcul sunt:
i
Fi ↓= Fi −1 ↓ + f i = ∑ f h , respectiv
h =1
m
Fi ↑= Fi +1 ↑ + f i = ∑ f h , unde fi reprezintă frecvenţele relative.
h =i

Frecvenţele relative, fi , exprimă ponderea unităţilor ni în volumul total al


unităţilor observate, n, şi se calculează după relaţiile:

13
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

ni n
• fi = = i , atunci când frecvenţele sunt exprimate sub formă de coeficient.
∑ ni n
i
În acest caz, ∑ fi = 1.
i
ni n
• fi = ⋅ 100 = i ⋅ 100 , atunci când frecvenţele sunt exprimate sub formă de
∑ ni n
i
procente (%). În acest caz, ∑ fi = 100%.
i

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea
iunie 2009 se prezintă astfel:

Tabelul 2.1. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze frecvenţele absolute şi relative cumulate crescător sau


descrescător.

Rezolvare
Frecvenţe absolute cumulate crescător( Ni↓)
Frecvenţele absolute cumulate crescător se calculează după relaţia:
i
N i ↓= N i −1 ↓ + ni = ∑ nh .
h =1
Pentru exemplul dat, avem:
N 1 ↓= n1 = 10 ;
N 2 ↓= N 1 ↓ + n 2 = 10 + 25 = 35;
N 3 ↓= N 2 ↓ + n3 = 35 + 40 = 75 etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:

14
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 2.2. Frecvenţele absolute cumulate crescător


xi ni Ni ↓
4 10 10
5 25 35
6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -

Interpretare
Numărul studenţilor care au obţinut nota 4 la examen este de 10 studenţi.
Numărul studenţilor care au obţinut cel mult nota 5 este de 35 persoane. Numărul
studenţilor care au obţinut cel mult nota 6 este de 75 persoane. În mod similar, se
interpretează celelalte rezultate.

Observaţie
În calculul frecvenţelor absolute cumulate crescător, ultima valoare Ni↓ este
întotdeauna egală cu volumul total al eşantionului observat. În exemplul dat, avem
N7↓=n=210.

Frecvenţe absolute cumulate descrescător ( N i ↑ )


Frecvenţele absolute cumulate descrescător se calculează după relaţia:
m
N i ↑= N i +1 ↑ + ni = ∑ n h .
h =i
Pentru exemplul dat, avem:
N 7 ↑= N 8 ↑ + n7 = 5 ;
N 6 ↑= N 7 ↑ + n6 = 5 + 15 = 20 ;
N 5 ↑= N 6 ↑ + n5 = 20 + 60 = 80 etc.
Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.3. Frecvenţele absolute cumulate descrescător


xi ni Ni ↑
4 10 210
5 25 200
6 40 175
7 55 135
8 60 80
9 15 20
10 5 5
TOTAL 210 -

15
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Numărul studenţilor care au obţinut nota 10 la examen este de 5 studenţi.
Numărul studenţilor care au obţinut peste nota 9 este de 25 persoane. Numărul studenţilor
care au obţinut peste nota 8 este de 80 persoane. În mod similar, se interpretează celelalte
rezultate.

Frecvenţe relative (fi)


Frecvenţele relative se calculează după relaţia:
n n
f i = i ⋅ 100 = i ⋅ 100 .
∑ ni n
i
Pentru exemplul dat, avem:
n 10
f 1 = 1 ⋅ 100 = ⋅ 100 = 4 ,76%
∑ ni 210
i
n2 25
f2 = ⋅ 100 = ⋅ 100 = 11,90% etc.
∑ ni 210
i
Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.4. Frecvenţele relative


xi ni fi (%)
4 10 4,76
5 25 11,91
6 40 19,05
7 55 26,19
8 60 28,57
9 15 7,14
10 5 2,38
TOTAL 210 100,00

Interpretare
Ponderea studenţilor care au obţinut nota 4 la examen este de 4,76% din numărul
total de studenţi. Ponderea studenţilor care au obţinut nota 5 este de 11,91%, iar ponderea
studenţilor care au obţinut nota 6 este de 19,05%. În mod similar, se interpretează
celelalte rezultate.

Frecvenţe relative cumulate crescător ( Fi ↓ )


Frecvenţele relative cumulate crescător se calculează după relaţia:
i
Fi ↓= Fi −1 ↓ + f i = ∑ fh .
h =1
Pentru exemplul dat, avem:
F1 ↓= f 1 = 4 ,76% ;
F2 ↓= F1 ↓ + f 2 = 4 ,76 + 11,91 = 16 ,67%;

16
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

F3 ↓= F2 ↓ + f 3 = 16 ,67 + 19 ,05 = 35 ,72% etc.


Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.5. Frecvenţele relative cumulate crescător


xi ni fi (%) Fi ↓ (%)
4 10 4,76 4,76
5 25 11,91 16,67
6 40 19,05 35,72
7 55 26,19 61,91
8 60 28,57 90,48
9 15 7,14 97,62
10 5 2,38 100,00
TOTAL 210 100 -

Interpretare
Ponderea studenţilor care au obţinut nota 4 la examen este de 4,76% din numărul
total de studenţi. Ponderea studenţilor care au obţinut cel mult nota 5 este de 16,67%.
Ponderea studenţilor care au obţinut cel mult nota 6 este de 35,72%. În mod similar, se
interpretează celelalte rezultate.

Frecvenţe relative cumulate descrescător ( Fi ↑ )


Frecvenţele relative cumulate descrescător se calculează după relaţiile:
m
Fi ↑= Fi +1 ↑ + f i = ∑ f h .
h =i
Pentru exemplul dat, avem:
F7 ↑= F8 ↑ + f 7 = 2 ,38%; ;
F6 ↑= F7 ↑ + f 6 = 2 ,38 + 7 ,14 = 9 ,52%;
F5 ↑= F6 ↑ + f 5 = 9 ,52 + 28 ,57 = 38 ,09% etc.

Celelalte rezultate sunt prezentate în tabelul de mai jos:

Tabelul 2.6. Frecvenţele relative cumulate crescător


xi ni fi (%) Fi ↑ (%)
4 10 4,76 100,00
5 25 11,91 95,24
6 40 19,05 83,33
7 55 26,19 64,28
8 60 28,57 38,09
9 15 7,14 9,52
10 5 2,38 2,38
TOTAL 210 100 -

17
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Ponderea studenţilor care au obţinut nota 10 la examen este de 2,38%. Ponderea
studenţilor care au obţinut peste nota 9 este de 9,52%. Ponderea studenţilor care au
obţinut peste nota 8 este de 38,09%. În mod similar, se interpretează celelalte rezultate.

2.3. Caracterizarea seriei statistice folosind metode grafice


O distribuţie statistică după o variabilă numerică discretă poate fi reprezentată
grafic folosind poligonul frecvenţelor, curba frecvenţelor şi curba frecvenţelor cumulate.

Poligonul frecvenţelor
Construirea poligonului frecvenţelor presupune găsirea locului geometric al
punctelor Ai de coordonate (xi , ni) sau (xi , fi) şi unirea acestora prin segmente de dreaptă.
Poligonul frecvenţelor aproximează forma unei distribuţii.
Alura poligonului frecvenţelor este reprezentată în figura de mai jos:

Figura 1. Poligonul frecvenţelor

Curba frecvenţelor
Construirea curbei frecvenţelor presupune ajustarea printr-o linie curbă, continuă
a poligonului frecvenţelor. Curba frecvenţelor aproximează mai bine forma de distribuţie
a colectivităţii după variabila considerată.
Alura curbei frecvenţelor este reprezentată în figura de mai jos:

18
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Figura 2. Curba frecvenţelor

Curba frecvenţelor pentru distribuţia dată se compară cu forma curbei frecvenţelor


pentru o distribuţie normală, cunoscută sub denumirea de Clopotul lui Gauss. Această
curbă este o curbă simetrică faţă de nivelul mediu: jumătate din unităţi au valori mai mici
decât nivelul mediu, iar jumătate au valori mai mari.
În urma prelucrării datelor la nivelul unui eşantion, pot fi obţinute următoarele
forme ale distribuţiei unităţilor:

Figura 3. Curbă asimetrică la dreapta

19
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Figura 4. Curbă asimetrică la stânga

În exemplele prezentate în Figura 3 şi Figura 4 se observă o concentrare a


frecvenţelor ni spre valorile mici (Figura 3), respectiv spre valorile mari ale variabilei X
(Figura 4).

Curba frecvenţelor cumulate


Construirea curbei frecvenţelor cumulate presupune reprezentarea grafică a
funcţiei de repartiţie a frecvenţelor unei variabile: F(X ≤ xi).
Alura curbei frecvenţelor cumulate crescător este reprezentată în figura de mai
jos:

Figura 5. Curba frecvenţelor cumulate crescător

Alura curbei frecvenţelor cumulate desccrescător este reprezentată în figura de


mai jos:

20
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Figura 6. Curba frecvenţelor cumulate descrescător

2.4. Caracterizarea seriei folosind indicatori ai statisticii descriptive

Cei mai importanţi indicatori ai statisticii descriptive pot fi grupaţi în indicatori ai


tendinţei centrale, indicatori ai dispersiei, indicatori ai asimetriei şi boltirii.

2.4.1. Indicatori ai tendinţei centrale (mărimi medii)


Indicatorii tendinţei centrale sunt indicatori prin care pot fi caracterizate în mod
sintetic unităţile statistice observate după o variabilă X. Principalele mărimi medii folosite
în caracterizarea unei serii statistice sunt media aritmetică, modul şi mediana.

a. Media aritmetică ( x )
Media aritmetică pentru o serie statistică după o variabilă discretă se calculează
după relaţiile:
∑ xi
x= i , pentru o serie simplă de valori;
n
∑ x i ⋅ ni
x= i , pentru o serie cu frecvenţe ni.
∑ ni
i

Principalele proprietăţi ale mediei aritmetice sunt:


1. Media aritmetică se înscrie în intervalul de variaţie al variabilei X:
x min ≤ x ≤ x max .

21
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

2. Pentru o serie cu frecvenţe, media aritmetică este plasată între valorile extreme,
oscilând în jurul valorii cu frecvenţa dominantă.
Media este considerată în statistică un punct de echilibru, similar centrului de
greutate în fizică. Dacă o serie nu prezintă o asimetrie pronunţată, atunci media va fi în
apropierea valorii cu frecvenţa cea mai mare.

3. Media este o mărime normală, adică suma abaterilor valorilor individuale ale unei
variabile X de la media lor este egală cu zero:
∑ ( xi − x ) = 0 , pentru o serie simplă de valori;
i

∑ ( x i − x ) ⋅ ni = 0 , pentru o serie cu frecvenţe.


i

Exemple
1. Vânzările unei firme (mil. Lei) înregistrate timp de cinci zile sunt: 10, 9, 8 7, 7.
Se cere să se calculeze media aritmetică.

Rezolvare
Media aritmetică pentru o serie simplă de valori se calculează după relaţia:
∑ xi
x= i .
n
Pentru exemplul dat, obţinem:
∑ xi 10 + 9 + 8 + 7 + 7
x= i = = 8 ,2 mil. Lei.
n 5
Interpretare
Nivelul mediu al vânzărilor zilnice ale firmei este de 8,2 mil. Lei.

2. Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea


iunie 2009 se prezintă astfel:

Tabelul 2.7. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze media aritmetică.

22
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Rezolvare
Media aritmetică pentru o serie statistică cu frecvenţe se calculează după relaţia
∑ x i ⋅ ni
x= i .
∑ ni
i
Elementele pentru calculul mediei aritmetice sunt prezentate în tabelul de mai jos:

Tabelul 2.8. Elementele pentru calculul mediei aritmetice


xi ni x i ⋅ ni
4 10 40
5 25 125
6 40 240
7 55 385
8 60 480
9 15 135
10 5 50
TOTAL ∑ ni = 210 ∑ x i ⋅ ni = 1455
i i

Înlocuind în relaţia de mai sus, se obţine :


∑ xi ⋅ ni 1455
x= i = = 6 ,93 .
∑ ni 210
i
Interpretare
Nota medie obţinută de studenţii din eşantionul observat la examen este de
6,93~7.

b. Modul (Mo)
Modul este valoarea variabilei cea mai frecvent observată într-o distribuţie, adică
valoarea xi care corespunde frecvenţei maxime (nimax).
Aflarea modului presupune identificarea valorii xi corespunzătoare frecvenţei
maxime (nimax).

Exemple
1. Vânzările unei firme A (mil. Lei) înregistrate timp de cinci zile sunt: 10, 9, 8 7,
7. Se cere să se afle modul.

Rezolvare
Pentru aflarea modului, trebuie identificată valoarea xi corespunzătoare frecvenţei
maxime (nimax). Frecvenţa maximă este nimax=2, iar valoarea xi corespunzătoare este xi=7.
Pentru seria dată, modul este: Mo=7 mil. Lei.

23
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Valoarea vânzărilor cea mai frecvent înregistrată de firma A este de 7 mil. Lei pe
zi.

2. Vânzările unei firme A (mil. Lei) înregistrate timp de cinci zile sunt: 10, 8, 8 7,
7. Se cere să se afle valoarea modului.

Rezolvare
Pentru aflarea modului, trebuie identificată valoarea xi corespunzătoare frecvenţei
maxime (nimax). Frecvenţa maximă este nimax=2, iar valorile xi corespunzătoare sunt xi=7
şi xi=8. Seria dată este o serie bimodală, valorile modului fiind de 7 mil. Lei şi de 8 mil.
Lei.

Interpretare
Valorile vânzărilor cele mai frecvente sunt de 7 mil. Lei şi de 8 mil. Lei pe zi .

3. Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea


iunie 2009 se prezintă astfel:

Tabelul 2.9. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
Mo=8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze modul.

Rezolvare
Pentru aflarea modului, se află frecvenţa maximă: nimax=60. Valoarea xi care
corespunde acestei frecvenţe maxime este xi=8. Pentru seria dată, modul este: Mo=8.

Interpretare
Cei mai mulţi studenţi au luat la examenul din sesiunea iunie 2009 nota 8.

c. Mediana (Me)
Mediana reprezintă acea valoare a variabilei care împarte seria ordonată crescător
în două părţi egale: jumătate din unităţi au valori mai mici decât mediana, iar jumătate au
valori mai mari decât mediana.
Aflarea medianei se realizează diferit în funcţie de tipul seriei:

24
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

1. Pentru o serie simplă:


• cu număr par de termeni, mediana este reprezentată de media aritmetică simplă a
celor doi termeni centrali ai seriei ordonate crescător.
Exemplu
Se consideră seria reprezentată de valorile 10, 9, 11, 6, 7, 8. Pentru aflarea
medianei, şirul valorilor se ordonează în sens crescător: 6, 7, 8, 9, 10, 11. Mediana este
reprezentată de media aritmetică simplă a celor doi termeni centrali ai seriei ordonate
8+9
crescător, respectiv Me = = 8 ,5 .
2

• cu număr impar de termeni, mediana este reprezentată de termenul central al


seriei ordonate crescător.
Exemplu
Se consideră seria reprezentată de valorile 10, 9, 11, 6, 7. Pentru aflarea medianei,
şirul valorilor se ordonează în sens crescător: 6, 7, 9, 10, 11. Mediana este reprezentată de
termenul central al seriei ordonate crescător, respectiv Me = 9 .

2. Pentru o serie cu frecvenţe după o variabilă discretă


Aflarea medianei presupune parcurgerea următoarelor etape:
• se calculează unitatea mediană:
∑ ni
Me
- atunci când n ≥ 100 , unitatea mediană este : U = i ;
2
∑ ni + 1
Me
- atunci când n < 100 , unitatea mediană este U = i .
2
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UMe;
• valoarea xi corespunzătoare acestei frecvenţe Ni↓≥UMe este mediana.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen, în sesiunea
iunie 2009, se prezintă astfel:

Tabelul 2.10. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

25
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Se cere să se calculeze mediana.

Rezolvare
Etape pentru aflarea medianei:

210
∑ ni
Me i
• se calculează unitatea mediană: U = = 105 ;=
2 2
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

Tabelul 2.11. Frecvenţele absolute cumulate crescător


xi ni N1 ↓
4 10 10
5 25 35
6 40 75
Me=7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -

• se află prima valoare Ni↓≥UMe. Pentru exemplul dat, N i ↓= 130 ≥ U Me = 105.


• valoarea xi corespunzătoare primei frecvenţe Ni↓≥UMe este mediana. Pentru
exemplul dat, Me=7.

Interpretare
Jumătate din numărul total al studenţilor au luat la examenul din sesiunea iunie
2009 o notă de până la 7, iar jumătate au luat peste 7.

Observaţie
Locul medianei într-o distribuţie depinde de forma acesteia. Doar în cazul unei
distribuţii simetrice mediana este termenul central al seriei.

Exemplu
Se consideră distribuţiile a două serii, prezentate în tabelele de mai jos:

26
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Seria I
xi ni
1 20
2 40
3 20
4 15
5 5
TOTAL 100

Seria II
xi ni
1 10
2 20
3 40
4 20
5 10
TOTAL 100

Să se afle şi să se compare valorile medianei pentru cele două distribuţii.

Rezolvare
Pentru seria I, aflarea medianei presupune parcurgerea următoarelor etape:
∑ ni 100
Me
• se calculează unitatea mediană: U = i = = 50 ;
2 2
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

Tabelul 2.12. Frecvenţele absolute cumulate crescător


pentru seria I
xi ni Ni ↓
1 20 20
Me=2 40 60
3 20 80
4 15 95
5 5 100
TOTAL 100 -

• prima valoare Ni↓≥UMe este N i ↓= 60 ≥ U Me = 50.


• valoarea xi corespunzătoare frecvenţei Ni↓≥UMe este Me=2.

Pentru seria II se obţin următoarele rezultate:

27
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 2.13. Frecvenţele absolute cumulate crescător


pentru seria II
xi ni Ni ↓
1 10 10
2 20 30
Me=3 40 70
4 20 90
5 10 100
TOTAL 100 -

În acest caz, valoarea medianei este Me=3.

Se observă că poziţia medianei pentru cele două distribuţii diferă, deşi volumul
colectivităţii este acelaşi, n=100. Seria I este o serie asimetrică, spre deosebire de seria II
care este o distribuţie simetrică. În acest ultim caz, mediana este reprezentată de termenul
central al seriei.

d. Relaţii între cele trei mărimi medii fundamentale


Relaţia dintre cele trei mărimi medii fundamentale evidenţiază forma unei
distribuţii:
• atunci când x = Mo = Me , distribuţia este simetrică;

Figura 7. Distribuţie simetrică

• atunci când x > Me > Mo , distribuţia este asimetrică la dreapta;

28
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Figura 8. Distribuţie asimetrică la dreapta

• atunci când x < Me < Mo , distribuţia este asimetrică la stânga.

Figura 9. Distribuţie asimetrică la stânga

e. Comparaţii între cele trei mărimi medii fundamentale


Interpretarea valorilor obţinute pentru cele trei mărimi medii fundamentale poate
releva aspecte importante privind unităţile statistice din distribuţia analizată.
De exemplu, să considerăm că în urma prelucrării datelor privind salariul lunar
(lei) obţinut de către salariaţii unei firme, s-au obţinut următoarele rezultate:
x = 1500 lei ; Mo = 700 lei ; Me = 800 lei .

29
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Aceste valori arată că salariul mediu obţinut de salariaţii firmei este de 1500
lei/lună, însă cei mai mulţi salariaţi câştigă 700 lei/lună, iar jumătate din numărul total al
salariaţilor câştigă până la 800 lei/lună, iar jumătate câştigă peste 800 lei/lună. Distribuţia
salariaţilor firmei observate este o distribuţie puternic asimetrică la dreapta.
Aceste rezultate pot fi explicate prin diferenţe mari înregistrate între valorile
salariului obţinut de salariaţii din firma considerată. Media aritmetică este o mărime
influenţată de valorile extreme, aberante. De aceea, este deosebit de utilă şi interpretarea
celorlalte mărimi medii fundamentale.

f. Generalizarea medianei: quantilele


Quantilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în r
părţi egale. Cele mai folosite quantile sunt:

1. Quartilele
Quartilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în 4
părţi egale.
Poziţia celor trei quartile într-o distribuţie simetrică este prezentată în figura de
mai jos:

Figura 10. Poziţia quartilelor într-o distribuţie

Quartila unu ( Q1)


Aflarea quartilei unu presupune parcurgerea următoarelor etape:
∑ ni
Q1
• se calculează unitatea quartilică unu: U = i ;
4
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UQ1;
• valoarea xi corespunzătoare frecvenţei Ni↓≥UQ1 este quartila unu.

30
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Quartila doi ( Q2)


Aflarea quartilei doi presupune parcurgerea următoarelor etape:
2 ⋅ ∑ n i ∑ ni
Q2
• se calculează unitatea quartilică doi: U = i
= i = U Me . Quartila doi
4 2
este, deci, mediana.

Quartila trei ( Q3)


Aflarea quartilei trei presupune parcurgerea următoarelor etape:
3 ⋅ ∑ ni
Q3 i
• se calculează unitatea quartilică trei: U = ;
4
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UQ3;
• valoarea xi corespunzătoare frecvenţei Ni↓≥UQ3 este quartila trei.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen, în sesiunea
iunie 2009, se prezintă astfel:

Tabelul 2.14. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze quartila unu şi quartila trei.

Rezolvare
Quartila unu

210
∑ ni
Q1 i
• se calculează unitatea quartilică unu: U = =
= 52 ,5 ;
4 4
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

31
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 2.15. Frecvenţele absolute cumulate crescător


xi ni N1 ↓
4 10 10
5 25 35
Q1=6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -

• se află prima valoare Ni↓≥UQ1. Pentru exemplul dat, N i ↓= 75 ≥ U Q1 = 52 ,5 ;


• valoarea xi corespunzătoare primei frecvenţe Ni↓≥UMe este quartila unu. Pentru
exemplul dat, Q1=6.

Interpretare
25% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o
notă de până la 6, iar 75% au luat peste 6.

Quartila trei
3 ⋅ ∑ ni
Q3 3 ⋅ 210 i
• se calculează unitatea quartilică trei: U = = 157 ,5 ; =
4 4
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

Tabelul 2.16. Frecvenţele absolute cumulate crescător


xi ni N1 ↓
4 10 10
5 25 35
6 40 75
7 55 130
Q3=8 60 190
9 15 205
10 5 210
TOTAL 210 -

• se află prima valoare Ni↓≥UQ3. Pentru exemplul dat, N i ↓= 190 ≥ U Q3 = 157 ,5.
• valoarea xi corespunzătoare primei frecvenţe Ni↓≥UQ3 este quartila trei. Pentru
exemplul dat, Q3=8.

Interpretare
75% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o
notă de până la 8, iar 25% au luat peste 8.

32
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

2. Decilele
Decilele sunt valori ale caracteristicii care împart volumul unei colectivităţi în 10
părţi egale. Cele mai importante decile sunt decila unu şi decila nouă.

Decila unu ( D1)


Aflarea decilei unu presupune parcurgerea următoarelor etape:
∑ ni
D1
• se calculează unitatea decilică unu: U = i ;
10
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UD1;
• valoarea xi corespunzătoare frecvenţei Ni↓≥UD1 este decila unu.

Decila nouă (D9)


Aflarea decilei nouă presupune parcurgerea următoarelor etape:
9 ⋅ ∑ ni
D9 i
• se calculează unitatea decilică nouă: U = ;
10
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UD9;
• valoarea xi corespunzătoare ifrecvenţei Ni↓≥UD9 este decila nouă.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea
iunie 2009 se prezintă astfel:

Tabelul 2.17. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze decila unu şi decila nouă.

Rezolvare
Decila unu
∑ ni 210
D1 i
• se calculează unitatea decilică unu: U = = = 21 ;
10 10

33
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt


prezentate în tabelul de mai jos:

Tabelul 2.18. Frecvenţele absolute cumulate crescător


xi ni N1 ↓
4 10 10
D1=5 25 35
6 40 75
7 55 130
8 60 190
9 15 205
10 5 210
TOTAL 210 -

• se află prima valoare Ni↓≥UD1. Pentru exemplul dat, N i ↓= 35 ≥ U D1 = 21.


• valoarea xi corespunzătoare primei frecvenţe Ni↓≥UD1 este decila unu. Pentru
exemplul dat, D1=5.

Interpretare
10% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o
notă de până la 5, iar 90% au luat peste 5.

Decila nouă
9 ⋅ ∑ ni
D9 9 ⋅ 210i
• se calculează unitatea decilică nouă: U = = 189 ; =
10 10
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

Tabelul 2.19. Frecvenţele absolute cumulate crescător


xi ni N1 ↓
4 10 10
5 25 35
6 40 75
7 55 130
D9=8 60 190
9 15 205
10 5 210
TOTAL 210 -

• se află prima valoare Ni↓≥UD9. Pentru exemplul dat, N i ↓= 190 ≥ U D9 = 189.


• valoarea xi corespunzătoare primei frecvenţe Ni↓≥UD9 este decila nouă. Pentru
exemplul dat, D9=8.

34
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
90% din numărul total al studenţilor au luat la examenul din sesiunea iunie 2009 o
notă de până la 8, iar 10% au luat peste 8.

g. Reprezentarea diagramei „box-and-whiskers” sau „box-plot”


Construirea diagramei „box-and-whiskers” presupune reprezentarea următoarelor
valori ale tendinţei centrale: quartila unu, mediana, quartila trei, decila unu şi decila nouă.
Forma generală a diagramei „box-and-whiskers” este prezentată în figura de mai jos:

4,00 5,00 6,00 7,00 8,00 9,00 10,00

D1 Q1 Q2 Q3 D9

Figura 11. Diagrama „box-and-whiskers”

Diagrama „box-and-whiskers” este utilă în cercetarea statistică deoarece oferă


informaţii cu privire la indicatorii tendinţei centrale, la forma unei distribuţii, dar şi cu
privire la gradul de dispersie al distribuţiei (fenomen prezentat în capitolul următor).
Într-o distribuţie perfect simetrică, valorile decilei unu şi nouă, respectiv ale
quartilei unu şi trei, sunt reprezentate la aceeaşi distanţă faţă de mediană. Această situaţie
este reprezentată în Figura 11.

2.4.2. Indicatori ai dispersiei


Pentru caracterizarea unităţilor unei distribuţii nu este suficientă doar folosirea
indicatorilor tendinţei centrale. Pentru o caracterizare corectă a unei distribuţii trebuie să
se ia în considerare gradul de variaţie a valorilor variabilei X faţă de nivelul mediu. O
colectivitate caracterizată printr-o dispersie mare a valorilor xi ale unei variabile faţă de
nivelul mediu este o colectivitate eterogenă iar media nu este reprezentativă pentru
distribuţie.

a. Definirea fenomenului de dispersie


Aprecierea variabilităţii valorilor unei variabile faţă de nivelul mediu se poate
realiza prin aprecierea fenomenului de dispersie. Dispersia exprimă gradul de împrăştiere

35
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

a valorilor individuale ale unei variabile faţă de nivelul mediu. Aprecierea fenomenului
de dispersie al unei distribuţii permite identificarea gradului de reprezentativitate a
mediei unei distribuţii.

b. Indicatorii dispersiei
Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaţie
Amplitudinea de variaţie măsoară distanţa dintre nivelul maxim şi nivelul minim
al unei variabile. Se calculează pe baza relaţiei:
A = x max − x min .
Acest indicator permite aprecierea întinderii domeniului de variaţie al variabilei
X. Dezavantajul acestui indicator constă în faptul că nu „pătrunde” în interiorul
distribuţiei, respectiv între cele două valori extreme ale variabilei.

2. Varianţa
Varianţa este media pătratelor abaterilor valorilor xi de la nivelul mediu şi poate fi
calculată pe baza relaţiei:
∑ ( xi − x ) 2
s2 = i , pentru o serie simplă;
n
∑ ( x i − x ) 2 ⋅ ni
s2 = i , pentru o serie cu frecvenţe.
∑ ni
i
Varianţa nu are unitate de măsură şi nu se interpretează.

3. Abaterea medie pătratică (abaterea standard)


Abaterea medie pătratică sau abaterea standard este rădăcina mediei pătratelor
abaterilor valorilor xi de la nivelul mediu şi poate fi calculată pe baza relaţiei:
∑ ( xi − x ) 2
s = s2 = i
, pentru o serie simplă;
n
∑ ( x i − x ) 2 ⋅ ni
s = s2 = i
, pentru o serie cu frecvenţe.
∑ ni
i
Abaterea standard se exprimă în aceeaşi unitate de măsură cu cea a variabilei X.
Arată cu cât variază, în medie, valorile variabilei X de la nivelul mediu, în sens negativ şi
pozitiv.

4. Coeficientul de variaţie
Întrucât abaterea standard şi media se exprimă în aceeaşi unitate de măsură cu cea
a variabilei X, aceşti indicatori nu pot fi folosiţi pentru a compara două serii de date care
sunt exprimate în unităţi de măsură diferite. Pentru a înlătura acest inconvenient, se
calculează coeficientul de variaţie, după relaţia:

36
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

s
v= ⋅ 100 .
x
Prin evaluarea acestui coeficient se poate aprecia gradul de reprezentativitate a
mediei unei distribuţii. În general, o valoare a coeficientului de variaţie mai mică de 50%
arată că media este reprezentativă.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea
iunie 2009 se prezintă astfel:

Tabelul 2.20. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze indicatorii dispersiei.

Rezolvare
Cei mai importanţi indicatori ai dispersiei sunt: amplitudinea de variaţie, varianţa,
abaterea standard şi coeficientul de variaţie.

Amplitudinea de variaţie
Amplitudinea de variaţie se calculează pe baza relaţiei:
A = x max − x min = 10 − 4 = 6 .
Interpretare
Diferenţa dintre nivelul maxim şi nivelul minim al variabilei X este egală cu 6.

Varianţa
Varianţa se calculează pe baza relaţiei:
∑ ( x i − x ) 2 ⋅ ni
s2 = i . Pentru această distribuţie, media este x = 6 ,93 .
∑ ni
i
Elementele de calcul ale varianţei sunt prezentate în tabelul de mai jos:

37
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 2.21. Elemente de calcul ale varianţei


xi ni xi − x ( xi − x ) 2 ( xi − x ) 2 ⋅ n i
4 10 -2,93 8,58 85,85
5 25 -1,93 3,72 93,12
6 40 -0,93 0,86 34,60
7 55 0,07 0,00 0,27
8 60 1,07 1,14 68,69
9 15 2,07 4,28 64,27
10 5 3,07 9,42 47,12
TOTAL 210 - - 393,93

Înlocuind în relaţia de mai sus, se obţine:


∑ ( xi − x )2 ⋅ ni 393,93
s2 = i = = 1,876 .
∑ ni 210
i

Abaterea standard
Abaterea standard se calculează pe baza relaţiei:
s = s 2 = 1,876 = 1,37 .
Interpretare
Notele obţinute de studenţii din seria dată variază, în medie, faţă de nota medie cu
1,37~1 punct, în sens pozitiv şi negativ.

Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s 1,37
v = ⋅ 100 = ⋅ 100 = 19 ,77% .
x 6 ,93
Interpretare
Valoarea coeficientului de variaţie arată că distribuţia studenţilor după nota
obţinută la un examen în sesiunea iunie 2009 este o distribuţie omogenă, caracterizată
printr-o dispersie mică (v<50%). Media este reprezentativă pentru această distribuţie.

c. Compararea fenomenului de dispersie pentru mai multe distribuţii


Pentru două colectivităţi se înregistrează vârsta persoanelor şi se obţin
următoarele rezultate:
x1 = 15 ani , s1 = 2 ani ;
x 2 = 50 ani , s 2 = 2 ani .
Aceste rezultate arată că ambele colectivităţi se caracterizează printr-o dispersie
mică a vârstei persoanelor faţă de vârsta medie. Vârsta medie pentru unităţile din prima
colectivitate este, însă, mult mai mică decât vârsta medie pentru unităţile din cea de-a
doua colectivitate. Aceasta arată că prima colectivitate este formată din persoane foarte
tinere, spre deosebire de persoanele din cea de-a doua colectivitate.

38
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Reprezentarea grafică a două distribuţii caracterizate prin medii diferite şi aceeaşi


dispersie este realizată în figura de mai jos:

Figura 12. Curba frecvenţelor pentru două distribuţii

Reprezentarea grafică a două distribuţii caracterizate prin aceeaşi medie şi


dispersii diferite este realizată în figura de mai jos:

Figura 13. Curba frecvenţelor pentru două distribuţii

d. Abaterea standard şi distribuţia normală


Cunoscând nivelul mediu şi abaterea standard pentru o distribuţie, putem afla care
este proporţia unităţilor care înregistrează valori mai mari, de exemplu, decât ( x + s ).

39
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Pentru aceasta, se calculează valori ale unei variabile standardizat Z, cunoscută şi


sub denumirea de scor Zi, după relaţia:
x −x
zi = i . Această mărime arată poziţia unei unităţi faţă de nivelul mediu ( x ),
s
folosind ca „unitate de măsură” abaterea standard. Variabila Z este o variabilă de medie 0
şi varianţă egală cu 1.
De exemplu, pentru o distribuţie caracterizată printr-o medie de x = 100 şi o
abatere standard de s = 20 , pentru xi=140 putem afla valoarea zi, astfel:
140 − 100
zi = = 2 . Aceasta arată că unitatea care înregistrează valoarea xi=140 se
20
găseşte la o distanţă faţă de nivelul mediu egală cu de două ori abaterea standard.

Odată calculată valoarea z, putem afla proporţia unităţilor care înregistrează valori
mai mari decât 140, de exemplu. Aceste valori sunt calculate pentru o distribuţie normală
şi sunt tabelate (Anexa 1).
Tabelul care prezintă aceste rezultate este de forma:

0 0.01 K 0.05 K
0
0.1
0.2
M
1 0,341
1.1 0,375
M

Pe prima coloană sunt valorile lui z, întregul şi prima zecimală, iar valorile din
următoarele coloane reprezintă a doua zecimală a valorii zi. Valorile din interiorul tabelul

40
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

arată proporţia unităţilor care înregistrează valori cuprinse între nivelul mediu şi scorul z
corespunzător.

De exemplu, pentru o valoare zi=1,15, se citeşte 0,375. Această valoare arată că


aproximativ 37,5% din unităţile distribuţiei înregistrează valori cuprinse între nivelul
mediu şi valoarea zi=1,15.
În Tabelul Z nu sunt valori negative pentru zi, însă distribuţia normală este o
distribuţie simetrică, deci aria suprafeţei cuprinse între nivelul mediu şi valoarea pozitivă
sau negativă a lui Z este aceeaşi.

Exemple
1. Pentru o distribuţie normală de medie, x , şi abatere standard, s, să se afle
proporţia unităţilor care înregistrează valori cuprinse în intervalele ( x ± s ), ( x ± 2 ⋅ s ) şi
( x ± 3 ⋅ s ).

Rezolvare
Pentru a afla proporţia unităţilor care înregistrează valori cuprinse în intervalul
( x − s ; x + s ) , se calculează scorul Z, astfel:
x −x x−s−x
z1 = 1 = = −1
s s
x −x x+s−x
z2 = 2 = = +1 .
s s

Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=1, şi anume 0,341.

0 0.01 K 0.05 K
0
0.1
0.2
M
1 0,341
1.1 0,375
M

41
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Această valoare, 0,341, reprezintă aria suprafeţei cuprinse între nivelul mediu şi
zi=1. Proporţia unităţilor care înregistrează valori cuprinse în intervalul ( x − s ; x + s )
este: 2 ⋅ 0 ,341 = 0 ,682 sau 68,2%.

În mod similar, se obţin valorile zi=±2, pentru limitele intervalului ( x ± 2 ⋅ s ).

Din tabelul Z, se citeşte valoarea care corespunde unui nivel zi=2, de 0,477.

0 K 0.05 K
0
0.1
0.2
M
2 0,477
M

Proporţia unităţilor care înregistrează valori cuprinse în intervalul


( x − 2 ⋅ s ; x + 2 ⋅ s ) este: 2 ⋅ 0 ,477 = 0 ,954 sau 95,4%.

42
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Pentru intervalul ( x ± 3 ⋅ s ), se obţin valorile zi=±3:

Pentru zi=±3, se citeşte valoarea corespunzătoare 0,499.

0 K 0.05 K
0
0.1
0.2
M
3 0,499

Proporţia unităţilor care înregistrează valori cuprinse în intervalul


( x − 3 ⋅ s ; x + 3 ⋅ s ) este: 2 ⋅ 0 ,499 = 0 ,998 sau 99,8%.

43
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Într-o distribuţie normală, în intervalul ( x ± s ) sunt cuprinse 68,2% din unităţi, în
intervalul ( x ± 2 ⋅ s ) sunt cuprinse 95,4% din unităţi şi în intervalul ( x ± 3 ⋅ s ) sunt
cuprinse 99,8% din unităţi.

2. Distribuţia unor studenţi după nota obţinută la un test urmează o lege normală
şi se caracterizează prin următoarele rezultate: x = 7 şi s=2. Se cere să se afle proporţia
studenţilor care au luat note mai mici decât 6.

Rezolvare
Valoarea Zi care corespunde unei valori xi=6 se calculează astfel:
x −x 6−7
zi = i = = −0 ,5
s 2
Din tabelul Z se citeşte valoarea care corespunde unui nivel zi=0,5, egală cu
0,191.

0 0.01 K 0.05 K
0
0.1
0.2
M
0,5 0,191
M

Proporţia studenţilor care au luat note mai mici decât 6 este f=0,5-0,191=0,309
sau 30,9%.

44
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Observaţie
Aria suprafeţei reprezentate în figura de mai sus este egală cu unu (după cum am
precizat anterior, suma proporţiilor este egală cu 1 sau 100%). Distribuţia normală este o
distribuţie simetrică, deci proporţia unităţilor care au valori mai mari decât nivelul mediu
este de 0,5.

3. Distribuţia unor persoane după vârstă urmează o lege normală şi se


caracterizează prin următoarele rezultate: x = 30 ani şi s=4 ani. Se cere să se afle
proporţia persoanelor care au o vârstă cuprinsă între 27 ani şi 35 ani.

Rezolvare
Valorile lui Z corespunzătoare lui x1=27 şi x2=35 sunt:
x − x 27 − 30
z1 = 1 = = −0 ,75
s 4
x − x 35 − 30
z2 = 2 = = +1,25 .
s 4
Din tabelul Z se citesc valorile corespunzătoare lui z1=-0,75 şi z2=+1,25, astfel:

0 K 0.05 K
0
0.1
0.2
M
0,7 0,273
M M
1,2 0,394
M M

Proporţia persoanelor care au o vârstă cuprinsă între 27 ani şi 35 ani este:


f=0,273+0,394=0,667 sau 66,7%.

45
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

4. Pentru o distribuţie normală de medie x , şi abatere standard s, să se afle


limitele intervalului care include 95% din unităţile statistice observate.

Rezolvare
Această problemă poate fi prezentată grafic astfel:

Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat
anterior: se cunoaşte proporţia (95%) şi trebuie să aflăm valoarea zi care corespunde
acestei proporţii.
Pentru a afla valoarea zi, se calculează aria suprafeţei cuprinsă între nivelul mediu
95%
şi z, care este egală cu = 47 ,5% sau 0,475.
2

46
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Pentru această proporţie egală cu 0,475, se citeşte valoarea zi corespunzătoare, de


1,96.
0 K 0.06 K
0
0.1
0.2
M
1,9 0,475
M M

Prin urmare, într-o distribuţie normală, 95% din unităţi au valori cuprinse în
intervalul [x − 1,96 ⋅ s ; x + 1,96 ⋅ s ] .

Observaţie
În estimarea parametrilor unei populaţii, problematică prezentată în partea a doua,
obiectivul urmărit este de a afla limitele unui interval care acoperă media unei populaţii,
în 95% din cazuri, de exemplu.

47
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

2.4.3. Indicatori ai formei unei distribuţii

a. Asimetria
O distribuţie este simetrică dacă valorile frecvenţelor sunt egal dispersate faţă de
valoarea centrală a seriei. Distribuţia normală este exemplul clasic al unei repartiţii
simetrice. Graficul densităţii de repartiţie în cazul unei distribuţii normale are forma unui
clopot simetric, cu axa de simetrie reprezentată de media seriei. O deviere de la forma
simetrică a unei distribuţii evidenţiază fenomenul de asimetrie.

Asimetria poate fi apreciată pe cale grafică prin reprezentarea poligonului şi


curbei frecvenţelor, şi prin reprezentarea diagramei “box-and-whiskers”.

Alura curbei frecvenţelor în cazul unei distribuţii simetrice, a unei distribuţii


asimetrice la dreapta sau la stânga este reprezentată grafic în figurile de mai jos:
50

40
Frequency

30

20

10

0 Mean = 7,00
Std. Dev. =
4,00 6,00 8,00 10,00 1,54303
N = 190
Nota

Figura 14. Distribuţie simetrică

60

50
Frequency

40

30

20

10

0 Mean = 6,4737
Std. Dev. =
4,00 6,00 8,00 10,00 1,43163
N = 190
Nota

Figura 15. Distribuţie asimetrică la dreapta

48
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

60

50

Frequency
40

30

20

10
Mean = 7,5263
Std. Dev. =
0 1,43163
N = 190
4,00 6,00 8,00 10,00

Nota

Figura 16. Distribuţie asimetrică la stânga

Alura diagramei “box-and-whiskers” în cazul unei distribuţii simetrice, a unei


distribuţii asimetrice la dreapta sau la stânga este reprezentată grafic în figurile de mai
jos:

4,00 5,00 6,00 7,00 8,00 9,00 10,00

Figura 17. Distribuţie simetrică

49
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Nota

4,00 5,00 6,00 7,00 8,00 9,00 10,00

Figura 18. Distribuţie asimetrică la dreapta

Nota

4,00 5,00 6,00 7,00 8,00 9,00 10,00

Figura 19. Distribuţie asimetrică la stânga

Cei mai importanţi indicatori ai asimetriei sunt:


1. Asimetria în mărime absolută
Asimetria în mărime absolută poate fi calculată pe baza relaţiei:
As = x − Mo .
O valoare pozitivă a acestui indicator arată o asimetrie la dreapta a distribuţiei, iar
o valoare negativă arată o asimetrie la stânga. O valoare nulă arată o distribuţie simetrică.

2. Coeficientul de asimetrie Pearson


Coeficientul de asimetrie Pearson se calculează pe baza relaţiei:
µ 32
β1 = , unde:
µ 23

50
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

∑ ( x i − x ) 3 ⋅ ni
i
µ3 = reprezintă momentul centrat de ordinul 3;
∑ ni
i

∑ ( x i − x ) 2 ⋅ ni
µ2 = i
= s 2 reprezintă momentul centrat de ordinul 2, adică
∑ ni
i
varianţa.
Acest indicator este întotdeauna pozitiv. Sensul asimetriei este dat de semnul lui
µ 3. Atunci când µ 3>0, distribuţia este asimetrică la dreapta. Atunci când µ 3<0, distribuţia
este asimetrică la stânga.

3. Coeficientul de asimetrie Fisher


Coeficientul de asimetrie Fisher se calculează pe baza relaţiei:
µ3
γ1 = .
s3
Interpretarea valorii acestui coeficient este similară coeficientului de asimetrie
Pearson.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea
iunie 2009 se prezintă astfel:

Tabelul 2.22. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze indicatorii asimetriei.

Rezolvare
Indicatorii asimetriei sunt:
1. Asimetria în mărime absolută
As = x − Mo = 6 ,93 − 8 = −1,07 .

51
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Valoarea indicatorului de asimetrie arată că distribuţia studenţilor dintr-o serie
după nota obţinută la un examen în sesiunea iunie 2009 prezintă o asimetrie la stânga
(As<0).

2. Coeficientul de asimetrie Pearson


Coeficientul de asimetrie Pearson se calculează pe baza relaţiei:
µ 32
β1 = , unde:
µ 23
∑ ( x i − x ) 3 ⋅ ni
i
µ3 = reprezintă momentul centrat de ordinul 3;
∑ ni
i

∑ ( x i − x ) 2 ⋅ ni
µ2 = i
= s 2 reprezintă momentul centrat de ordinul 2, adică
∑ ni
i
varianţa.

Elementele de calcul sunt prezentate în tabelul de mai jos:

Tabelul 2.23. Elemente de calcul


xi ni ( xi − x ) ( xi − x ) 2 ( xi − x ) 2 ⋅ ni ( xi − x ) 3 ( xi − x ) 3 ⋅ n i
4 10 -2,93 8,58 85,85 -25,15 -251,54
5 25 -1,93 3,72 93,12 -7,19 -179,73
6 40 -0,93 0,86 34,60 -0,80 -32,17
7 55 0,07 0,00 0,27 0,00 0,02
8 60 1,07 1,14 68,69 1,23 73,50
9 15 2,07 4,28 64,27 8,87 133,05
10 5 3,07 9,42 47,12 28,93 144,67
TOTAL 210 - - 393,93 - -112,20

Momentele centrate de ordinul doi şi trei sunt:


∑ ( xi − x )2 ⋅ ni 393,93
µ2 = i = = 1,876
∑ ni 210
i

∑ ( x i − x ) 3 ⋅ ni − 112 ,20
i
µ3 = = = −0 ,534
∑ ni 210
i
Înlocuind în relaţia de mai sus, se obţine:
µ 32 ( −0 ,534 ) 2 0 ,2852
β1 = 3 = = = 0 ,0432 .
µ2 1,876 3 6 ,6023

52
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Valoarea coeficientului de asimetrie Pearson arată că distribuţia dată se
caracterizează printr-o asimetrie ( β 1 ≠ 0 ) la stânga (µ 3<0).

3. Coeficientul de asimetrie Fisher


Coeficientul de asimetrie Fisher se calculează pe baza relaţiei:
µ − 0 ,534
γ 1 = 33 = = −0 ,208 .
s 1,37 3

b. Boltirea
Boltirea este definită prin compararea distribuţiei statistice cu distribuţia normală
din punctul de vedere al variaţiei variabilei X şi a frecvenţei ni.
Boltirea poate fi apreciată pe cale grafică prin reprezentarea curbei frecvenţelor.
Alura curbei frecvenţelor în cazul unei distribuţii normale (mezocurtice) sau care prezintă
un accentuat fenomen de boltire este reprezentată în figura de mai jos:

Figura 20. Boltirea unei distribuţii

În cazul unei distribuţii leptocurtice, se înregistrează o variaţie mică a valorilor


variabilei X şi o variaţie mare a frecvenţelor absolute, ni. În cazul unei distribuţii
platicurtice, se înregistrează o variaţie mare a variabilei X şi o variaţie mică a frecvenţelor
absolute, ni.

Boltirea poate fi apreciată pe cale numerică prin calculul indicatorilor boltirii:


1. Coeficientul de boltire Pearson
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
µ4 µ4
β2 = = , unde:
µ 22 s 4

53
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

∑ ( x i − x ) 4 ⋅ ni
i
µ4 = reprezintă momentul centrat de ordinul 4.
∑ ni
i
O valoare a coeficientului de boltire Pearson β 2 = 3 arată o distribuţie
mezocurtică. O valoare β 2 > 3 arată o distribuţie leptocurtică iar o valoare β 2 < 3 arată
o distribuţie platicurtică.

2. Coeficientul de boltire Fisher


Coeficientul de boltire Fisher se calculează pe baza relaţiei:
γ 2 = β2 − 3 .
O valoare a coeficientului de boltire Fisher γ 2 = 0 arată o distribuţie mezocurtică.
O valoare γ 2 > 0 arată o distribuţie leptocurtică iar o valoare γ 2 < 0 arată o distribuţie
platicurtică.

Exemplu
Distribuţia studenţilor dintr-o serie după nota obţinută la un examen în sesiunea
iunie 2009 se prezintă astfel:

Tabelul 2.24. Distribuţia studenţilor unei serii


după nota obţinută la un examen în sesiunea iunie 2009
Nota Nr. studenţi
4 10
5 25
6 40
7 55
8 60
9 15
10 5
TOTAL 210

Se cere să se calculeze indicatorii boltirii.

Rezolvare
Indicatorii boltirii sunt:
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
µ4 µ4
β2 = = , unde:
µ 22 s 4
∑ ( x i − x ) 4 ⋅ ni
i
µ4 = reprezintă momentul centrat de ordinul 4.
∑ ni
i
Elementele de calcul sunt prezentate în tabelul de mai jos:

54
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 2.25. Elemente de calcul


xi ni ( xi − x ) ( xi − x ) 4 ( xi − x ) 4 ⋅ n i
4 10 -2,93 -2,93000 73,70051
5 25 -1,93 -1,93000 13,87488
6 40 -0,93 -0,93000 0,74805
7 55 0,07 0,07000 0,00002
8 60 1,07 1,07000 1,31080
9 15 2,07 2,07000 18,36037
10 5 3,07 3,07000 88,82874
TOTAL 210 - - 1911,99746

Momentul centrat de ordinul patru este:


∑ ( xi − x )4 ⋅ ni 1911,99746
µ4 = i = = 9 ,105
∑ ni 210
i
Înlocuind în relaţia de mai sus, se obţine:
µ 9 ,105
β 2 = 42 = = 2 ,59 .
µ 2 1,876 2

Interpretare
Valoarea coeficientului de boltire Pearson arată că distribuţia studenţilor după
nota obţinută la examen în sesiunea iunie 2009 este o distribuţie platicurtică ( β 2 < 3 ) .

Coeficientul de boltire Fisher se calculează pe baza relaţiei:


γ 2 = β 2 − 3 = 2 ,59 − 3 = −0 ,41 .

Interpretare
Valoarea coeficientului de boltire Fisher arată că distribuţia studenţilor după nota
obţinută la examen în sesiunea iunie 2009 este o distribuţie platicurtică ( γ 2 < 0 ).

55
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

56
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

CAPITOLUL 3. CARACTERIZAREA UNEI SERII


STATISTICE DUPĂ O VARIABILĂ NUMERICĂ CONTINUĂ

Caracterizarea unităţilor statistice observate după o variabilă continuă se


realizează folosind metode grafice sau numerice. Reprezentarea grafică a unei serii după
o variabilă discretă presupune folosirea următoarelor diagrame: histograma, poligonul
frecvenţelor, curba frecvenţelor sau curba frecvenţelor cumulate. Indicatorii numerici
prin care poate fi caracterizată o serie statistică după o variabilă continuă pot fi grupaţi, ca
şi în cazul variabilelor discrete, în indicatori ai tendinţei centrale (mărimi medii),
indicatori ai dispersiei, indicatori ai asimetriei şi boltirii.

3.1. Frecvenţe absolute şi relative cumulate crescător sau


descrescător
Frecvenţele absolute şi relative cumulate crescător sau descrescător se calculează
în mod similar modului de calcul prezentat în cazul variabilelor discrete.
Înaintea prelucrării unei serii după o variabilă continuă prezentată pe intervale de
variaţie, dacă limitele intervalelor nu sunt precizate, acestea trebuie închise:
- în cazul intervalelor egale de variaţie, primul şi ultimul interval se închid
luând în considerare aceeaşi mărime a intervalelor;
- în cazul intervalelor inegale de variaţie, primul interval se închide luând în
considerare mărimea intervalului următor, iar ultimul interval se închide luând
în considerare mărimea intervalului anterior.

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei),
înregistrată în luna octombrie 2009, este prezentată în tabelul de mai jos:

Tabelul 3.1. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
până la 10 20
10-20 40
20-30 35
30-40 15
peste 40 10
TOTAL 110

Se cere să se calculeze frecvenţele absolute şi relative cumulate crescător sau


descrescător.

57
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Rezolvare
Închiderea intervalelor de variaţie
Mărimea intervalelor de variaţie este l=10. Limita inferioară a primului interval
de variaţie se închide luând în considerare aceeaşi mărime, deci: 10-10=0. Limita
superioară a ultimului interval de variaţie este: 40+10=50.

Frecvenţe absolute cumulate crescător şi descrescător


Frecvenţele absolute cumulate crescător şi descrescător se calculează după
relaţiile:
i m
N i ↓= N i −1 ↓ + ni = ∑ nh , respectiv N i ↑= N i+1 ↑ + ni = ∑ nh .
h =1 h =i
Valorile frecvenţelor absolute cumulate crescător şi descrescător pentru exemplul
dat sunt prezentate în tabelul de mai jos:

Tabelul 3.2. Frecvenţe absolute cumulate crescător şi descrescător


xi-1-xi ni Ni ↓ Ni ↑
0- 10 20 20 120
10-20 40 60 100
20-30 35 95 60
30-40 15 110 25
40-50 10 120 10
TOTAL 120 - -

Interpretare
Un număr de 20 firme au realizat vânzări de până la 10 mil. Lei ( N 1 ↓ ). Un
număr de 60 firme au realizat vânzări de până la 20 mil. Lei ( N 2 ↓ ). În mod similar se
interpretează celelalte valori din tabelul de mai sus.
Din numărul total al firme, 10 firme au realizat vânzări de peste 40 mil. Lei. Un
număr de 25 de firme au realizat vânzări de peste 30 mil. Lei. În mod similar se
interpretează celelalte valori din tabelul de mai sus.

Observaţie
În interpretarea frecvenţelor absolute cumulate crescător se consideră limita
superioară a intervalului de variaţie, iar în interpretarea frecvenţelor absolute cumulate
descrescător se consideră limita inferioară a intervalului de variaţie.

Frecvenţe relative cumulate crescător şi descrescător


Frecvenţele relative cumulate crescător şi descrescător se calculează după
relaţiile:
i m
Fi ↓= Fi −1 ↓ + f i = ∑ f h , respectiv Fi ↑= Fi +1 ↑ + f i = ∑ f h .
h =1 h =i
Pentru exemplul dat, valorile calculate ale frecvenţelor relative cumulate crescător
şi descrescător sunt prezentate în tabelul de mai jos:

58
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 3.3. Frecvenţe absolute cumulate crescător şi descrescător


xi-1-xi ni fi Fi ↓ Fi ↑
0 -10 20 16,67 16,67 100,00
10-20 40 33,33 50,00 83,33
20-30 35 29,17 79,17 50,00
30-40 15 12,50 91,67 20,83
40-50 10 8,33 100,00 8,33
TOTAL 120 100,00 - -

Interpretare
Ponderea firmelor care au realizat vânzări de până la 10 mil. Lei ( F1 ↓ ) este de
16,67%. Ponderea firmelor care au realizat vânzări de până la 20 mil. Lei ( F2 ↓ ) este de
50%. În mod similar se interpretează celelalte valori din Tabelul 3.3.
Ponderea firmelor care au realizat vânzări de peste 40 mil. Lei este de 8,33%.
20,83% din numărul total al firmelor au realizat vânzări de peste 30 mil. Lei. În mod
similar se interpretează celelalte valori din Tabelul 3.3.

3.2. Caracterizarea seriei folosind metode grafice


O distribuţie statistică după o variabilă numerică continuă poate fi reprezentată
grafic folosind histograma, poligonul frecvenţelor, curba frecvenţelor şi curba
frecvenţelor cumulate.

Histograma
Construirea histogramei presupune ridicarea unor dreptunghiuri alăturate, cu baza
egală, în cazul intervalelor egale de variaţie, sau inegală, în cazul intervalelor inegale, de
înălţime ni. Alura histogramei, considerând intervale egale de variaţie, este reprezentată
în figura de mai jos:

Histogram
5

4
Frequency

0
4,00 6,00 8,00 10,00

Figura 21. Histograma

59
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Poligonul frecvenţelor
Construirea poligonului frecvenţelor presupune găsirea locului geometric al
punctelor Ai de coordonate ( x'i , ni ) sau ( x'i , ni ) şi unirea acestora prin segmente de
dreaptă. Valorile x'i reprezintă mijlocul sau centrul intervalelor de variaţie, calculat ca
medie aritmetică simplă a limitelor intervalelor de variaţie:
x + xi
x'i = i −1 .
2

Curba frecvenţelor
Construirea curbei frecvenţelor presupune ajustarea printr-o linie curbă, continuă
a poligonului frecvenţelor. Curba frecvenţelor pentru o distribuţie normală este
reprezentată în figura de mai jos:

4
Frequency

0
4,00 6,00 8,00 10,00

Nota

Figura 22. Curba frecvenţelor

Curba frecvenţelor cumulate


Construirea curbei frecvenţelor cumulate presupune reprezentarea grafică a
funcţiei de repartiţie a frecvenţelor unei variabile: F(X<xi). Alura curbei frecvenţelor
cumulate crescător este reprezentată în figura de mai jos:

60
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

100%

75%

Percent
50%

25%

0%
5 6 7 8 9

nota

Figura 23. Curba frecvenţelor cumulate crescător

3.3. Caracterizarea seriei folosind indicatori ai statisticii descriptive

3.3.1. Indicatori ai tendinţei centrale (mărimi medii)

a. Media aritmetică
Media aritmetică pentru o serie statistică după o variabilă continuă se calculează
după relaţia:
∑ xi' ⋅ ni x + xi
x= i , unde x'i = i −1 .
∑ ni 2
i

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei),
înregistrată în luna octombrie 2009, este prezentată în tabelul de mai jos:

Tabelul 3.4. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
- 10 20
10-20 40
20-30 35
30-40 15
peste 40 10
TOTAL 110

61
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Se cere să se calculeze media aritmetică.

Rezolvare
∑ xi' ⋅ ni xi −1 + xi
Media aritmetică se calculează după relaţia x = i
, unde x'i = .
∑ ni 2
i
x0 + x1 0 + 10
Centrul intervalelor de variaţie se calculează astfel: x1' = = =5;
2 2
x1 + x 2 10 + 20
x'2 = = = 15 etc.
2 2
Elementele pentru calculul mediei aritmetice sunt prezentate în tabelul de mai jos:

Tabelul 3.5. Elemente pentru calculul mediei aritmetice


xi-1-xi ni xi' x'i ⋅ ni
0 -10 20 5 100
10-20 40 15 600
20-30 35 25 875
30-40 15 35 525
40-50 10 45 450
TOTAL 120 - 2550

Înlocuind în relaţia de mai sus se obţine:


∑ xi' ⋅ ni 2550
x= i = = 21,25 mil. Lei.
∑ ni 120
i

Interpretare
Valoarea medie a vânzărilor zilnice realizate în luna octombrie 2009 de firmele
din judeţul Iaşi este de 21,25 milioane lei.

b. Modul (Mo)
Pentru aflarea modului în cazul unei variabile continue, trebuie parcurse
următoarele etape:
• se află frecvenţa maximă, nimax;
• în dreptul acestei frecvenţe maxime, se citeşte intervalul modal (xi-1, xi);
• în acest interval, modul se află prin interpolare, după relaţia:
∆1
Mo = xi −1 + d ⋅ , unde:
∆1 + ∆2
xi-1, reprezintă limita inferioară a intervalului modal;
d este mărimea intervalului modal, d= xi - xi-1;

62
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

∆1 este diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului anterior:


∆1 = ni max − ni −1 ;
∆2 este diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului următor:
∆1 = ni max − ni +1 .

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei),
înregistrată în luna octombrie 2009, este prezentată în tabelul de mai jos:

Tabelul 3.6. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 110

Se cere să se calculeze valoarea modului.

Rezolvare
Etapele aflării modului sunt:
• se află frecvenţa maximă, nimax=40;
• în dreptul acestei frecvenţe maxime se citeşte intervalul modal (10-20);
• în acest interval, modul se află prin interpolare, după relaţia:
∆1
Mo = xi −1 + d ⋅ , unde:
∆1 + ∆2
xi-1 =10;
d= xi - xi-1 =20-10=10 ;
∆1 = ni max − ni −1 = 40 − 20 = 20 ;
∆1 = ni max − ni +1 = 40 − 35 = 5 .
Înlocuind în relaţia de mai sus, se obţine:
( 40 − 20 )
Mo = 10 + 10 ⋅ = 18 mil. Lei.
( 40 − 20 ) + ( 40 − 35 )

Interpretare
Cele mai multe firme din judeţul Iaşi au realizat în luna octombrie 2009 vânzări
zilnice de 18 mil. Lei.

63
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

c. Mediana (Me)
Aflarea medianei presupune parcurgerea următoarelor etape:
∑ ni
Me
• se calculează unitatea mediană: U = i ;
2
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UMe;
• în dreptul primei valori Ni↓≥UMe, se citeşte intervalul median: (xi-1, xi);
• în acest interval, mediana se află prin interpolare după relaţia:
U Me − N i −1 ↓
Me = xi −1 + d ⋅ , unde:
ni
xi-1, reprezintă limita inferioară a intervalului median;
d este mărimea intervalului median, d= xi - xi-1;
N i −1 ↓ este frecvenţa absolută cumulată corespunzătoare intervalului anterior intervalului
median;
ni este frecvenţa absolută corespunzătoare intervalului median.

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei),
înregistrată în luna octombrie 2009, este prezentată în tabelul de mai jos:

Tabelul 3.7. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120

Se cere să se calculeze mediana.

Rezolvare
Etape pentru aflarea medianei:

120
∑ ni
Me i
• se calculează unitatea mediană: U = = 60 ;=
2 2
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

64
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 3.8. Frecvenţele absolute cumulate crescător


xi-1-xi ni Ni ↓
0 - 10 20 20
10-20 40 60
20-30 35 95
30-40 15 110
40-50 10 120
TOTAL 120 -

• prima valoare Ni↓=60 ≥UMe=60;


• în dreptul acestei valori, se citeşte intervalul median: (10-20);
• în acest interval, mediana se află prin interpolare după relaţia:
U Me − N i −1 ↓
Me = xi −1 + d ⋅ , unde:
ni
xi-1=10;
d= xi - xi-1=20-10=10;
N i −1 ↓= 20 ;
ni = 40.
60 − 20
Înlocuind în relaţia de mai sus, se obţine: Me = 10 + 10 ⋅ = 20 mil. Lei.
40
Interpretare
Jumătate din numărul total al firmelor din judeţul Iaşi au realizat, în luna
octombrie 2009, vânzări zilnice de până la 20 mil. Lei, iar jumătate au realizat vânzări de
peste 20 mil. Lei.

d. Generalizarea medianei: quantilele

1. Quartilele
Quartila unu (Q1)
Aflarea quartilei unu presupune parcurgerea următoarelor etape:
∑ ni
Q1
• se calculează unitatea quartilică unu: U = i ;
4
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UQ1;
• în dreptul primei valori Ni↓≥UQ1, se citeşte intervalul quartilic unu: (xi-1, xi);
• în acest interval, quartila unu se află prin interpolare după relaţia:
U Q1 − N i −1 ↓
Q1 = xi −1 + d ⋅ , unde:
nQ1
xi-1, reprezintă limita inferioară a intervalului quartilic unu;
d este mărimea intervalului quartilic unu, d= xi - xi-1;

65
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

N i −1 ↓ este frecvenţa absolută cumulată corespunzătoare intervalului anterior intervalului


quartilic unu;
nQ1 este frecvenţa absolută corespunzătoare intervalului quartilic unu.

Quartila doi (Q2)


După cum am arătat în cazul variabilelor discrete, quartila doi este egală cu
mediana, Q2=Me.

Quartila trei (Q3)


Aflarea quartilei trei presupune parcurgerea următoarelor etape:
3 ⋅ ∑ ni
Q3 i
• se calculează unitatea quartilică trei: U = ;
4
• se calculează frecvenţele absolute cumulate crescător, Ni↓;
• se află prima valoare Ni↓≥UQ3;
• în dreptul primei valori Ni↓≥UQ1 se citeşte intervalul quartilic trei: (xi-1, xi);
• în acest interval, quartila trei se află prin interpolare după relaţia:
U Q3 − N i −1 ↓
Q3 = xi −1 + d ⋅ , unde:
nQ3
xi-1, reprezintă limita inferioară a intervalului quartilic trei;
d este mărimea intervalului quartilic trei, d= xi - xi-1;
N i −1 ↓ este frecvenţa absolută cumulată corespunzătoare intervalului anterior intervalului
quartilic trei;
nQ3 este frecvenţa absolută corespunzătoare intervalului quartilic trei.

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei)
înregistrată în luna octombrie 2009 este prezentată în tabelul de mai jos:

Tabelul 3.8. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120

Se cere să se calculeze quartila unu şi quartila trei.

Rezolvare
Quartila unu
Etape pentru aflarea quartilei unu:

66
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

120
∑ ni
Q1 i
• se calculează unitatea quartilică unu: U = = 30 ; =
4 4
• se calculează frecvenţele absolute cumulate crescător, Ni↓. Acestea sunt
prezentate în tabelul de mai jos:

Tabelul 3.8. Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor
zilnice (mil. Lei), în luna octombrie 2009
xi-1-xi ni Ni ↓
0- 10 20 20
10-20 40 60
20-30 35 95
30-40 15 110
40-50 10 120
TOTAL 120 -

• prima valoare Ni↓=60 ≥UQ1=30;


• în dreptul acestei valori se citeşte intervalul quartilic unu: (10-20);
• în acest interval, quartila unu se află prin interpolare după relaţia:
U Q1 − N i −1 ↓
Q1 = xi −1 + d ⋅ , unde:
nQ1
xi-1=10;
d= xi - xi-1=20-10=10;
N i −1 ↓= 20 ;
ni = 40.
30 − 20
Înlocuind în relaţia de mai sus, se obţine: Q1 = 10 + 10 ⋅ = 12 ,5 mil. Lei.
40
Interpretare
25% din numărul total al firmelor din judeţul Iaşi au realizat vânzări zilnice de
până la 12,5 mil. Lei, iar 75% au realizat vânzări zilnice de peste 12,5 mil. Lei.

Quartila trei
3 ⋅ ∑ ni
Q3 i 3 ⋅ 120
• se calculează unitatea quartilică trei: U = = = 90 ;
4 4
• prima valoare Ni↓=95 ≥UQ1=90;
• în dreptul acestei valori se citeşte intervalul quartilic trei: (20-30);
• în acest interval, quartila trei se află prin interpolare după relaţia:
U Q3 − N i −1 ↓
Q3 = xi −1 + d ⋅ , unde:
nQ3
xi-1=20;
d= xi - xi-1=30-20=10;
N i −1 ↓= 60 ;

67
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

ni = 35.
90 − 60
Înlocuind în relaţia de mai sus, se obţine: Q3 = 20 + 10 ⋅ = 28 ,57 mil. Lei.
35

Interpretare
75% din numărul total al firmelor din judeţul Iaşi au realizat vânzări zilnice de
până la 28,57 mil. Lei, iar 25% au realizat vânzări zilnice de peste 28,57 mil. Lei.

3.3.2. Indicatori ai dispersiei


Principalii indicatori ai dispersiei sunt:
1. Amplitudinea de variaţie
Amplitudinea de variaţie măsoară distanţa dintre nivelul maxim şi nivelul minim
al unei variabile. Se calculează pe baza relaţiei:
A = x max − x min .

2. Varianţa
Varianţa se calculează pe baza relaţiei:
∑ ( xi' − x )2 ⋅ ni
s2 = i . Varianţa nu are unitate de măsură şi nu se interpretează.
∑ ni
i

3. Abaterea medie pătratică (abaterea standard)


Abaterea medie pătratică se calculează pe baza relaţiei:
∑ ( x'i − x )2 ⋅ ni
s = s2 = i
. Abaterea medie pătratică reprezintă variaţia medie
∑ ni
i
a valorilor individuale ale variabilei X de la nivelul mediu, în sens pozitiv şi negativ.

4. Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s
v = ⋅ 100 .
x

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei)
înregistrată în luna octombrie 2009 este prezentată în tabelul de mai jos:

68
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 3.9. Distribuţia firmelor din judeţul Iaşi


după valoarea vânzărilor zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120

Se cere să se calculeze abaterea standard şi coeficientul de variaţie.

Rezolvare
Abaterea standard
Abaterea standard se calculează pe baza relaţiei:
∑ ( x'i − x )2 ⋅ ni
s = s2 = i
.
∑ ni
i
Pentru această distribuţie, media aritmetică este x = 21,25 mil. Lei.
Elementele de calcul ale abaterii standard sunt prezentate în tabelul de mai jos:

Tabelul 3.10. Elemente de calcul ale abaterii standard


xi-1-xi ni xi' xi' − x ( xi' − x ) 2 ( xi' − x ) 2 ⋅ ni
0 - 10 20 5 -16,25 264,06 5281,25
10-20 40 15 -6,25 39,06 1562,50
20-30 35 25 3,75 14,06 492,19
30-40 15 35 13,75 189,06 2835,94
40-50 10 45 23,75 564,06 5640,63
TOTAL 120 - - - 15812,50

Înlocuind în relaţia de mai sus se obţine:


∑ ( xi' − x )2 ⋅ ni 15812 ,50
s = s2 = i
= = 11,48 mil. Lei.
∑ ni 120
i

Interpretare
Vânzările zilnice ale firmelor din judeţul Iaşi, realizate în luna octombrie 2009,
variază, în medie, de la nivelul mediu al vânzărilor zilnice, cu ± 11,48 mil. Lei.

Coeficientul de variaţie
Coeficientul de variaţie se calculează după relaţia:
s 11,48
v = ⋅ 100 = ⋅ 100 = 54 ,02% .
x 21,25

69
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Valoarea coeficientului de variaţie arată că distribuţia firmelor după valoarea
vânzărilor zilnice realizate în luna octombrie 2009 este o distribuţie eterogenă,
caracterizată printr-o dispersie mare (v>50%). Media nu este reprezentativă pentru
această distribuţie.

3.3.3. Indicatori ai formei unei distribuţii

Asimetria
Indicatorii asimetriei se calculează, în cazul unei variabile continue, astfel:
1. Asimetria în mărime absolută
Asimetria în mărime absolută poate fi calculată pe baza relaţiei:
As = x − Mo .
Modul de interpretare este identic cu cel prezentat în cazul variabilelor discrete.

2. Coeficientul de asimetrie Pearson


Coeficientul de asimetrie Pearson se calculează pe baza relaţiei:
µ 32
β1 = , unde:
µ 23
∑ ( xi' − x )3 ⋅ ni xi −1 + xi
µ3 = i
reprezintă momentul centrat de ordinul 3, unde: x'i = ;
∑ ni 2
i

∑( xi' − x ) 2 ⋅ ni
µ2 = i
= s 2 reprezintă momentul centrat de ordinul 2, adică varianţa.
∑ ni
i
Acest indicator este întotdeauna pozitiv. Sensul asimetriei este dat de semnul lui
µ 3. Atunci când µ 3>0, distribuţia este asimetrică la dreapta. Atunci când µ 3<0, distribuţia
este asimetrică la stânga.

3. Coeficientul de asimetrie Fisher


Coeficientul de asimetrie Fisher se calculează pe baza relaţiei:
µ3
γ1 =.
s3
Interpretarea valorii acestui coeficient este similară coeficientului de asimetrie
Pearson.

Boltirea
Indicatorii boltirii se calculează după relaţiile
1. Coeficientul de boltire Pearson
Coeficientul de boltire Pearson se calculează pe baza relaţiei:
µ4 µ4
β2 = = , unde:
µ 22 s 4

70
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

∑ ( xi' − x )4 ⋅ ni
i
µ4 = reprezintă momentul centrat de ordinul 4.
∑ ni
i
O valoare a coeficientului de boltire Pearson β 2 = 3 arată o distribuţie
mezocurtică. O valoare β 2 > 3 arată o distribuţie leptocurtică iar o valoare β 2 < 3 arată
o distribuţie platicurtică.

2. Coeficientul de boltire Fisher


Coeficientul de boltire Fisher se calculează pe baza relaţiei:
γ 2 = β2 − 3 .
O valoare a coeficientului de boltire Fisher γ 2 = 0 arată o distribuţie mezocurtică.
O valoare γ 2 > 0 arată o distribuţie leptocurtică iar o valoare γ 2 < 0 arată o distribuţie
platicurtică.

Exemplu
Distribuţia firmelor din judeţul Iaşi după valoarea vânzărilor zilnice (mil. Lei)
înregistrată în luna octombrie 2009 este prezentată în tabelul de mai jos:

Tabelul 3.11. Distribuţia firmelor din judeţul Iaşi


după valoarea vânzărilor zilnice (mil. Lei), în luna octombrie 2009
Valoare vânzări Număr firme
0- 10 20
10-20 40
20-30 35
30-40 15
40-50 10
TOTAL 120

Se cere să se calculeze coeficientul de asimetrie Pearson şi coeficientul de boltire


Pearson.

Rezolvare
Coeficientul de asimetrie Pearson se calculează pe baza relaţiei:
µ 32
β1 = , unde:
µ 23
∑ ( xi' − x )3 ⋅ ni ∑ ( xi' − x )2 ⋅ ni
µ3 = i
; µ2 = i
= s2 .
∑ ni ∑ ni
i i
Elementele de calcul ale momentelor centrate de ordinul doi şi trei sunt prezentate
în tabelul de mai jos:

71
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 3.12. Elemente de calcul ale momentelor centrate de ordinul doi şi trei
xi-1-xi ni xi' xi' − x ( xi' − x ) 2 ( xi' − x ) 2 ⋅ ni ( xi' − x )3 ( xi' − x )3 ⋅ ni
0 - 10 20 5 -16,25 264,06 5281,25 -4291,02 -85820,31
10-20 40 15 -6,25 39,06 1562,50 -244,14 -9765,63
20-30 35 25 3,75 14,06 492,19 52,73 1845,70
30-40 15 35 13,75 189,06 2835,94 2599,61 38994,14
40-50 10 45 23,75 564,06 5640,63 13396,48 133964,84
TOTAL 120 - - - 15812,50 - 79218,75

Înlocuind în relaţiile de mai sus, se obţine:


79218 ,75
µ3 = = 660 ,16 ;
120
15812 ,5
µ2 = = 131,77 .
120
660 ,16 2 435811,23
Coeficientul de asimetrie Pearson este: β 1 = 3
= = 0 ,19 .
131,77 2287966,38

Interpretare
Valoarea coeficientului de asimetrie Pearson arată că distribuţia dată prezintă o
asimetrie ( β 1 ≠ 0 ) la dreapta (µ 3>0).

Coeficientul de boltire Pearson


µ4 µ4
β2 = = , unde:
µ 22 s 4
∑ ( xi' − x )4 ⋅ ni
i
µ4 = .
∑ ni
i
Elementele de calcul ale momentului centrat de ordinul patru sunt prezentate în
tabelul de mai jos:

Tabelul 3.13. Elemente de calcul ale momentului centrat de ordinul patru


xi-1-xi ni xi' xi' − x ( xi' − x )4 ( xi' − x )4 ⋅ ni
0 - 10 20 5 -16,25 69729,00 1394580,08
10-20 40 15 -6,25 1525,88 61035,16
20-30 35 25 3,75 197,75 6921,39
30-40 15 35 13,75 35744,63 536169,43
40-50 10 45 23,75 318166,50 3181665,04
TOTAL 120 - - 5180371,09

Înlocuind în relaţiile de mai sus, se obţine:


5180371,09
µ4 = = 43169,76 .
120

72
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

43169 ,76
Coeficientul de boltire Pearson este: β 2 = = 2 ,49 .
131,77 2

Interpretare
Valoarea coeficientului de boltire Pearson arată că distribuţia dată este o
distribuţie platicurtică ( β 2 < 3 ).

73
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

74
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

CAPITOLUL 4. CARACTERIZAREA UNEI SERII


STATISTICE DUPĂ O VARIABILĂ CATEGORIALĂ

4.1. Caracterizarea seriei folosind metode grafice

O distribuţie statistică după o variabilă categorială nominală sau ordinală poate fi


reprezentată grafic folosind diagrame de structură: cercul de structură, dreptunghiul de
structură etc.
Alura acestor grafice este prezentată în figurile de mai jos:

Sexul_persoanei

Masculin
Feminin

35,0%

65,0%

Figura 24. Cercul de structură

70,0%

60,0%

50,0%
Percent

40,0%

65,0%
30,0%

20,0%
35,0%

10,0%

0,0%
Masculin Feminin

Sexul_persoanei

Figura 25. Dreptunghiul de structură

75
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

4.2. Caracterizarea seriei folosind indicatori ai statisticii descriptive

4.2.1. Mărimi relative

a. Mărimi relative de structură


Pentru o distribuţie după o variabilă categorială nominală se pot calcula
frecvenţele relative, respectiv ponderea unităţilor din fiecare categorie în volumul total al
colectivităţii, după relaţia:
n n
f i = i ⋅ 100 = i ⋅ 100 .
∑ ni n
i

Exemplu
Distribuţia studenţilor dintr-o grupă pe sexe, la 1 ianuarie 2009, se prezintă astfel:

Tabelul 4.1 Distribuţia studenţilor dintr-o grupă


pe sexe, la 1 ianuarie 2009
Sexul persoanei Nr. studenţi
Masculin 7
Feminin 13
TOTAL 20

Se cere să se calculeze frecvenţele relative.

Rezolvare
Frecvenţele relative se calculează după relaţia:
n n
f i = i ⋅ 100 = i ⋅ 100 .
∑ ni n
i
Pentru exemplul dat, avem:
n 7
f 1 = 1 ⋅ 100 = ⋅ 100 = 35%
∑ ni 20
i
n2 13
f2 = ⋅ 100 = ⋅ 100 = 65% .
∑ ni 20
i
Interpretare
Ponderea persoanelor de sex masculin este de 35%, iar ponderea persoanelor de
sex feminin este de 65%.

76
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

b. Mărimi relative de corespondenţă


Mărimile relative de corespondenţă arată numărul de unităţi dintr-o grupă care
revin la 100 (1000) de unităţi dintr-o altă grupă, în cadrul aceleaşi populaţii.
Mărimile relative de corespondenţă se calculează după relaţia:
X X
K A / B = A ⋅ 100 , respectiv K B / A = B ⋅ 100 , unde:
XB XA
XA, XB reprezintă numărul de unităţi din grupa A, respectiv B.

Exemplu
Distribuţia salariaţilor dintr-o regiune pe sexe, la 1 ianuarie 2009, se prezintă
astfel:

Tabelul 4.2 Distribuţia salariaţilor dintr-o regiune


pe sexe, la 1 ianuarie 2009
Sexul persoanei Nr. studenţi
Masculin 7000
Feminin 1300
TOTAL 830

Se cere să se calculeze mărimile relative de corespondenţă.

Rezolvare
Mărimile relative de corespondenţă se calculează după relaţia:
X X
K A / B = A ⋅ 100 , respectiv K B / A = B ⋅ 100 .
XB XA
Considerând grupa A, grupa formată din persoanele de sex masculin, şi grupa B
cea a persoanelor de sex feminin, se obţine:
X 7000
K A / B = A ⋅ 100 = ⋅ 100 = 538 ,5
XB 1300
X 1300
K B / A = B ⋅ 100 = ⋅ 100 = 18 ,6 .
XA 7000
Interpretare
La 100 de persoane de sex feminin revin 538,5~540 de persoane de sex masculin.
La 100 de persoane de sex masculin revin 18,6~19 persoane de sex feminin.

4.2.2 Mărimi medii


În cazul unei distribuţii după o variabilă categorială nominală singura mărime
medie care poate fi calculată este modul. Modul arată categoria variabilei X cea mai
frecvent observată, respectiv cea care corespunde frecvenţei maxime.
În cazul unei distribuţii după o variabilă categorială ordinală, mărimile medii care
pot fi calculate sunt modul şi mediana.

77
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Exemple
Distribuţia salariaţilor dintr-o regiune pe sexe, la 1 ianuarie 2009 se prezintă
astfel:

Tabelul 4.3 Distribuţia salariaţilor dintr-o regiune


pe sexe, la 1 ianuarie 2009
Sexul persoanei Nr. studenţi
1-Masculin 700
2-Feminin 130
TOTAL 830

Se cere să se afle valoarea modului.

Rezolvare
Pentru aflarea modului, se observă că nimax=700. Categoria care corespunde
acestei frecvenţe maxime este xi=1-Masculin.

Interpretare
Cele mai multe persoane din colectivitatea observată sunt de sex masculin.

2. Distribuţia salariaţilor unei firme după nivelul de studii (Primar, Gimnazial,


Liceal, Superior) se prezintă astfel:

Tabelul 4.4 Distribuţia salariaţilor unei firme


după nivelul de studii
Nivel de studii Nr. persoane
Primar 10
Gimnazial 25
Liceal 15
Superior 50
TOTAL 100

Se cere să se calculeze valorile modului şi medianei.

Rezolvare
Modul
Pentru identificarea modului, se află nimax=50. Categoria care corespunde acestei
frecvenţe maxime este xi=Superior.

Interpretare
Cele mai multe persoane din colectivitatea observată au studii superioare.

Mediana
∑ ni
100
Me i
Pentru aflarea medianei, se află U = =
= 50 . Se calculează
2 2
frecvenţele absolute cumulate crescător, prezentate în tabelul de mai jos:

78
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 4.5 Frecvenţele absolute cumulate crescător


Nivel de studii Nr. persoane Ni↓
Primar 10 10
Gimnazial 25 35
Liceal 15 50
Superior 50 100
TOTAL 100 -

Prima valoare Ni↓=50 ≥UMe=50. Mediana este reprezentată de categoria Liceal.

Interpretare
Jumătate din numărul total al persoanelor sunt cu studii primare, gimnaziale şi
liceale, iar jumătate sunt cu studii superioare.

79
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

80
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

PARTEA A DOUA
INFERENŢA STATISTICĂ

Inferenţa statistică are ca obiectiv cunoaşterea unei populaţii în mod indirect, prin
prelucrarea datelor la nivelul unui eşantion extras aleatoriu din aceasta. Inferenţa
statistică presupune estimarea parametrilor unei populaţii şi testarea ipotezelor statistice.

Capitolul 5. Noţiuni şi notaţii folosite în inferenţa


statistică

5.1. Populaţie şi eşantion

Observarea şi înregistrarea valorilor unei variabile pentru toate unităţile populaţiei


presupune o observare exhaustivă, totală. Acest procedeu se aplică, de exemplu, în cazul
recensământului unei populaţii, când sunt înregistrate mai multe caracteristici ale
populaţiei (vârsta, categoria socio-profesională, sexul persoanei etc.), la un moment de
referinţă. Volumul unei populaţii se notează cu N.
Observarea şi înregistrarea valorilor unei variabile pentru anumite unităţi statistice
extrase dintr-o populaţie presupune o observare parţială. În acest caz, se observă doar un
eşantion reprezentativ extras din populaţie. Inferenţa statistică are ca obiectiv cunoaşterea
unei populaţii în mod indirect, prin prelucrarea datelor la nivelul unui eşantion extras din
aceasta. Volumul eşantionului se notează cu n. Avantajele cercetării prin sondaj decurg,
în principal, din costurile reduse de obţinere a datelor statistice.

5.2. Parametri şi estimaţii

Parametrii reprezintă mărimi reale dar necunoscute prin care poate fi caracterizată
o populaţie. De exemplu, o populaţie poate fi caracterizată folosind un indicator al
tendinţei centrale, cum ar fi media populaţiei ( µ ), şi un indicator al dispersiei, cum ar fi
abaterea medie pătratică ( σ ).
Aceste mărimi sunt estimate prin prelucrarea datelor înregistrate la nivelul unui
eşantion, proces în urma căruia se obţin estimaţii ale parametrilor populaţiei. De
exemplu, prin înregistrarea valorilor unei variabile la nivelul unui eşantion, pot fi
calculate media eşantionului ( x ) şi abaterea medie pătratică ( s ).

81
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Notaţiile folosite pentru definirea parametrilor şi estimaţiilor sunt prezentate în


tabelul de mai jos.

Estimaţii Parametri
(eşantion) (populaţie)
Media x µ
Varianţa s2 σ2
Abaterea standard s σ
Proporţia f p

5.3. Distribuţia de selecţie a mediei

O distribuţie de selecţie este distribuţia unui estimator. Un estimator este o


funcţie de variabile aleatoare de selecţie şi se notează, de regulă, cu semnul „^” deasupra
parametrului respectiv. De exemplu, estimatorul mediei se notează µ̂ , al varianţei σ̂ 2 ,
iar al proporţiei p̂ .

Pentru a forma distribuţia mediei de selecţie, să considerăm cele k eşantioane de


volum n care se pot extrage dintr-o populaţie de volum N. Pentru fiecare din cele k
eşantioane, se pot calcula mediile eşantioanelor şi se pot determina frecvenţele de apariţie
a fiecărei variante.

De exemplu, să considerăm o populaţie formată din 5 persoane pentru care se


înregistrează vârsta (ani) şi se obţin următoarele valori: 22, 25, 26, 24, 23.
Caracterizarea acestei populaţii se poate realiza prin calculul unui indicator al
tendinţei centrale, media, de exemplu, şi a unui indicator al dispersiei, cum este abaterea
standard:
∑ X i 22 + 25 + 26 + 24 + 23
Media populaţiei este: µ = i = = 24 ani.
N 5
Abaterea standard este σ = σ 2 . Varianţa se calculează astfel:

∑ ( X i − µ )2 ( 22 − 24 )2 + ( 25 − 24 ) 2 + ( 26 − 24 ) 2 + ( 24 − 24 )2 + ( 23 − 24 )2
σ2 = i
= =2
N 5

Înlocuind în relaţia de mai sus, se obţine: σ = σ 2 = 2 = 1,41 ani.

82
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Considerând această populaţie de volum N=5, se pot forma K = C Nn eşantioane


de volum n, extrase aleator nerepetat (o unitate extrasă şi înregistrată nu se mai
5!
reintroduce în populaţie). Dacă n=2, K = C Nn = C 52 = = 10 eşantioane.
2!⋅( 5 − 2 )!
Valorile unităţilor celor 10 eşantioane sunt:

Eş . 1 Eş.2 Eş.3 Eş.4 Eş.5 Eş.6 Eş.7 Eş.8 Eş.9 Eş.10


22 22 22 22 25 25 25 26 26 24
25 26 24 23 26 24 23 24 23 23

Pentru fiecare din cele 10 eşantioane, se calculează mediile eşantioanelor, astfel:

22 + 25 25 + 24
Eşantionul 1: x1 = = 23 ,5 Eşantionul 6: x6 = = 24 ,5
2 2
22 + 26 25 + 23
Eşantionul 2: x 2 = = 24 Eşantionul 7: x7 = = 24
2 2
22 + 24 26 + 24
Eşantionul 3: x3 = = 23 Eşantionul 8: x8 = = 25
2 2
22 + 23 26 + 23
Eşantionul 4: x4 = = 22 ,5 Eşantionul 9: x9 = = 24 ,5
2 2
25 + 26 24 + 23
Eşantionul 5: x5 = = 25 ,5 Eşantionul 10: x10 = = 23 ,5
2 2

Distribuţia mediei de selecţie, µ̂ , se formează prin ordonarea mediilor


eşantioanelor şi determinarea probabilităţii (frecvenţei) de apariţie a fiecărei variante:

Tabelul 5.1. Distribuţia variabilei media de selecţie µ̂


xi Frecvenţa de pi
apariţie
22,5 I 1/10=0,1
23,0 I 1/10=0,1
23,5 II 2/10=0,2
24,0 II 2/10=0,2
24,5 II 2/10=0,2
25,0 I 1/10=0,1
25,5 I 1/10=0,1
TOTAL - 1

Distribuţia mediei de selecţie este o distribuţie de probabilitate a mediilor tuturor


eşantioanelor de volum n care se pot extrage aleatoriu dintr-o populaţie de volum N.

Caracteristicile variabilei media de selecţie sunt:

83
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

- media mediei de selecţie este: M = ∑ xi ⋅ pi = 24 . Media mediei de selecţie


i
este, deci, egală cu media populaţiei ( µ ).
- varianţa mediei de selecţie este:
V ( µˆ ) = σ µ2ˆ = ∑ xi2 ⋅ pi − ( ∑ xi ⋅ pi ) 2 =576 ,75 − 24 2 = 0 ,75 . Varianţa mediei
i i

σ2 N −n
de selecţie este egală cu σ µ2ˆ = ⋅ , în cazul unui sondaj aleator
n N
σ2
nerepetat. Se demonstrează că în cazul unui sondaj aleator repetat, σ µ2ˆ = ⋅
n
- abaterea standard a mediei de selecţie este:
σ µˆ = σ µ2ˆ = ∑ xi2 ⋅ pi − ( ∑ xi ⋅ pi )2 = 0 ,75 = 0 ,866 .
i i

Tabelul 5.2. Elemente de calcul ale mediei şi varianţei variabilei µ̂


xi pi xi ⋅ pi xi2 xi2 ⋅ pi
22,5 0,1 2,25 506,25 50,63
23,0 0,1 2,30 529,00 52,90
23,5 0,2 4,70 552,25 110,45
24,0 0,2 4,80 576,00 115,20
24,5 0,2 4,90 600,25 120,05
25,0 0,1 2,50 625,00 62,50
25,5 0,1 2,55 650,25 65,03
TOTAL 1,0 24,00 - 576,75

Reprezentarea grafică a distribuţiei mediei de selecţie este realizată în figura de


mai jos:

25

20
Frequency

15

10

Mean = 24,00
0 Std. Dev. =
0,87039
22,00 23,00 24,00 25,00 26,00 N = 100

VAR00001

Figura 26. Reprezentarea grafică a distribuţiei mediei de selecţie, µ̂

84
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

După cum se observă, distribuţia mediei de selecţie urmează o lege normală, iar
mediile eşantioanelor „se grupează” în jurul mediei lor, adică a mediei populaţiei.

Variabila media de selecţie se caracterizează prin legea normală - teorema limită


centrală, bazată pe legea numerelor mari:
- dacă variabila aleatoare X urmează o lege normală, atunci µ̂ urmează o lege
normală oricare ar fi n;
- dacă variabila aleatoare X nu urmează o lege normală, atunci µ̂ urmează o
lege normală doar pentru valori mari ale lui n, de regulă mai mari decât 30.
2
σ2
Folosind notaţiile prezentate, putem scrie: µˆ ~ N ( µ , σ µ̂ ) sau µˆ ~ N ( µ , ).
n

85
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

86
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Capitolul 6. Estimarea parametrilor unei populaţii

Estimarea reprezintă procedeul de determinare a unui parametru al unei populaţii


(µ, σ2, p) prin prelucrarea datelor înregistrate la nivelul unui eşantion.
Estimarea se poate realiza:
1. punctual: presupune aflarea unei valori posibile a estimatorului parametrului
căutat.
2. prin interval de încredere (IC): presupune aflarea limitelor de încredere ale unui
interval care acoperă valoarea unui parametru.

6.1. Estimarea mediei unei populaţii ( µ )

a. Estimarea punctuală a mediei unei populaţii


Estimarea punctuală a mediei unei populaţii presupune aflarea unei valori posibile
a estimatorului parametrului µ̂ . În paragraful anterior, am arătat că media eşantionului,
x , este o valoare a estimatorului µ̂ . Media eşantionului este, deci, o estimaţie punctuală
a mediei populaţiei.

b. Estimarea prin interval de încredere a mediei unei populaţii


Construirea IC se bazează pe variabila normală standard Z, prezentată în partea
întâi: µˆ ~ N ( µ , σ µ2ˆ ) ⇒ Z ~ N ( 0 , 1 ) .
x −µ x −µ
Valoarea Z se calculează după relaţia: z = = . Astfel, se poate
σ µˆ σ/ n
x−µ
determina: P( − z ≤ ≤ + z ) = 1 − α , unde:
σ/ n
α este un nivel al probabilităţii cuprins între zero şi unu. Acest nivel arată riscul
asumat în estimare. De regulă, în economie se foloseşte un risc de 0,05 sau 5%.

Intervalul de încredere pentru media populaţiei, când se cunoaşte varianţa


populaţiei, este:
 σ 
 x ± zα / 2 ⋅  , unde:
 n
x este media calculată la nivelul eşantionului;
zα / 2 este o valoare a statisticii Z care se citeşte din Tabelul Z pentru un risc α .
σ este abaterea standard la nivelul populaţiei;
n este volumul eşantionului.

87
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Atunci când nu se cunoaşte varianţa populaţiei, în estimarea mediei prin interval


de încredere se foloseşte statistica t Student. Limitele intervalului de încredere pentru
media populaţiei sunt definite de:
 s' 
 x ± tα / 2 ⋅  , unde:
 n
x este media calculată la nivelul eşantionului;
tα / 2 este valoarea statisticii t Student care se citeşte din Tabelul Student pentru un risc α
şi n-1 grade de libertate;
s' este abaterea standard corectată determinată la nivelul eşantionului, după relaţia:
∑ ( xi − x ) 2
i
s' = ;
n −1
n este volumul eşantionului.

Observaţii
Precizia estimării creşte (mărimea intervalului de încredere este mai mică), atunci
când:
- volumul eşantionului (n) creşte (“legea rădăcinii pătrate”: mărirea de 4 ori a
volumului eşantionului, dublează precizia estimării);
- probabilitatea cu care se garantează rezultatele este mai mică;
- varianţa eşantionului este mică (valorile aberante afectează mărimea intervalului
de încredere).

Exemple
1. La nivelul unui eşantion format din 25 de persoane, extras aleator simplu, s-au
obţinut următoarele rezultate privind vârsta (ani): x = 32 ani , s' = 2 ani . Să se estimeze
prin interval de încredere vârsta medie a întregii populaţii din care a fost extras
eşantionul, considerând un risc de 0,05.

Rezolvare
• (n=20)≤30, în estimarea prin IC a mediei populaţiei se foloseşte statistica t
Student. Din Tabelul repartiţiei Student se citeşte valoarea t0,025;20-1=2,093.

t K 0.025 K
M

19 K 2,093 K

 s 
• IC este definit de:  x ± tα / 2 ⋅  . Înlocuind cu valorile date, se obţine:
 n

88
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

 2 
32 ± 2 ,093 ⋅  sau [31,163; 32 ,837 ] .
 25 

Interpretare
Se poate garanta cu o probabilitate de 0,95 că vârsta medie a întregii populaţii din
care a fost extras eşantionul ( µ ) este acoperită de intervalul: [31,163; 32 ,837 ] ani.

2. La nivelul unui eşantion format din 9 persoane, extras aleator simplu, s-au
obţinut următoarele rezultate privind vârsta (ani): x = 32 ani , s' = 2 ani . Să se estimeze
prin interval de încredere vârsta medie a întregii populaţii din care a fost extras
eşantionul, considerând un risc de 0,05.

Rezolvare
• (n=9)≤30, în estimarea prin IC a mediei populaţiei se foloseşte statistica t
Student. Din Tabelul Student se citeşte valoarea t0,025;9-1=2,306.

t K 0.025 K
M

8 K 2,306 K

 s' 
• IC este definit de:  x ± tα / 2 ⋅  . Înlocuind cu valorile date, se obţine:
 n
 2 
32 ± 2 ,306 ⋅  sau [30 ,46 ; 33 ,54 ] .
 9

Interpretare
Se poate garanta cu o probabilitate de 0,95 că vârsta medie a întregii populaţii din
care a fost extras eşantionul ( µ ) este acoperită de intervalul: [30 ,46 ; 33 ,54 ] ani.

Observaţie
Mărimea intervalului de încredere este, în acest caz, mai mare faţă de exemplul
anterior. Precizia estimării s-a micşorat datorită volumului redus al eşantionului.

6.2. Estimarea proporţiei unei populaţii (p)

a. Estimarea punctuală a proporţiei la nivelul unei populaţii


Estimarea punctuală a proporţiei la nivelul unei populaţii presupune aflarea unei
valori posibile a estimatorului parametrului p̂ . Proporţia unei anumite categorii calculată

89
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

la nivelul eşantionului (f) este o estimaţie punctuală a proporţiei acestei categorii la


nivelul populaţiei.

Exemplu
În urma realizării unui sondaj electoral la nivelul unui eşantion format din 1500
persoane, se observă că 840 persoane au votat pentru candidatul A. Să se estimeze
punctual proporţia persoanelor care au votat pentru candidatul A la nivelul întregii
populaţii.

Rezolvare
Proporţia persoanelor care au votat pentru candidatul A calculată la nivelul
n 840
eşantionului este: f = i = = 0 ,56 .
n 1500

Interpretare
Proporţia persoanelor care au votat pentru candidatul A la nivelul întregii
populaţii poate fi estimată punctual prin proporţia calculată la nivelul eşantionului, deci
p=0,56 sau p=56%.

b. Estimarea prin interval de încredere a proporţiei unei populaţii


p( 1 − p )
Variabila proporţia de selecţie ( p̂ ) se caracterizează prin: p̂ ~ N ( p , ).
n
Construirea intervalului de încredere pentru proporţia calculată la nivelul unei
populaţii se realizează în mod similar mediei unei populaţii. Intervalul de încredere
pentru proporţia la nivelul unei populaţii este:
 f ⋅(1 − f ) 
 f ± tα / 2 ⋅  , atunci când nu se cunoaşte σ p̂ .
 n 

Exemplu
În urma realizării unui sondaj electoral la nivelul unui eşantion format din 1500
persoane, se observă că 840 persoane au votat pentru candidatul A. Să se estimeze prin
interval de încredere proporţia persoanelor care au votat pentru candidatul A la nivelul
întregii populaţii, considerând un risc de 0,05.

Rezolvare
Proporţia persoanelor care au votat pentru candidatul A, la nivelul eşantionului,
n 840
este: f = i = = 0 ,56 sau 56%.
n 1500
Limitele intervalului de încredere se calculează astfel:
 f ⋅(1 − f ) 
 f ± tα / 2 ⋅  , unde:
 n 
f = 0 ,56 ;

90
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

tα / 2 este valoarea statisticii t Student care se citeşte din Tabelul Student pentru un risc
α = 0 ,05 şi n-1 grade de libertate. Din Tabelul Student se citeşte: t0,025;1500-1=1,96.

t K 0.025 K
M

M K K

∞ K 1,96 K

Înlocuind în relaţia de mai sus, se obţine:


 0 ,56 ⋅ ( 1 − 0 ,56 ) 
0 ,56 ± 1,96 ⋅  sau [0 ,53; 0 ,59 ] .
 1500 

Interpretare
Se poate garanta cu o probabilitate de 0,95 că proporţia persoanelor care au votat
pentru candidatul A la nivelul întregii populaţii este cuprinsă între 0,53 sau 53% şi 0,59
sau 59%.

91
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

92
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

CAPITOLUL 7. TESTAREA IPOTEZELOR STATISTICE

Testarea ipotezelor statistice este un procedeu prin care se testează semnificaţia


egalităţii dintre valoarea unui parametru şi o valoare de referinţă sau dintre doi parametri
(două medii ale populaţiei sau două proporţii de la nivelul unor populaţii).

7.1. Testarea ipotezelor cu privire la un parametru

Testarea ipotezelor cu privire la un parametru are ca obiectiv testarea egalităţii


dintre media unei populaţii sau proporţia la nivelul unei populaţii faţă de valori de
referinţă, cunoscute.

7.1.1 Demersul testării

• Verificarea ipotezelor care se formulează cu privire la populaţie. Inferenţa


statistică presupune ca distribuţia populaţiei din care a fost extras eşantionul să
urmeze o lege normală sau volumul eşantionului să fie suficient de ridicat (n>30).

• Formularea ipotezelor statistice


O ipoteză este o presupunere cu privire la valoarea unui parametru: media unei
populaţii, varianţa unei populaţii sau proporţia unei anumite categorii dintr-o populaţie.
Ipotezele care se formulează în statistică sunt:
- ipoteza nulă este ipoteza prin care se presupune că nu există diferenţe faţă de o
valoare teoretică sau o valoare de referinţă considerată. Ipoteza nulă are un rol important
în determinarea distribuţiei de selecţie care va fi folosită în procesul testării. Se notează
cu H0.
- ipoteza alternativă este contrară ipotezei nule, deci este ipoteza prin care se
presupune că există diferenţe faţă de o valoare teoretică sau o valoare de referinţă
considerată. Se notează cu H1.

• Alegerea pragului de semnificaţie a testului


În testarea ipotezelor statistice, pragul de semnificaţie a testului, notat cu α ,
reprezintă probabilitatea (de regulă, egală cu 0.05, 0.01) bazată pe ipoteza că H0 este
adevărată.

• Alegerea şi calcularea statisticii test


Testul statistic se alege în funcţie de legea urmată de distribuţia de selecţie a
statisticii considerate. De exemplu, în paragraful anterior am arătat că distribuţia de
selecţie a mediei de selecţie urmează o lege normală. În testarea semnificaţiei mediei unei
populaţii, se foloseşte testul Z sau testul t Student.

93
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

• Definirea regulii de decizie


Pentru definirea regulii de decizie, valoarea calculată a statisticii test, pe baza
datelor observate la nivelul unui eşantion, se compară cu valoarea teoretică, numită şi
valoare critică, care se alege din tabelele teoretice. Decizia corectă poate fi adoptată şi
prin compararea probabilităţii asociate statisticii test calculate cu riscul α . În mod
sintetic, regula de decizie, în cazul folosirii repartiţiei Z, poate fi prezentată astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob. < α dacă Pr ob. ≥ α
asociată statisticii test
Folosind valoarea dacă z calculat < − zα / 2 sau dacă z calculat ≥ − zα / 2 sau
calculată a statisticii test z calculat > + zα / 2 z calculat ≤ + zα / 2

Reprezentarea grafică a regiunilor de respingere şi de acceptare a ipotezei H0 este


realizată în figura de mai jos:

1-α

α/2 α/2
-zα/2 zα/2 Z

H 1 H 0 H 1

Figura 27. Regiunile de respingere şi de acceptare a ipotezei H0

7.1.2. Testarea semnificaţiei mediei unei populaţii

Ipoteze statistice
În testarea semnificaţiei mediei unei populaţii se formulează următoarele ipoteze
statistice:
- ipoteza nulă este ipoteza prin care se presupune că nu există diferenţe între
media unei populaţii, µ , estimată prin media calculată la nivelul eşantion, şi o valoare de
referinţă considerată, µ 0 .
De exemplu, într-un studiu statistic cu privire la nivelul ratei şomajului în anumite
ţări ale Uniunii Europene, în procesul testării statistice se poate urmări dacă există
diferenţe semnificative între nivelul mediu al ratei şomajului pentru ansamblul ţărilor din

94
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

UE ( µ ) şi nivelul mediu al ratei şomajului din SUA ( µ 0 ). Ipoteza nulă care se


formulează este: H 0 : µ = µ 0 .

- ipoteza alternativă este contrară ipotezei nule, deci este ipoteza prin care se
presupune că există diferenţe între valorile comparate.
Pentru exemplul prezentat anterior, ipoteza alternativă se formulează astfel:
H 1 : µ ≠ µ 0 (test bilateral), H 1 : µ > µ 0 (test unilateral la dreapta) sau H 1 : µ < µ 0 (test
unilateral la stânga).

Alegerea pragului de semnificaţie a testului


În testarea ipotezelor statistice, pragul de semnificaţie a testului, notat cu α , este,
de regulă, egal cu 0.05 sau 0.01.
De exemplu, dacă pragul de semnificaţie a unui test este de 0,05, atunci ipoteza
H 0 : µ = µ 0 va fi respinsă dacă media eşantionului extras din populaţie este atât de
îndepărtată, la stânga sau la dreapta, de valoarea fixă µ0 , încât se încadrează printre cele
5% cele mai puţin probabile medii ale eşantioanelor posibil de extras din populaţie.
Pragul de semnificaţie a testului, α , arată probabilitatea de a respinge ipoteza H0
atunci când aceasta este adevărată. Eroarea comisă în respingerea ipotezei H0, atunci când
aceasta este adevărată, poartă denumirea de eroare de tip I.
Eroarea de tip II se produce în momentul acceptării ipotezei H0, atunci când
aceasta este falsă.

Alegerea şi calculul statisticii test


Atunci când se cunoaşte varianţa populaţiei ( σ 2 ) , în testarea semnificaţiei
mediei unei distribuţii se foloseşte statistica Z. Pe baza datelor observate la nivelul unui
eşantion de volum n, se calculează statistica test Z astfel:
x − µ0 x − µ0
z calculat = = .
σ µˆ σ/ n

Atunci când nu se cunoaşte varianţa populaţiei, în testarea semnificaţiei mediei


unei distribuţii se foloseşte statistica t Student. Pe baza datelor observate la nivelul unui
eşantion de volum n, se calculează statistica test t Student astfel:

x − µ0 x − µ0
∑ ( xi − x ) 2
i
t calculat = = , unde s' = .
s µˆ s' / n n −1

Definirea regulii de decizie

Considerând un test bilateral, regula de decizie poate fi definită astfel:

95
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob. < α dacă Pr ob. ≥ α
asociată statisticii test
Folosind valoarea dacă z calculat < − zα / 2 sau dacă z calculat ≥ − zα / 2 sau
calculată a statisticii test z calculat > + zα / 2 z calculat ≤ + zα / 2

Reprezentarea regiunii de acceptare şi de respingere a ipotezei H0 este realizată în


figura de mai jos:

1-α

α/2 α/2
-zα/2 zα/2 Z

H 1 H 0 H 1

Figura 28. Regiunea de respingere şi de acceptare a ipotezei H0


în cazul unui test bilateral

Regula de decizie pentru un test unilateral poate fi definită astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob. < α dacă Pr ob. ≥ α
asociată statisticii test
Test unilateral la dreapta dacă z calculat > + zα dacă z calculat ≤ + zα
H 1 : µ > µ0
Test unilateral la stânga dacă z calculat < − zα dacă z calculat ≥ − zα
H 1 : µ < µ0

Reprezentarea regiunilor de respingere şi de acceptare a ipotezei H0 pentru un test


unilateral este realizată în figura de mai jos:

96
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Figura 29. Regiunea de respingere şi de acceptare a ipotezei H0


în cazul unui test unilateral la dreapta

Figura 30. Regiunea de respingere şi de acceptare a ipotezei H0


în cazul unui test unilateral la stânga

De exemplu, în cazul unui test bilateral, considerând un prag de semnificaţie


α = 0 ,05 , valoarea critică a statisticii test Z este z=1,96. Regiunea de respingere a
ipotezei Ho este definită de: z calculat < −1,96 , respectiv z calculat > +1,96.
În cazul unui test unilateral la dreapta, pentru care ipoteza H 1 : µ > µ 0 ,
considerând un prag de semnificaţie α = 0 ,05 , valoarea critică a statisticii test Z este
z=1,65. Regiunea de respingere a ipotezei Ho este, astfel, definită de: z calculat > 1,65 .
În cazul unui test unilateral la stânga, pentru care ipoteza H 1 : µ < µ 0 ,
considerând un prag de semnificaţie α = 0 ,05 , valoarea critică a statisticii test Z
este z = −1,65 . Regiunea de respingere a ipotezei Ho este definită de: z calculat < −1,65 .

97
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Exemple
1. La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul
lunar obţinut şi se obţine x = 14 mil .lei . Ştiind că σ = 4 mil .lei , se cere să se testeze
dacă există diferenţe semnificative între salariul mediu al întregii populaţii din care a fost
extras eşantionul şi salariul mediu pe economie, de 13 mil. lei. Se consideră un risc
α = 0 ,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : µ = 13 milioane lei (nu există diferenţe semnificative între salariul mediu al
întregii populaţii din care a fost extras eşantionul şi salariul mediu pe economie)
H 1 : µ ≠ 13 milioane lei (există diferenţe semnificative între salariul mediu al
întregii populaţii din care a fost extras eşantionul şi salariul mediu pe economie)

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte σ , se
x − µ0
foloseşte statistica test Z: z = .
σ/ n

Calculul statisticii test


Pe baza datelor obţinute la nivelul eşantionului, se obţine:
14 − 13
z cakulat = = 2 ,5 .
4 / 100

Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
• dacă Pr ob. < α , atunci se respinge ipoteza H0;
• dacă Pr ob. ≥ α , atunci se acceptă ipoteza H0.

Folosind statistica test:


• dacă z calculat < − zα sau z calculat > + zα , atunci se respinge ipoteza H0;
• dacă z calculat ≥ − zα sau z calculat ≤ + zα , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul Z pentru un risc α = 0 ,05 . Această valoare este:
zα / 2 = 1,96.

Probabilitatea asociată statisticii test calculate


Valoarea probabilităţii asociate statisticii test calculate, z cakulat = 2 ,5 , se citeşte
din tabelul Z, astfel: P( Z > 2 ,5 ) = 0 ,5 − 0 ,494 = 0 ,006 . Această valoare este furnizată de

98
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

programele specializate de statistică şi poartă denumirea de Prob. sau p-value (programul


E-VIEWS) sau Sig. (Significance Level) (programul SPSS).

Figura 31. Regiunea de respingere şi de acceptare a ipotezei H0

Interpretare
z calculat = 2 ,5 > z 0 ,025 = 1,96 sau (Pr ob. = 2 ⋅ 0 ,006 = 0 ,012 ) < α = 0 ,05 , se
respinge ipoteza Ho. Se poate garanta cu o probabilitate de 0,95 că există diferenţe
semnificative între salariul mediu al întregii populaţii din care a fost extras eşantionul
observat ( µ ) şi salariul mediu pe economie ( µ 0 ) .

2. La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul


lunar obţinut şi se obţine x = 14 mil .lei . Ştiind că σ = 4 mil .lei , se cere să se testeze
dacă salariul mediu al întregii populaţii din care a fost extras eşantionul este mai mare
decât salariul mediu pe economie, de 13 mil. lei. Se consideră un risc α = 0 ,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : µ = 13 milioane lei
H 1 : µ > 13 milioane lei

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte σ , se
x − µ0
foloseşte statistica test Z: z = .
σ/ n

99
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Calculul statisticii test


Pe baza datelor obţinute la nivelul eşantionului, se obţine:
14 − 13
z cakulat = = 2 ,5 .
4 / 100

Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
• dacă Pr ob. < α , atunci se respinge ipoteza H0;
• dacă Pr ob. ≥ α , atunci se acceptă ipoteza H0.

Folosind statistica test:


• dacă z calculat > + zα , atunci se respinge ipoteza H0;
• dacă z calculat ≤ + zα , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul Z pentru un risc α = 0 ,05 . Această valoare este:
zα / 2 = 1,65.

Probabilitatea asociată statisticii test calculate


Valoarea probabilităţii asociate statisticii test calculate, z cakulat = 2 ,5 , se citeşte
din tabelul Z, astfel: Pr ob.( Z > 2 ,5 ) = 0 ,5 − 0 ,494 = 0 ,006 .

Figura 32. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test


unilateral la dreapta

Interpretare
z calculat = 2 ,5 > z 0 ,025 = 1,65 sau Pr ob. = 0 ,006 < α = 0 ,05 , se respinge ipoteza
Ho. Se poate garanta cu o probabilitate de 0,95 că salariul mediu al întregii populaţii din

100
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

care a fost extras eşantionul observat ( µ ) este mai mare decât salariul mediu pe
economie ( µ 0 ) .

3. Pentru un eşantion format din 25 de persoane, se înregistrează salariul lunar


obţinut şi se obţin următoarele rezultate: x = 15 mil .lei , s' = 2 mil .lei . Se cere să se
testeze dacă există diferenţe semnificative între salariul mediu al întregii populaţii din
care a fost extras eşantionul şi salariul mediu de economie, de 13 mil. lei. Se consideră un
risc α = 0 ,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : µ = 13
H 1 : µ ≠ 13

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t
x − µ0
Student, t = .
s' / n

Calculul statisticii test


15 − 13
Pe baza datelor obţinute la nivelul eşantionului, se obţine: t cakulat = = 5.
2 / 25

Regula de decizie
• dacă t calculat < −tα / 2 sau t calculat > +tα / 2 , atunci se respinge ipoteza H0;
• dacă t calculat ≥ −tα / 2 sau t calculat ≤ +tα / 2 , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul t Student pentru un risc α = 0 ,05 şi n-1 grade de libertate.
Această valoare este: tα / 2 ;n−1 = t 0 ,025;24 = 2 ,064 .

t K 0.025 K
M

24 K 2,064 K

101
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în
figura de mai jos:

0,95

0,025 0,025
tcalc =5
t
-2,064 2,064

H1 H0 H1
Figura 33. Regiunea de respingere şi de acceptare a ipotezei H0

t calculat = 5 > t 0 ,025;24 = 2 ,064 , se respinge ipoteza Ho. Se poate garanta cu o


probabilitate de 0,95 că există diferenţe semnificative între salariul mediu al întregii
populaţii din care a fost extras eşantionul observat ( µ ) şi salariul mediu pe economie
( µ0 ) .

7.1.3 Testarea semnificaţiei proporţiei unei populaţii


Demersul testării semnificaţiei unei proporţii este similar demersului prezentat în
cazul mediei unei populaţii.

Ipoteze statistice
Ipotezele care se formulează în testarea semnificaţiei unei proporţii sunt:
H 0 : p = p0
H 1 : p ≠ p0 (test bilateral)

Alegerea pragului de semnificaţie a testului


α = 0 ,05 .

Alegerea şi calculul statisticii test


Atunci când nu se cunoaşte varianţa populaţiei, în testarea semnificaţiei
proporţiei unei distribuţii se foloseşte statistica t Student. Pe baza datelor observate la
nivelul unui eşantion de volum n, se calculează statistica test t astfel:
f − p0 f − p0
t calculat = = .
s p̂ f (1− f ) / n

Definirea regulii de decizie

102
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Adoptarea decizie corecte presupune compararea valorii calculate a statisticii test


cu valoarea teoretică. De exemplu, considerând un test bilateral, atunci când nu se
cunoaşte varianţa populaţiei, regula de decizie poate fi definită astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob. > α dacă Pr ob. ≥ α
asociată statisticii test
Folosind valoarea dacă t calculat < −tα / 2 sau dacă t calculat ≥ −tα / 2 sau
calculată a statisticii test t calculat > +tα / 2 t calculat ≤ +tα / 2

Exemplu
La nivelul unui eşantion de volum n=25 de persoane, se observă că ponderea
persoanelor care votează pentru candidatul A este de 49%. Se cere să se testeze dacă
există diferenţe semnificative între proporţia persoanelor care votează pentru candidatul
A la nivelul întregii populaţii şi proporţia persoanelor care au votat pentru acest candidat
la alegerile anterioare, de 51%. Se consideră un risc α = 0 ,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : p = 51%
H 1 : p ≠ 51%

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t
f − p0
Student, t = .
f ⋅( 1 − f ) / n

Calculul statisticii test


Pe baza datelor obţinute la nivelul eşantionului, se obţine:
49 − 51
t calculat = = −0 ,2 .
49 ⋅ ( 100 − 49 ) / 25

Regula de decizie
• dacă t calculat < −tα / 2 sau t calculat > +tα / 2 , atunci se respinge ipoteza H0;
• dacă t calculat ≥ −tα / 2 sau t calculat ≤ +tα / 2 , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul t Student pentru un risc α = 0 ,05 şi n-1 grade de libertate.
Această valoare este: tα / 2 ;n−1 = t 0 ,025;24 = 2 ,064 .

103
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
t calculat = 0 ,2 < t 0 ,025;24 = 2 ,064 , se acceptă ipoteza Ho. Se poate garanta cu o
probabilitate de 0,95 că nu există diferenţe semnificative între proporţia persoanelor care
votează pentru candidatul A la nivelul întregii populaţii, p, şi proporţia persoanelor care
au votat pentru acest candidat la alegerile anterioare, p0.

7.2 Testarea ipotezelor cu privire la doi parametri


Testarea ipotezelor cu privire la doi parametri poate viza două medii ale unor
populaţii, µ 1 şi µ 2 , sau două proporţii, p1 şi p 2 .

7.2.1 Testarea diferenţei dintre două medii

a. Cazul eşantioanelor independente


În cazul eşantioanelor independente, statistica test folosită în testarea ipotezelor
statistice este statistica Z sau t.

Ipoteze statistice
H 0 : µ1 − µ 2 = 0
H 1 : µ1 − µ 2 ≠ 0

Alegerea pragului de semnificaţie a testului α

Alegerea şi calculul statisticii test


Atunci când σ 12 = σ 22 şi nu se cunosc varianţele populaţiilor, statistica test se
calculează astfel:
x − x2
t calculat = 1 .
s12 s 22
+
n1 n 2
Atunci când σ 12 ≠ σ 22 şi nu se cunosc varianţele populaţiilor, statistica test se
calculează astfel:
x1 − x 2
t calculat = , unde:
1 1
s p⋅ +
n1 n 2
s12 ( n1 − 1 ) + s 22 ( n2 − 1 )
sp = .
n1 + n 2 − 2

104
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Definirea regulii de decizie


Regula de decizie se defineşte în mod similar testării semnificaţiei unui parametru
al unei populaţii. Valoarea teoretică a statisticii test se alege însă pentru n1+n2-2 grade de
libertate.

Exemple
1. Pentru două eşantioane extrase aleator simplu de volum n1=n2=625 persoane
s-a înregistrat vârsta şi s-au obţinut următoarele rezultate: x1 = 35 ani , x 2 = 32 ani ;
s1 = 2 ani , s 2 = 4 ani . Să se testeze ipoteza potrivit căreia între vârstele medii ale celor
două populaţii din care au fost extrase eşantioanele observate există diferenţe
semnificative. Se consideră un risc de 0,05.

Rezolvare
Ipoteze statistice:
H0: µ 1 = µ 2 (nu există diferenţe semnificative între vârstele medii ale celor două
populaţii din care au fost extrase eşantioanele)
H1: µ 1 ≠ µ 2 (există diferenţe semnificative între vârstele medii ale celor două
populaţii din care au fost extrase eşantioanele)

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Când nu se cunosc varianţele populaţiilor, pentru testarea ipotezelor statistice se
foloseşte statistica t, calculată după relaţia:
x − x2
t= 1
s12 s 22
+
n1 n 2

Regula de decizie
• dacă t calc > tα / 2 , se respinge ipoteza H0;
• dacă t calc ≤ tα / 2 , se acceptă ipoteza H0.
Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în
figura de mai jos:

105
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

1-α

α/2 α/2
-t α/2 tα/2 t

H 1 H 0 H 1

Figura 34. Regiunea de respingere şi de acceptare a ipotezei H0

Calculul statisticii test


Statistica test este:
35 − 32
t= = 16 ,7
2 2
2 +4
625

Valoarea teoretică a statisticii test


Valoarea teoretică a statisticii t se citeşte din Tabelul Student pentru un risc
α=0,05 şi n1+n2-2 grade de libertate: t α /2=1,96.

Interpretare
( t calc = 16 ,7 ) > (t0 ,025 = 1,96 ), se respinge ipoteza H0. Se poate garanta cu o
probabilitate de 0,95 că există diferenţe semnificative între vârstele medii ale populaţiilor
din care au fost extrase eşantioanele observate.

2. Pentru două eşantioane, extrase aleator simplu, formate din 7 persoane de sex
masculin, iar al doilea din 9 persoane de sex feminin, se înregistrează salariul lunar
obţinut şi se obţin următoarele rezultate: x M = 24 sute lei , x F = 25 sute lei ;
s M = 3 , s F = 2 . Să se testeze ipoteza potrivit căreia între salariul mediu al persoanelor
de sex masculin şi salariul mediu al persoanelor de sex feminin există diferenţe
semnificative, la nivelul populaţiei din care au fost extrase eşantioanele observate. Se
consideră un risc de 0,05.

Rezolvare
Ipoteze statistice
H0: µ M = µ F
H1: µ M ≠ µ F

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

106
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Statistica test
Când nu se cunosc varianţele populaţiilor, pentru testarea ipotezelor statistice se
foloseşte statistica t, calculată după relaţia:
x − xF
t= M
sM2 sF2
+
n1 n2

Regula de decizie
• dacă t calc > tα / 2 , se respinge ipoteza H0;
• dacă t calc ≤ tα / 2 , se acceptă ipoteza H0.
Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în
figura de mai jos:

1-α

α/2 α/2
-t α/2 tα/2 t

H 1 H 0 H 1

Figura 35. Regiunea de respingere şi de acceptare a ipotezei H0

Calculul statisticii test


Statistica test este:
24 − 25
t= = 0 ,76
32 22
+
7 9

Valoarea teoretică a statisticii test


Valoarea teoretică a statisticii t se citeşte din Tabelul Student pentru un risc
α=0,05 şi n1+n2-2 grade de libertate: t α /2; 7+9-2=2,145.

Interpretare
( t calc = 0 ,76 ) < (t0 ,025 = 2,145 ), se acceptă ipoteza H0. Se poate garanta cu o
probabilitate de 0,95 că nu există diferenţe semnificative între salariul mediu al
persoanelor de sex masculin şi salariul mediu al persoanelor de sex feminin, la nivelul
populaţiilor din care au fost extrase eşantioanele observate.

107
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

b. Cazul eşantioanelor dependente


În cazul eşantioanelor dependente, unităţile statistice observate sunt aceleaşi. De
exemplu, pentru a studia efectele unui tratament asupra unui lot de bolnavi, se
înregistrează anumiţi parametri înainte şi după tratament, pentru aceleaşi persoane. În
acest caz, se va estima diferenţa dintre valorile înregistrate la parametrii respectivi înainte
şi după tratament.

Ipoteze statistice
H 0 : µ1 − µ 2 = 0
H 1 : µ1 − µ 2 ≠ 0

Alegerea pragului de semnificaţie a testului α

Alegerea şi calculul statisticii test


Statistica test se calculează astfel:
x − x2
t calculat = 1 , unde sd este abaterea standard a diferenţelor dintre valorile
sd / n
înregistrate de unităţile statistice între cele două momente observate.

Regula de decizie
• dacă t calc > tα / 2 , se respinge ipoteza H0;
• dacă t calc ≤ tα / 2 , se acceptă ipoteza H0.
Valoarea critică a statisticii test ( tα / 2 ) se alege pentru n-1 grade de libertate.

Exemplu
Pentru două eşantioane formate din 5 persoane, se înregistrează punctajele
obţinute la două teste susţinute în primul şi al doilea semestru, şi se obţin următoarele
rezultate:

Persoana Punctaj test


Semestrul I Semestrul II
A 65 58
B 69 65
C 88 82
D 73 70
E 75 71

Se cere să se testeze dacă există diferenţe semnificative între punctajele medii


obţinute la testele susţinute în semestrul I şi semestrul II, la nivelul populaţiilor din care
au fost extrase eşantioanele. Se consideră un risc de 0,05.

Rezolvare
Ipoteze statistice
H0: µ semI − µ semII = 0

108
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

H1: µ semI − µ semII ≠ 0

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Pentru testarea ipotezelor statistice se foloseşte statistica t, calculată după relaţia:
xd
t calculat = , unde:
sd / n
xd este media diferenţelor dintre valorile înregistrate între cele două momente:
∑ ( xi 1 − xi 2 ) ∑ d i
i i
xd = = ;
n n
∑ ( d i − xd )2
i
sd = este abaterea standard a diferenţelor di.
n −1

Regula de decizie
• dacă t calc > tα / 2 , se respinge ipoteza H0;
• dacă t calc ≤ tα / 2 , se acceptă ipoteza H0.
Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în
figura de mai jos:

1-α

α/2 α/2
-t α/2 tα/2 t

H 1 H 0 H 1

Figura 36. Regiunea de respingere şi de acceptare a ipotezei H0

Calculul statisticii test


Pe baza datelor înregistrate la nivelul eşantioanelor, se calculează statistica test
astfel:
x1 − x 2
t calculat =
.
sd / n
Elementele de calcul ale mediilor şi abaterii standard sunt prezentate în tabelul de
mai jos:

109
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Tabelul 7.1. Elemente de calcul ale mediilor şi abaterii standard


Persoana Sem_I Sem_II di= xi1 − xi 2 ( d i − x d ) ( d i − x d )2
(xi1) (xi2)
A 65 58 7 2,2 4,84
B 69 65 4 -0,8 0,64
C 88 82 6 1,2 1,44
D 73 70 3 -1,8 3,24
E 75 71 4 -0,8 0,64
TOTAL 370 346 24 - 10,8

∑ di24
i
Media diferenţelor, x d , este: x d = =
= 4 ,8 .
n 5
Abaterea standard a diferenţelor dintre valorile înregistrate în cele două momente
10 ,8
este: s d = = 2 ,7 = 1,64 .
5 −1
Statistica test se calculează astfel:
4 ,8
t calculat = = 6 ,55 .
1,64 / 5

Valoarea teoretică a statisticii test


Valoarea teoretică a statisticii t se citeşte din Tabelul Student pentru un risc
α=0,05 şi n-1 grade de libertate: t α /2; 5-1=2,776.

Interpretare
( t calc = 6 ,55 ) > (t0 ,025 = 2 ,776 ), se respinge ipoteza H0. Se poate garanta cu o
probabilitate de 0,95 că există diferenţe semnificative între punctajele medii obţinute la
testele susţinute în semestrul I şi semestrul II, la nivelul populaţiilor din care au fost
extrase eşantioanele.

7.2.2 Testarea diferenţei dintre două proporţii

Ipoteze statistice
H 0 : p1 − p 2 = 0
H 1 : p1 − p 2 ≠ 0

Alegerea pragului de semnificaţie a testului α

Alegerea şi calculul statisticii test


Statistica test se calculează astfel:
f1 − f 2
t calculat = .
f1 ⋅ ( 1 − f1 ) f 2 ⋅ ( 1 − f 2 )
+
n1 n2

110
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Regula de decizie
• dacă t calc > tα / 2 ; n1 + n2 − 2 , se respinge ipoteza H0;
• dacă t calc ≤ tα / 2 ;n + n , se acceptă ipoteza H0.
1 2 −2

Exemplu
Pentru două eşantioane extrase aleator simplu de volum n1=n2=625 persoane s-a
înregistrat proporţia persoanelor care au votat pentru candidatul A în anul 2009 şi în anul
2005 şi s-au obţinut următoarele rezultate: f 1 = 51%,; f 2 = 49% . Să se testeze ipoteza
potrivit căreia între proporţia persoanelor care au votat pentru candidatul A în cele două
momente, la nivelul populaţiilor, există diferenţe semnificative. Se consideră un risc de
0,05.

Rezolvare
Ipoteze statistice:
H0: p1 = p 2 (nu există diferenţe semnificative între proporţia persoanelor care au
votat pentru candidatul A în anul 2009 şi anul 2005)
H1: p1 ≠ p 2 (există diferenţe semnificative între proporţia persoanelor care au
votat pentru candidatul A în anul 2009 şi anul 2005)

Alegerea pragului de semnificaţie a testului


α = 0 ,05.

Statistica test
Statistica t se calculează după relaţia:
f1 − f 2
t calculat =
f1 ⋅ ( 1 − f1 ) f 2 ⋅ ( 1 − f 2 )
+
n1 n2

Regula de decizie
• dacă t calc > tα / 2 ; n1 + n2 − 2 , se respinge ipoteza H0;
• dacă t calc ≤ tα / 2 ;n + n , se acceptă ipoteza H0.
1 2 −2

Calculul statisticii test


Pe baza datelor înregistrate la nivelul eşantioanelor, se calculează statistica test
astfel:
51 − 49
t calculat = = 0 ,71 .
51 ⋅ ( 100 − 51 ) + 49 ⋅ ( 100 − 49 )
625

Valoarea teoretică a statisticii test


Valoarea teoretică a statisticii t se citeşte din Tabelul Student pentru un risc
α=0,05 şi n1+n2-2 grade de libertate: t α /2=1,96.

111
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Interpretare
( t calc = 0 ,71) < (t0 ,025 = 1,96 ), se acceptă ipoteza H0. Se poate garanta cu o
probabilitate de 0,95 că nu există diferenţe semnificative între proporţia persoanelor care
au votat pentru candidatul A în anul 2009 şi în anul 2005, la nivelul populaţiilor din care
au fost extrase eşantioanele observate.

7.3. Estimare versus testare


Estimarea prin interval de încredere presupune construirea unui interval pentru
valoarea unui parametru, plecând de la rezultatele obţinute prin prelucrarea datelor la
nivelul unui eşantion extras din populaţie.
Prin testarea ipotezelor statistice se formulează o ipoteză asupra valorii unui
parametru şi se verifică dacă această ipoteză este sau nu „contrazisă” de observaţiile de la
nivelul unui eşantion extras din populaţie.
De exemplu, în estimarea şi testarea semnificaţiei mediei unei populaţii, să
presupunem că se înregistrează salariul lunar obţinut de persoanele dintr-un eşantion de
volum n şi se află limitele intervalului de încredere pentru salariul mediu la nivelul
populaţiei. În urma prelucrării datelor, considerând un risc de 0,05, se obţin următoarele
rezultate pentru intervalul de încredere a mediei populaţiei: [14; 18 ] mil. Lei. Dacă
testarea statistică are ca obiectiv verificarea egalităţii dintre salariul mediu la nivelul
populaţiei şi salariul mediu pe economie, µ 0 = 12 mil. Lei, atunci, cu o probabilitate de
0,95, se poate conchide că se respinge ipoteza egalităţii dintre cele două valori. În
procesul testării statistice, ipotezele care se formulează, în exemplul dat, sunt
următoarele: H 0 : µ = 12; H 1 : µ ≠ 12 . Cunoscând limitele intervalului de încredere
pentru media populaţiei, 14 ≤ µ ≤ 18 , se observă, astfel, că aceasta nu poate fi egală cu
12 mil. Lei.
În mod similar, dacă intervalul de încredere calculat pentru un parametru θ nu
include valoarea zero, atunci se respinge ipoteza H0 prin care se admite că valoarea acelui
parametru este nulă ( H 0 : θ = 0 ), considerând o probabilitate de 1 − α .

112
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

ANEXE

113
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Repartiţia Laplace:
z t2
1 −
Φ( z ) = ∫e 2 dt
2π 0

0 z
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.000 0.004 0.008 0.012 0.016 0.020 0.024 0.028 0.032 0.036
0.1 0.040 0.044 0.048 0.052 0.056 0.060 0.064 0.067 0.071 0.075
0.2 0.079 0.083 0.087 0.091 0.095 0.099 0.103 0.106 0.110 0.114
0.3 0.118 0.122 0.126 0.129 0.133 0.137 0.141 0.144 0.148 0.152
0.4 0.155 0.159 0.163 0.166 0.170 0.174 0.177 0.181 0.184 0.188
0.5 0.191 0.195 0.198 0.202 0.205 0.209 0.212 0.216 0.219 0.222
0.6 0.226 0.229 0.232 0.236 0.239 0.242 0.245 0.249 0.252 0.255
0.7 0.258 0.261 0.264 0.267 0.270 0.273 0.276 0.279 0.282 0.285
0.8 0.288 0.291 0.294 0.297 0.300 0.302 0.305 0.308 0.311 0.313
0.9 0.316 0.319 0.321 0.324 0.326 0.329 0.331 0.334 0.336 0.339
1 0.341 0.344 0.346 0.348 0.351 0.353 0.355 0.358 0.360 0.362
1.1 0.364 0.367 0.369 0.371 0.373 0.375 0.377 0.379 0.381 0.383
1.2 0.385 0.387 0.389 0.391 0.393 0.394 0.396 0.398 0.400 0.401
1.3 0.403 0.405 0.407 0.408 0.410 0.411 0.413 0.415 0.416 0.418
1.4 0.419 0.421 0.422 0.424 0.425 0.426 0.428 0.429 0.431 0.432
1.5 0.433 0.434 0.436 0.437 0.438 0.439 0.441 0.442 0.443 0.444
1.6 0.445 0.446 0.447 0.448 0.449 0.451 0.452 0.453 0.454 0.454
1.7 0.455 0.456 0.457 0.458 0.459 0.460 0.461 0.462 0.462 0.463
1.8 0.464 0.465 0.466 0.466 0.467 0.468 0.469 0.469 0.470 0.471
1.9 0.471 0.472 0.473 0.473 0.474 0.474 0.475 0.476 0.476 0.477
2 0.477 0.478 0.478 0.479 0.479 0.480 0.480 0.481 0.481 0.482
2.1 0.482 0.483 0.483 0.483 0.484 0.484 0.485 0.485 0.485 0.486
2.2 0.486 0.486 0.487 0.487 0.487 0.488 0.488 0.488 0.489 0.489
2.3 0.489 0.490 0.490 0.490 0.490 0.491 0.491 0.491 0.491 0.492
2.4 0.492 0.492 0.492 0.492 0.493 0.493 0.493 0.493 0.493 0.494
2.5 0.494 0.494 0.494 0.494 0.494 0.495 0.495 0.495 0.495 0.495
2.6 0.495 0.495 0.496 0.496 0.496 0.496 0.496 0.496 0.496 0.496
2.7 0.497 0.497 0.497 0.497 0.497 0.497 0.497 0.497 0.497 0.497
2.8 0.497 0.498 0.498 0.498 0.498 0.498 0.498 0.498 0.498 0.498
2.9 0.498 0.498 0.498 0.498 0.498 0.498 0.498 0.499 0.499 0.499
3 0.499 0.499 0.499 0.499 0.499 0.499 0.499 0.499 0.499 0.499

114
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

Repartiţia Student: p=P(t>tdf)


df α = 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
1 3.078 6.314 12.706 31.821 63.656 318.289 636.578
2 1.886 2.920 4.303 6.965 9.925 22.328 31.600
3 1.638 2.353 3.182 4.541 5.841 10.214 12.924
4 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 1.476 2.015 2.571 3.365 4.032 5.894 6.869
6 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 1.314 1.703 2.052 2.473 2.771 3.421 3.689
28 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 1.311 1.699 2.045 2.462 2.756 3.396 3.660
30 1.310 1.697 2.042 2.457 2.750 3.385 3.646
∞ 1.282 1.645 1.960 2.326 2.576 3.091 3.291

115
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

116
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

BIBLIOGRAFIE
1. Andrei, T., Statistică şi econometrie, Editura Economica, Bucureşti, 2003.
2. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
3. Bărbat, Al. , Teoria statisticii sociale, Editura Didactică şi Pedagogică, Bucureşti, 1972.
4. Baron, T.; Biji, E.; Tövissi, L., ş.a., Statistică teoretică şi economică, Editura Didactică
şi Pedagogică, Bucureşti, 1991.
5. Biji, M.; Biji, El., Statistica teoretică, Editura Didactică şi Pedagogică, Bucureşti, 1979.
2. Biji, M.; Stoichiţă, I. , Metoda selectivă a cercetării statistice, Editura Ştiinţifică,
Bucureşti, 1957.
3. Capanu, I; Wagner, P.; Mitruţ, C., Sistemul conturilor naţionale şi agregate
macroeconomice, Editura All, Bucureşti, 1994.
4. Chelcea, S., Chestionarul în investigaţia sociologică, Editura Ştiinţifică şi
Enciclopedică, Bucureşti, 1975.
3. Galton, Fr., Natural Inheritance, Macmillan, London, 1889
4. Georgescu Roegen, N. , Metoda statistică - elemente de statistică matematică, I.S.C.S.,
Bucureşti, 1933.
5. Glenberg, A.M., Andrzejewski, M.E., Learning from data. An Introduction to
Statistical Reasoning, Taylor and Francis Group, New York, 2008.
6. Isaic-Maniu, Al.; Grădinaru, A.; Voineagu, V.; Mitruţ, C. - Statistică teoretică şi
economică, Editura Tehnică, Chişinău, 1994.
7. Jaba, E., Grama, A., Analiza statistică cu SPSS sub Windows, Ed. Polirom, Iaşi, 2004
8. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
9. Jaba, E., Pintilescu, C., Iosub F., Statistică descriptivă. Teste grilă şi probleme, Editura
Sedcom Libris, Iaşi, 2001.
10. Jaba, E., Pintilescu, C., Statistică. Teste grilă şi probleme, Editura Sedcom Libris, Iaşi,
2005.
11. Jemna, D., Econometrie, Editura Sedcom Libris, Iaşi, 2009.
12. Jemna, D., Pintilescu, C., Turturean, C., Chirilă V., Chirilă, C, Viorică, D.,
Econometrie. Probleme şi teste grilă, Editura Sedcom Libris, Iaşi, 2009.
13. Lecaillon, J.; Labrousse, C., Statistique descriptive, Editura Cujas, Paris, 1988
14. Mallinvaud, E. - Méthodes statistique de l'économetrie, Dunod, Paris, 1981
15. Marinescu, I. , Analiza factorială, Editura Ştiinţifică şi Enciclopedică, Bucureşti, 1984.
16. McClave, J.T.; Benson, P.G. , Statistics for Business and Economics, Dellen Publishing
Company, San Francisco, 1985.

117
© 2010 Prof. Univ. Dr. Carmen Pintilescu Statistica – Suport de curs

17. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
18. Milton Smith, G. - Ghid simplificat de statistică pentru psihologie şi pedagogie, E.D.P.,
Bucureşti 1971.
19. Minium, E.W., Clarke, R., C., Coladarci, T., Elements of Statistical Reasoning, John
Wiley and Sons, 1999.
20. Pecican, E.S. - Econometrie, Editura All, Bucureşti, 1994
21. Pintilescu, C., Analiza datelor, Editura Junimea, Iaşi, 2002.
22. Pintilescu, C., Analiză statistică multivariată, Editura Universităţii “Alexandru Ioan
Cuza” Iaşi, 2007.
23. Saporta, G., Probabilités, analyse des données et statistique, Editura Technip, Paris,
1990
24. Tövissi, L.; Isaic-Maniu, Al., Statistica, A.S.E., Bucureşti, 1984.
25. Trebici, V.(coord.) - Mica enciclopedie de statistică, Editura Ştiinţifică şi
Enciclopedică, Bucureşti, 1985.
26. Ţarcă, M. , Statistică, vol.I şi II, Universitatea "Al.I.Cuza" Iaşi, 1979.
27. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică,
Bucureşti, 1969.
28. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.

118