Sunteți pe pagina 1din 49

PARTEA A DOUA.

STATISTIC INFERENIAL

US4. NOIUNI I NOTAII FOLOSITE N STATISTICA INFERENIAL

Cuprins

4.1. Populaie i eantion


4.2. Parametri i estimaii
4.3. Noiunea de probabilitate
4.4. Abaterea standard i distribuia normal
4.5. Distribuia Student
4.6. Distribuia de selecie a mediei

Rezumat

n acest capitol sunt prezentate cele mai importante noiuni folosite n inferena
statistic: populaie statistic i eantion, parametri i estimaii, distribuii de selecie.
Fundamentele inferenei statistice sunt estimarea i testarea statistic. Caracterizarea unei
populaii n mod indirect, prin extragerea unui eantion din aceasta, presupune prelucrarea
datelor la nivelul eantionului extras, respectiv calculul unor indicatori statistici (medie,
varian, proporie), care se numesc estimaii. Aceste mrimi se folosesc pentru a estima
parametrii unei populaii (media populaiei, variana populaiei, proporia unei categorii la
nivelul unei populaii), care nu pot fi cunoscui n mod direct.

Bibliografie

1. Andrei, T., Statistic i econometrie, Ed. Economic, 2003


2. Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002
3. James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and
Economics, Pearson, Education New Jersey, 2008
4. Saporta, G., Probabilits, analyse des donnes et statistique, Editura Technip, Paris, 1990
5. Weiss, N, A., Elementary Statistics, Pearson, 2012
6. Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.
91
92
US4. NOIUNI I NOTAII FOLOSITE N STATISTICA
INFERENIAL

Statistica inferenial are ca obiectiv cunoaterea unei populaii n mod indirect, prin
prelucrarea datelor la nivelul unui eantion extras aleatoriu din aceasta. Inferena statistic
presupune estimarea parametrilor unei populaii i testarea ipotezelor statistice.

4.1. Populaie i eantion

Observarea i nregistrarea valorilor unei variabile pentru toate unitile populaiei


presupune o observare exhaustiv, total. Acest procedeu se aplic, de exemplu, n cazul
recensmntului unei populaii, cnd sunt nregistrate mai multe caracteristici ale populaiei
(vrsta, categoria socio-profesional, sexul persoanei etc.), la un moment de referin.
Volumul unei populaii se noteaz cu N.
Observarea i nregistrarea valorilor unei variabile pentru anumite uniti statistice
extrase dintr-o populaie presupune o observare parial. n acest caz, se observ doar un
eantion reprezentativ extras din populaie. Inferena statistic are ca obiectiv cunoaterea
unei populaii n mod indirect, prin prelucrarea datelor la nivelul unui eantion extras din
aceasta. Volumul eantionului se noteaz cu n. Avantajele cercetrii prin sondaj decurg, n
principal, din costurile reduse de obinere a datelor statistice.

4.2. Parametri i estimaii

Parametrii reprezint mrimi reale dar necunoscute prin care poate fi caracterizat o
populaie. De exemplu, o populaie poate fi caracterizat folosind un indicator al tendinei
centrale, cum ar fi media populaiei ( ) i un indicator al dispersiei, cum ar fi abaterea medie
ptratic ( ).
Aceste mrimi sunt estimate prin prelucrarea datelor nregistrate la nivelul unui
eantion, proces n urma cruia se obin estimaii ale parametrilor populaiei. De exemplu,
prin nregistrarea valorilor unei variabile la nivelul unui eantion, pot fi calculate media
eantionului ( x ) i abaterea medie ptratic ( s ).
Notaiile folosite pentru definirea parametrilor i estimaiilor sunt prezentate n tabelul
de mai jos.

93
Estimaii Parametri
(eantion) (populaie)
Media x
Variana s2 2
Abaterea standard s
Proporia p

4.3. Noiunea de probabilitate

DEFINIIE Probabilitatea (p) ca un anumit eveniment s se ntmple este raportul dintre


numrul cazurilor favorabile ale unui experiment (n) i numrul total de cazuri
n
ale respectivului eveniment (N): p
N

Prin experiment nelegem o aciune al crei rezultat nu poate fi anticipat exact, iar prin
eveniment nelegem unul dintre rezultatele posibile ale acestui experiment.
Probabilitatea este un numr real, cuprins ntre 0 i 1. Valoarea p=0 corespunde
imposibilitii realizrii evenimentului sau evenimentul imposibil, iar valoarea p=1
corespunde evenimentului cert sau sigur.

Observaie:
Probabilitatea este definit ca un caz limit al frecvenei, adic este frecvena relativ de
apariie a unui eveniment (fi).

Exemplul 4.1. Calculul probabilitii de apariie a unui eveniment


Considernd aruncarea a dou zaruri, pentru care exist un total de 36 de evenimente
posibile, aa cum sunt prezentate n figura 4.1, se cere s se afle:
a) care este probabilitatea ca, dup o aruncare a zarurilor, suma de pe feele celor dou
zaruri s fie egal cu 4?
b) care este probabiltatea ca, dup o aruncare a zarurilor, suma de pe feele celor dou
zaruri s fie mai mic sau egal cu 8?

94
Figura 4.1. Evenimentele posibile n cazul aruncrii simultane a dou zaruri

Rezolvare
a) Exist 4 cazuri cnd suma de pe feele celor dou zaruri este egal cu 4, i anume:

Avnd n vedere c n total sunt 36 de cazuri posibile, probabilitatea ca suma de pe feele celor
dou zaruri s fie egal cu 4 este egal cu 4/36=0.11 sau 11%.

b) Putem considera valorile posibile ale fiecruia dintre cele dou zaruri (1, 2, 3, 4, 5,
6) ca valori ale unor variabile numerice discrete. Variabila care rezult prin nsumarea
numerelor de pe cele dou zaruri este tot o variabil discret ale crei valori posibile sunt de la
2 la 12. Probabilitatea ca suma de pe feele celor dou zaruri s fie mai mic sau egal cu 8
este astfel frecvena absolut cumulat cresctor asociat acestei valori.
n tabelul de mai jos, prezentm frecvenele relative de apariie, simple i cumulate
cresctor, ale valorilor acestei variabile.

95
Tabelul 4.1. Distribuia evenimentelor dup suma de pe feele celor dou zaruri
Suma celor dou zaruri ni fi Fi
2 1 0.027778 0.027778
3 2 0.055556 0.083333
4 3 0.083333 0.166667
5 4 0.111111 0.277778
6 5 0.138889 0.416667
7 6 0.166667 0.583333
8 5 0.138889 0.722222
9 4 0.111111 0.833333
10 3 0.083333 0.916667
11 2 0.055556 0.972222
12 1 0.027778 1
Total 36 1 -

Probabilitatea ca, dup o aruncare a zarurilor, suma de pe feele celor dou zaruri s fie
mai mic sau egal cu 8 este 0,7222 sau 72,22%. Aceast probabilitate s-a obinut prin
cumularea tuturor probabilitilor asociate cazurilor n care suma este 2, 3, 4, 5, 6, 7 sau 8
(0,027778+0,055556+0,083333+0,111111+0,138889+0,166667+0,138889=0,722222).

4.4. Abaterea standard i distribuia normal

Cunoscnd nivelul mediu i abaterea standard pentru o distribuie, putem afla care este
proporia unitilor care nregistreaz valori mai mari, de exemplu, dect ( x s ).
Pentru aceasta, se calculeaz o valoare standardizat Zi, cunoscut i sub denumirea de
xi x
scor Zi, dup relaia: z i .
s
Aceast mrime arat poziia unei uniti fa de nivelul mediu ( xi x ), folosind ca
unitate de msur abaterea standard.
De exemplu, pentru o distribuie caracterizat printr-o medie de x 100 i o abatere
140 100
standard de s 20 , putem afla valoarea zi pentru xi=140, astfel: zi 2 . Aceasta
20
arat c unitatea care nregistreaz valoarea xi=140 se gsete la o distan fa de nivelul
mediu egal cu de dou ori abaterea standard.

96
Odat calculat valoarea z, putem afla proporia unitilor care nregistreaz valori mai
mari dect 140, de exemplu. Aceste valori sunt calculate pentru o distribuie normal i sunt
tabelate ntr-un tabel cunoscut sub denumirea de tabelul Z (prezentat n Anexa 1).
Tabelul care prezint aceste rezultate este de forma:

0 0.01 0.05
0
0.1
0.2

1 0,341
1.1 0,375

Pe prima coloan sunt valorile lui z, prima cifr i prima zecimal, iar valorile din
urmtoarele coloane reprezint a doua zecimal a valorii z. Valorile din interiorul tabelul arat
proporia unitilor care nregistreaz valori cuprinse ntre nivelul mediu i scorul z
corespunztor.

Exemplul 4.2. Citirea probabilitii asociate unei valori zi


Pentru zi=1,15, se citete n tabelul Z valoarea 0,375. Aceast valoare arat c
aproximativ 37,5% din unitile distribuiei nregistreaz valori cuprinse ntre nivelul mediu i
valoarea zi=1,15.
n tabelul Z nu sunt valori negative pentru zi, ns distribuia normal este o distribuie
simetric, deci aria suprafeei cuprinse ntre nivelul mediu i valoarea pozitiv sau negativ a
lui Z este aceeai.

97
Exemplul 4.3. Calculul probabilitilor pentru o variabil normal distribuit
a. Pentru o distribuie normal de medie, x , i abatere standard, s, s se afle proporia
unitilor care nregistreaz valori cuprinse n intervalele ( x s ), ( x 2 s ) i ( x 3 s ).

Rezolvare
Pentru a afla proporia unitilor care nregistreaz valori cuprinse n intervalul
( x s; x s ) , se calculeaz scorul Z, astfel:
x1 x x s x
z1 1
s s
x2 x x s x
z2 1 .
s s

Din tabelul Z se citete valoarea care corespunde valorii zi=1, i anume 0,341.

0 0.01 0.05
0
0.1
0.2

1 0,341
1.1 0,375

Aceast valoare, 0,341, reprezint aria suprafeei cuprinse ntre nivelul mediu i zi=1.
Proporia unitilor care nregistreaz valori cuprinse n intervalul ( x s; x s ) este:
2 0,341 0,682 sau 68,2%.

98
n mod similar, se obin valorile zi=2, pentru limitele intervalului ( x 2 s ).

Din tabelul Z, se citete valoarea care corespunde valorii zi=2, de 0,477.

0 0.05
0
0.1
0.2

2 0,477

Proporia unitilor care nregistreaz valori cuprinse n intervalul ( x 2 s; x 2 s )


este: 2 0,477 0,954 sau 95,4%.

99
Pentru intervalul ( x 3 s ), se obin valorile zi=3:

Pentru zi=3, se citete valoarea corespunztoare 0,499.

0 0.05
0
0.1
0.2

3 0,499

Proporia unitilor care nregistreaz valori cuprinse n intervalul ( x 3 s; x 3 s )


este: 2 0,499 0,998 sau 99,8%.

Interpretare: ntr-o distribuie normal, n intervalul ( x s ) sunt cuprinse 68,2% din uniti,
n intervalul ( x 2 s ) sunt cuprinse 95,4% din uniti i n intervalul ( x 3 s ) sunt cuprinse
99,8% din uniti.

b. Distribuia unor studeni dup nota obinut la un test urmeaz o lege normal i se
caracterizeaz prin urmtoarele rezultate: x 7 i s=2. Se cere s se afle proporia studenilor
care au luat note mai mici dect 6.

100
Rezolvare
Valoarea Zi care corespunde unei valori xi=6 se calculeaz astfel:
xi x 6 7
zi 0,5
s 2
Din tabelul Z se citete valoarea care corespunde unui nivel zi=0,5, egal cu 0,191.

0 0.01 0.05
0
0.1
0.2

0,5 0,191

Proporia studenilor care au luat note mai mici dect 6 este p=0,5-0,191=0,309 sau
30,9%.

Observaie: Aria suprafeei reprezentate n figura de mai sus este egal cu unu (dup cum am
precizat anterior, suma proporiilor este egal cu 1 sau 100%). Distribuia normal este o
distribuie simetric, deci proporia unitilor care au valori mai mari dect nivelul mediu este
de 0,5.

c. Distribuia unor persoane dup vrst urmeaz o lege normal i se caracterizeaz


prin urmtoarele rezultate: x 30 ani i s=4 ani. Se cere s se afle proporia persoanelor care
au o vrst cuprins ntre 27 ani i 35 ani.

Rezolvare
Valorile lui Z corespunztoare lui x1=27 i x2=35 sunt:
101
x1 x 27 30
z1 0 ,75
s 4
x2 x 35 30
z2 1,25 .
s 4
Din tabelul Z se citesc valorile corespunztoare lui z1=-0,75 i z2=+1,25, astfel:

0 0.05
0
0.1
0.2

0,7 0,273

1,2 0,394

Proporia persoanelor care au o vrst cuprins ntre 27 ani i 35 ani este:


f=0,273+0,394=0,667 sau 66,7%.

d. Pentru o distribuie normal de medie, x , i abatere standard, s, s se afle limitele


intervalului care include 95% din unitile statistice observate.

Rezolvare
Aceast problem poate fi prezentat grafic astfel:

102
Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat anterior:
se cunoate proporia (95%) i trebuie s aflm valoarea lui z care corespunde acestei
proporii.
Pentru a afla valoarea lui z, se calculeaz aria suprafeei cuprins ntre nivelul mediu i
0 ,95
z, care este egal cu 0 ,475 .
2

Pentru aceast valoare egal cu 0,475, se citete valoarea lui z corespunztoare, de 1,96.

0 0.06
0
0.1
0.2

1,9 0,475

Prin urmare, ntr-o distribuie normal 95% din uniti au valori cuprinse n intervalul
x 1,96 s; x 1,96 s . Riscul asumat pentru ca o unitate s nu fie n acest interval este de
5%.
103
Observaie: n estimarea parametrilor unei populaii, problematic prezentat n partea a doua,
obiectivul urmrit este de a afla limitele unui interval care acoper media unei populaii, n
95% din cazuri, de exemplu. n acest caz, riscul asumat ca media unei populaii s nu fie n
acest interval este de 5% (sau 100%-95%). Acest risc este simbolizat cu .

4.5. Distribuia Student

Atunci cnd nu se cunoate variana populaiei (2), caz frecvent ntlnit n practic,
aceasta poate fi nlocuit prin variana calculat la nivelul eantionului (s2).
x
Variabila Z devine astfel: . Aceast mrime este cunoscut sub denumirea
s/ n
de variabila t.
ntruct pentru fiecare eantion se pot nregistra valori diferite ale lui s, vom avea mai
multe distribuii t (cu variane diferite). Cum valorile variabilei t depind de volumul
eantionului, cu ct eantionul este de volum mai mare, cu att variana eantionului va estima
mai bine variana populaiei.
Precizia acestei estimri este luat n calcul n modelul matematic al distribuiei t
(cunoscut sub denumirea de t Student) prin numrul gradelor de libertate, egal cu (n-1), care
crete odat cu creterea volumului eantionului (n).
Ca i n cazul variabilei Z, variabila t are media egal cu zero. Variana sa ns nu mai
este egal cu 1, este ntotdeauna mai mare dect 1, dar se apropie de 1 atunci cnd numrul
gradelor de libertate este mare (eantionul este de volum mare). Se poate astfel considera c
atunci cnd n distribuia Student tinde spre o distribuie normal standard Z.
Ca i n cazul variabilei Z, valorile variabilei t sunt calculate i tabelate n tabelul
Student (prezentat n Anexa 2). Acest tabel este de forma :

104
Grade de libertate 0.10 0.05 0.025
1 3.078 6.314 12.706
2 1.886 2.920 4.303

30 1.310 1.697 2.042
>30 1.282 1.645 1.960

n prima coloan sunt prezentate gradele de libertate (n-1), iar pe prima linie sunt date
diferite valori ale riscului asumat (). Valorile t care sunt n interiorul tabelului sunt valorile t
Student pentru care probabilitatea P(t >t)= (aria suprafeei din dreapta valorii t este ).
Pentru aceeai probabilitate, valorile variabilei t difer n funcie de gradele de libertate
considerate.
De exemplu, pe prima coloan (0.10) se gsesc valorile t pentru care aria suprafeei
delimitate la dreapta de aceste valori este de 0.10 sau 10%.
Exemplul 4.4. Citirea valorii t din tabelul Student
a. Considernd 9 grade de libertate, s se afle valoarea t astfel nct P(t >t0.05)=0.05.

Rezolvare
n tabelul Student, n dreptul gradelor de libertate egale cu 9 se citete pentru coloana
0.05 valoarea t=1,833.
0.10 0.05
1
2
3

9 1,833

Interpretare: Pentru o distribuie t Student cu 9 grade de libertate, valoarea t Student


este t0.05=1,833. Probabilitatea ca t s aib valori mai mari de 1,833 este de 0.05 sau 5% :
P(t >1,833)=0.05.

b. Considernd 9 grade de libertate, s se afle P(t >2,52).

105
Rezolvare
n tabelul Student, n dreptul gradelor de libertate egale cu 9 se observ c valoarea
t=2,52 se gsete ntre valorile 2,262 i 2,821, care corespund probabilitilor 0,025 i 0,01.

0.10 0.05 0.025 0.01


1
2
3

9 2,262 2,821

Probabilitatea ca t s fie mai mare dect 2,52 este deci cuprins ntre 0,01 i 0,025:
0,01 P(t 2,52) 0,025 .

Interpretare: Pentru o distribuie t Student cu 9 grade de libertate, probabilitatea ca t s fie


mare mare dect 2,52 este cuprins ntre 1% i 2,5%.

Observaie: Numeroase soft-uri statistice permit calculul exact al acestei probabiliti.

c. S se afle valorile t astfel nct P(t >t0.05)=0.05, considernd urmtoarele grade de


libertate : 9, 25, 30, 50. S se compare aceste valori.

Rezolvare
n tabelul Student, pentru coloana 0.05 se citesc valorile prezentate mai jos, n dreptul
gradelor de libertate egale cu 9, 25, 30, 50:

106
Grade de libertate 0.10 0.05
1
2

9 1,833

25 1,708

30 1,697
>30 1,645

Interpretare: Se observ c valorile t sunt din ce n ce mai mici (1,833 >1,708>1,697>1,645)


pe msur ce numrul gradelor de libertate crete (volumul eantionului crete).

De asemenea, se observ c distribuia t tinde spre o distribuie normal Z pentru


eantioane de volum mare (mai mare dect 30). Valoarea t pentru eantioane mari este aceeai
cu valoarea Z. Pentru exemplul dat, valoarea Z astfel nct P(Z <z)=0,95 este 1,64.

4.6. Distribuia de selecie a mediei

O distribuie de selecie este distribuia unui estimator. Un estimator este o funcie de


variabile aleatoare de selecie i se noteaz, de regul, cu semnul ^ deasupra parametrului
respectiv. De exemplu, estimatorul mediei se noteaz , al varianei 2 , iar al proporiei .
Pentru a forma distribuia mediei de selecie, s considerm cele K eantioane de volum
n care se pot extrage dintr-o populaie de volum N. Considernd o populaie de volum N, se
pot forma K CNn eantioane de volum n, extrase aleator nerepetat (o unitate extras i
nregistrat nu se mai reintroduce n populaie). Pentru fiecare din cele K eantioane, se pot
calcula mediile eantioanelor i se pot determina frecvenele de apariie a fiecrei medii.

Exemplu 4.5. Construirea distribuiei de selecie a mediei


S considerm o populaie format din 4 supermarket-uri pentru care se nregistreaz
preul (lei) la cafea i se obin urmtoarele valori: 14, 15, 17, 18. S se construiasc distribuia
mediei de selecie, extrgnd toate eantioanele de volum n=2.
107
Rezolvare
Caracterizarea acestei populaii se poate realiza prin calculul unui indicator al tendinei
centrale, media, de exemplu, i a unui indicator al dispersiei, cum este abaterea standard:
Xi 14 15 17 18
Media populaiei este: i
16 lei.
N 4

Abaterea standard este 2 . Variana se calculeaz astfel:

( X i )2 (14 16) 2 (15 16) 2 (17 16) 2 (18 16) 2


2 i
2,5
N 4

nlocuind n relaia de mai sus, se obine: 2 2,5 1,58 lei.

4!
Dac n=2, K C Nn C42 6 eantioane.
2!(4 2)!
Valorile variabilei pentru cele 2 uniti din fiecare din cele 6 eantioane sunt:

E. 1 E.2 E.3 E.4 E.5 E.6


14 14 14 15 15 17
15 17 18 17 18 18

Pentru fiecare din cele 6 eantioane, se calculeaz mediile eantioanelor, astfel:

14 15 15 17
Eantionul 1: x1 14,5 Eantionul 4: x6 16
2 2
14 17 15 18
Eantionul 2: x2 15,5 Eantionul 5: x7 16,5
2 2
14 18 17 18
Eantionul 3: x3 16 Eantionul 6: x8 17,5
2 2

Distribuia mediei de selecie, , se formeaz prin ordonarea mediilor eantioanelor i


determinarea probabilitii (frecvenei) de apariie a fiecrei variante:

108
Tabelul 4.2. Distribuia variabilei media de selecie

xi Frecvena de pi
apariie
14,5 I 1/6=0,167
15,5 I 1/6=0,167
16 II 2/6=0,332
16,5 I 1/6=0,167
17,5 I 1/6=0,167
TOTAL - 1

Distribuia mediei de selecie este o distribuie de probabilitate a mediilor tuturor


eantioanelor de volum n care se pot extrage aleatoriu dintr-o populaie de volum N.
Caracteristicile variabilei media de selecie sunt:
- media mediei de selecie este: M ;
- variana mediei de selecie este:
2
V ( ) 2 , n cazul unui sondaj aleator repetat;
n
2 N n
V ( ) 2 , n cazul unui sondaj aleator nerepetat.
n N

n cazul nostru,
- media mediei de selecie este calculat ca o medie aritmetic folosind frecvene
relative:
M xi pi 14,5 0.167 15,5 0.167 ... 17,5 0.167 16 .
i

Media mediei de selecie este, deci, egal cu media populaiei ( ).


- variana mediei de selecie este:
V ( ) 2 xi2 pi ( xi pi ) 2 256,83 16 2 0,83 .
i i

Reamintim c variana poate fi calculat ca diferen ntre media ptratelor valorilor


unei variabile i ptratul mediei variabilei.
- abaterea standard a mediei de selecie este:

2 x
i
i
2
pi ( xi pi ) 2 0,83 0,911 .
i

109
Tabelul 4.3. Elemente de calcul ale mediei i varianei variabilei

xi pi xi pi xi2 xi2 pi
14,5 0,167 2,421 210,250 35,111
15,5 0,167 2,588 240,250 40,121
16 0,332 5,312 256,000 84,992
16,5 0,167 2,755 272,250 45,465
17,5 0,167 2,922 306,250 51,143
TOTAL 1,0 16 - 256,832

Reprezentarea grafic a distribuiei mediei de selecie este realizat n figura de mai


jos:

Figura 4.2. Reprezentarea grafic a distribuiei mediei de selecie,

Dup cum se observ, distribuia mediei de selecie urmeaz o lege normal, iar mediile
eantioanelor se grupeaz n jurul mediei lor, adic a mediei populaiei.

Variabila media de selecie se caracterizeaz prin legea normal - teorema limit


central, bazat pe legea numerelor mari:
- dac variabila aleatoare X urmeaz o lege normal, atunci urmeaz o lege
normal oricare ar fi n;
- dac variabila aleatoare X nu urmeaz o lege normal, atunci urmeaz o lege
normal doar pentru valori mari ale lui n, de regul mai mari dect 30.

110
2
Folosind notaiile prezentate, putem scrie: ~ N ( , 2 ) sau ~ N ( , ).
n

US5. ESTIMAREA PARAMETRILOR UNEI POPULAII

Cuprins

5.1. Estimarea mediei unei populaii ()


5.2. Estimarea proporiei unei populaii ()

Rezumat

Capitolul 5 prezint modalitatea de estimare a parametrilor unei populaii, respectiv a


unei medii i a unei proporii, atunci cnd populaia nu poate fi observat n mod direct.
Estimarea parametrilor unei populaii se poate realiza punctual sau prin interval de ncredere
(IC). Estimarea prin interval de ncredere se realizeaz diferit n funcie de cunoaterea sau
necunoaterea varianei populaiei, folosind diferite grade de risc asumat.

Bibliografie

1. Andrei, T., Statistic i econometrie, Ed. Economic, 2003


2. Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002
3. James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and
Economics, Pearson, Education New Jersey, 2008
4. Weiss, N, A., Elementary Statistics, Pearson, 2012
5. Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.

111
US5. ESTIMAREA PARAMETRILOR UNEI POPULAII

Estimarea reprezint procedeul de determinare a unui parametru al unei populaii (,


2, ) prin prelucrarea datelor nregistrate la nivelul unui eantion.
Estimarea se poate realiza:
1. punctual: presupune aflarea unei valori posibile a estimatorului parametrului cutat.
2. prin interval de ncredere (IC): presupune aflarea limitelor de ncredere ale unui
interval care acoper valoarea unui parametru.

5.1. Estimarea mediei unei populaii ( )

Estimarea mediei unei populaii se poate realiza punctual i prin interval de ncredere
(I.C.).

5.1.1. Estimarea punctual a mediei unei populaii

DEFINIIE Estimarea punctual a mediei unei populaii presupune aflarea unei valori
posibile a estimatorului parametrului .

n paragraful anterior, am artat c media eantionului, x , este o valoare a


estimatorului . Media eantionului este, deci, o estimaie punctual a mediei populaiei.

5.1.2. Estimarea prin interval de ncredere a mediei unei populaii

Construirea IC se bazeaz pe variabila normal standard Z, prezentat n partea nti:


~ N ( , 2 ) Z ~ N ( 0 , 1 ) .

Lund n considerare media () i variana ( 2 ) unei populaii, variabila Z este dat de


X
relaia Z . Pentru variabila , valorile variabilei Z se calculeaz dup relaia:

xi xi x
zi . Astfel, se poate determina: P( z z ) 1 , unde:
/ n / n
este un nivel al probabilitii cuprins ntre zero i unu. Acest nivel arat riscul
asumat n estimare. De regul, n economie se folosete un risc de 0,05 sau 5%.

112
Intervalul de ncredere pentru media populaiei, cnd se cunoate variana populaiei,
este:

x z / 2 , unde:
n
x este media calculat la nivelul eantionului;
z / 2 este o valoare a statisticii Z care se citete din Tabelul Z pentru un risc .

este abaterea standard la nivelul populaiei;


n este volumul eantionului.

Atunci cnd nu se cunoate variana populaiei, n estimarea mediei prin interval de


ncredere se folosete statistica t Student. Limitele intervalului de ncredere pentru media
populaiei sunt definite de:
s'
x t / 2,n1 , unde:
n
x este media calculat la nivelul eantionului;
t / 2,n1 este valoarea statisticii t Student care se citete din Tabelul Student pentru un risc i

n-1 grade de libertate;


s' este abaterea standard corectat determinat la nivelul eantionului, dup relaia:

( xi x ) 2
i
s' ;
n 1
n este volumul eantionului.

Observaii:

Precizia estimrii crete (mrimea intervalului de ncredere este mai mic), atunci cnd:
- volumul eantionului (n) crete (legea rdcinii ptrate: mrirea de 4 ori a
volumului eantionului, dubleaz precizia estimrii);
- probabilitatea cu care se garanteaz rezultatele este mai mic;
- variana eantionului este mic (valorile aberante afecteaz mrimea intervalului de
ncredere).

113
Exemplul 5.1. Estimarea mediei prin interval de ncredere
a. La nivelul unui eantion format din 28 de angajai ai unei firme, extras aleator
simplu, s-au obinut urmtoarele rezultate privind vechimea n munc (luni):
x 62 luni, s ' 4 luni . S se estimeze prin interval de ncredere vechimea medie la nivelul
tuturor angajailor firmei din care a fost extras eantionul, considernd un risc de 0,05.

Rezolvare
ntruct nu se cunoate variana populaiei, n estimarea prin IC a mediei populaiei se
s
folosete statistica t Student. IC este definit de: x t / 2,n1 .
n
Din Tabelul repartiiei Student se citete valoarea t0,025;28-1=2,093.

t 0.025

27 2.052

nlocuind cu valorile date, se obine:


4
62 2,052 62 1,551 sau 60,449; 63,551 luni .
28

Interpretare: Se poate garanta cu o probabilitate de 0,95 sau 95% c vechimea medie a


ntregii populaii de angajai ( )este acoperit de intervalul: 60,449; 63,151 luni.

b. La nivelul unui eantion format din 9 angajai, extras aleator simplu, s-au obinut
urmtoarele rezultate privind vechimea n munc (luni): x 62 luni, s ' 4 luni . S se
estimeze prin interval de ncredere vechimea medie a ntregii populaii din care a fost extras
eantionul, considernd un risc de 0,05.

Rezolvare
s'
IC este definit de: x t / 2 .
n

114
Din Tabelul Student se citete valoarea t0,025;9-1=2,306.

t 0.025

8 2,306

nlocuind cu valorile date, se obine:


4
62 2,306 62 3,074 sau 58,926 ; 65,074 luni.
9

Interpretare: Se poate garanta cu o probabilitate de 0,95 c vechimea medie a ntregii


populaii de angajai ( ) este acoperit de intervalul: 58,926; 65,074 luni.

Observaie: Mrimea intervalului de ncredere este, n acest caz, mai mare fa de exemplul
anterior. Precizia estimrii s-a micorat datorit volumului mai redus al eantionului.

5.2. Estimarea proporiei unei populaii ()

Estimarea proporiei unei populaii se poate realiza punctual i prin interval de


ncredere.

5.2.1. Estimarea punctual a proporiei la nivelul unei populaii

Estimarea punctual a proporiei la nivelul unei populaii presupune aflarea unei valori
posibile a estimatorului parametrului . Proporia unei anumite categorii calculat la nivelul
eantionului (p) este o estimaie punctual a proporiei acestei categorii la nivelul populaiei.

Exemplul 5.2. Estimarea punctual a unei proporii


n urma realizrii unui sondaj in randul studenilor unei serii s-a extras un eantion de
80 de studeni, pentru care s-a observat c 68 dintre acetia au fost declarai admii la un
examen. S se estimeze punctual, la nivelul ntregii serii, proporia studenilor care au fost
declarai admii la examen.

115
Rezolvare
Proporia studenilor care au fost declarai admii la examen, calculat la nivelul
ni 68
eantionului, este: p 0,85 sau 85%.
n 80

Interpretare: Proporia studenilor admii la examen la nivelul ntregii serii poate fi estimat
punctual prin proporia calculat la nivelul eantionului, deci =0,85 sau =85%.

5.2.2. Estimarea prin interval de ncredere a proporiei unei populaii

(1 )
Variabila proporia de selecie ( ) se caracterizeaz prin: ~ N ( , ).
n
Construirea intervalului de ncredere pentru proporia calculat la nivelul unei
populaii se realizeaz n mod similar mediei unei populaii.
Intervalul de ncredere pentru proporia la nivelul unei populaii este:
p (1 p)
p t / 2,n1 , atunci cnd nu se cunoate .
n

Exemplul 5.3. Estimarea proporiei prin interval de ncredere


n urma realizrii unui sondaj n rndul studenilor unei serii, s-a extras un eantion de
80 de studeni, pentru care s-a observat c 68 dintre acetia au fost declarai admii la un
examen. S se estimeze prin interval de ncredere proporia studenilor care sunt admii la
nivelul ntregii serii, considernd un risc de 0,05.

Rezolvare
Proporia studenilor care sunt admii la examen, la nivelul eantionului, este:
ni 68
p 0,85 sau 85%.
n 80
Limitele intervalului de ncredere se calculeaz astfel:
p (1 p)
p t / 2,n1 , unde:
n
p 0,85 ;

116
t / 2,n1 este valoarea statisticii t Student care se citete din Tabelul Student pentru un risc

0,05 i n-1 grade de libertate. Din Tabelul Student se citete: t0,025;80-1=1,96.

t 0.025

1,96

nlocuind n relaia de mai sus, se obine:


0,85 (1 0,85)
0,85 1,96 0,85 0,078 sau 0,772; 0,928 .
80

Interpretare: Se poate garanta cu o probabilitate de 0,95 sau 95% c proporia studenilor


admii la examen, la nivelul ntregii serii, este cuprins ntre 77,2% i 92,8%.

117
US6. TESTAREA IPOTEZELOR STATISTICE

Cuprins

6.1. Testarea ipotezelor cu privire la valoarea unui parametru


6.2. Testarea ipotezelor cu privire la dou valori ale unui parametru
6.3. Estimare versus testare

Rezumat

n acest capitol este prezentat demersul testrii statistice. Testarea statistic are ca
obiectiv testarea diferenei dintre un parametru al unei populaii (medie, proporie), care este
estimat pe baza datelor nregistrate la nivelul unui eantion, i un alt parametru al unei
populaii, o valoare cunoscut, de referin. n procesul de testare statistic se formuleaz
dou ipoteze statistice: ipoteza nul i ipoteza alternativ. n condiiile unui risc asumat, se
adopt decizia de a respinge sau a accepta una dintre cele dou ipoteze.

Bibliografie
1. Andrei, T., Statistic i econometrie, Ed. Economic, 2003
2. Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002
3. James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and
Economics, Pearson, Education New Jersey, 2008
4. Weiss, N, A., Elementary Statistics, Pearson, 2012
5. Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.

118
US6. TESTAREA IPOTEZELOR STATISTICE

Testarea ipotezelor statistice este un procedeu prin care se testeaz semnificaia


egalitii dintre valoarea unui parametru i o valoare de referin sau dintre dou valori ale
aceluiai parametru (dou medii ale populaiei sau dou proporii de la nivelul unor populaii).

6.1. Testarea ipotezelor cu privire la valoarea unui parametru

Testarea ipotezelor cu privire la valoarea unui parametru are ca obiectiv testarea


egalitii dintre media unei populaii sau proporia la nivelul unei populaii fa de valori de
referin, cunoscute.

6.1.1 Demersul testrii

Verificarea ipotezelor care se formuleaz cu privire la populaie. Inferena statistic


presupune ca distribuia populaiei din care a fost extras eantionul s urmeze o lege
normal sau volumul eantionului s fie suficient de ridicat (n>30).
Formularea ipotezelor statistice
O ipotez este o presupunere cu privire la valoarea unui parametru: media unei
populaii, variana unei populaii sau proporia unei anumite categorii dintr-o populaie.
Ipotezele care se formuleaz n statistic sunt:
- ipoteza nul este ipoteza prin care se presupune c nu exist diferene fa de o
valoare teoretic sau o valoare de referin considerat. Ipoteza nul are un rol important n
determinarea distribuiei de selecie care va fi folosit n procesul testrii. Se noteaz cu H 0.
- ipoteza alternativ este contrar ipotezei nule, deci este ipoteza prin care se
presupune c exist diferene fa de o valoare teoretic sau o valoare de referin considerat.
Se noteaz cu H1.
Alegerea pragului de semnificaie a testului
n testarea ipotezelor statistice, pragul de semnificaie a testului, notat cu ,
reprezint probabilitatea (de regul, egal cu 0.05) bazat pe ipoteza c H0 este adevrat.
Alegerea i calcularea statisticii test
Testul statistic se alege n funcie de legea urmat de distribuia de selecie a statisticii
considerate. De exemplu, n paragraful anterior am artat c distribuia de selecie a mediei de

119
selecie urmeaz o lege normal. n testarea semnificaiei mediei unei populaii, se folosete
testul Z sau testul t Student.
Definirea regulii de decizie
Pentru definirea regulii de decizie, valoarea calculat a statisticii test, pe baza datelor
observate la nivelul unui eantion, se compar cu valoarea teoretic, numit i valoare critic,
care se alege din tabelele teoretice. Decizia corect poate fi adoptat i prin compararea
probabilitii asociate statisticii test calculate (Prob.) cu riscul . n mod sintetic, regula de
decizie, n cazul folosirii repartiiei Z, poate fi prezentat astfel:

Se respinge ipoteza H0 Nu se respinge ipoteza H0


Folosind probabilitatea dac Pr ob. dac Pr ob.
asociat statisticii test
Folosind valoarea calculat a dac z calculat z / 2 sau dac z calculat z / 2 sau
statisticii test
z calculat z / 2 z calculat z / 2

Reprezentarea grafic a regiunilor de respingere i de acceptare a ipotezei H0 este


realizat n figura de mai jos:

1-


-z z Z

H 1 H 0 H 1

Figura 6.1. Regiunile de respingere i de acceptare a ipotezei H0

6.1.2. Testarea semnificaiei mediei unei populaii

a. Ipoteze statistice

n testarea semnificaiei mediei unei populaii se formuleaz dou ipoteze statistice,


ipoteza nul i ipoteza alternativ.

120
Ipoteza nul este ipoteza prin care se presupune c nu exist diferene ntre media unei
populaii, , estimat prin media calculat la nivelul eantion, i o valoare de referin

considerat, 0 .

Exemplul 6.1. Formularea ipotezei H0


ntr-un studiu statistic cu privire la nivelul ratei omajului n anumite ri ale Uniunii
Europene, n procesul testrii statistice se poate urmri dac exist diferene semnificative
ntre nivelul mediu al ratei omajului pentru ansamblul rilor din UE ( ) i nivelul mediu al

ratei omajului din SUA ( 0 ). Ipoteza nul care se formuleaz este: H 0 : 0 .

Ipoteza alternativ este contrar ipotezei nule, deci este ipoteza prin care se presupune
c exist diferene ntre valorile comparate.

Exemplul 6.2. Formularea ipotezei H1


Pentru exemplul 6.1, ipoteza alternativ se formuleaz astfel: H 1 : 0 (test

bilateral), H 1 : 0 (test unilateral la dreapta) sau H 1 : 0 (test unilateral la stnga).

b. Alegerea pragului de semnificaie a testului

n testarea ipotezelor statistice, pragul de semnificaie a testului, notat cu , este, de


regul, egal cu 0.05.
De exemplu, dac pragul de semnificaie a unui test este de 0,05, atunci ipoteza
H 0 : 0 va fi respins dac media eantionului extras din populaie este att de

ndeprtat, la stnga sau la dreapta, de valoarea fix 0 (se ncadreaz printre cele 5% cele
mai puin probabile medii ale eantioanelor posibil de extras din populaie).
Pragul de semnificaie a testului, , arat probabilitatea de a respinge ipoteza H0
atunci cnd aceasta este adevrat. Eroarea comis n respingerea ipotezei H0, atunci cnd
aceasta este adevrat, poart denumirea de eroare de tip I.
Eroarea de tip II se produce n momentul acceptrii ipotezei H0, atunci cnd aceasta
este fals.

121
c. Alegerea i calculul statisticii test

Atunci cnd se cunoate variana populaiei ( 2 ) , n testarea semnificaiei mediei unei


distribuii se folosete statistica Z. Pe baza datelor observate la nivelul unui eantion de volum
n, se calculeaz statistica test Z astfel:
x 0 x 0
z calculat .
/ n
Atunci cnd nu se cunoate variana populaiei, n testarea semnificaiei mediei unei
distribuii se folosete statistica t Student. Pe baza datelor observate la nivelul unui eantion
de volum n, se calculeaz statistica test t Student astfel:

x 0 x 0
( xi x ) 2
i
t calculat , unde s' .
s s' / n n 1

d. Definirea regulii de decizie

Considernd un test bilateral, regula de decizie poate fi definit astfel:

Se respinge ipoteza H0 Nu se respinge ipoteza H0


Folosind probabilitatea dac Pr ob. dac Pr ob.
asociat statisticii test
Folosind valoarea calculat a dac z calculat z / 2 sau dac z calculat z / 2 sau
statisticii test
z calculat z / 2 z calculat z / 2

Reprezentarea regiunii de acceptare i de respingere a ipotezei H 0 este realizat n


figura de mai jos:

1-


-z z Z

H 1 H 0 H 1

Figura 6.2. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test bilateral

122
Regula de decizie pentru un test unilateral poate fi definit astfel:

Se respinge ipoteza H0 Se accept ipoteza H0


Folosind probabilitatea dac Pr ob. dac Pr ob.
asociat statisticii test
Test unilateral la dreapta dac z calculat z dac z calculat z
H 1 : 0
Test unilateral la stnga dac z calculat z dac z calculat z
H 1 : 0

Reprezentarea regiunilor de respingere i de acceptare a ipotezei H0 pentru un test


unilateral este realizat n figura de mai jos:

Figura 6.3. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test unilateral la
dreapta

123
Figura 6.4. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test unilateral la
stnga

Exemplul 6.3. Citirea valorilor critice i definirea regiunilor critice


n cazul unui test bilateral, considernd un prag de semnificaie 0,05 , valoarea
critic a statisticii test Z este z=1,96. Regiunea de respingere a ipotezei Ho este definit de:
z calculat 1,96 , respectiv z calculat 1,96.

n cazul unui test unilateral la dreapta, pentru care ipoteza H 1 : 0 , considernd

un prag de semnificaie 0,05 , valoarea critic a statisticii test Z este z=1,64. Regiunea de
respingere a ipotezei Ho este, astfel, definit de: z calculat 1,64 .

n cazul unui test unilateral la stnga, pentru care ipoteza H 1 : 0 , considernd

un prag de semnificaie 0,05 , valoarea critic a statisticii test Z este z 1,64 . Regiunea

de respingere a ipotezei Ho este definit de: z calculat 1,64 .

Exemplul 6.4. Testarea diferenei dintre o medie i o valoare fix, cazul unui test bilateral
La nivelul unui eantion format din 100 de persoane, se nregistreaz salariul lunar
obinut i se obine x 14 sute lei. tiind c 4 sute lei , se cere s se testeze dac exist
diferene semnificative ntre salariul mediu al ntregii populaii din care a fost extras
eantionul i salariul mediu pe economie, de 13 sute lei. Se consider un risc 0,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : 13 sute lei (nu exist diferene semnificative ntre salariul mediu al ntregii populaii

din care a fost extras eantionul i salariul mediu pe economie)


H 1 : 13 sute lei (exist diferene semnificative ntre salariul mediu al ntregii populaii
din care a fost extras eantionul i salariul mediu pe economie)

Alegerea pragului de semnificaie a testului


0,05.

Statistica test

124
Pentru testarea semnificaiei mediei unei populaii, atunci cnd se cunoate , se folosete

x 0
statistica test Z: z .
/ n

Calculul statisticii test


14 13
Pe baza datelor obinute la nivelul eantionului, se obine: z cakulat 2 ,5 .
4 / 100

Regula de decizie
Folosind probabilitatea asociat statisticii test calculate:
dac Pr ob. , atunci se respinge ipoteza H0;
dac Pr ob. , atunci se accept ipoteza H0.

Folosind statistica test:


dac z calculat z sau z calculat z , atunci se respinge ipoteza H0;

dac z calculat z sau z calculat z , atunci se accept ipoteza H0.

Valoarea teoretic a statisticii test


Se citete din tabelul Z pentru un risc 0,05 . Aceast valoare este: z / 2 1,96.

Probabilitatea asociat statisticii test calculate


Valoarea probabilitii asociate statisticii test calculate, z cakulat 2 ,5 , se citete din tabelul Z,

astfel: P( Z 2,5 ) 0 ,5 0 ,494 0 ,006 . Aceast valoare este furnizat de programele


specializate de statistic i poart denumirea de Prob. sau p-value (programul E-VIEWS) sau
Sig. (Significance Level) (programul SPSS).

125
Figura 6.5. Regiunea de respingere i de acceptare a ipotezei H0

Interpretare: z calculat 2,5 z0 ,025 1,96 sau (Pr ob. 2 0 ,006 0 ,012 ) 0 ,05 , se

respinge ipoteza Ho. Se poate garanta cu o probabilitate de 0,95 c exist diferene


semnificative ntre salariul mediu al ntregii populaii din care a fost extras eantionul
observat ( ) i salariul mediu pe economie ( 0 ) .

Exemplul 6.5. Testarea diferenei dintre o medie i o valoare fix, cazul unui test unilateral
La nivelul unui eantion format din 100 de persoane, se nregistreaz salariul lunar
obinut i se obine x 14 sute lei. tiind c 4 sute lei , se cere s se testeze dac salariul
mediu al ntregii populaii din care a fost extras eantionul este mai mare dect salariul mediu
pe economie, de 13 sute lei. Se consider un risc 0,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : 13 sute lei

H 1 : 13 sute lei

Alegerea pragului de semnificaie a testului


0,05.

Statistica test

126
Pentru testarea semnificaiei mediei unei populaii, atunci cnd se cunoate , se folosete

x 0
statistica test Z: z .
/ n

Calculul statisticii test


14 13
Pe baza datelor obinute la nivelul eantionului, se obine: z cakulat 2 ,5 .
4 / 100

Regula de decizie
Folosind probabilitatea asociat statisticii test calculate:
dac Pr ob. , atunci se respinge ipoteza H0;
dac Pr ob. , atunci se accept ipoteza H0.

Folosind statistica test:


dac z calculat z , atunci se respinge ipoteza H0;

dac z calculat z , atunci se accept ipoteza H0.

Valoarea teoretic a statisticii test


Se citete din tabelul Z pentru un risc 0,05 . Aceast valoare este: z / 2 1,64 .

Probabilitatea asociat statisticii test calculate


Valoarea probabilitii asociate statisticii test calculate, z cakulat 2 ,5 , se citete din tabelul Z,

astfel: Pr ob.( Z 2,5 ) 0 ,5 0 ,494 0 ,006 .

127
Figura 6.6. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test unilateral
la dreapta

Interpretare: zcalculat 2,5 z0,025 1,64 sau Pr ob. 0,006 0,05 , se respinge ipoteza

Ho. Se poate garanta cu o probabilitate de 0,95 c salariul mediu al ntregii populaii din care
a fost extras eantionul observat ( ) este mai mare dect salariul mediu pe economie ( 0 ) .

Exemplul 6.6. Testarea diferenei dintre o medie i o valoare fix, cazul n care nu se
cunoate variana populaiei
Pentru un eantion format din 25 de persoane, se nregistreaz salariul lunar obinut i se
obin urmtoarele rezultate: x 15 sute lei, s' 2 sute lei. Se cere s se testeze dac exist
diferene semnificative ntre salariul mediu al ntregii populaii din care a fost extras
eantionul i salariul mediu de economie, de 13 sute lei. Se consider un risc 0,05.

Rezolvare
Formularea ipotezelor statistice
H 0 : 13

H 1 : 13

Alegerea pragului de semnificaie a testului


0,05.

Statistica test
Pentru testarea semnificaiei mediei unei populaii se folosete statistica test t Student,
x 0
t .
s' / n

Calculul statisticii test


15 13
Pe baza datelor obinute la nivelul eantionului, se obine: t cakulat 5.
2 / 25

Regula de decizie
dac t calculat t / 2 sau t calculat t / 2 , atunci se respinge ipoteza H0;

dac t calculat t / 2 sau t calculat t / 2 , atunci se accept ipoteza H0.


128
Valoarea teoretic a statisticii test
Se citete din tabelul t Student pentru un risc 0,05 i n-1 grade de libertate. Aceast
valoare este: t / 2 ;n 1 t 0 ,025 ;24 2 ,064 .

t 0.025

24 2,064

Interpretare: Regiunea de acceptare i regiunea de respingere a ipotezei Ho sunt prezentate n


figura de mai jos:

0,95

0,025 0,025
tcalc =5
t
-2,064 2,064

H 1 H 0 H
1

Figura 6.7. Regiunea de respingere i de acceptare a ipotezei H0

t calculat 5 t0 ,025;24 2,064 , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de

0,95 c exist diferene semnificative ntre salariul mediu al ntregii populaii din care a fost
extras eantionul observat ( ) i salariul mediu pe economie ( 0 ) .

6.1.3 Testarea semnificaiei proporiei unei populaii

Demersul testrii semnificaiei unei proporii este similar demersului prezentat n


cazul mediei unei populaii.

Ipoteze statistice
Ipotezele care se formuleaz n testarea semnificaiei unei proporii sunt:

129
H0 : 0

H 1 : 0 (test bilateral)

Alegerea pragului de semnificaie a testului


0,05 .

Alegerea i calculul statisticii test


Atunci cnd nu se cunoate variana populaiei, n testarea semnificaiei proporiei unei
distribuii se folosete statistica t Student. Pe baza datelor observate la nivelul unui eantion
de volum n, se calculeaz statistica test t astfel:
p 0 p 0
t calculat sau, n cazul folosirii procentelor,
s p(1 p) / n

p 0 p 0
tcalculat .
s p(100 p) / n

Definirea regulii de decizie


Adoptarea decizie corecte presupune compararea valorii calculate a statisticii test cu valoarea
teoretic. De exemplu, considernd un test bilateral, atunci cnd nu se cunoate variana
populaiei, regula de decizie poate fi definit astfel:

Se respinge ipoteza H0 Se accept ipoteza H0


Folosind probabilitatea dac Pr ob. dac Pr ob.
asociat statisticii test
Folosind valoarea calculat a dac t calculat t / 2 sau dac t calculat t / 2 sau
statisticii test
t calculat t / 2 t calculat t / 2

Exemplul 6.7. Testarea diferenei dintre o proporie i o valoare fix


La nivelul unui eantion de volum n=25 de persoane, se observ c ponderea
persoanelor care voteaz pentru candidatul A este de 49%. Se cere s se testeze dac exist
diferene semnificative ntre proporia persoanelor care voteaz pentru candidatul A la nivelul
ntregii populaii i proporia persoanelor care au votat pentru acest candidat la alegerile
anterioare, de 51%. Se consider un risc 0,05.

Rezolvare
130
Formularea ipotezelor statistice
H 0 : 51 %

H 1 : 51%

Alegerea pragului de semnificaie a testului


0,05.

Statistica test
Pentru testarea semnificaiei mediei unei populaii se folosete statistica test t Student,
p 0
t .
p (100 p) / n

Calculul statisticii test


Pe baza datelor obinute la nivelul eantionului, se obine:
49 51
t calculat 0 ,2 .
49 ( 100 49 ) / 25

Regula de decizie
dac t calculat t / 2 sau t calculat t / 2 , atunci se respinge ipoteza H0;

dac t calculat t / 2 sau t calculat t / 2 , atunci se accept ipoteza H0.

Valoarea teoretic a statisticii test


Se citete din tabelul t Student pentru un risc 0,05 i n-1 grade de libertate. Aceast
valoare este: t / 2 ;n 1 t0 ,025 ;24 2 ,064 .

Interpretare: t calculat 0 ,2 t0 ,025;24 2,064 , se accept ipoteza Ho. Se poate garanta cu o

probabilitate de 0,95 c nu exist diferene semnificative ntre proporia persoanelor care


voteaz pentru candidatul A la nivelul ntregii populaii, , i proporia persoanelor care au
votat pentru acest candidat la alegerile anterioare, 0.

6.2. Testarea ipotezelor cu privire la dou valori ale unui parametru

131
Testarea ipotezelor cu privire la dou valori ale aceluiai parametru poate viza dou
medii ale unor populaii, 1 i 2 , sau dou proporii, 1 i 2 .

6.2.1 Testarea diferenei dintre dou medii

n cazul eantioanelor independente, statistica test folosit n testarea ipotezelor


statistice este statistica Z sau t.

Ipoteze statistice
H 0 : 1 2 0

H 1 : 1 2 0

Alegerea pragului de semnificaie a testului

Alegerea i calculul statisticii test


Atunci cnd 12 22 i nu se cunosc varianele populaiilor, statistica test se calculeaz
astfel:
x1 x 2
t calculat .
s12 s 22

n1 n2

Atunci cnd 12 22 i nu se cunosc varianele populaiilor, statistica test se calculeaz


astfel:
x1 x 2
t calculat , unde:
1 1
s p
n1 n2

s12 ( n1 1 ) s 22 ( n2 1 )
sp .
n1 n2 2

Definirea regulii de decizie


Regula de decizie se definete n mod similar testrii semnificaiei unui parametru al unei
populaii. Valoarea teoretic a statisticii test se alege ns pentru (n1+n2-2) grade de libertate.

132
Exemplul 6.8. Testarea diferenelor dintre dou medii
Pentru dou eantioane extrase aleator simplu de volum n1=n2=625 persoane s-a
nregistrat vrsta i s-au obinut urmtoarele rezultate: x1 35 ani, x2 32 ani ;
s1 2 ani, s2 4 ani . S se testeze ipoteza potrivit creia ntre vrstele medii ale celor dou
populaii din care au fost extrase eantioanele observate exist diferene semnificative. Se
consider un risc de 0,05.

133
Rezolvare
Ipoteze statistice:
H0: 1 2 (nu exist diferene semnificative ntre vrstele medii ale celor dou populaii din
care au fost extrase eantioanele)
H1: 1 2 (exist diferene semnificative ntre vrstele medii ale celor dou populaii din
care au fost extrase eantioanele)

Alegerea pragului de semnificaie a testului


0,05.

Statistica test
Cnd nu se cunosc varianele populaiilor, pentru testarea ipotezelor statistice se folosete
statistica t, calculat dup relaia:
x1 x 2
t
s12 s 22

n1 n 2

Regula de decizie
dac t calc t / 2 , se respinge ipoteza H0;

dac t calc t / 2 , se accept ipoteza H0.

Regiunea de acceptare i regiunea de respingere a ipotezei Ho sunt prezentate n figura de mai


jos:

1-


-t t t

H 1 H 0 H 1

Figura 6.8. Regiunea de respingere i de acceptare a ipotezei H0

Calculul statisticii test


Statistica test este:
134
35 32
t 16 ,7
2 2
2 4
625

Valoarea teoretic a statisticii test


Valoarea teoretic a statisticii t se citete din Tabelul Student pentru un risc =0,05 i n1+n2-2
grade de libertate: t /2=1,96.

Interpretare: tcalc 16 ,7 t0 ,025 1,96 , se respinge ipoteza H0. Se poate garanta cu o

probabilitate de 0,95 c exist diferene semnificative ntre vrstele medii ale populaiilor din
care au fost extrase eantioanele observate.

Exemplul 6.9. Testarea diferenelor dintre dou medii


Pentru dou eantioane, extrase aleator simplu, formate din 7 persoane de sex
masculin, iar al doilea din 9 persoane de sex feminin, se nregistreaz salariul lunar obinut i
se obin urmtoarele rezultate: x M 24 sute lei , x F 25 sute lei ; s M 3 , s F 2 . S se

testeze ipoteza potrivit creia ntre salariul mediu al persoanelor de sex masculin i salariul
mediu al persoanelor de sex feminin exist diferene semnificative, la nivelul populaiei din
care au fost extrase eantioanele observate. Se consider un risc de 0,05.

Rezolvare
Ipoteze statistice
H0: M F

H1: M F

Alegerea pragului de semnificaie a testului


0,05.

Statistica test
Cnd nu se cunosc varianele populaiilor, pentru testarea ipotezelor statistice se folosete
statistica t, calculat dup relaia:
xM xF
t
sM2 sF2

n1 n2

135
Regula de decizie
dac t calc t / 2 , se respinge ipoteza H0;

dac t calc t / 2 , se accept ipoteza H0.

Regiunea de acceptare i regiunea de respingere a ipotezei Ho sunt prezentate n figura


de mai jos:

1-


-t t t

H 1 H 0 H 1

Figura 6.9. Regiunea de respingere i de acceptare a ipotezei H0

Calculul statisticii test


Statistica test este:
24 25
t 0 ,76
2 2
3 2

7 9

Valoarea teoretic a statisticii test


Valoarea teoretic a statisticii t se citete din Tabelul Student pentru un risc =0,05 i n1+n2-2
grade de libertate: t /2; 7+9-2=2,145.

Interpretare: tcalc 0 ,76 t0 ,025 2,145, se accept ipoteza H0. Se poate garanta cu o

probabilitate de 0,95 c nu exist diferene semnificative ntre salariul mediu al persoanelor de


sex masculin i salariul mediu al persoanelor de sex feminin, la nivelul populaiilor din care
au fost extrase eantioanele observate.

6.2.2 Testarea diferenei dintre dou proporii

Ipoteze statistice
H 0 : 1 2 0

H1 : 1 2 0
136
Alegerea pragului de semnificaie a testului

Alegerea i calculul statisticii test


Statistica test se calculeaz astfel:
p1 p2
tcalculat .
p1 (1 p1 ) p2 (1 p2 )

n1 n2

Regula de decizie
dac t calc t / 2; n1 n2 2 , se respinge ipoteza H0;

dac t calc t / 2;n n , se accept ipoteza H0.


1 2 2

Exemplul 6.10. Testarea diferenelor dintre dou proporii


Pentru dou eantioane extrase aleator simplu de volum n1=n2=625 persoane s-a
nregistrat proporia persoanelor care au votat pentru candidatul A n anul 2016 i n anul
2012 i s-au obinut urmtoarele rezultate: p1 51%,; p2 49% . S se testeze ipoteza
potrivit creia ntre proporia persoanelor care au votat pentru candidatul A n cele dou
momente, la nivelul populaiilor, exist diferene semnificative. Se consider un risc de 0,05.

Rezolvare
Ipoteze statistice:
H0: 1 2 (nu exist diferene semnificative ntre proporia persoanelor care au votat pentru
candidatul A n anul 2016 i anul 2012)
H1: 1 2 (exist diferene semnificative ntre proporia persoanelor care au votat pentru
candidatul A n anul 2016 i anul 2012)

Alegerea pragului de semnificaie a testului


0,05.

Statistica test
Statistica t se calculeaz dup relaia:

137
p1 p2
tcalculat
p1 (100 p1 ) p2 (100 p2 )

n1 n2

Regula de decizie
dac t calc t / 2; n1 n2 2 , se respinge ipoteza H0;

dac t calc t / 2;n n , se accept ipoteza H0.


1 2 2

Calculul statisticii test


Pe baza datelor nregistrate la nivelul eantioanelor, se calculeaz statistica test astfel:
51 49
tcalculat 0,71 .
51 (100 51) 49 (100 49)
625

Valoarea teoretic a statisticii test


Valoarea teoretic a statisticii t se citete din Tabelul Student pentru un risc =0,05 i n1+n2-2
grade de libertate: t /2=1,96.

Interpretare: tcalc 0 ,71 t0 ,025 1,96 , se accept ipoteza H0. Se poate garanta cu o

probabilitate de 0,95 c nu exist diferene semnificative ntre proporia persoanelor care au


votat pentru candidatul A n anul 2016 i n anul 2012, la nivelul populaiilor din care au fost
extrase eantioanele observate.

6.3. Estimare versus testare

Estimarea prin interval de ncredere presupune construirea unui interval pentru valoarea
unui parametru, plecnd de la rezultatele obinute prin prelucrarea datelor la nivelul unui
eantion extras din populaie.
Testarea ipotezelor statistice presupune un demers invers: se formuleaz o ipotez
asupra valorii unui parametru i se verific dac aceast ipotez este sau nu contrazis de
observaiile de la nivelul unui eantion extras din populaie.
De exemplu, s presupunem c n urma prelucrrii datelor la nivelul unui eantion, se
obin limitele intervalului de ncredere pentru media unei populaii definite de 14; 18 . Dac

138
n procesul testrii statistice, formulm ipotezele H 0 : 10; H 1 : 10 , atunci putem

observa c se respinge ipoteza H0, deoarece media populaiei, , nu poate fi egal cu 10.

139

S-ar putea să vă placă și