Documente Academic
Documente Profesional
Documente Cultură
STATISTIC INFERENIAL
Cuprins
Rezumat
n acest capitol sunt prezentate cele mai importante noiuni folosite n inferena
statistic: populaie statistic i eantion, parametri i estimaii, distribuii de selecie.
Fundamentele inferenei statistice sunt estimarea i testarea statistic. Caracterizarea unei
populaii n mod indirect, prin extragerea unui eantion din aceasta, presupune prelucrarea
datelor la nivelul eantionului extras, respectiv calculul unor indicatori statistici (medie,
varian, proporie), care se numesc estimaii. Aceste mrimi se folosesc pentru a estima
parametrii unei populaii (media populaiei, variana populaiei, proporia unei categorii la
nivelul unei populaii), care nu pot fi cunoscui n mod direct.
Bibliografie
Statistica inferenial are ca obiectiv cunoaterea unei populaii n mod indirect, prin
prelucrarea datelor la nivelul unui eantion extras aleatoriu din aceasta. Inferena statistic
presupune estimarea parametrilor unei populaii i testarea ipotezelor statistice.
Parametrii reprezint mrimi reale dar necunoscute prin care poate fi caracterizat o
populaie. De exemplu, o populaie poate fi caracterizat folosind un indicator al tendinei
centrale, cum ar fi media populaiei ( ) i un indicator al dispersiei, cum ar fi abaterea medie
ptratic ( ).
Aceste mrimi sunt estimate prin prelucrarea datelor nregistrate la nivelul unui
eantion, proces n urma cruia se obin estimaii ale parametrilor populaiei. De exemplu,
prin nregistrarea valorilor unei variabile la nivelul unui eantion, pot fi calculate media
eantionului ( x ) i abaterea medie ptratic ( s ).
Notaiile folosite pentru definirea parametrilor i estimaiilor sunt prezentate n tabelul
de mai jos.
93
Estimaii Parametri
(eantion) (populaie)
Media x
Variana s2 2
Abaterea standard s
Proporia p
Prin experiment nelegem o aciune al crei rezultat nu poate fi anticipat exact, iar prin
eveniment nelegem unul dintre rezultatele posibile ale acestui experiment.
Probabilitatea este un numr real, cuprins ntre 0 i 1. Valoarea p=0 corespunde
imposibilitii realizrii evenimentului sau evenimentul imposibil, iar valoarea p=1
corespunde evenimentului cert sau sigur.
Observaie:
Probabilitatea este definit ca un caz limit al frecvenei, adic este frecvena relativ de
apariie a unui eveniment (fi).
94
Figura 4.1. Evenimentele posibile n cazul aruncrii simultane a dou zaruri
Rezolvare
a) Exist 4 cazuri cnd suma de pe feele celor dou zaruri este egal cu 4, i anume:
Avnd n vedere c n total sunt 36 de cazuri posibile, probabilitatea ca suma de pe feele celor
dou zaruri s fie egal cu 4 este egal cu 4/36=0.11 sau 11%.
b) Putem considera valorile posibile ale fiecruia dintre cele dou zaruri (1, 2, 3, 4, 5,
6) ca valori ale unor variabile numerice discrete. Variabila care rezult prin nsumarea
numerelor de pe cele dou zaruri este tot o variabil discret ale crei valori posibile sunt de la
2 la 12. Probabilitatea ca suma de pe feele celor dou zaruri s fie mai mic sau egal cu 8
este astfel frecvena absolut cumulat cresctor asociat acestei valori.
n tabelul de mai jos, prezentm frecvenele relative de apariie, simple i cumulate
cresctor, ale valorilor acestei variabile.
95
Tabelul 4.1. Distribuia evenimentelor dup suma de pe feele celor dou zaruri
Suma celor dou zaruri ni fi Fi
2 1 0.027778 0.027778
3 2 0.055556 0.083333
4 3 0.083333 0.166667
5 4 0.111111 0.277778
6 5 0.138889 0.416667
7 6 0.166667 0.583333
8 5 0.138889 0.722222
9 4 0.111111 0.833333
10 3 0.083333 0.916667
11 2 0.055556 0.972222
12 1 0.027778 1
Total 36 1 -
Probabilitatea ca, dup o aruncare a zarurilor, suma de pe feele celor dou zaruri s fie
mai mic sau egal cu 8 este 0,7222 sau 72,22%. Aceast probabilitate s-a obinut prin
cumularea tuturor probabilitilor asociate cazurilor n care suma este 2, 3, 4, 5, 6, 7 sau 8
(0,027778+0,055556+0,083333+0,111111+0,138889+0,166667+0,138889=0,722222).
Cunoscnd nivelul mediu i abaterea standard pentru o distribuie, putem afla care este
proporia unitilor care nregistreaz valori mai mari, de exemplu, dect ( x s ).
Pentru aceasta, se calculeaz o valoare standardizat Zi, cunoscut i sub denumirea de
xi x
scor Zi, dup relaia: z i .
s
Aceast mrime arat poziia unei uniti fa de nivelul mediu ( xi x ), folosind ca
unitate de msur abaterea standard.
De exemplu, pentru o distribuie caracterizat printr-o medie de x 100 i o abatere
140 100
standard de s 20 , putem afla valoarea zi pentru xi=140, astfel: zi 2 . Aceasta
20
arat c unitatea care nregistreaz valoarea xi=140 se gsete la o distan fa de nivelul
mediu egal cu de dou ori abaterea standard.
96
Odat calculat valoarea z, putem afla proporia unitilor care nregistreaz valori mai
mari dect 140, de exemplu. Aceste valori sunt calculate pentru o distribuie normal i sunt
tabelate ntr-un tabel cunoscut sub denumirea de tabelul Z (prezentat n Anexa 1).
Tabelul care prezint aceste rezultate este de forma:
0 0.01 0.05
0
0.1
0.2
1 0,341
1.1 0,375
Pe prima coloan sunt valorile lui z, prima cifr i prima zecimal, iar valorile din
urmtoarele coloane reprezint a doua zecimal a valorii z. Valorile din interiorul tabelul arat
proporia unitilor care nregistreaz valori cuprinse ntre nivelul mediu i scorul z
corespunztor.
97
Exemplul 4.3. Calculul probabilitilor pentru o variabil normal distribuit
a. Pentru o distribuie normal de medie, x , i abatere standard, s, s se afle proporia
unitilor care nregistreaz valori cuprinse n intervalele ( x s ), ( x 2 s ) i ( x 3 s ).
Rezolvare
Pentru a afla proporia unitilor care nregistreaz valori cuprinse n intervalul
( x s; x s ) , se calculeaz scorul Z, astfel:
x1 x x s x
z1 1
s s
x2 x x s x
z2 1 .
s s
Din tabelul Z se citete valoarea care corespunde valorii zi=1, i anume 0,341.
0 0.01 0.05
0
0.1
0.2
1 0,341
1.1 0,375
Aceast valoare, 0,341, reprezint aria suprafeei cuprinse ntre nivelul mediu i zi=1.
Proporia unitilor care nregistreaz valori cuprinse n intervalul ( x s; x s ) este:
2 0,341 0,682 sau 68,2%.
98
n mod similar, se obin valorile zi=2, pentru limitele intervalului ( x 2 s ).
0 0.05
0
0.1
0.2
2 0,477
99
Pentru intervalul ( x 3 s ), se obin valorile zi=3:
0 0.05
0
0.1
0.2
3 0,499
Interpretare: ntr-o distribuie normal, n intervalul ( x s ) sunt cuprinse 68,2% din uniti,
n intervalul ( x 2 s ) sunt cuprinse 95,4% din uniti i n intervalul ( x 3 s ) sunt cuprinse
99,8% din uniti.
b. Distribuia unor studeni dup nota obinut la un test urmeaz o lege normal i se
caracterizeaz prin urmtoarele rezultate: x 7 i s=2. Se cere s se afle proporia studenilor
care au luat note mai mici dect 6.
100
Rezolvare
Valoarea Zi care corespunde unei valori xi=6 se calculeaz astfel:
xi x 6 7
zi 0,5
s 2
Din tabelul Z se citete valoarea care corespunde unui nivel zi=0,5, egal cu 0,191.
0 0.01 0.05
0
0.1
0.2
0,5 0,191
Proporia studenilor care au luat note mai mici dect 6 este p=0,5-0,191=0,309 sau
30,9%.
Observaie: Aria suprafeei reprezentate n figura de mai sus este egal cu unu (dup cum am
precizat anterior, suma proporiilor este egal cu 1 sau 100%). Distribuia normal este o
distribuie simetric, deci proporia unitilor care au valori mai mari dect nivelul mediu este
de 0,5.
Rezolvare
Valorile lui Z corespunztoare lui x1=27 i x2=35 sunt:
101
x1 x 27 30
z1 0 ,75
s 4
x2 x 35 30
z2 1,25 .
s 4
Din tabelul Z se citesc valorile corespunztoare lui z1=-0,75 i z2=+1,25, astfel:
0 0.05
0
0.1
0.2
0,7 0,273
1,2 0,394
Rezolvare
Aceast problem poate fi prezentat grafic astfel:
102
Demersul urmat pentru rezolvarea acestei probleme este invers celui prezentat anterior:
se cunoate proporia (95%) i trebuie s aflm valoarea lui z care corespunde acestei
proporii.
Pentru a afla valoarea lui z, se calculeaz aria suprafeei cuprins ntre nivelul mediu i
0 ,95
z, care este egal cu 0 ,475 .
2
Pentru aceast valoare egal cu 0,475, se citete valoarea lui z corespunztoare, de 1,96.
0 0.06
0
0.1
0.2
1,9 0,475
Prin urmare, ntr-o distribuie normal 95% din uniti au valori cuprinse n intervalul
x 1,96 s; x 1,96 s . Riscul asumat pentru ca o unitate s nu fie n acest interval este de
5%.
103
Observaie: n estimarea parametrilor unei populaii, problematic prezentat n partea a doua,
obiectivul urmrit este de a afla limitele unui interval care acoper media unei populaii, n
95% din cazuri, de exemplu. n acest caz, riscul asumat ca media unei populaii s nu fie n
acest interval este de 5% (sau 100%-95%). Acest risc este simbolizat cu .
Atunci cnd nu se cunoate variana populaiei (2), caz frecvent ntlnit n practic,
aceasta poate fi nlocuit prin variana calculat la nivelul eantionului (s2).
x
Variabila Z devine astfel: . Aceast mrime este cunoscut sub denumirea
s/ n
de variabila t.
ntruct pentru fiecare eantion se pot nregistra valori diferite ale lui s, vom avea mai
multe distribuii t (cu variane diferite). Cum valorile variabilei t depind de volumul
eantionului, cu ct eantionul este de volum mai mare, cu att variana eantionului va estima
mai bine variana populaiei.
Precizia acestei estimri este luat n calcul n modelul matematic al distribuiei t
(cunoscut sub denumirea de t Student) prin numrul gradelor de libertate, egal cu (n-1), care
crete odat cu creterea volumului eantionului (n).
Ca i n cazul variabilei Z, variabila t are media egal cu zero. Variana sa ns nu mai
este egal cu 1, este ntotdeauna mai mare dect 1, dar se apropie de 1 atunci cnd numrul
gradelor de libertate este mare (eantionul este de volum mare). Se poate astfel considera c
atunci cnd n distribuia Student tinde spre o distribuie normal standard Z.
Ca i n cazul variabilei Z, valorile variabilei t sunt calculate i tabelate n tabelul
Student (prezentat n Anexa 2). Acest tabel este de forma :
104
Grade de libertate 0.10 0.05 0.025
1 3.078 6.314 12.706
2 1.886 2.920 4.303
30 1.310 1.697 2.042
>30 1.282 1.645 1.960
n prima coloan sunt prezentate gradele de libertate (n-1), iar pe prima linie sunt date
diferite valori ale riscului asumat (). Valorile t care sunt n interiorul tabelului sunt valorile t
Student pentru care probabilitatea P(t >t)= (aria suprafeei din dreapta valorii t este ).
Pentru aceeai probabilitate, valorile variabilei t difer n funcie de gradele de libertate
considerate.
De exemplu, pe prima coloan (0.10) se gsesc valorile t pentru care aria suprafeei
delimitate la dreapta de aceste valori este de 0.10 sau 10%.
Exemplul 4.4. Citirea valorii t din tabelul Student
a. Considernd 9 grade de libertate, s se afle valoarea t astfel nct P(t >t0.05)=0.05.
Rezolvare
n tabelul Student, n dreptul gradelor de libertate egale cu 9 se citete pentru coloana
0.05 valoarea t=1,833.
0.10 0.05
1
2
3
9 1,833
105
Rezolvare
n tabelul Student, n dreptul gradelor de libertate egale cu 9 se observ c valoarea
t=2,52 se gsete ntre valorile 2,262 i 2,821, care corespund probabilitilor 0,025 i 0,01.
Probabilitatea ca t s fie mai mare dect 2,52 este deci cuprins ntre 0,01 i 0,025:
0,01 P(t 2,52) 0,025 .
Rezolvare
n tabelul Student, pentru coloana 0.05 se citesc valorile prezentate mai jos, n dreptul
gradelor de libertate egale cu 9, 25, 30, 50:
106
Grade de libertate 0.10 0.05
1
2
9 1,833
25 1,708
30 1,697
>30 1,645
4!
Dac n=2, K C Nn C42 6 eantioane.
2!(4 2)!
Valorile variabilei pentru cele 2 uniti din fiecare din cele 6 eantioane sunt:
14 15 15 17
Eantionul 1: x1 14,5 Eantionul 4: x6 16
2 2
14 17 15 18
Eantionul 2: x2 15,5 Eantionul 5: x7 16,5
2 2
14 18 17 18
Eantionul 3: x3 16 Eantionul 6: x8 17,5
2 2
108
Tabelul 4.2. Distribuia variabilei media de selecie
xi Frecvena de pi
apariie
14,5 I 1/6=0,167
15,5 I 1/6=0,167
16 II 2/6=0,332
16,5 I 1/6=0,167
17,5 I 1/6=0,167
TOTAL - 1
n cazul nostru,
- media mediei de selecie este calculat ca o medie aritmetic folosind frecvene
relative:
M xi pi 14,5 0.167 15,5 0.167 ... 17,5 0.167 16 .
i
2 x
i
i
2
pi ( xi pi ) 2 0,83 0,911 .
i
109
Tabelul 4.3. Elemente de calcul ale mediei i varianei variabilei
xi pi xi pi xi2 xi2 pi
14,5 0,167 2,421 210,250 35,111
15,5 0,167 2,588 240,250 40,121
16 0,332 5,312 256,000 84,992
16,5 0,167 2,755 272,250 45,465
17,5 0,167 2,922 306,250 51,143
TOTAL 1,0 16 - 256,832
Dup cum se observ, distribuia mediei de selecie urmeaz o lege normal, iar mediile
eantioanelor se grupeaz n jurul mediei lor, adic a mediei populaiei.
110
2
Folosind notaiile prezentate, putem scrie: ~ N ( , 2 ) sau ~ N ( , ).
n
Cuprins
Rezumat
Bibliografie
111
US5. ESTIMAREA PARAMETRILOR UNEI POPULAII
Estimarea mediei unei populaii se poate realiza punctual i prin interval de ncredere
(I.C.).
DEFINIIE Estimarea punctual a mediei unei populaii presupune aflarea unei valori
posibile a estimatorului parametrului .
112
Intervalul de ncredere pentru media populaiei, cnd se cunoate variana populaiei,
este:
x z / 2 , unde:
n
x este media calculat la nivelul eantionului;
z / 2 este o valoare a statisticii Z care se citete din Tabelul Z pentru un risc .
( xi x ) 2
i
s' ;
n 1
n este volumul eantionului.
Observaii:
Precizia estimrii crete (mrimea intervalului de ncredere este mai mic), atunci cnd:
- volumul eantionului (n) crete (legea rdcinii ptrate: mrirea de 4 ori a
volumului eantionului, dubleaz precizia estimrii);
- probabilitatea cu care se garanteaz rezultatele este mai mic;
- variana eantionului este mic (valorile aberante afecteaz mrimea intervalului de
ncredere).
113
Exemplul 5.1. Estimarea mediei prin interval de ncredere
a. La nivelul unui eantion format din 28 de angajai ai unei firme, extras aleator
simplu, s-au obinut urmtoarele rezultate privind vechimea n munc (luni):
x 62 luni, s ' 4 luni . S se estimeze prin interval de ncredere vechimea medie la nivelul
tuturor angajailor firmei din care a fost extras eantionul, considernd un risc de 0,05.
Rezolvare
ntruct nu se cunoate variana populaiei, n estimarea prin IC a mediei populaiei se
s
folosete statistica t Student. IC este definit de: x t / 2,n1 .
n
Din Tabelul repartiiei Student se citete valoarea t0,025;28-1=2,093.
t 0.025
27 2.052
b. La nivelul unui eantion format din 9 angajai, extras aleator simplu, s-au obinut
urmtoarele rezultate privind vechimea n munc (luni): x 62 luni, s ' 4 luni . S se
estimeze prin interval de ncredere vechimea medie a ntregii populaii din care a fost extras
eantionul, considernd un risc de 0,05.
Rezolvare
s'
IC este definit de: x t / 2 .
n
114
Din Tabelul Student se citete valoarea t0,025;9-1=2,306.
t 0.025
8 2,306
Observaie: Mrimea intervalului de ncredere este, n acest caz, mai mare fa de exemplul
anterior. Precizia estimrii s-a micorat datorit volumului mai redus al eantionului.
Estimarea punctual a proporiei la nivelul unei populaii presupune aflarea unei valori
posibile a estimatorului parametrului . Proporia unei anumite categorii calculat la nivelul
eantionului (p) este o estimaie punctual a proporiei acestei categorii la nivelul populaiei.
115
Rezolvare
Proporia studenilor care au fost declarai admii la examen, calculat la nivelul
ni 68
eantionului, este: p 0,85 sau 85%.
n 80
Interpretare: Proporia studenilor admii la examen la nivelul ntregii serii poate fi estimat
punctual prin proporia calculat la nivelul eantionului, deci =0,85 sau =85%.
(1 )
Variabila proporia de selecie ( ) se caracterizeaz prin: ~ N ( , ).
n
Construirea intervalului de ncredere pentru proporia calculat la nivelul unei
populaii se realizeaz n mod similar mediei unei populaii.
Intervalul de ncredere pentru proporia la nivelul unei populaii este:
p (1 p)
p t / 2,n1 , atunci cnd nu se cunoate .
n
Rezolvare
Proporia studenilor care sunt admii la examen, la nivelul eantionului, este:
ni 68
p 0,85 sau 85%.
n 80
Limitele intervalului de ncredere se calculeaz astfel:
p (1 p)
p t / 2,n1 , unde:
n
p 0,85 ;
116
t / 2,n1 este valoarea statisticii t Student care se citete din Tabelul Student pentru un risc
t 0.025
1,96
117
US6. TESTAREA IPOTEZELOR STATISTICE
Cuprins
Rezumat
n acest capitol este prezentat demersul testrii statistice. Testarea statistic are ca
obiectiv testarea diferenei dintre un parametru al unei populaii (medie, proporie), care este
estimat pe baza datelor nregistrate la nivelul unui eantion, i un alt parametru al unei
populaii, o valoare cunoscut, de referin. n procesul de testare statistic se formuleaz
dou ipoteze statistice: ipoteza nul i ipoteza alternativ. n condiiile unui risc asumat, se
adopt decizia de a respinge sau a accepta una dintre cele dou ipoteze.
Bibliografie
1. Andrei, T., Statistic i econometrie, Ed. Economic, 2003
2. Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002
3. James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and
Economics, Pearson, Education New Jersey, 2008
4. Weiss, N, A., Elementary Statistics, Pearson, 2012
5. Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.
118
US6. TESTAREA IPOTEZELOR STATISTICE
119
selecie urmeaz o lege normal. n testarea semnificaiei mediei unei populaii, se folosete
testul Z sau testul t Student.
Definirea regulii de decizie
Pentru definirea regulii de decizie, valoarea calculat a statisticii test, pe baza datelor
observate la nivelul unui eantion, se compar cu valoarea teoretic, numit i valoare critic,
care se alege din tabelele teoretice. Decizia corect poate fi adoptat i prin compararea
probabilitii asociate statisticii test calculate (Prob.) cu riscul . n mod sintetic, regula de
decizie, n cazul folosirii repartiiei Z, poate fi prezentat astfel:
1-
-z z Z
H 1 H 0 H 1
a. Ipoteze statistice
120
Ipoteza nul este ipoteza prin care se presupune c nu exist diferene ntre media unei
populaii, , estimat prin media calculat la nivelul eantion, i o valoare de referin
considerat, 0 .
Ipoteza alternativ este contrar ipotezei nule, deci este ipoteza prin care se presupune
c exist diferene ntre valorile comparate.
ndeprtat, la stnga sau la dreapta, de valoarea fix 0 (se ncadreaz printre cele 5% cele
mai puin probabile medii ale eantioanelor posibil de extras din populaie).
Pragul de semnificaie a testului, , arat probabilitatea de a respinge ipoteza H0
atunci cnd aceasta este adevrat. Eroarea comis n respingerea ipotezei H0, atunci cnd
aceasta este adevrat, poart denumirea de eroare de tip I.
Eroarea de tip II se produce n momentul acceptrii ipotezei H0, atunci cnd aceasta
este fals.
121
c. Alegerea i calculul statisticii test
x 0 x 0
( xi x ) 2
i
t calculat , unde s' .
s s' / n n 1
1-
-z z Z
H 1 H 0 H 1
Figura 6.2. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test bilateral
122
Regula de decizie pentru un test unilateral poate fi definit astfel:
Figura 6.3. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test unilateral la
dreapta
123
Figura 6.4. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test unilateral la
stnga
un prag de semnificaie 0,05 , valoarea critic a statisticii test Z este z=1,64. Regiunea de
respingere a ipotezei Ho este, astfel, definit de: z calculat 1,64 .
un prag de semnificaie 0,05 , valoarea critic a statisticii test Z este z 1,64 . Regiunea
Exemplul 6.4. Testarea diferenei dintre o medie i o valoare fix, cazul unui test bilateral
La nivelul unui eantion format din 100 de persoane, se nregistreaz salariul lunar
obinut i se obine x 14 sute lei. tiind c 4 sute lei , se cere s se testeze dac exist
diferene semnificative ntre salariul mediu al ntregii populaii din care a fost extras
eantionul i salariul mediu pe economie, de 13 sute lei. Se consider un risc 0,05.
Rezolvare
Formularea ipotezelor statistice
H 0 : 13 sute lei (nu exist diferene semnificative ntre salariul mediu al ntregii populaii
Statistica test
124
Pentru testarea semnificaiei mediei unei populaii, atunci cnd se cunoate , se folosete
x 0
statistica test Z: z .
/ n
Regula de decizie
Folosind probabilitatea asociat statisticii test calculate:
dac Pr ob. , atunci se respinge ipoteza H0;
dac Pr ob. , atunci se accept ipoteza H0.
125
Figura 6.5. Regiunea de respingere i de acceptare a ipotezei H0
Interpretare: z calculat 2,5 z0 ,025 1,96 sau (Pr ob. 2 0 ,006 0 ,012 ) 0 ,05 , se
Exemplul 6.5. Testarea diferenei dintre o medie i o valoare fix, cazul unui test unilateral
La nivelul unui eantion format din 100 de persoane, se nregistreaz salariul lunar
obinut i se obine x 14 sute lei. tiind c 4 sute lei , se cere s se testeze dac salariul
mediu al ntregii populaii din care a fost extras eantionul este mai mare dect salariul mediu
pe economie, de 13 sute lei. Se consider un risc 0,05.
Rezolvare
Formularea ipotezelor statistice
H 0 : 13 sute lei
H 1 : 13 sute lei
Statistica test
126
Pentru testarea semnificaiei mediei unei populaii, atunci cnd se cunoate , se folosete
x 0
statistica test Z: z .
/ n
Regula de decizie
Folosind probabilitatea asociat statisticii test calculate:
dac Pr ob. , atunci se respinge ipoteza H0;
dac Pr ob. , atunci se accept ipoteza H0.
127
Figura 6.6. Regiunea de respingere i de acceptare a ipotezei H0 n cazul unui test unilateral
la dreapta
Interpretare: zcalculat 2,5 z0,025 1,64 sau Pr ob. 0,006 0,05 , se respinge ipoteza
Ho. Se poate garanta cu o probabilitate de 0,95 c salariul mediu al ntregii populaii din care
a fost extras eantionul observat ( ) este mai mare dect salariul mediu pe economie ( 0 ) .
Exemplul 6.6. Testarea diferenei dintre o medie i o valoare fix, cazul n care nu se
cunoate variana populaiei
Pentru un eantion format din 25 de persoane, se nregistreaz salariul lunar obinut i se
obin urmtoarele rezultate: x 15 sute lei, s' 2 sute lei. Se cere s se testeze dac exist
diferene semnificative ntre salariul mediu al ntregii populaii din care a fost extras
eantionul i salariul mediu de economie, de 13 sute lei. Se consider un risc 0,05.
Rezolvare
Formularea ipotezelor statistice
H 0 : 13
H 1 : 13
Statistica test
Pentru testarea semnificaiei mediei unei populaii se folosete statistica test t Student,
x 0
t .
s' / n
Regula de decizie
dac t calculat t / 2 sau t calculat t / 2 , atunci se respinge ipoteza H0;
t 0.025
24 2,064
0,95
0,025 0,025
tcalc =5
t
-2,064 2,064
H 1 H 0 H
1
0,95 c exist diferene semnificative ntre salariul mediu al ntregii populaii din care a fost
extras eantionul observat ( ) i salariul mediu pe economie ( 0 ) .
Ipoteze statistice
Ipotezele care se formuleaz n testarea semnificaiei unei proporii sunt:
129
H0 : 0
H 1 : 0 (test bilateral)
p 0 p 0
tcalculat .
s p(100 p) / n
Rezolvare
130
Formularea ipotezelor statistice
H 0 : 51 %
H 1 : 51%
Statistica test
Pentru testarea semnificaiei mediei unei populaii se folosete statistica test t Student,
p 0
t .
p (100 p) / n
Regula de decizie
dac t calculat t / 2 sau t calculat t / 2 , atunci se respinge ipoteza H0;
131
Testarea ipotezelor cu privire la dou valori ale aceluiai parametru poate viza dou
medii ale unor populaii, 1 i 2 , sau dou proporii, 1 i 2 .
Ipoteze statistice
H 0 : 1 2 0
H 1 : 1 2 0
s12 ( n1 1 ) s 22 ( n2 1 )
sp .
n1 n2 2
132
Exemplul 6.8. Testarea diferenelor dintre dou medii
Pentru dou eantioane extrase aleator simplu de volum n1=n2=625 persoane s-a
nregistrat vrsta i s-au obinut urmtoarele rezultate: x1 35 ani, x2 32 ani ;
s1 2 ani, s2 4 ani . S se testeze ipoteza potrivit creia ntre vrstele medii ale celor dou
populaii din care au fost extrase eantioanele observate exist diferene semnificative. Se
consider un risc de 0,05.
133
Rezolvare
Ipoteze statistice:
H0: 1 2 (nu exist diferene semnificative ntre vrstele medii ale celor dou populaii din
care au fost extrase eantioanele)
H1: 1 2 (exist diferene semnificative ntre vrstele medii ale celor dou populaii din
care au fost extrase eantioanele)
Statistica test
Cnd nu se cunosc varianele populaiilor, pentru testarea ipotezelor statistice se folosete
statistica t, calculat dup relaia:
x1 x 2
t
s12 s 22
n1 n 2
Regula de decizie
dac t calc t / 2 , se respinge ipoteza H0;
1-
-t t t
H 1 H 0 H 1
probabilitate de 0,95 c exist diferene semnificative ntre vrstele medii ale populaiilor din
care au fost extrase eantioanele observate.
testeze ipoteza potrivit creia ntre salariul mediu al persoanelor de sex masculin i salariul
mediu al persoanelor de sex feminin exist diferene semnificative, la nivelul populaiei din
care au fost extrase eantioanele observate. Se consider un risc de 0,05.
Rezolvare
Ipoteze statistice
H0: M F
H1: M F
Statistica test
Cnd nu se cunosc varianele populaiilor, pentru testarea ipotezelor statistice se folosete
statistica t, calculat dup relaia:
xM xF
t
sM2 sF2
n1 n2
135
Regula de decizie
dac t calc t / 2 , se respinge ipoteza H0;
1-
-t t t
H 1 H 0 H 1
Interpretare: tcalc 0 ,76 t0 ,025 2,145, se accept ipoteza H0. Se poate garanta cu o
Ipoteze statistice
H 0 : 1 2 0
H1 : 1 2 0
136
Alegerea pragului de semnificaie a testului
Regula de decizie
dac t calc t / 2; n1 n2 2 , se respinge ipoteza H0;
Rezolvare
Ipoteze statistice:
H0: 1 2 (nu exist diferene semnificative ntre proporia persoanelor care au votat pentru
candidatul A n anul 2016 i anul 2012)
H1: 1 2 (exist diferene semnificative ntre proporia persoanelor care au votat pentru
candidatul A n anul 2016 i anul 2012)
Statistica test
Statistica t se calculeaz dup relaia:
137
p1 p2
tcalculat
p1 (100 p1 ) p2 (100 p2 )
n1 n2
Regula de decizie
dac t calc t / 2; n1 n2 2 , se respinge ipoteza H0;
Interpretare: tcalc 0 ,71 t0 ,025 1,96 , se accept ipoteza H0. Se poate garanta cu o
Estimarea prin interval de ncredere presupune construirea unui interval pentru valoarea
unui parametru, plecnd de la rezultatele obinute prin prelucrarea datelor la nivelul unui
eantion extras din populaie.
Testarea ipotezelor statistice presupune un demers invers: se formuleaz o ipotez
asupra valorii unui parametru i se verific dac aceast ipotez este sau nu contrazis de
observaiile de la nivelul unui eantion extras din populaie.
De exemplu, s presupunem c n urma prelucrrii datelor la nivelul unui eantion, se
obin limitele intervalului de ncredere pentru media unei populaii definite de 14; 18 . Dac
138
n procesul testrii statistice, formulm ipotezele H 0 : 10; H 1 : 10 , atunci putem
observa c se respinge ipoteza H0, deoarece media populaiei, , nu poate fi egal cu 10.
139