Sunteți pe pagina 1din 14

US 7.

TESTAREA IPOTEZELOR STATISTICE

Cuprins
7.1 Demersul testării statistice
7.2 Testarea ipotezelor privind un parametru
7.3 Aplicaţie în SPSS

Obiective
- definirea noţiunilor
- prezentarea demersului testării statistice
- aplicarea demersului testării pentru parametrii medie şi proporţie
- studiu de caz: testarea în cazul alegerilor electorale
- realizarea de aplicaţii cu date reale

Competenţe
- însuşirea noţiunilor şi a demersului procedeului de testare statistică
- înţelegerea diferenţei dintre estimare şi testare
- dobândirea de abilităţi practice de utilizare a metodei testării pentru diferite situaţii reale
- însuşirea demersului testării cu ajutorul softului statistic specializat

Termen mediu: 2 h

Bibliografie

1. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
2. Biji, M.; Biji, El., Statistica teoretică, Editura Didactică şi Pedagogică, Bucureşti, 1979
3. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
4. Jemna, D.V., Econometrie, Editura Sedcom Libris, Iaşi, 2009
5. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
6. McNabb, D., Research methods in public administration and nonprofit management :
quantitative and qualitative approaches, Armonk, M.E. Sharpe, 2002
7. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti,
1969.
8. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
Testarea ipotezelor statistice este un procedeu prin care se testează semnificaţia egalităţii
dintre valoarea unui parametru şi o valoare de referinţă sau dintre doi parametri (două medii ale
populaţiei sau două proporţii de la nivelul unor populaţii).

7.1. Demersul testării statistice

 Verificarea ipotezelor care se formulează cu privire la populaţie. Inferenţa statistică


presupune ca distribuţia populaţiei din care a fost extras eşantionul să urmeze o lege
normală sau volumul eşantionului să fie suficient de ridicat (n>30).

 Formularea ipotezelor statistice


O ipoteză este o presupunere cu privire la valoarea unui parametru: media unei populaţii,
varianţa unei populaţii sau proporţia unei anumite categorii dintr-o populaţie. Ipotezele care se
formulează în statistică sunt:
- ipoteza nulă este ipoteza prin care se presupune că nu există diferenţe faţă de o valoare
teoretică sau o valoare de referinţă considerată. Ipoteza nulă are un rol important în determinarea
distribuţiei de selecţie care va fi folosită în procesul testării. Se notează cu H0.
- ipoteza alternativă este contrară ipotezei nule, deci este ipoteza prin care se presupune că
există diferenţe faţă de o valoare teoretică sau o valoare de referinţă considerată. Se notează cu H1.

 Alegerea pragului de semnificaţie a testului


În testarea ipotezelor statistice, pragul de semnificaţie a testului, notat cu  , reprezintă
probabilitatea (de regulă, egală cu 0.05, 0.01) bazată pe ipoteza că H0 este adevărată.

 Alegerea şi calcularea statisticii test


Testul statistic se alege în funcţie de legea urmată de distribuţia de selecţie a statisticii
considerate. De exemplu, în paragraful anterior am arătat că distribuţia de selecţie a mediei de
selecţie urmează o lege normală. În testarea semnificaţiei mediei unei populaţii, se foloseşte testul Z
sau testul t Student.

 Definirea regulii de decizie


Pentru definirea regulii de decizie, valoarea calculată a statisticii test, pe baza datelor
observate la nivelul unui eşantion, se compară cu valoarea teoretică, numită şi valoare critică, care
se alege din tabelele teoretice. Decizia corectă poate fi adoptată şi prin compararea probabilităţii
asociate statisticii test calculate cu riscul  . În mod sintetic, regula de decizie, în cazul folosirii
repartiţiei Z, poate fi prezentată astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob.   dacă Pr ob.  
asociată statisticii test
Folosind valoarea dacă z calculat   z / 2 sau dacă z calculat   z / 2 sau
calculată a statisticii test z calculat   z / 2 z calculat   z / 2
Reprezentarea grafică a regiunilor de respingere şi de acceptare a ipotezei H0 este realizată
în figura de mai jos:

1-

 
Z
-z z

H 1 H 0 H 1

Figura 27. Regiunile de respingere şi de acceptare a ipotezei H0

7.2. Testarea ipotezelor privind un parametru

Testarea ipotezelor cu privire la un parametru are ca obiectiv testarea egalităţii dintre media
unei populaţii sau proporţia la nivelul unei populaţii faţă de valori de referinţă, cunoscute.

7.2.1. Testarea semnificaţiei mediei unei populaţii

Ipoteze statistice
În testarea semnificaţiei mediei unei populaţii se formulează următoarele ipoteze statistice:
- ipoteza nulă este ipoteza prin care se presupune că nu există diferenţe între media unei
populaţii,  , estimată prin media calculată la nivelul eşantion, şi o valoare de referinţă considerată,
0 .
De exemplu, într-un studiu statistic cu privire la nivelul ratei şomajului în anumite ţări ale
Uniunii Europene, în procesul testării statistice se poate urmări dacă există diferenţe semnificative
între nivelul mediu al ratei şomajului pentru ansamblul ţărilor din UE (  ) şi nivelul mediu al ratei
şomajului din SUA (  0 ). Ipoteza nulă care se formulează este: H 0 :    0 .

- ipoteza alternativă este contrară ipotezei nule, deci este ipoteza prin care se presupune că
există diferenţe între valorile comparate.
Pentru exemplul prezentat anterior, ipoteza alternativă se formulează astfel: H 1 :    0
(test bilateral), H 1 :    0 (test unilateral la dreapta) sau H 1 :    0 (test unilateral la stânga).

Alegerea pragului de semnificaţie a testului


În testarea ipotezelor statistice, pragul de semnificaţie a testului, notat cu  , este, de regulă,
egal cu 0.05 sau 0.01.
De exemplu, dacă pragul de semnificaţie a unui test este de 0,05, atunci ipoteza
H 0 :    0 va fi respinsă dacă media eşantionului extras din populaţie este atât de îndepărtată, la
stânga sau la dreapta, de valoarea fixă  0 , încât se încadrează printre cele 5% cele mai puţin
probabile medii ale eşantioanelor posibil de extras din populaţie.
Pragul de semnificaţie a testului,  , arată probabilitatea de a respinge ipoteza H0 atunci
când aceasta este adevărată. Eroarea comisă în respingerea ipotezei H0, atunci când aceasta este
adevărată, poartă denumirea de eroare de tip I.
Eroarea de tip II se produce în momentul acceptării ipotezei H0, atunci când aceasta este
falsă.

Alegerea şi calculul statisticii test


Atunci când se cunoaşte varianţa populaţiei (  2 ) , în testarea semnificaţiei mediei unei
distribuţii se foloseşte statistica Z. Pe baza datelor observate la nivelul unui eşantion de volum n, se
calculează statistica test Z astfel:
x  0 x  0
z calculat   .
 ˆ / n
Atunci când nu se cunoaşte varianţa populaţiei, în testarea semnificaţiei mediei unei
distribuţii se foloseşte statistica t Student. Pe baza datelor observate la nivelul unui eşantion de
volum n, se calculează statistica test t Student astfel:

x  0 x  0
 ( xi  x ) 2
t calculat   , unde s'  i
.
s ˆ s' / n n1

Definirea regulii de decizie

Considerând un test bilateral, regula de decizie poate fi definită astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob.   dacă Pr ob.  
asociată statisticii test
Folosind valoarea dacă z calculat   z / 2 sau dacă z calculat   z / 2 sau
calculată a statisticii test z calculat   z / 2 z calculat   z / 2

Reprezentarea regiunii de acceptare şi de respingere a ipotezei H0 este realizată în figura de


mai jos:

1-

 
Z
-z z

H 1 H 0 H 1

Figura 28. Regiunea de respingere şi de acceptare a ipotezei H0


în cazul unui test bilateral
Regula de decizie pentru un test unilateral poate fi definită astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob.   dacă Pr ob.  
asociată statisticii test
Test unilateral la dreapta dacă z calculat   z dacă z calculat   z
H 1 :   0
Test unilateral la stânga dacă z calculat   z dacă z calculat   z
H 1 :   0

Reprezentarea regiunilor de respingere şi de acceptare a ipotezei H0 pentru un test unilateral


este realizată în figura de mai jos:

Figura 29. Regiunea de respingere şi de acceptare a ipotezei H0


în cazul unui test unilateral la dreapta

Figura 30. Regiunea de respingere şi de acceptare a ipotezei H0


în cazul unui test unilateral la stânga

De exemplu, în cazul unui test bilateral, considerând un prag de semnificaţie   0 ,05 ,


valoarea critică a statisticii test Z este z=1,96. Regiunea de respingere a ipotezei Ho este definită de:
z calculat  1,96 , respectiv z calculat  1,96.
În cazul unui test unilateral la dreapta, pentru care ipoteza H 1 :    0 , considerând un
prag de semnificaţie   0 ,05 , valoarea critică a statisticii test Z este z=1,65. Regiunea de
respingere a ipotezei Ho este, astfel, definită de: z calculat  1,65 .
În cazul unui test unilateral la stânga, pentru care ipoteza H 1 :    0 , considerând un prag
de semnificaţie   0 ,05 , valoarea critică a statisticii test Z este z  1,65 . Regiunea de respingere
a ipotezei Ho este definită de: z calculat  1,65 .

Exemple
1. La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul lunar
obţinut şi se obţine x  14 mil .lei. Ştiind că   4 mil .lei , se cere să se testeze dacă există
diferenţe semnificative între salariul mediu al întregii populaţii din care a fost extras eşantionul şi
salariul mediu pe economie, de 13 mil. lei. Se consideră un risc   0 ,05 .

Rezolvare
Formularea ipotezelor statistice
H 0 :   13 milioane lei (nu există diferenţe semnificative între salariul mediu al întregii
populaţii din care a fost extras eşantionul şi salariul mediu pe economie)
H 1 :   13 milioane lei (există diferenţe semnificative între salariul mediu al întregii
populaţii din care a fost extras eşantionul şi salariul mediu pe economie)

Alegerea pragului de semnificaţie a testului


  0 ,05 .
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte  , se foloseşte
x  0
statistica test Z: z  .
/ n

Calculul statisticii test


14  13
Pe baza datelor obţinute la nivelul eşantionului, se obţine: z cakulat   2 ,5 .
4 / 100

Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
 dacă Pr ob.   , atunci se respinge ipoteza H0;
 dacă Pr ob.   , atunci se acceptă ipoteza H0.

Folosind statistica test:


 dacă z calculat   z sau z calculat   z , atunci se respinge ipoteza H0;
 dacă z calculat   z sau z calculat   z , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul Z pentru un risc   0 ,05 . Această valoare este: z / 2  1,96.

Probabilitatea asociată statisticii test calculate


Valoarea probabilităţii asociate statisticii test calculate, z cakulat  2 ,5 , se citeşte din tabelul
Z, astfel: P( Z  2,5 )  0,5  0,494  0,006 . Această valoare este furnizată de programele
specializate de statistică şi poartă denumirea de Prob. sau p-value (programul E-VIEWS) sau Sig.
(Significance Level) (programul SPSS).

Figura 31. Regiunea de respingere şi de acceptare a ipotezei H0

Interpretare
z calculat  2 ,5  z 0 ,025  1,96 sau (Pr ob.  2  0,006  0,012 )    0,05 , se respinge ipoteza
Ho. Se poate garanta cu o probabilitate de 0,95 că există diferenţe semnificative între salariul mediu
al întregii populaţii din care a fost extras eşantionul observat (  ) şi salariul mediu pe economie
( 0 ) .

2. La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul lunar
obţinut şi se obţine x  14 mil .lei. Ştiind că   4 mil .lei , se cere să se testeze dacă salariul mediu
al întregii populaţii din care a fost extras eşantionul este mai mare decât salariul mediu pe
economie, de 13 mil. lei. Se consideră un risc   0 ,05 .

Rezolvare
Formularea ipotezelor statistice
H 0 :   13 milioane lei
H 1 :   13 milioane lei

Alegerea pragului de semnificaţie a testului


  0 ,05 .

Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte  , se foloseşte
x  0
statistica test Z: z  .
/ n

Calculul statisticii test


14  13
Pe baza datelor obţinute la nivelul eşantionului, se obţine: z cakulat   2 ,5 .
4 / 100

Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
 dacă Pr ob.   , atunci se respinge ipoteza H0;
 dacă Pr ob.   , atunci se acceptă ipoteza H0.

Folosind statistica test:


 dacă z calculat   z , atunci se respinge ipoteza H0;
 dacă z calculat   z , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul Z pentru un risc   0 ,05 . Această valoare este: z / 2  1,65.

Probabilitatea asociată statisticii test calculate


Valoarea probabilităţii asociate statisticii test calculate, z cakulat  2 ,5 , se citeşte din tabelul
Z, astfel: Pr ob.( Z  2,5 )  0,5  0,494  0,006 .

Figura 32. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test unilateral
la dreapta

Interpretare
z calculat  2 ,5  z0 ,025  1,65 sau Pr ob .  0 ,006    0 ,05 , se respinge ipoteza Ho. Se poate
garanta cu o probabilitate de 0,95 că salariul mediu al întregii populaţii din care a fost extras
eşantionul observat (  ) este mai mare decât salariul mediu pe economie (  0 ) .

3. Pentru un eşantion format din 25 de persoane, se înregistrează salariul lunar obţinut şi se


obţin următoarele rezultate: x  15 mil .lei, s'  2 mil .lei. Se cere să se testeze dacă există diferenţe
semnificative între salariul mediu al întregii populaţii din care a fost extras eşantionul şi salariul
mediu de economie, de 13 mil. lei. Se consideră un risc   0 ,05 .

Rezolvare
Formularea ipotezelor statistice
H 0 :   13
H 1 :   13

Alegerea pragului de semnificaţie a testului


  0 ,05 .
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t Student,
x  0
t .
s' / n

Calculul statisticii test


15  13
Pe baza datelor obţinute la nivelul eşantionului, se obţine: t cakulat   5.
2 / 25

Regula de decizie
 dacă t calculat  t / 2 sau t calculat  t / 2 , atunci se respinge ipoteza H0;
 dacă t calculat  t / 2 sau t calculat  t / 2 , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul t Student pentru un risc   0 ,05 şi n-1 grade de libertate. Această
valoare este: t / 2;n1  t0 ,025;24  2 ,064 .

t  0.025 

24  2,064 

Interpretare
Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în figura de
mai jos:

0,95

0,025 0,025
tcalc =5
t
-2,064 2,064

H1 H0 H1
Figura 33. Regiunea de respingere şi de acceptare a ipotezei H0

t calculat  5  t 0 ,025 ;24  2 ,064 , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 că există diferenţe semnificative între salariul mediu al întregii populaţii din care a fost extras
eşantionul observat (  ) şi salariul mediu pe economie (  0 ) .

7.2.2. Testarea semnificaţiei proporţiei unei populaţii


Demersul testării semnificaţiei unei proporţii este similar demersului prezentat în cazul
mediei unei populaţii.
Ipoteze statistice
Ipotezele care se formulează în testarea semnificaţiei unei proporţii sunt:
H 0 : p  p0
H 1 : p  p0 (test bilateral)

Alegerea pragului de semnificaţie a testului


  0 ,05 .

Alegerea şi calculul statisticii test


Atunci când nu se cunoaşte varianţa populaţiei, în testarea semnificaţiei proporţiei unei
distribuţii se foloseşte statistica t Student. Pe baza datelor observate la nivelul unui eşantion de
volum n, se calculează statistica test t astfel:
f  p0 f  p0
t calculat   .
s p̂ f (1 f ) / n

Definirea regulii de decizie


Adoptarea decizie corecte presupune compararea valorii calculate a statisticii test cu
valoarea teoretică. De exemplu, considerând un test bilateral, atunci când nu se cunoaşte varianţa
populaţiei, regula de decizie poate fi definită astfel:

Se respinge ipoteza H0 Se acceptă ipoteza H0


Folosind probabilitatea dacă Pr ob.   dacă Pr ob.  
asociată statisticii test
Folosind valoarea dacă t calculat  t / 2 sau dacă t calculat  t / 2 sau
calculată a statisticii test t calculat  t / 2 t calculat  t / 2

Exemplu
La nivelul unui eşantion de volum n=25 de persoane, se observă că ponderea persoanelor
care votează pentru candidatul A este de 49%. Se cere să se testeze dacă există diferenţe
semnificative între proporţia persoanelor care votează pentru candidatul A la nivelul întregii
populaţii şi proporţia persoanelor care au votat pentru acest candidat la alegerile anterioare, de 51%.
Se consideră un risc   0 ,05 .

Rezolvare
Formularea ipotezelor statistice
H 0 : p  51%
H 1 : p  51%

Alegerea pragului de semnificaţie a testului


  0 ,05 .

Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t Student,
f  p0
t .
f (1  f ) / n

Calculul statisticii test


Pe baza datelor obţinute la nivelul eşantionului, se obţine:
49  51
t calculat   0 ,2 .
49  ( 100  49 ) / 25

Regula de decizie
 dacă t calculat  t / 2 sau t calculat  t / 2 , atunci se respinge ipoteza H0;
 dacă t calculat  t / 2 sau t calculat  t / 2 , atunci se acceptă ipoteza H0.

Valoarea teoretică a statisticii test


Se citeşte din tabelul t Student pentru un risc   0 ,05 şi n-1 grade de libertate. Această
valoare este: t / 2;n1  t0 ,025;24  2 ,064 .

Interpretare
t calculat  0 ,2  t 0 ,025 ;24  2 ,064 , se acceptă ipoteza Ho. Se poate garanta cu o probabilitate
de 0,95 că nu există diferenţe semnificative între proporţia persoanelor care votează pentru
candidatul A la nivelul întregii populaţii, p, şi proporţia persoanelor care au votat pentru acest
candidat la alegerile anterioare, p0.

7.3. Aplicaţie în SPSS

Exemplul 1
Din totalul judeţelor României a fost extras aleatoriu un eşantion de 10 judeţe, care au fost
observate după rata şomajului, pentru anul 2010. Pentru un risc asumat de 5%, se cere să se testeze
dacă există diferenţe semnificative între rata medie a şomajului la nivelul României şi rata medie a
şomajului înregistrată la nivelul U.E. în 2010, de 9.6%.

Rezolvare
Rezultatele testării, obţinute cu ajutorul programului SPSS, sunt prezentate în tabelul 7.1.

Tabelul 7.1. Rezultatele testării unei medii cu o valoare cunoscută

Formularea ipotezelor statistice


H 0 :   9.6
H 1 :   9.6

Alegerea pragului de semnificaţie a testului


  0 ,05 .
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t Student,
x  0
t .
s' / n

Calculul statisticii test


Din tabelul SPSS se citeşte valoarea calculată a statisticii test, tcalc=-2.590.

Regula de decizie
SPSS permite luarea deciziei pe baza valorilor Sig. şi  , după următoarea regulă de decizie:
 dacă Sig .   , atunci se respinge ipoteza H0;
 dacă Sig .   , atunci se acceptă ipoteza H0.

Interpretare
Sig.  0.029    0.05 , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de 95%
că rata medie a şomajului la nivelul României diferă semnificativ de rata medie a şomajului U.E.

Exemplul 2
Din totalul judeţelor României a fost extras aleatoriu un eşantion de 10 judeţe, care au fost
observate după rata şomajului, pentru anul 2010. Pentru un risc asumat de 5%, se cere să se testeze
dacă există diferenţe semnificative între proporţia judeţelor cu o rată a şomajului sub media U.E. şi
proporţia obţinută în 2009, de 30%.

Rezolvare
Rezultatele testării, obţinute cu ajutorul programului SPSS, sunt prezentate în tabelul 7.2.

Tabelul 7.2. Rezultatele testării unei proporţii cu o valoare cunoscută

Formularea ipotezelor statistice


H 0 : p  30%
H 1 : p  30%

Alegerea pragului de semnificaţie a testului


  0 ,05 .

Regula de decizie
SPSS permite luarea deciziei pe baza valorilor Sig. şi  , după următoarea regulă de decizie:
 dacă Sig .   , atunci se respinge ipoteza H0;
 dacă Sig .   , atunci se acceptă ipoteza H0.
Interpretare
Sig.  0.270    0.05 , se acceptă ipoteza Ho. Se poate garanta cu o probabilitate de 95%
că proporţia judeţelor cu rata şomajului peste medie U.E. nu diferă semnificativ de 30%.
Teste1

1) Pentru un eşantion de 100 salariaţi repartizaţi după nivelul venitului lunar, s-au obţinut
rezultatele: x  1500lei; s'  300lei . Cu un risc de 5%, se consideră că între venitul mediu al
salariaţilor populaţiei totale şi nivelul mediu de referinţă 0  1800lei :
a) nu există diferenţe semnificative
b) există diferenţe semnificative
c) nu există nici o legătură

2) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics

Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Std. Error of Mean
$785.000

Pentru un nivel de încredere de 95%, valoarea calculată a testului şi decizia de a accepta ipoteza că
salariul mediu a unui angajat nu diferă semnificativ de 33000$ sunt:
a) tcalc =1,27 şi se acceptă ipoteza nulă
b) tcalc =1,27 şi se respinge ipoteza nulă, cu o încredere de 95%
c) tcalc =2,27 şi se respinge ipoteza nulă, cu o încredere de 95%

3)Decizia de a accepta sau a respinge o ipoteză nulă se ia prin compararea:


a) valorii calculate a testului cu o valoare teoretică a acestuia
b) estimaţiei cu parametrul
c) erorii limită cu pragul de semnificaţie

4) Într-un test statistic se acceptă ipoteza nulă dacă:


a) tcalc = tα
b) tcalc>tα
c) [x] tcalc aparţine intervalului (-tα/2 ; tα/2)

5) Într-un sondaj electoral, un candidat a obţinut un procent de voturi estimat egal cu 52%. Ştiind că
volumul eşantionului este de 400 persoane, iar probabilitatea este de 0,95, atunci candidatul
a) câştigă
b) pierde
c) nu se poate decide

1
Răspunsuri: 1 –b; 2 – a; 3 – a,b; 4 – c; 5 - b