Documente Academic
Documente Profesional
Documente Cultură
Cuprins
7.1 Demersul testării statistice
7.2 Testarea ipotezelor privind un parametru
7.3 Aplicaţie în SPSS
Obiective
- definirea noţiunilor
- prezentarea demersului testării statistice
- aplicarea demersului testării pentru parametrii medie şi proporţie
- studiu de caz: testarea în cazul alegerilor electorale
- realizarea de aplicaţii cu date reale
Competenţe
- însuşirea noţiunilor şi a demersului procedeului de testare statistică
- înţelegerea diferenţei dintre estimare şi testare
- dobândirea de abilităţi practice de utilizare a metodei testării pentru diferite situaţii reale
- însuşirea demersului testării cu ajutorul softului statistic specializat
Termen mediu: 2 h
Bibliografie
1. Andrei, T. şi Stancu, S., Statistică - teorie şi aplicaţii , Editura All, Bucureşti, 1995
2. Biji, M.; Biji, El., Statistica teoretică, Editura Didactică şi Pedagogică, Bucureşti, 1979
3. Jaba, E., Statistica, Ediţia a treia, Editura Economica, Bucureşti, 2002
4. Jemna, D.V., Econometrie, Editura Sedcom Libris, Iaşi, 2009
5. Mills, Fr.G., Statistical Methods, 3rd ed., Henry Holt, New York, 1955.
6. McNabb, D., Research methods in public administration and nonprofit management :
quantitative and qualitative approaches, Armonk, M.E. Sharpe, 2002
7. Yule, U.G.; Kendall, M.C. - Introducere în teoria statisticii, Editura Ştiinţifică, Bucureşti,
1969.
8. Wonnacott, T.H., Wonnacott, R.J., Statistique, Economica, Paris, 1991.
Testarea ipotezelor statistice este un procedeu prin care se testează semnificaţia egalităţii
dintre valoarea unui parametru şi o valoare de referinţă sau dintre doi parametri (două medii ale
populaţiei sau două proporţii de la nivelul unor populaţii).
1-
Z
-z z
H 1 H 0 H 1
Testarea ipotezelor cu privire la un parametru are ca obiectiv testarea egalităţii dintre media
unei populaţii sau proporţia la nivelul unei populaţii faţă de valori de referinţă, cunoscute.
Ipoteze statistice
În testarea semnificaţiei mediei unei populaţii se formulează următoarele ipoteze statistice:
- ipoteza nulă este ipoteza prin care se presupune că nu există diferenţe între media unei
populaţii, , estimată prin media calculată la nivelul eşantion, şi o valoare de referinţă considerată,
0 .
De exemplu, într-un studiu statistic cu privire la nivelul ratei şomajului în anumite ţări ale
Uniunii Europene, în procesul testării statistice se poate urmări dacă există diferenţe semnificative
între nivelul mediu al ratei şomajului pentru ansamblul ţărilor din UE ( ) şi nivelul mediu al ratei
şomajului din SUA ( 0 ). Ipoteza nulă care se formulează este: H 0 : 0 .
- ipoteza alternativă este contrară ipotezei nule, deci este ipoteza prin care se presupune că
există diferenţe între valorile comparate.
Pentru exemplul prezentat anterior, ipoteza alternativă se formulează astfel: H 1 : 0
(test bilateral), H 1 : 0 (test unilateral la dreapta) sau H 1 : 0 (test unilateral la stânga).
x 0 x 0
( xi x ) 2
t calculat , unde s' i
.
s ˆ s' / n n1
1-
Z
-z z
H 1 H 0 H 1
Exemple
1. La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul lunar
obţinut şi se obţine x 14 mil .lei. Ştiind că 4 mil .lei , se cere să se testeze dacă există
diferenţe semnificative între salariul mediu al întregii populaţii din care a fost extras eşantionul şi
salariul mediu pe economie, de 13 mil. lei. Se consideră un risc 0 ,05 .
Rezolvare
Formularea ipotezelor statistice
H 0 : 13 milioane lei (nu există diferenţe semnificative între salariul mediu al întregii
populaţii din care a fost extras eşantionul şi salariul mediu pe economie)
H 1 : 13 milioane lei (există diferenţe semnificative între salariul mediu al întregii
populaţii din care a fost extras eşantionul şi salariul mediu pe economie)
Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
dacă Pr ob. , atunci se respinge ipoteza H0;
dacă Pr ob. , atunci se acceptă ipoteza H0.
Interpretare
z calculat 2 ,5 z 0 ,025 1,96 sau (Pr ob. 2 0,006 0,012 ) 0,05 , se respinge ipoteza
Ho. Se poate garanta cu o probabilitate de 0,95 că există diferenţe semnificative între salariul mediu
al întregii populaţii din care a fost extras eşantionul observat ( ) şi salariul mediu pe economie
( 0 ) .
2. La nivelul unui eşantion format din 100 de persoane, se înregistrează salariul lunar
obţinut şi se obţine x 14 mil .lei. Ştiind că 4 mil .lei , se cere să se testeze dacă salariul mediu
al întregii populaţii din care a fost extras eşantionul este mai mare decât salariul mediu pe
economie, de 13 mil. lei. Se consideră un risc 0 ,05 .
Rezolvare
Formularea ipotezelor statistice
H 0 : 13 milioane lei
H 1 : 13 milioane lei
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii, atunci când se cunoaşte , se foloseşte
x 0
statistica test Z: z .
/ n
Regula de decizie
Folosind probabilitatea asociată statisticii test calculate:
dacă Pr ob. , atunci se respinge ipoteza H0;
dacă Pr ob. , atunci se acceptă ipoteza H0.
Figura 32. Regiunea de respingere şi de acceptare a ipotezei H0 în cazul unui test unilateral
la dreapta
Interpretare
z calculat 2 ,5 z0 ,025 1,65 sau Pr ob . 0 ,006 0 ,05 , se respinge ipoteza Ho. Se poate
garanta cu o probabilitate de 0,95 că salariul mediu al întregii populaţii din care a fost extras
eşantionul observat ( ) este mai mare decât salariul mediu pe economie ( 0 ) .
Rezolvare
Formularea ipotezelor statistice
H 0 : 13
H 1 : 13
Regula de decizie
dacă t calculat t / 2 sau t calculat t / 2 , atunci se respinge ipoteza H0;
dacă t calculat t / 2 sau t calculat t / 2 , atunci se acceptă ipoteza H0.
t 0.025
24 2,064
Interpretare
Regiunea de acceptare şi regiunea de respingere a ipotezei Ho sunt prezentate în figura de
mai jos:
0,95
0,025 0,025
tcalc =5
t
-2,064 2,064
H1 H0 H1
Figura 33. Regiunea de respingere şi de acceptare a ipotezei H0
t calculat 5 t 0 ,025 ;24 2 ,064 , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de
0,95 că există diferenţe semnificative între salariul mediu al întregii populaţii din care a fost extras
eşantionul observat ( ) şi salariul mediu pe economie ( 0 ) .
Exemplu
La nivelul unui eşantion de volum n=25 de persoane, se observă că ponderea persoanelor
care votează pentru candidatul A este de 49%. Se cere să se testeze dacă există diferenţe
semnificative între proporţia persoanelor care votează pentru candidatul A la nivelul întregii
populaţii şi proporţia persoanelor care au votat pentru acest candidat la alegerile anterioare, de 51%.
Se consideră un risc 0 ,05 .
Rezolvare
Formularea ipotezelor statistice
H 0 : p 51%
H 1 : p 51%
Statistica test
Pentru testarea semnificaţiei mediei unei populaţii se foloseşte statistica test t Student,
f p0
t .
f (1 f ) / n
Regula de decizie
dacă t calculat t / 2 sau t calculat t / 2 , atunci se respinge ipoteza H0;
dacă t calculat t / 2 sau t calculat t / 2 , atunci se acceptă ipoteza H0.
Interpretare
t calculat 0 ,2 t 0 ,025 ;24 2 ,064 , se acceptă ipoteza Ho. Se poate garanta cu o probabilitate
de 0,95 că nu există diferenţe semnificative între proporţia persoanelor care votează pentru
candidatul A la nivelul întregii populaţii, p, şi proporţia persoanelor care au votat pentru acest
candidat la alegerile anterioare, p0.
Exemplul 1
Din totalul judeţelor României a fost extras aleatoriu un eşantion de 10 judeţe, care au fost
observate după rata şomajului, pentru anul 2010. Pentru un risc asumat de 5%, se cere să se testeze
dacă există diferenţe semnificative între rata medie a şomajului la nivelul României şi rata medie a
şomajului înregistrată la nivelul U.E. în 2010, de 9.6%.
Rezolvare
Rezultatele testării, obţinute cu ajutorul programului SPSS, sunt prezentate în tabelul 7.1.
Regula de decizie
SPSS permite luarea deciziei pe baza valorilor Sig. şi , după următoarea regulă de decizie:
dacă Sig . , atunci se respinge ipoteza H0;
dacă Sig . , atunci se acceptă ipoteza H0.
Interpretare
Sig. 0.029 0.05 , se respinge ipoteza Ho. Se poate garanta cu o probabilitate de 95%
că rata medie a şomajului la nivelul României diferă semnificativ de rata medie a şomajului U.E.
Exemplul 2
Din totalul judeţelor României a fost extras aleatoriu un eşantion de 10 judeţe, care au fost
observate după rata şomajului, pentru anul 2010. Pentru un risc asumat de 5%, se cere să se testeze
dacă există diferenţe semnificative între proporţia judeţelor cu o rată a şomajului sub media U.E. şi
proporţia obţinută în 2009, de 30%.
Rezolvare
Rezultatele testării, obţinute cu ajutorul programului SPSS, sunt prezentate în tabelul 7.2.
Regula de decizie
SPSS permite luarea deciziei pe baza valorilor Sig. şi , după următoarea regulă de decizie:
dacă Sig . , atunci se respinge ipoteza H0;
dacă Sig . , atunci se acceptă ipoteza H0.
Interpretare
Sig. 0.270 0.05 , se acceptă ipoteza Ho. Se poate garanta cu o probabilitate de 95%
că proporţia judeţelor cu rata şomajului peste medie U.E. nu diferă semnificativ de 30%.
Teste1
1) Pentru un eşantion de 100 salariaţi repartizaţi după nivelul venitului lunar, s-au obţinut
rezultatele: x 1500lei; s' 300lei . Cu un risc de 5%, se consideră că între venitul mediu al
salariaţilor populaţiei totale şi nivelul mediu de referinţă 0 1800lei :
a) nu există diferenţe semnificative
b) există diferenţe semnificative
c) nu există nici o legătură
2) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($) s-au obţinut rezultatele
din tabelul de mai jos.
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Std. Error of Mean
$785.000
Pentru un nivel de încredere de 95%, valoarea calculată a testului şi decizia de a accepta ipoteza că
salariul mediu a unui angajat nu diferă semnificativ de 33000$ sunt:
a) tcalc =1,27 şi se acceptă ipoteza nulă
b) tcalc =1,27 şi se respinge ipoteza nulă, cu o încredere de 95%
c) tcalc =2,27 şi se respinge ipoteza nulă, cu o încredere de 95%
5) Într-un sondaj electoral, un candidat a obţinut un procent de voturi estimat egal cu 52%. Ştiind că
volumul eşantionului este de 400 persoane, iar probabilitatea este de 0,95, atunci candidatul
a) câştigă
b) pierde
c) nu se poate decide
1
Răspunsuri: 1 –b; 2 – a; 3 – a,b; 4 – c; 5 - b