Sunteți pe pagina 1din 7

UNITATEA DE NVARE 2

Testarea ipotezelor statistice


Obiectivele cursului:
1. Cunoaterea considerentelor teoretico-metodologice privind testarea ipotezelor statistice;
2. Testarea ipotezei privind media populaiei generale pentru eantioane de volum redus,
respectiv de volum mare
3. Compararea mediilor dintre dou eantioane de volum redus.
Prin ipotez statistic se nelege presupunerea care se face cu privire la parametrul
unei repartiii sau a legii de repartiie pe care o urmeaz anumite variabile aleatoare.
Exist dou ipoteze statistice:

ipoteza nul este ipoteza care urmeaz a fi testat i este notat cu H0. Aceasta
presupune c nu exist deosebiri eseniale sau c eventualele deosebiri au un
caracter ntmpltor;

ipoteza alternativ reprezint negarea ipotezei nule i se noteaza cu H1.

Procedeul de verificare a unei ipoteze statistice se numeste test sau criteriu de semnificatie.
Pentru cele mai multe testari statistice, testul este derivat din estimatorul punctual al parametrului
ce va fi testat.
Ipoteza alternativ poate avea una din urmtoarele trei forme. De exmplu, dac testm
parametrul numit medie al unei colectiviti generale cu valoarea 0 putem obine urmtoarele
trei situaii privind ipoteza alternativ:

test bilateral:

H0: = 0

H1: 0

test unilateral de dreapta:

H0: = 0

H1: > 0

test unilateral de stnga:

H0: = 0

H1: < 0

n testul bilateral, regiunea de respingere a ipotezei H0 corespunde unui interval, divizat n


dou subintervale, delimitate la un capt de o valoare critic (prag critic),iar la cellalt capt de
infinit: (-; valoarea critic inferioar] i [valoarea critic superioar;+).
Tabelul de mai jos ilustreaz relaia dintre decizia luat referitoare la ipoteza nul i adevrul
sau falsitatea acestei ipoteze.

n testarea ipotezelor statistice se disting dou tipuri de teste:


Testele parametrice
-presupun cunoaterea distribuiei populaiei (legii de distribuie) considerate. Cel mai
cunoscut este testul Student (testul t). De asemenea, acesta este utilizat pentru testarea valorii
unui coeficient de regresie, precum i a valorii coeficientului de corelatie.
Testele neparametrice
-presupun testarea ipotezelor statistice fr a cere specificarea formei parametrice a distribuiei
populaiilor comparate:
- testul Wilcoxon (utilizat pentru a verifica, pe baza de sondaj, dac exist diferene
semnificative ntre dou populaii),
- testul Mann-Whitney (utilizat pentru verificarea existenei egalitii dintre dou populaii),
- testul Kolmogorov-Smirnov (testeaz identitatea a dou funcii de repartiie), etc.
Admitem ca parametru - nivelul mediu al distribuiei unei medii i un estimator al
acestuia. Testarea ipotezei ca o valoare a estimatorului estimeaz valoarea parametrului ,
presupune parcurgerea urmtoarele etape:
1. formularea ipotezelor ipotezele pot fi sub forma testului bilateral sau unilateral de stnga sau
de dreapta;

2. alegerea testului statistic depinde de volumul eantionului extras i de cunoaterea sau


necunoaterea variantei distribuiei.
3. specificarea unui prag de semnificaie al test se asociaz testului o probabilitate pragul
de semnificaie asociat testului, adic riscul pe care l admitem n respingerea ipotezei nule cnd
aceasta este adevrat.
4.definirea regiunii de respingere
5. calcularea valorii numerice a statisticii test folosind datele rezultate din observarea
eantionului.
6. formularea concluziilor (decizia) se compar valoarea calculate a statisticii respective cu
valoarea critic a lui z sau t cu (n-1) grade de libertate pentru pragul de semnificaie ales:

dac valoarea numeric calculat a statisticii cade n regiunea de respingere, se


poate spune c ipoteza alternativ este adevarat;

daca valoarea statisticii nu cade n regiunea de respingere, avem rezerve s


spunem c ipoteza este adevarat.

Considerente teoretico-metodologice
-Pentru eantioanele de volum redus (n 30)
, forma distribuiei de eantionare a
mediei x depinde de forma populaiei generale din care este extras eantionul
S2
2
-Dac nu se cunoate dispersia colectivitii generale
,
atunci
dispersia
eantionului
0
este posibil s nu ofere o aproximare foarte bun a lui 02
-n consecin, n locul statisticii z care necesit cunoaterea cu o bun aproximare a lui 0
se utilizeaz statistica: t (Student)
Testarea ipotezei privind media populaiei generale
Ipotezele statistice vor fi, n aceste condiii:
pentru test bilateral;
H0: = 0
H1: 0
pentru test unilateral dreapta;
H0: = 0
H1: > 0
pentru test unilateral stnga;
H0: = 0
H:1 < 0
Pentru eantioane de volum mic (n 30)
, testul statistic utilizat este:

sx

x
sx

unde : S x2

( xi

x) 2

n 1
3

Dac pragul de semnificaie ( ) este stabilit atunci regiunea critic Rc este:

Rc : t

sau t

/ 2, n 1

Rc : t

pentru test unilateral dreapta

,n 1

Rc : t

pentru test bilateral

/ 2, n 1

pentru test unilateral stnga

,n 1

Exemplu
Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul
companiei n anul curent. Valorile previzionate sunt 2,6; 3,32; 1,80; 3,43; 2,00 (miliarde
lei). tiind c profitul n anul anterior profitul a fost de 2,01 miliarde lei, se poate
concluziona cu o probabilitate de 95% c media previziunilor experilor este semnificativ
mai mare dect cifra anului anterior ?
Rezolvare:
E1: H0: = 0
H1: > 0
E2: Se alege nivelul de ncredere al testului statistic (1

) 95%

0.05

E3:se stabilete testul statistic utilizat drept criteriu de acceptate sau respingere a ipotezei
nule ( H 0 ), n funcie de volumul eantionului i obiectivul urmrit
volum mic ( n 30
- H1: > 0

) -> testul t

- testul unilateral dreapta

Rc : t

,n 1

E4: se calculeaz valoarea numeric a testului statistic pe baza datelor din eantion

2,6 3,32 1,8 3,43 2


5

x) 2

( xi

S x2

2,203
0,5507
4

n 1

sx

x
sx

2,63

E5 Se determin

Sx

S x2

0,74

2,63 2,01
1,874
0,74 5

Rc : t

,n 1

astfel:

,n 1

t0,05;4

2,132

Se caut n tabelul cu valorile repartiiei Student n funcie de probabilitate P(t


i numrul gradelor de libertate (f=n-1)

t )

E6:Se verific dac valoarea testului cade n regiunea critic i se ia decizia


Cum t 1,874 t0,05;4

2,132

acceptm ipoteza nul H 0

i respingem H 1

Rezult c nu se poate trage concluzia c media profitului previzionat pentru anul


curent va fi semnificativ mai mare dect profitul anului trecut (2,01 milioane lei)
Pentru eantioane de volum mare

0
x

(n>30) , testul statistic utilizat este:

unde :

2
x

( xi

x) 2

Dac pragul de semnificaie ( ) este stabilit atunci regiunea critic Rc este:


Rc : z

/2

Rc : z

Rc : z

sau

/2

pentru test bilateral

z , pentru test unilateral dreapta

z ,pentru test unilateral stnga

Exemplu
Patronul unei firme de prestri servicii dorete s fluidizeze servirea clienilor i,
pn n prezent, el presupunea c timpul de servire al clienilor este normal distribuit, de
medie 130 minute i abatere medie ptratic de 15 minute. El este de acord cu abaterea
medie ptratic, dar se ndoiete de faptul c durata medie de servire a unui client este de
130 minute. Pentru a studia aceast problem, nregistreaz timpii de servire pentru 100
clieni. Timpul mediu obinutn eantion este de 120 minute. Poate patronul s
5

concluzioneze faptul c timpul mediu este diferit de intervalul de 130 minute pentru o
probabilitate de 99%?
Rezolvare:
E1: H0: = 0
H1: 0
E2: Se alege nivelul de ncredere al testului statistic (1

99%

0.01

E3:se stabilete testul statistic utilizat drept criteriu de acceptate sau respingere a ipotezei
nule ( H 0 ), n funcie de volumul eantionului i obiectivul urmrit
volum mare ( n

) -> testul z

30

- H1: 0- testul bilateral


Rc : z

/2

sau

/2

E4: se calculeaz valoarea numeric a testului statistic pe baza datelor din eantion

0
x

E5: Se determin Rc : z

120 130

15 / 100

/2

sau

/2

6.67

astfel:

z / 2 z 0,005 2,575
E6:Se verific dac valoarea testului cade n regiunea critic i se ia decizia
Cum z

6.67

z 0,005

2.575

se respinge H0 i se accept H1.


Rezult c nu sunt suficiente dovezi pentru a respinge ipoteza nul H0 i pentru a
accepta ipoteza alternativ, aceea c timpul mediu de servire al unui client este diferit
de 130 minute.

Aplicaii propuse spre rezolvare :


1. Un fabricant de automobile a estimat c un nou tip de maini obine un consum mediu
de 11 litri la 100 km, dar compania care dorea s comercializeze aceste maini pretindea c acest
consum depete estimaia productorului. Pentru a susine afirmaia, compania a selectat 36 de
maini i a nregistrat consumul. Au rezultat datele: x 11,8 litri / 100 km; s = 3,0 litri / 100 km.
a) Dac cei interesai doresc s arate c media consumului este mai mare de 11 litri / 100
km, care este ipoteza nul? Dar ipoteza alternativ?
b) Efectuai testarea pentru

= 0,05.

2. Analiza unui eantion aleator de 49 de observaii a dus la urmtoarele rezultate:


x

20,7 ;

xi

2,155 .

a) Testai ipoteza nul

20,47 , cu ipoteza alternativ:

20,47 , utiliznd o

probabilitate de 99%.
b) Testai ipoteza nul

20,47 cu ipoteza alternativ

20,47 utiliznd o probabilitate

de 90%.
3.

Un productor de imprimante pentru calculatoare personale dorete s estimeze media

numrului de caractere tiprite pn cnd se consum cerneala. Costul crescut al unei astfel de
anchete impune utilizarea unui eantion de volum redus. Presupunem c au fost testate n = 15
imprimante i s-au calculat: x 1,13 milioane caractere, s = 0,27 milioane caractere.
a) S se testeze cu o probabilitate de 90% intervalul de ncredere pentru numrul mediu de
caractere.
b) S se testeze ipoteza nul

1,00 milioane, cu ipoteza alternativ

1,00 milioane

caractere, utiliznd o probabilitate de 95%, n ipoteza distribuiei normale a numrului de


caractere n colectivitatea general.

S-ar putea să vă placă și