Sunteți pe pagina 1din 31

Testarea ipotezelor

statistice
Structura curs 2

1. Concepte, notaţii, indicatori statistici


2. Etapele procesului de testare a ipotezelor statistice
3. Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum mic, n  30 (testul Student)
4. Aplicaţii

2
Ipoteza statistică.Concepte
 Testarea ipotezelor statistice reprezintă o altă modalitate,
alături de estimaţia pe interval de încredere, de a realiza
inferenţa statistică.
 Scopul acestui tip de inferenţă este să determinăm dacă există
suficiente dovezi statistice care să ne permită să concluzionăm
că o afirmaţie (sau o ipoteză) despre un parametru este
adevărată.
 În urma prelevării unui eşantion dintr-o populaţie statistică,
prin prelucrarea datelor provenite din sondaj se obţine un
estimator (estimație) al parametrului urmărit în populaţia de
origine.
 Estimatorul reprezintă valoarea indicatorului din esantionul
probabilistic care aproximeaza parametrul ce caracterizeaza
populatia de referinta, cea din care s-a extras esantionul
 Despre parametru se crede ca este egal cu o valoare
revendicate sau valoare initiala sau valoare admisa, deci
apare o ipoteză statistică. Se verifica acest lucru cu ajutorul
datelor de sondaj
Indicatorii utilizați în testare-Notaţii,
Mod de Calcul (n≤30 observatii)
INDICATORUL COLECTIVITATEA COLECTIVITATEA DE
GENERALĂ SELECŢIE
(POPULAŢIA TOTALĂ) (EŞANTION)
PARAMETRII ESTIMATORI
N n

MEDIA x i x
i 1
i
i 1 x

N n

 x  x
N n

 xi    2 2
DISPERSIA i
(VARIANŢA) 2  i 1
s2  i 1
N n 1
ABATEREA MEDIE N

 x  x
n
 xi   
2 2
PĂTRATICĂ i
(ABATEREA   
2 i 1
s  s2  i 1

STANDARD) N n 1

4
Ipoteza statistica.Definiție
Definiție = “presupunerea” care se face cu privire la
parametrul unei repartiții sau a legii de repartiție pe care o
urmează anumite variabile aleatoare.
Există două ipoteze statistice:
 ipoteza nulă este ipoteza care urmează a fi testată și
este notată cu H0. Aceasta reprezintă situația initiala,
starea initiala si presupune ca sunt asemanari intre
valorile comparate (cea revendicata sau admisa sau
initiala, pentru parametru populatiei cu cea rezultata
din sondaj) sau pot exista eventuale deosebiri care au
un caracter intamplator;
 ipoteza alternativă reprezinta o situatie a parametrului
populatiei ulterioara celei nule si se noteaza cu H 1.
Este gresit sa consideram ca ipoteza alternativa este
negarea celei nule.
Ipoteza statistică.Concepte
 Procedeul de verificare a unei ipoteze statistice se numeşte test sau
criteriu de semnificaţie.
 Există cinci componente principale ce se precizează in testarea unei ipoteze
statistice:
• ipoteza nulă-ea specifica intotdeauna o singura valoare a
parametrului populatiei si reprezinta status-quo-ul ,ceea ce este
acceptat pana se dovedeste ca poate fi respinsa pe baza dovezilor de
sondaj;
• ipoteza alternativă-ea este validata de catre decident doar cand
exista suficiente dovezi,evidente, pentru a respinge ipoteza nula;
• statistica testului; formula de calcul = (valoare de sondaj – valoare
revendicata sau admisa)/eroarea standard
• nivelul de semnificatie; riscul ales, maxim acceptat pentru a gresi si
a respinge in mod gresit ipoteza nula atunci cand in realitate este
adevarata
• regiunea critică (de respingere a ipotezei nule).
6
 Statistica testului este utilizata drept criteriu de respingere sau nu a
ipotezei nule
Ipoteza statistică.Concepte
 Regiunea critică Rc (de respingere a lui H0) = reprezintă valorile
numerice ale statisticii testului pentru care ipoteza nulă va fi respinsă, cu
probabilitatea 1 - α
 Dacă valoarea calculata a testului cade în regiunea critică Rc, ipoteza H0
se respinge, iar dacă valoarea calculata a testului cade în afara regiunii
critice Rc, ipoteza H0 nu se poate respinge (sau nu avem motive, dovezi
sa o respingem).
 Zona de nerespingere = a unei ipoteze statistice denumita si interval de
încredere reprezinta acel interval in care pe baza aplicarii unui test
statistic se accepta ipoteza nula careia i se asocieaza o probabilitate (1-
α).
 Eroare de genul întâi = eroarea pe care o facem eliminând ipoteză
nulă, deşi este adevărată in realitate
 Riscul de gradul întâi (α) reprezinta probabilitatea comiterii unei erori
de genul întâi si se numeşte nivel de semnificaţie.
 Eroare de tip II =eroarea pe care o facem acceptand ipoteza nula, desi
este falsa in realitate. Probabilitatea (riscul) comiterii unei astfel de erori
se noteaza cu β.Puterea testului statistic este 1-β.
Etapele procesului de testare
 1. Se identifică cele doua ipoteze : cea nulă H0 si cea alternativă H1
 2. Identificarea statisticii testului si a repartitiei acestuia in raport cu
presupunerile care se fac despre populația ce este eșantionată pentru a
respinge sau nu ipoteza nula.
 3.Se stabileste nivelul de semnificatie (α) al testului.

 4. Se stabileşte regiunea critică-(Rc) și valoarea critica a testului în funcție


de repartitia statisticii testului si a nivelului de semnificatie
 5.Se determina valoarea calculata a testului pe baza datelor din esantion.
 6.Reprezentarea grafica si compararea valorii calculate cu valoarea critica a
testului
 7. Se desprind concluziile :a) dacă valoarea numerică a testului statistic
apartine regiunii critice (Rc) sau Regiuneii de respingere, respingem ipoteza
nulă H0;b) dacă valoarea numerică a testului nu apartine regiunii critice
(Rc), ci celei de nonrespingere nu se poate respinge ipoteza nula Ho in
favoarea celei alternative H1.
 8. Luarea unei decizii de management.
Nivelul de incredere al unui test statistic este (1-α), iar in expresie procentuala,
(1-α)*100 reprezinta probabilitatea de garantare a rezultatelor.
Formularea ipotezelor statistice
 Daca se dorește testarea ipotezei privind media µ a unei populații de
caracteristică X, atunci ipoteza alternativă –H1 poate avea una dintre
cele trei forme (pe care le vom exemplifica pentru testarea egalităţii
parametrului „media colectivităţii generale“ μ cu valoarea revendicata
sau admisa sau valoare conform ipotezei nule (denumita si ipoteza
initiala) μ0.

 test bilateral:
H0 : μ = μ 0
H1: μ ≠ μ0 (μ < μ0 si μ > μ0)
 test unilateral dreapta:
H0 : μ = μ 0
H1 : μ > μ 0
9
Formularea ipotezelor statistice

test unilateral stânga:


H0: μ = μ0
H1: μ < μ0

 Regiunea critică in acest caz se reprezintă grafic astfel:


a) b) c)

Regiunea critică pentru a) test bilateral; b) test unilateral dreapta;


c) test unilateral stânga
Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum redus

Pentru eşantioanele de volum redus , forma


distribuţiei de eşantionare a mediei x depinde de forma
populaţiei generale din care este extras eşantionul.
Dacă nu se cunoaşte dispersia colectivităţii generale
atunci dispersia eşantionului este posibil să nu ofere
o aproximare foarte bună a lui
În consecinţă, în locul statisticii care necesită
cunoaşterea cu o bună aproximare a lui se utilizează
stastistica t(Student):
Testarea ipotezei privind media populaţiei
generale (μ) pentru eşantioane de volum redus
 Ipotezele statistice sunt
pentru testul bilateral

pentru testul unilateral dreapta

H 0 :   0
pentru testul unilateral stânga
H1 :    0
 Pentru eşantioane de volum mic , testul
statistic utilizat este:
Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum redus

Dacă nivelul de semnificaţie este stabilit atunci regiunea de


respingere Rc este:
pentru test bilateral
(se compara valorile luate in modul)

pentru test unilateral dreapta

pentru test unilateral stânga

Populația generală în acest caz este normal


distribuită sau aproximativ normal distribuită
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus

 Exemplu_1
Conducerea unei companii apelează la 5 experţi
pentru a previziona profitul companiei în anul
curent. Valorile previzionate sunt 2,6; 3,32; 1,80;
3,43; 2,00 (miliarde lei). Ştiind că în anul anterior
profitul a fost de 2,01 miliarde lei, se poate
concluziona cu o probabilitate de 95% că media
previziunilor experţilor este semnificativ mai
mare decât cifra anului anterior ?

2. Testarea ipotezelor statistice (testul Z şi Student) 14


Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus

 Rezolvare
n = 5 experţi
xi - valorile profitului companiei previzionate
2,6; 3,32; 1,80; 3,43; 2,00 (miliarde lei).
 o  2,01 mld lei profitul anului anterior
(1   )100  95% probabilitatea de 95%

2. Testarea ipotezelor statistice (testul Z şi Student) 15


Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus

Etapa 1:
H 0 :    o sau   2,01 Profitul previzionat de
experti in anul curent este egal cu valoarea profitului
din anul anterior
H1 :    o sau   2,01 Profitul previzionat de
experti in anul curent este semnificativ mai mare decat
valoarea profitului din anul anterior
Etapa 2 - tipul testului: deoarece n  30 , utilizăm
testul ”t” (test ”t” unilateral dreapta) şi se începe
construirea graficului
2. Testarea ipotezelor statistice (testul Student)
16
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus

Etapa 3 – Se stabileste nivelul de semnificatie al


testului statistic
(100   )  95%    5%

Etapa 4: se stabileşte :
 ”t” critic : t ,n 1  t 0,05,51  2,132 , iar valorile se
trec pe grafic
 Regiunea de respingere (critică): dacă Rc : t  t ,n 1
atunci ipoteza nulă H 0 se respinge in favoarea lui
H1
care se valideaza in 95% din cazuri
2. Testarea ipotezelor statistice (testul Student)
17
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus

E5: Se calculează valoarea numerică a testului statistic


pe baza datelor din eşantion
2,6  3,32  1,8  3,43  2
x  2,63
5

s x2 
 (x i  x) 2

2,203
 0,5507 sx  s x2  0,74
n 1 4

x  0 x   0 2,63  2,01
t     1,874
sx sx / n 0,74 5

2. Testarea ipotezelor statistice (testul Student)


18
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus
Etapa 6: Se verifică dacă valoarea testului cade în regiunea critică şi
se ia decizia. Cum t  1,874  t 0 , 05; 4  2,132 nu există
suficiente dovezi pentru a respinge ipoteza nulă H 0

Etapa 7 : Pentru o probabilitate de garantare a rezultatelor de 95%


nu putem trage concluzia că profitul previzionat pentru anul
curent de cei 5 experti va fi semnificativ mai mare decât valoarea
profitul din anul anterior (2,01 milioane lei).

Etapa 8: Deci compania nu a inregistrat rezultate financiare


semnificative in anul curent comparativ cu anul anterior. Profitul
fiind aproximativ la aceeasi valoare cu cel din anul anterior.In
concluzie ar trebui pe viitor sa incerce sa isi schimbe strategia de
marketing; sa reduca costurile de productie;sa isi dezvolte
compartimentul de logistica si parteneriate cu alte firme
19
concurente.
Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum redus

1- α
0,95
α
Regiune de H0 se respinge
nonrespingere H1 se validează
0,025 în 95% cazuri
-∞ µ=0 ∞
Compararea mediilor
dintre două eşantioane de volum redus

 Eşantioanele fiind de volum mic este necesar să


construim o statistică t (Student).
 Vom face presupunerile:
 ambele colectivităţi generale din care s-au extras
eşantioanele sunt normal sau aproximativ normal
distribuite
 dispersiile în cele două colectivităţi sunt egale (sau
inegale)
 eşantioanele aleatoare sunt selectate independent
unul de celălalt

4. Testarea ipotezelor statistice privind eşantioanele de volum mic 21


Compararea mediilor
dintre două eşantioane de volum redus

 Estimatorul dispersiei totale din cele două populaţii


combinate in cazul cand dispersiile sunt egale este:
n1 n2

 i
( x  x1 ) 2
  i
( x  x 2 ) 2

S c2  i 1 i 1

n1  n 2  2
sau
( n  1) S 2
 ( n  1) S 2
S c2  1 x1 2 x2

n1  n2  2

4. Testarea ipotezelor statistice privind eşantioanele de volum mic 22


Compararea mediilor
dintre două eşantioane de volum redus
 Testul statistic utilizat cand dispersiile sunt egale are forma:

( x1  x 2 )  D ( x1  x 2 )  D n1 n 2 n1  n2  2 
t 
2 1 1  S x21 n1  1  S x22 n2  1 n1  n2
S c   
 n1 n2 

 Regiunea critică este dată de:

Rc : t  t / 2,n1  n2  2 sau t  t / 2,n1  n2  2 pentru testul


bilateral

Rc : t  t ,n1  n2  2
pentru testul unilateral dreapta
Rc : t  t ,n1  n2  2
pentru testul unilateral stânga
 D =diferența ipotetică dintre mediile populațiilor, deseori egală cu 0.
4. Testarea ipotezelor statistice privind eşantioanele de volum mic 23
Compararea mediilor
dintre două eşantioane de volum redus

 Așadar dispersia combinată la nivelul


eșantionului este media aritmetică ponderată a
dispersiilor celor două eșantioane și .
 Dacă dispersiile nu sunt egale atunci testul
statistic are forma: ( x1  x 2 )  D
t 
s12 s 22

n1 n2
D =diferența ipotetică dintre mediile populațiilor,
deseori egală cu 0.
Compararea mediilor
dintre două eşantioane de volum redus
Forma generală D=0
Ipoteze statistice
H 0 : ( 1   2 )  D H 0 : 1   2
Test bilateral
H1 : ( 1   2 )  D H 1 : 1   2

H 0 : ( 1   2 )  D H 0 : 1   2
Test unilateral dreapta
H1 : ( 1   2 )  D H 1 : 1   2

H 0 : ( 1   2 )  D H 0 : 1   2
Test unilateral stânga
H1 : ( 1   2 )  D H 1 : 1   2

4. Testarea ipotezelor statistice privind eşantioanele de volum mic 25


Compararea mediilor
dintre două eşantioane de volum redus
Exemplul_2
Să se testeze, cu o probabilitate de 90% dacă între cheltuielile de
funcţionare pentru două mărci de autoturisme (A şi B) există
diferenţe semnificative. Testul a fost efectuat cu 8 posesori ai
autoturismului marca A şi 12 posesori ai autoturismului marca B
care au ţinut evidenţa cheltuielilor de funcţionare pe durata unui
an. Prin prelucrarea datelor primare în cele două eşantioane s-au
obţinut:
pentru marca A n1  8; x1  5,696 S x1  0,485  0,5
n2  12 x 2  5,273 S x 2  0,635
pentru marca B
4. Testarea ipotezelor statistice privind eşantioanele de volum mic 26
Compararea mediilor
dintre două eşantioane de volum redus
Exemplul_2
(1   )100  90% probabilitate de 90%

Eșantion 1_Marca A Eșantion 2_Marca B


n1=8 posesori n2=12 posesori
x1  5,696 um x2  5,273 um
s1  0,485 um s2  0,635 um

4. Testarea ipotezelor statistice privind eşantioanele de volum mic 27


Compararea mediilor
dintre două eşantioane de volum redus
Rezolvare:
Etapa1: Se formuleaza cele doua ipoteze:
H 1 : 1   2 nu exista diferente semnificative privind
cheltuielile de functionare ale celor 2 marci de autoturisme
H 1 : 1   2 exista diferente semnificative privind
cheltuielile de functionare a celor 2 marci de autoturisme
Etapa 2: Se stabileste tipul testului:
deoarece n ≤ 30 , utilizăm testul ”t” (test ”t”bilateral) şi se începe
construirea graficului
Etapa 3 –Se stabileste nivelul de semnificatie al testului statistic
(1   )100  90%   %  10%    0,1
Etapa 4: se stabileşte :”t” critic : t / 2;n1  n2  2  t0,1/ 2;812 2  t0,05;18  1,734
Regiunea de respingere (critică): dacă Rc : t  t / 2,n  n 1 2 2
sau t  t / 2,n1  n2  2
atunci ne aflam in zona de non respingere a ipotezei nulă H 0
28
4. Testarea ipotezelor statistice privind eşantioanele de volum mic
Compararea mediilor
dintre două eşantioane de volum redus

E5: Se calculează valoarea numerică a testului


statistic pe baza datelor din cele două eşantioane

S c2 
8  10,485 2  12  10,635 2
 0,3379
8  12  2

t 
5,696  5,273  0

0,423
 1,594
1 1  0,2653
0,3379  
 8 12 

4. Testarea ipotezelor statistice privind eşantioanele de volum mic 29


Compararea mediilor
dintre două eşantioane de volum redus

Etapa 6: se verifică dacă valoarea calculata a testului cade în


regiunea critică şi se compara cu valoarea critica a testului:
tcalculat 1,594  tcritic (1,734)
Etapa 7: Se desprinde concluzia că, pentru o probabilitate de garantare a
rezultatelor de 90% exista suficiente dovezi statistice pentru a nu
respinge ipoteza nulă H0 (nu sunt diferenţe semnificative între
marca A şi marca B de autoturisme privind acuratetea,evidenta
cheltuielilor de functionare) deoarece valoarea calculata a testului se
gaseste pe grafic in afara regiuni critice in zona de nonrespingere a
ipotezei nule.
Etapa 8: Nu numai cheltuielile de functionare diferentieaza 2 marci de
autoturisme ci si fiabilitatea, nivelul de poluare, pretul, designul,
performanta etc., caracteristici care trebuie avute in principal in
vedere la nivel managerial.
4. Testarea ipotezelor statistice privind eşantioanele de volum mic 30
Compararea mediilor
dintre două eşantioane de volum redus

1- α
0,90

H0 se respinge Regiune de H0 se respinge


H1 se validează non respingere H1 se validează
în 90% cazuri 0,05 0,05 în 90% cazuri
-∞ µ=0 ∞

S-ar putea să vă placă și