Sunteți pe pagina 1din 21

Testarea ipotezelor statistice I

1
1. Concepte şi notaţii
2. Paşii procesului de testare
3. Testarea ipotezei privind media (μ) a unei populatii normale
N(μ,σ2), cand dispersia σ2 populaţiei generale nu este
cunoscuta (testul t)
4. Testarea ipotezei privind media populaţiei generale (μ) pentru
eşantioane de volum mare n>30 (testul z)

2
TESTAREA IPOTEZELOR STATISTICE
 Testarea ipotezelor statistice reprezintă o altă modalitate, alături de estimaţia pe
interval de încredere, de a realiza inferenţa statistică.
 Scopul acestui tip de inferenţă este să determinăm dacă există suficiente dovezi
statistice care să ne permită să concluzionăm că o afirmaţie (sau o ipoteză) despre
un parametru este adevărată.
 În urma prelevării unui eşantion dintr-o populaţie statistică, prin prelucrarea
datelor provenite din sondaj se obţine un estimator (estimatie) al parametrului
urmărit în populaţia de origine.
 Se pune atunci problema în ce măsură parametrul estimat pe baza rezultatelor
sondajului asigură „credibilitatea” aprecierilor făcute asupra întregii populatii
staistice.
 Estimatorul reprezintă o „presupunere” asupra parametrului, deci o ipoteză
statistică.
 Orice functie de datele de selectie se numeste functie de selectie sau statistica
(“statistica testului”).

3
Notaţii
INDICATORUL COLECTIVITATEA COLECTIVITATEA DE
GENERALĂ SELECŢIE
(POPULAŢIA TOTALĂ) (EŞANTION)
PARAMETRII ESTIMATORI
N n

MEDIA x i x
i 1
i
i 1 x

N n
N n

 x     x  x 
2 2
DISPERSIA i i
(VARIANŢA) 2  i 1
s2  i 1
N n 1
ABATEREA MEDIE N n
 x    x  x 
2 2
PĂTRATICĂ i i
(ABATEREA   2  i 1
s  s2  i 1

STANDARD) N n 1

4
Concepte
 Ipoteza statistică = o afirmatie cu privire la parametrul repartiţiei unei variabile aleatoare.
 Ipoteza nulă (H0) = constă întotdeauna în admiterea caracterului întâmplător al
deosebirilor, adică în presupunerea că nu există deosebiri esenţiale;
= afirmatie in care se specifica valori ipotetice pentru parametrul
populatiei totale.
 Ipoteza alternativă (H1) = o teorie care contrazice ipoteza nulă. Ea va fi acceptată doar
când există suficiente dovezi, evidenţe, pentru a se stabili că este adevărată.
= o afirmatie despre acelasi parametru al populatiei totale ca si cel la
care se refera H0 , dar care contrazice ipoteza nula.
 Dacă ipoteza nulă constă în afirmaţia că parametrul θ al unei distribuţii este egal cu o
anumită valoare θ0:
 ipoteză alternativă simplă: θ = θ1
 ipoteză alternativă compusă:
  { 1 , 2 ,..., k }
 Cele două ipoteze reprezintă teorii, mutual exclusive şi exhaustive, asupra valorii
parametrului populaţiei.

5
Concepte
 Procedeul de verificare a unei ipoteze statistice se numeşte test sau
criteriu de semnificaţie.
 Există cinci componente principale ce se precizează in testarea unei
ipoteze statistice:
• ipoteza nulă;
• ipoteza alternativă;
• statistica testului;
• pragul de semnificatie;
• regiunea critică (de respingere a ipotezei nule).
 Statistica testului este utilizata drept criteriu de acceptare sau de
respingere a ipotezei nule

6
Concepte
 Regiunea critică (de respingere a lui H0), Rc
=valorile numerice ale statisticii testului pentru care ipoteza
nulă va fi respinsă.
 este astfel aleasă încât probabilitatea ca ea să conţină testul statistic, când ipoteza
nulă este adevărată să fie α, cu α mic (α=0.01 etc).
 dacă valoarea testului cade în regiunea critică Rc, ipoteza H 0 se respinge, iar dacă
punctul cade în afara regiunii critice Rc, ipoteza H 0 se acceptă (sau nu avem motive
sa o respingem).
 regiunea critică este delimitată de valoarea critică, C – punctul de tăietură în
stabilirea acesteia.
 Eroare de genul întâi = eroarea pe care o facem eliminând o
ipoteză nulă, deşi este adevărată.
 Riscul de genul întâi (α) = probabilitatea comiterii unei erori de
genul întâi; se numeşte nivel sau prag de semnificaţie.

7
Paşii procesului de testare
1) Se identifică ipoteza statistică specială despre parametrul populaţiei
Ipoteza nulă (H0) specifică întotdeauna o singură valoare a parametrului
populaţiei şi reprezintă ceea ce este acceptat până se dovedeşte a fi fals.
2) Se formulează ipoteza alternativă (de cercetat), H1, ce reprezintă o teorie
care contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente
dovezi, evidenţe, pentru a se stabili că este adevărată.
Ipoteza alternativă poate căpăta trei forme, care răspund la trei tipuri de
întrebări referitoare la parametrul studiat:
- dacă parametrul este diferit faţă de valoarea specificată în ipoteza nulă (test
bilateral);
- dacă parametrul este mai mic sau mai mare faţă de valoarea specificată în
ipoteza nulă (test unilateral stanga, respectiv unilateral dreapta).
3) Identificarea statisticii testului si a repartitiei acestuia dupa presupunerile despre
populatia ce este esantionata.
4) Se specifica pragul de semnificatie α al testului.

8
Paşii procesului de testare
5) Se culeg datele si se calculează indicatorii statistici în eşantion.
6) In ipoteza ca H0 este adevarata si pe baza datelor culese de la
unitatile esantionului, se calculeaza valoarea statisticii testului.
7) Se stabileşte regiunea critică-Rc si valoarea critica a testului in
functie de repartitia statisticii testului si a pragului de semnificatie.
Regiunea critică reprezintă valorile numerice ale testului statistic
pentru care ipoteza nulă va fi respinsă.
8) Se desprind concluziile:
a) dacă valoarea numerică a testului statistic cade în regiunea critică
(Rc), respingem ipoteza nulă şi concluzionăm că ipoteza alternativă
este adevărată.
b) dacă valoarea numerică a testului nu cade în regiunea critică (Rc),
se acceptă ipoteza nulă H0.

9
Formularea ipotezelor
 Daca se doreste testarea ipotezei privind media µ a unei populatii
de caracteristica X, atunci
 Ipoteza alternativă poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalităţii parametrului „media colectivităţii
generale“, μ cu valoarea μ0)
 test bilateral:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
 test unilateral dreapta:
H0: μ = μ0
H1: μ > μ0
 test unilateral stânga:
H0: μ = μ0
H1: μ < μ0
10
Regiunea critică

μ μ
μ
a) b)
c)

Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga

11
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
cand dispersia σ2 populaţiei generale nu este cunoscută (testul t)

 Condiţia esenţială în verificarea ipotezelor statistice este că variabila


de interes urmează o repartiţie normală X~N(μ,σ2)
 Se extrage un esantion de volum n din respectiva populatie: x1,x2,…,xn.
 Testam ipoteza H0: μ = μ0 (sau μ - μ0=0)
cu alternativa H1: μ ≠ μ0 (sau μ - μ0≠0)
(adică μ < μ0 sau μ > μ0); (test bilateral)
 Statistica testului este
x
t
s
n

care urmeaza o repartiţie Student cu n-1 grade libertate.

12
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
când dispersia σ2 populaţiei generale nu este cunoscută (testul t)

1 n
 Media de selectie x  n  xi este un estimator nedeplasat al mediei
i 1
populatiei generale μ. n

 x  x
2
i
 Abaterea standard de selectie s x  s x2  i 1 este un estimator
n 1
nedeplasat al abaterii standard necunoscute    2 a populaţiei
generale.
 In ipoteza că H0 este adevarată, adica μ= μ0, şi pe baza datelor din
eşantion, se calculeaza statistica testului
x  0
t calc 
sx / n

 Fie α pragul de semnificatie si fie t α/2,n-1 cuantila superioara de ordinul α/2 a


repartitiei Studentn-1 numită valoarea critică a testului (se gaseste in tabele sau
este furnizata de softuri statistice)

13
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
când dispersia σ2 populaţiei generale nu este cunoscută (testul t)

 Regiunea critică: t<-t α/2,n-1 sau t>t α/2,n-1

 Regula de decizie: respingem H0 dacă

tcalc< t α/2,n-1 sau tcalc> t α/2,n-1

 În cazul testelor unilaterale

H1: μ > μ0 (sau μ - μ0>0) (test unilateral dreapta)


sau H1: μ < μ0 (sau μ - μ0<0) (test unilateral stanga)

Regiunea critică (de respingere a ipotezei nule) se stabileşte astfel:


t>t α,n-1 pentru test unilateral dreapta (H1: μ > μ0)
t<-tα,n-1 testul unilateral stanga (H1: μ < μ0)

14
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum mare n>30 (testul z)

 In verificarea ipotezelor statistice referitoare la media unei populatii,


putem relaxa conditia ca variabila de interes X să urmeze o repartiţie
normală prin utilizarea eşantioanelor de volum mare ce face posibilă
aplicarea teoremei limită centrală. Aceasta teoremă dă posibilitatea
folosirii repartiţiei normale drept lege practică de aproximare.
 Se consideră o populaţie statistică de caracteristica X, cu media μ si
dispersia σ2, din care se extrage un esantion de volum mare n (n>30),
valorile obtinute in urma selectiei sunt x1,x2,…,xn.
 Testăm ipoteza H0: μ = μ0 (sau μ - μ0=0)
cu alternativa H1: μ ≠ μ0 (sau μ - μ0≠0)
(adică μ < μ0 sau μ > μ0) (test bilateral)
 Statistica testului este
x x
z  ~ N 0,1
 n mare s x
n n
15
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum mare n>30 (testul z)

 In ipoteza că H0 este adevarata, adica μ= μ0, şi pe baza datelor din


eşantion, se calculează statistica testului
x  0
z calc 
sx
n
 Fie α pragul de semnificatie si fie zα/2 cuantila superioara de ordinul α/2
a repartitiei normale standard N(0,1) (valoarea critică a testului z)

 Regiunea critică: z<-zα/2 sau z>zα/2


 Regula de decizie:
respingem H0 dacă zcalc<-zα/2 sau zcalc>zα/2

16
Testarea ipotezei privind media populaţiei generale (μ) pentru
eşantioane de volum mare n>30 (testul z)

În cazul testelor unilaterale


H1: μ > μ0 (sau μ - μ0>0) (test unilateral dreapta)
sau H1: μ < μ0 (sau μ - μ0<0) (test unilateral stânga)

Regiunea critică (de respingere a ipotezei nule) se stabileşte astfel:

z>zα pentru test unilateral dreapta (H1: μ > μ0)


z<-zα pentru test unilateral stanga (H1: μ < μ0)

17
Funcţia Gauss-Laplace

 (z ) este o funcţie simetrică faţă de origine, şi deci funcţia  este o funcţie impară. Prin
urmare este suficient să cunoaştem  (z ) pentru z  0 .

n (z;0,1)

z
 ( z )   n(t;0,1)dt
0

18
Distribuţia Student (pentru eşantioane de volum redus)

n (x;0,1)

Se arată că lim f (t , n)  N (t ;0,1) , deci t este aproximată suficient de bine de N (x;0,1)


n 

pentru n  30 .Altfel spus, dacă eşantionul este mare, distribuţia Student aproximează
distribuţia normală.

19
Aplicaţii
1. Conducerea unei companii apelează la 5 experţi pentru a previziona profitul companiei în anul curent.
Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preţurile anului anterior). Ştiind
că profitul companiei în anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi pentru a
concluziona că media previziunilor experţilor este semnificativ mai mare decât cifra anului anterior
(pentru α = 0,05)? Presupunem ca profitul este o variabila cu repartitie normala.

Media previziunilor experţilor este x  2,63 mld. lei,

x x  2,2030,5507


2
i
Dispersia s 
2
x
n1 4
Abaterea standard s x  s 2x  0mld.
,74 lei.
Elementele procesului de testare a ipotezei statistice sunt:
H0: μ = 2,01, x x 2,63  2,01
t
   1,874
H1: μ > 2,01 (test unilateral dreapta). sx sx n 0,74 / 5
Cum tα,n-1 = t0,05;4 = 2,132, regiunea critică este dată de t>tα,n-1.
Dar tcalc=1,874< t0,05;4=2,132, nu putem trage concluzia că media profitului previzionată de cei
5 experţi pentru anul curent este semnificativ mai mare decât profitul anului trecut, de 2,01 mld. lei.

20
Aplicaţii
2. Un fabricant de materiale de construcţii comercializează ciment în pungi, care
trebuie să conţină 12 kg/pungă. Pentru a detecta eventuale abateri în ambele
sensuri de la această cantitate, selectează 100 de pungi, pentru care calculează
kg, sx= 0,5 kg. Pentru α = 0,01 (grad de încredere (1- α)100=99%) să se determine
dacă se acceptă ipoteza nulă, aceea că greutatea pungilor este în medie de 12 kg.
x  11 , 85

H0: μ = 12
H1: μ ≠ 12 ( μ < 12 sau μ > 12);
z α/2 =z0,005=2,575
x  12 x  12 x  12 11,85  12
z     3,0
x  n s n 0,5 10

Regiunea critică: z< - z α/2 sau z> z α/2

Cum z = - 3,0 < - 2,575 se respinge ipoteza nulă H0 şi se acceptă ipoteza


alternativă, aceea că greutatea pungilor diferă semnificativ de 12 kg.
21

S-ar putea să vă placă și