Documente Academic
Documente Profesional
Documente Cultură
CURS 2.
Testarea ipotezelor statistice
1
Structura curs 2
1. Concepte şi notaţii
2. Paşii procesului de testare
3. Testarea ipotezei privind media (μ) a unei populatii normale
N(μ,σ2), cand dispersia σ2 populaţiei generale nu este
cunoscuta (testul t)
4. Testarea ipotezei privind media populaţiei generale (μ) pentru
eşantioane de volum mare n>30 (testul z)
5. Aplicaţii
2
TESTAREA IPOTEZELOR STATISTICE
Testarea ipotezelor statistice – metoda de realizare a inferenţei
statistice.
Scopul metodei:
- se determină existenta unor dovezi statistice suficiente care să permită
concluzia că o afirmaţie (sau o ipoteză) despre un parametru este
adevărată sau nu.
Prin extragerea aleatoare a unui eşantion dintr-o populaţie statistică, prin
prelucrarea datelor provenite din sondaj se obţine un estimator
(estimatie) al parametrului urmărit în populaţia de origine.
Se pune atunci problema în ce măsură parametrul estimat pe baza
rezultatelor sondajului asigură „credibilitatea” aprecierilor făcute asupra
întregii populatii statistice.
Estimatorul reprezintă o „presupunere” asupra parametrului, deci o
ipoteză statistică.
3
Notaţii
INDICATORUL COLECTIVITATEA COLECTIVITATEA DE
GENERALĂ SELECŢIE
(POPULAŢIA TOTALĂ) (EŞANTION)
PARAMETRII ESTIMATORI
N n
MEDIA x i xi =1
i
i =1
= x=
N n
(x − x )
N n
(x − ) 2 2
DISPERSIA i i
(VARIANŢA) 2 = i =1
s2 = i =1
N n −1
ABATEREA MEDIE
(x − x )
N
(x − )
n
2 2
PĂTRATICĂ i i
(ABATEREA = 2 = i =1
s = s2 = i =1
STANDARD) N n −1
4
Concepte
1. IPOTEZA STATISTICĂ = o afirmatie cu privire la parametrul repartiţiei unei
variabile aleatoare.
Ipoteza nulă (H0) = afirmatie in care se specifica valori ipotetice pentru
parametrul populatiei totale.
-constă întotdeauna în admiterea caracterului întâmplător al deosebirilor, adică în presupunerea că nu
există deosebiri esenţiale;
5
Concepte
6
Concepte
3. Regiunea critică (de respingere a lui H0), Rc
=valorile numerice ale statisticii testului pentru
care ipoteza nulă va fi respinsă.
◼ este astfel aleasă încât probabilitatea ca ea să conţină testul statistic, când
ipoteza nulă este adevărată să fie α, cu α mic (α=0.01 etc).
◼ dacă valoarea testului cade în regiunea critică Rc, ipoteza H0 se respinge,
iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă (sau
nu avem motive sa o respingem).
◼ regiunea critică este delimitată de valoarea critică, C – punctul de tăietură
în stabilirea acesteia.
4. Erorile
Eroare de genul întâi = eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată.
Riscul de genul întâi (α) = probabilitatea comiterii unei erori de genul întâi; se numeşte nivel sau
prag de semnificaţie.
7
Paşii procesului de testare
1) Se identifică ipoteza statistică specială despre parametrul populaţiei
Ipoteza nulă (H0) specifică întotdeauna o singură valoare a parametrului
populaţiei şi reprezintă ceea ce este acceptat până se dovedeşte a fi fals.
2) Se formulează ipoteza alternativă (de cercetat), H1, ce reprezintă o teorie
care contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente
dovezi, evidenţe, pentru a se stabili că este adevărată.
Ipoteza alternativă poate căpăta trei forme, care răspund la trei tipuri de
întrebări referitoare la parametrul studiat:
- dacă parametrul este diferit faţă de valoarea specificată în ipoteza nulă (test
bilateral);
- dacă parametrul este mai mic sau mai mare faţă de valoarea specificată în
ipoteza nulă (test unilateral stanga, respectiv unilateral dreapta).
3) Identificarea statisticii testului si a repartitiei acestuia dupa presupunerile despre
populatia ce este esantionata.
4) Se specifica pragul de semnificatie α al testului.
8
Paşii procesului de testare
5) Se culeg datele si se calculează indicatorii statistici în eşantion.
6) In ipoteza ca H0 este adevarata si pe baza datelor culese de la
unitatile esantionului, se calculeaza valoarea statisticii testului.
7) Se stabileşte regiunea critică-Rc si valoarea critica a testului in
functie de repartitia statisticii testului si a pragului de semnificatie.
Regiunea critică reprezintă valorile numerice ale testului statistic
pentru care ipoteza nulă va fi respinsă.
8) Se desprind concluziile:
a) dacă valoarea numerică a testului statistic cade în regiunea critică
(Rc), respingem ipoteza nulă şi concluzionăm că ipoteza alternativă
este adevărată.
b) dacă valoarea numerică a testului nu cade în regiunea critică (Rc),
se acceptă ipoteza nulă H0.
9
Formularea ipotezelor
Daca se doreste testarea ipotezei privind media µ a unei populatii
de caracteristica X, atunci
◼ Ipoteza alternativă poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalităţii parametrului „media colectivităţii
generale“, μ cu valoarea μ0)
test bilateral:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
test unilateral dreapta:
H0: μ = μ0
H1: μ > μ0
test unilateral stânga:
H0: μ = μ0
H1: μ < μ0
10
Regiunea critică
μ μ μ
a) b) c)
Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga
11
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
cand dispersia σ2 populaţiei generale nu este cunoscută (testul t)
12
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
când dispersia σ2 populaţiei generale nu este cunoscută (testul t)
1 n
Media de selectie x = xi este un estimator nedeplasat al mediei
n i =1
populatiei generale μ. n
(x − x)
2
i
Abaterea standard de selectie s x = s x2 = i =1 este un estimator
n −1
nedeplasat al abaterii standard necunoscute = 2 a populaţiei
generale.
In ipoteza că H0 este adevarată, adica μ= μ0, şi pe baza datelor din
eşantion, se calculeaza statistica testului
x − 0
t calc =
sx / n
Fie α pragul de semnificatie si fie t α/2,n-1 cuantila superioara de ordinul α/2 a
repartitiei Studentn-1 numită valoarea critică a testului (se gaseste in tabele sau
este furnizata de softuri statistice)
13
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
când dispersia σ2 populaţiei generale nu este cunoscută (testul t)
14
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum mare n>30 (testul z)
n n
15
Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum mare n>30 (testul z)
x − 0
z calc =
sx
n
Fie α pragul de semnificatie si fie zα/2 cuantila superioara de ordinul α/2
a repartitiei normale standard N(0,1) (valoarea critică a testului z)
16
Testarea ipotezei privind media (μ) a unei populatii normale N(μ,σ2),
când dispersia σ2 populaţiei generale nu este cunoscută (testul t)
17
Funcţia Gauss-Laplace
(z ) este o funcţie simetrică faţă de origine, şi deci funcţia este o funcţie impară. Prin
urmare este suficient să cunoaştem (z ) pentru z 0 .
n (z;0,1)
z
( z ) = n(t;0,1)dt
0
18
Distribuţia Student (pentru eşantioane de volum redus)
n (x;0,1)
pentru n 30 .Altfel spus, dacă eşantionul este mare, distribuţia Student aproximează
distribuţia normală.
19
Aplicaţii
1. Conducerea unei companii apelează la 5 experţi pentru a previziona profitul companiei în anul
curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preţurile anului
anterior). Ştiind că profitul companiei în anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi
pentru a concluziona că media previziunilor experţilor este semnificativ mai mare decât cifra anului
anterior (pentru α = 0,05)? Presupunem ca profitul este o variabila cu repartitie normala.
(x − x ) = 2,203 = 0,5507
2
Dispersia s =
2 i
n −1
x
4
20
Aplicaţii
2. Un fabricant de materiale de construcţii comercializează ciment în pungi, care
trebuie să conţină 12 kg/pungă. Pentru a detecta eventuale abateri în ambele
sensuri de la această cantitate, selectează 100 de pungi, pentru care calculează
kg, sx= 0,5 kg. Pentru α = 0,01 (grad de încredere (1- α)100=99%) să se determine dacă se
acceptă ipoteza nulă, aceea că greutatea pungilor este în medie de 12 kg.
x = 11,85
H0: μ = 12
H1: μ ≠ 12 ( μ < 12 sau μ > 12);
z α/2=z0,005=2,575
x − 12 x − 12 x − 12 11,85 − 12
z= = = = −3,0
x n s n 0,5 10
21