Sunteți pe pagina 1din 24

Testarea ipotezelor statistice

Concepte
 Ipoteză statistică = ipoteza care se face cu privire la parametrul unei
repartiţii sau la legea de repartiţie pe care o urmează anumite variabile
aleatoare.
 Ipoteză nulă (H0) = ipoteza care se consideră a priori adevărată.
 Ipoteză alternativă (HA) = o ipoteză care contrazice ipoteza nulă. Ea va
fi acceptată doar când există suficiente dovezi în favoarea acesteia.
 Dacă ipoteza nulă constă în afirmaţia că parametrul θ al unei distribuţii
este egal cu o anumită valoare θ0:
 ipoteză alternativă simplă: θ = θ1
 ipoteză alternativă compusă:

θ ∈ {θ 1 ,θ 2 ,...,θ k }
Concepte
 Testul statistic este utilizat drept criteriu de acceptare sau de
respingere a ipotezei nule
 Regiunea critică, Rc = valorile numerice ale testului statistic
pentru care ipoteza nulă va fi respinsă.
 este astfel aleasă încât probabilitatea ca ea să conţină testul statistic, când
ipoteza nulă este adevărată să fie α, cu α mic (α=0.01 etc).
 Dacă valoarea calculată a testului statisticic se află în regiunea critică Rc,
ipoteza H0 se respinge
 regiunea critică este delimitată de valoarea critică, C – punctul de tăietură
în stabilirea acesteia.
Concepte
 Eroare de genul întâi = eroarea pe care o facem eliminînd o ipoteză nulă,
deşi este adevărată.
 Riscul de genul întâi (α) = probabilitatea comiterii unei erori de genul întâi;
se numeşte nivel sau prag de semnificaţie.
 Nivelul de încredere al unui test statistic este (1-α) iar în expresie
procentuală, (1-α)100 reprezintă probabilitatea ca rezultatele să fie
adevărate.
 Eroare de genul al doilea = eroarea pe cere o facem acceptînd o ipoteză
nulă, deşi este falsă.
 Probabilitatea (riscul) comiterii unei erori de genul al doilea este β.
 Puterea testului statistic este (1-β).
 P-value=cel mai mic nivel de semnificaţie la care poate fi respinsă ipoteza
nulă.
Concepte

 Erorile în testarea ipotezelor statistice

Decizia de Ipoteza adevărată


acceptare H0 H1
H0 Decizie corectă Eroare de tip II
(probabilitate 1-α) (risc β)
HA Eroare de tip I Decizie corectă
(risc α) (probabilitate 1-β)
 α= P(respingere H0 ‫ ׀‬H0 este adevărată)=P(eroare de tip I)
 β= P(acceptare H0 ‫ ׀‬H0 este falsă)=P(eroare de tip II)
Concepte

Legătura dintre probabilităţile α şi β


Etapele verificării ipotezelor
statistice

 Identificarea ipotezelor ce trebuie testate


 Identificarea testului statistic
 Specificarea nivelului de semnificaţie
 Stabilirea regulii de decizie
 Culegerea datelor şi realizarea calculelor
 Luarea deciziei statistice
 Aplicarea deciziei statistice în lumea concretă
Efectuarea testului statistic
 Condiţia esenţială în verificarea ipotezelor statistice este că
variabila de interes urmează o repartiţie normală:

X : N( µ , σ )2

 Se extrage un eşantion aleator din respectiva populaţie


normală
x : ( x1,..., x n)

 Pe baza eşantionului se calculează valoarea estimatorului


parametrului populaţiei de interes şi apoi valoarea testului
 Forma generală a testului statistic:
valoarea estimată - valoarea ipotetică
eroarea standard a estimatorului
Concepte
 Se fac presupuneri despre populaţia sau populaţiile ce sunt eşantionate (normalitate etc.).
 Se calculează apoi testul statistic şi se determină valoarea sa numerică, pe baza datelor din eşantion.
 Se desprind concluziile: ipoteza nulă este fie acceptată, fie respinsă, astfel:
 dacă valoarea numerică a testului statistic cade în regiunea critică (Rc), respingem ipoteza nulă şi acceptăm ipoteza
alternativă. Această decizie este incorectă doar în 100 α % din cazuri;
 dacă valoarea numerică a testului nu se află în regiunea critică (Rc), se acceptă ipoteza nulă H0.
Concepte
 Ipoteza alternativă poate avea una din trei forme (pe care le vom exemplifica
pentru testarea egalităţii parametrului „media colectivităţii generale“, μ cu valoarea
μ0)
 test bilateral:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
 test unilateral dreapta:
H0: μ = μ0
H1: μ > μ0
 test unilateral stânga:
H0: μ = μ0
H1: μ < μ0
Teste pentru media populaţiei
- σ este cunoscută
2

• Se aplică testul “z”


α
•Se stabileşte pragul de semnificaţie , de
regulă 0.05
•Se extrage un eşantion aleator din
x :(
respectiva populaţie x ,...,
normală
1 x )n
x − µ0
•Se calculează valoarea statisticii z=
σ/ n
•Se compară valoarea calculată cu o valoare
tabelată(valoare critică) şi se ia decizia
Testul z bilateral
 Ipoteze: H 0 : µ =µ0

H A : µ ≠µ 0
 Valoarea critică:zα / 2

 Decizia: 
 z > z α / 2⇒ resping H 0

altfel ⇒ accept H 0

Testul z unilateral dreapta
 Ipoteze: H 0 : µ =µ0

H A : µ >µ 0
 Valoarea critică: zα

 Decizia:  z > zα ⇒ resping H 0



altfel ⇒ accept H 0
Testul z unilateral stînga
 Ipoteze: H 0 : µ =µ0

H A : µ <µ 0
 Valoarea critică:− zα

 Decizia:  z < − z α ⇒ resping H 0



altfel ⇒ accept H 0
Regiunea critică

− zα / 2 μ zα / 2 μ zα − zα μ
a) b) c)

Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
Exemplu
 Un fond de investiţii a obţinut în anul 2005 un profit
mediu lunar de 12%. Rezultatele pentru primele 9
luni ale anului 2006 arată un profit mediu lunar de
11.5%.
Din cercetări anterioare, se cunoaşte că riscul mediu
al fondului de investiţii, măsurat prin abaterea
standard, este σ=2%.
Se poate afirma, folosind o probabilitate de 95%, ca
profitul mediu lunar în anul 2006 este semnificativ
diferit ce profitul mediu lunar obţinut în anul 2005?
Soluţie-testul z bilateral

 Variabila de interes: X – profitul lunar – presupunem o


distribuţie normală X : N( µ , σ2 ) .
 Dispersia populaţiei este cunoscută: σ = 0.02 ⇒ 2 σ 0.0004
=
 Profitul mediu lunar în anul 2005: µ 0 = 0.12
 Profitul mediu lunar în cele n=9 luni din 2006:x = 0.115
 Pragul de semnificaţie: α = 0.05 (5% )
Ipotezele: H : µ =µ
 0

0

H A : µ ≠µ 0

 Valoarea critică: zα / 2 = 1.96


x − µ 0 0.115 − 0.12
 Valoarea testului: z = = = −0.083
σ/ n 0.02 / 9

 Verificarea: z = 0.083 < zα / 2 = 1.96

 Decizia: acceptH 0 i.e. cu probabilitatea de 95%


putem afirma că profitul mediu lunar obţinut în
cele 9 luni ale anului 2006 nu este semnificativ
diferit de valoarea de 12% obţinută în anul 2005.
Teste pentru media populaţiei
- σ este necunoscută
2

•Se estimează dispersia populaţiei cu dispersia de


n
eşantion:

( x −x) 2i
s =
2 i =1

n −1
•Se aplică testul “t”, similar cu testul “z”
x − µ0
t=
•Se calculează valoarea statisticii s / n

•Valorile critice sînt cuantilele repartiţiei


t(Student) cu n-1 grade de libertate şi nivelul de
Regiunea critică-testul t

− tα / 2 ;n − 1 μ tα / 2;n − 1 μ tα ;n − 1 − tα ;n − 1 μ
a) b) c)

Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga
Exemplu – testul t
 Un producător de bere afirmă că volumul unei cutii este de 0.33
litri. Inspectorii de calitate vor să verifice acest lucru şi selectează
aşeator un eşantion de 16 cutii care sînt gata de comercializare.
În urma prelucrării datelor, s-au obţinut următoarele rezultate:

n
∑xi = 5.25
 i =1
n
 ( x −x) =
 ∑ i
2
23.04
 i =1 producătorului? Folosiţi un nivel de
Confirmă datele afirmaţia
încredere de 95%.
Soluţie-testul t

 Variabila de interes: X – volumul unei cutii de bere –


presupunem o distribuţie normală
X : N( µ , σ )
2

 Dispersia populaţiei este necunoscută - va trebui


estimată: n

∑ ( xi − x2
)
23 .0 4
s =
2 i=1
= 1 .5 36 =
n−1 15
Volumul mediu ipotetic: µ 0 = 0.33 n

∑x i
 Volumul mediu din eşantion: x= i =1
= 0.328
n
 Pragul de semnificaţie: α = 0.05 (5% )
Ipotezele:
 H 0 : µ = µ0


H A : µ ≠ µ 0
 Valoarea critică:
tα / 2;n −1 = t0.05/ 2;15 = 2.48 = TINV (α , n − 1)
 Valoarea testului: x − µ 0 0.382− 0.33
t= = = −
0.00038
 Verificarea:
s/ n 1.24 / 16

t = 0.00038 < tα / 2;n −1 = 2.48


 Decizia : cu probabilitatea 95% nu sînt suficiente
motive pentru a respinge ipoteza nulă.

S-ar putea să vă placă și