Sunteți pe pagina 1din 17

SPD curs 9

Testarea ipotezelor statistice


AC-UTIasi
2020
Introducere

Verificarea ipotezelor statistice este legată de compararea diferitelor


ipoteze asupra unei populaţii statistice (şi nu asupra unui eşantion) cu
datele obţinute prin încercări experimentale. Dacă datele observate nu
sunt compatibile cu o anumită ipoteză, atunci ea trebuie respinsă.

Def: O ipoteză statistică reprezintă o presupunere asupra parametrilor


unei populații
Introducere

O procedură care generează o decizie privind ipoteza nulă se numește


test de ipoteză. Acest test utilizează un eșantion dintr-o populație

În construcția unei test de ipoteze statistice există cel puțin 2 entități:


- Ipoteza nulă (H0)
- Ipoteza alternativă (Hi)
Introducere

Decizia dacă ipoteza va fi acceptată sau respinsă se va baza pe gradul


de încredere pe care vrem sa îl considerăm în urma efectuării unui test

Testele care se referă la ipoteze ce privesc valorile necunoscute ale


parametrilor unei repartiţii specificate se numesc teste parametrice iar
cele care se referă la ipoteze făcute în legătură cu însăşi repartiţia unei
variabile se numesc teste de concordanţa (neparametrice).
Erori în testarea ipotezelor statistice
În baza unui test de ipoteză pot fi identificate două tipuri de erori:

Tip 1 – Rejectarea ipotezei nule când ipoteza este adevărată


𝛼𝛼 = 𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡 1)

Tip 2 – Acceptarea ipotezei nulei când ipoteza este falsă


𝛽𝛽 = 𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡 2)
Erori în testarea ipotezelor statistice
Fie o populatie compusă din piese circulare produse automat. Suntem
interesați să decidem dacă diametrul pieselor este de 50mm.

Astfel H0: 𝜇𝜇 = 50𝑚𝑚𝑚𝑚


H1: 𝜇𝜇 ≠ 50 𝑚𝑚𝑚𝑚

Extragem un eșantion de 10 piese și calculăm media empirică. Să


presupunem că 48.5 ≤ 𝑋𝑋� ≤ 51.5 va conduce la acceptarea ipotezei nule.
Astfel, 𝑋𝑋� < 48.5 sau 𝑋𝑋� > 51.5 implică rejectarea ipotezei nule și acceptarea
ipotezei alternative
Erori în testarea ipotezelor statistice
Valorile pentru 𝑋𝑋� < 48.5 și 𝑋𝑋� > 51.5 formează regiunea critică a
testului. În paralel, 48.5 ≤ 𝑋𝑋� ≤ 51.5 reprezintă regiunea de acceptare.

Eroarea tip 1 se va realiza dacă 𝑋𝑋� < 48.5 sau 𝑋𝑋� > 51.5 când în
realitate media populației ar fi 𝜇𝜇 = 50𝑚𝑚𝑚𝑚.

Să presupunem că abaterea standard este 𝜎𝜎 = 2.5𝑚𝑚𝑚𝑚 și că mediile


eșantioanelor extrase verifică teorema de limită centrală. Astfel
𝜎𝜎𝑋𝑋� = 𝜎𝜎𝑛𝑛 = 2.5 = 0.79
10
Erori în testarea ipotezelor statistice
Cum
𝛼𝛼 = 𝑃𝑃 𝑋𝑋� < 48.5 𝜇𝜇 = 50 + 𝑃𝑃 𝑋𝑋� > 48.5 𝜇𝜇 = 50
și
𝑧𝑧1 = 48.5−50
0.79
= −1.90 ; 𝑧𝑧2 = 51.5−50
0.79
= 1.90

Rezultă
𝛼𝛼 = 𝑃𝑃 𝑧𝑧 < −1.9 + 𝑃𝑃 𝑧𝑧 > 1.9 = 0.0287 + 0.0287 = 0.0574
Erori în testarea ipotezelor statistice
Interpretare
5.74% din eșantioane vor conduce
la rejectarea ipotezei nule

Obs: Valoarea lui α se poate reduce prin:


- creșterea regiunii de acceptare
- creșterea nr. de indivizi din eșantion
Erori în testarea ipotezelor statistice
Pentru a calcula valoarea lui β este necesară fixarea unei valori
alternative.

Să calculăm probabilitatea ca media acceptată este 50mm când


valoarea adevărată este 52mm
𝛽𝛽 = 𝑃𝑃(48.5 ≤ 𝑋𝑋� ≤ 51.5|𝜇𝜇 = 52)

𝑧𝑧1 = 48.5−52
0.79
= −4.43 ; 𝑧𝑧2 = 51.5−52
0.79
= −0.63
Erori în testarea ipotezelor statistice
Deci,

𝛽𝛽 = 𝑃𝑃 −4.43 ≤ 𝑧𝑧 ≤ −0.63

= 𝑃𝑃 𝑧𝑧 ≤ −0.63 − 𝑃𝑃 𝑧𝑧 ≤ −4.43

= 0.2643 − 0.000 = 0.2643


Erori în testarea ipotezelor statistice

Dacă se testează
H0: 𝜇𝜇 = 50 , H1: 𝜇𝜇 ≠ 50
n=10 iar valoarea adevărată este 52
Atunci probabilitatea de eroare în
rejectare a ipotezei nule va fi 0.2643
Erori în testarea ipotezelor statistice

Obs: probabilitatea realizării unei erori


de tip 2 crește atunci când valoare
alternativă se apropie de valoarea din H0
Erori în testarea ipotezelor statistice
Erori în testarea ipotezelor statistice
Obs:
- O valoare acceptată în multe cazuri pentru α este 0.05.
- Această valoare trebuie adaptată aplicației

- Puterea unui test statistic este probabilitatea de rejectare a ipotezei


nule H0 atunci când ipoteza alternativă este adevărată. Puerea se
calculează ca 1-β
Valoarea p a unui test statistic
Această valoare reprezintă cel mai mic grad de încredere care permite
rejectarea ipotezei nule pe baza eșantionului analizat

Considerând n=16, σ=2.5, presupunem că 𝑋𝑋� =51.3. Ce decidem asupra


H0?
Procedură generală test al ipotezelor
statistice
1. Stabilirea parametrilor de interes
2. Formularea ipotezelor statistice
3. Formularea ipotezelor alternative
4. Algerea testului statistic
5. Formularea criteriului de rejectare a lui H0
6. Calculul numeric al valorilor din criteriul 5
7. Concluzii

S-ar putea să vă placă și