Statistica Verificarea Ipotezelor Statistice Varianta Clasica

FACULTATEA DE AGRICULTURA.
SPECIALIZARE MASTER
PROTECTIE SI EXPERTIZARE FITOSANITARĂ
VERIFICAREA IPOTEZELOR STATISTICE.

VARIANTA CLASICĂ
HANGANU MIHAELA (MÎRZA)
2023
Verificarea ipotezelor statistice: varianta clasica
Testarea ipotezelor statistice reprezintă o abordare pentru analiza datelor provenite prin
eșantionare dintr-o populație originară. Un test statistic este un demers care constă din a
determina dacă există destule dovezi pentru a respinge o ipoteză numită ipoteza nulă (adică a
considera că ipoteza este falsă). O ipoteză, în limbajul statistic, este un enunț care exprimă un
fapt ce va fi dovedit adevărat sau fals, în urma unui test; ipoteza nulă este ipoteza care se dorește
a fi testată, respectiv că datele obținute dintr-un eșantion prelevat dintr-o populație originară
mare sunt aleatorii. Analiza datelor prin testare statistică este un răspuns la întrebarea „Care este
probabilitatea ca aceste rezultate să fi fost obținute complet aleatoriu?”
Ipoteza nulă este testată în mod frecvent față de ipoteza alternativă care se consideră adevărată
dacă ipoteza nulă este falsă. De obicei, ipoteza alternativă înseamnă că datele rezultă dintr-un
efect real, nu în mod aleatoriu. Un exemplu de format curent pentru testarea ipotezei nule H0 este
afirmația că două medii ale populației sunt egale.
Testele cele mai frecvent utilizate sunt testul -z, testul -t, testul-F, testul χ 2 (hi pătrat) și testul
analizei varianței, prescurtat ANOVA. Aceste teste privind ipotezele statistice se bazează pe
faptul că mediile, varianțele (dispersiile), proporțiile și alte instrumente statistice formează
distribuții de frecvențe cu modele cunoscute. Testul -z se bazează pe distribuția normală, cea mai
cunoscută (distribuția Gauss), testele -t, -F și χ2 se bazează pe distribuțiile t, F și hi pătrat.
Situații de utilizare
Atunci când se trag concluzii referitoare la media, proporția, varianța sau alte caracteristici
statistice ale unui set de date;
 Atunci când concluziile se vor baza pe eșantioane prelevate dintr-o populație originară mai
mare;
 Atunci când se analizează dacă media sau varianța mai multor seturi de date diferă;
 Atunci când se analizează dacă două proporții din două seturi diferite de date sunt diferite.
Procesul de testare
Procedura pentru testarea ipotezelor are trei etape: înțelegerea problemei care trebuie rezolvată
(concluzii de obținut), planificarea testului (pașii 1, 2, 3), un număr mare de calcule realizate cu
un calculator (pașii 4 și 5) și aplicarea rezultatelor numerice la problema respectivă (pasul 6).
Se parcurg următorii pași:
1. Se stabilește tipul concluziei sau deciziei care trebuie obținute în legătură cu datele
disponibile. Se identifică testul corespunzător ce va fi aplicat pentru respectiva decizie.
2. Se enunță ipoteza nulă și ipoteza alternativă. Ipoteza nulă H 0 este cea considerată a
priori ca adevărată.Ipoteza alternativă H1 este complementară ipotezei nule. Enunțarea ipotezelor
este importantă pentru că o enunțare eronată a ipotezelor face confuz restul procesului. Se
stabilește dacă testul este bilateral, unilateral stânga sau unilateral dreapta. Dacă ipoteza
alternativă include < (mai mic decât) este necesar un test unilateral stânga. Dacă ipoteza
alternativă include > (mai mare decât) este necesar un test unilateral dreapta. Testul hi pătrat este
totdeauna unilateral dreapta.
3. Se alege pragul de semnificație α. Acesta reprezintă un prag de probabilitate sub care
ipoteza nulă va fi respinsă. De obicei se alege un prag de semnificație α de 1%, 5% sau 10% (α =
0,01, 0,05 sau 0,10).
4. Se calculează testul statistic, adică numărul utilizat pentru ipoteza nulă. Pentru fiecare
tip de test există o anumită formulă. Pentru acest calcul se utilizează de obicei computerul.
5. Se stabilește probabilitatea P ca testul să fie aleatoriu, în cadrul distribuției cunoscute a
testului ales. Valoarea P este egală cu suprafața de sub curba de distribuție, de după valoarea
statistică a testului. Se utilizează în acest scop un tabel statistic sau un program informatic de
calcul.
6. Se compară valoarea P cu α în cazul unui test unilateral stânga sau unilateral dreapta
sau cu α/2 pentru un test bilateral. Regula de decizie este următoarea: dacă valoarea P este < α se
respinge ipoteza nulă și se stabilește că ipoteza alternativă este probabil adevărată. In caz contrar,
nu se respinge ipoteza nulă și se stabilește că nu există suficiente dovezi pentru a sprijini ipoteza
alternativă.
Erori de tipul I și de tipul II

Datorită faptului că testarea ipotezelor operează cu eșantioane și probabilități există
posibilitatea de a lua decizii greșite, de a comite erori. Există două tipuri de erori care se referă la
acceptarea sau respingerea ipotezei nule.
Eroarea de tipul I apare atunci când ipoteza nulă H0 este adevărată, însă este respinsă,
fiind considerată falsă. Probabilitatea de apariție a unei erori de tipul I este pragul de semnificație
α.
Eroarea de tipul II apare atunci când ipoteza nulă H0 este falsă, dar este acceptată,
considerând că aceasta este adevărată. Probabilitatea de apariție a unei erori de tipul II este β.
Pentru un volum al eșantionului dinainte dat, probabilitatea de a comite o eroare de tipul I se
poate micșora prin reducerea corespunzătoare a mărimii α, care coincide cu pragul de
semnificație ales. Aceasta atrage după sine o mărire corespunzătoare a probabilității β, deci a
probabilității erorii de tipul II. De aceea, singurul mijloc de a micșora simultan ambele
probabilități ale erorilor constă în mărirea numărului de măsurări ale căror rezultate se folosesc
pentru testul statistic.
In alte stinte decat matematica, pot fi propuse ipoteze sau teorii referitoare la un anumit
univers sau la o anumita populatie. Aceste ipotezese numesci ipoteze statistice si singura cale de
a fi absolut siguri de adevarul sau falsitatea lor este de a cerceta ıntreaga populatie. Acest
procedeu nu este practic (sau este chiar imposibil) astfel este nevoie sa se considere o selectie
dintr-o populatie utilizand-o pentru a decide asupra valabilitatii sau falsitatii ipotezei.
Procedeul de a folosi o selectie pentru a verifica daca o ipoteza este adevarata (sau falsa)
este numit test statistic asupra valabilitatii (sau falsitatii) ipotezei. Nu exista nici o certitudine ca
nu vom comite o eroare. Intr-adevar exista doua tipuri de erori pe care le putem face.
1. Daca se ıntampla ca ipoteza cercetata sa fie adevarata si noi decidem ca este falsa,
facem o eroare de ordinul I (spet¸a, genul, tipul I). Probabilitatea acestei erori se
noteaza cu α.
2. Daca dimpotriva, ipoteza este falsa ¸si noi decidem ca este adevarata, facem o eroare
de ordinul II, probabilitatea acestei erori notandu-se cu β. Frecventa cu care facem o
greseala este, desigur, foarte importanta si vom vedea ca aceasta frecventa poate fi
controlata pana la un anumit grad. Decizia daca ipoteza va fi acceptata sau respinsa se
va baza pe informatia pe care o detinem facand observatii si pe riscul pe care suntem
dispusi sa-l acceptam ın a lua o decizie gresita.
Stabilim, de exemplu, ipoteza ca un anumit parametru al unei populatii are o anumita

valoare. Din populatia studiata consideram o selectie si cercetam daca rezultatele obtinute pot fi
considerate ca provenind sau nu din populatia stabilita pe baza ipotezei facute. Daca exista o
concordanta stransa ıntre ipoteza emisa si rezultatele obtinute, acceptam ipoteza. Daca
concordanta este slaba vom respinge ipoteza. Decizia daca concordanta este stransa sau nu revine
la calcularea unei anumite statistici si la compararea valorii particulare obtinute cu repartitia de
selectie pentru aceasta statistica, ın cazul cand consideram ca ipoteza este adevarata.
Cand ipoteza statistica se refera la parametrii de care depinde legea de probabilitate a

caracteristicii X se obtine un test parametric, iar ın caz contrar un test neparametric. Pentru
testele parametrice vom considera ca θ ∈ A = A0 ∪ A1, unde A0 ∩ A1 = ∅. Ipoteza H0: θ ∈ A0 o
vom numi ipoteza nula, iar ipoteza H1 (sau Ha): θ ∈ A1 o vom numi ipoteza alternativa. Daca
ipoteza nula are forma H0: θ = θ0 (ipoteza simpla), putem avea pentru ipoteza alternativa una din
formele: H1 : θ = θ0 (test bilateral), H1 : θ < θ0 (test unilateral stanga), H1 : θ > θ 0 (test unilateral
dreapta). Ipoteza nula este cea asupra careia ne focalizam atentia. In general ea este o propozitie
de forma ,,un parametru al unei populatii are o valoare specificata“. Adesea ın interpretarea ei
este utilizata propozitia ,,nu exista nici o diferenta“, de unde si numele de ipoteza nula.
Ipoteza alternativa este o propozitie despre acelasi parametru al populatiei care este cea
data ın ipoteza nula. Respingerea ipotezei nule va implica acceptarea ipotezei alternative. Drept
concluzie la un test de verificare a ipotezelor vom lua o decizie. Vom decide ca acceptam ipoteza
nula (de fapt nu reusim sa o respingem) sau o respingem. Avem de fapt patru situatii sintetizate
ın tabelul de mai jos.
Decizia Ipoteza nula este

adevarata falsa
Acceptam H0 decizie corecta eroare de ordinal II
Respingem H0 eroare de ordinal I decizie corecta
Construirea unui test revine la obtinerea regiunii critice U ⊂ Rn pentru un nivel de

semnificatie (probabilitate de risc) α dat astfel ıncat P ((X 1, . . . , Xn) ∈ U|H0) = α, unde X1, . . . ,
Xn sunt variabilele de selectie corespunzatoare selectiei de volum n considerate. Daca (x 1, . . . ,
xn) ∈/ U, H0 va fi acceptata si daca (x1, . . ., xn) ∈ U, H1 va fi respinsa. Exista doua abordari
pentru testele statistice: abordarea clasica si abordarea bazata pe probabilitate.
Abordarea clasica
1. Formularea ipotezei nule.

2. Formularea ipotezei alternative.
3. Determinarea criteriului de test – consta ın
 determinarea unei statistici a testului;
 specificarea unui nivel de semnificatie α;
 determinarea regiunii critice.
4. Calcularea valorii statisticii.
5. Luare unei decizii si interpretarea ei.
Decizia: Daca valoarea statisticii testului cadeˆın interiorul regiunii critice se respinge
H0, iar ın caz contrar se accepta.
Exemplu:
Un ecologist sustine ca orasul Timisoara are o problema privind poluarea aerului.

Concret, el sus¸ine ca nivelul mediu al monoxidului de carbon ın aer ın centrul orasului depaseste
valoarea 4, 9/106 = valoarea medie normala. Pentru a formula ın acest caz, ipotezele H 0 ¸si Ha,
trebuie sa identificam: populatia, parametrul populatiei ˆın cauza si valoarea cu care aceasta
urmeaza sa fie comparata. Populatia ın acest caz poate fi multimea locurilor din centrul orasului
Timisoara. Variabila X este concentratia monoxidului de carbon ale carei valori x variaza ın
functie de loc, iar parametrul populatiei este valoarea medie µ a acestei variabile. Valoarea
specifica cu care aceasta medie trebuie comparata este 4, 9/106 egala cu valoarea (medie)
normala. Ecologistul face o asertiune privind valorea lui µ. Aceasta valoare poate fi: µ < 4, 9/106
sau µ = 4, 9/106 sau µ > 4, 9/106 . Cele trei situatii pot fi cuprinse ın doua afirmatii dintre care
una exprima ceea ce ecologistul sustine, iar cealalta exprima contrariul. Inegalitatea µ > 4, 9/106
este afirmatia: ”valoarea medie este mai mare ca 4, 9/106”. Inegalitatea µ ≤ 4, 9/106 este
echivalenta cu ”µ < 4, 9/106 sau µ = 4, 9/106” si este afirmatia contrara: ”valoarea medie nu este
mai mare ca 4, 9/106”. Ecologistul sustine ca µ > 4, 9/106 . Pentru a formula ipoteza H 0 si
ipoteza Ha reamintim ca:
1) In general, ipoteza H0 sustine ca media µ (parametrul ın chestiune) are o valoare

specifica anume.
2) Inferenta privind media µ a populatiei se bazeaza pe media unui esantion si mediile

esantioanelor au o distributie aproximativ normala. (conform teoremei limita centrala).
3) O distributie normala este complet determinata daca valoarea medie si deviatia

standard a distributiei sunt cunoscute. Cele de mai sus sugereaza ca afirmatia µ = 4, 9/106 ar
trebui sa fie ipoteza nula si afirmatia µ > 4, 9/106 ar trebui sˇa fie ipoteza alternativa: H0 : µ = 4,
9/106 Ha : µ > 4, 9/106 Reamintim ca dupa ce ipoteza nula H 0 este formulata, ın testul statistic
identificat se presupune ca H0 este adevarata. Aceasta ınseamna ca µ = 4, 9/106 este egala cu
media 41 distributiei mediilor esantioanelor µx si este o ratiune ın plus pentru care ipoteza H 0
trebuie scrisa doar cu semnul egal H 0 : µ = 4, 9/106 . Daca admitem ca afirmatia ”µ = 4, 9/106
sau µ < 4, 9/106” este ipoteza nula H0, atunci: H0 : µ ≤ 4, 9/106 Ha : µ > 4, 9/106 .
Remarca exemplului. Semnul egal trebuie sa fie inclus totdeauna ın ipoteza nula. In acest
exemplu asertiunea ecologistului este exprimata de fapt ın Ha ¸si aceasta este analizat.

Statistica Verificarea Ipotezelor Statistice Varianta Clasica

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Statistica Verificarea Ipotezelor Statistice Varianta Clasica

Încărcat de

Drepturi de autor:

Formate disponibile

FACULTATEA DE AGRICULTURA.

VERIFICAREA IPOTEZELOR STATISTICE.

HANGANU MIHAELA (MÎRZA)

Erori de tipul I și de tipul II

Stabilim, de exemplu, ipoteza ca un anumit parametru al unei populatii are o anumita

Cand ipoteza statistica se refera la parametrii de care depinde legea de probabilitate a

Decizia Ipoteza nula este

Construirea unui test revine la obtinerea regiunii critice U ⊂ Rn pentru un nivel de

1. Formularea ipotezei nule.

Un ecologist sustine ca orasul Timisoara are o problema privind poluarea aerului.

1) In general, ipoteza H0 sustine ca media µ (parametrul ın chestiune) are o valoare

2) Inferenta privind media µ a populatiei se bazeaza pe media unui esantion si mediile

3) O distributie normala este complet determinata daca valoarea medie si deviatia

S-ar putea să vă placă și