Documente Academic
Documente Profesional
Documente Cultură
SPECIALIZARE MASTER
PROTECTIE SI EXPERTIZARE FITOSANITARĂ
2023
Verificarea ipotezelor statistice: varianta clasica
Testarea ipotezelor statistice reprezintă o abordare pentru analiza datelor provenite prin
eșantionare dintr-o populație originară. Un test statistic este un demers care constă din a
determina dacă există destule dovezi pentru a respinge o ipoteză numită ipoteza nulă (adică a
considera că ipoteza este falsă). O ipoteză, în limbajul statistic, este un enunț care exprimă un
fapt ce va fi dovedit adevărat sau fals, în urma unui test; ipoteza nulă este ipoteza care se dorește
a fi testată, respectiv că datele obținute dintr-un eșantion prelevat dintr-o populație originară
mare sunt aleatorii. Analiza datelor prin testare statistică este un răspuns la întrebarea „Care este
probabilitatea ca aceste rezultate să fi fost obținute complet aleatoriu?”
Ipoteza nulă este testată în mod frecvent față de ipoteza alternativă care se consideră adevărată
dacă ipoteza nulă este falsă. De obicei, ipoteza alternativă înseamnă că datele rezultă dintr-un
efect real, nu în mod aleatoriu. Un exemplu de format curent pentru testarea ipotezei nule H0 este
afirmația că două medii ale populației sunt egale.
Testele cele mai frecvent utilizate sunt testul -z, testul -t, testul-F, testul χ 2 (hi pătrat) și testul
analizei varianței, prescurtat ANOVA. Aceste teste privind ipotezele statistice se bazează pe
faptul că mediile, varianțele (dispersiile), proporțiile și alte instrumente statistice formează
distribuții de frecvențe cu modele cunoscute. Testul -z se bazează pe distribuția normală, cea mai
cunoscută (distribuția Gauss), testele -t, -F și χ2 se bazează pe distribuțiile t, F și hi pătrat.
Situații de utilizare
Atunci când se trag concluzii referitoare la media, proporția, varianța sau alte caracteristici
statistice ale unui set de date;
Atunci când concluziile se vor baza pe eșantioane prelevate dintr-o populație originară mai
mare;
Atunci când se analizează dacă media sau varianța mai multor seturi de date diferă;
Atunci când se analizează dacă două proporții din două seturi diferite de date sunt diferite.
Procesul de testare
Procedura pentru testarea ipotezelor are trei etape: înțelegerea problemei care trebuie rezolvată
(concluzii de obținut), planificarea testului (pașii 1, 2, 3), un număr mare de calcule realizate cu
un calculator (pașii 4 și 5) și aplicarea rezultatelor numerice la problema respectivă (pasul 6).
Se parcurg următorii pași:
1. Se stabilește tipul concluziei sau deciziei care trebuie obținute în legătură cu datele
disponibile. Se identifică testul corespunzător ce va fi aplicat pentru respectiva decizie.
2. Se enunță ipoteza nulă și ipoteza alternativă. Ipoteza nulă H 0 este cea considerată a
priori ca adevărată.Ipoteza alternativă H1 este complementară ipotezei nule. Enunțarea ipotezelor
este importantă pentru că o enunțare eronată a ipotezelor face confuz restul procesului. Se
stabilește dacă testul este bilateral, unilateral stânga sau unilateral dreapta. Dacă ipoteza
alternativă include < (mai mic decât) este necesar un test unilateral stânga. Dacă ipoteza
alternativă include > (mai mare decât) este necesar un test unilateral dreapta. Testul hi pătrat este
totdeauna unilateral dreapta.
3. Se alege pragul de semnificație α. Acesta reprezintă un prag de probabilitate sub care
ipoteza nulă va fi respinsă. De obicei se alege un prag de semnificație α de 1%, 5% sau 10% (α =
0,01, 0,05 sau 0,10).
4. Se calculează testul statistic, adică numărul utilizat pentru ipoteza nulă. Pentru fiecare
tip de test există o anumită formulă. Pentru acest calcul se utilizează de obicei computerul.
5. Se stabilește probabilitatea P ca testul să fie aleatoriu, în cadrul distribuției cunoscute a
testului ales. Valoarea P este egală cu suprafața de sub curba de distribuție, de după valoarea
statistică a testului. Se utilizează în acest scop un tabel statistic sau un program informatic de
calcul.
6. Se compară valoarea P cu α în cazul unui test unilateral stânga sau unilateral dreapta
sau cu α/2 pentru un test bilateral. Regula de decizie este următoarea: dacă valoarea P este < α se
respinge ipoteza nulă și se stabilește că ipoteza alternativă este probabil adevărată. In caz contrar,
nu se respinge ipoteza nulă și se stabilește că nu există suficiente dovezi pentru a sprijini ipoteza
alternativă.
Procedeul de a folosi o selectie pentru a verifica daca o ipoteza este adevarata (sau falsa)
este numit test statistic asupra valabilitatii (sau falsitatii) ipotezei. Nu exista nici o certitudine ca
nu vom comite o eroare. Intr-adevar exista doua tipuri de erori pe care le putem face.
1. Daca se ıntampla ca ipoteza cercetata sa fie adevarata si noi decidem ca este falsa,
facem o eroare de ordinul I (spet¸a, genul, tipul I). Probabilitatea acestei erori se
noteaza cu α.
2. Daca dimpotriva, ipoteza este falsa ¸si noi decidem ca este adevarata, facem o eroare
de ordinul II, probabilitatea acestei erori notandu-se cu β. Frecventa cu care facem o
greseala este, desigur, foarte importanta si vom vedea ca aceasta frecventa poate fi
controlata pana la un anumit grad. Decizia daca ipoteza va fi acceptata sau respinsa se
va baza pe informatia pe care o detinem facand observatii si pe riscul pe care suntem
dispusi sa-l acceptam ın a lua o decizie gresita.
Ipoteza alternativa este o propozitie despre acelasi parametru al populatiei care este cea
data ın ipoteza nula. Respingerea ipotezei nule va implica acceptarea ipotezei alternative. Drept
concluzie la un test de verificare a ipotezelor vom lua o decizie. Vom decide ca acceptam ipoteza
nula (de fapt nu reusim sa o respingem) sau o respingem. Avem de fapt patru situatii sintetizate
ın tabelul de mai jos.
Abordarea clasica
Decizia: Daca valoarea statisticii testului cadeˆın interiorul regiunii critice se respinge
H0, iar ın caz contrar se accepta.
Exemplu:
Remarca exemplului. Semnul egal trebuie sa fie inclus totdeauna ın ipoteza nula. In acest
exemplu asertiunea ecologistului este exprimata de fapt ın Ha ¸si aceasta este analizat.