Documente Academic
Documente Profesional
Documente Cultură
INFERENŢA STATISTICĂ
TESTAREA IPOTEZELOR STATISTICE
Întregul demers statistic are drept obiectiv obţinerea informaţiilor necesare pentru
fundamentarea deciziilor, indiferent de domeniul care se aplică. Această finalitate a procesului
de obţinere şi prelucrare a datelor statistice derivă din nevoia de a cunoaşte o anumită
realitate, din aşteptările pe care le avem în legătură cu efectele acţiunilor viitoare.
Procesul de luare a deciziilor are o structură piramidală, vârful piramidei fiind
reprezentat de etapa finală, cea a inferenţei statistice.
Etapa finală a procesului decizional, concretizată în aplicarea procedurilor statistice şi
a raţionamentelor specifice, care să permit formularea unor concluzii cu privire la ipoteza
cercetării, este în strânsă legătură cu celelalte componente ale piramidei:
- formularea adecvată a scopului cercetării;
- identificarea ipotezelor de lucru;
- identificarea populaţiei statistice şi a principalelor caracteristici ale acesteia;
- alegerea metodei potrivite de obţinere a datelor;
- aplicarea tehnicilor adecvate de prelucrare primară a datelor.
1
Problema care se pune este, dacă, între valoarea estimatorului şi valoarea
presupusă a parametrului populaţiei există diferenţe datorate doar întâmplării sau
diferenţele existente sunt semnificative şi nu pot fi puse doar pe seama întâmplării.
În procesul de verificare a unei afirmaţii se formează un cuplu de două ipoteze:
- ipoteza nulă ( H 0 ) şi
- ipoteza alternativă ( H 1 ).
Ipoteza nulă ( H 0 ) reprezintă afirmaţia, ipoteza statistică ce urmează a fi verificată şi
reprezintă ceea ce este acceptat ca fiind adevărat, până se dovedeşte a fi fals (« ipoteza
egalitatii »).
În funcţie de rezultatul testării se ia decizia de respingere sau de acceptare a ipotezei nule.
Respingerea ipotezei nule implică acceptarea ca fiind adevărată a ipotezei alternative H 1 .
Ipoteza alternativă ( H 1 ) reprezintă ipoteza conform căreia diferenţele existente
sunt semnificative şi nu se datorează doar întâmplării, fiind aşadar o teorie ce contrazice
ipoteza nulă.
2
3. Regiunea critică (Rc) reprezintă valorile numerice ale testului statistic pentru
care ipoteza nulă va fi respinsă.
Delimitarea regiunii critice se face astfel încât probabilitatea ca aceasta să conţină testul
statistic, când ipoteza nulă este adevărată, să fie foarte mică.
4. Eroarea de genul întâi este eroarea pe care o facem prin decizia de a respinge
ipoteza nulă, deşi ea este adevărată.
Decizia de a respinge ipoteza nulă trebuie luată cu prudenţă deoarece există două
posibilităţi: ea este într-adevăr falsă sau ea este adevărată, şi totuşi, pe baza datelor
din sondaj o respingem.
Similar, decizia de a accepta ipoteza nulă H 0 , poate avea două faţete: nu există suficiente
dovezi pentru a respinge ipoteza nulă deşi ea este falsă sau ipoteza nulă este adevărată.
Aşadar, este mai corect să spunem că pe baza datelor din eşantionul studiat, nu există
suficiente dovezi pentru a respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.
Relaţia existentă între decizia luată şi tipul de eroare comis este rezumată în tabelul următor:
Realitatea (necunoscută)
Decizia de acceptare
H 0 - adevărată H 0 - falsă
H0 Decizie corectă Decizie eronată
(probabilitate 1-α) (Eroare de gen II - risc β)
Decizie eronată Decizie corectă
H1
(Eroare de gen I, risc α) (probabilitate 1-β)
Diminuarea probabilităţii de a comite o eroare, fie de genul, fie de genul al doilea se
poate realiza prin creşterea volumului eşantionului şi reducerea variabilităţii datelor.
3
8. Nivelul de semnificație observat reprezintă probabilitatea de semnificație a
testului statistic, valoarea acestuia fiind determinată numai prin utilizarea pachetelor software
specializate la aplicarea testelor statistice. Denumirile cele mai uzuale pentru nivelul de
semnificație observat sunt: p, p-value, significance “numele testului (z, t, F…)”.
1. Dacă 0.01 p 0.05 , rezultatul este semnificativ, există suficiente motive pentru a
respinge ipoteza H 0 .
Trebuie precizat că aplicarea testelor statistice presupune adeseori, realizarea unor calculele
laborioase și, din acest motiv, se recurge la utilizarea pachetelor software specializate în
analiza datelor statistice (SPSS, Excel-Data Analysis) care implementează într-o măsură mai
mare sau mai mică testele uzuale.