Sunteți pe pagina 1din 4

CURS 2

INFERENŢA STATISTICĂ
TESTAREA IPOTEZELOR STATISTICE

Întregul demers statistic are drept obiectiv obţinerea informaţiilor necesare pentru
fundamentarea deciziilor, indiferent de domeniul care se aplică. Această finalitate a procesului
de obţinere şi prelucrare a datelor statistice derivă din nevoia de a cunoaşte o anumită
realitate, din aşteptările pe care le avem în legătură cu efectele acţiunilor viitoare.
Procesul de luare a deciziilor are o structură piramidală, vârful piramidei fiind
reprezentat de etapa finală, cea a inferenţei statistice.
Etapa finală a procesului decizional, concretizată în aplicarea procedurilor statistice şi
a raţionamentelor specifice, care să permit formularea unor concluzii cu privire la ipoteza
cercetării, este în strânsă legătură cu celelalte componente ale piramidei:
- formularea adecvată a scopului cercetării;
- identificarea ipotezelor de lucru;
- identificarea populaţiei statistice şi a principalelor caracteristici ale acesteia;
- alegerea metodei potrivite de obţinere a datelor;
- aplicarea tehnicilor adecvate de prelucrare primară a datelor.

TESTAREA IPOTEZELOR STATISTICE, ca metodă alternativă estimării pe interval de


încredere, presupune determinarea unor dovezi statistice suficiente care să permită concluzia
că o afirmaţie (ipoteză) este adevărată.

Procesul de testare a ipotezelor statistice presupune utilizarea unei terminologii specifice,


mecanismul inferenţei statistice prin această metodă fiind acelaşi, indiferent de ipoteza
cercetată.
1. IPOTEZA STATISTICA este afirmaţia referitoare la parametrul unei populaţii
sau la legea de repartiţie a unei variabile studiate.
Afirmaţia făcută poate fi falsă sau adevărată, scopul metodei fiind acela de a verifica
veridicitatea acesteia, pentru un anumit nivel de încredere.
Pentru verificarea credibilităţii unei afirmaţii se recurge la prelevarea unui eşantion
din populaţia statistică vizată, prelucrarea datelor provenite din sondaj şi calculul
estimatorului parametrului urmărit în populaţie.

1
Problema care se pune este, dacă, între valoarea estimatorului şi valoarea
presupusă a parametrului populaţiei există diferenţe datorate doar întâmplării sau
diferenţele existente sunt semnificative şi nu pot fi puse doar pe seama întâmplării.
În procesul de verificare a unei afirmaţii se formează un cuplu de două ipoteze:
- ipoteza nulă ( H 0 ) şi

- ipoteza alternativă ( H 1 ).
Ipoteza nulă ( H 0 ) reprezintă afirmaţia, ipoteza statistică ce urmează a fi verificată şi

constă în admiterea caracterului întâmplător al diferenţelor.

Ipoteza nulă specifică întotdeauna o singură valoare a parametrului  0  populaţiei şi

reprezintă ceea ce este acceptat ca fiind adevărat, până se dovedeşte a fi fals (« ipoteza
egalitatii »).
În funcţie de rezultatul testării se ia decizia de respingere sau de acceptare a ipotezei nule.
Respingerea ipotezei nule implică acceptarea ca fiind adevărată a ipotezei alternative H 1 .
Ipoteza alternativă ( H 1 ) reprezintă ipoteza conform căreia diferenţele existente
sunt semnificative şi nu se datorează doar întâmplării, fiind aşadar o teorie ce contrazice
ipoteza nulă.

Ipoteza alternativă poate fi formulată în trei moduri:


- parametrul este diferit (semnificativ mai mare sau mai mic) decât valoarea
specificată în ipoteza nulă;
- parametrul este semnificativ mai mare decât valoarea specificată în ipoteza nulă;
- parametrul este semnificativ mai mic decât valoarea specificată în ipoteza nulă.

2. Testul statistic reprezintă procedeul de verificare a unei ipoteze statistice.


 Valoarea numerică a testului statistic este criteriul utilizat în acceptarea sau
respingerea ipotezei nule.
 În majoritatea cazurilor, testul statistic derivă din estimatorul punctual al
parametrului testat.
 Alegerea testului statistic depinde de presupunerile făcute asupra populaţiei statistice
eşantionate.

2
3. Regiunea critică (Rc) reprezintă valorile numerice ale testului statistic pentru
care ipoteza nulă va fi respinsă.
Delimitarea regiunii critice se face astfel încât probabilitatea ca aceasta să conţină testul
statistic, când ipoteza nulă este adevărată, să fie foarte mică.

4. Eroarea de genul întâi este eroarea pe care o facem prin decizia de a respinge
ipoteza nulă, deşi ea este adevărată.

 Decizia de a respinge ipoteza nulă trebuie luată cu prudenţă deoarece există două
posibilităţi: ea este într-adevăr falsă sau ea este adevărată, şi totuşi, pe baza datelor
din sondaj o respingem.
 Similar, decizia de a accepta ipoteza nulă H 0 , poate avea două faţete: nu există suficiente
dovezi pentru a respinge ipoteza nulă deşi ea este falsă sau ipoteza nulă este adevărată.
Aşadar, este mai corect să spunem că pe baza datelor din eşantionul studiat, nu există
suficiente dovezi pentru a respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.

5. Nivelul (pragul) de semnificaţie (α) reprezintă probabilitatea de a comite o eroare


de genul I, generată de situaţia ca regiunea critică să conţină testul statistic atunci când ipoteza
nulă este adevărată. Astfel, α numit risc de genul întâi, se alege foarte mic, de regulă,
valoarea lui fiind cuprinsă între 1% și 5%.
6. Nivelul de încredere reprezintă probabilitatea de garantare a rezultatelor şi este
(1-α), iar în expresie procentuală, (1-α)100.
7. Eroarea de genul al doilea este eroarea pe care o facem acceptând o ipoteză nulă,
deşi este falsă.
Probabilitatea (riscul) comiterii unei astfel de erori se notează cu β, mărimea (1-β)
reprezentând puterea testului statistic.

Relaţia existentă între decizia luată şi tipul de eroare comis este rezumată în tabelul următor:
Realitatea (necunoscută)
Decizia de acceptare
H 0 - adevărată H 0 - falsă
H0 Decizie corectă Decizie eronată
(probabilitate 1-α) (Eroare de gen II - risc β)
Decizie eronată Decizie corectă
H1
(Eroare de gen I, risc α) (probabilitate 1-β)
Diminuarea probabilităţii de a comite o eroare, fie de genul, fie de genul al doilea se
poate realiza prin creşterea volumului eşantionului şi reducerea variabilităţii datelor.

3
8. Nivelul de semnificație observat reprezintă probabilitatea de semnificație a
testului statistic, valoarea acestuia fiind determinată numai prin utilizarea pachetelor software
specializate la aplicarea testelor statistice. Denumirile cele mai uzuale pentru nivelul de
semnificație observat sunt: p, p-value, significance “numele testului (z, t, F…)”.

Stabilirea semnificaţiei testului pe baza valorii lui p (p-value) se face frecvent cu


următoarea regulă empirică, considerând nivelul de semnificație ales   0.05 :

1. Dacă 0.01  p  0.05 , rezultatul este semnificativ, există suficiente motive pentru a
respinge ipoteza H 0 .

2. Dacă p  0.01 , rezultatul este înalt semnificativ și există argumente puternice


pentru respingerea ipotezei nule.
3. Dacă p  0.05 rezultatul este nesemnificativ statistic, nu există suficiente motive
pentru a respinge ipoteza nulă, deci ipoteza H 0 este considerată a fi adevărată.

Procesul de testare a unei ipoteze presupune parcurgerea următoarelor etape:


1. Se formulează ipotezele, în funcţie de problema pusă;
2. Se alege un test statistic în funcţie de presupunerile făcute asupra populaţiei
eşantionate;
3. Se stabileşte prag de semnificaţie pentru test;
4. Se stabileşte regiunea critică în funcţie de testul statistic ales şi pragul de
semnificaţie;
5. Se calculează valoarea numerică a testului statistic pe baza datelor de sondaj;
6. Se compară valoarea calculată a testului statistic cu valoarea teoretică, numită şi
valoare critică sau se compară valoarea observată a nivelului de semnificație (p)
cu valoarea nivelului de semnificație ales α (5%, de regulă);
7. Se ia decizia de a respinge sau de a accepta ipoteza nulă.

Trebuie precizat că aplicarea testelor statistice presupune adeseori, realizarea unor calculele
laborioase și, din acest motiv, se recurge la utilizarea pachetelor software specializate în
analiza datelor statistice (SPSS, Excel-Data Analysis) care implementează într-o măsură mai
mare sau mai mică testele uzuale.

S-ar putea să vă placă și