Sunteți pe pagina 1din 8

3.

Concepte generale n testarea ipotezelor statistice

Procesul de luare a deciziilor presupune analiza, judecarea i interpretarea evidenelor oferite


de datele pe care le avem la dispoziie. Managerii trebuie s fie pregtii s ia decizii privind
aciunile viitoare pe baza informaiilor disponibile. Astfel ei emit ipoteze pe care le pot testa
tiinific utiliznd metodele i tehnicile statistice.
Testarea ipotezelor statistice reprezint o alt modalitate, alturi de estimaia pe interval de
ncredere, de a realiza inferena statistic. Scopul acestui tip de inferene statistice este s
determinm dac exist suficiente dovezi statistice care s ne permit s concluzionm c o
afirmaie (sau o ipotez) despre un parametru este adevrat.
Exemplu
Exemplu

Sute de produse noi sunt lansate n fiecare an. Dintr-o varietate de motive, multe dintre
acestea nu reuesc s cucereasc piaa. De aceea, produsele care ajung n stagiul final de lansare
pe pia sunt evaluate de specialitii n marketing, care doresc s fac predicii asupra succesului
produselor (cu alte cuvinte, ct de bine se vor vinde). Evident, informaii complete i sigure nu se
pot obine i atunci specialitii vor dori s trag concluzii valide, pe baza datelor disponibile din
cercetri pariale. S presupunem c un lan de magazine dorete s vnd un nou produs lansat
pe pia i sper s aib succes. Dup o analiz financiar, specialitii determin c, dac mai
mult de 10% dintre potenialii cumprtori vor cumpra produsul, lanul de magazine va obine
profit. Un eantion aleator de clieni poteniali este selectat i persoanele sunt ntrebate dac ar
cumpra produsul. Procedeul de eantionare i de culegere a datelor este cunoscut, din capitolele
precedente, iar parametrul reprezint proporia clienilor care ar cumpra produsul. Testarea
ipotezei statistice se refer, atunci, la a determina dac proporia cumprtorilor este mai mare de
10%.

n urma prelevrii unui eantion dintr-o populaie statistic, prin prelucrarea datelor
provenite din sondaj se obine un estimator al parametrului urmrit n populaia de origine. Se
pune atunci problema n ce msur parametrul estimat pe baza rezultatelor sondajului asigur

credibilitatea aprecierilor fcute asupra ntregii colectiviti. Estimatorul este, aadar, o presupunere asupra parametrului, deci o ipotez statistic. Nu este nevoie s testm ipoteze statistice
atunci cnd tim totul despre un fenomen, ci doar cnd exist incertitudine.
Ipoteza statistic este ipoteza care se face cu privire la parametrul unei repartiii sau la
legea de repartiie pe care o urmeaz anumite variabile aleatoare. O ipotez statistic nu este
neaprat adevrat. Ea poate fi corect sau greit.
n statistic, ipotezele apar ntotdeauna n perechi: ipoteza nul i ipoteza alternativ. Ipoteza
statistic ce urmeaz a fi testat se numete ipotez nul i este notat, uzual, H0. Ea const
ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu
exist deosebiri eseniale. Respingerea ipotezei nule care este testat implic acceptarea unei alte
ipoteze. Aceast alt ipotez este numit ipotez alternativ, notat H1. Cele dou ipoteze
reprezint teorii, mutual exclusive i exhaustive, asupra valorii parametrului populaiei sau legii
de repartiie. Spunem c ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze s
fie adevrate. Spunem c ele sunt exhaustive deoarece acoper toate posibilitile, adic ori
ipoteza nul, ori ipoteza alternativ trebuie s fie adevrat.
Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de semnificaie.
O secven general de pai se aplic la toate situaiile de testare a ipotezelor statistice. Exist
patru componente principale ale unui test privind o ipotez:
ipoteza nul;
ipoteza alternativ;
testul statistic;
regiunea critic (de respingere).
Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul rmne
acelai, parcurgndu-se urmtorii pai:
1) Se identific ipoteza statistic special despre parametrul populaiei sau legea de
repartiie (H0). Ipoteza statistic numit i ipotez nul specific ntotdeauna o singur

valoare a parametrului populaiei i reprezint status- quo-ul, ceea ce este acceptat pn se


dovedete a fi fals.
2) ntotdeauna ipoteza nul este nsoit de ipoteza alternativ (de cercetat), H1, ce reprezint
o teorie care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente dovezi,
evidene, pentru a se stabili c este adevrat.
Ipoteza alternativ este cea mai important, deoarece este ipoteza care ne rspunde la
ntrebare. Ipoteza alternativ poate cpta trei forme, care rspund la trei tipuri de ntrebri
referitoare la parametrul studiat:
- dac parametrul este diferit (mai mare sau mai mic) dect valoarea specificat n ipoteza
nul;
- dac parametrul este mai mare dect valoarea specificat n ipoteza nul;
- dac parametrul este mai mic dect valoarea specificat n ipoteza nul;

3) Se calculeaz indicatorii statistici n eantion, utilizai pentru a accepta sau a respinge


ipoteza nul i se determin testul statistic ce va fi utilizat drept criteriu de acceptare sau de
respingere a ipotezei nule.
Pentru cele mai multe testri statistice ale ipotezelor, testul statistic este derivat din
estimatorul punctual al parametrului ce va fi testat. Spre exemplu, deoarece media eantionului
este un estimator punctual al mediei din colectivitatea general, ea va fi utilizat n testarea
ipotezelor privind parametrul media colectivitii generale.
4) Se stabilete regiunea critic, Rc. Regiunea critic reprezint valorile numerice ale
testului statistic pentru care ipoteza nul va fi respins. Regiunea critic este astfel aleas nct
probabilitatea ca ea s conin testul statistic, cnd ipoteza nul este adevrat, s fie , cu mic
(=0.01 etc). Verificarea ipotezei nule se face pe baza unui eantion de volum n, extras din
populaia X, care este o variabil aleatoare. Dac punctul definit de vectorul de sondaj x1,x2,,xn
cade n regiunea critic Rc, ipoteza H0 se respinge, iar dac punctul cade n afara regiunii critice
Rc, ipoteza H0 se accept. Regiunea critic este delimitat de valoarea critic, C punctul de
tietur n stabilirea acesteia.

n baza legii numerelor mari, numai ntr-un numr foarte mic de cazuri punctul rezultat din
sondaj va cdea n Rc, majoritatea vor cdea n afara regiunii critice. Nu este ns exclus ca
punctul din sondaj s cad n regiunea critic, cu toate c ipoteza nul despre parametrul
populaiei este adevrat. Cu alte cuvinte, atunci cnd respingem ipoteza nul, trebuie s ne
gndim de dou ori, deoarece exist dou posibiliti: ea este fals ntr-adevr i ea este totui
adevrat, dei pe baza datelor din sondaj o respingem.
La fel i pentru situaia n care acceptm ipoteza nul H 0. Cnd ipoteza nul nu poate fi
respins (nu exist suficiente dovezi pentru a fi respins), sunt dou posibiliti: ipoteza nul este
adevrat i ipoteza nul este totui fals, greit, dei nu am respins-o. De aceea, este mai corect
s spunem c pe baza datelor din eantionul studiat, nu putem respinge ipoteza nul, dect s
spunem c ipoteza nul este adevrat.

Eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat, se numete eroare de
genul nti. Probabilitatea comiterii unei astfel de erori reprezint riscul de genul nti () i se
numete nivel sau prag de semnificaie.

Nivelul de ncredere al unui test statistic este (1-), iar n expresie procentual, (1-)100
reprezint probabilitatea de garantare a rezultatelor.

Eroarea pe cere o facem acceptnd o ipotez nul, dei este fals, se numete eroare de
genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se noteaz cu . Puterea
testului statistic este (1-).

Tabelul 1 ilustreaz legtura dintre decizia pe care o lum referitor la ipoteza nul i
adevrul sau falsitatea acestei ipoteze.

Decizia de acceptare
H0

Tabelul 1 Erorile n testarea ipotezelor statistice


Ipoteza adevrat
H0
H1
Decizie corect
Eroare de gen II

H1

(probabilitate 1-)
Eroare de gen I
(risc )

(risc )
Decizie corect
(probabilitate 1-)

Cu ct probabilitile comiterii erorilor de genul nti i de genul al doilea sunt mai mici, cu
att testul este mai bun. Acest lucru se poate realiza prin mrirea volumului eantionului, n.
Nivelurile riscurilor se stabilesc n funcie de considerente economice i de natura testului.
Am vzut c:
= P(respingere H0 | H0 este corect) = P(eroare de gen I)
= P(acceptare H0 | H0 este fals) = P(eroare de gen II)
Alegerea nivelului (pragului) de semnificaie depinde i de costurile asociate cu
producerea unei erori de genul I.
Exemplu
Pragul de semnificaie ales de o firm ce fabric ngheat, interesat n greutatea medie a
cutiilor de ngheat va putea fi diferit de pragul de semnificaie ales de o companie
farmaceutic, interesat de cantitatea medie a unui ingredient activ dintr-un tip de medicament.
Evident, costul n prima situaie prezentat este mult mai mic, comparativ cu costul asociat n
cazul producerii unei erori de genul I pentru compania farmaceutic: o cantitate prea mic de
ingredient activ poate face medicamentul ineficient; o cantitate prea mare de ingredient activ
poate cauza efecte secundare, duntoare sau poate avea, chiar, efecte letale.

Similar, exist costuri asociate cu producerea unei erori de genul al II-lea. ntre eroarea de
genul I i eroarea de genul al II-lea exist o legtur, o condiionare. O modalitate de a vizualiza
aceast legtur este s presupunem c exist doar dou distribuii care ne intereseaz. O
distribuie corespunde ipotezei nule H0, iar cealalt corespunde ipotezei alternativei H1. n acest
caz, presupunem c i ipoteza nul i cea alternativ sunt ipoteze simple. ntr-o manier uor de
neles, s considerm c ipoteza nul este de forma H0: =0, iar ipoteza alternativ este de forma
H1:=1 (figura 1):

Figura 1 - Legtura dintre probabilitile i

Pe grafic se observ c cele dou distribuii se suprapun i, din procesul de testare a ipotezei
nule, pot rezulta dou tipuri de erori.
Eroarea de genul I apare atunci cnd respingem ipoteza nul H0, n situaia n care, de fapt,
aceasta este adevrat. Adic, dei distribuia lui

este cea corespunztoare ipotezei H0, respingem

H0, deoarece media de sondaj este mai mare dect valoarea critic, C, i se situeaz n regiunea
critic. Probabilitatea comiterii unei astfel de erori (

) este aria de sub curba de distribuie H0, care

se situeaz la dreapta valorii critice C. Deseori, cnd lucrm cu soft-ware specializat, ntlnim
valoarea-p (p-value). Aceasta reprezint nivelul observat de semnificaie, adic cel mai mic
nivel la care H0 poate fi respins pentru un set de valori date.
Eroarea de genul al doilea apare atunci cnd nu respingem (adic acceptm) H0, dei H1 n
loc de H0 este corect. n acest caz, dei distribuia lui

este cea corespunztoare ipotezei H1,

acceptm H0 deoarece media de sondaj este mai mic dect valoarea critic, C (nu se afl n
regiunea critic). Probabilitatea comiterii unei astfel de erori () este aria de sub curba de
distribuie H1, care se situeaz la stnga valorii critice, C.
Dac alegem un prag de semnificaie, , mai mic (adic reducem riscul comiterii unei erori
de genul nti), va crete (riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creterea volumului n al eantionului, este posibil s reducem riscul , fr a crete riscul .

sx

sx

Cum

, o dat cu creterea volumului n al eantionului, abaterile medii ptratice ale

distribuiilor pentru H0 i H1 devin mai mici i, evident, att , ct i descresc (figura 2).

Figura 2 - i cnd volumul eantionului n' > n


5) Dup ce am stabilit pragul de semnificaie i regiunea critic, trecem la pasul urmtor, n
care vom face principalele presupuneri despre populaia sau populaiile ce sunt eantionate
(normalitate etc.).
6) Se calculeaz apoi testul statistic i se determin valoarea sa numeric, pe baza datelor
din eantion.
7) La ultimul pas, se desprind concluziile: ipoteza nul este fie acceptat, fie respins, astfel:

dac valoarea numeric a testului statistic cade n regiunea critic (Rc), respingem
ipoteza nul i concluzionm c ipoteza alternativ este adevrat. Vom ti c
aceast decizie este incorect doar n 100 % din cazuri;

dac valoarea numeric a testului nu cade n regiunea critic (Rc), se accept


ipoteza nul H0.

Ipoteza alternativ poate avea, aa cum am artat, una din trei forme (pe care le vom
exemplifica pentru testarea egalitii parametrului media colectivitii generale, cu valoarea
0):
i) s testm dac parametrul din colectivitatea general (media ) este egal cu o anumit
valoare (inclusiv zero, 0), cu alternativa media diferit de valoarea 0. Atunci:
H0: = 0,

H1: 0 ( < 0 sau > 0)


i acest test este un test bilateral;
ii) s testm ipoteza nul = 0, cu alternativa media este mai mare dect 0.
H0: = 0,
H1: > 0,
care este un test unilateral dreapta;
iii) s testm ipoteza nul = 0, cu alternativa media este mai mic dect 0.
H0: = 0,
H1: < 0,
care este un test unilateral stnga.

Regiunea critic pentru testul bilateral difer de cea pentru testul unilateral. Cnd ncercm
s detectm o diferen fa de ipoteza nul, n ambele direcii, trebuie s stabilim o regiune
critic Rc n ambele cozi ale distribuiei de eantionare pentru testul statistic. Cnd efectum un
test unilateral, vom stabili o regiune critic ntr-o singur parte a distribuiei de eantionare, astfel
(figura 3):

a)

b)

c)

Figura 3 Regiunea critic pentru:


a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga