Sunteți pe pagina 1din 6

Curs8

CURS 8. FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR


STATISTICE

8.1. Concepte generale in testarea ipotezelor statistice


Procesul de luare a deciziilor presupune analiza, judecarea si interpretarea evidenelor
oferite de datele pe care le avem la dispoziie. Managerii trebuie s fie pregtii s ia
decizii privind aciunile viitoare pe baza informaiilor disponibile. Astfel, ei emit ipoteze
pe care le pot testa tiinific utiliznd metodele si tehnicile statistice. Testarea ipotezelor
statistice reprezint o alt modalitate, alturi de estimaia pe interval de ncredere, de a
realiza inferen statistic. Scopul acestui tip de inferen statistic este s determinm
dac exist suficiente dovezi statistice care s ne permit s concluzionm c o afirmaie
(sau o ipotez) dspre un parametru este adevrat.

Exemplu. Sute de produse noi sunt lansate n fiecare an. Dintr-o varietate de motive, multe
dintre acestea nu reuesc s cucereasc piaa. De aceea, produsele care ajung in stadiul final de
lansare pe pia sunt evaluate de specialitii n marketing, care doresc s fac predicii asupra
succesului (cu alte cuvinte, ct de bine se vor vinde). Evident, informaii complete i sigure nu se
pot obine i atunci specialitii vor dori s trag concluzii valide, pe baza datelor disponibile din
cercetri pariale. S presupunem c un lan de magazine dorete s vnd un nou produs lansat
pe pia i sper s aib succes. Dup o analiz financiar, specialitii determin c, dac mai
mult de 10% din potenialii cumprtori vor cumpra produsul, lanul de magazine va obine
profit. Un eantion aleator de clieni poteniali este selectat i persoanele sunt ntrebate dac ar
cumpra produsul. Procedeul de eantionare i de culegere a datelor este cunoscut din cursurile
precedente, iar parametrul reprezint proporia clienilor care ar cumpra produsul. Testarea
ipotezei statistice se refer, atunci, la a determina dac proporia cumprtorilor este mai mare
de 10%. n urma prelevrii unui eantion dintr-o populaie statistica, prin prelucrarea datelor
provenite din sondaj se obine un estimator al parametrului urmrit n populaia de origine. Se
pune atunci problema n ce msur parametrul estimat pe baza rezultatelor sondajului asigur
credibilitatea aprecierilor fcute asupra ntregii colectiviti. Estimatorul este, aadar, o
presupunere asupra parametrului, deci o ipotez statistic. Nu este nevoie s testm ipoteze
statistice atunci cnd tim totul despre un fenomen, ci doar cnd exist incertitudine.

Ipoteza statistic este ipoteza care se face cu privire la parametrul unei repartiii sau la
legea de repartiie pe care o urmeaz anumite variabile aleatoare. O ipoez statistic nu
este neaprat adevrat. Ea poate fi corect sau greit. n statistic, ipotezele apar
ntotdeauna n perechi: ipoteza nul si ipoteza alternativ. Ipoteza statistic ce urmeaz a
fi testat se numete ipotez nul i este notat, uzual, H0. Ea const ntotdeauna n
admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu exist
deosebiri eseniale. Respingerea ipotezei nule care este testat implic acceptarea unei
alte ipoteze. Aceast alt ipotez este numit ipotez alternativ, notat H1. Cele dou
ipoteze reprezint teorii, mutual exclusive si exhaustive, asupra valorii parametrului
1

Curs8

populaiei sau legii de repartiie. Spunem c ele sunt mutual exclusive deoarece este
imposibil ca ambele ipoteze s fie adevrate. Spunem c ele sunt exhaustive deoarece
acoper toate posibilitile, adic ori ipoteza nul, ori ipoteza alternativ trebuie s fie
adevrat. Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de
semnificaie. O secven general de pai se aplic la toate situaiile de testare a
ipotezelor statistice. Exist patru componente principale ale unui test privind o ipotez:
ipoteza nul;
ipoteza alternativ;
testul statistic;
regiunea critic (de respingere).

Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul rmne
acelai, parcurgndu-se urmtorii pai:
1) Se identific ipoteza statistic special despre parametrul populaiei sau legea de
repartiie (H0). Ipoteza statistic numit i ipotez nul specific ntotdeauna o singur
valoare a parametrului populaiei i reprezint status-quo-ul, ceea ce este acceptat pn se
dovedete a fi fals.
2) ntotdeauna, ipoteza nul este nsoit de ipoteza alternativ (de cercetat), H1, ce
reprezint o teorie care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente
dovezi, evidene, pentru a se stabili c este adevrat.
Ipoteza alternativ este cea mai important, deoarece este ipoteza care ne rspunde la
ntrebare. Ipoteza alternativ poate cpta trei forme, care rspund la trei tipuri de ntrebri
referitoare la parametrul studiat:

dac parametrul este diferit (mai mare sau mai mic) dect valoarea specificat n
ipoteza nul;

dac parametrul este mai mare dect valoarea specificat n ipoteza nul;

dac parametrul este mai mic dect valoarea specificat n ipoteza nul.
3) Se calculeaz indicatorii statistici n eantion, utilizai pentru a accepta sau a respinge
ipoteza nul i se determin testul statistic ce va fi utilizat drept criteriu de acceptare sau de
respingere a ipotezei nule.
Pentru cele mai multe testri statistice ale ipotezelor, testul statistic este derivat din
estimatorul punctual al parametrului ce va fi testat. Spre exemplu, deoarece media eantionului
este un estimator punctual al mediei din colectivitatea general, ea va fi utilizat n testarea
ipotezelor privind parametrul media colectivitii generale.
4) Se stabilete regiunea critic, Rc. Regiunea critic reprezint valorile numerice ale
testului statistic pentru care ipoteza nul va fi respins. Regiunea critic este astfel aleas nct
probabilitatea ca ea s conin testul statistic, cnd ipoteza nul este adevrat, s fie , cu mic
( = 0.01 etc). Verificarea ipotezei nule se face pe baza unui eantion de volum n, extras din
populaia X, care este o variabil aleatoare. Dac punctul definit de vectorul de sondaj x1, x2, ..., xn
cade n regiunea critic Rc, ipoteza H0 se respinge, iar dac punctul cade n afara regiunii critice
Rc, ipoteza H0 se accept. Regiunea critic este delimitat de valoarea critic, C punctul de
tietur n stabilirea acesteia.
n baza legii numerelor mari, numai ntr-un numr foarte mic de cazuri punctul rezultat din
sondaj va cdea n Rc, majoritatea vor cdea n afara regiunii critice. Nu este ns exclus ca
2

Curs8
punctul din sondaj s cad n regiunea critic, cu toate c ipoteza nul despre parametrul
populaiei este adevarat. Cu alte cuvinte, atunci cnd respingem ipoteza nul, trebuie s ne
gndim de dou ori, deoarece exist dou posibiliti: ea este fals ntr-adevr i ea este totui
adevrat, dei pe baza datelor din sondaj o respingem.
La fel i pentru situaia n care acceptm ipoteza nul H0. Cnd ipoteza nul nu poate fi respins
(nu exist suficiente dovezi pentru a fi respins), sunt dou posibiliti: ipoteza nul este
adevrat si ipoteza nul este totui fals, greit, dei nu am respins-o. De aceea, este mai corect
s spunem c, pe baza datelor din eantionul studiat,nu putem respinge ipoteza nul, dect s spunem c
ipoteza nul este adevrat.
Eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat, se numete eroare de
genul nti. Probabilitatea comiterii unei astfel de erori reprezint riscul de genul nti () i se
numete nivel sau prag de semnificaie.
Nivelul de ncredere al unui test statistic este (1 ), iar n expresie procentual, (1 )100
reprezint probabilitatea de garantare a rezultatelor.
Eroarea pe care o facem acceptnd o ipotez nul, dei este fals, se numete eroare de genul al
doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se noteaz cu . Puterea testului
statistic este (1 ).
Tabelul 8.1. ilustreaz legtura dintre decizia pe care o lum referitor la ipoteza nul i adevrul
sau falsitatea acestei ipoteze.
Tabelul 8.1. Erorile n testarea ipotezelor statistice
Decizia
de Ipoteza adevrat
acceptare
H0
H1
Decizie corect
Eroare de gen II
H0
(probabilitate 1 )
(risc )
Eroare de gen I
Decizie corect
H1
(risc )
(probabilitate 1 )
Cu ct probabilitile comiterii erorilor de genul nti i de genul al doilea sunt mai mici, cu att
testul este mai bun. Acest lucru se poate realiza prin mrirea volumului eantionului, n.
Nivelurile riscurilor se stabilesc n funcie de considerente economice i de natura testului.
Am vzut c:
= P (respingere H0| H0 este corect) = P (eroare de gen I);
= P (acceptare H0| H0 este fals) = P (eroare de gen II).
Alegerea nivelului (pragului) de semnificaie depinde i de costurile asociate cu producerea
unei erori de genul I.

Exemplu. Pragul de semnificaie ales de o firm ce fabric ngheat, interesat n greutatea


medie a cutiilor de ngheat, va putea fi diferit de pragul de semnificaie ales de o companie
farmaceutic, interesat de cantitatea medie a unui ingredient activ dintr-un tip de medicament.
Evident, costul n prima situaie prezentat este mult mai mic, comparativ cu costul asociat n
cazul producerii unei erori de genul I pentru compania farmaceutic: o cantitate prea mic de
ingredient activ poate face medicamentul ineficient; o cantitate prea mare de ingredient activ
poate cauza efecte secundare, duntoare sau poate avea, chiar, efecte letale.
3

Curs8
Similar, exist costuri asociate cu producerea unei erori de genul al II-lea. ntre eroarea de genul I
i eroarea de genul al II-lea exist o legatur, o condiionare. O modalitate de a vizualiza aceast
legtur este s presupunem c exist doar dou distribuii care ne intereseaz. O distribuie
corespunde ipotezei nule H0, iar cealalt corespunde ipotezei alternative H1. n acest caz,
presupunem c i ipoteza nul i cea alternativ sunt ipoteze simple. ntr-o manier uor de
neles, considerm c ipoteza nul este de forma H0: = 0, iar ipoteza alternativ este de forma
H1: = 1 (figura 8.1.):

Figura 8.1. Legtura dintre probabilitile

Pe grafic se observ c cele dou distribuii se suprapun i, din procesul de testare a ipotezei
nule, pot rezulta dou tipuri de erori.
Eroarea de genul I apare atunci cnd respingem ipoteza nul H0, n situaia n care, de fapt,
aceasta este adevrat. Adic, dei distribuia lui x este cea corespunztoare ipotezei H0,
respingem H0, deoarece media de sondaj este mai mare dect valoarea critic, C, i se situeaz n
regiunea critic. Probabilitatea comiterii unei astfel de erori () este aria de sub curba de
distribuie H0, care se situeaz la dreapta valorii critice C. Deseori, cnd lucrm cu soft-ware
specializat, ntlnim valoarea-p (p-value). Aceasta reprezint nivelul observat de
semnificaie, adic cel mai mic nivel la care H0 poate fi respins pentru un set de valori date.
Eroarea de genul al doilea apare atunci cnd nu respingem (adic acceptm) H0, dei H1 n loc de
H0 este corect. n acest caz, dei distribuia lui x este cea corespunztoare ipotezei H1, acceptm
H0 deoarece media de sondaj este mai mic dect valoarea critic, C (nu se afl n regiunea
critic). Probabilitatea comiterii unei astfel de erori () este aria de sub curba de distribuie H1,
care se situeaz la stnga valorii critice, C.
Dac alegem un prag de semnificaie, , mai mic (adic reducem riscul comiterii unei erori de
genul nti), va crete (riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creterea volumului n al eantionului, este posibil s reducem riscul , fr a crete riscul .
Cum sx

sx
n

, o dat cu creterea volumului n al eantionului, abaterile medii ptratice ale

distribuiilor pentru H0 i H1 devin mai mici i, evident, att , ct i descresc (figura 8.2.).

Curs8

Figura 8.2.

cnd volumul eantionului n>n

5) Dup ce am stabilit pragul de semnificaie i regiunea critic, trecem la pasul urmtor,


n care vom face principalele presupuneri despre populaia sau populaiile ce sunt eantionate
(normalitate etc.).
6) Se calculeaz apoi testul statistic i se determin valoarea sa numeric, pe baza datelor
din eantion.
7) La ultimul pas, se desprind concluziile: ipoteza nul este fie acceptat, fie respins,
astfel:
a) dac valoarea numeric a testului statistic cade n regiunea critic (Rc), respingem
ipoteza nul i concluzionm c ipoteza alternativ este adevrat. Vom ti c aceast decizie
este incorect doar n 100 % din cazuri;
b) dac valoarea numeric a testului nu cade n regiunea critic (Rc), se accept ipoteza
nul H0.
Ipoteza alternativ poate avea, aa cum am artat, una din trei forme (pe care le vom
exemplifica pentru testarea egalitaii parametrului media colectivitii generale, cu valoarea
0):
i) s testm dac parametrul din colectivitatea general (media ) este egal cu o anumit
valoare (inclusiv zero, 0), cu alternativa media diferit de valoarea 0. Atunci:

H0 :

0,

H1 :

sau

i acest test este un test bilateral;


ii) s testm poteza nul = 0, cu alternativa media este mai mare dect 0,
H0: = 0,
H1: > 0,
care este un test unilateral dreapta;
iii) s testm ipoteza nul = 0, cu alternativa media este mai mic dect 0,
H0: = 0,
H1: < 0,
care este un test unilateral stnga.
Regiunea critic pentru testul bilateral difer de cea pentru testul unilateral. Cnd ncercm s
detectm o diferen fa de ipoteza nul, n ambele direcii, trebuie s stabilim o regiune critic
Rc n ambele cozi ale distribuiei de eantionare pentru testul statistic. Cnd efectum un test
unilateral, vom stabili o regiune critic ntr-o singur parte a distribuiei de eantionare, astfel
(figura 8.3.):
5

Curs8

a)

b)

c)

Figura 8.3.Regiunea critic:


a) test bilateral; b) test unilateral dreapta; c) test unilateral stnga.