Documente Academic
Documente Profesional
Documente Cultură
Sute de produse noi sunt lansate n fiecare an. Dintr-o varietate de motive, multe dintre
acestea nu reuesc s cucereasc piaa. De aceea, produsele care ajung n stagiul final de lansare
pe pia sunt evaluate de specialitii n marketing, care doresc s fac predicii asupra succesului
produselor (cu alte cuvinte, ct de bine se vor vinde). Evident, informaii complete i sigure nu se
pot obine i atunci specialitii vor dori s trag concluzii valide, pe baza datelor disponibile din
cercetri pariale. S presupunem c un lan de magazine dorete s vnd un nou produs lansat
pe pia i sper s aib succes. Dup o analiz financiar, specialitii determin c, dac mai
mult de 10% dintre potenialii cumprtori vor cumpra produsul, lanul de magazine va obine
profit. Un eantion aleator de clieni poteniali este selectat i persoanele sunt ntrebate dac ar
cumpra produsul. Procedeul de eantionare i de culegere a datelor este cunoscut, din capitolele
precedente, iar parametrul reprezint proporia clienilor care ar cumpra produsul. Testarea
ipotezei statistice se refer, atunci, la a determina dac proporia cumprtorilor este mai mare de
10%.
n urma prelevrii unui eantion dintr-o populaie statistic, prin prelucrarea datelor
provenite din sondaj se obine un estimator al parametrului urmrit n populaia de origine. Se
pune atunci problema n ce msur parametrul estimat pe baza rezultatelor sondajului asigur
credibilitatea aprecierilor fcute asupra ntregii colectiviti. Estimatorul este, aadar, o presupunere asupra parametrului, deci o ipotez statistic. Nu este nevoie s testm ipoteze statistice
atunci cnd tim totul despre un fenomen, ci doar cnd exist incertitudine.
Ipoteza statistic este ipoteza care se face cu privire la parametrul unei repartiii sau la
legea de repartiie pe care o urmeaz anumite variabile aleatoare. O ipotez statistic nu este
neaprat adevrat. Ea poate fi corect sau greit.
n statistic, ipotezele apar ntotdeauna n perechi: ipoteza nul i ipoteza alternativ. Ipoteza
statistic ce urmeaz a fi testat se numete ipotez nul i este notat, uzual, H0. Ea const
ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c nu
exist deosebiri eseniale. Respingerea ipotezei nule care este testat implic acceptarea unei alte
ipoteze. Aceast alt ipotez este numit ipotez alternativ, notat H1. Cele dou ipoteze
reprezint teorii, mutual exclusive i exhaustive, asupra valorii parametrului populaiei sau legii
de repartiie. Spunem c ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze s
fie adevrate. Spunem c ele sunt exhaustive deoarece acoper toate posibilitile, adic ori
ipoteza nul, ori ipoteza alternativ trebuie s fie adevrat.
Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de semnificaie.
O secven general de pai se aplic la toate situaiile de testare a ipotezelor statistice. Exist
patru componente principale ale unui test privind o ipotez:
ipoteza nul;
ipoteza alternativ;
testul statistic;
regiunea critic (de respingere).
Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul rmne
acelai, parcurgndu-se urmtorii pai:
1) Se identific ipoteza statistic special despre parametrul populaiei sau legea de
repartiie (H0). Ipoteza statistic numit i ipotez nul specific ntotdeauna o singur
n baza legii numerelor mari, numai ntr-un numr foarte mic de cazuri punctul rezultat din
sondaj va cdea n Rc, majoritatea vor cdea n afara regiunii critice. Nu este ns exclus ca
punctul din sondaj s cad n regiunea critic, cu toate c ipoteza nul despre parametrul
populaiei este adevrat. Cu alte cuvinte, atunci cnd respingem ipoteza nul, trebuie s ne
gndim de dou ori, deoarece exist dou posibiliti: ea este fals ntr-adevr i ea este totui
adevrat, dei pe baza datelor din sondaj o respingem.
La fel i pentru situaia n care acceptm ipoteza nul H 0. Cnd ipoteza nul nu poate fi
respins (nu exist suficiente dovezi pentru a fi respins), sunt dou posibiliti: ipoteza nul este
adevrat i ipoteza nul este totui fals, greit, dei nu am respins-o. De aceea, este mai corect
s spunem c pe baza datelor din eantionul studiat, nu putem respinge ipoteza nul, dect s
spunem c ipoteza nul este adevrat.
Eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat, se numete eroare de
genul nti. Probabilitatea comiterii unei astfel de erori reprezint riscul de genul nti () i se
numete nivel sau prag de semnificaie.
Nivelul de ncredere al unui test statistic este (1-), iar n expresie procentual, (1-)100
reprezint probabilitatea de garantare a rezultatelor.
Eroarea pe cere o facem acceptnd o ipotez nul, dei este fals, se numete eroare de
genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se noteaz cu . Puterea
testului statistic este (1-).
Tabelul 1 ilustreaz legtura dintre decizia pe care o lum referitor la ipoteza nul i
adevrul sau falsitatea acestei ipoteze.
Decizia de acceptare
H0
H1
(probabilitate 1-)
Eroare de gen I
(risc )
(risc )
Decizie corect
(probabilitate 1-)
Cu ct probabilitile comiterii erorilor de genul nti i de genul al doilea sunt mai mici, cu
att testul este mai bun. Acest lucru se poate realiza prin mrirea volumului eantionului, n.
Nivelurile riscurilor se stabilesc n funcie de considerente economice i de natura testului.
Am vzut c:
= P(respingere H0 | H0 este corect) = P(eroare de gen I)
= P(acceptare H0 | H0 este fals) = P(eroare de gen II)
Alegerea nivelului (pragului) de semnificaie depinde i de costurile asociate cu
producerea unei erori de genul I.
Exemplu
Pragul de semnificaie ales de o firm ce fabric ngheat, interesat n greutatea medie a
cutiilor de ngheat va putea fi diferit de pragul de semnificaie ales de o companie
farmaceutic, interesat de cantitatea medie a unui ingredient activ dintr-un tip de medicament.
Evident, costul n prima situaie prezentat este mult mai mic, comparativ cu costul asociat n
cazul producerii unei erori de genul I pentru compania farmaceutic: o cantitate prea mic de
ingredient activ poate face medicamentul ineficient; o cantitate prea mare de ingredient activ
poate cauza efecte secundare, duntoare sau poate avea, chiar, efecte letale.
Similar, exist costuri asociate cu producerea unei erori de genul al II-lea. ntre eroarea de
genul I i eroarea de genul al II-lea exist o legtur, o condiionare. O modalitate de a vizualiza
aceast legtur este s presupunem c exist doar dou distribuii care ne intereseaz. O
distribuie corespunde ipotezei nule H0, iar cealalt corespunde ipotezei alternativei H1. n acest
caz, presupunem c i ipoteza nul i cea alternativ sunt ipoteze simple. ntr-o manier uor de
neles, s considerm c ipoteza nul este de forma H0: =0, iar ipoteza alternativ este de forma
H1:=1 (figura 1):
Pe grafic se observ c cele dou distribuii se suprapun i, din procesul de testare a ipotezei
nule, pot rezulta dou tipuri de erori.
Eroarea de genul I apare atunci cnd respingem ipoteza nul H0, n situaia n care, de fapt,
aceasta este adevrat. Adic, dei distribuia lui
H0, deoarece media de sondaj este mai mare dect valoarea critic, C, i se situeaz n regiunea
critic. Probabilitatea comiterii unei astfel de erori (
se situeaz la dreapta valorii critice C. Deseori, cnd lucrm cu soft-ware specializat, ntlnim
valoarea-p (p-value). Aceasta reprezint nivelul observat de semnificaie, adic cel mai mic
nivel la care H0 poate fi respins pentru un set de valori date.
Eroarea de genul al doilea apare atunci cnd nu respingem (adic acceptm) H0, dei H1 n
loc de H0 este corect. n acest caz, dei distribuia lui
acceptm H0 deoarece media de sondaj este mai mic dect valoarea critic, C (nu se afl n
regiunea critic). Probabilitatea comiterii unei astfel de erori () este aria de sub curba de
distribuie H1, care se situeaz la stnga valorii critice, C.
Dac alegem un prag de semnificaie, , mai mic (adic reducem riscul comiterii unei erori
de genul nti), va crete (riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creterea volumului n al eantionului, este posibil s reducem riscul , fr a crete riscul .
sx
sx
Cum
distribuiilor pentru H0 i H1 devin mai mici i, evident, att , ct i descresc (figura 2).
dac valoarea numeric a testului statistic cade n regiunea critic (Rc), respingem
ipoteza nul i concluzionm c ipoteza alternativ este adevrat. Vom ti c
aceast decizie este incorect doar n 100 % din cazuri;
Ipoteza alternativ poate avea, aa cum am artat, una din trei forme (pe care le vom
exemplifica pentru testarea egalitii parametrului media colectivitii generale, cu valoarea
0):
i) s testm dac parametrul din colectivitatea general (media ) este egal cu o anumit
valoare (inclusiv zero, 0), cu alternativa media diferit de valoarea 0. Atunci:
H0: = 0,
Regiunea critic pentru testul bilateral difer de cea pentru testul unilateral. Cnd ncercm
s detectm o diferen fa de ipoteza nul, n ambele direcii, trebuie s stabilim o regiune
critic Rc n ambele cozi ale distribuiei de eantionare pentru testul statistic. Cnd efectum un
test unilateral, vom stabili o regiune critic ntr-o singur parte a distribuiei de eantionare, astfel
(figura 3):
a)
b)
c)