Sunteți pe pagina 1din 9

Cursul 3

Econometrie

Testarea ipotezelor statistice

Managerii trebuie să ia decizii, iar acest lucru îl pot face pe baza informaţiilor de care
dispun. Aceştia emit ipoteze pe care le pot testa ştiinţific utilizând metodele şi tehnicile
statistice.
Ex. Un lanţ de magazine doreşte să vândă un produs nou lansat pe piaţă şi speră să aibă
succes. În urma unei analize financiare, specialiştii observă că, dacă mai mult de 10% dintre
potenţialii cumpărători vor cumpăra produsul, lanţul de magazine va obţine profit. Specialiştii
de marketing, pentru a lua o decizie în sensul de a vinde sau nu produsul respectiv, vor selecta
un eşantion aleatoriu de clienţi potenţiali, iar aceştia vor fi întrebaţi dacă vor cumpăra sau nu
produsul respectiv. Parametrul este reprezentat de proporţia clienţilor care ar cumpăra
produsul. Testarea ipotezei statistice se va referi la a determina dacă proporţia cumpărătorilor
este mai mare de 10%.
În urma prelevării unui eşantion dintr-o populaţie statistică, prin prelucrarea datelor se
va obţine un estimator al parametrului urmărit în populaţia de origine.
În exemplul nostru, dacă s-ar face analiza pe toată populaţia s-ar constata că x% din
clienţi ar cumpăra produsul. Dar noi nu putem face analiza pe toată populaţia, ci doar pe un
eşantion. Pe eşantion însă noi nu putem face decât o estimaţie. Putem spune că x̂% din cei
intervievaţi ar cumpăra produsul.
Se pune problema de a vedea în ce măsură parametrul estimat pe baza rezultatelor
sondajului asigură „credibilitatea” aprecierilor făcute asupra întregii colectivităţi. Estimatorul
este, aşadar, o „presupunere” asupra parametrului, deci o ipoteză statistică. Când cunoaştem
totul despre un fenomen, nu avem ce ipoteză să testăm. Testarea ipotezei se face doar atunci
când există incertitudine.
Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau
la legea de repartiţie pe care o urmează anumite variabile aleatoare. O ipoteză statistică poate fi
corectă sau greşită.
Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată cu H0.
Aceasta constă în a admite că nu există deosebiri esenţiale între valoarea estimatorului şi
valoarea parametrului.

1
Respingerea ipotezei nule care este testată implică acceptarea ipotezei alternative,
notată cu H1.
Cele două ipoteze reprezintă teorii mutual exclusive şi exhaustive, asupra valorii
parametrului populaţiei sau legii de repartiţie.
Cele două ipoteze sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să
fie adevărate.
Ipotezele sunt exhaustive deoarece acoperă toate posibilităţile. Cu alte cuvinte, ori
ipoteza nulă, ori ipoteza alternativă trebuie să fie adevărată.
Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de
semnificaţie.
Pentru testarea unei ipoteze statistice se urmează o secvenţă de paşi, astfel:
1) Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea
de repartiţie.
Ipoteza statistică – numită şi ipoteză nulă H0 – specifică întotdeauna o singură valoare
a parametrului populaţiei, adică ceea ce este acceptat până se dovedeşte a fi fals.
2) Ipoteza nulă este însoţită întotdeauna de ipoteza alternativă H1, ce reprezintă o
teorie care contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente dovezi,
evidenţe, pentru a se stabili că este adevărată.
Ipoteza alternativă este cea mai importantă, deoarece este ipoteza care ne răspunde la
întrebare.
Ipoteza alternativă poate căpăta trei forme, care răspund la trei tipuri de întrebări
referitoare la parametrul studiat:
- dacă parametrul este diferit (mai mare sau mai mic) decât valoarea specificată în
ipoteza nulă;
- dacă parametrul este mai mare decât valoarea specificată în ipoteza nulă;
- dacă parametrul este mai mic decât valoarea specificată în ipoteza nulă;

3) Se calculează indicatorii statistici pentru eşantion şi se determină testul statistic ce


va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei nule.
În cazul nostru, deoarece media eşantionului este un estimator punctual al mediei din
colectivitatea generală, ea va fi utilizată în testarea ipotezelor privind parametrul media
colectivităţii generale.

2
4) Se stabileşte regiunea critică, Rc. Regiunea critică reprezintă valorile numerice ale
testului statistic pentru care ipoteza nulă va fi respinsă. Regiunea critică este astfel aleasă încât
probabilitatea ca ea să conţină testul statistic, când ipoteza nulă este adevărată, să fie α, cu α
având o valoare mică (ex. α=0,01 etc).
Verificarea ipotezei nule se face pe baza unui eşantion de volum n, extras dintr-o
populaţie totală N. Dacă punctul definit de vectorul de sondaj cade în regiunea critică Rc,
ipoteza H0 se respinge, iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă.
În baza legii numerelor mari, numai într-un număr foarte mic de cazuri punctul
rezultat din sondaj va cădea în Rc, majoritatea vor cădea în afara regiunii critice. Nu este însă
exclus ca punctul din sondaj să cadă în regiunea critică, cu toate că ipoteza nulă despre
parametrul populaţiei este adevărată. Mai exact, atunci când respingem ipoteza nulă, trebuie
să ne gândim de două ori, deoarece există două posibilităţi:
a. să fie falsă într-adevăr şi
b. să fie totuşi adevărată, deşi pe baza datelor din sondaj o respingem.
La fel şi pentru situaţia în care acceptăm ipoteza nulă H0. Şi aici există două
posibilităţi:
a. ipoteza nulă este adevărată şi
b. ipoteza nulă este totuşi falsă, greşită, deşi nu am respins-o.
Aşadar, este mai corect să spunem că, pe baza datelor din eşantionul studiat, nu putem
respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.
Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se numeşte
eroare de genul întâi. Probabilitatea comiterii unei astfel de erori reprezintă riscul de genul
întâi (α) şi se numeşte nivel sau prag de semnificaţie.
Nivelul de încredere al unui test statistic este (1-α), iar în expresie procentuală, (1-
α)100 reprezintă probabilitatea de garantare a rezultatelor.
Eroarea pe cere o facem acceptând o ipoteză nulă, deşi este falsă, se numeşte eroare
de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu β.
Puterea testului statistic este (1-β).
Legătura dintre decizia pe care o luăm referitor la ipoteza nulă şi adevărul sau
falsitatea acestei este redată în tabelul de mai jos.

3
Tabelul 1. Erorile în testarea ipotezelor statistice
Ipoteza adevărată
Decizia de acceptare
H0 H1

Decizie corectă Eroare de gen II


H0
(probabilitate 1-α) (risc β)
Eroare de gen I Decizie corectă
H1
(risc α) (probabilitate 1-β)

Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al doilea sunt mai
mici, cu atât testul este mai bun. Prin mărirea eşantionului probabilitatea comiterii erorilor se
micşorează.
5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la pasul
următor, în care vom face principalele presupuneri despre populaţia sau populaţiile ce
sunt eşantionate (normalitate etc.).
6) Se calculează apoi testul statistic şi se determină valoarea sa numerică, pe baza
datelor din eşantion.
7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată, fie respinsă,
astfel:
• dacă valoarea numerică a testului statistic cade în regiunea critică Rc, respingem
ipoteza nulă şi concluzionăm că ipoteza alternativă este adevărată;
• dacă valoarea numerică a testului nu cade în regiunea critică Rc, se acceptă
ipoteza nulă H0.

Ipoteza alternativă poate avea, aşa cum am arătat, una din trei forme (pe care le vom
exemplifica pentru testarea egalităţii parametrului „media colectivităţii generale”, μ cu
valoarea μ0):
I) să testăm dacă parametrul din colectivitatea generală (media μ) este egal cu o
anumită valoare (inclusiv zero, μ0), cu alternativa media diferită de valoarea μ0.
Atunci: H0: μ = μ0,
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
şi acest test este un test bilateral;
II) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai mare decât μ0:
În acest caz, H0: μ = μ0,
H1: μ > μ0,
care este un test unilateral dreapta;

4
III) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai mică decât μ0.
H0: μ = μ0,
H1: μ < μ0,
care este un test unilateral stânga.
Regiunea critică pentru testul bilateral diferă de cea pentru testul unilateral (a se vedea
pe grafic regiunea haşurată).

α/2 α/2 α α

μ μ μ

a) b) c)

Figura 1. Regiunea critică pentru:


a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga

Testarea ipotezei privind media populaţiei generale (μ)


pentru eşantioane de volum mare

Eşantioane de volum mare înseamnă n > 30. Testarea se face pe baza mediei
eşantionului x şi, pentru a o efectua, este nevoie să construim un test cu un nivel de
semnificaţie α prestabilit.
Dacă volumul eşantionului este mare, media eşantionului x este aproximativ normal
distribuită.
Se va aplica testul z. Variabila aleatoare z urmează o distribuţie normală standard.
Statistica z are următoarea formă:
x − µ0
z calc =
σx n

unde, x - media eşantionului;


μ0 - media teoretică (media populaţiei generale)
n – volumul eşantionului;
σ x - abaterea medie pătratică a populaţiei.

5
Valoarea calculată a lui z ( zcalc ) se va compara cu valoarea tabelată ( ztab (α ) ) pentru

pragul de semnificaţie α ales.


În funcţie de probabilitatea acceptată se respinge sau se acceptă ipoteza nulă ca în
tabelul următor.
Tabelul 2. Criterii de decizie
Tipul testului Distribuţia normală (z)
Eşantion mare (n≥30)
Test unilateral stânga zcalc. > - ztab (α ) acceptăm H0
zcalc. ≤ - ztab (α ) respingem H0
Test unilateral dreapta zcalc. < ztab (α ) acceptăm H0
zcalc. ≥ ztab (α ) respingem H0
Test bilateral - z tab (α / 2) < zcalc.< z tab (α / 2) acceptăm H0
zcalc. ≤ - z tab (α / 2) sau zcalc. ≥ z tab (α / 2) respingem H0

Aplicaţia 1. Patronul unei firme de prestări servicii doreşte să fluidizeze servirea


clienţilor şi, până în prezent, el presupunea că timpul de servire a clienţilor este normal
distribuit, de medie 130 de minute şi abatere medie pătratică 15 minute. El este de acord cu
abaterea medie pătratică, dar se îndoieşte de faptul că durata medie de servire a unui client
este 130 minute. Pentru a studia această problemă, înregistrează timpii de servire pentru 100
de clienţi. Timpul mediu obţinut în eşantion este 120 minute. Poate patronul să concluzioneze,
la o probabilitate de 99%, că timpul mediu este diferit de 130 minute.
În această problemă, parametrul ce ne interesează este timpul mediu în colectivitatea
generală şi ipotezele de testat sunt:
H 0 : µ = 130,
Acesta este un test bilateral.
H 1 : µ ≠ 130.
Trebuie, aşadar, să răspundem la întrebarea: “Este media de 120 minute suficient de
diferită de valoarea 130, pentru a ne permite să concluzionăm că media populaţiei nu este
egală cu 130 minute?”
Vom putea să respingem ipoteza nulă dacă media eşantionului este suficient de
diferită, relativ la valoarea 130. Dar, interpretările nu sunt evidente. Dacă în eşantion
obţineam media 1300 sau 1,3 atunci diferenţele erau clare. De asemenea, dacă media
eşantionului era 130,1 atunci egalitatea era şi ea evidentă.
Distribuţia de eşantionare a mediei x este normală sau aproximativ normală, cu media
µ şi abaterea medie pătratică σ x .

6
x − µ0 120 − 130
z calc = = = −6,67 .
σx n 15 / 100
P = (1-α)*100=99% → α = 0,01
z tab (α / 2) = z tab ( 0, 01 / 2 ) = z tab ( 0, 005) = 2,575
Regiunea de respingere (critică) o putem specifica astfel:
Cum z calc = −6,67 < −2,575 , rezultă că sunt suficiente dovezi pentru a respinge ipoteza
nulă H0 şi a accepta ipoteza alternativă, aceea că timpul mediu de servire a unui client este
diferit de 130 minute.

Aplicaţia 2. Un producător de detergenţi industriali preambalează produsul la cutii ce


trebuie să aibă, în medie, 12 kg. El doreşte să verifice corectitudinea ambalării şi hotărăşte să
organizeze un sondaj de n=100 observaţii (cutii), pentru care obţine greutatea medie x = 11,85
kg, cu o abatere medie pătratică σ x =0,5 kg. Să se testeze ipoteza conform căreia în medie
cutiile au câte 12 kg, cu alternativa că greutatea este diferită de 12 kg. (<12 kg sau >12 kg),
pentru o probabilitate de 95%.
H0: µ = µ 0 = 12 kg;

H1: µ ≠ 12 kg ( µ < 12 kg sau µ > 12 kg).

x − µ0 11,85 − 12
Testul statistic: z = = = −3,0 .
σx / n 0,5 / 10

Nivelul de încredere: 1 - α = 0,95.

Pragul de semnificaţie: α = 0,05, din care rezultă α/2 = 0,025 (deoarece avem test
bilateral).

z tab (α / 2 ) = z tab ( 0, 025) = 1,96 .

Regiunea de respingere: z tab (α / 2) < −1,96 sau z tab (α / 2) > 1,96 .

Cum z calc > z tab (α / 2 ) , rezultă că ipoteza nulă este respinsă şi se acceptă ipoteza

alternativă, aceea că în cutii se află o cantitate de detergenţi semnificativ diferită de 12 kg.

Aplicaţia 3. Într-o cercetare prin sondaj aleator privitoare la transportul în comun, au


fost selectate 100 de persoane pentru care s-a calculat valoarea medie a biletelor cumpărate

7
într-o lună pentru transport în comun urban de 110 u.m, cu o abatere medie pătratică de 60
u.m.

a) Testaţi ipoteza nulă, aceea conform căreia valoarea medie a biletelor cumpărate într-
o lună, în colectivitatea generală, este µ = µ 0 = 100 u.m, cu ipoteza alternativă µ > µ 0 = 100

u.m, utilizând un nivel de încredere 1 - α = 0,95 (probabilitatea (1-α)⋅100 = 95%).


b) Testaţi ipoteza nulă µ = µ 0 = 100 u.m, cu ipoteza alternativă µ ≠ µ 0 = 100 u.m, cu
aceeaşi probabilitate. Interpretaţi rezultatele.

a) H0: µ = µ 0 = 100 u.m

H1: µ > µ 0 = 100 u.m.


Aşadar, avem un test unilateral dreapta.

x − µ0 110 − 100
Testul statistic: z = = = 1,67
σx / n 60 / 10

Nivelul de încredere: 1 - α = 0,95.


Pragul de semnificaţie: α = 0,05 (test unilateral dreapta)
z tab (α ) = z tab ( 0, 05) = 1,645

Cum z calc > z tab (α ) , rezultă că ipoteza nulă este respinsă ( µ = µ 0 = 100 u.m.) şi se

acceptă ipoteza alternativă ( µ > µ 0 = 100 u.m.).

b) H0: µ = µ 0 = 100 u.m.;

H1: µ ≠ µ 0 = 100 u.m.

x − µ0 110 − 100
Test statistic: z = = = 1,67 .
σx / n 60 / 10

Nivelul de încredere 1 - α = 0,95.

Pragul de semnificaţie α = 0,05, din care rezultă α/2 = 0,025 (deoarece avem test
bilateral).

z tab (α / 2 ) = z tab ( 0, 025) = 1,96

8
Cum z calc < z tab (α / 2) , (1,67 < 1,96), rezultă că se acceptă ipoteza nulă (valoarea medie a

biletelor cumpărate nu este semnificativ diferită de 100 u.m.).

S-ar putea să vă placă și