Sunteți pe pagina 1din 12

UNITATEA DE ÎNVĂŢARE 8

VERIFICAREA IPOTEZELOR STATISTICE

CUPRINS

8.1. Obiective 1
8.2. Demersul verificării unei ipoteze statistice 2
8.3. Verificarea ipotezelor referitoare la media unei populaţii statistice 5
8.4. Test de autoevaluare 8
8.5. Răspunsuri Test de autoevaluare 9
8.6. Lucrare de verificare 11
8.7. Rezumat 12
8.8. Bibliografie 12

8.1. OBIECTIVE. În Unitatea de învăţare 8, Verificarea ipotezelor


statistice, se urmăreşte:
- demersul verificării unei ipoteze statistice
- verificarea ipotezelor statistice cu privire la media unei populaţii
8.2. DEMERSUL VERIFICĂRII UNEI IPOTEZE STATISTICE

Verificarea sau testarea ipotezelor statistice este strâns legată de


cercetarea prin sondaj. Testarea unei ipoteze statistice reprezintă procesul de
luare a unei decizii de admitere sau respingere a unei ipoteze referitoare la
distribuţia uneia sau a mai multor variabile ori cu privire la un parametru al unei
distribuţii date, baza unor reguli prestabilite.
Procedeul de verificare a unei ipoteze statistice poartă numele de test sau
criteriu de semnificaţie şi presupune, în general, parcurgerea următoarelor
etape:
Etapa I. Formularea ipotezelor statistice. Ipoteza ce urmează a fi
verificată se numeşte ipoteză nulă şi constă în admiterea faptului că eventualele
deosebiri între două distribuţii sau între doi parametri sunt întâmplătoare. Se
notează, de regulă, cu H0. Ipoteza care se testează în opoziţie cu ipoteza nulă se
numeşte ipoteza alternativă şi se notează cu H1. Ipoteza alternativă se va
accepta atunci când se respinge ipoteza nulă, şi invers.
Dacă verificarea ipotezei se referă la un parametru θ care se presupune că
ia o valoare θ0, atunci ipoteza nulă se prezintă astfel:

H0: θ =θ0 (1)

iar ipoteza alternativă poate lua una din formele:


− test bilateral: H1: θ ≠ θ0;
− test unilateral la stânga: H1: θ < θ0;
− test unilateral la dreapta: H1: θ > θ0;
Verificarea ipotezei nule se face pe baza unui eşantion de volum n, extras
din populaţia statistică studiată. Acceptarea sau respingerea acesteia ridică
problema definirii regiunii de acceptare, respectiv, a regiunii de respingere a
ipotezei, adică a alegerii tipului de test (unilateral sau bilateral) şi a
probabilităţii asociate acestuia.
Regiunea de acceptare reprezintă intervalul în care ipoteza nulă H0 este
acceptată ca urmare a efectuării unui test statistic şi are probabilitatea asociată p
= 1 – α, numită nivel (prag) de încredere.
Complementar, regiunea de respingere se defineşte ca interval de
respingere a ipotezei nule H0 ca urmare a efectuării testului statistic şi are
probabilitatea asociată α, numită nivel (prag) de semnificaţie. De regulă, cea

2
care se stabileşte în cadrul testului este regiunea de respingere, pentru un nivel
de semnificaţie considerat acceptabil de către analist.
Pentru testul bilateral (H0:θ =θ0; H1:θ ≠ θ0), regiunea de respingere
corespunde unui interval împărţit în două subintervale, delimitate la un capăt de
câte o valoare critică (tabelată) – una inferioară (Li) şi una superioară (Ls) – iar
la celălalt capăt de ±∞, conform figurii 1

Zonă de acceptare H0
(p = 1 – α)

Zonă de Zonă de
respinger respinger
e e
H0 H0

Li Media de selecţie Ls

Figura 1. Regiunea de acceptare şi regiunea de respingere a H0 în


cazul testului bilateral

Pentru testul unilateral la stânga (H0:θ =θ0; H1:θ < θ0), regiunea de
respingere corespunde unui singur interval, delimitat la dreapta de o valoare
critică (Lcritic), iar la stânga de –∞, conform figurii 2

Zonă de acceptare H0
(p = 1 – α)

Zonă de
respinger
e
H0

Lcritic Media de
Figura 2. Regiunea de acceptare şi regiunea de respingere a h0 în
cazul testului unilateral la stânga

3
Pentru testul unilateral la dreapta (H0:θ =θ0; H1:θ > θ0), regiunea de
respingere corespunde tot unui singur interval, delimitat, de data aceasta, la
stânga de o valoare critică (Lcritic), iar la dreapta de +∞, conform figurii 3:

Zonă de acceptare H0
(p = 1 – α)

Zonă de
respin-
gere
H0

Media de selecţie Lcritic

Figura 3. Regiunea de acceptare şi regiunea de respingere a h0 în


cazul testului unilateral la dreapta

Pe parcursul verificării ipotezelor statistice pot apare o serie de erori de


testare, concretizate în acceptarea sau respingerea pe nedrept a unei ipoteze.
Erorile au, la rândul lor o anumită repartiţie de probabilitate, fiecărui tip de
eroare fiindu-i caracteristică o anumită probabilitate.
Eroarea prin care se respinge o ipoteză adevărată se numeşte eroare de
ordinul întâi, iar probabilitatea asociată acesteia poartă numele de risc de
ordinul întâi şi este notată cu α.
Eroarea prin care se acceptă o ipoteză falsă poartă numele de eroare de
ordinul doi, iar probabilitatea asociată acesteia se numeşte risc de ordinul doi şi
este notată cu β.
Etapa a II-a. Alegerea nivelului de semnificaţie (α) al testului. În această
etapă se stabileşte, în funcţie de specific, nivelul de semnificaţie, adică
întinderea regiunii de respingere a testului. În practica economică, în cele mai
multe cazuri, nivelul de semnificaţie se alege ca fiind: α = 0,05 sau α = 5%.
Etapa a III-a. Alegerea testului statistic şi determinarea valorii calculate
aferente acestuia. Testele statistice se aleg în funcţie de ipoteza verificată şi de
repartiţia populaţiei statistice studiate. Cel mai des utilizate în practică sunt
testele (criteriile): Laplace (z), Student (t), Helmert (χ2) şi Fisher (f). Valorile
calculate aferente acestor teste se determină conform metodologiei specifice
fiecărui test în parte.

4
Etapa a IV-a. Alegerea valorii critice (tabelare) aferente testului utilizat.
Fiecărui test statistic îi corespunde o repartiţie de valori, prezentate, de regulă,
sub formă tabelară. Din tabelele aferente repartiţiei respective se alege, în
funcţie de anumite criterii, valoarea critică sau tabelară a testului.
Etapa a V-a. Compararea valorii calculate a testului cu cea critică şi
luarea deciziei. Aceasta reprezintă ultima etapă a verificării unei ipoteze
statistice şi constă în compararea valorii calculate cu cea critică, iar în urma
acestei comparaţii, conform regulilor stabilite, se decide dacă ipoteza nulă h0 se
acceptă sau se respinge. Indiferent de decizia luată, aceasta va avea o
probabilitate de eroare egală cu nivelul de semnificaţie al testului, α .

8.3. Verificarea ipotezelor referitoare la media unei populaţii


statistice

Acest tip de test este utilizat pentru a verifica dacă media populaţiei
statistice studiate, m, are sau nu o anumită valoare, m0, având la dispoziţie
datele aferente unui eşantion de volum n. Verificarea ipotezei presupune
calcularea mediei de selecţie ( x ) pe baza datelor eşantionului, precum şi
deţinerea unor informaţii referitoare la varianţa populaţiei statistice (σ2). În
funcţie de aceste elemente, există două tipuri de teste referitoare la media
populaţiei statistice:
I. Dacă varianţa populaţiei statistice (σ2) este cunoscută, situaţie
întâlnită în special în cazul controlului proceselor de producţie, având, la rândul
său, două variante:
I-a) dacă volumul eşantionului este mai mare de 30 de unităţi (n > 30),
înseamnă că testul are le bază o repartiţie normală centrată redusă (funcţia
laplace), iar verificarea ipotezei referitoare la media populaţiei statistice va
parcurge următoarele etape:
1. Se formulează ipoteza nulă, conform căreia media populaţiei statistice
studiate (m) ia o anumită valoare (m0): H0: m = m0, cu ipoteza alternativă (testul
este, de regulă, bilateral): H1: m ≠ m0;
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule), α. De regulă, în prelucrarea statistică a datelor referitoare la
fenomene sau procese economice, valoarea nivelului de semnificaţie se alege ca
fiind α = 0,05 (sau 5%);
3. Se determină valoarea calculată (numerică) a testului Laplace (zc),
după relaţia:

5
x − m0
zc = n (2)
σ
4. Din tabelele statistice aferente funcţiei Laplace se obţine, în funcţie de
nivelul de semnificaţie, α = 1 – 2φ(z), valoarea critică (tabelară) a testului (zα);
5. Se compară valoarea calculată a testului cu cea critică şi se ia decizia
de acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (zc ≤
zα), atunci ipoteza nulă h0 se acceptă şi se poate spune cu probabilitatea p = 1 –
α că media populaţiei statistice studiate, m, are valoarea m0, eventualele
diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (zc > zα),
atunci ipoteza nulă h0 se respinge şi se poate spune cu probabilitatea p = 1 – α
că media populaţiei statistice studiate, m, nu are valoarea m0, diferenţele fiind
semnificative.
I-b) dacă volumul eşantionului este mai mic de 30 de unităţi (n < 30),
înseamnă că testul are la bază o repartiţie student cu ν = n – 1 grade de libertate,
iar verificarea ipotezei referitoare la media populaţiei statistice va presupune
parcurgerea următoarelor etape:
1. Se formulează aceeaşi ipoteză nulă, conform căreia media populaţiei
statistice studiate, m, ia o anumită valoare, m0: H0: m = m0, cu ipoteza
alternativă: H1: m ≠ m0;
2. Se stabileşte nivelul de semnificaţie al testului (regiunea de respingere
a ipotezei nule), α ;
3. Se determină valoarea calculată (numerică) a testului Student (tc), de
această dată, conform relaţiei:

x − m0
tc = n (7.3)
σ
4. Din tabelele statistice aferente repartiţiei Student se alege, în funcţie
de nivelul de semnificaţie, α/2 şi ν = n – 1 grade de libertate, valoarea critică a
testului student (tα/2;ν);
5. Se compară valoarea calculată cu cea critică şi se ia decizia de
acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (tc ≤
tα/2;ν), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1

6
– α că media populaţiei statistice studiate, m, are valoarea m0, eventualele
diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (tc > tα/2;ν),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – α
că media populaţiei statistice studiate, m, nu are valoarea m0, diferenţele fiind
semnificative.
II. Dacă varianţa populaţiei statistice (σ2) nu este cunoscută, situaţia
cel mai des întâlnită în activitatea economică, atunci, în locul abaterii standard
la nivelul populaţiei statistice (σ), se va utiliza estimatorul acesteia (s),
determinat pe baza datelor eşantionului, conform relaţiei:

∑(x − x)
n
2
i
i =1
s= (4)
n−1

Testul are la bază tot o repartiţie student cu ν = n – 1 grade de libertate,


iar etapele verificării ipotezei statistice, similare cu cele de la varianta I-b, se
parcurg după cum urmează:
1. Se formulează ipoteza nulă, conform căreia media populaţiei statistice
studiate, m, ia valoarea m0: H0: m = m0, cu ipoteza alternativă: H1: m ≠ m0;
2. Se stabileşte nivelul de semnificaţie al testului, α ;
3. Se determină valoarea calculată a testului Student (tc), după relaţia:

x − m0
tc = n (5)
s

4. Din tabelele statistice aferente repartiţiei Student (anexa 2) se alege, în


funcţie de nivelul de semnificaţie, α/2 şi ν = n – 1 grade de libertate, valoarea
critică a testului student (tα/2;ν);
5. Se compară valoarea calculată cu cea critică şi se ia decizia de
acceptare sau de respingere a ipotezei nule, astfel:
– dacă valoarea calculată este mai mică sau egală cu valoarea critică (tc ≤
tα/2;ν), atunci ipoteza nulă H0 se acceptă şi se poate spune cu probabilitatea p = 1
– α că media populaţiei statistice studiate, m, are valoarea m0, eventualele
diferenţe fiind întâmplătoare;
– dacă valoarea calculată este mai mare decât valoarea critică (tc> tα/2;ν),
atunci ipoteza nulă H0 se respinge şi se poate spune cu probabilitatea p = 1 – α
că media populaţiei statistice studiate, m, nu are valoarea m0, diferenţele fiind
semnificative

7
8.4. Test de autoevaluare

1. Capacitatea nominală de producţie a unei linii tehnologice este de 75


tone/zi. Datorită factorilor aleatori care acţionează de-a lungul
procesului de producţie, valorile reale ale producţiei se abat în plus sau
în minus faţă de capacitatea nominală. Pentru a controla producţia
obţinută, s-a verificat linia tehnologică, timp de 60 de zile, alese aleator,
şi s-au obţinut următoarele date:

77,5 73,4 76,9 78,7 74,6 79,4 77,5 71,6 77,6 77,8
69,9 75,4 77,6 73,6 77,9 71,7 69,8 70,3 73,3 71,7
70,6 74,8 76,1 70,4 78,1 77,5 78,7 74,6 73,1 74,5
77,5 73,3 76,7 78,5 73,6 77,3 75,5 71,6 74,6 74,8
69,7 75,3 75,6 73,6 75,7 71,7 77,8 77,3 73,4 71,5
71,3 73,8 76,1 70,3 78,1 77,5 78,5 73,6 73,7 73,5

Presupunând că, din experienţa anterioară, se cunoaşte varianţa procesului de


producţie, σ2 = 10, se cere să se verifice, cu o probabilitate de 95%, dacă media
producţiei realizate efectiv (m) respectă capacitatea nominală de producţie (m0).

2. Diametrul unui reper component al unui utilaj trebuie să fie de 100


milimetri. Datorită factorilor aleatori care acţionează în procesul de
fabricaţie, valorile reale ale diametrului reperului se abat în plus sau în
minus faţă de valoarea standard. Pentru a controla calitatea reperelor
realizate, s-au ales aleator 20 dintre ele şi s-au obţinut următoarele date:

100,7 100,9 99,2 101,3 98,9 100,5 100 99,4 99,1 100,8
98,7 101,1 100 100,4 100,7 99,3 98,8 99,3 100 101,2

Presupunând că, din experienţa anterioară, se cunoaşte varianţa procesului de


producţie, σ2 = 0,8 , se cere să se verifice, cu o probabilitate de 95%, dacă
media diametrelor reperelor fabricate (m) respectă diametrul standard cerut
(m0).
3. Rezolvati exercitiul anterior, cu diferenţa că varianţa populaţiei
statistice nu este cunoscută.

8
8.5. RĂSPUNSURI LA TESTUL DE AUTOEVALUARE

1. Se determină, media de selecţie ( x ) şi abaterea standard a


populaţiei statistice (σ), astfel:

n
∑ xi
4486
x= i =1
= = 74,76 tone/zi , iar σ = σ 2 = 10 = 3,16
n 60

Apoi, se parcurg etapele testului Laplace, după cum urmează:


1. Se formulează ipoteza nulă, conform căreia media producţiei efectiv realizate
este egală cu capacitatea nominală de producţie: H0: m = m0 = 75 tone, cu
ipoteza alternativă: H1: m ≠ 75 tone;
2. Se stabileşte nivelul de semnificaţie: α = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Laplace, astfel:

74,76 − 75
zc = 60 = 0,588
3,16

4. Din tabelele statistice aferente funcţiei Laplace (anexa 1), se alege valoarea
critică zα , în funcţie de α = 1 – 2φ(z): zα = 1,96;
5. Se compară valoarea calculată cu cea critică şi se observă că zc < zα , de unde
rezultă că se poate spune cu probabilitatea de 95% că media producţiei efectiv
realizate nu diferă semnificativ de capacitatea nominală, eventualele diferenţe
fiind cu totul întâmplătoare. Procesul de producţie se desfăşoară, deci, în
condiţii optime şi nu sunt necesare intervenţii de corectare a acestuia.

2. Se determină, într-o primă fază, media de selecţie ( x ) şi abaterea


standard a populaţiei statistice (σ):

n
∑ xi
i =1 2000,3
x= = = 100,015 mm,
n 20
σ= σ2 = 0,8 = 0,894 mm
Apoi, se parcurg etapele testului student, astfel:

9
1. Se formulează ipoteza nulă, conform căreia media diametrelor reperelor
realizate este egală cu diametrul standard: H0: m = m0 = 100 milimetri, cu
ipoteza alternativă: H1: m ≠ 100 milimetri;
2. Se stabileşte nivelul de semnificaţie: α = 1 – p = 0,05;
3. Se determină valoarea calculată a testului student:

100,015 − 100
tc = 20 = 0,075
0,894

4. Din tabelele statistice aferente repartiţiei Student (anexa 2), se alege valoarea
critică tα/2;ν , în funcţie de α/2 = 0,025 şi ν = n – 1 = 19. Rezultă t0,025;19
= 2,093;
5. Se compară valoarea calculată cu cea critică şi se observă că tc <
t0,025;19 , de unde rezultă că se poate spune cu probabilitatea de 95% că
media diametrelor reperelor realizate nu diferă semnificativ de
dimensiunea standard, eventualele diferenţe fiind cu totul întâmplătoare.

3. În aceste condiţii, se determină, mai întâi, media de selecţie ( x =


100, 015 milimetri) şi estimatorul abaterii standard a populaţiei
statistice (s), astfel:

14,305
s= = 0,867
19

Apoi, se parcurg etapele testului student:


1. Se formulează ipoteza nulă, conform căreia media diametrelor reperelor
realizate este egală cu diametrul standard: H0: m = m0 = 100 milimetri, cu
ipoteza alternativă: H1: m ≠ 100 milimetri;
2. Se stabileşte nivelul de semnificaţie: α = 1 – p = 0,05;
3. Se determină valoarea calculată a testului Student:

100,015 − 100
tc = 20 = 0,077
0,867

4. Din tabelele statistice aferente repartiţiei Student se alege valoarea critică


tα/2;ν , în funcţie de α/2 = 0,025 şi ν = n – 1 = 19: t0,025;19 = 2,093;

10
5. Se compară valoarea calculată cu cea critică şi se observă că tc < t0,025;19 , de
unde rezultă că, şi de această dată, se poate spune cu probabilitatea de 95% că
media diametrelor reperelor realizate nu diferă semnificativ de dimensiunea
standard, eventualele diferenţe fiind cu totul întâmplătoare.

8.6. LUCRARE DE VERIFICARE

1. O companie a lansat o nouă linie de produse şi doreşte să studieze impactul


acesteia asupra vânzărilor. În acest scop s-au ales aleator câte 9 săptămâni după
lansare, obţinându-se următoarele date (mil. Lei):

430.2 441.3 428.9 425.6 431.8 433.8 439.1 437.7 440.2

Să se determine cu o probabilitate de 95% dacă media vânzărilor de după


lansarea noilor produse este 440 mil. lei, dacă varianţa procesului este σ2= 35.

2. O firmă a lansat o campanie promoţională şi doreşte să studieze impactul


acesteia asupra vânzărilor. În acest scop au fost alese aleator 15 săptămâni după
aceasta, obţinându-se următoarele date (mil. Lei)

131,3
130,9
132,5
133,3
137,1
139,8
130,7
132,6
131,3
137,5
138,4
139,1
138,7
132,9
137,3

Se cere să se verifice cu o probabilitate de 95% dacă vanzarile au fost in


medie de 135 (mil. Lei).

11
REZUMAT. În Unitatea de învăţare 8, Verificarea ipotezelor
statistice, s-a introdus noţiunea de test statistic şi s-au prezentat etapele
de parcurgere al acestuia. Se testează dacă media unui populaţii statistice
are sau nu o anumită valoare, având la dispoziţie datele aferente unui
eşantion de volum n. Verificarea ipotezei presupune calcularea mediei de
selecţie, precum şi deţinerea unor informaţii referitoare la varianţa
populaţiei statistice.

BIBLIOGRAFIE

1. Anderson D.R., Williams Th.A., Sweeney D.J., Statistics for Business


and Economics, West Publishing Company, 1990

2. Baron T., Anghelache C., Ţiţan E., Statistică, Editura Economică,


Bucureşti, 1996

3. Berenson M.L., Levine D.M., Krehbiel T.C., Basic Business


Statistics. Concepts and Applications, 9th Edition, Pearson
Prentice Hall, 2004

4. Levine D.M., Berenson M.L., Stephan D., Statistics for Managers


using Microsoft Excel, Second Edition, Prentice Hall,
1999

5. Newbold P., Carlson W.L., Thorne B., Statistics for Business and
Economics, Fifth Edition, Pearson Prentice Hall, 2003

6. Şipoş C., Preda C., Statistică economică, Editura Mirton, Timişoara,


2004

7. Ţiţan E., Statistică macroeconomică, A.S.E., Bucureşti, 1996


***
8. Anuarul Statistic al României, anii 2000 – 2005

9. ***
Rapoartele anuale şi lunare ale Băncii Naţionale a României, anii
2000 – 2007

12

S-ar putea să vă placă și