Sunteți pe pagina 1din 27

Testarea ipotezelor

statistice

Statistică - Curs 7,
Business şi Turism,
Seria A anul I

1
1. Scop şi utilitate

◼ Inferența statistică presupune:


◼ Extinderea rezultatelor la de la nivelul eșantionului la nivelul
populației totale, în condiții de probabilitate.
◼ Estimarea valorii unui parametru al populației totale pe baza
rezultatelor obținute în eșantion
◼ Emiterea unor concluzii generale asupra unei populații totale, pe
baza unor informații limitate, ce provin dintr-un eșantion.

◼ Există două modalități prin care putem realiza inferența


statistică:
◼ Folosind mai multe valori, sub forma unui interval de încredere –
care acoperă, cu o anumită probabilitate, valoare parametrului din
populația totală (vezi sondajul statistic – cursul anterior)
◼ Folosind o singură valoare – numită valoare ipotetică, despre
care se emite ipoteza că ar fi egală cu valoarea parametrului
populației totale (Testarea ipotezelor statistice).
2
1. Scop şi utilitate
◼ Scop:
◼ De a stabili existenţa unor dovezi suficiente pentru a
concluziona dacă o ipoteză sau o afirmaţie referitoare la un
parametru al unei populaţii este adevărată.
◼ În ce constă procedura:
◼ Se caută dovezi în eșantion în sprijinul acestei ipoteze. Dacă se
găsesc astfel de dovezi, se acceptă ipoteza emisă, considerând-o
adevărată. Dacă nu, se respinge, considerând-o falsă și se
acceptă o altă ipoteză, contrară celei inițiale.
◼ Utilitate:
Testarea ipotezelor statistice ajută managerii să verifice ştiinţific
ipotezele emise, pentru a adopta deciziile cele mai potrivite în
legătură cu acţiunile lor viitoare.
3
2. Concepte de bază în Testarea
ipotezelor statistice
◼ Ipoteză statistică = o afirmaţie matematică cu privire la parametrul unei
populaţii sau la legea de repartiţie pe care o urmează anumite variabile
aleatoare.
◼ Teste parametrice = teste statistice care verifică valoarea unui parametru al
colectivităţii totale. Ele au următoarele componente:
a) Ipoteză nulă (H0)
◼ Este o afirmaţie în care se specifică valori ipotetice pt. unul sau mai mulţi
parametri ai pop. totale.
◼ Ea admite întotdeauna caracterul întâmplător al deosebirilor, adică
presupune că nu există deosebiri esenţiale.
◼ Este ipoteza ce urmează a fi testată, considerată adevărată până când se
dovedeşte că este falsă.

4
2. Concepte de bază în Testarea
ipotezelor statistice
◼ Exemplu: Reprezentantul patronatelor din industria hotelieră
susține că salariul mediu net al unui angajat în acest domeniu
este de 3500 lei.
◼ Ipoteza emisă se scrie astfel:

H0 : µ = 3500

Valoarea parametrului Valoarea ipotetică


(mediei) populației totale
5
2. Concepte
b) Ipoteza alternativă (H1)
◼ O afirmaţie despre acelaşi parametru al populaţiei totale ca şi cel la care se
referă ipoteza nulă, dar care contrazice ipoteza nulă.
◼ Ea constituie ipoteza ce va fi acceptată, dacă ipoteza nulă va fi respinsă.
◼ Poate fi de două feluri:
◼ Ipoteze non-direcţionale:
◼ Sunt ipoteze alternative care specifică existenţa unei diferenţe între
valoarea parametrului pop. generale şi valoarea specificată în
ipoteza nulă, dar fără a arăta direcţia acestei diferenţe
◼ Sunt asociate testelor bilaterale
◼ Ipoteze direcţionale:
◼ Reprezintă ipoteze alternative care stabilesc direcţia în care
parametrul pop. totale diferă de valoarea specificată în ipoteza nulă
◼ Corespund testelor unilaterale (test unilateral stâng sau drept).

◼ Cele două ipoteze sunt teorii mutual exclusive (este imposibil ca ambele să fie
adevărate) şi exhaustive (acoperă toate posibilităţile: ori H0 este adevărată, ori H1.)
6
2. Concepte de bază în Testarea
ipotezelor statistice
◼ Exemplu: Reprezentantul sindicatelor din industria hotelieră
susține că salariul mediu net al unui angajat în acest domeniu:
◼ nu este de 3500 lei:
H1: µ≠ 3500 (Test bilateral -TB)
◼ este mai mare de 3500 lei:
◼ H1: µ > 3500 (Test unilateral dreapta - TUD)
◼ este mai mic de 3500 lei:
◼ H1: µ < 3500 (Test unilateral stânga - TUS)

7
2. Concepte de bază în Testarea
ipotezelor statistice
c) Testul statistic propriuzis(criteriul de semnificaţie)

◼ Este un criteriu în funcţie de a cărui valoare se ia decizia de


acceptare sau de respingere a ipotezei nule.
◼ Se bazează pe un estimator punctual al parametrului ce va fi
testat (ex.: media eşantionului)
◼ Reprezintă o variabilă aleatoare, ce urmează diferite distribuții
matematice:
◼ În cazul testării unei ipoteze referitoare la media unei populații
totale, se pot folosi:
◼ Testul z – dacă eșantionul este de volum mare (n>30)

◼ Testul t – dacă eșantionul este de volum redus (n≤30)


8
2. Concepte de bază în Testarea
ipotezelor statistice
d) Regiunea critică (de respingere) (Rr)
◼ Valorile numerice ale testului statistic pentru care ipoteza nulă
va fi respinsă.
◼ Regula de decizie:
◼ Dacă valoarea testului se găseşte în regiunea critică Rr, atunci se va
respinge ipoteza nulă (H0) și se va accepta ipoteza alternativă (H1);
◼ Dacă valoarea testului nu se regăseşte în Rr, nu avem suficiente
argumente pt. a respinge ipoteza nulă, deci o acceptăm.
◼ Intervalul de valori care nu se găseşte în regiunea critică se
numeşte “regiune non-critică” sau “regiune de acceptare” (Rac).
◼ regiunea critică este delimitată de valoarea critică, C – punctul
de tăietură în stabilirea acesteia.
◼ Ea este astfel aleasă încât probabilitatea ca ea să conţină testul
statistic, când ipoteza nulă este adevărată să fie α, cu α mic
(α=0.01, 0.05 etc). 9
2. Concepte de bază în Testarea
ipotezelor statistice
◼ Întrucât ipoteza nulă poate fi sau adevărată, sau falsă, deciziile adoptate în
urma testului statistic pot fi:
◼ Decizii corecte:
◼ Să nu respingem ipoteza nulă (să o acceptăm) atunci când ea este adevărată;
◼ Să respingem ipoteza nulă atunci când ea este falsă;
◼ Decizii incorecte:
◼ Să respingem ipoteza nulă atunci când ea este adevărată (eroare de genul
întâi);
◼ Să nu respingem ipoteza nulă atunci când ea este falsă (eroare de genul al
doilea);

10
2. Concepte de bază în Testarea
ipotezelor statistice

Decizia de Ipoteza adevărată


acceptare H0 H1
H0 Decizie corectă Eroare de gen II
(probabilitate 1-α) (risc β)
H1 Eroare de gen I Decizie corectă
(risc α) (probabilitate 1-β)

◼ Probabilitatea (riscul) comiterii unei erori de genul I = α


α= P(respingere H0 ‫ ׀‬H0 este adevărată)=P(eroare de gen I)
◼ Probabilitatea (riscul) comiterii unei erori de genul II = β
β= P(acceptare H0 ‫ ׀‬H0 este falsă)=P(eroare de gen II)
◼ “α” se mai numeşte prag/nivel de semnificaţie
◼ “1-α” se mai numeşte nivelul de încredere al testului
◼ “1- β” se mai numeşte puterea testului
11
3. Paşii pentru aplicarea procedurilor
de testare a ipotezelor statistice

◼ Paşi pentru aplicarea unui test statistic de verificare a ipotezelor:

1. Se formulează ipoteza nulă şi cea alternativă;


2. Se stabileşte testul statistic;
3. Se stabileşte regiunea critică şi pragul de semnificaţie;
4. Se formulează principalele presupuneri despre populaţia eşantionată
(normalitate etc.);
5. Se calculează valoarea testului statistic, pe baza datelor culese de la
unităţile eşantionului;
6. Se formulează concluziile (se iau deciziile): ipoteza nulă este fie
acceptată, fie respinsă, astfel:
◼ dacă valoarea numerică a testului statistic cade în regiunea critică (Rc),
respingem ipoteza nulă şi concluzionăm că ipoteza alternativă este
adevărată. Această decizie este incorectă doar în 100 α % din cazuri;
◼ dacă valoarea numerică a testului nu cade în regiunea critică (Rc), se
acceptă ipoteza nulă H0.
12
Regiunea critică/de respingere

-tcrit 0 tcrit 0 tcrit - tcrit 0


Rr Rac Rr Rac Rr Rr Rac

Regiunea critică pentru a) Test bilateral; b) Test Unilateral Dreapta; c) Test Unilateral Stânga

13
Notaţii – variabilă non-alternativă
INDICATORUL COLECTIVITATEA COLECTIVITATEA DE
GENERALĂ SELECŢIE
(POPULAŢIA TOTALĂ) (EŞANTION)
PARAMETRII ESTIMATORI
N n

MEDIA x i xi =1
i
i =1
= x=
N n

 (x )
N n

 (x − )
2
DISPERSIA i
2
i −x
(VARIANŢA) 2 = i =1
s2 = i =1
N n −1
ABATEREA MEDIE
 (x )
N

 (xi −  )2
n
2
PĂTRATICĂ i −x
(ABATEREA  = 2 = i =1
s= s2 = i =1

STANDARD) N n −1

14
4. TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAŢIEI GENERALE (μ) PENTRU
EŞANTIOANE DE VOLUM REDUS (n≤30)
◼ Forma distribuţiei de eşantionare a mediei x depinde, de forma
populaţiei generale din care a fost extras eşantionul.
◼ Distribuţia de eşantionare a lui x va fi normală (sau aproximativ
normală), în cazul eşantioanelor de volum redus, doar dacă
colectivitatea generală este distribuită normal (sau aproximativ
normal).
◼ dispersia eşantionului ( s 2x ), poate să nu ofere o aproximare foarte
bună a lui  (în cazul eşantioanelor mici).
2
x

◼ Pentru efectuarea testării se utilizează statistica t, de forma:


x − 0 x − 0
t= =
x s n
unde:

s 2
=
 (x − x)
i
2

n −1
15
Repartiţia Student
◼ Prin curba Student se înţelege graficul densităţii de probabilitate a repartiţiei
Student (de fapt o familie de curbe indexată prin numărul gradelor de
libertate).
◼ Curba este simetrică şi are o formă apropiată de curba normală standard
către care tinde o dată cu mărirea numărului de grade de libertate. Se poate
observa că probabilităţile extreme sunt mai mari decât în cazul curbei
normale.

◼ Pentru valori mici ale lui n se poate considera că T este repartizată Student cu
n - 1 grade de libertate.
◼ Adică P(a < T < b)  aria de sub curba S(n – 1) delimitată de x = a şi x = b
◼ Pentru n mare repartiţia Student aproximează repartiţia normală.
16
Repartiţia t (Student)

17
4. TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAŢIEI GENERALE (μ) PENTRU
EŞANTIOANE DE VOLUM REDUS

◼ Test bilateral (TB):


H0: μ = μ0,
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0);
◼ Testul statistic utilizat:
x − 0 x − 0
tcalc = =
x s n
◼ Regiunea critică/de respingere Rr este dată de:
◼ tcalc< - tcrit sau tcalc> tcrit

unde tcrit = tα/2,n-1 este valoarea critică, determinată în funcţie de nivelul de


semnificaţie alfa şi de numărul gradelor de libertate. Se preia din tabelele
matematice ale repartiţiei Student, sau prin apelarea unor funcţii în diferite
programe soft specializate.
18
4. TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAŢIEI GENERALE (μ) PENTRU
EŞANTIOANE DE VOLUM REDUS

◼ Test unilateral dreapta (TUD):


H0: μ = μ0
H1: μ > μ0

◼ Testul statistic utilizat:


x − 0 x − 0
tcalc = =
x s n

◼ Regiunea critică/de respingere Rr este dată de:


◼ tcalc> tcrit
unde tcrit = tα,n-1
19
4. TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAŢIEI GENERALE (μ) PENTRU
EŞANTIOANE DE VOLUM REDUS

◼ Test unilateral stânga (TUS):


H0: μ = μ0
H 1 : μ < μ0

◼ Testul statistic utilizat:


x − 0 x − 0
tcalc = =
x s n
◼ Regiunea critică/de respingere Rr este dată de:
◼ tcalc < - tcrit
unde tcrit = tα,n-1
◼ Presupunerea specială ce trebuie făcută este aceea că populaţia generală
este normal sau aproximativ normal distribuită.
20
Tabel cu valorile repartiţiei Student în funcţie de probabilitatea
P( t  t ) şi numărul „f” al gradelor de libertate

Nivel de semnificaţie pentru testul bilateral


α 0,50 0,20 0,10 0,05 0,02 0,01 0,002 0,001 0,0001
f
1 1,000 3,078 6,314 12,706 31,821 63,657 318,309 636,618 6366,198
2 0,816 1,886 2,920 4,303 6,965 9,925 22,327 31,598 99,992
3 0,765 1,638 2,353 3,482 4,541 5,841 10,214 12,924 28,000
4 0,741 1,533 2,132 2,776 3,747 4,604 7,173 8,610 15,544
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893 6,869 11,178
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208 5,959 9,082
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785 5,408 7,885
8 0,706 1,397 1,860 2,306 2,896 3.355 4,501 5,041 7,120
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297 4,781 6,594
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144 4,587 6,211
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025 4,437 5,921
12 0,695 1,356 1,782 2,179 2,681 3,055 3,930 4,318 5,694
13 0,694 1,350 1,771 2,160 2,650 3,102 3,852 4,221 5,513
14 0,692 1,345 1,761 2,145 2,624 2,977 3,787 4,140 5,363
15 0,691 1,341 1,753 2,131 2,602 2,947 3,733 4,073 5,239
16 0,690 1,337 1,746 2,120 2,583 2,921 3,686 4,015 5,134
17 0,689 1,333 1,740 2,110 2,567 2,898 3,646 3,965 5,014
18 0,688 1,330 1,734 2,101 2,552 2,878 3,610 3,922 `4,966
19 0,688 1,328 1,729 2,093 2,539 2,861 3,579 3,883 4,897
20 0,687 1,325 1,725 2,086 2,528 2,845 3,552 3,850 4,837
21 0,686 1,323 1,721 2,080 2,518 2,831 3,527 3,819 4,784
22 0,686 1,321 1,717 2,074 2,508 2,819 3,505 3,792 4,736
23 0,685 1,319 1,714 2,069 2,500 2,807 3,485 3,767 4,693
24 0,685 1,318 1,711 2,064 2,492 2,797 3,467 3,745 4,654
25 0,684 1,316 1,708 2,060 2,485 2,787 3,450 3,725 4,619
26 0,684 1,315 1,706 2,056 2,479 2,779 3,435 3,707 4,587
27 0,684 1,314 1,703 2,052 2,473 2,771 3,421 3,690 4,558
28 0,683 1,313 1,701 2,048 2,467 2,763 3,408 3,674 4,530
29 0,683 1,312 1,699 2,045 2,462 2,756 3,396 3,659 4,506
30 0,683 1,310 1,697 2,042 2,457 2,750 3,385 3,646 4,482
35 0,682 1,306 1,690 2,030 2,438 2,724 3,340 3,591 4,389
40 0,681 1,303 1,684 2,021 2,423 2,704 3,307 3,551 4,321
45 0,680 1,301 1,679 2,014 2,412 2,690 3,281 3,520 4,269
50 0,679 1,299 1,676 2,009 2,403 2,678 3,261 3,496 4,288
60 0,679 1,296 1,671 2,000 2,390 2,660 3,232 3,460 4,169
70 0,678 1,294 1,667 1,994 2,381 2,648 3,211 3,435 4,127
80 0,678 1,292 1,664 1,990 2,374 2,639 3,195 3,416 4,096
90 0,677 1,291 1,662 1,987 2,368 2,632 3,183 3,402 4,072
100 0,677 1,290 1,660 1,984 2,364 2,626 3,174 3,390 4,053
120 0,677 1,289 1,658 1,980 2,358 2,617 3,160 3,373 4,025
200 0,676 1,286 1,653 1,972 2,345 2,601 3,131 3,340 3,970
500 0,675 1,283 1,648 1,965 2,334 2,586 3,107 3,310 3,922
1000 0,675 1,282 1,646 1,962 2,330 2,581 3,098 3,300 3,906
∞ 0,675 1,282 1,645 1,960 2,326 2,576 3,090 3,290 3,891
α 0,25 0,10 0,05 0,025 0,01 0,005 0,001 0,0005 0,00005
f
Nivel de semnificaţie pentru testul unilateral

21
EXEMPLUL 1
◼ Exemplu:
Conducerea unei firme apelează la 5 experţi pentru a previziona profitul acesteia în anul
curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (milioane lei, preţurile anului
anterior).
Ştiind că profitul firmei în anul anterior a fost de 2,01 mil. lei, sunt suficiente dovezi pentru
a concluziona că media previziunilor experţilor este semnificativ mai mare decât cifra anului
anterior (pentru α = 0,05)?
Soluție:
Notații:

X = profitul (variabila statistică)


(xi): 2,60; 3,32; 1,80; 3,43; 2,00 (valorile variabilei)
n = 5 (volumul eșantionului)
µ0 = 2,01 (valoarea ipotetică)
α = 0,05

22
EXEMPLUL 1

s = s 2 = 0,74

x− x −  2,63 − 2,01


tcalc = = = = 1,874
x s n 0,74 / 5

23
Exemplul 2.

20

24
Exemplul 2.

25
Exemplul 2.

26
Exemplul 2 – Sondaj statistic
◼ c) Estimați pe interval de încredere timpul mediu de servire al unui client al firmei
sale, garantând rezultatele cu o probabilitate de 99% (valoare critică: z=2,86)
◼ 1. Se determină eroare standard a mediei:
𝑠 14,9
𝜎𝑥 = = = 3,33 𝑚𝑖𝑛.
𝑛 20
◼ 2. Se calculează erorea limită:

∆𝑥 = 𝑧 ∙ 𝜎𝑥 = 2,86 ∙ 3,33 = 9,52 𝑚𝑖𝑛.

◼ 3. Se determină intervalul de încredere pentru media populației totale:

𝑥 − 𝛥𝑥 ≤ 𝜇 ≤ 𝑥 + 𝛥𝑥

140 − 9,52 ≤ 𝜇 ≤ 140 + 9,52

130,48 ≤ 𝜇 ≤ 149,52

27

S-ar putea să vă placă și