Sunteți pe pagina 1din 31

TESTAREA IPOTEZELOR

STATISTICE

Testul Student (t)


1
STRUCTURA CURSULUI
TESTAREA IPOTEZELOR STATISTICE

— 1. Scop și utilitate
— 2. Concepte
— 3. Etapele în aplicarea procedurilor de testare a
ipotezelor.
— 4. Testarea ipotezelor privind media populației
generale pentru eșantioanele de volum mic

2
1. SCOP ŞI UTILITATE

¢ Testarea ipotezelor statistice reprezintă o altă


modalitate, alături de estimaţia pe interval de încredere,
de a realiza inferenţa statistică. În urma prelevării unui
eşantion dintr-o populaţie statistică, prin prelucrarea
datelor provenite din sondaj se obţine un estimator al
parametrului urmărit în populaţia de origine.

¢ Se pune atunci problema în ce măsură parametrul


estimat pe baza rezultatelor sondajului asigură
„credibilitatea” aprecierilor făcute asupra întregii
colectivităţi.

¢ Estimatorul reprezintă o „presupunere” asupra


parametrului, deci o ipoteză statistică.
3
1. SCOP ŞI UTILITATE

¢ Scop:
-- de a stabili existenţa unor dovezi suficiente
pentru a concluziona dacă o ipoteză sau o afirmaţie
referitoare la un parametru al unei populaţii este
adevărată.

¢ Utilitate:
-- testarea ipotezelor statistice ajută managerii
să verifice ştiinţific ipotezele emise, pentru a adopta
deciziile cele mai potrivite în legătură cu acţiunile lor
viitoare.

4
2. CONCEPTE
¢ Ipoteză statistică = o afirmaţie matematică cu privire la
parametrul unei populaţii sau la legea de repartiţie pe care o
urmează anumite variabile aleatoare.
¢ Teste parametrice = teste statistice care verifică valoarea unui
parametru al colectivităţii totale. Ele au următoarele
componente:
a) Ipoteza nulă (H0)
-- este o afirmaţie în care se specifică valori ipotetice pt. unul sau mai
mulţi parametri ai pop. totale.
-- admite întotdeauna caracterul întâmplător al deosebirilor, adică
presupune că nu există deosebiri esenţiale.
-- este ipoteza ce urmează a fi testată, considerată adevărată până când
se dovedeşte că este falsă.
5
2. CONCEPTE
b) Ipoteza alternativă (H1)
— O afirmaţie despre acelaşi parametru al populaţiei totale ca şi cel la
care se referă ipoteza nulă, dar care contrazice ipoteza nulă.
— Ea constituie ipoteza ce va fi acceptată, dacă ipoteza nulă va fi
respinsă.
— Poate fi de două feluri:
Ø Ipoteze non-direcţionale:
Ø Ipoteze direcţionale:

Cele două ipoteze sunt teorii mutual exclusive (este


imposibil ca ambele să fie adevărate) şi exhaustive
(acoperă toate posibilităţile: ori H0 este adevărată, ori H1.)

6
2. CONCEPTE

Ø Ipoteze non-direcţionale:
-- sunt ipoteze alternative care specifică existenţa unei
diferenţe între valoarea parametrului pop. generale şi
valoarea specificată în ipoteza nulă, dar fără a arăta
direcţia acestei diferenţe
-- Sunt asociate testelor bilaterale

Ø Ipoteze direcţionale:
¢Reprezintă ipoteze alternative care stabilesc direcţia în

care parametrul pop. totale diferă de valoarea specificată


în ipoteza nulă
¢Corespund testelor unilaterale (test unilateral stâng sau

drept).
7
2. Concepte

c) Testul statistic (criteriul de semnificaţie)

¢ Este un criteriu (o variabilă aleatoare), în funcţie de a cărui


valoare se ia decizia de acceptare sau de respingere a
ipotezei nule.

¢ Se bazează pe un estimator punctual al parametrului ce va


fi testat (ex.: media eşantionului)

8
2. Concepte

d) Regiunea critică / de respingere (Rc/Rr)


¢ Valorile numerice ale testului statistic pentru care ipoteza
nulă va fi respinsă.
¢ Dacă valoarea testului se găseşte în regiunea critică,
atunci se va respinge ipoteza nulă; iar dacă valoarea
testului nu se regăseşte în Rc, nu avem suficiente
argumente pt. a respinge ipoteza nulă, deci o acceptăm
¢ Intervalul de valori care nu se găseşte în regiunea critică
se numeşte “regiune non-critică” sau “regiune de
acceptare”.
¢ regiunea critică este delimitată de valoarea critică, C –
punctul de tăietură în stabilirea acesteia.
¢ Ea este astfel aleasă încât probabilitatea ca ea să conţină
testul statistic, când ipoteza nulă este adevărată să fie α,
cu α mic (α=0.01 etc).
9
2. Concepte
¢ Întrucât ipoteza nulă poate fi sau adevărată, sau falsă,
deciziile adoptate în urma testului statistic pot fi:
v Decizii corecte:

¢ Să nu respingem ipoteza nulă (să o acceptăm)


atunci când ea este adevărată;
¢ Să respingem ipoteza nulă atunci când ea este falsă;
v Decizii incorecte:

¢ Să respingem ipoteza nulă atunci când ea este


adevărată (eroare de genul întâi);
¢ Să nu respingem ipoteza nulă atunci când ea este
falsă (eroare de genul al doilea); 10
2. Concepte
Decizia de Ipoteza adevărată
acceptare H0 H1
H0 Decizie corectă Eroare de gen II
(probabilitate 1-α) (risc β)
H1 Eroare de gen I Decizie corectă
(risc α) (probabilitate 1-β)

q Probabilitatea (riscul) comiterii unei erori de genul I = α


α = P(respingere H0 ‫ ׀‬H0 este adevărată)=P(eroare de gen I)
q Probabilitatea (riscul) comiterii unei erori de genul II = β
β = P(acceptare H0 ‫ ׀‬H0 este falsă) = P(eroare de gen II)
§ “α” se mai numeşte prag/nivel de semnificaţie
§ “1-α” se mai numeşte nivelul de încredere al testului
§ “1- β” se mai numeşte puterea testului

11
NOȚIUNI DE BAZĂ ÎN
TESTARE

12
3. ETAPE ÎN APLICAREA PROCEDURILOR DE TESTARE A
IPOTEZELOR STATISTICE
1. Se formulează ipoteza nulă şi cea alternativă;
2. Se stabileşte testul statistic;
3. Se stabileşte regiunea critică şi pragul de semnificaţie;
4. Se formulează principalele presupuneri despre populaţia
eşantionată (normalitate etc.);
5. Se calculează valoarea testului statistic, pe baza datelor
culese de la unităţile eşantionului;
6. Se formulează concluziile (se iau deciziile): ipoteza nulă
este fie acceptată, fie respinsă, astfel:
Ø dacă valoarea numerică a testului statistic cade în
regiunea critică (Rc), respingem ipoteza nulă şi
concluzionăm că ipoteza alternativă este adevărată.
Această decizie este incorectă doar în 100 α % din
cazuri;
Ø dacă valoarea numerică a testului nu cade în
13
regiunea critică (Rc), se acceptă ipoteza nulă H0.
REGIUNEA CRITICĂ

μ μ μ
a) b) c)

a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga

14
NOTAŢII

INDICATORUL COLECTIVITATEA COLECTIVITATEA DE


GENERALĂ SELECŢIE
(POPULAŢIA TOTALĂ) (EŞANTION)
PARAMETRII ESTIMATORI
N n

MEDIA å xi å
i =1
xi
µ= i =1 x=
N n

( )
N n

å (xi - µ ) å i
2 2
DISPERSIA x - x
(VARIANŢA) s2 = i= 1 s2 = i =1
N n -1
ABATEREA MEDIE N n
PĂTRATICĂ å (xi - µ )2
(
å ix - x )2

(ABATEREA s = s2 = i=1
s = s2 = i =1

STANDARD) N n -1

15
TEOREMA LIMITĂ CENTRALĂ
Dacă
F Variabilele X k , k = 1,2,..., n sunt independente
F X k nu ia valori prea mari una în comparaţie cu celelalte
F număruln al variabilelor este suficient de mare,
n
atunci variabila aleatoare X = å X k are ca repartiţie asimptotică
i =1
repartiţia normală, oricare ar fi repartiţiile variabilelor aleatoare
X k , k = 1,2,..., n

Teorema limită centrală dă posibilitatea folosirii repartiţiei


normale drept lege practică de aproximare

16
TEOREMA LIMITĂ CENTRALĂ

17
4. Testarea ipotezei privind media populaţiei
generale (μ) pentru eşantioane de volum redus
¢ Forma distribuţiei de eşantionare a mediei xdepinde, de
forma populaţiei generale din care a fost extras eşantionul.
¢ Distribuţia de eşantionare a lui x va fi normală (sau
aproximativ normală), în cazul eşantioanelor de volum
redus, doar dacă colectivitatea generală este distribuită
normal (sau aproximativ normal).
¢ dispersia eşantionului ( s ), poate să nu ofere o aproximare
2
x

foarte bună a lui s (în cazul eşantioanelor mici).


2
x

¢ Pentru efectuarea testării se utilizează statistica t, de


forma: x - µ0 x - µ0
t = =
sx sx n

¢ unde: s 2
=
å (x i -x )
2

n -1
x

18
REPARTIŢIA STUDENT (T)
¢ Prin curba Student se înţelege graficul densităţii de
probabilitate a repartiţiei Student (de fapt o familie de curbe
indexată prin numărul gradelor de libertate).
¢ Curba este simetrică şi are o formă apropiată de curba
normală standard către care tinde o dată cu mărirea numărului
de grade de libertate. Se poate observa că probabilităţile
extreme sunt mai mari decât în cazul curbei normale.

19
REPARTIŢIA STUDENT (T)
¢ Prin curba Student se înţelege graficul densităţii de
probabilitate a repartiţiei Student (de fapt o familie de
curbe indexată prin numărul gradelor de libertate).
¢ Curba este simetrică şi are o formă apropiată de curba
normală standard către care tinde o dată cu mărirea
numărului de grade de libertate. Se poate observa că
probabilităţile extreme sunt mai mari decât în cazul
curbei normale.
¢ Repartiţia Student depinde de un singur parametru
denumit numărul gradelor de libertate notat cu df ,
adică numărul variabilelor independente care au în
vedere mărimea luată în considerare, a căror variaţie nu
admite nici o restricţie.
¢ Pentru valori mici ale lui n se poate considera că t este
repartizată Student cu n - 1 grade de libertate.
¢ Adică P(a < t < b) @ aria de sub curba S(n – 1) delimitată
de x = a şi x = b 20
¢ Pentru n mare repartiţia Student aproximează repartiţia
normală.
REPARTIŢIA STUDENT (T)

21
4. Testarea ipotezei privind media populaţiei
generale (μ) pentru eşantioane de volum redus
¢ Ipotezele sunt:
-- pentru test bilateral;
H0: μ = μ0,
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0);
-- pentru test unilateral dreapta;
H0: μ = μ0,
H1: μ > μ0,
-- pentru test unilateral stânga;
H0: μ = μ0,
H1: μ < μ0.
¢ Testul statistic utilizat: x - µ0 x - µ0
t= =
sx sx n 22
4. Testarea ipotezei privind media populaţiei
generale (μ) pentru eşantioane de volum redus
¢ Presupunerea specială ce trebuie făcută este aceea că
populaţia generală este normal sau aproximativ normal
distribuită.

¢ Regiunea critică este dată de:


— t > t α/2,n-1 sau t < - t α/2,n-1

— t > t α,n-1

— t < - t α,n-1

23
4. Exemplu
Conducerea unei companii apelează la 5 experţi pentru a
previziona profitul companiei în anul curent. Valorile
previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei,
preţurile anului anterior)
Ştiind că profitul companiei în anul anterior a fost de 2,01
mld. lei, sunt suficiente dovezi pentru a concluziona că media
previziunilor experţilor este semnificativ mai mare decât cifra
anului anterior (pentru α = 0,05)?
Rezolvare:
Se calculează: - media previziunilor experţilor: x = 2,63 mld. lei,

- dispersia: s 2
=
å (x - x)
i
2

=
2,203
= 0,5507
x
n -1 4
- abaterea standard : s x = s 2x = 0,74 mld. lei.

24
4. Exemplu
Ipoteze:
Ipoteza nulă: H0 : μ = 2,01 mld. lei,
Ipoteza alternativă:
H1: μ > 2,01 mld.lei (test unilateral dreapta).

Valoare critică:
tα,n-1 = t0,05;4 = 2,132

!!! Fiind test unilateral, în tabel-anexă se citește de jos în


sus, valoarea fiind la intersecția nivelului de semnificație
cu a gradelor de libertate

!!! Funcție EXCEL_unilateral dreapta:


=T.INV(1-α, df)
25
Tabel cu valorile repartiţiei Student în funcţie de probabilitatea
P( t £ ta ) şi numărul „f” al gradelor de libertate

Nivel de semnificaţie pentru testul bilateral


α 0,50 0,20 0,10 0,05 0,02 0,01 0,002 0,001 0,0001
f
1 1,000 3,078 6,314 12,706 31,821 63,657 318,309 636,618 6366,198
2 0,816 1,886 2,920 4,303 6,965 9,925 22,327 31,598 99,992
3 0,765 1,638 2,353 3,482 4,541 5,841 10,214 12,924 28,000
4 0,741 1,533 2,132 2,776 3,747 4,604 7,173 8,610 15,544
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893 6,869 11,178
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208 5,959 9,082
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785 5,408 7,885
8 0,706 1,397 1,860 2,306 2,896 3.355 4,501 5,041 7,120
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297 4,781 6,594
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144 4,587 6,211
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025 4,437 5,921
12 0,695 1,356 1,782 2,179 2,681 3,055 3,930 4,318 5,694
13 0,694 1,350 1,771 2,160 2,650 3,102 3,852 4,221 5,513
14 0,692 1,345 1,761 2,145 2,624 2,977 3,787 4,140 5,363
15 0,691 1,341 1,753 2,131 2,602 2,947 3,733 4,073 5,239
16 0,690 1,337 1,746 2,120 2,583 2,921 3,686 4,015 5,134
17 0,689 1,333 1,740 2,110 2,567 2,898 3,646 3,965 5,014
18 0,688 1,330 1,734 2,101 2,552 2,878 3,610 3,922 `4,966
19 0,688 1,328 1,729 2,093 2,539 2,861 3,579 3,883 4,897
20 0,687 1,325 1,725 2,086 2,528 2,845 3,552 3,850 4,837
21 0,686 1,323 1,721 2,080 2,518 2,831 3,527 3,819 4,784
22 0,686 1,321 1,717 2,074 2,508 2,819 3,505 3,792 4,736
23 0,685 1,319 1,714 2,069 2,500 2,807 3,485 3,767 4,693
24 0,685 1,318 1,711 2,064 2,492 2,797 3,467 3,745 4,654
25 0,684 1,316 1,708 2,060 2,485 2,787 3,450 3,725 4,619
26 0,684 1,315 1,706 2,056 2,479 2,779 3,435 3,707 4,587
27 0,684 1,314 1,703 2,052 2,473 2,771 3,421 3,690 4,558
28 0,683 1,313 1,701 2,048 2,467 2,763 3,408 3,674 4,530
29 0,683 1,312 1,699 2,045 2,462 2,756 3,396 3,659 4,506
30 0,683 1,310 1,697 2,042 2,457 2,750 3,385 3,646 4,482
35 0,682 1,306 1,690 2,030 2,438 2,724 3,340 3,591 4,389
40 0,681 1,303 1,684 2,021 2,423 2,704 3,307 3,551 4,321
45 0,680 1,301 1,679 2,014 2,412 2,690 3,281 3,520 4,269
50 0,679 1,299 1,676 2,009 2,403 2,678 3,261 3,496 4,288
60 0,679 1,296 1,671 2,000 2,390 2,660 3,232 3,460 4,169
70 0,678 1,294 1,667 1,994 2,381 2,648 3,211 3,435 4,127
80 0,678 1,292 1,664 1,990 2,374 2,639 3,195 3,416 4,096
90 0,677 1,291 1,662 1,987 2,368 2,632 3,183 3,402 4,072
100 0,677 1,290 1,660 1,984 2,364 2,626 3,174 3,390 4,053
120 0,677 1,289 1,658 1,980 2,358 2,617 3,160 3,373 4,025
200 0,676 1,286 1,653 1,972 2,345 2,601 3,131 3,340 3,970
500 0,675 1,283 1,648 1,965 2,334 2,586 3,107 3,310 3,92226
1000 0,675 1,282 1,646 1,962 2,330 2,581 3,098 3,300 3,906
∞ 0,675 1,282 1,645 1,960 2,326 2,576 3,090 3,290 3,891
α 0,25 0,10 0,05 0,025 0,01 0,005 0,001 0,0005 0,00005
f
Nivel de semnificaţie pentru testul unilateral
4. Exemplu

Statistica testului: t = x - µ = x - µ = 2,63 - 2,01 = 1,874


sx sx n 0,74 / 5

Decizia:
Deoarece t (1,874) < t0,05;4 (2,132), concluzia este că Ho se
acceptă deci, media profitului previzionată de cei 5 experţi pentru
anul curent NU este semnificativ mai mare decât profitul anului
trecut, de 2,01 mld. lei.
27
OBSERVAȚIE_1

Valoare critică:

Dacă testul era unilateral stânga, în tabel-anexă se


citește de jos în sus, valoarea fiind la intersecția
nivelului de semnificație cu a gradelor de libertate

Vcrit = - tα,n-1 = - t0,05; 4 = - 2,776

!!! Funcție EXCEL_unilateral stânga:


=T.INV (α, df)

28
OBSERVAȚIE_2

Valoare critică:

Dacă testul era bilateral, în tabel-anexă se citește de


sus în jos, valoarea fiind la intersecția nivelului de
semnificație cu a gradelor de libertate

!!! Funcție EXCEL:


=T.INV.2T(α, df)

29
Tabel cu valorile repartiţiei Student în funcţie de probabilitatea
P( t £ ta ) şi numărul „f” al gradelor de libertate

Nivel de semnificaţie pentru testul BILATERAL


α 0,50 0,20 0,10 0,05 0,02 0,01 0,002 0,001 0,0001
f
1 1,000 3,078 6,314 12,706 31,821 63,657 318,309 636,618 6366,198
2 0,816 1,886 2,920 4,303 6,965 9,925 22,327 31,598 99,992
3 0,765 1,638 2,353 3,482 4,541 5,841 10,214 12,924 28,000
4 0,741 1,533 2,132 2,776 3,747 4,604 7,173 8,610 15,544
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893 6,869 11,178
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208 5,959 9,082
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785 5,408 7,885
8 0,706 1,397 1,860 2,306 2,896 3.355 4,501 5,041 7,120
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297 4,781 6,594
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144 4,587 6,211
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025 4,437 5,921
12 0,695 1,356 1,782 2,179 2,681 3,055 3,930 4,318 5,694
13 0,694 1,350 1,771 2,160 2,650 3,102 3,852 4,221 5,513
14 0,692 1,345 1,761 2,145 2,624 2,977 3,787 4,140 5,363
15 0,691 1,341 1,753 2,131 2,602 2,947 3,733 4,073 5,239
16 0,690 1,337 1,746 2,120 2,583 2,921 3,686 4,015 5,134
17 0,689 1,333 1,740 2,110 2,567 2,898 3,646 3,965 5,014
18 0,688 1,330 1,734 2,101 2,552 2,878 3,610 3,922 `4,966
19 0,688 1,328 1,729 2,093 2,539 2,861 3,579 3,883 4,897
20 0,687 1,325 1,725 2,086 2,528 2,845 3,552 3,850 4,837
21 0,686 1,323 1,721 2,080 2,518 2,831 3,527 3,819 4,784
22 0,686 1,321 1,717 2,074 2,508 2,819 3,505 3,792 4,736
23 0,685 1,319 1,714 2,069 2,500 2,807 3,485 3,767 4,693
24 0,685 1,318 1,711 2,064 2,492 2,797 3,467 3,745 4,654
25 0,684 1,316 1,708 2,060 2,485 2,787 3,450 3,725 4,619
26 0,684 1,315 1,706 2,056 2,479 2,779 3,435 3,707 4,587
27 0,684 1,314 1,703 2,052 2,473 2,771 3,421 3,690 4,558
28 0,683 1,313 1,701 2,048 2,467 2,763 3,408 3,674 4,530
29 0,683 1,312 1,699 2,045 2,462 2,756 3,396 3,659 4,506
30 0,683 1,310 1,697 2,042 2,457 2,750 3,385 3,646 4,482
35 0,682 1,306 1,690 2,030 2,438 2,724 3,340 3,591 4,389
40 0,681 1,303 1,684 2,021 2,423 2,704 3,307 3,551 4,321
45 0,680 1,301 1,679 2,014 2,412 2,690 3,281 3,520 4,269
50 0,679 1,299 1,676 2,009 2,403 2,678 3,261 3,496 4,288
60 0,679 1,296 1,671 2,000 2,390 2,660 3,232 3,460 4,169
70 0,678 1,294 1,667 1,994 2,381 2,648 3,211 3,435 4,127
80 0,678 1,292 1,664 1,990 2,374 2,639 3,195 3,416 4,096
90 0,677 1,291 1,662 1,987 2,368 2,632 3,183 3,402 4,072
100 0,677 1,290 1,660 1,984 2,364 2,626 3,174 3,390 4,053
120 0,677 1,289 1,658 1,980 2,358 2,617 3,160 3,373 4,025
200 0,676 1,286 1,653 1,972 2,345 2,601 3,131 3,340 3,970
500 0,675 1,283 1,648 1,965 2,334 2,586 3,107 3,310 3,922
1000 0,675 1,282 1,646 1,962 2,330 2,581 3,098 3,300 3,906
∞ 0,675 1,282 1,645 1,960 2,326 2,576 3,090 3,290 3,891
α 0,25 0,10 0,05 0,025 0,01 0,005 0,001 0,0005 0,00005
f
Nivel de semnificaţie pentru testul unilateral
30
4. OBSERVAȚIE!!!

31

S-ar putea să vă placă și