Documente Academic
Documente Profesional
Documente Cultură
Unitatea de nvare 4:
FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR
STATISTICE III
Cuprins:
Testarea ipotezei privind media populaiei generale () pentru eantioane de volum mare
x 0 x 0 x 0
Testul statistic: z .
x x n sx n
Testarea ipotezei privind media populaiei generale () pentru eantioane de volum redus
1
Ipotezele statistice: H0: = 0 ( - 0=0),
- test bilateral: H1: 0 ( - 00) (adic < 0 sau > 0).
- test unilateral dreapta: H1: > 0 ( - 0>0)
- test unilateral stnga: H1: < 0 ( - 0<0)
x 0 x 0
Testul statistic: t .
sx sx n
Ipotezele statistice: H 0 : p p0
- test bilateral: H 1 : p p0
Testarea ipotezei privind diferena dintre dou medii pentru eantioane de volum mare
Testul statistic: z
x 1
x2 D
x x2
1
2
x21 x22
unde x , dac dispersiile celor dou populaii sunt diferite
1 x 2
n1 n2
1 1
sau x , dac dispersiile celor dou populaii sunt egale
1 x 2
n1 n 2
3. Testarea ipotezei privind diferena dintre dou medii pentru eantioane de volum
redus
n cazul n care dorim s testm semnificaia diferenei dintre mediile a dou eantioane
de volum redus, va trebui s construim, ca i n cazul anterior, o statistic t, Student. Pentru
aceasta vom presupune c:
- ambele colectiviti generale din care s-au extras eantioanele sunt normal sau
aproximativ normal distribuite;
- eantioanele aleatoare sunt selectate independent unul de cellalt.
3
x x x x
n1 n2
2 2
i 1 i 2
sc2 i 1 i 1
n1 n2 2
sau
s 2
n1 1 s x21 n2 1 s x22 n1 1 s x21 n2 1 s x22
c
n1 1 n2 1 n1 n2 2
2
Aadar, dispersia combinat sc este media aritmetic ponderat a dispersiilor celor dou
2 2
eantioane, s x1 i s x 2 .
Testul statistic:
t
x 1
x2 D
x 1
x2 D
n1n2 n1 n2 2
1 1 s x21 n1 1 s x22 n2 1 n1 n2
sc2
n1 n2
Testul statistic:
t
( x1 x2 ) D /n1 s22 /n2 s
2
1 2
Ipotezele statistice:
- pentru test bilateral
H0: 1 = 2 (1- 2 = D)
H1: 1 2 (1- 2 D)
- pentru test unilateral dreapta
H0: 1 = 2 (1- 2 = D)
H1: 1 > 2 (1- 2 > D)
- pentru test unilateral stnga
4
H0: 1 = 2 (1- 2 = D)
H1: 1 < 2 (1- 2 < D)
unde D reprezint diferena ipotetic dintre mediile populaiilor, deseori egal cu 0.
t< t / 2 , n 1 n2 2
sau t> t / 2 ,n n
1 2 2
t> t , n1 n 2 2
- pentru test unilateral stnga:
t< t , n 1 n2 2
Exemplu
Exemplu
Presupunem c dorim s testm ipoteza conform creia ntre dou mrci de autoturisme
nu exist diferene semni-ficative privind cheltuielile de funcionare. Pentru aceasta 20 de
posesori de autoturisme (8 posesori ai primei mrci i 12 po-sesori ai celei de-a doua) sunt
rugai s in, cu acuratee, evidena cheltuielilor de funcionare pe o perioad de un an de
zile. Pentru =0,1 (probabilitate de garantare a rezultatelor (1-)100 = 90%) s se testeze
aceast ipotez, dac rezultatele prelucrrii datelor n eantioane sunt:
Marca 1 Marca 2
n1=8 n2=12
x 1 5,696 mil. lei x 2 5,273 mil. lei
sx1=0,485 mil. lei sx2=0,635 mil. lei
s c2
8 1 0,4852 12 1 0,6352 0,3379
8 12 2
5
t
5,696 5,273 0 0,423
1,5943
1 1 0,2653
0,3379
8 12
Cum t/2,n1+n2-2= t0,05;18 = 1,734, se observ c t < t/2,n1+n2-2, aadar nu ne aflm n regiunea
critic.
Test de autoevaluare 1
x x 2
Linia Nr. sptmni i i x
A 12 129 69,52
B 12 111 42,35
6
Se tie c:
- suma ptratelor diferenelor ( x i x ) 2 (care este, de fapt, egal cu n s 2 sau
care aria din stnga este , deoarece statistica este ntotdeauna mai mare dect zero. Dar
2
21 reprezint punctul pentru care aria de sub curb situat la stnga lui este .
Exemplu
2 16 ,92 i 2 3,33.
0 ,05;9 0 ,95;9
( n 1) s 2
2
2
care are o distribuie cu (n-1) grade de libertate, cnd populaia eantionat este normal
2
distribuit, cu dispersia 2 .
Ipotezele statistice:
- pentru test bilateral
H 0 : 2 02
H 0 : 2 02
H 0 : 2 02
7
- pentru test unilateral stnga
H 0 : 2 02
H 0 : 2 02
Exemplu
Pentru urmtoarele date privind cererea unui produs (selectate dintr-o colectivitate normal
distribuit), s se testeze (pentru o probabilitate de 95%), ipotezele:
H 0 : 2 100 ,
H 1 : 2 100 .
Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
n eantion: s 13,85 , s 2 191,8 .
s 2
(x i x)2
1726
191,8 .
n 1 9
Testul statistic este:
(n 1) s 2 1726
2
17,26 .
2 100
Cum , n 1 0.05, 9 16,92 ,
2 2
Test de autoevaluare 2
8
1. Abaterea medie ptratic a nlimii fetelor dintr-o clas de boboci (clasa a 9-a) ai unui
liceu este de 6,9 centimetri. Este vreun motiv s credem c a avut loc o schimbare n variaia
nlimii fetelor dac a fost selectat un eantion aleator de 30 de fete din clasa a 9-a a liceului
i s-a obinut o dispersie de 49 cm2. Se presupune un nivel de semnificaie de 0,02.
Am vzut c testarea ipotezei privind dispersia poate fi utilizat pentru a trage concluzii
privitoare la consistena unor procese economice ori privitoare la riscurile asociate. n acest
subcapitol vom compara dou dispersii, ceea ce ne va permite s comparm consistena a
dou procese sau riscurile a dou portofolii de investiii etc.
Statisticienii testeaz, adesea, egalitatea dintre dou dispersii nainte de a decide ce
procedeu s foloseasc n verificarea ipotezei privind diferena dintre dou medii.
Vom compara dispersiile a dou populaii, determinnd raportul dintre ele. n consecin,
parametrul ce ne intereseaz este 12 / 22 . Dac dispersia eantionului este (aa cum am vzut)
un estimator nedeplasat i consistent al dispersiei colectivitii generale, s notm c raportul
s 12 / s 22 este estimator punctual al raportului de dispersii 12 / 22 .
Se cunoate c raportul dintre dou variabile hi-ptrat independente mprite la gradele lor
de libertate are o distribuie Fisher (distribuie F). Gradele de libertate ale distribuiei F sunt
identice cu gradele de libertate ale celor dou distribuii hi-ptrat. Atunci:
Valoarea lui F pentru care aria de sub curb (situat la dreapta ei) este , se noteaz F (cu
gradele de libertate gl1 i gl2, unde gl1 = n1 1 i gl2 = n2 1).
Ipotezele statistice:
9
- pentru test bilateral
H 0 : 12 / 22 1
H 0 : 12 / 22 1
H 0 : 12 / 22 1
H 0 : 12 / 22 1
Testul statistic:
s12
F
s 22
Exemplu
Un analist dorete s compare mprtierea veniturilor pe familie, pentru colectivitatea
turitilor ce prefer turismul litoral, cu mprtierea veniturilor, pentru colectivitatea turitilor ce
prefer turismul balnear. Presupunnd c distribuiile veniturilor (mil. lei), n cele dou
colectiviti sunt aproximativ normale au fost selectate dou eantioane, de volum 60 i 50 de
persoane, iar abaterile medii ptratice (mil. lei) sunt: s1 2,84 i s 2 1,86 . Se utilizeaz o
probabilitate de garantare a rezultatelor de 95%.
Ipotezele statistice sunt:
10
H 0 : 12 / 22 1 ,
H 1 : 12 / 22 1 .
Cum F F0.05; 59; 49 ipoteza nul se respinge (aceea c raportul dintre dispersii este 1) i
se accept ipoteza alternativ. Acest lucru nseamn c se accept ipoteza conform creia
mprtierea veniturilor pentru turitii din zona litoral este semnificativ mai mare dect cea a
turitilor din zona balnear.
n general, dac la numrtor se trece dispersia cea mai mare testul F este un test
unilateral dreapta.
6. Exersai n EXCEL
Un specialist afirm c persoanele care mnnc cereale la micul dejun vor consuma la masa de prnz,
n medie, mai puine calorii ca aceia care nu mnnc cereale la micul dejun. Pentru a testa aceast
afirmaie, au fost selectai aleator 30 de persoane i au fost ntrebate ce mnnc n mod regulat la
micul dejun i la masa de prnz. Fiecare persoan a fost identificat ca un consumator sau
nonconsumator de cereale la micul dejun i fiecrei persoane i-au fost calculate numrul de calorii
consumate la masa de prnz.
Rezultatele obinute sunt urmtoarele:
Consumatori de cereale:
640, 605, 529, 591, 596, 564, 615, 560, 635, 623 (calorii)
Nonconsumatori de cereale:
502, 703, 735, 707, 523, 534, 768, 626, 620, 589, 736, 565, 686, 529, 632, 951, 744, 632, 593, 847
(calorii)
Se poate spune cu un nivel de semnificaie de 5% c specialistul are dreptate?
Identificarea metodei:
Specialistul trebuie s compare media consumului de calorii pentru populaia consumatorilor de
cereale cu cea a nonconsumatorilor de cereale. Datele sunt cantitative.
11
Ipoteza care trebuie testat este: H 0: 1= 2 cu alternativa H1: 1< 2, deoarece trebuie observat
dac numrul mediu al caloriilor consumate de consumatorii de cereale la masa de prnz este mai mic
dect al neconsumatorilor de cereale.
I. Pentru a putea identifica testul ce trebuie aplicat se va testa dac dispersiile (variaiile) celor dou
populaii sunt egale folosind testul F.
Ipotezele sunt:
H0: 12/22=1 cu alternativa H1: 12/221
Expresia testului este:
F= s12/s22
Instruciuni n EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
2. Apsai Tools/Data Analysis i apoi F-Test Two-Sample for Variances
3. Specificai variabila 1: A1:A26
4. Specificai variabila 2: B1:B26
5. Apsai Labels i apoi OK.
Se obin rezultatele:
F-Test Two-Sample for Variances
Consumatori Nonconsumatori
Mean 595.8 661.1
Variance 1273.51 13375.25
Observations 10 20
df 9 19
F 0.0952
P(F<=f) one-tail 0.00053
F Critical one-tail 0.3392
Excel calculeaz statistica F ca raportul ntre dispersia cea mai mare i dispersia cea mai mic.
Statistica F n cazul nostru este 0,095 iar valoarea p asociat testului unilateral este 0,00053. Valoarea
p corespunztoare testului bilateral (pragul de semnificaie) este 2 0,00053 = 0,00106. Deoarece
aceast valoare este foarte apropiat de zero, ipoteza nul se respinge, deci cele dou dispersii difer
semnificativ.
II. Deoarece sunt complet diferite va fi aplicat testul t pentru variaii inegale.
Instruciuni n EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
12
2. Apsai Tools/Data Analysis i apoi t-Test: Two-Sample Assuming Unequal Variances
3. Specificai variabila 1: A1:A11
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK
Se obin rezultatele:
t-Test: Two-Sample Assuming Unequal Variances
Variable 1 Variable 2
Mean 595.8 661.1
Variance 1273.511 13375.25
Observations 10 20
Hypothesized Mean Difference 0
Df 25
t Stat -2.31433
P(T<=t) one-tail 0.014576
t Critical one-tail 1.70814
P(T<=t) two-tail 0.029153
t Critical two-tail 2.059537
Test de autoevaluare 1
1. Ipotezele statistice sunt:
H0: 1 = 2 (1- 2 = 0),
H1: 1 > 2 (1- 2 > 0)
13
Testul ce se va aplicate este testul pentru diferena dintre dou medii pentru eantioane de
volum redus (deoarece n=12).
Caz 1: Dispersiile sunt egale
t
x 1 x2 D
129 / 12 11 / 12
11,66
12,67
1 1 5,0851 / 12 1 / 12 0,92
s c2
n1 n 2
Cum t/2,n1+n2-2= t0,05;20 = 1,725, se observ c t > t/2,n1+n2-2, aadar ne aflm n regiunea
critic.
t
x 1
x2 D
129 / 12 11 / 12
11,66
12,67
s12 s 22 69,52 42,35 0.92
n1 n 2 12 * 11 12 * 11
14
Test de autoevaluare 2
1. Ipotezele: H 0 : 2 47,61 ,
H 1 : 2 47,61 .
n eantion: s 2 49 , n=30 .
Testul statistic este:
(n 1) s 2 29 49
2 29,84 .
2 47,61
9. Lucrare de verificare 4
1. Cum se testeaz ipoteza privind diferena dintre mediile a dou colectiviti generale, n
cazul eantioanelor de volum redus?
2. O companie producatoare de hrana pentru bebelui susine c noul su produs este superior
fa de cel al principalului su concurent, prin aceea c bebeluii care consum acest produs
ctig mai repede i mai mult n greutate. Pentru a verifica aceasta afirmaie, au fost selectai
aleator 10 bebelui; timp de 2 luni, 5 bebelui au fost hrnii cu produsul creat de compania
productoare, iar ceilali 5 bebelui cu produsul creat de firma concurent. Surplusul de
greutate (zeci grame) ctigat de bebelui n urma consumrii celor dou produse a fost:
Produsul companiei 85 102 79 105 113
Produsul concurentului 91 68 85 82 76
Putem concluziona, cu o probabilitate de 95%, c bebeluii hrnii cu produsul companiei au
luat mai mult n greutate dect cei hranii cu produsul concurentului? (tcritic= 2,306)
15