Sunteți pe pagina 1din 24

TESTAREA IPOTEZELOR

STATISTICE

APLICATII
24 oct. 2013

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute si diferite

APLICATIA 1
Un specialist afirm c persoanele care mnnc cereale la micul
dejun vor consuma la masa de prnz, n medie, mai puine calorii
ca aceia care nu mnnc cereale la micul dejun. Pentru a testa
aceast afirmaie, au fost selectai aleator 30 de persoane i au
fost ntrebate ce mnnc n mod regulat la micul dejun i la
masa de prnz. Fiecare persoan a fost identificat ca un
consumator sau nonconsumator de cereale la micul dejun i
fiecrei persoane i-au fost calculate numrul de calorii consumate
la masa de prnz.
Rezultatele obinute sunt urmtoarele:
Consumatori de cereale:
640, 605, 529, 591, 596, 564, 615, 560, 635, 623 (calorii)
Nonconsumatori de cereale:
502, 703, 735, 707, 523, 534, 768, 626, 620, 589, 736, 565, 686, 529,
632, 951, 744, 632, 593, 847 (calorii)

Se poate spune cu un nivel de semnificaie de 5% c specialistul


are dreptate?

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute si diferite

Identificarea metodei:
Specialistul trebuie s compare media consumului de
calorii pentru populaia consumatorilor de cereale cu cea
a nonconsumatorilor de cereale. Datele sunt cantitative.
Ipoteza care trebuie testat este: H0: 1= 2 cu
alternativa H1: 1< 2, deoarece trebuie observat dac
numrul mediu al caloriilor consumate de consumatorii
de cereale la masa de prnz este mai mic dect al
neconsumatorilor de cereale.

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute si diferite
Pentru a putea identifica testul ce trebuie aplicat
se vor calcula i compara abaterile medii
ptratice
(Tools/Data Analysis/Descriptive statstics).
Acestea sunt: s1 = 35,7 i s2 = 115,7 .
Deoarece ele sunt total diferite va fi aplicat testul
t pentru dispersii inegale (se poate aplica un test
statistic pentru semnificaia diferenei dintre
dispersii)

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute si diferite

Rezultate Descriptive statistics


Ne-consumatori

Consumatori
Mean
Standard Error
Median
Mode

595.8
11.284995
600.5
#N/A

Mean
Standard Error

661.1
25.86045

Median

632

Mode

632

Standard Deviation

35.686287

Standard Deviation

115.6514

Sample Variance

1273.5111

Sample Variance

13375.25

Kurtosis

-0.3766986

Kurtosis

0.585221

Skewness

-0.6162901

Skewness

0.787462

Range

111

Range

449

Minimum

529

Minimum

502

Maximum

640

Maximum

951

Sum
Count

5958
10

Sum
Count

13222
20

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute si diferite

Rezolvare folosind EXCEL:


Introducei

datele pe dou coloane. n A1 se scrie


Consumatori iar n B1 Nonconsumatori.
Apsai Tools/Data Analysis i apoi t-Test: TwoSample Assuming Unequal Variances
Specificai variabila 1: A1:A11
Specificai variabila 2: B1:B21
Specificai Hypothesized Mean Difference: 0,
apsai Labels. Apsai OK

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute si diferite

t-Test: Two-Sample Assuming Unequal


Variances
Neconsumat
ori

Consumatori
Mean

595.8

661.1

Variance

1273.511111

13375.25263

Observations

10

20

Hypothesized Mean Difference 0


df

25

t Stat

-2.31433179

P(T<=t) one-tail

0.014576434

t Critical one-tail

1.708140189

P(T<=t) two-tail

0.029152868

t Critical two-tail

2.05953711

Val. calculata a
testului
Niv.semnif. pt. test
unilateral (1,46%)
Val. critica pt. test
unilateral
Niv.semnif. pt. test
bilateral (2,9%)
Val. critica pt. test
bilateral

t-Test: Two-Sample Assuming Unequal


Variances

Rezultat:
Deoarece

valoarea p pentru testul unilateral (nivelul


de semnificatie) este mic (1,46%<5%), putem spune
c aceste date dovedesc c cei care consum
cereale la micul dejun consum mai puine calorii la
masa de prnz (se accept ipoteza alternativ, c
exist diferene semnificative), cu o probabilitate
maxima de 100-1,46=98,54%. (>95%)

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute, dar egale

APLICATIA 2
Directorul unei companii pentru fabricarea mobilei de birou crede ca
productivitatea muncitorilor depinde, printre altele, si de
succesiunea operatiilor pe care trebuie sa le execute muncitorul.
Pentru producerea unui birou ergonomic sunt considerate doua
variante de realizare a acestuia (d.p.d.v. al succesiunii operatiilor).
Pentru a decide care varianta este mai buna, au fost selectati
aleator 25 de muncitori care asambleaza biroul in varianta A si 25
de muncitori care asambleaza biroul in varianta B. Au fost
inregistrati timpii de asamblare pt. fiecare din cei 50 de muncitori.
Directorul doreste sa afle daca, pentru un nivel de semnificatie de
5%, timpii medii de asamblare in cele doua variante difera
semnificativ.
H0: 1 = 2
H1: 1 2

Testarea ipotezei privind diferena dintre dou


medii pentru dispersiile populatiilor
necunoscute, dar egale
Pentru a putea identifica testul ce trebuie aplicat
se vor calcula i compara abaterile medii
ptratice
(Tools/Data Analysis/Descriptive statstics).
Acestea sunt: s1 = 0,921 i s2 = 1,14.
Deoarece ele sunt aproximativ egale va fi aplicat
testul t pentru dispersii egale (se poate aplica un
test statistic pentru semnificaia diferenei dintre
dispersii)

Rezultate Descriptive statistics


Varianta B

Varianta A
Mean
Standard Error
Median
Mode

6.288
0.184148
6.3
5

Mean
Standard Error

6.016
0.228304

Median

5.9

Mode

5.9

Standard Deviation

0.920742

Standard Deviation

1.141519

Sample Variance

0.847767

Sample Variance

1.303067

Kurtosis

-0.37359

Skewness

0.104214

Kurtosis
Skewness

-0.761
-0.09588

Range

3.3

Range

4.3

Minimum

4.6

Minimum

4.2

Maximum

7.9

Maximum

8.5

Sum
Count

157.2
25

Sum
Count

150.4
25

Rezolvare folosind EXCEL:

Introducei datele pe dou coloane. n A1 se


scrie Varianta A iar n B1 Varianta B.
Apsai Tools/Data Analysis i apoi t-Test:
Two-Sample Assuming Equal Variances
Specificai variabila 1: A1:A26
Specificai variabila 2: B1:B26
Specificai Hypothesized Mean Difference: 0,
apsai Labels. Apsai OK

t-Test: Two-Sample Assuming Equal


Variances
Dispersia
Dispersia
combinata
Valoarea
calculata a
testului t
100-17,9=82,1%
nivelul de incredere
pt. testul unilateral
Val. critica. pt.
testul unilateral
100-35,8=64,2%
nivelul de incredere
pt. testul bilateral

Val. critica. pt.


testul bilateral

t-Test: Two-Sample Assuming Equal


Variances

Concluzie:
Deoarece

tcalculat (0,927) < tcritic (2,01) se


accepta H0, deci timpii medii de asamblare nu
difera semnificativ.
Ipoteza H1, conform careia timpii medii sunt
semnificativ diferiti poate fi garantata cu o
probabilitate de doar 64,2% (<95%).

Testarea ipotezei privind diferena dintre dou


medii pentru populatii dependente

APLICATIA 3
Pe 20 de maini selectate aleator se instaleaz
un tip de anvelope i se msoar numrul de
kilometri parcuri pn la uzura total a
acestora. Apoi pe aceleai maini se instaleaz
un nou tip de anvelope i se procedeaz similar
cu cazul anterior. Se poate spune c distanta
media parcursa cu noul tip de anvelope difera
semnificativ fata de cea parcursa cu vechiul tip?

Testarea ipotezei privind diferena dintre dou


medii pentru populatii dependente
Maina

Distana parcurs n mii de kilometri cu


tipul de anvelope noi

57

64

Distana parcurs n mii de kilometri cu


tipul de anvelope vechi

48

50

Maina

11

12

Distana parcurs n mii de kilometri cu


tipul de anvelope noi

100

Distana parcurs n mii de kilo-metri cu


tipul de anvelope vechi

98

10

102 62

81

87

61

62

74

62

89

56

78

75

50

49

70

66

13

14

15

16

17

18

19

20

90

83

84

86

62

67

40

71

77

86

78

90

98

58

58

41

61

82

Testarea ipotezei privind diferena dintre dou


medii pentru populatii dependente

Deoarece cele dou tipuri de anvelope sunt instalate pe


aceleai maini, vom avea de testat dac mediile a dou
populaii dependente sunt egale.
Datele sunt cantitative iar obiectivul experimentului este
de a compara numrul de kilometrii parcuri pentru cele
dou populaii pereche. Deci ipotezele care trebuie
testate sunt
H0: 1= 2
H1: 1 2.

Testarea ipotezei privind diferena dintre dou


medii pentru populatii dependente

Rezolvare folosind EXCEL:


Introducei

datele pe dou coloane


Apsai Tools/Data Analysis i apoi t-Test:
Paired Two-Sample for Means
Specificai variabila 1: A1:A21
Specificai variabila 2: B1:B21
Specificai Hypothesized Mean Difference:
0, apsai Labels. Apsai OK

Testarea ipotezei privind diferena dintre dou


medii pentru populatii dependente
Valoarea calculata a
testului
Niv. de semnif. 1%;
nivel de incredere
99%, cu care
garantam ca mediile
sunt diferite

Val. critica a testului


bilateral.
Cum tstat>t crit
se accepta ipoteza H1.

Testarea ipotezei privind raportul dintre dou


dispersii

APLICATIA 4
Folosind datele APLICATIEI 1, s se testeze dac
dispersiile (variaiile) celor dou populaii sunt
egale
Rezolvare:

Identificarea metodei:

Ipotezele sunt:
H0: 12 22 1
H1: 2 2 1
1
2
Expresia testului este:

Fs

2
1

2
2

Testarea ipotezei privind raportul dintre dou


dispersii

Rezolvare folosind EXCEL:


Introducei

datele pe dou coloane. n A1 se


scrie Consumatori iar n B1
Nonconsumatori.
Apsai Tools/Data Analysis i apoi F-Test
Two-Sample for Variances
Specificai variabila 1: A1:A26
Specificai variabila 2: B1:B26
Apsai Labels i apoi OK.

Se obin rezultatele:

Testarea ipotezei privind raportul dintre dou


dispersii
F-Test Two-Sample for Variances
Consumatori

Nonconsumatori

Mean

595.8

661.1

Variance

1273.51

13375.25

Observations

10

20

df

19

0.0952

P(F<=f) one-tail

0.00053

F Critical one-tail

0.3392

Valoarea calculata
a testului F

Nivel (minim) de semnificatie


0,053%. Probabilitatea cu care se
garanteaza ca dispersiile sunt
diferite (acceptam H1) este de
99,947% (>95%)

Val. critica a testului


unilateral. (F1-,n1-1,n2-1)

S-ar putea să vă placă și