Sunteți pe pagina 1din 10

CAP. I.

TESTARI DE IPOTEZE
Problema 1
Patronul unei firme de prestri servicii dorete s fluidizeze servirea clienilor i, pn n prezent,
el presupunea c timpul de servire a clienilor este normal distribuit, de medie 130 de minute i abatere
medie ptratic 15 minute. El este de acord cu abaterea medie ptratic, dar se ndoiete de faptul c
durata medie de servire a unui client este 130 minute. Pentru a studia aceast problem, nregistreaz
timpii de servire pentru 100 de clieni. Timpul mediu obinut n eantion este 120 minute. Poate
patronul s concluzioneze, la o probabilitate de 99%, c timpul mediu este diferit de 130 minute.
n aceast problem, parametrul ce ne intereseaz este timpul mediu n colectivitatea general i
ipotezele de testat sunt:
H 0 : 130,
H 1 : 130.

Trebuie, aadar, s rspundem la ntrebarea: Este media de 120 minute suficient de diferit de
valoarea 130, pentru a ne permite s concluzionm c media populaiei nu este egal cu 130 minute?
Vom putea s respingem ipoteza nul dac media eantionului este suficient de diferit, relativ la
valoarea 130. Dar, interpretrile nu sunt evidente. Dac n eantion obineam media 1300 sau 1,3
atunci diferenele erau clare. De asemenea, dac media eantionului era 130,1 atunci egalitatea era i
ea evident.
Distribuia de eantionare a mediei x este normal sau aproximativ normal, cu media i
abaterea
z

medie

ptratic

s/

n.

Ca

rezultat,

putem

standardiza

calcula

x 130
x 130

.
1,5
15 / 100

Regiunea de respingere (critic) o putem specifica astfel:


Se respinge H0, dac z z 0.005 sau z z 0.005 .
n exemplul nostru, z / 2 z 0.005 2,575
z

120 130
6,67 .
1,5

Cum z 6,67 2,575 z 0.005 , rezult c sunt suficiente dovezi pentru a respinge ipoteza
nul H0 i a accepta ipoteza alternativ, aceea c timpul mediu de servire a unui client este diferit de
130 minute.
Problema 2

Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei n anul curent.
Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preurile anului anterior).

tiind c profitul companiei n anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi pentru a
concluziona c media previziunilor experilor este semnificativ mai mare dect cifra anului anterior
(pentru = 0,05)?
Media previziunilor experilor este
s

2
x

n 1

x 2,63 mld.

lei, cu dispersia:

2,203
2
0,5507 i abaterea medie ptratic: s x s x 0,74 mld. lei.
4

Elementele procesului de testare a ipotezei statistice sunt:


H0: = 2,01,
H1: > 2,01 (test unilateral dreapta).
t

x
x
2,63 2,01

1,874 .
sx
sx
n
0,74 / 5

n scopul folosirii statisticii t, vom face presupunerea c populaia general din care s-a extras
eantionul este normal distribuit. Cum t,n-1 = t0,05;4 = 2,132, regiunea critic este dat de t>t,n-1. Cum
t=1,874< t0,05;4=2,132, nu putem trage concluzia c media profitului previzionat de cei 5 experi pentru
anul curent este semnificativ mai mare dect profitul anului trecut, de 2,01 mld. lei.

Problema 3
Presupunem c pentru 100 de observaii asupra unei variabile aleatoare X s-a obinut media x 110
i abaterea standard 60.
a) Testai ipoteza nul c =100, cu alternativa >100, utiliznd = 0,05.
b) Testai ipoteza nul c = 100, cu alternativa 100, utiliznd = 0,05. Comparai rezultatele
celor dou teste.
Rezolvare:
a) n = 100;
x 110 ;

sx = 60;
= 0,05.
Considerm:
H0: = 0=100,
H1: > 0=100.
Se aplic testul z unilateral dreapta:

x 0

z 1
sx / n

Regiunea critic va fi dat de:

sx

x 0 z

z 0, 05 1,645

0 z

sx

100

60
100

1,645 109,870

Cum x 110 > 109,870, suntem n regiunea critic deci se respinge H 0.


b) H0: = 100;
H1: 100.
Se aplic testul z bilateral.

x 0
P z
z 1 ;

sx / n
2
2

z 0 , 05 1,96
2

Limitele intervalului de ncredere sunt:

0 z
2

sx
n

sx
n

z
2

x 0 z
2

60
100

sx
n

1,96 11,76 ;

100 11,76 x 100 11,76;


88,24 x 111,76.

ntruct ne aflm n intervalul de ncredere, se accept ipoteza H 0.


Problema 4
Un productor de detergeni industriali preambaleaz produsul la cutii ce trebuie s aib, n medie, 12 kg.
El dorete s verifice corectitudinea ambalrii i hotrte s organizeze un sondaj de n=100 observaii
(cutii), pentru care obine greutatea medie

x 11,85 kg,

cu o abatere medie ptratic sx=0,5 kg. S se

testeze ipoteza conform creia n medie cutiile au cte 12 kg, cu alternativa c greutatea este diferit
de 12 kg. (<12 kg sau >12 kg), pentru o probabilitate de 95%.
Rezolvare:
H0: 0 12 kg;
H1: 12 kg ( 12 kg sau 12 kg).
Testul statistic: z

x 0
x 0
11,85 12

3,0 .
sx
0,5 / 10
sx / n

Nivelul de ncredere: 1 - = 0,95.

Pragul de semnificaie: = 0,05, din care rezult /2 = 0,025 (deoarece avem test bilateral).
z / 2 z 0,025 1,96 .

Regiunea de respingere: z / 2 1,96 sau z / 2 1,96 .


Cum z calc z / 2 , rezult c ipoteza nul este respins i se accept ipoteza alternativ, aceea c n
cutii se afl o cantitate de detergeni semnificativ diferit de 12 kg.
Problema 5
ntr-o cercetare prin sondaj aleator privitoare la transportul n comun, au fost selectate 100 de persoane
pentru care s-a calculat valoarea medie a biletelor cumprate ntr-o lun pentru transport n comun
urban de 110 u.m, cu o abatere medie ptratic de 60 u.m.
a) Testai ipoteza nul, aceea conform creia valoarea medie a biletelor cumprate ntr-o lun, n
colectivitatea general, este 0 100 u.m, cu ipoteza alternativ 0 100 u.m, utiliznd un
nivel de ncredere 1 - = 0,95 (probabilitatea (1-)100 = 95%).
b) Testai ipoteza nul 0 100 u.m, cu ipoteza alternativ 0 100 u.m, cu aceeai
probabilitate. Interpretai rezultatele.
Rezolvare:
a) H0: 0 100 u.m
H1: 0 100 u.m.
Testul statistic: z

x 0
x 0 110 100

1,67
sx
60 / 10
sx / n

Nivelul de ncredere: 1 - = 0,95.


Pragul de semnificaie: = 0,05 (test unilateral dreapta)
z z 0,05 1,645

Cum z calc z , rezult c ipoteza nul este respins ( 0 100 u.m.) i se accept ipoteza
alternativ ( 0 100 u.m.).
b) H0: 0 100 u.m.;
H1: 0 100 u.m.
Test statistic: z

x 0
x 0 110 100

1,67 .
sx
60 / 10
sx / n

Nivelul de ncredere 1 - = 0,95.

Pragul de semnificaie = 0,05, din care rezult /2 = 0,025 (deoarece avem test bilateral).
z / 2 z 0,025 1,96

Cum z calc z / 2 , (1,67 < 1,96), rezult c se accept ipoteza nul (valoarea medie a biletelor
cumprate nu este semnificativ diferit de 100 u.m.).

CAP. 2. METODA ANALIZEI DISPERSIONALE ANOVA si Regula de compunere a variabilitatii


Problema 1.

Un productor de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are
urmtoarele avantaje fa de vechiul produs: este mai practic de utilizat, are o calitate cel puin la fel
de bun i cost semnificativ mai mic.
Pentru a decide pe care dintre cele trei avantaje s-i axeze strategia de marketing, directorul
acestui departament a realizat un studiu n trei orae. n oraul A campania de publicitate s-a axat pe
uurina de utilizare a noului produs. n oraul B campania de publicitate s-a axat pe calitatea noului
produs. n oraul C campania de publicitate s-a axat pe preul mai mic al noului produs. n toate cele 3
orae s-a nregistrat numrul de buci vndute n 20 de sptmni.
Directorul de marketing ar dori s tie dac exist diferene semnificative ntre numrul de buci
vndute, n medie pe sptmn, n cele trei orae dup terminarea campaniei de publicitate.
In urma prelucrarii datelor si a aplicarii metodei analizei dispersionale, s-au obtinut urmatoarele rezultate:
ANOVA
Source of Variation
Between Groups
Within Groups

SS
57512.23
506983.5

df
2
57

Total

564495.7

59

MS
28756.12
8894.447

F
3.233

P-value
0.047

F crit
3.159

Identificarea metodei: Datele sunt cantitative i problema revine la a compara mediile celor trei
populaii.
MSB=28756,12
SSW=506983,5
Completarea coloanei Df:
r-1=3-1=2
n-r=60-3=57
n-1=60-1=59
Completarea coloanei SS:
Stim ca MSB=SSB/(r-1), de unde rezulta ca: SSB=MSB * (r-1) =28756,12 * 2 = 57512,23
SST=SSB+SSW=57512,23 + 506983,5 = 564495,7
Completarea coloanei MS:
MSW=SSW/(n-r) = 506983,5 / 57 = 8894,447
Fcalc= MSB/MSW=28756,12 / 8894,447 = 3,233

Cum Fcalc (3,233) >Fcrit (3,159), rezulta ca exista diferente semnificative intre vanzarile medii din cele trei
orase, asadar strategia de marketing aleasa a influentat semnificativ variatia vanzarilor.
CAP. 3. REGRESIA LINIARA

1. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i
numrul vizitatorilor (mii pers.) timp de 14 zile. Datele sunt prezentate n tabelul 4.1.
Tabelul 4.1
Ziua
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14

a.
b.
c.
d.

Nr. spoturi publicitare


1
7
5
1
8
10
2
6
7
9
3
12
8
4
11

Nr.vizitatori(mii pers.)
2
42
32
10
40
61
8
35
34
45
11
64
37
30
55

Sa se reprezinte grafic datele si sa se caracterizeze pe baza lui legatura dintre variabile.


Sa se determine ecuaia de regresie liniara si sa se interpreteze valorile coeficientilor b0 si b1.
Sa se previzioneze numrul vizitatorilor n ipoteza c se vor difuza 15 spoturi pe zi.
S se msoare intensitatea legturii dintre cele dou variabile cu ajutorul unui indicator
adecvat. (coeficientul de corelatie liniara Pearson).

Rezolvare:
a) Notm cu X variabila factorial, independent nr.spoturi publicitare i cu Y variabila
dependent nr.vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate construim
corelograma (figura 4.1).

70

nr.vizitatori

60
50
40
30
20
10
0
0

10

12

14

nr.spoturi

Figura 4.1 Corelograma (diagrama de mprtiere)


Comentarii: exista legatura intre variabile, directa si liniara.
b) Ecuaia de regresie va avea forma:
y i b0 b1 xi

Pentru a determina estimatorii b0 i b1, rezolvm sistemul de ecuaii normale, folosind datele din
tabelul de lucru 4.2:

nb0 b1 xi yi

2
b0 xi b1 xi xi yi
n=14 (numrul observaiilor)
Tabelul 4.2
yi

xi2

0
7
5
1
8
10
2
6
7
9
3
12
8
4
11

1
42
32
10
40
61
8
35
34
45
11
64
37
30
55

2
49
25
1
64
100
4
36
49
81
9
144
64
16
121

=93

=504

=763

xi

xi yi xi2

xiyi
3
294
160
10
320
610
16
210
238
405
33
768
296
120
605
xi yi
=4085

yi2

yi 2 ,2858 5 ,0753 xi

4
1764
1024
100
1600
3721
64
1225
1156
2025
121
4096
1369
900
3025

5
37,8
27,7
7,4
42,9
53,0
12,4
32,7
37,8
48,0
17,5
63,2
42,9
22,6
58,1
yi =504

yi2

=22190

14b0 93b1 504

93b0 763b1 4085


Serezolvasistemulsisegaseste :
b0 2,2858
b1 5,0753
Ecuaia de regresie este:
yi 2 ,2858 5 ,0753 xi
Interpretare b0:
Daca nu se difuzeaza nici un spot publicitar, (0 difuzari), atunci numarul mediu de vizitatori este de
2,2858 mii persoane. (ac. Interpretare se face doar daca 0 este o valoare posibila a variabilei X).
Interpretare b1:.
b1>0, rezulta o legatura directa intre cele doua variabile.
Daca numarul de spoturi publicitare difuzate creste cu 1, atunci numarul vizitatorilor va creste, in
medie, cu 5,0753 mii persoane.
c) Dac numrul spoturilor publicitare difuzate va fi de 15, atunci numrul previzionat al
vizitatorilor pe baza acestei ecuaii de regresie este:
y / x 15 2 ,2858 5 ,0753 15 78 mii pers.

d) Pentru a msura intensitatea legturii dintre cele dou variabile se va calcula coeficientul
de corelaie liniar Pearson:

xi yi xi yi
2
2
n
x 2 xi n yi2 yi
i

10318

2033 14 22190 504 2

b
n

yi2

yi

10318
0 ,9615
10731

Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de valoarea
unitar).
2. Un analist de marketing urmrete n 5 luni efectul reclamelor asupra veniturilor din vnzri. El
nregistreaz cheltuielile cu reclama (X) (mii RON) i veniturile din vnzri, Y (sute mii RON). n
urma prelucrrii rezultatelor, obine:
xi 15 ; yi 10 ; xi2 55 ; xi y i 37 . n ipoteza unei dependene liniare, s se
determine ecuaia de regresie.
Rezolvare:
Ecuaia de regresie este:

y i b0 b1 xi

Pentru a determina estimatorii b0 i b1, rezolvm sistemul de ecuaii normale:

nb0 b1 xi yi

2
b0 xi b1 xi xi yi
n=5 (numrul observaiilor)

5b0 15b1 10

15b0 55b1 37
b0 0,1
b1 0,7
Deci ecuaia de regresie este: y 0 ,1 0 ,7 x .
3. Pentru opt judee ale Romniei, se cunosc: suprafaa cultivat n 1996 ( mii ha) i producia
agricol total n acelai an (mil. RON preuri curente):
Tabelul 4.14
Judeul
Alba
Arad
Bistria Nsud
Botoani
Braov
Buzu
Cara Severin
Clrai

Suprafaa cultivat n
1996 (mii ha)
127
342
98
286
111
252
124
404

Producia agricol
(mil. RON)
75,1
112,4
64,4
89,4
80,4
84,3
62
96,5

S se studieze existena, direcia i intensitatea legturii dintre suprafaa cultivat i producia


agricol, cu ajutorul coeficienilor de corelaie a rangurilor ai lui Spearman i Kendall.
Rezolvare:
Coeficientul lui Spearman se determin cu relaia:

rs 1

di2

,
n n2 1
unde di reprezint diferena ntre rangurile celor dou variabile, aferente aceleiai uniti. Se
ordoneaz perechile de valori n ordinea cresctoare a valorilor xi, apoi se atribuie ranguri valorilor celor
dou variabile (tabelul 4.15.).
Tabelul 4.15
Jude

Suprafaa
(xi)
127
342
98
286
111
252
124
404

Bistria Nsud
Braov
Cara Severin
Alba
Buzu
Botoani
Arad
Clrai
Total

Producia
(yi)
75,1
112,4
64,4
89,4
80,4
84,3
62
96,5

Rx

Ry

di

d i2

1
2
3
4
5
6
7
8

2
4
1
3
5
6
8
7

-1
-2
2
1
0
0
-1
1

1
4
4
1
0
0
1
1
12

6 12
0 ,86 , valoare ce indic o legtur direct, puternic, ntre cele dou variabile.
8 63
Coeficientul lui Kendall se calculeaz cu relaia:
rs 1

rk

2 p i q i
n(n 1)

, unde

reprezint suma rangurilor superioare (pi) i

este

suma rangurilor inferioare (qi), corespunztoare fiecrui rang curent (tabelul 4.16).
2 20
rk
0,71 , valoare a crei interpretare este aceeai ca n cazul coeficientului lui Spearman.
87
Tabelul 4.16
Jude
Bistria Nsud
Braov
Cara Severin
Alba
Buzu
Botoani
Arad
Clrai
Total

Rx
1
2
3
4
5
6
7
8
-

Ry
2
4
1
3
5
6
8
7
-

pi
6
4
5
4
3
2
0
0
24

qi
1
2
0
0
0
0
1
0
4

4. Datele sistematizate, obinute n urma unui studiu statistic privind vechimea n munc i timpul
zilnic nelucrat, efectuat pe 800 de salariai ai unei societi comerciale, sunt:
Tabelul 4.17
Vechimea
peste 10 ani
sub 10 ani

Timp nelucrat (u.m.)


sub 60 u.m.
peste 60 u.m.
300
150
100
250

S se precizeze dac ntre cele dou variabile exist o legtur.


Rezolvare:

Se folosete coeficientul de asociere Yulle, calculat cu relaia:


n n n12 n21
QY 11 22
, unde n11 = 300, n22 = 250, n21 = 100, n12 = 150.
n11 n22 n12 n21
300 250 100 150 60.000
QY

0,67 .
300 250 100 150 90.000
Rezult c ntre cele dou variabile exist o asociere pozitiva de intensitate medie.

S-ar putea să vă placă și