Sunteți pe pagina 1din 68

FUNDAMENTAREA DECIZIILOR FOLOSIND TESTAREA IPOTEZELOR STATISTICE

ntrebri teoretice i probleme rezolvate

2. Presupunem c pentru 100 de observaii asupra unei variabile aleatoare X s-a obinut media x =110 i abaterea
standard 60.
a) Testai ipoteza nul c =100, cu alternativa >100, utiliznd = 0,05.
b) Testai ipoteza nul c = 100, cu alternativa 100, utiliznd = 0,05. Comparai rezultatele celor dou teste.
Rezolvare:
a) n = 100;
x =110 ;

sx = 60;
= 0,05.
Considerm:
H0: = 0=100,
H1: > 0=100.
Se aplic testul z unilateral dreapta:

x 0

P
z = 1
sx / n

Regiunea critic va fi dat de:

x 0 + z

sx
n

z 0, 05 =1,645

0 + z

sx
n

= 100 +

60
100

1,645 = 109,870

Cum x =110 > 109,870, suntem n regiunea critic deci se respinge H0.
b) H0: = 100;
H1: 100.
Se aplic testul z bilateral.

x 0
P z
z = 1 ;

2
2 sx / n
z 0, 05 = 1,96
2

Limitele intervalului de ncredere sunt:

0 z

sx

sx
n

z =
2

x 0 + z
2

60
100

sx
n

1,96 = 11,76 ;

100 11,76 <x <100 +11,76;


88,24 <x <111,76.

ntruct ne aflm n intervalul de ncredere, se accept ipoteza H 0.


3. Un productor de detergeni industriali preambaleaz produsul la cutii ce trebuie s aib, n medie, 12 kg. El
dorete s verifice corectitudinea ambalrii i hotrte s organizeze un sondaj de n=100 observaii (cutii), pentru care
obine greutatea medie

x =11,85 kg,

cu o abatere medie ptratic sx=0,5 kg. S se testeze ipoteza conform creia n

medie cutiile au cte 12 kg, cu alternativa c greutatea este diferit de 12 kg. (<12 kg sau >12 kg), pentru o probabilitate
de 95%.
Rezolvare:
H0: = 0 = 12 kg;
H1: 12 kg ( < 12 kg sau > 12 kg).
Testul statistic: z =

x 0
x 0
11,85 12
=
=
= 3,0 .
sx
0,5 / 10
sx / n

Nivelul de ncredere: 1 - = 0,95.


Pragul de semnificaie: = 0,05, din care rezult /2 = 0,025 (deoarece avem test bilateral).
z / 2 = z 0,025 = 1,96 .

Regiunea de respingere: z / 2 < 1,96 sau z / 2 > 1,96 .


Cum z calc > z / 2 , rezult c ipoteza nul este respins i se accept ipoteza alternativ, aceea c n cutii se afl o
cantitate de detergeni semnificativ diferit de 12 kg.
4. ntr-o cercetare prin sondaj aleator privitoare la transportul n comun, au fost selectate 100 de persoane pentru
care s-a calculat valoarea medie a biletelor cumprate ntr-o lun pentru transport n comun urban de 110 u.m, cu o
abatere medie ptratic de 60 u.m.
a) Testai ipoteza nul, aceea conform creia valoarea medie a biletelor cumprate ntr-o lun, n colectivitatea general, este

= 0 = 100 u.m, cu ipoteza alternativ > 0 = 100 u.m, utiliznd un nivel de ncredere 1 - = 0,95 (probabilitatea
(1-)100 = 95%).
b) Testai ipoteza nul = 0 = 100 u.m, cu ipoteza alternativ 0 = 100 u.m, cu aceeai probabilitate. Interpretai
rezultatele.
Rezolvare:
a) H0: = 0 = 100 u.m
H1: > 0 = 100 u.m.

Testul statistic: z =

x 0
x 0 110 100
=
=
= 1,67
sx
60 / 10
sx / n

Nivelul de ncredere: 1 - = 0,95.


Pragul de semnificaie: = 0,05 (test unilateral dreapta)
z = z 0,05 = 1,645

Cum z calc > z , rezult c ipoteza nul este respins ( = 0 = 100 u.m.) i se accept ipoteza alternativ (

> 0 = 100 u.m.).


b) H0: = 0 = 100 u.m.;
H1: 0 = 100 u.m.
Test statistic: z =

x 0
x 0 110 100
=
=
= 1,67 .
sx
60 / 10
sx / n

Nivelul de ncredere 1 - = 0,95.


Pragul de semnificaie = 0,05, din care rezult /2 = 0,025 (deoarece avem test bilateral).
z / 2 = z 0,025 = 1,96

Cum z calc < z / 2 , (1,67 < 1,96), rezult c se accept ipoteza nul (valoarea medie a biletelor cumprate nu este
semnificativ diferit de 100 u.m.).
5. Un productor de baterii dorete s verifice dac procentul bateriilor defecte este mai mic de 5%. Presupunem
c sunt selectate aleator 300 de baterii, fiecare dintre acestea este testat i c sunt gsite 10 baterii de fecte. Ofer aceste
informaii suficiente dovezi c procentul bateriilor defecte este mai mic de 5%? Utilizai o probabilitate de 99% de
garantare a rezultatelor.
Rezolvare:
H0: p = 0,05 ;
H1: p < 0,05.
Testul statistic:

z=

f p0
=
sf

f p0

f (1 f )
n

f = 10 / 300 = 0,03;

sf =
z=

f (1 f )
=
n

0,03 0,97
= 0,0098 0,01 ;
300

0,03 0,05
= 2
0,01

Nivelul de ncredere 1 - = 0,99.


Pragul de semnificaie = 0,01 (test unilateral stnga).
z = z 0,01 = 2,33

Cum z calc < z , (2 < 2,33), rezult c ipoteza nul nu se respinge, aadar nu avem suficiente dovezi pentru a afirma c
procentul bateriilor defecte este mai mic de 5%.
6. Presupunem c suntei interesai n efectuarea testului statistic:
H 0 : = 200,
H 1 : > 200,

i utilizai regula de decizie: Se respinge H 0 dac media eantionului de 100 de uniti este mai mare de 212. Deviaia
standard n populaie este de 80. Probabilitatea comiterii unei erori de genul nti este:
a) 13,36%;
b) 6,68%;
c) 43,32%;
d) 0,4332;
e) 3,34%.
Rezolvare: b)
7. ntr-un proces de verificare a ipotezelor statistice nivelul de ncredere reprezint probabilitatea:
a) ;
b) 1-;
c) ;
d) 1-;
e) +.
Rezolvare: b)

8. O variabil aleatoare X urmeaz o repartiie normal de parametri x i 2 dac are densitatea de repartiie:
a)

2
1
exp
xx ;
2
2
2

b)

2
1
1

exp
xx ;
2

c)

2
1

exp
x

x
;
2
2 2

d)

2
1
exp
x+x ;
2
2
2

e)

2
1
exp 2 x x .
2
2

Rezolvare: c)
9. Un omer care caut un loc de munc ntr-o anumit industrie culege informaii despre salariul oferit de
firmele din aceast industrie. Presupunem c distribuia salariului oferit angajailor de calificare similar poate fi

aproximat cu o distribuie normal de medie 800 mii lei i o abatere medie ptratic de 200 mii lei. n plus, presupunem
c muncitorului i se ofer 1150 mii lei de ctre prima firm contactat. Proporia ofertelor salariale care ar putea s se
situeze peste acest nivel este:
a) 4,01%;
b) 8,02%;
c) 54,01%;
d) 91,98%;
e) 45,99%.
Rezolvare: a)
10. Un distribuitor de sucuri livreaz baxuri de cte 8 sticle i cunoate probabilitatea (p=0,02) ca o sticl s se sparg
pe durata transportului. Dac se transport 4000 de baxuri, numrul baxurilor n care se vor gsi dou sau mai multe sticle
sparte este de aproximativ:
a) 85;
b) 14;
c) 3960;
d) 41;
e) 40.
Rezolvare: d)
11. ntr-un spital, 50% din pacienii internai mnnc regim fr sare. Alctuind grupuri de cte 6 pacieni,
probabilitatea ca exact 2 pacieni s in regim fr sare este:
a) 0,015625;
b) 0,2344;
c) 0,9375;
d) 0,50;
e) 0,0468.
Rezolvare: b)
12. n testarea ipotezei statistice privitoare la parametrul media populaiei:
H 0 : = 0 ,
H 1 : < 0 .

Cnd datele provin de la un eantion de volum redus, regiunea critic este dat de:
a)

z < z ;

b)

z < z / 2 ;

c)

t < t,n ;

d) t < t / 2,n ;
e)

t < t, n 1 .

Rezolvare: e)

13. O caracteristic important de calitate pentru sucurile de fructe mbuteliate este proporia de concentrat natural
pe care o conin. ntr-un proces de fabricaie a unei mrci de sucuri, presupunem c procentul de concentrat natural este
aproximativ normal distribuit, cu media 40% i coeficientul de variaie 8%. Sticlele care conin mai puin de 36%
concentrat natural sunt respinse calitativ. Dac 20.000 de sticle sunt verificate, la controlul calitativ pot fi respinse
aproximativ:
a) 2112 sticle;
b) 4224 sticle;
c) 1056 sticle;
d) 124 sticle;
e) 248 sticle.
Rezolvare: a)
14. Atunci cnd datele provin dintr-un eantion de volum redus (n) i se testeaz ipoteza nul privind parametrul
media ntregii colectiviti:
H 0 : = 0 ,
H 1 : > 0 .

regiunea critic este dat de:


a)

z > z ;

b)

z > z / 2 ;

c)

t > t; n 1 ;

d) t > t / 2 ;
e)

t > t2; n 1 .

Rezolvare: c)
15. Probabilitatea ca o companie de asigurri s fie inut s plteasc o poli pentru o problem medical major
este 0,001. Dac un grup de 2000 de persoane asigurate sunt selectate ntmpltor, probabilitatea ca aceast companie s
plteasc cel puin o poli persoanelor selectate este:
a) 0,8196;
b) 0,1804;
c) 0,1353;
d) 0,8647;
e) 0,001.
Rezolvare: d)
16. Perioada de timp ct funcioneaz un anumit tip de baterii este normal distribuit cu o medie de 50 de ore i o
deviaie standard de 15 ore. Probabilitatea ca o baterie s funcioneze ntre 30 i 70 de ore este:
a) 0,5918;
b) 0,4082;

c) 0,8164;
d) 0,1836;
e) 0,7959.
Rezolvare: c)
17. n testarea ipotezei statistice privind media populaiei, cnd datele provin de la un eantion de volum redus (n)
i:
H 0 : = 0 ,
H 1 : 0 ,

regiunea critic este dat de:


a)

z < z sau z > z ;

b)

z < z / 2 sau z > z / 2 ;

c) t < t / 2,n sau t > t / 2,n ;


d) t < t, n 1 sau t > t, n 1 ;
e)

t < t / 2,n1 sau t > t / 2,n 1

Rezolvare: e)
18.
a)

Densitatea de repartiie a variabilei aleatoare normale, de medie


1

f ( xi ) =

b)

f ( xi ) =

c)

f ( xi ) =

d)

f ( xi ) =

e)

f ( xi ) =

20,92
35

1
17,5 2
1
17,5 2
1
4,18 2
1
4,18 2

i dispersie 17,5, este descris de:

x =20,9

1
217,52

( xi 20,9 ) 2

( xi 20,9 ) 2
217,5

( xi 20,9 ) 2
24,18

( xi 20,9 )2
217,5

;
;
.

Rezolvare: e)
19. n testarea ipotezei statistice
H 0 : = 100,
H 1 : < 100,

utiliznd testul z se obine valoarea testului z = -1,11. Nivelul de ncredere al testului este:
a) 86,65%;
b) 36,65%;
c) 13,35%;
d) 26,70%;
e) 73,30%.

Rezolvare: a)
20. ntr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea este:
a) eroarea pe care o facem acceptnd ipoteza nul cnd ea este adevrat;
b) eroarea pe care o facem acceptnd ipoteza alternativ cnd ea este fals;
c) eroarea pe care o facem acceptnd ipoteza nul cnd ea este fals;
d) eroarea pe care o facem eliminnd ipoteza nul cnd ea este adevrat;
e) eroarea pe care o facem eliminnd ipoteza alternativ atunci cnd ea este fals.
Rezolvare: c)
21. Un sistem al unui vehicul spaial trebuie s funcioneze continuu pentru ca nava s reintre n spaiu. O
component a sistemului funcioneaz corespunztor 85% din timp. Pentru a asigura buna funcionare a sistemului, sunt
montate patru componente similare, n aa fel nct sistemul funcioneaz dac cel puin o component lucreaz.
Componentele opereaz independent. Probabilitatea ca sistemul s cad este:
a) 0,05%;
b) 5%;
c) 15%;
d) 52,20%;
e) 0,5220%.
Rezolvare: a)
22. n testarea ipotezei statistice
H 0 : = 100,
H 1 : < 100.

se obine valoarea testului statistic z = -1,11.


Pragul de semnificaie al testului este:
a) 0,3665;
b) 0,1335;
c) 0,267 ;
d) 0,06675;
e) 0,43325.
Rezolvare: b)
23.

ntr-un proces de testare a ipotezelor statistice, eroarea de genul nti este:

a) eroarea pe care o facem acceptnd ipoteza nul cnd ea este adevrat;


b) eroarea pe care o facem acceptnd ipoteza nul atunci cnd ea este fals;
c) eroarea pe care o faccem acceptnd ipoteza alternativ cnd ea este adevrat;
d) eroarea pe care o facem eliminnd ipoteza nul atunci cnd ea este adevrat;
e) eroarea pe care o facem eliminnd ipoteza alternativ atunci cnd ea este adevrat.
Rezolvare: d)

24. O variabil aleatoare X are o distribuie normal, de medie 50 i dis persie 9. Valorea 0, pentru care
P( x 0 ) = 0,8413 , este:

a) 54,23;
b) 45,77;
c) 53;
d) 59;
e) 46.
Rezolvare: c)
25. Probabilitatea ca valorile unei variabile aleatoare normale s se situeze la o distan mai mare de 1,96 ori
abaterea medie ptratic de o parte i de alta fa de medie este:
a) 5%;
b) 0,05%;
c) 2,5%;
d) 47,50%;
e) 97,5%.
Rezolvare: a)
26. Un grup de 10 angajai este ales dintr-o companie n scopul de a determina numrul celor care susin sindicatul
companiei. Presupunem c 60% din toi angajaii susin sindicatul.
Probabilitatea ca mai puin de 7 angajai din cei 10 s susin sindicatul este:
a) 61,78%;
b) 38,22%;
c) 83,28%;
d) 21,50%;
e) 16,72%.
Rezolvare: a)
27. O main utilizat pentru a doza cantitatea de culoare n vopsea, dozeaz n medie m ml pe cutie de vopsea.
Cantitatea de culoare dozat este cunoscut a avea o distribuie normal cu dispersia egal cu 0,160. Dac mai mult de 6
ml de culoare este amestecat n obinerea unei nuane de albastru, vopseaua este respins. Valoarea lui , astfel nct s
nu fie respinse mai mult de 1% din cutii, este:
a) 5,072;
b) 5,6272;
c) 5,536;
d) 5,068;
e) 5,6288.
Rezolvare: d)

28. n testarea ipotezei statistice privitoare la parametrul media populaiei, regiunea critic este dat de:
t < t; n 1 cnd:

a) datele provin dintr-un eantion de volum redus i se efectueaz test unilateral stnga;
b) datele provin dintr-un eantion de volum redus i se efectueaz test unilateral dreapta;
c) datele provin dintr-un eantion de volum normal, se cunoate dispersia populaiei i s-a efectuat test unilateral
stnga;
d) datele provin dintr-un eantion de volum redus i s-a efectuat test bilateral;
e) datele provin dintr-un eantion de volum normal i s-a efectuat test bilateral.
Rezolvare: a)
29. O distribuie de eantioane este o:
a)

distribuie de frecvene a unui parametru;

b)

distribuie de frecvene a valorilor ateptate;

c)

distribuie de probabilitate a unui indicator (ex. x );

d)

distribuie normal a mediilor de selecie;

e)

distribuie normal a abaterilor medii ptratice.

Rezolvare: c)
30. Care dintre urmtoarele modificri nu determin, uzual, schimbri i in distribuia de eantioane?
a) Modificri n volumul populaiei;
b) nlocuirea indicatorului

cu Me;

c) Modificri n distribuia populaiei studiate;


d) Modificri n volumul eantionului;
e) Oricare dintre modificrile anterioare cauzeaz, uzual, modificri n distribuia de eantionare.
Rezolvare: e)
31. Un eantion aleator:
a) Are o distribuie similar cu cea din colectivitatea general;
b) Este eantionul cel mai simplu de selectat;
c) Se realizeaz printr-o eantionare multifazic;
d) Ofer fiecrui element din colectivitatea general o ans egal de a fi inclus;
e)

Necesit ca fiecare element din colectivitatea general s fie reprezentat cnd procesul seleciei este terminat.

Rezolvare: d)
32. Dac din colectivitatea general format din elementele: 1, 2, 4, 5 se selecteaz aleator repetat eantioane de 2
uniti, valorile posibile ale lui

sunt:

a) 1; 2; 4; 5;
b) 1; 2; 3; 4; 5;
c) 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5;
d) 1,5; 2,5; 3,5; 4,5;

10

e) 2; 3; 4.
Rezolvare: c)
33. Dac notm xmax valoarea maxim dintr-un eantion, care dintre urmtorii termeni este corect pentru a descrie
xmax?
a) valoare ateptat;
b) median;
c) estimator;
d) parametru;
e) abatere medie ptratic.
Rezolvare: c)
34. Dac dou sondaje electorale sunt realizate obiectiv, utiliznd eantionarea aleatoare, sunt posibile rezultate
diferite, deoarece:
a) sondajele pot fi efectuate n zile diferite;
b) ntrebrile pot fi formulate diferit i pot induce rspunsuri diferite de la aceeai persoan;
c) pot fi utilizate mrimi diferite ale eantioanelor;
d) pot rezulta eantioane diferite din aceeai populaie;
e) toate de mai sus.
Rezolvare: e)
35. Distribuia de eantioanare a lui

x:

a) este un eantion aleator din toate valorile lui


b) este o distribuie de probabilitate a lui
c) arat relaia dintre

d) arat cum se modific

x;

x;

cnd se modific n;

e) este o distribuie de frecvene a lui .


Rezolvare: b)
36. Care dintre urmtoarele afirmaii nu este adevrat despre un interval de ncredere pentru

a) este o cale de a face o interferen statistic care evit ca cineva s cread c o valoare estimat este
valoarea real;
b) i schimb mrimea dup cum componentele

sau s, z i n i schimb valorile;

x , dar este ateptat s includ ;


i schimb mrimea dup cum x se schimb;

c) se calculeaz pe baza lui


d)

e) toate de mai sus.


Rezolvare: d)
37. Un specialist afirm c persoanele care mnnc cereale la micul dejun vor consuma la masa de prnz, n
medie, mai puine calorii ca aceia care nu mnnc cereale la micul dejun. Pentru a testa aceast afirmaie, au fost

11

selectai aleator 30 de persoane i au fost ntrebate ce mnnc n mod regulat la micul dejun i la masa de prnz. Fiecare
persoan a fost identificat ca un consumator sau nonconsumator de cereale la micul dejun i fiecrei persoane i-au fost
calculate numrul de calorii consumate la masa de prnz.
Rezultatele obinute sunt urmtoarele:
Consumatori de cereale:
640, 605, 529, 591, 596, 564, 615, 560, 635, 623 (calorii)
Nonconsumatori de cereale:
502, 703, 735, 707, 523, 534, 768, 626, 620, 589, 736, 565, 686, 529, 632, 951, 744, 632, 593, 847 (calorii)
Se poate spune cu un nivel de semnificaie de 5% c specialistul are dreptate?
Rezolvare:
Identificarea metodei:
Specialistul trebuie s compare media consumului de calorii pentru populaia consumatorilor de cereale cu cea a
nonconsumatorilor de cereale. Datele sunt cantitative.
Ipoteza care trebuie testat este: H 0: 1= 2 cu alternativa

H1: 1< 2, deoarece trebuie observat dac numrul mediu

al caloriilor consumate de consumatorii de cereale la masa de prnz este mai mic dect al neconsumatorilor de cereale.
Pentru a putea identifica testul ce trebuie aplicat se vor calcula i compara abaterile medii ptratice.
Acestea sunt: s1 = 35,7 i s2 = 115,7.
Deoarece sunt complet diferite va fi aplicat testul t pentru variaii inegale.
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
2. Apsai Tools/Data Analysis i apoi t-Test: Two-Sample Assuming Unequal Variances
3. Specificai variabila 1: A1:A11
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK
Se obin rezultatele:

t-Test: Two-Sample Assuming Unequal Variances

Mean
Variance
Observations
Hypothesized Mean Difference
Df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail

Variable 1
595.8
1273.511
10
0
25
-2.31433
0.014576
1.70814
0.029153
2.059537

Variable 2
661.1
13375.25
20

EXCEL listeaz mediile, dispersiile i dimensiunile eantioanelor. De asemenea listeaz rezultatele statistice legate de
testarea de ipoteze.
Valoarea statisticii t este -2,31433.

12

Valoarea p pentru test unilateral este 0,014576 (pragul de semnificaie = 1 probabilitatea de garantare a rezultatelor).
Valoarea p pentru test bilateral este 0,029153.
EXCEL mai listeaz i valorile critice pentru cele dou cazuri, pentru un nivel de semnificaie de 5%.
Deoarece valoarea p pentru testul unilateral este mic putem spune c aceste date dovedesc c cei care consum
cereale la micul dejun consum mai puine calorii la masa de prnz (se accept ipoteza alternativ, c exist diferene
semnificative), cu o probabilitate de 98,54%.
Rezolvare folosind STATISTICA:
1. Se creaz un fiier cu 2 variabile i 30 de cazuri (File/New data). Se introduc datele astfel:
- prima variabil numrul de calorii consumate la masa de prnz
- a doua variabil consumatori de cereale: 1; nonconsumatori de cereale: 0
2. Selectai modulul Basic Statistics and Tables i apoi t-test for independent samples. Apsai OK.
3. La Variabile selectai:
- Grouping variable: variabila de grupare - consumatori sau nonconsumatori de cereale
- Dependent variables: variabila dependent - numrul de calorii consumate la masa de prnz
4. Introducei:
- Code for Group 1 = 0
- Code for Group 2 = 1
5. Apsai T tests
Se obin rezultatele:

Valoarea statisticii t este t separ. var. est. = 2,31433.


Valoarea p pentru test bilateral este p 2-sided = 0,02915.
Deoarece valoarea p (pragul de semnificaie) pentru testul bilateral este mic putem spune c aceste date dovedesc c
cei care consum cereale la micul dejun, consum mai puine calorii la masa de prnz. Totui, deoarece eantionul este de
mic dimensiune, trebuie s avem n vedere c rezultatele pot fi afectate de erori.
38. Directorul unei companii pentru fabricarea mobilei de birou, crede c productivitatea muncitorilor depinde,
printre altele i de succesiunea operaiilor pe care trebuie s le execute muncitorul. Pentru producerea unui birou
ergonomic sunt considerate dou variante de realizare a acestuia (din punctul de vedere al succesiunii operaiilor). Pentru
a decide care variant este mai bun au fost selectai aleator 25 de muncitori care asamblau biroul n varianta A i 25 de
muncitori pentru varianta B. Au fost nregistrai timpii de asamblare. Directorul dorete s afle dac, pentru un nivel de
semnificaie de 5%, timpii de asamblare n cele 2 variante difer.

13

Timpii de asamblare
Varianta A: 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0; 7,1; 6,1; 5,0; 6,3; 7,0; 6,4; 6,1; 6,6; 7,7; 6,4
(ore)
Varianta B: 5,2; 6,7; 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1; 5,8; 7,0; 5,7; 5,9; 4,9; 5,3; 4,2; 7,1
(ore)

Rezolvare:
Identificarea metodei: Datele sunt cantitative iar obiectivul experimentului este de a compara timpii de asamblare
pentru cele dou populaii. Deci ipoteza care trebuie testat este H0: 1= 2 cu alternativa H1: 1 2.
Pentru a putea identifica testul ce trebuie aplicat se vor calcula i compara abaterile medii ptratice.
Acestea sunt: s1 = 0,921 i s2 = 1,14.
Deoarece ele sunt aproximativ egale va fi aplicat testul t pentru dispersii egale (se poate aplica un test statistic pentru
semnificaia diferenei dintre dispersii vezi Exemplul 4.22).
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Varianta A iar n B1 Varianta B.
2. Apsai Tools/Data Analysis i apoi t-Test: Two-Sample Assuming Equal Variances
3. Specificai variabila 1: A1:A26
4. Specificai variabila 2: B1:B26
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK
Se obin rezultatele:

t-Test: Two-Sample Assuming Equal Variances


Varianta A
Mean
6.288
Variance
0.8477667
Observations
25
Pooled Variance
1.0754167
Hypothesized Mean Difference 0
Df
48
t Stat
0.9273326
P(T<=t) one-tail
0.1791967
t Critical one-tail
1.6772242
P(T<=t) two-tail
0.3583935
t Critical two-tail
2.0106336

Varianta B
6.016
1.30306667
25

Valoarea statisticii este 0,927. Deoarece este un test bilateral, valoarea p este 0,358. Valoarea critic este 2,01. Cum
valoarea statisticii t este mai mic dect valoarea critic, se accept ipoteza nul (mediile nu difer semnificativ). Se
observ c mediile difer semnificativ doar pentru o probabilitate de 64% (adic 1-p).
Rezolvare folosind STATISTICA:
1. Se creaz un fiier cu 2 variabile i 50 de cazuri (File/New data). Se introduc datele astfel:

14

- prima variabil - timpii de asamblare


- a doua variabil - varianta de asamblare: 0 pentru varianta A, 1 pentru varianta B
2. Selectai modulul Basic Statistics and Tables i apoi t-test for independent samples.
3. La Variables selectai:
- Grouping variable: variabila de grupare - varianta de asamblare
- Dependent variables: variabila dependent timpul de asamblare
4. Introducei:
- Code for Group 1 = 0
- Code for Group 2 = 1
5. Apsai T tests
Se obin rezultatele:

Valoarea statisticii testului este t value = 0,93 iar valoarea p = 0,36 .


Deoarece valoarea p este mare, se poate spune c ipoteza H 0 nu poate fi respins. Deci, pentru alegerea variantei de
asamblare, directorul trebuie s aleag alt criteriu. Timpul de asamblare nu difer semnificativ de la o variant la alta.
39. Pentru 20 de maini selectate aleator se instaleaz un tip de anvelope i se msoar numrul de kilometri
parcuri pn la uzura total a acestora. Apoi pe aceleai maini se instaleaz un tip nou de anvelope i se procedeaz
similar cu cazul anterior. Se poate spune c noul tip de anvelope este mai bun ca cel vechi?

Maina
1 2 3 4 5 6 7 8 9 10
Distana parcurs n mii de 57 64 102 62 81 87 61 62 74 62
kilometri cu tipul de anvelope noi
Distana parcurs n mii de 48 50 89 56 78 75 50 49 70 66
kilometri cu tipul de anvelope
vechi
Maina
11 12 13 14 15 16 17 18 19 20
Distana parcurs n mii de 100 90 83 84 86 62 67 40 71 77
kilometri cu tipul de anvelope noi
Distana parcurs n mii de kilo- 98 86 78 90 98 58 58 41 61 82
metri cu tipul de anvelope vechi
Rezolvare:
Identificarea metodei:
Deoarece cele dou tipuri de anvelope sunt instalate pe aceleai maini, vom avea de testat dac mediile a dou
populaii dependente sunt egale.
Datele sunt cantitative iar obiectivul experimentului este de a compara numrul de kilometrii parcuri pentru cele dou
populaii pereche. Deci ipoteza care trebuie testat este H0: 1= 2 cu alternativa H1: 1 2.

15

Rezolvare folosind EXCEL:


1. Introducei datele pe dou coloane
2. Apsai Tools/Data Analysis i apoi t-Test: Paired Two-Sample for Means
3. Specificai variabila 1: A1:A21
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK
Se obin rezultatele:

t-Test: Paired Two Sample for Means


Anvelope noi
Mean
73.6
Variance
242.7789
Observations
20
Pearson Correlation
0.914679
Hypothesized Mean Difference 0
Df
19
t Stat
2.817587
P(T<=t) one-tail
0.005497
t Critical one-tail
1.729131
P(T<=t) two-tail
0.010994
t Critical two-tail
2.093025

Anvelope vechi
69.05
316.3658
20

Valoarea testului este 2,8176. Deoarece este un test bilateral, valoarea p este 0,01. Valoarea critic este 2,09.
Rezolvare folosind STATISTICA:
1. Se creaz un fiier cu 2 variabile i 40 de cazuri (File/New data). Se introduc datele astfel:
- prima variabil distana parcurs
- a doua variabil tipul anvelopelor: 0 pentru anvelope noi, 1 pentru anvelope vechi
2. Selectai modulul Basic Statistics and Tables i apoi t-test for dependent samples.
3. La Variabile selectai:
- Grouping variable: variabila de grupare tipul anvelopelor
- Dependent variables: variabila dependent distana parcurs
4. Introducei:
- Code for Group 1 = 0
- Code for Group 2 = 1
5. Selectai T tests
Se obin rezultatele:

16

Valoarea testului este t = 2,8176. Valoarea p este 0,01. Mediile sunt 73,6 mii de kilometri parcuri cu anvelopele noi i
69,05 mii de kilometri parcuri cu cele vechi.
Deoarece valoarea lui p este mic se respinge ipoteza nul conform creia cele dou medii sunt egale. Deci se poate
spune c anvelopele de tip nou sunt mai bune ca cele de tip vechi.
40.

Folosind datele problemei 36 s se dac dispersiile (variaiile) celor dou populaii sunt egale

Rezolvare:
Identificarea metodei:
Ipotezele sunt:
H0: 12/22=1 cu alternativa H1: 12/221
Expresia testului este:
F= s12/s22
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
2. Apsai Tools/Data Analysis i apoi F-Test Two-Sample for Variances
3. Specificai variabila 1: A1:A26
4. Specificai variabila 2: B1:B26
5. Apsai Labels i apoi OK.
Se obin rezultatele:

F-Test Two-Sample for Variances

Mean
Variance
Observations
df
F
P(F<=f) one-tail
F Critical one-tail

Consumatori
595.8
1273.51
10
9
0.0952
0.00053
0.3392

Nonconsumatori
661.1
13375.25
20
19

Excel calculeaz statistica F ca raportul ntre dispersia cea mai mare i dispersia cea mai mic. Statistica F n cazul
nostru este 0,095 iar valoarea p asociat testului unilateral este 0,00053. Valoarea p corespunztoare testului bilateral
(pragul de semnificaie) este 2 0,00053 = 0,00106. Deoarece aceast valoare este foarte apropiat de zero, ipoteza nul
se respinge, deci cele dou dispersii difer semnificativ. Aadar utilizarea testului t pentru dispersii inegale n problema
36 este justificat.

17

41. O companie de asigurri de via se gndete a oferi discount-uri nefumtorilor. De aceea organizeaz un
sondaj prin care sunt selectate 40 de persoane: 20 fumtoare i 20 nefumtoare. Persoanele sunt ntrebate dac au sau nu
boli cardiovasculare (codificarea este 1- persoan cu afeciuni cardiovasculare; 0 - persoan fr afeciuni
cardiovasculare). Datele obinute sunt:
Fumtori

1 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0

Nefumtori 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1
Se poate spune, cu un nivel de semnificaie de 5% c incidena bolilor cardiovasculare este mai mare la fumtori ca la
nefumtori? Din cercetri anterioare au rezultat urmtoarele dispersii n populaia total: 0,2 pentru fumtori, respectiv
0,15 pentru nefumtori.

Rezolvare:
Identificarea metodei: Datele sunt calitative i alternative iar obiectivul experimentului este de a compara dou
proporii: proporia fumtorilor cu boli cardiovasculare i proporia nefumtorilor cu boli cardiovasculare. Deci ipoteza
care trebuie testat este H0: p1= p2 cu alternativa H1: p1 > p2. Pentru aceasta se va aplica un test z deoarece dispersiile sunt
cunoscute.
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 tastai Fumtori iar n B1 Nefumtori.
2. Apsai Tools/Data Analysis i apoi z-Test: Two-Sample for Means
3. Specificai variabila 1: A1:A21
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels.
6. Introducei varianele (Variable 1 Variance (known): 0,2 i Variable 2 Variance (known): 0,15). Apsai OK.
Se obin rezultatele:

z-Test: Two Sample for Means


Fumtori
Mean
0.25
Known Variance
0.2
Observations
20
Hypothesized Mean Difference 0
z
0.377964
P(Z<=z) one-tail
0.352729
z Critical one-tail
1.644853
P(Z<=z) two-tail
0.705457
z Critical two-tail
1.959961

Nefumtori
0.2
0.15
20

Sunt calculate cele dou proporii: 25% dintre fumtori i 20% dintre nefumtori au o afeciune cardiovascular.
Valoarea statisticii z este 0,378 cu o valoare p de 0,35 (one-tail test unilateral). Deoarece valoarea p nu este apropiat de
zero (p>0,05), ipoteza nul se accept. Pentru un nivel de semnificaie de 5%, cele dou proporii sunt egale, deci, nu se
poate spune c incidena afeciunilor cardiovasculare este mai mare la fumtori ca la nefumtori.
42.

Distribuia unui lot de noi automobile, dup consumul de carburant la 100 km parcuri, se prezint astfel:

18

Intervale de variaie a consumului


(l)
6,2 6,6,
6,6 7,0
7,0 7,4
7,4 7,8
7,8 8,2
8,2 8,6
8,6 9,0
9,0 9,4
9,4 9,8
Total

Nr. automobile
4
12
44
90
107
86
36
15
6
400

S se verifice normalitatea distribuiei utiliznd testul 2.


Rezolvare:
Pentru verificarea normalitii repartiiei empirice se parcurg urmtoarele etape:
a) Se calculeaz x i sx pentru distribuia prezentat n tabel.

x=
s x2

x i ni

ni

3198,8
= 7,997 8 litri
400

)2

x i x ni
ni

143,84
= 0,3596
400

sx = 0,5997 litri
b) Se calculeaz valorile variabilei normale normate pentru limitele superioare ale intervalelor:
zi =

xi sup x

Limita superioar a ultimei grupe se consider +, iar limita inferioar a primului interval se consider -, innd cont
de faptul c distribuia normal tinde ctre 0, asimptotic.
c) Se calculeaz probabilitile (zi), ce reprezint probabilitile ca o valoare z s fie cuprins ntre 0 i zi, innd cont c

( z i ) = ( zi )
d) Probabilitile teoretice ca o valoare s se situeze n intervalul i sunt:
pi = F ( zi sup ) F ( zi 1 sup ) sau pi = ( zi sup ) ( zi 1 sup ) .

Excepie face primul interval, pentru care: p1 = ( z1 sup ) ( 0 ,5 ) = 0 ,5 + ( z1 sup )


i ultimul interval, pentru care: pr = 0 ,5 ( z r 1 sup ) .
Suma probabilitilor de apariie a evenimentelor este 1.
e) Frecvenele teoretice se determin, pe baza probabilitilor teoretice, astfel:
niteor = n pi
2
f) Se calculeaz statistica =

( ni npi ) 2

i =1

npi

2
g) Din tabel rezult: calculat = 3,44 .

19

2
Din tabelele anexe se citete valoarea lui tab
,=0, 05,l =6 =12,5916 , unde l = numrul gradelor de libertate, l = r k

1 = 9 - 2 - 1 = 6.
2
2
Cum calculat
, se accept ipoteza c ntre distribuia empiric i cea teoretic exist concordan.
< tab

Limitele
intervalelor
6,2-6,6
6,6-7,0
7,0-7,4
7,4-7,8
7,8-8,2
8,2-8,6
8,6-9,0
9,0-9,4
9,4-9,8
Total
Limitele
intervalelo
r
6,2-6,6
6,6-7,0
7,0-7,4
7,4-7,8
7,8-8,2
8,2-8,6
8,6-9,0
9,0-9,4
9,4-9,8
Total
43.

zi =

ni

xi

xini

( x i x ) 2 ni

4
12
44
90
107
86
36
15
6
400

6,4
6,8
7,2
7,6
8,0
8,4
8,8
9,2
9,6
-

25,6
81,6
316,8
684,0
856,0
722,4
316,8
138,0
57,6
3198,8

10,24
17,28
28,16
14,40
0
13,76
23,04
21,60
15,36
143,84

xi sup x

(z)

pi

npi

sx

-2,3340
-1,6675
-1,0005
-0,3335
0,3335
1,0005
1,6675
2,3340

( ni npi ) 2
npi

-0,4901
-0,4525
-0,3413
-0,1293
0,1293
0,3413
0,4525
0,4901
0,5000
-

0,0099
0,0376
0,1112
0,2120
0,2586
0,2120
0,1112
0,0376
0,0099
1,00

4
15
44
85
104
85
44
15
4
400

0
0,6
0
0,29
0,09
0,01
1,45
0
1
3,44

Un analist economic studiaz distribuia firmelor dup procentul din venituri cheltuit pentru cercetare-

dezvoltare. Pentru a verifica ipoteza normalitii empirice obinute, el utilizeaz testul 2 i obine, pentru un numr de
2
grade de libertate, l=10, valoarea calc
=18,30 . Probabilitatea maxim cu care se garanteaz rezultatul este:

a) 75%;
b) 90%;
c) 95%;
d) 99%;
e) 97,5%.
Rezolvare: b)

20

ntrebri teoretice i probleme propuse spre rezolvare


1. Managerul unei firme susine, pe baza unei cercetri efectuate asupra a 225 de colete, c greutatea medie a
acestora este de 64 kg,cu o eroare limit de 0,5 kg. n calculul erorii limite s-a utilizat o abatere standard de 3 kg. Care
este probabilitatea ca afirmaia s fie corect? Care este riscul ca afirmaia s fie greit?
2. Rspundei la urmtoarele ntrebri:
a) Care este diferena dintre H0 i H1?
b) Definii fiecare din urmtoarele:
Eroare de tip I;
Eroare de tip II;
;
.
c) Cnd riscai s facei o eroare de tip I? Dar de tip II?
d) n testarea ipotezelor, ce determin mrimea regiunii critice?
3. Pentru fiecare dintre urmtoarele regiuni critice, schiai distribuia lui z i indicai locul regiunii critice (Rc):
a) z > 1,96;
b) z > 1,645
c) z > 2,575
d) z < -1,29
e) z < -1,645 sau z > 1,645
f) z < -2,575 sau z > 2,575.
Pentru fiecare regiune critic, specificai care este probabilitatea ca o eroare de tip I s aib loc, atunci cnd H 0 este
adevrat.
4. Presupunem c suntei interesai n rezolvarea testului:
H0: = 200,
H1: > 200,
i decidei s utilizai urmtoarea regul de decizie: se respinge H 0 dac media a 100 de observaii este mai mare de 212.
a) Exprimai decizia n termeni z.
b) Determinai probabilitatea emiterii erorii de genul I.
5. n 1930 s-a propus utilizarea poligrafului pentru detectarea minciunilor. Pentru a se vedea ct de bine lucreaz,
s-a efectuat urmtoarea cercetare: dac 1000 de persoane sunt testate i 500 de persoane spun adevrul, iar 500 mint,
poligraful a indicat c aproximativ 185 de persoane care au fost identificate ca spunnd adevrul, au minit n realitate, iar
120 de persoane care au fost indicate c au minit, n realitate au spus adevrul. Dac:
H0: spune adevrul,
H1: minte:
a) Care este eroarea de tip I? Dar de tip II?

21

b) Care este probabilitatea comiterii unei erori de tipul I? Dar probabilitatea comiterii unei eroeri de tipul II?
6. Se efectueaz testarea unei ipoteze statistice utiliznd = 0,05 (test unilateral). Pentru care dintre urmtoarele
valori ale lui (z) (corespunztoare valorii calculate a testului) va fi respins ipoteza nul?
a) 0,44;
b) 0,499;
c) 0,40;
d) 0,249;
e) 0,49;
f) 0,458.
7. Pentru fiecare din valorile ( zcalc) i observate, specificai dac ipoteza nul este respins n cazul testului
bilateral:
a) = 0,05; (zcalc) = 0,40;
b) = 0,10; ( zcalc) = 0,45;
c) = 0,01; ( zcalc) = 0,499;
d) = 0,025; ( zcalc) = 0,45;
e) = 0,10; ( zcalc) = 0,05.
8. ntr-un test n care se testeaz ipoteza nul H 0 : = 100 cu H 1 : > 100 se obine valoarea testului z = 2,26.
Aflai pragul de semnificaie corespunztor valorii calculate a testului.
9. Dac se testeaz H 0 : = 100 cu H 1 : 100 i se obine z = 2,08 aflai pragul de semnificaie corespunztor
valorii calculate a testului.
10. Un fabricant de automobile a estimat c un nou tip de maini obine un consum mediu de 11 litri la 100 km,
dar compania care dorea s comercializeze aceste maini pretindea c acest consum depete estimaia productorului.
Pentru a susine afirmaia, compania a selectat 36 de maini i a nregistrat consumul. Au rezultat datele:

x =11,8

litri /

100 km; s = 3,0 litri / 100 km.


a) Dac cei interesai doresc s arate c media consumului este mai mare de 11 litri / 100 km, care este ipoteza nul?
Dar ipoteza alternativ?
b) Efectuai testarea pentru = 0,05.
11. O companie dorete s introduc o nou metod de realizare a unui produs. Se selecteaz 50 de produse pentru
care se nregistreaz timpii de realizare cu vechea metod i 50 de produse pentru noua metod. Rezultatele sunt:
Metoda actual:

Noua metod:

n1 = 50

n2 = 50

x1 = 27,3 minute

x 2 = 25,4 minute

22

s1 = 3,7 minute

s 2 = 3,1 minute

S se arate, utiliznd o probabilitate de 95%, dac rezultatele ofer suficiente informaii pentru a indica faptul c noua
metod duce la un consum de timp semnificativ mai mic.
12. Analiza unui eantion aleator de 49 de observaii a dus la urmtoarele rezultate:

xi x

x =20,7 ;

)2 = 2,155 .

a) Testai ipoteza nul = 0,47 , cu ipoteza alternativ: < 0,47 , utiliznd o probabilitate de 90%.
b) Testai ipoteza nul = 0,47 cu ipoteza alternativ 0,47 utiliznd o probabilitate de 90%.
13.

Un analist financiar presupune c valoarea facturilor emise de firma la care lucreaz este, n medie, de peste

10 mii lei/factur. Pentru a susine aceast ipotez, el selecteaz aleator 48 de facturi emise n ultima lun, pentru care
nregistreaz valorile (mii lei): 10, 2, 12, 8, 12, 8, 9, 10, 11, 9, 9, 10, 10, 9, 10, 10, 11, 9, 8, 9, 6, 10, 7, 10, 9, 13, 9, 10, 11,
10, 9, 9 , 9, 17, 12, 6, 10, 8, 7, 9, 11, 12, 10, 11, 12, 9, 7, 9. S se testeze ipoteza analistului pentru o probabilitate de
garantare a rezultatelor de 99%.
14.

Presupunem c n urma unui sondaj aleator de 100 de observaii, pentru o caracteristic alternativ s-a obinut

media f = 0,63 i dorim s testm ipoteza nul c, n colectivitatea general, media p este 0,7 cu ipoteza alternativ p <
0,7. S se utilizeze un prag de semnificaie = 0,05. S se testeze, pentru acelai prag de semnificaie, ipoteza nul p =
0,7 cu ipoteza alternativ p 0,7.
15.

Un eantion aleator de 50 de persoane a fost testat cu privire la un nou produs de snack-food. Rspunsurile au

fost codificate (0: nu-mi place; 1: mi place) i listate: 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1,


1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1.
a) Utilizai o probabilitate de 90% pentru a estima intervalul n care se va ncadra proporia celor crora le place
produsul, n colectivitatea general.
b) Testai ipoteza nul H0: p = 0,5 cu ipoteza alternativ H 1: p > 0,05, unde p este proporia celor crora le place
produsul, utiliznd o probabilitate de 95%.
16.

Presupunem c ai selectat un eantion aleator de 1600 de persoane dintr-o populaie general ce conine 20%

(p = 0,2) persoane favorabile unei propuneri. Care este probabilitatea ca proporia din eantion (f) s difere de cea din
colectivitatea general (p) cu mai mult de 1%?
17.

Un productor de imprimante pentru calculatoare personale dorete s estimeze media numrului de caractere

tiprite pn cnd se consum cerneala. Costul crescut al unei astfel de anchete impune utilizarea unui eantion de volum
redus. Presupunem c au fost testate n = 15 imprimante i s-au calculat:

x =1,13

milioane caractere, s = 0,27 milioane

caractere.
a) S se testeze cu o probabilitate de 90% intervalul de ncredere pentru numrul mediu de caractere.

23

b) S se testeze ipoteza nul =1,00 milioane, cu ipoteza alternativ >1,00 milioane caractere, utiliznd o
probabilitate de 95%, n ipoteza distribuiei normale a numrului de caractere n colectivitatea general.
18.

Valoarea medie a unei locuine aflate n imediata apropiere a unui colegiu este de 58.950 unitati monetare. Se

presupune ca valoarea locuinelor crete cu ct ele sunt situate mai aproape de acest colegiu. Pentru a testa aceast
ipotez, au fost selectate aleatoriu 12 locuine din zona colegiului; n urma evalurii acestora, a rezultat o valoare medie
de 62.460 uniti monetare, cu o abatere medie patratic de 5.200 uniti monetare. Testai aceast ipotez, pentru un nivel
de semnificaie de 5%.
19.

Un reporter se documenteaz pentru un articol privind costurile tot mai ridicate ale educaiei primite n

nvmntul superior. Pentru aceasta, el a luat n considerare variabila costul unui manual n semestrul n curs
(variabila x). n urma considerrii unui eantion de 41 de manuale, el a gsit c:

( x

= 550,22 u.m.;

=1617,984 . Se cere:

a) gsii media i abaterea medie ptratic a costului unui manual n semestrul n curs, la nivelul eantionului considerat;
b) testai ipoteza conform creia valoarea medie a unui manual este mai mic de 15 u.m., pentru un nivel de semnificaie
de 1%.
20. Pentru a estima proporia cetenilor care sunt de acord cu un program social susinut de Guvern, s-a considerat
un eantion aleatoriu de 1000 de persoane. Daca 545 au rspuns c sunt n favoarea programului, exist suficiente
informaii pentru a respinge afirmaia Guvernului, precum c programul su social se bucur de susinerea majoritii
cetenilor? (=0,05).
21.

Un politician susine c la viitoarele alegeri va primi 60% dintre voturile cetenilor. n urma selectrii unui

eantion aleatoriu de 100 de persoane, a rezultat c 50 dintre acestea ar vota cu politicianul respectiv la viitoarele alegeri.
Poate fi considerat adevarat afirmaia politicianului, pentru un nivel de semnificaie de 5%?
22.

Gradul de poluare a aerului se poate determina prin msurarea mai multor elemente, printre care i nivelul

monoxidului de carbon existent n atmosfer. Un ecologist vrea s arate c oraul X are un grad ridicat de poluare a
aerului, ilustrat printr-un nivel mediu al monoxidului de carbon mai mare de 4,9. Pentru a verifica aceast afirmaie, au
fost nregistrate nivelurile monoxidului de carbon din 12 zile consecutive, valorile gsite fiind urmtoarele:
Ziua
CO

1
3,5

2
3,9

3
2,8

4
3,1

5
3,1

6
3,4

7
4,8

8
3,2

9
2,5

10
3,5

11
4,4

12
3,1

a) calculai media i abaterea medie ptratic a nivelului de CO din aer, pentru cele 12 zile;
b) exist suficiente dovezi pentru a respinge ipoteza ecologistului?
23.

Un post de radio promoveaz un grup muzical aflat n mare vog. n trecut, 60% dintre asculttorii postului de

radio declaraser c le-au plcut grupurile muzicale promovate de acest post. Dintr-un eantion de 200 de asculttori, 102
au declarat c le place grupul recent promovat. Pentru un nivel de semnificaie de 0,05 testai ipoteza conform creia nu
exist diferene semnificative ntre preferinele asculttorilor din trecut i prezent.

24

24.

ntr-o livad de cirei, recolta medie a fost de 4,35 tone/arie. A fost ns testat un nou fertilizator chimic, pe 15

arii selectate aleator din livad i au fost nregistrate urmtoarele recolte:

3,56
4,79

5,00
4,45

4,88
5,35

4,93
4,81

3,92

4,25
5,12
3,48
4,45

5,13
4,72

Pentru un nivel de semnificaie de 5%, avem suficiente dovezi pentru a concluziona c n urma aplicrii fertilizantului s-a
obinut o cretere semnificativ a recoltei?
25.

Pentru dou eantioane de studeni, unul de fete i altul de biei, a fost nregistrat nlimea persoanelor care

au participat la un program sportiv (xi) i s-au obinut urmtoarele rezultate:


Eantion

Nr. studeni

Suma greutilor (xi) (inch)

Femei
Brbai

30
40

1952
2757

( x

74,2
284,3

Ofer aceste date suficiente informaii pentru a respinge ipoteza conform creia nlimea medie a unui student participant
la programul sportiv este cu cel mult 2,5 inch mai mare dect cea a unei studente? (nivel de semnificaie de 2%).
26.

Pentru analiza preurilor de vnzare a apartamentelor aflate n 2 cartiere ale unui ora, au fost selectate aleator

18 apartamente din primul cartier i 18 apartamente din cel de-al doilea cartier, de la care s-au nregistrat preurile de
vnzare. n urma prelucrrii datelor, a rezultat c un apartament din primul cartier are un pre mediu de vnzare de 15000
uniti monetare, cu o dispersie de 2400, iar un apartament din cel de-al doilea cartier are un pre mediu de vnzare de
16000 unit. monetare, cu o abatere medie ptratic de 69,282 unit.monetare. Se poate accepta ipoteza c exist o diferen
semnificativ ntre preul mediu de vnzare al apartamentelor din cele dou cartiere? (nivel de semnificaie 5%).
27.

Managerul unui restaurant dorete s determine dac o companie publicitar a mrit semnificativ media

ncasrilor zilnice. El culege date privitoare la 50 de zile naintea campaniei i la 30 de zile dup ncheierea campaniei
publicitare. Rezultatele pentru cele dou perioade sunt:
naintea campaniei

Dup campanie

n1 = 50

n2 = 50

x1 = 22,55 mil. lei

x 2 = 33,30 mil. lei

s x1 = 2,15 mil. lei

s x 2 = 2,38 mil. lei

Informaiile obinute sunt suficiente pentru a susine ipoteza conform creia mediile ncasrilor difer semnificativ, adic
sunt semnificativ mai mari dup campania publicitar? S se utilizeze o probabilitate de 95%.
28.

20 de oareci de laborator au fost mprii n dou grupuri egale. Fiecare grup a fost hrnit n conformitate cu

una din cele dou diete alimentare prestabilite (A, B). La sfritul a trei sptmni, a fost nregistrat creterea n greutate
a fiecrui oarece:
Dieta A
Dieta B

5
5

14
21

7
16

9
23

11
4

7
16

13
13

14
19

12
9

8
21

Se poate afirma, cu o probabilitate de 95% c dieta B a condus la o cretere medie a greutii semnificativ mai mare dect
dieta A?

25

29.

Un productor de jucrii electronice dorete s verifice dac procentul jucriilor defecte este mai mic de 7%.

Presupunem c sunt selectate aleator 200 de jucarii, fiecare dintre acestea este testat i c sunt gsite 12 jucarii de fecte.
Ofer aceste informaii suficiente dovezi c procentul jucariilor defecte este mai mic de 7%? Utilizai o probabilitate de
99% de garantare a rezultatelor.
30.

7 experi i exprim opiniile privind preul unui produs, n anul viitor. Rezultatele anchetei sunt exprimate de

indicatorii sintetici: x =5,8 mii lei, s = 1,72 mii lei. ( s = xi x


n 1

)2 , deoarece este un eantion de volum redus). Dac

se tie c anul acesta preul mediu a fost de 3,54 mii lei, sunt motive suficiente pentru a susine ipoteza c anul viitor
preul mediu va fi semnificativ mai mare fa de cel de anul acesta? Se va utiliza o proba bilitate de 95% de garantare a
rezultatelor.
31.

Decanul facultii de Marketing dorete s verifice dac procentul de nepromovabilitate dup prima sesiune de

examinare la disciplina statistic este mai mic de 30%. Pentru aceasta sunt selectai aleator 100 dintre studenii care au
susinut examenul de statistic n anul I. Pentru fiecare student se nregistreaz dac a promovat sau nu examenul. S-a
determinat astfel un numr de 24 de studeni care nu au promovat examenul. Ofer aceste informaii suficiente dovezi c
procentul de nepromovabilitate este mai mic de 30%? Utilizai o probabilitate de 99% de garantare a rezultatelor.
32.

Un lot de 200 de sticle de buturi rcoritare este supus unui control de calitate.

Lotul este declarat

necorespunztor dac mai mult de 3% dintre sticle nu respecta compoziia prestabilit de productor. n urma verificrii,
7 sticle sunt gsite ca necorespunztoare. Ofer aceste informaii suficiente dovezi ca ntregul lot s fie declarat
necorespunztor ? Utilizai o probabilitate de 99% de garantare a rezultatelor.

33. Managerul unei firme ce ofer servicii de curierat rapid susine c timpul su mediu de expediere, ntr-un
anumit perimetru, este mai mic de 6 ore. Pentru verificarea acestei afirmaii, a fost considerat un eantion aleator de 10
expedieri ale unor pachete, pentru care s-au nregistrat timpii necesari pentru expedierea acestora la destinatie (ore): 7; 3;
4; 6; 10; 5; 6; 4; 3; 8. Exista suficiente dovezi pentru a susine afirmaia managerului, pentru un nivel de semnificaie de
5% (tcritic= 1,833)?

34.

Un productor de anvelope susine c mai mult de 90% din anvelopele produse de el rezist la cel puin 50.000

km. n urma selectrii i testrii unui eantion aleatoriu de 200 de anvelope, 10 anvelope s-au uzat nainte de parcurgerea
distanei de 50.000 km. Exist suficiente informaii pentru a afirma c productorul are dreptate ? (zcritic = 1,645, pentru o
probabilitate de 95%).

35. O companie producatoare de hrana pentru bebelui susine c noul su produs este superior fa de cel al
principalului su concurent, prin aceea c bebeluii care consum acest produs ctig mai repede i mai mult n greutate.
Pentru a verifica aceasta afirmaie, au fost selectai aleator 10 bebelui; timp de 2 luni, 5 bebelui au fost hrnii cu

26

produsul creat de compania productoare, iar ceilali 5 bebelui cu produsul creat de firma concurent. Surplusul de
greutate (zeci grame) ctigat de bebelui n urma consumrii celor dou produse a fost:

Produsul companiei
Produsul concurentului

85
91

102
68

79
85

105
82

113
76

Putem concluziona, cu o probabilitate de 95%, c bebeluii hrnii cu produsul companiei au luat mai mult n greutate
dect cei hranii cu produsul concurentului? (tcritic= 2,306)

36. Managerul unui lan de magazine alimentare dorete s-i deschid un nou magazin. Pentru alegerea zonei de
amplasare a acestuia, el ia n considerare, printre ali factori, mrimea veniturilor gospodriilor din zona respectiv.
Pentru a alege ntre dou zone, A i B, sunt considerate aleator dou eantioane de cte 100 de gospodrii n fiecare zon.

Zona A
29980
4740

Venitul mediu anual al unei gospodrii (u.m)


Abaterea medie ptratic a veniturilor (u.m.)

Zona B
28650
5365

Se poate concluziona, pentru un nivel de semnificaie de 5%, pe baza datelor existente, c venitul mediu anual al unei
gospodrii din zona A este superior celui din zona B? Se presupune c veniturile sunt normal distribuite (zcritic= 1,645).
37.

Ce reprezint ipoteza nul ntr-un proces de testare de ipoteze statistice?

38.

Ce reprezint ipoteza alternativ ntr-un proces de testare de ipoteze statistice?

39.

Ce reprezint testul sau criteriul de semnificaie?

40.

Ce reprezint regiunea critic?

41.

Cnd comitem o eroare de genul nti?

42.

Cnd comitem o eroare de genul al doilea?

43.

Ce reprezint i ?

44.

Care sunt paii n construirea unui test statistic?

45.

Cum se testeaz ipoteza privind media unei colectiviti generale n cazul eantioanelor mari?

46.

Cum se testeaz ipoteza privind media unei colectiviti generale n cazul eantioanelor de volum redus?

47.

Cum se testeaz ipoteza privind diferena dintre mediile a dou colectiviti generale, n cazul eantioanelor

48.

Cum se testeaz ipoteza privind diferena dintre mediile a dou colectiviti generale, n cazul eantioanelor de

mari?

volum redus?

27

ELEMENTE DE ANALIZ DISPERSIONAL (ANOVA)


ntrebri teoretice i probleme rezolvate
1. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor angajai de a
promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20 de companii productoare
de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a unui salariat n firm pn la prima promovare
a acestuia. Firmele au fost grupate dup mrime, iar datele nregistrate sunt:
Mrimea firmelor
Mici
Medii
Mari

Numr de sptmni de la angajare pn la prima promovare


30; 26; 30; 32; 38; 24; 32; 28;
34; 32; 25; 36; 33
47; 41; 43; 48; 40; 49; 40.

Se cere s se determine, folosind testul F de analiz dispersional, dac variaia timpului scurs pn la prima promovare
este influenat semnificativ de mrimea firmei?
Rezolvare:
Notm cu X caracteristica mrimea firmelor factorul de grupare i cu Y caracteristica numr de
sptmni de la angajare pn la prima promovare.
Se formuleaz urmtoarele ipoteze:
H0: 1 = 2 = 3
H1: i j , i j
Unde i reprezint timpul mediu de promovare pentru firma din grupa i, la nivelul colectivitii generale.
Calculm, la nivelul eantionului, mediile pentru fiecare grup i ( yi ), cu

i =1,3 ,

unde i reprezint grupa

(mrimea firmei):
8

y
j =1

y1 =

1j

n1

30 + 26 + 30 + 38 + 32 + 24 + 32 + 28
sptmni;
= 30,00
8

34 + 32 + 25 + 36 + 33
sptmni;
= 32
5

47 + 41 + 43 + 48 + 40 + 49 + 40
sptmni.
= 44
7

y
j =1

y2 =

2j

n2
7

y
j =1

y3 =

n3

3j

Numrul mediu de sptmni pentru ntreaga colectivitate de 20 de firme poate fi calculat ca medie a mediilor
pariale:

y=

y n
n
i

30 8 + 32 5 + 44 7
= 35,4 sptmni.
20

Determinm dispersia fiecrei grupe i ( si2 ):

28

(y
8

1j

j =1

s =
2
1

y1

2
2
2
2
(
26 30 ) + ( 32 30 ) + ( 38 30 )
=

n1

2
2
2
(
24 30 ) + ( 32 30) + ( 28 30)
+

(y
5

s 22 =

j =1

2j

y2

s =
2
3

j =1

3j

128
= 16
8

( 34 32) 2 + ( 25 32) 2 + ( 36 32) 2 + ( 33 32) 2

n2

(y

y3

70
= 14
5

n3

2
2
2
(
47 44 ) + ( 41 44 ) + ( 43 44 )
=

2
2
2
(
48 44) + 2( 40 44 ) + ( 49 44 )
+

92
= 13,14
7

Variana sistematic va fi:


r

S1 = y i y ni =( 30 35,4 ) 8 + ( 32 35,4 ) 5 +
i =1

+ ( 44 35,4 ) 7 = 808,8
2

Variana rezidual este:


r

ni

S 2 = y ij y i
i =1 j =1

) = s
2

i =1

2
i

ni = 128 + 70 + 92 = 290

Dispersia corectat sistematic este:

s12 =

S1
808,8
=
= 404,4
r 1
2

Dispersia corectat rezidual este:

s 22 =

S2
290
=
= 17,06
nr
17

Testul F:

s12 404,4
F= 2 =
= 23,7
s 2 17,06
Ftabelar=Fcritic=F,r-1,n-r=F0,05;2;17=3,59
Cum Fcalculat>Fcritic, rezult c se respinge ipoteza nul, acceptndu-se ca adevrat ipoteza alternativ. Timpul mediu
de promovare pe fiecare tip de firm difer semnificativ, n consecin se poate afirma, cu o probabilitate de 95% c
mrimea firmei influeneaz semnificativ variaia timpului de promovare a tinerilor.

11. n vederea fundamentrii deciziei de nlocuire a unor utilaje din dotarea unei fabrici, managerul acesteia
solicit o analiz a vechimii utilajelor i a costului de ntreinere anual al acestora. Astfel cele 110 utilaje din dotarea
fabricii sunt grupate dup vechime (ani) i dup costul de ntreinere (mii lei):
Costul de ntreinere (mii lei)

29

Total

Vechime
(ani)
Mic (<5 ani)
Medie (5-10 ani)
Mare (>10 ani)
Total

57

79

9 11

11 13

10
10

8
15
2
25

5
20
25
50

7
18
52

23
42
45
110

Se cere s se determine dac influena vechimii asupra variaiei costului de ntreinere este semnificativ, utiliznd
testul F de analiz dispersional.
Rezolvare:
Notm cu X caracteristica vechime factorul de grupare i cu Y caracteristica costul de ntreinere.
n vederea calculrii indicatorilor necesari determinrii statisticii F datele vor fi sistematizate pentru fiecare categorie
de vechime conform tabelelor de mai jos.
i = 1 (grupa vechime mic).
Cost de ntreinere
(mii RON)
57
79
9 11
11-13
Total

y1 =

y n
n
j

1j

1j

n1j

yj

yjn1j

10
8
5

6
8
10
12
-

60
64
50

23

y j y1

( y j y1 )2 n1 j

-1,56
0,44
2,44

24,336
1,549
29,768

174

( y y ) n
n

55,653

174
= 7 ,56 mii RON ;
23

s12 =

1j

1j

55,653
= 2,42
23

i = 2 (grupa vechime medie).


Cost de ntreinere
(mii RON)
57
79
9 11
11-13
Total

y2

y n
=
n
j

2j

2j

n2j

yj

yjn2j

y j y2

( y j y 2 )2 n2 j

15
20
7
42

6
8
10
12
-

120
200
84
404

-1,62
0,38
2,38
-

39,366
2,888
39,6508
81,9048

y y 2 n2 j 81,9048
404
=
= 9 ,62 mii RON ; s22 = j
=
= 1,95
42
42
n2 j
2

i = 3 (grupa vechime mare)

y3 =

y n
n
j

Cost de ntreinere
(mii RON)
57
79
9 11
11-13
Total
3j

3j

n3j

yj

yjn3j

y j y3

( y j y 3 )2 n3 j

2
25
18
45

6
8
10
12
-

16
250
216
482

-2,7
-0,7
1,3
-

14,58
12,25
30,42
57,25

482
y y 3 n3 j 57 ,25
= 10 ,7 mii RON ; s32 = j
=
= 1,27
45
45
n3 j

Media dispersiilor grupelor va fi:


Variana rezidual este:

30

ni

S 2 = yij y i
i =1 j =1

) = s
2

i =1

2
i

ni = 2 ,42 23 +1,95 42 +1,27 45 = 194 ,7

Costul mediu de ntreinere pentru ntreaga colectivitate de 110 de utilaje poate fi calculat ca medie a mediilor
pariale:

y=

y n
n

7 ,56 23 + 9 ,62 42 + 10 ,7 45
= 9 ,64 mii RON.
110

Variana sistematic va fi:


r

S1 = y i y ni =( 7 ,56 9,64 ) 23 + ( 9 ,62 9 ,64) 42 + (10 ,7 9 ,64 ) 45 = 150 ,15


i =1

Dispersia corectat sistematic este:

s12 =

S1
150 ,15
=
= 75,075
r 1
2

Dispersia corectat rezidual este:

s 22 =

S2
194 ,7
=
= 1,82
nr
107

Testul F:

s12 75,075
F= 2 =
= 41,25
s2
1,82
Ftabelar=Fcritic=F;,r-1,n-r=F0,05;2;107=3,07
Cum Fcalculat>Fcritic, rezult c se respinge ipoteza nul, acceptndu-se ca adevrat ipoteza alternativ. n consecin
se poate afirma, cu o probabilitate de 95% c vechimea utilajelor influeneaz semnificativ variaia costului de ntreinere.

3.

Se cunosc datele:

Grupe de salariai dup durata medie a


zilei de lucru (ore)
7 7,2
7,2 7,4
7,4 7,6
7,6 7,8
7,8 i peste
Total

Salariul mediu
(unit. monetare)
9,2
10,4
11,6
11,8
12,0
-

Nr. de salariai
100
120
180
140
130
670

Coeficientul de variaie pe grup


(%)
6,52
10,58
12,07
10,17
7,50
-

S se arate dac durata medie a zilei de lucru influeneaz semnificativ variaia salariului, folosind testul F de analiz
dispersional
Rezolvare:
Se noteaz cu X - durata zilei de lucru (factorul de grupare), respectiv cu Y - salariul
Din vi =

s yi
yi

100 se determin abaterile medii ptratice pe grupe:

31

s yi =

vi y i
100

Grupe de salariai dup durata medie


a zilei de lucru (ore)
7 7,2
7,2 7,4
7,4 7,6
7,6 7,8
7,8 i peste
Total

s yi

s2
y

s2
n
y i

y i ni

0,6
1,1
1,4
1,2
0,9
-

0,36
1,21
1,96
1,44
0,81
-

36
145,2
352,8
201,6
105,3
840,9

920
1248
2088
1652
1560
7468

( y i y ) 2 ni
380,25
67,50
36,45
59,15
93,92
637,27

Media dispersiilor de grup este:


s

s 2y n i
i

ni

840,9
= 1,255
670

Pentru determinarea dispersiei dintre grupe, calculm:

y=

y i ni 7468
=
= 11,15 u.m.;
670
ni

Dispersia dintre grupe:

( y y ) n
=
n
2

637 ,27
= 0 ,951 ;
670

Variana total este:

S = y j y

= S1 + S 2 =1478 ,1

Variana factorial:

S1 = y i y

)2 ni = 2 n = 637,2 ;

Variana rezidual:

S 2 = y j y i

)2 = s 2 n =840,9 ;

Dispersiile corectate vor fi:

s12 =

S1
637,2
=
= 159,3 ;
r 1
4

s 22 =

S2
840,9
=
= 1,265 ;
nr
665

s 2 159,3
Fcalc = 1 =
= 125,9 > Ftab = F =0,05;4;665 = 2,45 .
s 22 1,265

Cum Fcalc > Ftab , rezult c influena duratei medii a zilei de lucru asupra salariului este semnificativ.
4.

Un productor de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are urmtoarele

avantaje fa de vechiul produs: este mai practic de utilizat, are o calitate cel puin la fel de bun i cost semnificativ mai
mic.

32

Pentru a decide pe care dintre cele trei avantaje s-i axeze strategia de marketing, directorul acestui departament a
realizat un studiu n trei orae. n oraul A campania de publicitate s-a axat pe uurina de utilizare a noului produs. n
oraul B campania de publicitate s-a axat pe calitatea noului produs. n oraul C campania de publicitate s-a axat pe preul
mai mic al noului produs. n toate cele 3 orae s-a nregistrat numrul de buci vndute n 20 de sptmni.
Directorul de marketing ar dori s tie dac exist diferene semnificative ntre numrul de buci vndute, n medie
pe sptmn, n cele trei orae dup terminarea campaniei de publicitate.
Uurina
folosirii:

529
498

658
663

793
604

514
495

663
485

719
557

711
353

606
557

461
542

529
614

Calitate:

804
492

630
719

774
787

717
699

679
572

604
523

620
584

697
634

706
580

615
624

Pre:

672
691

531
733

443
698

596
776

602
561

502
572

659
469

689
581

675
679

512
532

Identificarea metodei: Datele sunt cantitative i problema revine la a compara mediile celor trei populaii. Ipotezele
ce trebuie testate sunt: H0: 1 = 2 = 3 cu alternativa H1: cel puin dou medii sunt diferite.
Pentru aceasta se aplic o analiz de varian cu un singur factor.
Rezolvare folosind EXCEL:
1. Introducei datele astfel:

n A1 tastai Uurina folosirii, n B1 tastai Calitate, n C1 tastai Pre

datele se introduc pe coloane.

2. Apsai Tools-Data Analysis i ANOVA: Single Factor.


3. La Input Range selectai datele (sau scriei A1:C21). Selectai Labels in First Row.
4. Specificai Grouped by Columns. Apsai OK.
Se obin rezultatele:
Anova: Single Factor
SUMMARY
Groups
Uurina folosirii
Calitate
Pre

Count
20
20
20

Sum
11551
13060
12173

ANOVA
Source of Variation
Between Groups
Within Groups

SS
57512.23
506983.5

df
2
57

Total

564495.7

59

Average
577.55
653
608.65

MS
28756.12
8894.447

Variance
10775
7238.11
8670.24

F
3.233

n tabelul SUMMARY sunt trecute datele referitoare la cele trei populaii:


-

numrul de uniti din fiecare populaie: 20 de sptmni

numrul total de buci vndute n aceast perioad pentru fiecare populaie

numrul mediu de buci vndute n fiecare sptmn pentru fiecare populaie

dispersia populaiilor

33

P-value
0.047

F crit
3.159

Din aceste date observm c cea mai mare vnzare medie a fost n Oraul B n care publicitatea a avut ca argument
principal calitatea superioar a noului produs.
Cea mai mic medie i cea mai mare dispersie (mprtiere a datelor) s-a nregistrat n Oraul A unde publicitatea a
pus accent pe uurina folosirii noului produs.
n tabelul ANOVA este calculat Statistica F = 3,233 cu o valoare p egal cu 0,047 (pragul de semnificaie). Aceast
valoare p ne permite s spunem c cel puin dou medii difer semnificativ (cu o probabilitate de 95%), ceea ce nsemn
c tactica aleas pentru promovarea produsului influeneaz valoarea vnzrilor.
Rezolvare folosind STATISTICA:
1. Creai un fiier cu dou variabile i 60 de cazuri folosind New File.
n acest fiier, pe prima coloan introducei valoarea vnzrilor astfel: valorile pentru Uurina folosirii, apoi pentru
Calitate i ultimele pentru Pre. Pe a doua coloan se introduc coduri pentru cele trei categorii de date: pentru
primele 20 de uniti se introduce valoarea 1, pentru urmtoarele 20 valoarea 2 i pentru ultimele 20 valoarea 3.
2. Selectai modulul ANOVA/MANOVA. Se va deschide o fereastr General ANOVA/MANOVA.
3. n aceast fereastr apsai Variables. La Independent Variables selectai variabila a 2-a (codurile) iar la
Dependent Variable selectai prima variabil (valoarea vnzrilor). Apsai OK.
4. Apsai pe butonul Codes for between-groups factors. Apsai ALL i OK.
5. Apsai OK. Se va deschide o fereastr ANOVA Results.
6. Dac apsai pe butonul All Effects va fi calculat statistica F i valoarea p.

Statistica F este 3,233 cu o valoare p egal cu 0,047.


Aceast valoare p ne permite s spunem c cel puin dou medii difer, ceea ce nsemn c tactica aleas pentru
promovarea produsului influeneaz valoarea vnzrilor.
Dac dorim n plus informaii referitoare la medii i dispersii pe grupuri, n fereastra ANOVA Results se apas
butonul Descriptive Statistics & Graphs. Pentru calculul mediilor se apas butonul Means & no. of cases for each
group iar pentru calculul abaterilor standard se apas butonul Standard deviations for each group.
Tot n aceast fereastr este posibil i selectarea anumitor opiuni pentru testarea ipotezelor de fundamentare ale
ANOVA.
5.

Managerul unui post de radio local de muzic hard rock, dorete s tie dac asculttorii postului su de radio

ascult muzic mai mult n unele zile ale sptmnii dect n altele. Deoarece marea majoritate a asculttorilor postului
su de radio sunt tineri, a organizat un sondaj printre acetia. Au fost selectai 20 de tineri i au fost rugai s noteze zilnic
cte minute ascult postul de radio, ntr-o sptmn.
Exist vreo diferen semnificativ ntre zilele sptmnii privind numrul de minute n care tinerii ascult postul
de radio?

34

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.

Luni
65
90
30
72
70
90
43
88
96
60
75
74
49
76
66
30
53
76
59
40

Mari
40
85
30
52
88
51
72
89
60
92
79
46
92
98
64
53
90
68
51
30

Miercuri
32
75
20
66
47
103
66
82
80
72
79
72
64
96
57
85
47
78
94
45

Joi
48
90
25
100
73
41
39
95
106
45
78
46
69
77
55
53
111
74
103
40

Vineri
60
78
30
77
78
57
57
68
57
72
91
74
62
61
29
103
102
63
94
46

Smbt
75
120
60
66
67
69
90
105
81
77
60
55
87
84
72
111
76
68
85
60

Duminic
110
100
70
94
78
87
73
125
80
90
112
84
81
82
60
55
91
99
83
64

Identificarea metodei: Datele sunt cantitative i problema revine la a compara cele 7 populaii: numrul de minute n
care tinerii ascult postul de radio n fiecare zi a sptmnii.
Ipotezele ce trebuie testate sunt: H0: 1 = 2 =...= 7 cu alternativa H1: cel puin dou medii sunt diferite. Populaiile
sunt dependente deoarece sunt ntrebai 20 de tineri despre numrul de minute n care ascult postul de radio dar pe zile
ale sptmnii. Aceste medii pe zilele sptmnii sunt comparate.
Pentru aceasta se aplic o analiz de varian cu doi factori fr interaciune.
Rezolvare folosind EXCEL:
1. Introducei datele ca n tabelul de mai sus ncepnd din celula A1.
2. Apsai Tools-Data Analysis i ANOVA: Two-Factor Without Replication.
3. La Input Range selectai datele (sau scriei B2:H21). Apsai OK.
Se obin rezultatele:
ANOVA
Source of Variation
Rows
Columns
Error

SS
24872.82
7107.671
32958.33

df
19
6
114

Total

64938.82

139

MS
1309.096
1184.612
289.1081

F
4.528
4.097

P-value
1.58E-07
0.0009

F crit
1.678
2.179

n plus la rezultate mai sunt afiate i informaii referitoare la linii i coloane: numrul de observaii, numrul de
minute ascultate n total, media i variana (dispersia).
Valoarea statisticii F referitoare la testarea mediilor pe zile ale sptmnii, adic pe coloane, este 4,097 cu o
valoare p de 0,0009. Deoarece valoarea p este foarte apropiat de zero se poate spune tinerii nu ascult acelai numr de
minute postul de radio n fiecare zi a sptmnii.
Din tabelul urmtor (SUMMARY) se poate observa c tinerii ascult mai mult postul de radio smbta i
duminica dect n restul sptmnii (mediile sunt mult mai mari ca n restul sptmnii).

35

SUMMARY
Column 1
Column 2
Column 3
Column 4
Column 5
Column 6
Column 7

Count
20
20
20
20
20
20
20

Sum
1302
1330
1360
1368
1359
1568
1718

Average
65.1
66.5
68
68.4
67.95
78.4
85.9

Variance
381.9895
476.4737
461.6842
684.4632
416.05
310.2526
312.8316

n tabelul ANOVA mai este calculat i valoarea statisticii F referitoare la diferena ntre tineri. Statistica F este
4,53 cu o valoare p foarte apropiat de zero ceea ce nseamn c exist diferene semnificative i ntre tineri.
Rezolvare folosind STATISTICA:
1. Creai un fiier cu 7 variabile i 20 de cazuri folosind New File i introducei datele ca n tabelul din enunul
problemei: pe prima coloan datele referitoare la ziua de luni, n coloana a doua datele referitoare la ziua de mari
i aa mai departe.
2. Selectai modulul ANOVA/MANOVA. Se va deschide o fereastr General ANOVA/MANOVA.
3. n aceast fereastr apsai Variables. La Independent Variables nu selectai nimic iar la Dependent Variable
selectai toate cele 7 variabile. Apsai OK.
4. Apsai pe butonul Repeated measures (within SS) design. La No. of levels pe prima linie tastai 7 iar la
Factor Name, tot pe prima linie tastai zi. Apsai OK.
5. Apsai OK. Se va deschide o fereastr ANOVA Results.
6. Dac apsai pe butonul All Effects va fi calculat statistica F i valoarea p.
Se obin rezultatele:

Valoarea statisticii F este 4,097 cu o valoare p de 0,000925. Deoarece valoarea p este foarte apropiat de zero se
poate spune tinerii nu ascult acelai numr de minute postul de radio n fiecare zi a sptmnii.
Dac dorim n plus informaii referitoare la medii, dispersii pe grupuri n fereastra ANOVA Results se apas
butonul Descriptive Statistics & Graphs. Pentru calculul mediilor se apas butonul Means & no. of cases for each
group iar pentru calculul abaterilor standard se apas butonul Standard deviations for each group.
Tot n aceast fereastr este posibil i selectarea anumitor opiuni pentru testarea ipotezelor de fundamentare ale
ANOVA.
6.

n problema 4, considerm c pe lng tipurile diferite de marketing avem i 2 posibiliti de publicitate: prin

ziare i televiziune. De ceea experimentul s-a repetat n urmtorul fel. S-au selectat 6 orae. n oraul A s-a fcut
publicitate prin televiziune, strategia de marketing fiind: uurina folosirii noului produs. n oraul B publicitatea s-a

36

fcut prin ziare, strategia de marketing rmnnd aceeai. n oraele C i D strategia de marketing a fost calitatea
superioar a noului produs, n C publicitatea fiind fcut prin televiziune iar n D prin ziare. n oraele E i F strategia de
marketig a fost preul sczut al noului produs, n E publicitatea fiind fcut prin televiziune, iar n F prin ziare.
Vnzrile au fost nregistrate pe parcursul a 10 sptmni.
Ce se poate spune despre strategia de marketing i modul de publicitate: influeneaz sau nu vnzrile?
Oraul A
491
712
558
447
479
624
546
444
582
672

Oraul B
464
559
759
557
528
670
534
657
557
474

Oraul C
677
627
590
632
683
760
690
548
579
644

Oraul D
689
650
704
652
576
836
628
798
497
841

Oraul E
575
614
706
484
478
650
583
536
579
795

Oraul F
803
584
525
498
812
565
708
546
616
587

Rezolvare:
Identificarea metodei: Observm c avem 6 tratamente. Fiecare tratament este definit prin intermediul a doi factori.
Primul factor este strategia de marketing cu 3 nivele i al doilea este modul de publicitate cu 2 nivele. Deoarece cei doi
factori pot interaciona ntre ei se va aplica o analiz de varian cu doi factori cu interaciune ntre acetia.
Rezolvare folosind EXCEL:
1. Introducei datele ca n tabelul 5.20, ncepnd din celula A1.
2. Apsai Tools-Data Analysis i ANOVA: Two-Factor With Replication.
3. La Input Range selectai datele (sau scriei A1:D21).
4. La Rows per sample tastai numrul de observaii pentru fiecare tratament (10). Apsai OK.

lul 250
Nivel 1

Nivel 2

Nivel 1
491
712
558
447
479
624
546
444
582
672
464
559
759
557
528
670
534
657
557
474

Nivel 2
677
627
590
632
683
760
690
548
579
644
689
650
704
652
576
836
628
798
497
841

Se obin rezultatele:

37

Nivel 3
575
614
706
484
478
650
583
536
579
795
803
584
525
498
812
565
708
546
616
587

ANOVA
Source
of
Variation
Sample
Columns
Interaction
Within
Total

SS

df

MS

P-value

F crit

13172.017
98838.633
1609.633
501136.7

1
2
2
54

13172.017
49419.317
804.817
9280.309

1.419
5.325
0.087

0.239
0.008
0.917

4.019
3.168
3.168

614756.98

59

n tabelul ANOVA sunt calculate statisticile F i valorile p pentru influena factorului 1 strategie de marketing la
Columns, pentru influena factorului 2 modalitate de publicitate la Sample i pentru interaciunea dintre cei doi factori
la Interaction.
Astfel:
- Statistica F pentru strategia de marketing este 5,325 cu o valoare p de 0,008, deci acest factor influenez valoarea
vnzrilor;
- Statistica F pentru modalitatea de publicitate este 1,419 cu o valoare p de 0,239, deci acest factor nu influenez
semnificativ valoarea vnzrilor;
- Statistica F pentru interaciunea dintre cei doi factori este 0,087 cu o valoare p de 0,917, deci interaciunea dintre cei
doi factori nu influeneaz semnificativ valoarea vnzrilor.
Rezolvare folosind STATISTICA:
1. Creai un fiier cu 4 variabile i 20 de cazuri (File/New data) Introducei datele astfel: primele 3 variabile sunt
coloanele Nivel 1, Nivel 2, Nivel 3 din tabelul 5.20; variabila a 4-a are n primele 10 de rnduri, 1 (nivelul 1
pentru factorul 2) i n urmtoarele 10 rnduri, 2 (nivelul 2 al factorului 2)
2. Selectai modulul ANOVA/MANOVA. Se va deschide fereastra General ANOVA/MANOVA.
3. n aceast fereastr apsai Variables. La Independent Variables selectai variabila a 4-a iar la Dependent
Variable selectai primele 3 variabile. Apsai OK.
4. Apsai pe butonul Repeated measures (within SS) design. La No. of levels pe prima linie tastai 3 iar la
Factor Name, tot pe prima linie tastai factor 1. Apsai OK.
5. Apsai OK. Se va deschide o fereastr ANOVA Results.
6. Dac apsai pe butonul All Effects vor fi calculate statisticile F i valoarile p asociate.
Se obin rezultatele:

Sunt calculate statisticile F i valorile p pentru influena factorului 1 strategie de marketing la Effect 2, pentru
influena factorului 2 modalitate de publicitate la Effect 1 i pentru interaciunea dintre cei doi factori la Effect 12.
Astfel:

38

- Statistica F pentru strategia de marketing este 5,278 cu o valoare p de 0,0097, deci acest factor influenez valoarea
vnzrilor;
- Statistica F pentru modalitatea de publicitate este 1,44 cu o valoare p de 0,245, deci acest factor nu influenez
semnificativ valoarea vnzrilor;
- Statistica F pentru interaciunea dintre cei doi factori este 0,086 cu o valoare p de 0,918, deci interaciunea dintre cei
doi factori nu influenez semnificativ valoarea vnzrilor.
Se observ ca aceste valori difer puin de cele obinute prin Excel. Diferenele provin din rotunjirile fcute de
calculator.

39

ntrebri teoretice i probleme propuse spre rezolvare


1. Pentru a ntocmi o situaie asupra cheltuielilor efectuate de ceteni cu ntreinerea apartamentelor n luna
decembrie a anului 2005, se nregistreaz numrul de camere i cheltuielile cu ntreinerea pentru 250 de apartamente.
Datele grupate se prezint astfel:
Grupe de apartamente dup nr.
camerelor
Garsoniere
2 camere
3 camere
4 i peste 4 camere
Total

120-170
35
10
10
55

Cheltuieli de ntreinere (RON)


170-220
220-270
10
5
50
30
10
40
5
5
75
80

270-320
10
15
15
40

Total
50
100
75
25
250

S se arate dac influena numrului de camere asupra variaiei cheltuielilor de ntreinere este semnificativ, folosind
testul F de analiz dispersional, pentru o probabilitate de 99%.
2. O mare companie productoare de cosmetice deine n Bucureti 100 de magazine de desfacere a produselor sale.
Despre zona de amplasare a acestor magazine i despre valoarea medie a vnzrilor zilnice (mii RON) se cunosc datele:
Zona de
amplasare
Central
Sud-vest
Sud-est
Nord-vest
Nord-est

Numr de
magazine
35
20
15
10
20

Valoarea medie a vnzrilor


zilnice (mii RON/magazin)
20
12
10
5
13

Coeficientul de variaie
a vnzrilor (%)
6,0
12,5
13,0
20,0
12,3

S se arate dac zona de amplasare a magazinelor influeneaz semnificativ variaia valorii vnzrilor, pentru o
probabilitate de 95%, folosind testul F de analiz dispersional.
3. Pentru 20 de magazine situate n zona central, semicentrala i periferic a unui ora, se cunosc valorile vnzrilor
(mil. RON):
Zona
Central
Semicentrala
Periferic

Valoarea vnzrilor (mil. RON)


27; 22; 21; 20; 28; 29; 22; 20; 16
15; 20; 23; 23; 25
9; 15; 13; 18; 12; 10

Nr. magazine
9
5
6

S se determine daca zona de amplasare a magazinelor a influentat semnificativ variaia vnzrilor, folosind testul F de
analiza dispersionala (ANOVA); (nivel de semnificatie =0,05).
4. O mare agenie de nchiriat automobile hotrte s-i vnd automobilele dup utilizarea acestora timp de un
an. Managerul firmei presupune c distana parcurs de maini influeneaz costul de ntreinere al autovehiculelor i deci
preul de vnzare al acestora. Pentru a verifica aceast presupunere, se nregistreaz, pentru un numr de 200 de maini,
distana parcurs n ultimul an (n mii km) i costul de ntreinere al acestora (n uniti monetare). Se alctuiesc patru
grupe, dup distana parcurs: sub 40 mii km, 40-60 mii km, 60-80 mii km., 80 i peste 80 mii km.
Grupe dup
distana parcurs
20 40
40 60

Cost de ntreinere (unit. monetare)


57
79
9 11
11 13
18
28
14
10%
25%
35%
30%

tiind c:

40

Total
60
100%

pentru grupa a 3-a (60 80 mii km) s-au nregistrat date pentru 40 de autovehicule, costul mediu de ntreinere este
de 10,4 u.m., cu un coeficient de variaie de 11,538%, iar
pentru grupa a 4-a, ce cuprinde 10% din autovehicule, cheltuielile totale de ntreinere au fost de 264 u.m., iar
abaterea standard de 0,98 u.m.,
Se cere s se aplice testul F de analiz dispersional pentru a verifica dac distana parcurs a avut o influen
semnificativ asupra costului de ntreinere
5. Pentru 300 de angajai se cunosc: vechimea i nivelul salariului:
Grupe de angajai dup
vechime (ani)
0-10
10-20
20-30
30-40

(Nr. angajai (pers


80
130
70
20

Salariul mediu lunar


(sute RON/pers.)
8
12
14
20

Dispersia salariului
2,5
7,2
8,0
4,0

a) S se determine salariul mediu lunar al unui angajat, pe total;


b) S se determine daca vechimea a influentat semnificativ variaia salariului, folosind testul F de analiza
dispersionala (ANOVA); (nivel de semnificatie =0,05).
6. Pentru dou centre comerciale cu 12, respectiv 10 magazine, se cunosc datele:
Centrul
comercial
A
B

Nr. magazine
12
10

Valoarea medie a vnzrilor pe un


magazin (mil. RON)
18
27

Dispersia vnzrilor
10,24
20,25

S se determine dac centrul comercial n care sunt amplasate magazinele a influenat semnificativ variaia vnzrilor,
folosind testul F de analiza dispersionala (ANOVA); (probabilitatea de garantare a rezultatelor de 95%).
7. Cnd se recomand utilizarea metodei de analiz dispersional?
8. Care sunt tipurile de varian utilizate n ANOVA i ce reprezint ele?
9. Ce sunt dispersiile corectate?
10. Cum se stabilete regiunea critic pentru testul F?

41

MODELE ECONOMETRICE DE REGRESIE UNIFACTORIAL


Probleme rezolvate
1. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i numrul
vizitatorilor (mii pers.) timp de 14 zile.:
Ziua
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Nr. spoturi publicitare


7
5
1
8
10
2
6
7
9
3
12
8
4
11

Nr. vizitatori (mii pers.)


42
32
10
40
61
8
35
34
45
11
64
37
30
55

Se cere:
a) reprezentai grafic datele; Comentai graficul.
b) pe baza datelor de la nivelul eantionului, determinai ecuaia de regresie care modeleaz legtura dintre cele dou
variabile i calculai numrul zilnic previzionat de vizitatori;
c) verificai dac modelul de regresie identificat este valid statistic;
d) testai semnificaia statistic a parametrilor modelului, determinnd i intervalele de ncredere pentru acetia;
e) msurai intensitatea legturii dintre cele dou variabile cu ajutorul coeficientului i a raportului de corelaie; testai
semnificaia indicatorilor utilizai;
f) n ce msur variaia numrului de vizitatori este determinat de numrul spoturilor publicitare, pe baza modelului de
regresie determinat?
g) previzionai numrul vizitatorilor ateptai ntr-o zi, n ipoteza c se vor difuza 15 spoturi n acea zi.
h) previzionai numrul mediu zilnic de vizitatori, n ipoteza c se vor difuza 8 spoturi publicitare n medie pe zi.
Rezolvare:
a) Notm cu X variabila factorial, independent nr.spoturi publicitare i cu Y variabila dependent
nr.vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate construim corelograma (figura
4.10).

42

70
60

nr.vizitatori

50
40
30
20
10
0
0

10

12

14

nr.spoturi

Figura 4.10 Corelograma (diagrama de mprtiere)


Se observ c legtura dintre variabile este direct i liniar (ntruct dreapta de regresie are pant pozitiv), iar
ecuaia de regresie va avea forma:
yi = a + bxi
b) Pentru a determina estimatorii a i b, rezolvm sistemul de ecuaii normale, folosind datele din tabelul de lucru
4.5:

na + b xi = yi

2
a xi + b xi = xi yi
n=14 (numrul observaiilor)
Tabelul 4.5

xi

yi

xi2

xiyi

yi2

y i = 2,2858
+ 5,0753 xi

7
5
1
8
10
2
6
7
9
3
12
8
4
11
xi
=93

42
32
10
40
61
8
35
34
45
11
64
37
30
55
y
i
=504

49
25
1
64
100
4
36
49
81
9
144
64
16
121

xi2

=763

294
160
10
320
610
16
210
238
405
33
768
296
120
605
x
i yi
=4085

1764
1024
100
1600
3721
64
1225
1156
2025
121
4096
1369
900
3025

yi2

=22190

43

( yi yi ) 2

( y i y ) 2

(x

37,81
27,66
7,36
42,89
53,04
12,44
32,74
37,81
47,96
17,51
63,19
42,89
22,59
58,11

17,53
18,82
6,96
8,34
63,39
19,68
5,12
14,54
8,78
42,40
0,66
34,67
54,96
9,69

3,29
69,52
820,19
47,44
290,31
555,25
10,64
3,29
143,12
341,82
739,24
47,44
179,91
489,01

0,13
2,70
31,84
1,84
11,27
21,56
0,41
0,13
5,56
13,27
28,70
1,84
6,98
18,98

504

305,53

3740,47

145,21

14 a + 93b = 504

93a + 763b = 4085


504 763 93 4085 4647
a= a =
=
= 2 ,2858
2

2033
14 763 ( 93)

14 4085 93 504 10318


b= b =
=
= 5 ,0753

2033
14 763 ( 93) 2
Ecuaia de regresie este:
yi = 2 ,2858 + 5 ,0753 xi
c) Testarea validitii modelului de regresie determinat.
Pentru testarea validitii modelului se formuleaz cele dou ipoteze:
H0: model nevalid statistic, cu alternativa
H1: model valid statistic
Se completeaz tabelul:
Surs variaiei

Suma ptratelor
(SS-Sum of Squares)

Datorat
regresiei

2y / x =3740,465

Rezidual

2e =305,535

Total

Grade de libertate
(df- degree of
freedom)

s y2 / x =3740,465

k=1
n k 1=14 -2=12

2y =4046,000

Media ptratelor
(MS- Mean of
Squares)

Testul Fisher
(testul F)

Fcalc =

3740,465
=146,90
25,461
8

se2 =25,461

n 1=15-1= 13

Valoarea teoretic pentru un prag de semnificaie

= 0,05 i 1, respectiv 12 grade de libertate, preluat din tabelul

repartiiei Fisher este F;k ;n k 1 =4,75.


ntruct Fcalc> F;k ;n k 1 se respinge H0, adic se concluzioneaz c modelul este valid.
Calculele intermediare se gsesc n tabelul 4.5.
d) Ecuaia de regresie liniar la nivelul colectivitii generale se scrie:
yi = + xi + i,
iar la nivelul eantionului:

yi = a + bxi + ei
Pentru testarea semnificaiei parametrilor modelului de regresie liniar i estimarea lor pe intervalele de ncredere
se procedeaz astfel:
1) pentru parametrul
Ipotezele testate sunt:
H0 : = 0 (b = = 0),
H1 : 0.

44

Deoarece volumul eantionului este mic (n<30), vom utiliza testul t:

t calc =

Unde

b b b 0
=
, statistic ce urmeaz o distribuie t cu (n 2) grade de libertate.
sb
sb

sb =

se
n

(x
i =1

=
x)2
n

Iar

(y

2e
se =
=
n2

i =1

5,046
145,21

2
y i )

n2

= 0,4187

305,53
= 5,046
12

Se obine tcalc = 12,1206


Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este t /2;13 = 2,179 . Deoarece t calc >t/2;13 vom
concluziona c este foarte improbabil ca estimatorul b s provin dintr-o populaie cu =0 ( adic este semnificativ
diferit de zero), deci parametrul este semnificativ statistic.
Intervalul de ncredere pentru parametrul , coeficientul de regresie din colectivitatea general, este:
b t / 2 ,n 2 sb b + t / 2 ,n 2 sb , adic 4,1629 5,9876

2) pentru parametrul a
Ipotezele testate sunt:
H0 : = 0,
H1 : 0
Statistica t este:

t calc =

a a a 0
=
.
sa
sa
n

Unde s a = s e

x
i =1

2
i

n ( xi x ) 2

= 5,046

763
= 3,0912
14 145,21

i =1

Se obine t calc = 0,7394


Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este t /2;13 = 2,179 . Deoarece t calc <t/2;13 vom
concluziona c este foarte probabil ca estimatorul a s provin dintr-o populaie cu =0 ( adic nu este semnificativ
diferit de zero).
Intervalul de ncredere pentru parametrul

este dat de:

a t / 2 ,n2 sa a + t / 2 ,n2 sa , adic -4,4495 9,0210.

Un argument suplimentar pentru concluzia c parametrul este nesemnificativ statistic este acela c intervalul de
ncredere include i valoarea zero.

e) Pentru a msura intensitatea legturii dintre cele dou variabile se va calcula mai nti coeficientul de corelaie
liniar:

45

r=

xi yi xi yi
=
2
2
2
2
n
xi (xi )
n
yi (yi )

10318

2033 14 22190 504 2

yi2

(yi )

10318
= 0 ,9615
10731

Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de valoarea unitar).
Pentru testarea semnificaiei coeficientului de corelaie liniar simpl, se procedeaz astfel:
Ipotezele testate sunt:
H0 : = 0 ( nu este semnificativ statistic)

H1:

0 ( este semnificativ statistic).

Statistica t este:
t calc =

r
r n 2
0,9615 12
=
=
= 12,12 .
2
sr
1r
1 0,9615 2

Cum valoarea tabelar a testului t, pentru un prag de semnificaie de 5% i 12 grade de libertate este 2,179 rezult
c tcalc > t;n 2 , deci coeficientul de corelaie este semnificativ statistic
Un alt indicator utilizat att n cazul legturilor liniare, ct i al celor neliniare este raportul de corelaie R:
R = Ry / x =

( y y )
1
( y y )
i

= 1

305,53
= 0,9615
4046

Calculele necesre determinrii raportului de corelaie sunt redate n 4.5

y=

yi = 504 = 36
n

14

mii pers.

Ry/x = ry/x = 0,9615, deci exist o legtur liniar, puternic i direct ntre cele dou variabile.
Testarea semnificaiei raportului de corelaie se face cu testul F:

F=

n k 1 R 2

= 146,9
k
1 R2

Valoarea teoretic pentru un prag de semnificaie

= 0,05 i 1, respectiv 12 grade de libertate, preluat din

tabelul repartiiei Fisher este F;k ;n k 1 =4,75.


ntruct Fcalc> F;k ;n k 1 se respinge H0, adic se concluzioneaz c R este semnificativ statistic.
f) Pentru a determina n ce msur variaia numrului de vizitatori este explicat de influena numrului de spoturi
publicitare difuzate zilnic, se calculeaz coeficientul de determinaie:
R y2 / x = 0 ,9615 2 = 0 ,9245 su 92,45% arat c aproximativ 92% din variaia variabilei Y este explicat de variabila X.

g) Dac numrul spoturilor publicitare difuzate va fi de 15, atunci numrul previzionat al vizitatorilor pe baza acestei
ecuaii de regresie este:
y / x =15 = 2 ,2858 + 5 ,0753 15 78 mii pers. (estimare punctual)
Pentru estimarea pe interval de ncredere, trebuie s determinm dispersia diferenei y n +1 y n +1,i , adic
dispersia erorii de previzionare. Dispersia n eantion este:

46

(x
x) 2
1
s (2y n +1, i ) = s (2y n +1 y n +1, i ) = s e2 1 + + n n +1

n
( x i x) 2

i =1

(15 6,64) 2
1
= 25,461

1+
+

145,21
14

= 39,534 .

Intervalul de ncredere este:

y n +1,i t / 2,n 2 s e 1 +

1 ( x n +1 x) 2
+
, adic (64,71; 92,11) mii persoane.
n n
( xi x) 2
i =1

h) Suntem n cazul determinrii intervalului de ncredere pentru media de rspuns, cnd x n+1 x . Pentru aceasta
se determin y n +1 = y + b( x n +1 x) = 36 + 5,0753 ( 8 - 6,64 ) = 42,9
n +1 este:
iar estimatorul dispersiei pentru y

s (2y n +1 )

1 ( x x) 2
= s e2 + n n +1
n
2
xi x

i =1

1
(8 6,64) 2
= 25,461

+
14

145,21

= 2,14

Intervalul de ncredere pentru media de rspuns este:

x x
1
+ n n +1
n
xi x

y n +1 t / 2,n 2 s e

i =1

, adic (39,71; 46,08) mii persoane

Se poate utiliza, ns, pentru rezolvarea problemei i un pachet informatic specializat, n cazul nostru EXCEL. n
urma selectrii, din meniul principal, a opiunilor

<Tools>+<Data Analysis>+<Regression>, s-au obinut urmtoarele

rezultate:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,961501303
R Square
0,924484756
Adjusted R
Square
0,918191819
Standard Error
5,045911528
Observations
14
ANOVA
df
Regression
Residual
Total

SS
1
12
13

Coefficients

3740,465
305,535
4046,000

Standard Error

MS
3740,46
5
25,461

t Stat

Intercept

2,2858

3,0912

0,7394

Nr. spoturi

5,0753

0,4187

12,1206

Significance F

146,908

0,0000000433

P-value
0,473858069
6
0,000000043
3

47

Lower
95%

Upper
95%

-4,4495

9,0210

4,1629

5,9876

2. Se cunosc urmtoarele date, privind cifra de afaceri i cheltuielile pentru cercetare efectuate de 500 de firme:
Grupe de firme dup cifra
de afaceri (U.M.)
sub 50
50 70
70 90
90 110
peste 110
Total

Numr firme
70
100
200
80
50
500

Cheltuieli medii pentru


cercetare (U.M.)
8
7
12
15
20
-

Presupunnd c ntre cele dou variabile exist o legtur liniar, se cere:


a) S se ajusteze cheltuielile pentru cercetare n funcie de cifra de afaceri, folosind funcia de regresie adecvat;
b) S se msoare intensitatea legturii dintre cele dou variabile, folosind coeficientul de corelaie liniar simpl i
raportul de corelaie.
c) testai semnificaia parametrilor funciei de regresie;
d) testai semnificaia coeficientului de corelaie
Rezolvare:
a) Notm cu X cifra de afaceri (variabila factorial) i cu Y cheltuielile pentru cercetare (variabila rezultativ).
Ecuaia de regresie este: yi = a + bxi , unde y i reprezint valorile teoretice, ajustate ale lui Y.
Pentru a determina estimatorii a i b, rezolvm sistemul de ecuaii normale, folosind datele din tabelul 4.6:

na + b xi ni = yi ni

2
a xi ni + b xi ni = xi yi ni

yi ni xi ni
xi yi ni xi2 ni = yi ni xi2 ni xi yi ni xi ni
a=
2
n
nxi2 ni (xi ni )
xi ni
xi ni xi2 ni
a=

5860 3272000 38800 496400


500 3272000 38800 2

yi ni
xi yi ni
xi ni
xi2 ni

b=

xi ni
n

xi ni
b=

= 0 ,66

xi yi ni xi ni yi ni
nxi2 ni (xi ni )
2

20832
= 0 ,159 0 ,16
130560

Valorile teoretice ale variabilei Y calculate pe baza ecuaei de regresie y i = 0,66 + 0,16 xi sunt redate n
tabelul 4.6.
Tabelul 4.6
xi

ni

xini

yini

70

2800

560

40

xi2

xi2 ni

1600 112.000

48

xiyini

yi2 ni

yi

22.400

4480

5,74

( yi yi ) 2 ni
357,532

60
80
10
0
12
0
-

7
12
15

100 6000 700


200 16.000 2400
80 8000 1200

3600 360.000 42.000


6400 1.280.000 192.000
10000 800.000 120.000

4900 8,94
28800 12,14
18000 15,34

376,36
3,92
9,248

20

50

14400 720.000

20000 18,54

106,58

6000

1000


ni

xi ni

yi ni

=500 =38.800 =5860

120.000

xi2 ni xi yi n
yi2 ni
i
=3.272.00

=496.400 =76.180

( yi yi ) 2 ni

=853,64

Coeficientul de regresie b are urmtoarea interpretare: dac cifra de afaceri crete cu o U.M., atunci cheltuielile
medii pentru cercetare vor crete cu 0,16 U.M.
b) Coeficientul de corelaie liniar simpl:

cov( x , y )
ry / x =
=
sx s y

( xi x )( yi y )ni
ns x s y

xi yi ni xi ni yi ni
2
2
n
xi2 ni (xi ni ) nyi2 ni (yi ni )

500 496400 38800 5860

ry / x =

(500 3272000 38800 2 )(500 76180 5860 2 )

= 0 ,94

Raportul de corelaie determinat pe baza calculelor din tabelul 4.6 este:

( y y ) n
( y y) n
2

R = 1

y=

yi ni
ni

= 1

853,64
= 0,94
7500,8

5860
= 11,72 U.M.
500

Observm c R = ry/x = 0,94, ceea ce nseamn c ntre cele dou variabile exist o legtur liniar, puternic i
direct.
c) Testarea semnificaiei lui :
a
t calc =
.
sa

s a2 = s e2

s e2

2
xi ni

n ( x i x ) 2 ni

( y i y i ) ni
2

x=

ni 2

xi ni
ni

853,64
= 1,714
498

38.800
= 77,6
500
xi
40
60
80
100
120

( xi x )

yi
8
7
12
15
20

ni

98.963,2
30.976
1.152
40.140,8
89.888

49

( yi y )

Tabelul 4.7
2

ni

968,688
2227,84
15,68
860,672
3427,92

s a2 = 1,714

s a = 0,2
t calc =

261.120

7500,8

3272000
= 0,043
500 261120

0,66
0,2

= 3,3

Se compar valoarea calculat a statisticii t cu valoarea tabelar, teoretic t0,01;498 = 2,568.


Cum tcalc > t0,01;498 = 2,568, rezult c este semnificativ.
Testarea semnificaiei parametrului :
b
t calc =
sb
1
1,714
s b2 = s e2
=
= 0,0000065
2
261120
( x i x ) ni
s b = 0,0025
t calc =

0,16
= 64 > t 0,01; 498 = 2,568 deci este semnificativ.
0,0025

b) Testarea semnificaiei coeficientului de corelaie r se face cu ajutorul testului t:


t=

r
1 r

n 2 =

0,94
1 0,94

498 =

0,94
22,31 = 61,5 .
0,341

t calc > t 0, 01; 498 = 2,568 , deci r este semnificativ.

3. Cheltuielile cu reclama i cantitile din produsul X vndute, pentru 41 de magazine ale unui grup de firme cu
profil comercial, se prezint astfel:
Cheltuieli cu
reclama
(sute RON)
50 150
150 250
250 350
350 450
450 - 550

Cantiti vndute din produsul X (zeci mii buci)


0,6 1,4 1,4 2,2 2,2 3,0 3,0 3,8
3,8 4,6
6
-

1
8
1
-

5
8
-

6
-

2
4

Se cere:
a) Ajustai cantitile vndute din produsul X, funcie de cheltuielile cu reclama, folosind funcia de regresie
adecvat.
b) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator de corelaie adecvat.
c) testai semnificaia parametrilor funciei de regresie;
d) verificai validitatea modelului de regresie folosit.
Rezolvare:
a) Notm cu X variabila cheltuieli cu reclama, respectiv cu Y variabila cantiti vndute.
Admitem c ntre cele dou variabile exist o legtur de form liniar prin interpretarea corelogramei. Atunci vom utiliza
funcia de regresie liniar:
yi = a + bxi , unde y i reprezint valorile teoretice, ajustate ale variabilei Y.
Se obine sistemul:

50

a nij + b xi ni = y j n j
i
j
i j

2
a xi ni + b xi ni = xi y j nij
i
i j
i
Calculele intermediare necesre estimrii parametrilor a i b, precum i valorile ajustate se gsesc n tabelul
4.8.

y jn j

x i ni

xi y j nij

2
x i ni

a=

103,4

x i ni

x i ni

xi2 ni

y jn j

b=

3.680.000

xi y j nij

32960 3.680.000
= 0,4465
41
11.200
11.200

xi ni

11.200

xi ni
i

xi ni
i

2
x i ni

41
103,4
11.200 32960
=
= 0,0076
41
11.200
11.200 3.680.000

Ecuaia de regresie este:


y i = 0,4465 + 0,0076 x i

Observm c valoarea coeficientul de regresie b (panta dreptei) este pozitiv, ceea ce nseamn c ntre cele
dou variabile analizate exist legtur direct.
Interpretarea coeficientului b: dac cheltuielile cu reclama cresc cu 100 RON, vnzrile cresc, n medie, cu 76
buc.
Tabelul 4.8
Cheltuieli cu
reclama
(sute RON)
100
200
300
400
500

nj

1
6
6

Cantiti vndute
(zeci mii buc.)
1,8
2,6
3,4
1
8
5
1
8
6
10
13
6

4,2
2
4
6

y jn j

18

33,8

20,4

25,2

103,4

y 2j n j

32,4

87,88

69,36

105,84

301,48

ni

x i ni

xi2 ni

7
13
9
8
4
41

700
2600
2700
3200
2000
11200

70.000
520.000
810.000
1.280.000
1.000.000
3.680.000

b) Coficientul liniar de corelaie:

r=

cov( x, y )
=
sx s y

n xi y j nij xi ni y j n j

[n x n ( x n ) ][n y n
2
i

2
j

( y j n j )

r = 0,94 deci exist o legtur puternic direct ntre cele dou variabile.

51

xi y j nij y
i
j
780
5480
6780
11.520
8400
32.960

1,196
1,946
2,696
3,446
4.196

Raportul de corelaie:

2
y

2e
( y j y i ) nij
= 1
2
2
y
y y n
2

2y / x

R=

= 1

2y

( y y )
=
n
j

nj

y=

40,7
= 0,9927 .
41

y j n j 103,4
=
= 2,52 zeci mii buc.
41
n j

R = 1

5,565
= 0,93 , deci o legtur puternic, direct.
40,7

Calculele intermediare necesre determinrii lui R se gsesc n tabelul urmtor:


yj

y i
1
0,23
-

1,196
1,946
2,696
3,446
4,196
Total

1,8
0,365
0,1705
0,803
-

2,6
2,138
0,074
-

2
( y i y j ) nij

3,4
0,276
-

4,2
1,508
0,000064

c) Testarea semnificaiei parametrului :


Se construiete statistica (testul) t, astfel:
a
.
sa

t calc =

2
xi ni

s a2 = s e2

s e2 =

n ( x i x ) 2 ni

y j y i
i

nij 2
i

x=

) 2 nij

x i ni
ni

xi x

5,565
= 0,143
39

= 273,17 mil. lei.

)2 ni = (100 273,17 ) 2 7 + ( 200 273,17 ) 2 13 +

+ ( 300 273,17 ) 2 9 + ( 400 273,17 ) 2 8 + ( 500 273,17 ) 2 4 =

= 620.487,76
s a2 = 0,143

t calc =

273,17
= 0,0206
620487,76

0,4465
0,0206

= 3,1

t,n 2 = t 0, 05;39 = 2,021 . Cum tcalc > ttab, rezult c este semnificativ.

Testarea semnificaiei parametrului :


b
t calc =
sb

52

0,595
2,3085
0,877
1,784
0,000064
5,565

s b2 = s e2
t calc

0,143
= 0,0000002
620487,76

( xi x ) ni
0,0076
=
=16,89 > t tab = 2,021 deci este semnificativ.
0,0000002

d) F =
2
y/x

s y2 / x
s e2
2y / x
k

( y
=

2e
s =
=
n k 1
2
e

y ni
k

( y

40,7 5,565
= 35,135 .
2 1

2
y i ) nij

n k 1

5,565
= 0,1427 .
41 2

Fcalc = 246,2.
Ftab=F,k,n-k-1 = F0,05, 1,39 = 4,08.
Cum Fcalc > Ftab , nseamn c X influeneaz semnificativ pe Y.
4. Pentru vnzrile zilnice ale unui produs s-au nregistrat valorile variabilelor X (pre lei) i Y (cantitate vndut
buci) la nivelul a 10 uniti:
xi
yi

5
70

6
53

10
44

12
38

15
35

20
28

22
26

30
17

35
11

40
5

a) S se analizeze existena, direcia i forma legturii dintre variabilele X i Y.


b) S se determine parametrii funciei de regresie.
c) S se precizeze intensitatea legturii dintre X i Y.
Rezolvare:
a) Se alctuiete corelograma, i se observ c ntre cele dou variabile exist o legtur invers, neliniar
(Figura 4.11).

80
70
60

yi

50
40
30
20
10
0
0

10

20

xi

Figura 4.11

53

30

40

50

b) Pentru modelarea tendinei legturii, folosim modelul de regresie hiperbolic.


y i = a + b

1
xi

Aplicnd metoda celor mai mici ptrate, obinem sistemul:

na
+
b
= yi

a 1 + b 1 = 1 yi
xi
xi
xi2

y
a=

1
x yi
i
n
1

n
b=

1
x
i

1
x2
i
=
1
x
i
1
x2
i

y
1
x y

y x
i

2
i

1
1
yi
xi
xi

1
1

2
xi xi

327 0,0938 0,791 35,943


= 7,18
10 0,0938 0,6257

1
x
i

1
x2
i

1
1
yi yi
xi
xi

1
1

2
xi xi

10 35,943 0,791 327


= 322,68
.
10 0,0938 0,7912

Aadar, ecuaia de regresie este:


y i = 7,18 + 322,68

1
.
xi

Valorile ajustate ale lui Y i calculele intermediare se gsesc n tabelul 4.9.


c) Intensitatea legturii se stabilete cu raportul de corelaie:
Tabelul 4.9

xi

yi
5
6
10
12
15
20
22
30
35
40

1/xi
70
53
44
38
35
28
26
17
11
5

0,200
0,160
0,100
0,083
0,067
0,050
0,045
0,033
0,028
0,025

yi(1/xi)
14,000
8,480
4,400
3,154
2,345
1,400
1,170
0,561
0,308
0,125

(1/xi)

0,0400
0,0256
0,0100
0,0069
0,0044
0,0025
0,0020
0,0010
0,0008
0,0006

54

y i
71,58
58,70
39,38
33,90
28,75
23,28
21,67
17,80
16,20
15,23

(yi- y i )2
2,49
32,49
21,34
16,81
39,01
22,28
18,75
0,64
27,04
104,65

( yi y )2
1391,29
412,09
127,69
28,09
5,29
22,09
44,89
246,49
470,89
767,29

R=

327

( y y )
1
( y y )
i

0,791

= 1

y=

yi
n

35,943

0,0938

285,50

3516,10

285,5
= 0,96 .
3516,1

= 32,7 .

Raportul de corelaie arat o legtur puternic ntre cele dou variabile.


2
Coeficientul de determinaie R = 0,92 arat c 92% din variaia variabilei Y este explicat prin influena lui X

asupra lui Y.

5. Un vnztor de automobile second hand ar dori s tie dac preul de vnzare al acestora la licitaie depinde de
numrul de kilometri parcuri de automobilul respectiv. Pentru aceasta el selecteaz 50 de automobile cu o vechime de 3
ani, aceeai marc i aceleai faciliti. Pentru fiecare main a nregistrat preul de vnzare la licitaie i numrul de
kilometri de la bordul autoturismului.
a)

Vnztorul ar dori s tie care este dependena dintre preul de vnzare i numrul de kilometri parcuri.

b)

Testai semnificaia parametrilor funciei de regresie i validitatea modelului de regresie obinut.

c)

Msurai intensitatea legturii dintre variabile.


Preul Nr.K
m
37388 5318
44758 5061
45833 5008
30862 5795
31705 5784
34010 5359
45854 5235
19057 5845
40149 5536
40237 5401

Preul Nr.K
m
32359 5595
43533 5330
32744 5806
34470 5805
37720 5317
41350 5316
24469 5870
35781 5504
48613 5333
24188 5705

Preul Nr.K
m
38775 5150
45563 5249
28676 5775
38231 5327
36683 5192
32517 5544
39050 5054
45251 5115
34384 5410
38383 5529

Preul Nr.K
m
32161 5507
26561 5873
33533 5303
41849 5237
36668 5383
37495 5286
25629 5827
40099 5483
31014 5440
42233 5215

Preul
37407
34356
30599
42485
38430
40452
26030
46296
34844
27379

Nr.K
m
5105
5685
5788
5208
5168
5128
5750
4965
5238
5763

Rezolvare:
a) Pentru determinarea dependenei ntre cele dou variabile se face un grafic pentru determinarea tipului legturii.
6000

Pre

5800
5600
5400
5200
5000
4800
0

10000

20000

30000

40000

50000

Numr dekilometri parcuri

Figura 4.12

55

60000

Deoarece punctele reprezentate sunt grupate n jurul diagonalei secundare, exist o dependen liniar, invers
ntre cele dou variabile. Pentru determinarea modului n care preul variaz n funcie de numrul de kilometri
parcuri se va folosi modelul de regresie liniar.
Rezolvare folosind EXCEL:
1. Introducei datele astfel: n celula A1 tastai Nr.Km. iar n B1 Preul. n prima coloan, ncepnd din A2 se vor
introduce numrul de kilometri parcuri, iar pe coloana a doua, ncepnd din B2 se vor introduce preurile.
2. Apsi Tools-Data Analysis i Regression.
3. La Input Y Range selectai B1:B51. La Input X Range selectai A1:A51. Selectai Labels.
4. Dac dorii s calculai valorile reziduale ( y i y i ), selectai Residuals. Apsi OK.
Se obin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.808922
R Square
0.654355
Adjusted R Square
0.647154
Standard Error
157.8984
Observations
50
ANOVA
Df
Regression
Residual
Total

1
48
49
Coefficients

Intercept
Nr.Km.

SS
2265584
1196732
3462316

Standard
Error
6598.34
124.3322
-0.03224
0.003382

MS
2265584
24931.91

t Stat
53.07024
-9.53262

F
90.87089

P-value
2.78E-44
1.19E-12

Significance F
1.19E-12

Lower 95% Upper 95%


6348.353
-0.03904

6848.326
-0.02544

Interpretarea rezultatelor prezente n ultimul tabel din SUMMARY OUTPUT.


Coeficientul b este 0,03224, ceea ce nsemn c la creterea distanei parcurse cu 1 kilometru, preul va
descrete cu 0,03224104 lei (322,4 lei).
Intercept este termenul liber, deci coeficientul a este 6598,34. Termenul liber este punctul n care dreapta de
regresie intersecteaz axa y. Aceasta nseamn c x=0, deci a reprezint preul unei maini care nu a fost condus. Dar, n
cazul nostru acest punct nu are semnificaie, deoarece toate mainile sunt second hand.
Interpretarea rezultatelor prezente n primul tabel din SUMMARY OUTPUT.
Este calculat eroarea standard, Standard Error, egal cu 157,9. n cazul n care aceast valoare este zero,
nseamn c toate punctele observate se afl pe dreapta de regresie. Deci, bine este ca aceast valoare s fie ct mai
apropiat de zero. Ce nseamn mai apropiat de zero este greu de spus folosind doar eroarea standard. De aceea se
calculeaz mrimi derivate din aceasta pentru a spune ct de apropiate sunt punctele de dreapta de regresie.
Pentru a putea spune n ce msur modelul liniar de regresie explic dependena dintre variabile se calculeaz
coeficientul de determinaie, R-square care n cazul nostru este 0,6544. Deci 65,44% din variaia preului este explicat
de variaia numrului de kilometri parcuri de automobil. Este calculat, de asemenea, coeficientul de determinaie ajustat,
R

, egal cu 0,6472.
n cazul n care a fost selectat i Residuals, tot n acest Sheet de rezultate sunt calculate valorile reziduale i

valorile previzionate pe baza modelului de regresie.

56

RESIDUAL OUTPUT
Observation
1
2
3
4
.....

Predicted Price
Residuals
5392.879821
-74.8798
5155.257064
-94.2571
5120.597029
-112.597
5603.29042
191.7096

Rezolvare folosind STATISTICA:


1. Creai un fiier cu 2 variabile i 50 de cazuri (File/New data). Introducei datele astfel: prima variabil este
numrul de kilometri parcuri, a doua variabil este preul stabilit la licitaie.
2. Selectai modulul General Linear Model. Selectai apoi Simple Regression.
3. n noua fereastr deschis apsi butonul Variables. Aici selectai la Dependent variable list a doua variabil i
la Predictor prima variabil. Apsi OK.
4. Apsi Summary. Apsi Coefficients.
Se obine:

Acest tabel se interpreteaz similar cu tabelul 3 din SUMMARY OUTPUT obinut prin EXCEL.
5. Apsi Continue. Apsi Whole model R.
Se obine:

Acest tabel se interpreteaz similar cu tabelul 1 din SUMMARY OUTPUT obinut prin EXCEL.
Dac se dorete calculul valorilor reziduale i al celor previzionate se parcurg paii:
6. Apsi Continue. Apsi Resids. Selectai Extended. Apsi Predicted and residuals.
Se obine:

Se observ c n tabelul anterior sunt afiate:


- preul observat;
- preul previzionat;
- valoarea rezidual: preul observat preul previzionat;
- eroarea standard;

57

b) Rezolvare folosind EXCEL:


Interpretarea rezultatelor prezente n ultimul tabel din SUMMARY OUTPUT.
n coloana a doua (Standard Error) sunt calculate, erorile standard ale parametrilor estimai: sa = 124,33 i sb =
0,0034. Aceste erori sunt folosite pentru calculul statisticilor t pentru testarea semnificaiei estimatorilor. Acestea sunt
calculate n coloana tStat, ta = 53,07 i tb = - 9,53. Deoarece valorile p asociate sunt foarte apropiate de zero (n coloana
P-value), se poate spune c estimatorii sunt semnificativi.
Lower 95% i Upper 95% sunt limitele inferioare, respectiv superioare ale coeficienilor estimai.
Interpretarea rezultatelor prezente n tabelul ANOVA.
Validitatea modelului de regresie se testeaz folosind testul F. n tabelul ANOVA sunt calculate cele trei variaii:
cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se calculeaz Statistica F. n cazul nostru aceasta
este 90,87. Deaorece valoarea p asociat este foarte apropiat de zero (prag de semnificaie sczut), se poate valida
modelul de regresie.
n cazul n care a fost selectat i Residuals, tot n acest Sheet de rezultate sunt calculate valorile reziduale i
valorile previzionate pe baza modelului de regresie.
RESIDUAL OUTPUT
Observation
1
2
3
4
.....

Predicted Price Residuals


5392.879821 -74.8798
5155.257064 -94.2571
5120.597029 -112.597
5603.29042 191.7096

Rezolvare folosind STATISTICA:

Acest tabel se interpreteaz similar cu tabelul 3 din SUMMARY OUTPUT obinut prin EXCEL.
Dac se dorete calculul valorilor reziduale i al celor previzionate se parcurg paii:
Apsi Continue. Apsi Resids. Selectai Extended. Apsi Predicted and residuals.
Se obine:

58

Se observ c n tabelul anterior sunt afiate:


-

preul observat;

preul previzionat;

valoarea rezidual: preul observat preul previzionat;

eroarea standard;

intervalul de previziune, pentru o probabilitate de 95%: n cazul unui automobil cu acelai numr de kilometri
parcuri, cu o probabilitate de 95%, preul previzionat al acestuia va fi inclus n intervalul de previziune;

intervalul de ncredere, pentru o probabilitate de 95%: n cazul unui automobil cu acelai numr de kilometri
parcuri, cu o probabilitate de 95%, preul acestuia va fi inclus n intervalul de ncredere.
c) Deoarece datele sunt cantitative, pentru msurarea intensitii legturii dintre dou variabile se calculeaz

coeficientul de corelaie liniar.


Rezolvare folosind EXCEL:
1. Introducei datele ca n Exemplul 5.13.
2. Apsi Tools-Data Analysis i Correlation.
3. Specificai Input Range (A1:B51). Apsi Labels in First Row. Apsi OK.
Se obin rezultatele:
Numr de kilometri parcuri
Numr de kilometri parcuri
Pre

1
-0.808922247

Pre
1

Coeficientul de corelaie dintre numrul de kilometri parcuri i pre este -0,809. Deoarece acesta este negativ i
apropiat de unu se poate spune c exist o corelaie invers ntre cele dou variabile.
Rezolvare folosind STATISTICA:
1.
2.
3.
4.

Introducei datele ca n Exemplul 5.13.


Selectai modulul Basic Statistics and Tables. Selectai apoi Correlation Matrices.
Apsi butonul One variable list (square matrix). Selectai ambele variabile. Apsi OK.
La Display selectai Detailed table of results. Apsi OK.

Se obin rezultatele:

Coeficientul de corelaie dintre numrul de kilometri parcuri i pre este -0,81. Deoarece acesta este negativ i
apropiat de unu se poate spune c exist o corelaie invers ntre cele dou variabile.

59

6. Se cunosc indicii populaiei ocupate a Romniei i indicii productivitii muncii, pentru perioada 1990-2005:
Anul

Indicii populaiei ocupate (baz fix) (%)

Indicii productivitii muncii (%)

1990

100

100

1991

99,25

87,76

1992

97,49

81,44

1993

94,17

98,27

1994

92,12

114,57

1995

89,51

124,47

1996

86,61

128,69

1997

84,45

115,64

1998

81,85

109,22

1999

79,09

118,94

2000

78,24

129,09

2001

78,9

135,98

2002

77,52

143,3

2003

76,34

145,95

2004

75,92

150,38

2005

77,4

167,55

S se studieze dependena dintre cele dou variabile folosind un model de regresie liniar. Comentai rezultatele.
Rezolvare:
Nivelul ocuprii este factorul extensiv de influen a productivitii muncii. Reflectnd ntr-o form grafic
corelaia dintre cele dou variabile macroeconomice (figura 4.13) se observ c dependena productivitii muncii de
nivelul ocuprii este una invers, variabilele fiind invers proporionale i deci creterea uneia atrage dup sine scderea
Indicii productivitatii muncii (%)

celeilalte sau invers.


180
160
140
120
100
y = -2,3015x + 318,85

80

R 2 = 0,7218

60
40
70

75

80

85

90

95

100

105

Indicii pop. ocupate (%)

Figura 4.13 Relaia dintre indicii populaiei ocupate


i cei ai productivitii muncii n perioada 1990-2005 n Romnia

n plus, coeficientul de corelaie dintre cele dou variabile este de -0,85, ceea ce indic o legtur invers
puternic. Indicatorul este semnificativ statistic (i negativ), lucru verificat prin testul t (Student), rezultnd c valoarea
calculat a acestuia este t calc = 6,037 , t calc = 6,037 < t , n 2 = 1,761 (pentru o probabilitate de 95%).

60

Modelul ce red dependena variabilitii n timp a productivitii muncii n funcie de dinamica populaiei
ocupate explic 72,1789 % din variabilitatea primei caracteristici.
Modelnd dependena productivitii muncii de populaia ocupat printr-un model de regresie liniar simpl,
acesta are urmtoarea form:

I tW/ 90 = 318,85 2,301 I tPO


/ 90 ,
unde indicii productivitii muncii i cei ai ocuprii sunt exprimai n procente, determinai n anul curent t fa de anul
1990. A fost testat semnificaia modelului cu ajutorul testului F (Fisher), rezultnd o valoare calculat a acestuia de
Fcalc = 36,3216 (rezultate garantate cu o probabilitate de maxim de 99,9969%, nivelul de semnificaie minim prag

fiind de p_value = 0,0031 %). Cei doi coeficieni ai modelului de regresie liniar s-au dovedit, de asemenea, semnificativi
statistic, lucru verificat prin aplicarea testului t (Student). Pentru termenul liber, valoarea calculat a testului este de
9,7125 semnificativitatea fiind garantat cu o probabilitate maxim de 99,99998661% (p_value = 0,00001339 %), n timp
ce pentru coeficientul ocuprii valoarea calculat a testului este de -6,0267 semnificativitatea acestuia fiind garantat cu o
probabilitate maxim de 99,9969% (p_value = 0,0031 %). Limita inferioar i superioar a intervalelor de ncredere prin
care se estimeaz valoarea celor doi coeficieni au acelai semn, ntrind concluzia semnificativitii acestora.

61

Probleme propuse spre rezolvare


1. n scopul evalurii impactului pe care variaia preului unui produs l are asupra variaiei cantitilor vndute din
acel produs a fost selectat un eantion reprezentativ de 10 de magazine, n care s-au urmrit valorile urmtoarelor
variabile:
-

Q cantitatea vndut din produsul respectiv (kg)

P preul produsului (RON)

A fost folosit pentru estimarea parametrilor urmtorul model, ale crui rezultate sunt prezentate mai jos:
Q = + P + .
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.913173052
R Square
0.833885023
Adjusted R Square
0.813120651
Standard Error
10.73509502
Observations
10
ANOVA
df
Regression
Residual
Total

Intercept
Pret vanzare (mii $)

SS
4628.0619

5550

Coefficients
-29.32363674
0.068972606

Standard Error
20.687667
0.0108839

MS
.
.

F
.

a. Testati validitatea modelului de regresie, pentru un nivel de semnificaie de 5% (Fcritic=5.32);;


b. Testati, interpretai i determinai intervalele de ncredere pentru coeficienii modelului(tcritic= 2,896)
2. Pentru a decide n ce zon s fie amplast un magazin de casete video, managerul unei firme de comercializare i
nchiriere de casete video realizeaz un studiu. Astfel, el consider c succesul afacerii este cuantificat prin profitul anual
brut obinut (sute euro). Principalul factor de influen considerat pentru succesul acestei afaceri este venitul mediu al
locuitorilor de pe o raz de un kilometru (zeci euro). Sunt selectate aleator 5 supermarket-uri i sunt nregistrate valorile
celor 2 variabile.
Profit (mii euro)
Venit (sute euro)

2
4

6
12

8
21

11
25

15
20

a) Estimai parametrii ecuaiei de regresie, n ipoteza unei dependene liniare.


b) Testai validitatea modelului de regresie, pentru un nivel de semnificaie de 5% (Fcritic=10.13);
c) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator adecvat i testai semnificaia acestuia,
pentru un nivel de ncredere de 95% (tcritic= 4,541, Fcritic= 10,13).

3. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine relaia dintre preul (mii
euro) obinut pentru articolele licitate i vechimea (ani) a obiectelor. n urma prelucrrii cu EXCEL a datelor culese de la
un eantion aleatoriu de 10 licitaii, s-au obinut rezultatele:

62

SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0,913173
0,833885
0,813121
142,1289
10

Vechime
Mean
Standard Deviation
Smple Variance

100
24.83277
616.6667

ANOVA
df
Regression
Residual
Total

Intercept
Vechim
e

1
..

Coefficient
s
665,991
12,09009

SS

161605
972850
Standar
d Error

1,90781
3

MS
811245

F
.

t Stat
3,397844
...

In ipoteza unui model de regresie liniar, se cere:


a) s se testeze semnificaia modelului, pentru un nivel de semnificaie de 5% (Fcritic=5,32);
b) s se determine intervalele de ncredere pentru parametrii modelului i s se comenteze rezultatele obinute (tcritic=
2,896).
4. Managerul unei companii de asigurri dorete s afle dac contactarea potenialilor clieni prin telefon are
influen asupra vnzrilor. Pentru aceasta, au fost selectai aleator 5 ageni de asigurri, de la care s-au nregistrat
numrul sptmnal al convorbirilor telefonice (X) i numrul polielor de asigurare ncheiate ntr-o sptmn (Y):
Nr. de convorbiri telefonice
Nr. polielor de asigurare

66
20

43
15

57
18

32
12

18
2

a) Reprezentai grafic datele i determinai modelul liniar de regresie dintre cele dou variabile;
b) Msurai intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie i testai semnificaia
acestuia, pentru un nivel de semnificaie de 5% (tcritic= 3,747);
c) Efectuai o previzionare punctual i pe interval de ncredere a numrului de polie de asigurare ncheiate, dac
ntr-o sptmn s-au efectuat 50 de convorbiri telefonice.

63

5. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine relaia dintre preul obinut
pentru articolele licitate (u.m.) i numrul de persoane ce particip la licitaie. n ipoteza unui model de regresie liniar,
rezultatele prelucrrii n EXCEL sunt:
Regression Statistics
Multiple R
0.860271
R Square
0.740066
Adjusted R Square
0.707575
Standard Error
177.7908
Observations
10
ANOVA
df
Regression
Residual
Total

Intercept
Marimea audientei

SS
719973.5
252876.5
972850

1
8
9

Coefficient
s
1086.691
9.329102

MS
719973.5
31609.56

Standard
Error
174.4825
1.954748

Significance
F
0.001404

F
22.77708

t Stat
6.228079
4.772534

P-value
0.000252
0.001404

a)

S se interpreteze rezultatele din tabele;

b)

Determinai i interpretai intervalele de ncredere pentru parametrii modelului (tcritic= 2,896)


6. O companie de construcii susine c n timpul perioadelor n care se percep rate ridicate ale dobnzii, numrul

autorizaiilor de construcie s-a redus considerabil. Pentru 5 luni s-au nregistrat: rata dobnzii (%) (X) i numrul
autorizaiilor de construcie (Y):
Rata dobnzii (%)
Nr. autorizaiilor de construcie

a)

18
43

11
119

15
82

12
90

16
80

Reprezentai grafic datele i determinai modelul de regresie adecvat analizei legturii dintre cele dou variabile;

b) Testai validitatea modelului de regresie gsit, pentru un nivel de semnificaie de 5% (Fcritic=10,13);


c) S se determine n ce proporie rata dobnzii influeneaz variaia numrului de autorizaii.

7. Pentru a analiza dac ntre valoarea vnzrilor lunare i vrsta agenilor de vnzri, ai unei mari companii ce
comercializeaz produse cosmetice, exist o legtur, un analist selecteaz aleator un eantion de 15 persoane. n urma
prelucrrii n EXCEL a datelor culese pentru cele dou variabile, s-au obinut rezultatele:
SUMMARY
OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.100488802
0.010097999
-0.066048309
5.290688304
15

ANOVA
df
Regression

SS
1

MS
3.712025

64

Residual
Total

13
14

367.6

Intercept
Varsta

Coefficients
11.67340114
0.062282291

Standard
Error
..

...

t Stat
.
.

Lower 95%
-0.130924113
-0.307204742

Upper 95%
23.47773
0.431769

a) S se testeze validitatea modelului de regresie liniar pe baza cruia s-au obinut prelucrrile din tabelele de mai
sus.
b) S se testeze semnificatia parametrilor modelului pentru o probabilitate de 95% (tcritic= 2,624)
8. Pentru a analiza n ce mod influeneaz vechimea utilajelor variaia costurilor de ntreinere a acestora, s-au
nregistrat pentru 5 utilaje: vechimea utilajelor (ani) i costurile lunare de ntreinere (sute euro):
Vechimea (ani)
Cost mediu lunar de ntreinere (sute euro)

2
4

6
12

8
31

11
25

15
34

a) Reprezentai grafic datele i determinati modelul liniar de regresie dintre cele dou variabile;
b) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator adecvat i testai semnificaia acestuia,
pentru un nivel de ncredere de 95% (tcritic= 4,541, Fcritic= 10,13)
c) Determinai intervalele de ncredere pentru parametrii modelului i interpretai rezultatele obinute.
9. O agenie imobiliar dorete s previzioneze preul de vnzare al unor case, pe baza unui model de regresie liniar
unifactorial, n funcie de suprafaa locuibil a acestora. Rezultatele obinute n urma prelucrrii n EXCEL a datelor
nregistrate pentru un eantion de 15 locuine sunt:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.903563
R Square
0.816426
Adjusted R Square
0.802305
Standard Error
6.39372
Observations
15

Suprafata (mp)
Mean
Smple Variance

58
160.4286

ANOVA
df
Regression
Residual
Total

Intercept
X Variable 1

.
.
14

SS
..
531.4355595
2894.933333

Coefficients
21.23556
1.025824

Standard Error
.

MS
2363.497774

F
..

a) S se valideze modelul de regresie pentru un nivel de semnificaie de 5% (Fcritic=4,67);


b) S se testeze semnificaia parametrilor i s se interpreteze valorile acestora (tcritic= 2,65).
10. Pentru un magazin de confecii s-au cules date referitoare la vanzarile de camasi barbatesti si profitul obinut
i =9,1+5,64xi. Se cunosc:
pentru 5 zile consecutive. Modelul de regresie obinut n urma prelucrrii datelor este: y

65

2
variana datorat regresiei (sistematic) y / x =

( y
n

i =1

2
y =737,4; variana rezidual 2e = ( y i y i ) =90. S se
2

i =1

testeze semnificaia modelului de regresie folosind testul F, pentru un nivel de semnificaie =0,05.
11. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i numrul
i =9,13+3,98xi. Se
vizitatorilor (mii pers.) timp de 5 zile. Modelul de regresie obinut n urma prelucrrii datelor este: y
n

2
2
2
cunosc: variana datorat regresiei (sistematic) y / x = y i y =740,8; variana rezidual e = ( y i y i ) =60.
i =1

i =1

S se testeze semnificaia modelului de regresie folosind testul F, pentru un nivel de semnificaie =0,05.
12. Pentru un mare magazin alimentar s-au cules date privind vnzrile (mil. RON) i profitul (mil. RON) realizate
n 9 luni ale anului 2003:
Luna
Val. Vnz. (mil. RON)
Profit (mil. RON)

Ian.
70
15

Feb.
20
2

Mar.
60
13

Apr.
40
15

Mai
140
25

Iun.
150
27

Iul.
160
24

Aug.
120
20

Sept.
140
27

a) S se reprezinte grafic datele;


b) S se determine modelul de regresie n eantion, calculnd valorile ajustate ale profitului n funcie de vnzri;
c) S se verifice semnificaia modelului de regresie gsit la punctul b) folosind testul F, pentru un nivel de semnificaie
=0,05.
d) S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie =0,05.
e) Dac modelul s-a dovedit semnificativ, s se previzioneze valoarea profitului dac s-ar fi obinut vnzri n valoare de
200 mil. RON.
f) S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie, testnd semnificaia acestuia
pentru un nivel de semnificaie =0,05.
g) Ce pondere din variaia totala a profitului este explicata de influenta vnzrilor?
13. Pentru un magazin se cunosc vnzrile de cmi brbteti i profitul obinut pentru 8 zile consecutive:
Profit (unitati monetare)
Numar de camasi vandute ( zeci bucati)

30
3

42
4

10
1

62
6

12
1

30
2

21
2

58
5

a) S se reprezinte grafic datele;


b) S se determine modelul de regresie n eantion, calculnd valorile ajustate ale profitului n funcie de vnzri;
c) S se verifice semnificaia modelului de regresie gsit la punctul b) folosind testul F, pentru un nivel de semnificaie
=0,05.
d) S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie =0,05.
e) Dac modelul s-a dovedit semnificativ, s se previzioneze valoarea profitului dac s-ar fi vndut 8 zeci buc. de
cmi.
f) S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie, testnd semnificaia acestuia
pentru un nivel de semnificaie =0,05.
g) Ce pondere din variaia total a profitului este explicat de influena vnzrilor de cmi?

66

14. Managerul unui magazin alimentar dorete s cunoasc dependena dintre valoarea vnzrilor i profit. Pentru
aceasta nregistreaz timp de 9 luni date privind vnzrile i profitul (mil. RON). n urma prelucrrii datelor (utiliznd
EXCEL) i a specificrii ecuaiei de regresie (n ipoteza legturii liniare) care modeleaz dependena dintre cele 2
variabile se obine :
Val. Vnz. (mil. RON)
Mean
Median
Mode
Standard Deviation
Smple Variance
Sum
Count

10
12
14
5.267826876
27.75
90
9

yi = 0.07844 + 0.0117 xi , iar dispersia erorilor este

Profit (mil. RON)


Mean
Median
Mode
Standard Deviation
Smple Variance
Sum
Count

0.195555556
0.2
0.15
0.064828834
0.004202778
1.76
9

se2 =0.00045311.

Se cere:
a) Validai modelul de regresie obinut.
b) Testati semnificaia parametrilor ecuaiei de regresie.
c) Calculai i testai semnificaia coeficientului liniar de corelaie.
15. Pentru a analiza dependena dintre suprafaa cultivat (ha) i producia la hectar (q/ha) s-au nregistrat date
referitoare la aceste variabile pentru 10 parcele. n urma prelucrrii datelor (utiliznd EXCEL) i a specificrii ecuaiei de
regresie (n ipoteza legturii liniare) care modeleaz dependena dintre cele 2 variabile se obine :
Supr. cultivata. (ha)
Mean
82.4
Standard Deviation
11.296017
Smple Variance
127.6
Sum
824
Count
10

y i = 22.8711 + 0.576 xi , iar dispersia erorilor este

Productia la hectar (q/ha)


Mean
24.6
Standard Deviation
7.501111029
Smple Variance
56.26666667
Sum
246
Count
10
se2 =15.656.

Se cere:
a) Validai modelul de regresie obinut.
b) Determinai intervalul de ncredere pentru parametrii ecuaiei de regresie.
c) Analizai intensitatea legturii dintre cele dou variabile cu ajutorul unui indicator adecvat i testai semnificaia
acestuia.
16. Pentru un mare magazin alimentar s-au cules date privind vnzrile (mii RON) i profitul (mii RON) realizate
n 9 luni ale anului 2007. n urma studierii legturii liniare dintre cele dou variabile, s-au obinut urmtoarele rezultate:
ANOVA
Regression
Residual
Total

df
1
...
8

SS
0,03045
.
.

Intercept
Val. Vnz.

Coefficients
0,078438
0,011712

Standard
Error
.
0,001429

MS
..
0,000453

t Stat

P-value
0,001719
7,8E-05

tiind c valoarea medie a vnzrilor este de 10 mii RON/luna, se cere:

67

Significance F
0,0000779643

a) S se completeze informaiile lips din tabelele de mai sus;


b) S se testeze semnificaia modelului liniar de regresie, pentru un nivel de semnificaie de 5%
c) S se testeze semnificaia parametrilor modelului, pentru acelai nivel de semnificaie.
17. Pentru 8 agenii de turism s-au nregistrat datele privind numrul biletelor vndute i profitul obinut (mii
RON). n urma analizei legturii liniare dintre cele dou variabile, s-au obinut urmtoarele rezultate:

ANOVA
df
Regression
Residual
Total

Intercept
Nr. bilete
vndute

SS
.
0,450829
.

MS
0,438258
..

Coefficient
s
-0,435

Standard
Error
0,856914

t Stat

P-value
0,629823

0,001382

0,05221

Significance F
0,05221

tiind c dispersia numrului de bilete vndute este de 32796,79 se cere:


a) S se completeze informaiile lips din tabelele de mai sus;
b) S se determine intervalele de ncredere pentru parametrii modelului, pentru un nivel de semnificaie de 5%.
c) Ce procent din variaia profitului a fost determinat de influena numrului de bilete vndute?

68