Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
2. Presupunem c pentru 100 de observaii asupra unei variabile aleatoare X s-a obinut media x =110 i abaterea
standard 60.
a) Testai ipoteza nul c =100, cu alternativa >100, utiliznd = 0,05.
b) Testai ipoteza nul c = 100, cu alternativa 100, utiliznd = 0,05. Comparai rezultatele celor dou teste.
Rezolvare:
a) n = 100;
x =110 ;
sx = 60;
= 0,05.
Considerm:
H0: = 0=100,
H1: > 0=100.
Se aplic testul z unilateral dreapta:
x 0
P
z = 1
sx / n
x 0 + z
sx
n
z 0, 05 =1,645
0 + z
sx
n
= 100 +
60
100
1,645 = 109,870
Cum x =110 > 109,870, suntem n regiunea critic deci se respinge H0.
b) H0: = 100;
H1: 100.
Se aplic testul z bilateral.
x 0
P z
z = 1 ;
2
2 sx / n
z 0, 05 = 1,96
2
0 z
sx
sx
n
z =
2
x 0 + z
2
60
100
sx
n
1,96 = 11,76 ;
x =11,85 kg,
medie cutiile au cte 12 kg, cu alternativa c greutatea este diferit de 12 kg. (<12 kg sau >12 kg), pentru o probabilitate
de 95%.
Rezolvare:
H0: = 0 = 12 kg;
H1: 12 kg ( < 12 kg sau > 12 kg).
Testul statistic: z =
x 0
x 0
11,85 12
=
=
= 3,0 .
sx
0,5 / 10
sx / n
= 0 = 100 u.m, cu ipoteza alternativ > 0 = 100 u.m, utiliznd un nivel de ncredere 1 - = 0,95 (probabilitatea
(1-)100 = 95%).
b) Testai ipoteza nul = 0 = 100 u.m, cu ipoteza alternativ 0 = 100 u.m, cu aceeai probabilitate. Interpretai
rezultatele.
Rezolvare:
a) H0: = 0 = 100 u.m
H1: > 0 = 100 u.m.
Testul statistic: z =
x 0
x 0 110 100
=
=
= 1,67
sx
60 / 10
sx / n
Cum z calc > z , rezult c ipoteza nul este respins ( = 0 = 100 u.m.) i se accept ipoteza alternativ (
x 0
x 0 110 100
=
=
= 1,67 .
sx
60 / 10
sx / n
Cum z calc < z / 2 , (1,67 < 1,96), rezult c se accept ipoteza nul (valoarea medie a biletelor cumprate nu este
semnificativ diferit de 100 u.m.).
5. Un productor de baterii dorete s verifice dac procentul bateriilor defecte este mai mic de 5%. Presupunem
c sunt selectate aleator 300 de baterii, fiecare dintre acestea este testat i c sunt gsite 10 baterii de fecte. Ofer aceste
informaii suficiente dovezi c procentul bateriilor defecte este mai mic de 5%? Utilizai o probabilitate de 99% de
garantare a rezultatelor.
Rezolvare:
H0: p = 0,05 ;
H1: p < 0,05.
Testul statistic:
z=
f p0
=
sf
f p0
f (1 f )
n
f = 10 / 300 = 0,03;
sf =
z=
f (1 f )
=
n
0,03 0,97
= 0,0098 0,01 ;
300
0,03 0,05
= 2
0,01
Cum z calc < z , (2 < 2,33), rezult c ipoteza nul nu se respinge, aadar nu avem suficiente dovezi pentru a afirma c
procentul bateriilor defecte este mai mic de 5%.
6. Presupunem c suntei interesai n efectuarea testului statistic:
H 0 : = 200,
H 1 : > 200,
i utilizai regula de decizie: Se respinge H 0 dac media eantionului de 100 de uniti este mai mare de 212. Deviaia
standard n populaie este de 80. Probabilitatea comiterii unei erori de genul nti este:
a) 13,36%;
b) 6,68%;
c) 43,32%;
d) 0,4332;
e) 3,34%.
Rezolvare: b)
7. ntr-un proces de verificare a ipotezelor statistice nivelul de ncredere reprezint probabilitatea:
a) ;
b) 1-;
c) ;
d) 1-;
e) +.
Rezolvare: b)
8. O variabil aleatoare X urmeaz o repartiie normal de parametri x i 2 dac are densitatea de repartiie:
a)
2
1
exp
xx ;
2
2
2
b)
2
1
1
exp
xx ;
2
c)
2
1
exp
x
x
;
2
2 2
d)
2
1
exp
x+x ;
2
2
2
e)
2
1
exp 2 x x .
2
2
Rezolvare: c)
9. Un omer care caut un loc de munc ntr-o anumit industrie culege informaii despre salariul oferit de
firmele din aceast industrie. Presupunem c distribuia salariului oferit angajailor de calificare similar poate fi
aproximat cu o distribuie normal de medie 800 mii lei i o abatere medie ptratic de 200 mii lei. n plus, presupunem
c muncitorului i se ofer 1150 mii lei de ctre prima firm contactat. Proporia ofertelor salariale care ar putea s se
situeze peste acest nivel este:
a) 4,01%;
b) 8,02%;
c) 54,01%;
d) 91,98%;
e) 45,99%.
Rezolvare: a)
10. Un distribuitor de sucuri livreaz baxuri de cte 8 sticle i cunoate probabilitatea (p=0,02) ca o sticl s se sparg
pe durata transportului. Dac se transport 4000 de baxuri, numrul baxurilor n care se vor gsi dou sau mai multe sticle
sparte este de aproximativ:
a) 85;
b) 14;
c) 3960;
d) 41;
e) 40.
Rezolvare: d)
11. ntr-un spital, 50% din pacienii internai mnnc regim fr sare. Alctuind grupuri de cte 6 pacieni,
probabilitatea ca exact 2 pacieni s in regim fr sare este:
a) 0,015625;
b) 0,2344;
c) 0,9375;
d) 0,50;
e) 0,0468.
Rezolvare: b)
12. n testarea ipotezei statistice privitoare la parametrul media populaiei:
H 0 : = 0 ,
H 1 : < 0 .
Cnd datele provin de la un eantion de volum redus, regiunea critic este dat de:
a)
z < z ;
b)
z < z / 2 ;
c)
t < t,n ;
d) t < t / 2,n ;
e)
t < t, n 1 .
Rezolvare: e)
13. O caracteristic important de calitate pentru sucurile de fructe mbuteliate este proporia de concentrat natural
pe care o conin. ntr-un proces de fabricaie a unei mrci de sucuri, presupunem c procentul de concentrat natural este
aproximativ normal distribuit, cu media 40% i coeficientul de variaie 8%. Sticlele care conin mai puin de 36%
concentrat natural sunt respinse calitativ. Dac 20.000 de sticle sunt verificate, la controlul calitativ pot fi respinse
aproximativ:
a) 2112 sticle;
b) 4224 sticle;
c) 1056 sticle;
d) 124 sticle;
e) 248 sticle.
Rezolvare: a)
14. Atunci cnd datele provin dintr-un eantion de volum redus (n) i se testeaz ipoteza nul privind parametrul
media ntregii colectiviti:
H 0 : = 0 ,
H 1 : > 0 .
z > z ;
b)
z > z / 2 ;
c)
t > t; n 1 ;
d) t > t / 2 ;
e)
t > t2; n 1 .
Rezolvare: c)
15. Probabilitatea ca o companie de asigurri s fie inut s plteasc o poli pentru o problem medical major
este 0,001. Dac un grup de 2000 de persoane asigurate sunt selectate ntmpltor, probabilitatea ca aceast companie s
plteasc cel puin o poli persoanelor selectate este:
a) 0,8196;
b) 0,1804;
c) 0,1353;
d) 0,8647;
e) 0,001.
Rezolvare: d)
16. Perioada de timp ct funcioneaz un anumit tip de baterii este normal distribuit cu o medie de 50 de ore i o
deviaie standard de 15 ore. Probabilitatea ca o baterie s funcioneze ntre 30 i 70 de ore este:
a) 0,5918;
b) 0,4082;
c) 0,8164;
d) 0,1836;
e) 0,7959.
Rezolvare: c)
17. n testarea ipotezei statistice privind media populaiei, cnd datele provin de la un eantion de volum redus (n)
i:
H 0 : = 0 ,
H 1 : 0 ,
b)
Rezolvare: e)
18.
a)
f ( xi ) =
b)
f ( xi ) =
c)
f ( xi ) =
d)
f ( xi ) =
e)
f ( xi ) =
20,92
35
1
17,5 2
1
17,5 2
1
4,18 2
1
4,18 2
x =20,9
1
217,52
( xi 20,9 ) 2
( xi 20,9 ) 2
217,5
( xi 20,9 ) 2
24,18
( xi 20,9 )2
217,5
;
;
.
Rezolvare: e)
19. n testarea ipotezei statistice
H 0 : = 100,
H 1 : < 100,
utiliznd testul z se obine valoarea testului z = -1,11. Nivelul de ncredere al testului este:
a) 86,65%;
b) 36,65%;
c) 13,35%;
d) 26,70%;
e) 73,30%.
Rezolvare: a)
20. ntr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea este:
a) eroarea pe care o facem acceptnd ipoteza nul cnd ea este adevrat;
b) eroarea pe care o facem acceptnd ipoteza alternativ cnd ea este fals;
c) eroarea pe care o facem acceptnd ipoteza nul cnd ea este fals;
d) eroarea pe care o facem eliminnd ipoteza nul cnd ea este adevrat;
e) eroarea pe care o facem eliminnd ipoteza alternativ atunci cnd ea este fals.
Rezolvare: c)
21. Un sistem al unui vehicul spaial trebuie s funcioneze continuu pentru ca nava s reintre n spaiu. O
component a sistemului funcioneaz corespunztor 85% din timp. Pentru a asigura buna funcionare a sistemului, sunt
montate patru componente similare, n aa fel nct sistemul funcioneaz dac cel puin o component lucreaz.
Componentele opereaz independent. Probabilitatea ca sistemul s cad este:
a) 0,05%;
b) 5%;
c) 15%;
d) 52,20%;
e) 0,5220%.
Rezolvare: a)
22. n testarea ipotezei statistice
H 0 : = 100,
H 1 : < 100.
24. O variabil aleatoare X are o distribuie normal, de medie 50 i dis persie 9. Valorea 0, pentru care
P( x 0 ) = 0,8413 , este:
a) 54,23;
b) 45,77;
c) 53;
d) 59;
e) 46.
Rezolvare: c)
25. Probabilitatea ca valorile unei variabile aleatoare normale s se situeze la o distan mai mare de 1,96 ori
abaterea medie ptratic de o parte i de alta fa de medie este:
a) 5%;
b) 0,05%;
c) 2,5%;
d) 47,50%;
e) 97,5%.
Rezolvare: a)
26. Un grup de 10 angajai este ales dintr-o companie n scopul de a determina numrul celor care susin sindicatul
companiei. Presupunem c 60% din toi angajaii susin sindicatul.
Probabilitatea ca mai puin de 7 angajai din cei 10 s susin sindicatul este:
a) 61,78%;
b) 38,22%;
c) 83,28%;
d) 21,50%;
e) 16,72%.
Rezolvare: a)
27. O main utilizat pentru a doza cantitatea de culoare n vopsea, dozeaz n medie m ml pe cutie de vopsea.
Cantitatea de culoare dozat este cunoscut a avea o distribuie normal cu dispersia egal cu 0,160. Dac mai mult de 6
ml de culoare este amestecat n obinerea unei nuane de albastru, vopseaua este respins. Valoarea lui , astfel nct s
nu fie respinse mai mult de 1% din cutii, este:
a) 5,072;
b) 5,6272;
c) 5,536;
d) 5,068;
e) 5,6288.
Rezolvare: d)
28. n testarea ipotezei statistice privitoare la parametrul media populaiei, regiunea critic este dat de:
t < t; n 1 cnd:
a) datele provin dintr-un eantion de volum redus i se efectueaz test unilateral stnga;
b) datele provin dintr-un eantion de volum redus i se efectueaz test unilateral dreapta;
c) datele provin dintr-un eantion de volum normal, se cunoate dispersia populaiei i s-a efectuat test unilateral
stnga;
d) datele provin dintr-un eantion de volum redus i s-a efectuat test bilateral;
e) datele provin dintr-un eantion de volum normal i s-a efectuat test bilateral.
Rezolvare: a)
29. O distribuie de eantioane este o:
a)
b)
c)
d)
e)
Rezolvare: c)
30. Care dintre urmtoarele modificri nu determin, uzual, schimbri i in distribuia de eantioane?
a) Modificri n volumul populaiei;
b) nlocuirea indicatorului
cu Me;
Necesit ca fiecare element din colectivitatea general s fie reprezentat cnd procesul seleciei este terminat.
Rezolvare: d)
32. Dac din colectivitatea general format din elementele: 1, 2, 4, 5 se selecteaz aleator repetat eantioane de 2
uniti, valorile posibile ale lui
sunt:
a) 1; 2; 4; 5;
b) 1; 2; 3; 4; 5;
c) 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5;
d) 1,5; 2,5; 3,5; 4,5;
10
e) 2; 3; 4.
Rezolvare: c)
33. Dac notm xmax valoarea maxim dintr-un eantion, care dintre urmtorii termeni este corect pentru a descrie
xmax?
a) valoare ateptat;
b) median;
c) estimator;
d) parametru;
e) abatere medie ptratic.
Rezolvare: c)
34. Dac dou sondaje electorale sunt realizate obiectiv, utiliznd eantionarea aleatoare, sunt posibile rezultate
diferite, deoarece:
a) sondajele pot fi efectuate n zile diferite;
b) ntrebrile pot fi formulate diferit i pot induce rspunsuri diferite de la aceeai persoan;
c) pot fi utilizate mrimi diferite ale eantioanelor;
d) pot rezulta eantioane diferite din aceeai populaie;
e) toate de mai sus.
Rezolvare: e)
35. Distribuia de eantioanare a lui
x:
x;
x;
cnd se modific n;
a) este o cale de a face o interferen statistic care evit ca cineva s cread c o valoare estimat este
valoarea real;
b) i schimb mrimea dup cum componentele
11
selectai aleator 30 de persoane i au fost ntrebate ce mnnc n mod regulat la micul dejun i la masa de prnz. Fiecare
persoan a fost identificat ca un consumator sau nonconsumator de cereale la micul dejun i fiecrei persoane i-au fost
calculate numrul de calorii consumate la masa de prnz.
Rezultatele obinute sunt urmtoarele:
Consumatori de cereale:
640, 605, 529, 591, 596, 564, 615, 560, 635, 623 (calorii)
Nonconsumatori de cereale:
502, 703, 735, 707, 523, 534, 768, 626, 620, 589, 736, 565, 686, 529, 632, 951, 744, 632, 593, 847 (calorii)
Se poate spune cu un nivel de semnificaie de 5% c specialistul are dreptate?
Rezolvare:
Identificarea metodei:
Specialistul trebuie s compare media consumului de calorii pentru populaia consumatorilor de cereale cu cea a
nonconsumatorilor de cereale. Datele sunt cantitative.
Ipoteza care trebuie testat este: H 0: 1= 2 cu alternativa
al caloriilor consumate de consumatorii de cereale la masa de prnz este mai mic dect al neconsumatorilor de cereale.
Pentru a putea identifica testul ce trebuie aplicat se vor calcula i compara abaterile medii ptratice.
Acestea sunt: s1 = 35,7 i s2 = 115,7.
Deoarece sunt complet diferite va fi aplicat testul t pentru variaii inegale.
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
2. Apsai Tools/Data Analysis i apoi t-Test: Two-Sample Assuming Unequal Variances
3. Specificai variabila 1: A1:A11
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK
Se obin rezultatele:
Mean
Variance
Observations
Hypothesized Mean Difference
Df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail
Variable 1
595.8
1273.511
10
0
25
-2.31433
0.014576
1.70814
0.029153
2.059537
Variable 2
661.1
13375.25
20
EXCEL listeaz mediile, dispersiile i dimensiunile eantioanelor. De asemenea listeaz rezultatele statistice legate de
testarea de ipoteze.
Valoarea statisticii t este -2,31433.
12
Valoarea p pentru test unilateral este 0,014576 (pragul de semnificaie = 1 probabilitatea de garantare a rezultatelor).
Valoarea p pentru test bilateral este 0,029153.
EXCEL mai listeaz i valorile critice pentru cele dou cazuri, pentru un nivel de semnificaie de 5%.
Deoarece valoarea p pentru testul unilateral este mic putem spune c aceste date dovedesc c cei care consum
cereale la micul dejun consum mai puine calorii la masa de prnz (se accept ipoteza alternativ, c exist diferene
semnificative), cu o probabilitate de 98,54%.
Rezolvare folosind STATISTICA:
1. Se creaz un fiier cu 2 variabile i 30 de cazuri (File/New data). Se introduc datele astfel:
- prima variabil numrul de calorii consumate la masa de prnz
- a doua variabil consumatori de cereale: 1; nonconsumatori de cereale: 0
2. Selectai modulul Basic Statistics and Tables i apoi t-test for independent samples. Apsai OK.
3. La Variabile selectai:
- Grouping variable: variabila de grupare - consumatori sau nonconsumatori de cereale
- Dependent variables: variabila dependent - numrul de calorii consumate la masa de prnz
4. Introducei:
- Code for Group 1 = 0
- Code for Group 2 = 1
5. Apsai T tests
Se obin rezultatele:
13
Timpii de asamblare
Varianta A: 6,8; 5,0; 7,9; 5,2; 7,6; 5,0; 5,9; 5,2; 6,5; 7,4; 6,1; 6,2; 7,1; 4,6; 6,0; 7,1; 6,1; 5,0; 6,3; 7,0; 6,4; 6,1; 6,6; 7,7; 6,4
(ore)
Varianta B: 5,2; 6,7; 5,7; 6,6; 8,5; 6,5; 5,9; 6,7; 6,6; 4,2; 4,2; 4,5; 5,3; 7,9; 7,0; 5,9; 7,1; 5,8; 7,0; 5,7; 5,9; 4,9; 5,3; 4,2; 7,1
(ore)
Rezolvare:
Identificarea metodei: Datele sunt cantitative iar obiectivul experimentului este de a compara timpii de asamblare
pentru cele dou populaii. Deci ipoteza care trebuie testat este H0: 1= 2 cu alternativa H1: 1 2.
Pentru a putea identifica testul ce trebuie aplicat se vor calcula i compara abaterile medii ptratice.
Acestea sunt: s1 = 0,921 i s2 = 1,14.
Deoarece ele sunt aproximativ egale va fi aplicat testul t pentru dispersii egale (se poate aplica un test statistic pentru
semnificaia diferenei dintre dispersii vezi Exemplul 4.22).
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Varianta A iar n B1 Varianta B.
2. Apsai Tools/Data Analysis i apoi t-Test: Two-Sample Assuming Equal Variances
3. Specificai variabila 1: A1:A26
4. Specificai variabila 2: B1:B26
5. Specificai Hypothesized Mean Difference: 0, apsai Labels. Apsai OK
Se obin rezultatele:
Varianta B
6.016
1.30306667
25
Valoarea statisticii este 0,927. Deoarece este un test bilateral, valoarea p este 0,358. Valoarea critic este 2,01. Cum
valoarea statisticii t este mai mic dect valoarea critic, se accept ipoteza nul (mediile nu difer semnificativ). Se
observ c mediile difer semnificativ doar pentru o probabilitate de 64% (adic 1-p).
Rezolvare folosind STATISTICA:
1. Se creaz un fiier cu 2 variabile i 50 de cazuri (File/New data). Se introduc datele astfel:
14
Maina
1 2 3 4 5 6 7 8 9 10
Distana parcurs n mii de 57 64 102 62 81 87 61 62 74 62
kilometri cu tipul de anvelope noi
Distana parcurs n mii de 48 50 89 56 78 75 50 49 70 66
kilometri cu tipul de anvelope
vechi
Maina
11 12 13 14 15 16 17 18 19 20
Distana parcurs n mii de 100 90 83 84 86 62 67 40 71 77
kilometri cu tipul de anvelope noi
Distana parcurs n mii de kilo- 98 86 78 90 98 58 58 41 61 82
metri cu tipul de anvelope vechi
Rezolvare:
Identificarea metodei:
Deoarece cele dou tipuri de anvelope sunt instalate pe aceleai maini, vom avea de testat dac mediile a dou
populaii dependente sunt egale.
Datele sunt cantitative iar obiectivul experimentului este de a compara numrul de kilometrii parcuri pentru cele dou
populaii pereche. Deci ipoteza care trebuie testat este H0: 1= 2 cu alternativa H1: 1 2.
15
Anvelope vechi
69.05
316.3658
20
Valoarea testului este 2,8176. Deoarece este un test bilateral, valoarea p este 0,01. Valoarea critic este 2,09.
Rezolvare folosind STATISTICA:
1. Se creaz un fiier cu 2 variabile i 40 de cazuri (File/New data). Se introduc datele astfel:
- prima variabil distana parcurs
- a doua variabil tipul anvelopelor: 0 pentru anvelope noi, 1 pentru anvelope vechi
2. Selectai modulul Basic Statistics and Tables i apoi t-test for dependent samples.
3. La Variabile selectai:
- Grouping variable: variabila de grupare tipul anvelopelor
- Dependent variables: variabila dependent distana parcurs
4. Introducei:
- Code for Group 1 = 0
- Code for Group 2 = 1
5. Selectai T tests
Se obin rezultatele:
16
Valoarea testului este t = 2,8176. Valoarea p este 0,01. Mediile sunt 73,6 mii de kilometri parcuri cu anvelopele noi i
69,05 mii de kilometri parcuri cu cele vechi.
Deoarece valoarea lui p este mic se respinge ipoteza nul conform creia cele dou medii sunt egale. Deci se poate
spune c anvelopele de tip nou sunt mai bune ca cele de tip vechi.
40.
Folosind datele problemei 36 s se dac dispersiile (variaiile) celor dou populaii sunt egale
Rezolvare:
Identificarea metodei:
Ipotezele sunt:
H0: 12/22=1 cu alternativa H1: 12/221
Expresia testului este:
F= s12/s22
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 se scrie Consumatori iar n B1 Nonconsumatori.
2. Apsai Tools/Data Analysis i apoi F-Test Two-Sample for Variances
3. Specificai variabila 1: A1:A26
4. Specificai variabila 2: B1:B26
5. Apsai Labels i apoi OK.
Se obin rezultatele:
Mean
Variance
Observations
df
F
P(F<=f) one-tail
F Critical one-tail
Consumatori
595.8
1273.51
10
9
0.0952
0.00053
0.3392
Nonconsumatori
661.1
13375.25
20
19
Excel calculeaz statistica F ca raportul ntre dispersia cea mai mare i dispersia cea mai mic. Statistica F n cazul
nostru este 0,095 iar valoarea p asociat testului unilateral este 0,00053. Valoarea p corespunztoare testului bilateral
(pragul de semnificaie) este 2 0,00053 = 0,00106. Deoarece aceast valoare este foarte apropiat de zero, ipoteza nul
se respinge, deci cele dou dispersii difer semnificativ. Aadar utilizarea testului t pentru dispersii inegale n problema
36 este justificat.
17
41. O companie de asigurri de via se gndete a oferi discount-uri nefumtorilor. De aceea organizeaz un
sondaj prin care sunt selectate 40 de persoane: 20 fumtoare i 20 nefumtoare. Persoanele sunt ntrebate dac au sau nu
boli cardiovasculare (codificarea este 1- persoan cu afeciuni cardiovasculare; 0 - persoan fr afeciuni
cardiovasculare). Datele obinute sunt:
Fumtori
1 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0
Nefumtori 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1
Se poate spune, cu un nivel de semnificaie de 5% c incidena bolilor cardiovasculare este mai mare la fumtori ca la
nefumtori? Din cercetri anterioare au rezultat urmtoarele dispersii n populaia total: 0,2 pentru fumtori, respectiv
0,15 pentru nefumtori.
Rezolvare:
Identificarea metodei: Datele sunt calitative i alternative iar obiectivul experimentului este de a compara dou
proporii: proporia fumtorilor cu boli cardiovasculare i proporia nefumtorilor cu boli cardiovasculare. Deci ipoteza
care trebuie testat este H0: p1= p2 cu alternativa H1: p1 > p2. Pentru aceasta se va aplica un test z deoarece dispersiile sunt
cunoscute.
Rezolvare folosind EXCEL:
1. Introducei datele pe dou coloane. n A1 tastai Fumtori iar n B1 Nefumtori.
2. Apsai Tools/Data Analysis i apoi z-Test: Two-Sample for Means
3. Specificai variabila 1: A1:A21
4. Specificai variabila 2: B1:B21
5. Specificai Hypothesized Mean Difference: 0, apsai Labels.
6. Introducei varianele (Variable 1 Variance (known): 0,2 i Variable 2 Variance (known): 0,15). Apsai OK.
Se obin rezultatele:
Nefumtori
0.2
0.15
20
Sunt calculate cele dou proporii: 25% dintre fumtori i 20% dintre nefumtori au o afeciune cardiovascular.
Valoarea statisticii z este 0,378 cu o valoare p de 0,35 (one-tail test unilateral). Deoarece valoarea p nu este apropiat de
zero (p>0,05), ipoteza nul se accept. Pentru un nivel de semnificaie de 5%, cele dou proporii sunt egale, deci, nu se
poate spune c incidena afeciunilor cardiovasculare este mai mare la fumtori ca la nefumtori.
42.
Distribuia unui lot de noi automobile, dup consumul de carburant la 100 km parcuri, se prezint astfel:
18
Nr. automobile
4
12
44
90
107
86
36
15
6
400
x=
s x2
x i ni
ni
3198,8
= 7,997 8 litri
400
)2
x i x ni
ni
143,84
= 0,3596
400
sx = 0,5997 litri
b) Se calculeaz valorile variabilei normale normate pentru limitele superioare ale intervalelor:
zi =
xi sup x
Limita superioar a ultimei grupe se consider +, iar limita inferioar a primului interval se consider -, innd cont
de faptul c distribuia normal tinde ctre 0, asimptotic.
c) Se calculeaz probabilitile (zi), ce reprezint probabilitile ca o valoare z s fie cuprins ntre 0 i zi, innd cont c
( z i ) = ( zi )
d) Probabilitile teoretice ca o valoare s se situeze n intervalul i sunt:
pi = F ( zi sup ) F ( zi 1 sup ) sau pi = ( zi sup ) ( zi 1 sup ) .
( ni npi ) 2
i =1
npi
2
g) Din tabel rezult: calculat = 3,44 .
19
2
Din tabelele anexe se citete valoarea lui tab
,=0, 05,l =6 =12,5916 , unde l = numrul gradelor de libertate, l = r k
1 = 9 - 2 - 1 = 6.
2
2
Cum calculat
, se accept ipoteza c ntre distribuia empiric i cea teoretic exist concordan.
< tab
Limitele
intervalelor
6,2-6,6
6,6-7,0
7,0-7,4
7,4-7,8
7,8-8,2
8,2-8,6
8,6-9,0
9,0-9,4
9,4-9,8
Total
Limitele
intervalelo
r
6,2-6,6
6,6-7,0
7,0-7,4
7,4-7,8
7,8-8,2
8,2-8,6
8,6-9,0
9,0-9,4
9,4-9,8
Total
43.
zi =
ni
xi
xini
( x i x ) 2 ni
4
12
44
90
107
86
36
15
6
400
6,4
6,8
7,2
7,6
8,0
8,4
8,8
9,2
9,6
-
25,6
81,6
316,8
684,0
856,0
722,4
316,8
138,0
57,6
3198,8
10,24
17,28
28,16
14,40
0
13,76
23,04
21,60
15,36
143,84
xi sup x
(z)
pi
npi
sx
-2,3340
-1,6675
-1,0005
-0,3335
0,3335
1,0005
1,6675
2,3340
( ni npi ) 2
npi
-0,4901
-0,4525
-0,3413
-0,1293
0,1293
0,3413
0,4525
0,4901
0,5000
-
0,0099
0,0376
0,1112
0,2120
0,2586
0,2120
0,1112
0,0376
0,0099
1,00
4
15
44
85
104
85
44
15
4
400
0
0,6
0
0,29
0,09
0,01
1,45
0
1
3,44
Un analist economic studiaz distribuia firmelor dup procentul din venituri cheltuit pentru cercetare-
dezvoltare. Pentru a verifica ipoteza normalitii empirice obinute, el utilizeaz testul 2 i obine, pentru un numr de
2
grade de libertate, l=10, valoarea calc
=18,30 . Probabilitatea maxim cu care se garanteaz rezultatul este:
a) 75%;
b) 90%;
c) 95%;
d) 99%;
e) 97,5%.
Rezolvare: b)
20
21
b) Care este probabilitatea comiterii unei erori de tipul I? Dar probabilitatea comiterii unei eroeri de tipul II?
6. Se efectueaz testarea unei ipoteze statistice utiliznd = 0,05 (test unilateral). Pentru care dintre urmtoarele
valori ale lui (z) (corespunztoare valorii calculate a testului) va fi respins ipoteza nul?
a) 0,44;
b) 0,499;
c) 0,40;
d) 0,249;
e) 0,49;
f) 0,458.
7. Pentru fiecare din valorile ( zcalc) i observate, specificai dac ipoteza nul este respins n cazul testului
bilateral:
a) = 0,05; (zcalc) = 0,40;
b) = 0,10; ( zcalc) = 0,45;
c) = 0,01; ( zcalc) = 0,499;
d) = 0,025; ( zcalc) = 0,45;
e) = 0,10; ( zcalc) = 0,05.
8. ntr-un test n care se testeaz ipoteza nul H 0 : = 100 cu H 1 : > 100 se obine valoarea testului z = 2,26.
Aflai pragul de semnificaie corespunztor valorii calculate a testului.
9. Dac se testeaz H 0 : = 100 cu H 1 : 100 i se obine z = 2,08 aflai pragul de semnificaie corespunztor
valorii calculate a testului.
10. Un fabricant de automobile a estimat c un nou tip de maini obine un consum mediu de 11 litri la 100 km,
dar compania care dorea s comercializeze aceste maini pretindea c acest consum depete estimaia productorului.
Pentru a susine afirmaia, compania a selectat 36 de maini i a nregistrat consumul. Au rezultat datele:
x =11,8
litri /
Noua metod:
n1 = 50
n2 = 50
x1 = 27,3 minute
x 2 = 25,4 minute
22
s1 = 3,7 minute
s 2 = 3,1 minute
S se arate, utiliznd o probabilitate de 95%, dac rezultatele ofer suficiente informaii pentru a indica faptul c noua
metod duce la un consum de timp semnificativ mai mic.
12. Analiza unui eantion aleator de 49 de observaii a dus la urmtoarele rezultate:
xi x
x =20,7 ;
)2 = 2,155 .
a) Testai ipoteza nul = 0,47 , cu ipoteza alternativ: < 0,47 , utiliznd o probabilitate de 90%.
b) Testai ipoteza nul = 0,47 cu ipoteza alternativ 0,47 utiliznd o probabilitate de 90%.
13.
Un analist financiar presupune c valoarea facturilor emise de firma la care lucreaz este, n medie, de peste
10 mii lei/factur. Pentru a susine aceast ipotez, el selecteaz aleator 48 de facturi emise n ultima lun, pentru care
nregistreaz valorile (mii lei): 10, 2, 12, 8, 12, 8, 9, 10, 11, 9, 9, 10, 10, 9, 10, 10, 11, 9, 8, 9, 6, 10, 7, 10, 9, 13, 9, 10, 11,
10, 9, 9 , 9, 17, 12, 6, 10, 8, 7, 9, 11, 12, 10, 11, 12, 9, 7, 9. S se testeze ipoteza analistului pentru o probabilitate de
garantare a rezultatelor de 99%.
14.
Presupunem c n urma unui sondaj aleator de 100 de observaii, pentru o caracteristic alternativ s-a obinut
media f = 0,63 i dorim s testm ipoteza nul c, n colectivitatea general, media p este 0,7 cu ipoteza alternativ p <
0,7. S se utilizeze un prag de semnificaie = 0,05. S se testeze, pentru acelai prag de semnificaie, ipoteza nul p =
0,7 cu ipoteza alternativ p 0,7.
15.
Un eantion aleator de 50 de persoane a fost testat cu privire la un nou produs de snack-food. Rspunsurile au
Presupunem c ai selectat un eantion aleator de 1600 de persoane dintr-o populaie general ce conine 20%
(p = 0,2) persoane favorabile unei propuneri. Care este probabilitatea ca proporia din eantion (f) s difere de cea din
colectivitatea general (p) cu mai mult de 1%?
17.
Un productor de imprimante pentru calculatoare personale dorete s estimeze media numrului de caractere
tiprite pn cnd se consum cerneala. Costul crescut al unei astfel de anchete impune utilizarea unui eantion de volum
redus. Presupunem c au fost testate n = 15 imprimante i s-au calculat:
x =1,13
caractere.
a) S se testeze cu o probabilitate de 90% intervalul de ncredere pentru numrul mediu de caractere.
23
b) S se testeze ipoteza nul =1,00 milioane, cu ipoteza alternativ >1,00 milioane caractere, utiliznd o
probabilitate de 95%, n ipoteza distribuiei normale a numrului de caractere n colectivitatea general.
18.
Valoarea medie a unei locuine aflate n imediata apropiere a unui colegiu este de 58.950 unitati monetare. Se
presupune ca valoarea locuinelor crete cu ct ele sunt situate mai aproape de acest colegiu. Pentru a testa aceast
ipotez, au fost selectate aleatoriu 12 locuine din zona colegiului; n urma evalurii acestora, a rezultat o valoare medie
de 62.460 uniti monetare, cu o abatere medie patratic de 5.200 uniti monetare. Testai aceast ipotez, pentru un nivel
de semnificaie de 5%.
19.
Un reporter se documenteaz pentru un articol privind costurile tot mai ridicate ale educaiei primite n
nvmntul superior. Pentru aceasta, el a luat n considerare variabila costul unui manual n semestrul n curs
(variabila x). n urma considerrii unui eantion de 41 de manuale, el a gsit c:
( x
= 550,22 u.m.;
=1617,984 . Se cere:
a) gsii media i abaterea medie ptratic a costului unui manual n semestrul n curs, la nivelul eantionului considerat;
b) testai ipoteza conform creia valoarea medie a unui manual este mai mic de 15 u.m., pentru un nivel de semnificaie
de 1%.
20. Pentru a estima proporia cetenilor care sunt de acord cu un program social susinut de Guvern, s-a considerat
un eantion aleatoriu de 1000 de persoane. Daca 545 au rspuns c sunt n favoarea programului, exist suficiente
informaii pentru a respinge afirmaia Guvernului, precum c programul su social se bucur de susinerea majoritii
cetenilor? (=0,05).
21.
Un politician susine c la viitoarele alegeri va primi 60% dintre voturile cetenilor. n urma selectrii unui
eantion aleatoriu de 100 de persoane, a rezultat c 50 dintre acestea ar vota cu politicianul respectiv la viitoarele alegeri.
Poate fi considerat adevarat afirmaia politicianului, pentru un nivel de semnificaie de 5%?
22.
Gradul de poluare a aerului se poate determina prin msurarea mai multor elemente, printre care i nivelul
monoxidului de carbon existent n atmosfer. Un ecologist vrea s arate c oraul X are un grad ridicat de poluare a
aerului, ilustrat printr-un nivel mediu al monoxidului de carbon mai mare de 4,9. Pentru a verifica aceast afirmaie, au
fost nregistrate nivelurile monoxidului de carbon din 12 zile consecutive, valorile gsite fiind urmtoarele:
Ziua
CO
1
3,5
2
3,9
3
2,8
4
3,1
5
3,1
6
3,4
7
4,8
8
3,2
9
2,5
10
3,5
11
4,4
12
3,1
a) calculai media i abaterea medie ptratic a nivelului de CO din aer, pentru cele 12 zile;
b) exist suficiente dovezi pentru a respinge ipoteza ecologistului?
23.
Un post de radio promoveaz un grup muzical aflat n mare vog. n trecut, 60% dintre asculttorii postului de
radio declaraser c le-au plcut grupurile muzicale promovate de acest post. Dintr-un eantion de 200 de asculttori, 102
au declarat c le place grupul recent promovat. Pentru un nivel de semnificaie de 0,05 testai ipoteza conform creia nu
exist diferene semnificative ntre preferinele asculttorilor din trecut i prezent.
24
24.
ntr-o livad de cirei, recolta medie a fost de 4,35 tone/arie. A fost ns testat un nou fertilizator chimic, pe 15
3,56
4,79
5,00
4,45
4,88
5,35
4,93
4,81
3,92
4,25
5,12
3,48
4,45
5,13
4,72
Pentru un nivel de semnificaie de 5%, avem suficiente dovezi pentru a concluziona c n urma aplicrii fertilizantului s-a
obinut o cretere semnificativ a recoltei?
25.
Pentru dou eantioane de studeni, unul de fete i altul de biei, a fost nregistrat nlimea persoanelor care
Nr. studeni
Femei
Brbai
30
40
1952
2757
( x
74,2
284,3
Ofer aceste date suficiente informaii pentru a respinge ipoteza conform creia nlimea medie a unui student participant
la programul sportiv este cu cel mult 2,5 inch mai mare dect cea a unei studente? (nivel de semnificaie de 2%).
26.
Pentru analiza preurilor de vnzare a apartamentelor aflate n 2 cartiere ale unui ora, au fost selectate aleator
18 apartamente din primul cartier i 18 apartamente din cel de-al doilea cartier, de la care s-au nregistrat preurile de
vnzare. n urma prelucrrii datelor, a rezultat c un apartament din primul cartier are un pre mediu de vnzare de 15000
uniti monetare, cu o dispersie de 2400, iar un apartament din cel de-al doilea cartier are un pre mediu de vnzare de
16000 unit. monetare, cu o abatere medie ptratic de 69,282 unit.monetare. Se poate accepta ipoteza c exist o diferen
semnificativ ntre preul mediu de vnzare al apartamentelor din cele dou cartiere? (nivel de semnificaie 5%).
27.
Managerul unui restaurant dorete s determine dac o companie publicitar a mrit semnificativ media
ncasrilor zilnice. El culege date privitoare la 50 de zile naintea campaniei i la 30 de zile dup ncheierea campaniei
publicitare. Rezultatele pentru cele dou perioade sunt:
naintea campaniei
Dup campanie
n1 = 50
n2 = 50
Informaiile obinute sunt suficiente pentru a susine ipoteza conform creia mediile ncasrilor difer semnificativ, adic
sunt semnificativ mai mari dup campania publicitar? S se utilizeze o probabilitate de 95%.
28.
20 de oareci de laborator au fost mprii n dou grupuri egale. Fiecare grup a fost hrnit n conformitate cu
una din cele dou diete alimentare prestabilite (A, B). La sfritul a trei sptmni, a fost nregistrat creterea n greutate
a fiecrui oarece:
Dieta A
Dieta B
5
5
14
21
7
16
9
23
11
4
7
16
13
13
14
19
12
9
8
21
Se poate afirma, cu o probabilitate de 95% c dieta B a condus la o cretere medie a greutii semnificativ mai mare dect
dieta A?
25
29.
Un productor de jucrii electronice dorete s verifice dac procentul jucriilor defecte este mai mic de 7%.
Presupunem c sunt selectate aleator 200 de jucarii, fiecare dintre acestea este testat i c sunt gsite 12 jucarii de fecte.
Ofer aceste informaii suficiente dovezi c procentul jucariilor defecte este mai mic de 7%? Utilizai o probabilitate de
99% de garantare a rezultatelor.
30.
7 experi i exprim opiniile privind preul unui produs, n anul viitor. Rezultatele anchetei sunt exprimate de
se tie c anul acesta preul mediu a fost de 3,54 mii lei, sunt motive suficiente pentru a susine ipoteza c anul viitor
preul mediu va fi semnificativ mai mare fa de cel de anul acesta? Se va utiliza o proba bilitate de 95% de garantare a
rezultatelor.
31.
Decanul facultii de Marketing dorete s verifice dac procentul de nepromovabilitate dup prima sesiune de
examinare la disciplina statistic este mai mic de 30%. Pentru aceasta sunt selectai aleator 100 dintre studenii care au
susinut examenul de statistic n anul I. Pentru fiecare student se nregistreaz dac a promovat sau nu examenul. S-a
determinat astfel un numr de 24 de studeni care nu au promovat examenul. Ofer aceste informaii suficiente dovezi c
procentul de nepromovabilitate este mai mic de 30%? Utilizai o probabilitate de 99% de garantare a rezultatelor.
32.
Un lot de 200 de sticle de buturi rcoritare este supus unui control de calitate.
necorespunztor dac mai mult de 3% dintre sticle nu respecta compoziia prestabilit de productor. n urma verificrii,
7 sticle sunt gsite ca necorespunztoare. Ofer aceste informaii suficiente dovezi ca ntregul lot s fie declarat
necorespunztor ? Utilizai o probabilitate de 99% de garantare a rezultatelor.
33. Managerul unei firme ce ofer servicii de curierat rapid susine c timpul su mediu de expediere, ntr-un
anumit perimetru, este mai mic de 6 ore. Pentru verificarea acestei afirmaii, a fost considerat un eantion aleator de 10
expedieri ale unor pachete, pentru care s-au nregistrat timpii necesari pentru expedierea acestora la destinatie (ore): 7; 3;
4; 6; 10; 5; 6; 4; 3; 8. Exista suficiente dovezi pentru a susine afirmaia managerului, pentru un nivel de semnificaie de
5% (tcritic= 1,833)?
34.
Un productor de anvelope susine c mai mult de 90% din anvelopele produse de el rezist la cel puin 50.000
km. n urma selectrii i testrii unui eantion aleatoriu de 200 de anvelope, 10 anvelope s-au uzat nainte de parcurgerea
distanei de 50.000 km. Exist suficiente informaii pentru a afirma c productorul are dreptate ? (zcritic = 1,645, pentru o
probabilitate de 95%).
35. O companie producatoare de hrana pentru bebelui susine c noul su produs este superior fa de cel al
principalului su concurent, prin aceea c bebeluii care consum acest produs ctig mai repede i mai mult n greutate.
Pentru a verifica aceasta afirmaie, au fost selectai aleator 10 bebelui; timp de 2 luni, 5 bebelui au fost hrnii cu
26
produsul creat de compania productoare, iar ceilali 5 bebelui cu produsul creat de firma concurent. Surplusul de
greutate (zeci grame) ctigat de bebelui n urma consumrii celor dou produse a fost:
Produsul companiei
Produsul concurentului
85
91
102
68
79
85
105
82
113
76
Putem concluziona, cu o probabilitate de 95%, c bebeluii hrnii cu produsul companiei au luat mai mult n greutate
dect cei hranii cu produsul concurentului? (tcritic= 2,306)
36. Managerul unui lan de magazine alimentare dorete s-i deschid un nou magazin. Pentru alegerea zonei de
amplasare a acestuia, el ia n considerare, printre ali factori, mrimea veniturilor gospodriilor din zona respectiv.
Pentru a alege ntre dou zone, A i B, sunt considerate aleator dou eantioane de cte 100 de gospodrii n fiecare zon.
Zona A
29980
4740
Zona B
28650
5365
Se poate concluziona, pentru un nivel de semnificaie de 5%, pe baza datelor existente, c venitul mediu anual al unei
gospodrii din zona A este superior celui din zona B? Se presupune c veniturile sunt normal distribuite (zcritic= 1,645).
37.
38.
39.
40.
41.
42.
43.
Ce reprezint i ?
44.
45.
Cum se testeaz ipoteza privind media unei colectiviti generale n cazul eantioanelor mari?
46.
Cum se testeaz ipoteza privind media unei colectiviti generale n cazul eantioanelor de volum redus?
47.
Cum se testeaz ipoteza privind diferena dintre mediile a dou colectiviti generale, n cazul eantioanelor
48.
Cum se testeaz ipoteza privind diferena dintre mediile a dou colectiviti generale, n cazul eantioanelor de
mari?
volum redus?
27
Se cere s se determine, folosind testul F de analiz dispersional, dac variaia timpului scurs pn la prima promovare
este influenat semnificativ de mrimea firmei?
Rezolvare:
Notm cu X caracteristica mrimea firmelor factorul de grupare i cu Y caracteristica numr de
sptmni de la angajare pn la prima promovare.
Se formuleaz urmtoarele ipoteze:
H0: 1 = 2 = 3
H1: i j , i j
Unde i reprezint timpul mediu de promovare pentru firma din grupa i, la nivelul colectivitii generale.
Calculm, la nivelul eantionului, mediile pentru fiecare grup i ( yi ), cu
i =1,3 ,
(mrimea firmei):
8
y
j =1
y1 =
1j
n1
30 + 26 + 30 + 38 + 32 + 24 + 32 + 28
sptmni;
= 30,00
8
34 + 32 + 25 + 36 + 33
sptmni;
= 32
5
47 + 41 + 43 + 48 + 40 + 49 + 40
sptmni.
= 44
7
y
j =1
y2 =
2j
n2
7
y
j =1
y3 =
n3
3j
Numrul mediu de sptmni pentru ntreaga colectivitate de 20 de firme poate fi calculat ca medie a mediilor
pariale:
y=
y n
n
i
30 8 + 32 5 + 44 7
= 35,4 sptmni.
20
28
(y
8
1j
j =1
s =
2
1
y1
2
2
2
2
(
26 30 ) + ( 32 30 ) + ( 38 30 )
=
n1
2
2
2
(
24 30 ) + ( 32 30) + ( 28 30)
+
(y
5
s 22 =
j =1
2j
y2
s =
2
3
j =1
3j
128
= 16
8
n2
(y
y3
70
= 14
5
n3
2
2
2
(
47 44 ) + ( 41 44 ) + ( 43 44 )
=
2
2
2
(
48 44) + 2( 40 44 ) + ( 49 44 )
+
92
= 13,14
7
S1 = y i y ni =( 30 35,4 ) 8 + ( 32 35,4 ) 5 +
i =1
+ ( 44 35,4 ) 7 = 808,8
2
ni
S 2 = y ij y i
i =1 j =1
) = s
2
i =1
2
i
ni = 128 + 70 + 92 = 290
s12 =
S1
808,8
=
= 404,4
r 1
2
s 22 =
S2
290
=
= 17,06
nr
17
Testul F:
s12 404,4
F= 2 =
= 23,7
s 2 17,06
Ftabelar=Fcritic=F,r-1,n-r=F0,05;2;17=3,59
Cum Fcalculat>Fcritic, rezult c se respinge ipoteza nul, acceptndu-se ca adevrat ipoteza alternativ. Timpul mediu
de promovare pe fiecare tip de firm difer semnificativ, n consecin se poate afirma, cu o probabilitate de 95% c
mrimea firmei influeneaz semnificativ variaia timpului de promovare a tinerilor.
11. n vederea fundamentrii deciziei de nlocuire a unor utilaje din dotarea unei fabrici, managerul acesteia
solicit o analiz a vechimii utilajelor i a costului de ntreinere anual al acestora. Astfel cele 110 utilaje din dotarea
fabricii sunt grupate dup vechime (ani) i dup costul de ntreinere (mii lei):
Costul de ntreinere (mii lei)
29
Total
Vechime
(ani)
Mic (<5 ani)
Medie (5-10 ani)
Mare (>10 ani)
Total
57
79
9 11
11 13
10
10
8
15
2
25
5
20
25
50
7
18
52
23
42
45
110
Se cere s se determine dac influena vechimii asupra variaiei costului de ntreinere este semnificativ, utiliznd
testul F de analiz dispersional.
Rezolvare:
Notm cu X caracteristica vechime factorul de grupare i cu Y caracteristica costul de ntreinere.
n vederea calculrii indicatorilor necesari determinrii statisticii F datele vor fi sistematizate pentru fiecare categorie
de vechime conform tabelelor de mai jos.
i = 1 (grupa vechime mic).
Cost de ntreinere
(mii RON)
57
79
9 11
11-13
Total
y1 =
y n
n
j
1j
1j
n1j
yj
yjn1j
10
8
5
6
8
10
12
-
60
64
50
23
y j y1
( y j y1 )2 n1 j
-1,56
0,44
2,44
24,336
1,549
29,768
174
( y y ) n
n
55,653
174
= 7 ,56 mii RON ;
23
s12 =
1j
1j
55,653
= 2,42
23
y2
y n
=
n
j
2j
2j
n2j
yj
yjn2j
y j y2
( y j y 2 )2 n2 j
15
20
7
42
6
8
10
12
-
120
200
84
404
-1,62
0,38
2,38
-
39,366
2,888
39,6508
81,9048
y y 2 n2 j 81,9048
404
=
= 9 ,62 mii RON ; s22 = j
=
= 1,95
42
42
n2 j
2
y3 =
y n
n
j
Cost de ntreinere
(mii RON)
57
79
9 11
11-13
Total
3j
3j
n3j
yj
yjn3j
y j y3
( y j y 3 )2 n3 j
2
25
18
45
6
8
10
12
-
16
250
216
482
-2,7
-0,7
1,3
-
14,58
12,25
30,42
57,25
482
y y 3 n3 j 57 ,25
= 10 ,7 mii RON ; s32 = j
=
= 1,27
45
45
n3 j
30
ni
S 2 = yij y i
i =1 j =1
) = s
2
i =1
2
i
Costul mediu de ntreinere pentru ntreaga colectivitate de 110 de utilaje poate fi calculat ca medie a mediilor
pariale:
y=
y n
n
7 ,56 23 + 9 ,62 42 + 10 ,7 45
= 9 ,64 mii RON.
110
s12 =
S1
150 ,15
=
= 75,075
r 1
2
s 22 =
S2
194 ,7
=
= 1,82
nr
107
Testul F:
s12 75,075
F= 2 =
= 41,25
s2
1,82
Ftabelar=Fcritic=F;,r-1,n-r=F0,05;2;107=3,07
Cum Fcalculat>Fcritic, rezult c se respinge ipoteza nul, acceptndu-se ca adevrat ipoteza alternativ. n consecin
se poate afirma, cu o probabilitate de 95% c vechimea utilajelor influeneaz semnificativ variaia costului de ntreinere.
3.
Se cunosc datele:
Salariul mediu
(unit. monetare)
9,2
10,4
11,6
11,8
12,0
-
Nr. de salariai
100
120
180
140
130
670
S se arate dac durata medie a zilei de lucru influeneaz semnificativ variaia salariului, folosind testul F de analiz
dispersional
Rezolvare:
Se noteaz cu X - durata zilei de lucru (factorul de grupare), respectiv cu Y - salariul
Din vi =
s yi
yi
31
s yi =
vi y i
100
s yi
s2
y
s2
n
y i
y i ni
0,6
1,1
1,4
1,2
0,9
-
0,36
1,21
1,96
1,44
0,81
-
36
145,2
352,8
201,6
105,3
840,9
920
1248
2088
1652
1560
7468
( y i y ) 2 ni
380,25
67,50
36,45
59,15
93,92
637,27
s 2y n i
i
ni
840,9
= 1,255
670
y=
y i ni 7468
=
= 11,15 u.m.;
670
ni
( y y ) n
=
n
2
637 ,27
= 0 ,951 ;
670
S = y j y
= S1 + S 2 =1478 ,1
Variana factorial:
S1 = y i y
)2 ni = 2 n = 637,2 ;
Variana rezidual:
S 2 = y j y i
)2 = s 2 n =840,9 ;
s12 =
S1
637,2
=
= 159,3 ;
r 1
4
s 22 =
S2
840,9
=
= 1,265 ;
nr
665
s 2 159,3
Fcalc = 1 =
= 125,9 > Ftab = F =0,05;4;665 = 2,45 .
s 22 1,265
Cum Fcalc > Ftab , rezult c influena duratei medii a zilei de lucru asupra salariului este semnificativ.
4.
Un productor de sucuri de mere a realizat un nou produs: concentrat lichid. Acest nou produs are urmtoarele
avantaje fa de vechiul produs: este mai practic de utilizat, are o calitate cel puin la fel de bun i cost semnificativ mai
mic.
32
Pentru a decide pe care dintre cele trei avantaje s-i axeze strategia de marketing, directorul acestui departament a
realizat un studiu n trei orae. n oraul A campania de publicitate s-a axat pe uurina de utilizare a noului produs. n
oraul B campania de publicitate s-a axat pe calitatea noului produs. n oraul C campania de publicitate s-a axat pe preul
mai mic al noului produs. n toate cele 3 orae s-a nregistrat numrul de buci vndute n 20 de sptmni.
Directorul de marketing ar dori s tie dac exist diferene semnificative ntre numrul de buci vndute, n medie
pe sptmn, n cele trei orae dup terminarea campaniei de publicitate.
Uurina
folosirii:
529
498
658
663
793
604
514
495
663
485
719
557
711
353
606
557
461
542
529
614
Calitate:
804
492
630
719
774
787
717
699
679
572
604
523
620
584
697
634
706
580
615
624
Pre:
672
691
531
733
443
698
596
776
602
561
502
572
659
469
689
581
675
679
512
532
Identificarea metodei: Datele sunt cantitative i problema revine la a compara mediile celor trei populaii. Ipotezele
ce trebuie testate sunt: H0: 1 = 2 = 3 cu alternativa H1: cel puin dou medii sunt diferite.
Pentru aceasta se aplic o analiz de varian cu un singur factor.
Rezolvare folosind EXCEL:
1. Introducei datele astfel:
Count
20
20
20
Sum
11551
13060
12173
ANOVA
Source of Variation
Between Groups
Within Groups
SS
57512.23
506983.5
df
2
57
Total
564495.7
59
Average
577.55
653
608.65
MS
28756.12
8894.447
Variance
10775
7238.11
8670.24
F
3.233
dispersia populaiilor
33
P-value
0.047
F crit
3.159
Din aceste date observm c cea mai mare vnzare medie a fost n Oraul B n care publicitatea a avut ca argument
principal calitatea superioar a noului produs.
Cea mai mic medie i cea mai mare dispersie (mprtiere a datelor) s-a nregistrat n Oraul A unde publicitatea a
pus accent pe uurina folosirii noului produs.
n tabelul ANOVA este calculat Statistica F = 3,233 cu o valoare p egal cu 0,047 (pragul de semnificaie). Aceast
valoare p ne permite s spunem c cel puin dou medii difer semnificativ (cu o probabilitate de 95%), ceea ce nsemn
c tactica aleas pentru promovarea produsului influeneaz valoarea vnzrilor.
Rezolvare folosind STATISTICA:
1. Creai un fiier cu dou variabile i 60 de cazuri folosind New File.
n acest fiier, pe prima coloan introducei valoarea vnzrilor astfel: valorile pentru Uurina folosirii, apoi pentru
Calitate i ultimele pentru Pre. Pe a doua coloan se introduc coduri pentru cele trei categorii de date: pentru
primele 20 de uniti se introduce valoarea 1, pentru urmtoarele 20 valoarea 2 i pentru ultimele 20 valoarea 3.
2. Selectai modulul ANOVA/MANOVA. Se va deschide o fereastr General ANOVA/MANOVA.
3. n aceast fereastr apsai Variables. La Independent Variables selectai variabila a 2-a (codurile) iar la
Dependent Variable selectai prima variabil (valoarea vnzrilor). Apsai OK.
4. Apsai pe butonul Codes for between-groups factors. Apsai ALL i OK.
5. Apsai OK. Se va deschide o fereastr ANOVA Results.
6. Dac apsai pe butonul All Effects va fi calculat statistica F i valoarea p.
Managerul unui post de radio local de muzic hard rock, dorete s tie dac asculttorii postului su de radio
ascult muzic mai mult n unele zile ale sptmnii dect n altele. Deoarece marea majoritate a asculttorilor postului
su de radio sunt tineri, a organizat un sondaj printre acetia. Au fost selectai 20 de tineri i au fost rugai s noteze zilnic
cte minute ascult postul de radio, ntr-o sptmn.
Exist vreo diferen semnificativ ntre zilele sptmnii privind numrul de minute n care tinerii ascult postul
de radio?
34
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Luni
65
90
30
72
70
90
43
88
96
60
75
74
49
76
66
30
53
76
59
40
Mari
40
85
30
52
88
51
72
89
60
92
79
46
92
98
64
53
90
68
51
30
Miercuri
32
75
20
66
47
103
66
82
80
72
79
72
64
96
57
85
47
78
94
45
Joi
48
90
25
100
73
41
39
95
106
45
78
46
69
77
55
53
111
74
103
40
Vineri
60
78
30
77
78
57
57
68
57
72
91
74
62
61
29
103
102
63
94
46
Smbt
75
120
60
66
67
69
90
105
81
77
60
55
87
84
72
111
76
68
85
60
Duminic
110
100
70
94
78
87
73
125
80
90
112
84
81
82
60
55
91
99
83
64
Identificarea metodei: Datele sunt cantitative i problema revine la a compara cele 7 populaii: numrul de minute n
care tinerii ascult postul de radio n fiecare zi a sptmnii.
Ipotezele ce trebuie testate sunt: H0: 1 = 2 =...= 7 cu alternativa H1: cel puin dou medii sunt diferite. Populaiile
sunt dependente deoarece sunt ntrebai 20 de tineri despre numrul de minute n care ascult postul de radio dar pe zile
ale sptmnii. Aceste medii pe zilele sptmnii sunt comparate.
Pentru aceasta se aplic o analiz de varian cu doi factori fr interaciune.
Rezolvare folosind EXCEL:
1. Introducei datele ca n tabelul de mai sus ncepnd din celula A1.
2. Apsai Tools-Data Analysis i ANOVA: Two-Factor Without Replication.
3. La Input Range selectai datele (sau scriei B2:H21). Apsai OK.
Se obin rezultatele:
ANOVA
Source of Variation
Rows
Columns
Error
SS
24872.82
7107.671
32958.33
df
19
6
114
Total
64938.82
139
MS
1309.096
1184.612
289.1081
F
4.528
4.097
P-value
1.58E-07
0.0009
F crit
1.678
2.179
n plus la rezultate mai sunt afiate i informaii referitoare la linii i coloane: numrul de observaii, numrul de
minute ascultate n total, media i variana (dispersia).
Valoarea statisticii F referitoare la testarea mediilor pe zile ale sptmnii, adic pe coloane, este 4,097 cu o
valoare p de 0,0009. Deoarece valoarea p este foarte apropiat de zero se poate spune tinerii nu ascult acelai numr de
minute postul de radio n fiecare zi a sptmnii.
Din tabelul urmtor (SUMMARY) se poate observa c tinerii ascult mai mult postul de radio smbta i
duminica dect n restul sptmnii (mediile sunt mult mai mari ca n restul sptmnii).
35
SUMMARY
Column 1
Column 2
Column 3
Column 4
Column 5
Column 6
Column 7
Count
20
20
20
20
20
20
20
Sum
1302
1330
1360
1368
1359
1568
1718
Average
65.1
66.5
68
68.4
67.95
78.4
85.9
Variance
381.9895
476.4737
461.6842
684.4632
416.05
310.2526
312.8316
n tabelul ANOVA mai este calculat i valoarea statisticii F referitoare la diferena ntre tineri. Statistica F este
4,53 cu o valoare p foarte apropiat de zero ceea ce nseamn c exist diferene semnificative i ntre tineri.
Rezolvare folosind STATISTICA:
1. Creai un fiier cu 7 variabile i 20 de cazuri folosind New File i introducei datele ca n tabelul din enunul
problemei: pe prima coloan datele referitoare la ziua de luni, n coloana a doua datele referitoare la ziua de mari
i aa mai departe.
2. Selectai modulul ANOVA/MANOVA. Se va deschide o fereastr General ANOVA/MANOVA.
3. n aceast fereastr apsai Variables. La Independent Variables nu selectai nimic iar la Dependent Variable
selectai toate cele 7 variabile. Apsai OK.
4. Apsai pe butonul Repeated measures (within SS) design. La No. of levels pe prima linie tastai 7 iar la
Factor Name, tot pe prima linie tastai zi. Apsai OK.
5. Apsai OK. Se va deschide o fereastr ANOVA Results.
6. Dac apsai pe butonul All Effects va fi calculat statistica F i valoarea p.
Se obin rezultatele:
Valoarea statisticii F este 4,097 cu o valoare p de 0,000925. Deoarece valoarea p este foarte apropiat de zero se
poate spune tinerii nu ascult acelai numr de minute postul de radio n fiecare zi a sptmnii.
Dac dorim n plus informaii referitoare la medii, dispersii pe grupuri n fereastra ANOVA Results se apas
butonul Descriptive Statistics & Graphs. Pentru calculul mediilor se apas butonul Means & no. of cases for each
group iar pentru calculul abaterilor standard se apas butonul Standard deviations for each group.
Tot n aceast fereastr este posibil i selectarea anumitor opiuni pentru testarea ipotezelor de fundamentare ale
ANOVA.
6.
n problema 4, considerm c pe lng tipurile diferite de marketing avem i 2 posibiliti de publicitate: prin
ziare i televiziune. De ceea experimentul s-a repetat n urmtorul fel. S-au selectat 6 orae. n oraul A s-a fcut
publicitate prin televiziune, strategia de marketing fiind: uurina folosirii noului produs. n oraul B publicitatea s-a
36
fcut prin ziare, strategia de marketing rmnnd aceeai. n oraele C i D strategia de marketing a fost calitatea
superioar a noului produs, n C publicitatea fiind fcut prin televiziune iar n D prin ziare. n oraele E i F strategia de
marketig a fost preul sczut al noului produs, n E publicitatea fiind fcut prin televiziune, iar n F prin ziare.
Vnzrile au fost nregistrate pe parcursul a 10 sptmni.
Ce se poate spune despre strategia de marketing i modul de publicitate: influeneaz sau nu vnzrile?
Oraul A
491
712
558
447
479
624
546
444
582
672
Oraul B
464
559
759
557
528
670
534
657
557
474
Oraul C
677
627
590
632
683
760
690
548
579
644
Oraul D
689
650
704
652
576
836
628
798
497
841
Oraul E
575
614
706
484
478
650
583
536
579
795
Oraul F
803
584
525
498
812
565
708
546
616
587
Rezolvare:
Identificarea metodei: Observm c avem 6 tratamente. Fiecare tratament este definit prin intermediul a doi factori.
Primul factor este strategia de marketing cu 3 nivele i al doilea este modul de publicitate cu 2 nivele. Deoarece cei doi
factori pot interaciona ntre ei se va aplica o analiz de varian cu doi factori cu interaciune ntre acetia.
Rezolvare folosind EXCEL:
1. Introducei datele ca n tabelul 5.20, ncepnd din celula A1.
2. Apsai Tools-Data Analysis i ANOVA: Two-Factor With Replication.
3. La Input Range selectai datele (sau scriei A1:D21).
4. La Rows per sample tastai numrul de observaii pentru fiecare tratament (10). Apsai OK.
lul 250
Nivel 1
Nivel 2
Nivel 1
491
712
558
447
479
624
546
444
582
672
464
559
759
557
528
670
534
657
557
474
Nivel 2
677
627
590
632
683
760
690
548
579
644
689
650
704
652
576
836
628
798
497
841
Se obin rezultatele:
37
Nivel 3
575
614
706
484
478
650
583
536
579
795
803
584
525
498
812
565
708
546
616
587
ANOVA
Source
of
Variation
Sample
Columns
Interaction
Within
Total
SS
df
MS
P-value
F crit
13172.017
98838.633
1609.633
501136.7
1
2
2
54
13172.017
49419.317
804.817
9280.309
1.419
5.325
0.087
0.239
0.008
0.917
4.019
3.168
3.168
614756.98
59
n tabelul ANOVA sunt calculate statisticile F i valorile p pentru influena factorului 1 strategie de marketing la
Columns, pentru influena factorului 2 modalitate de publicitate la Sample i pentru interaciunea dintre cei doi factori
la Interaction.
Astfel:
- Statistica F pentru strategia de marketing este 5,325 cu o valoare p de 0,008, deci acest factor influenez valoarea
vnzrilor;
- Statistica F pentru modalitatea de publicitate este 1,419 cu o valoare p de 0,239, deci acest factor nu influenez
semnificativ valoarea vnzrilor;
- Statistica F pentru interaciunea dintre cei doi factori este 0,087 cu o valoare p de 0,917, deci interaciunea dintre cei
doi factori nu influeneaz semnificativ valoarea vnzrilor.
Rezolvare folosind STATISTICA:
1. Creai un fiier cu 4 variabile i 20 de cazuri (File/New data) Introducei datele astfel: primele 3 variabile sunt
coloanele Nivel 1, Nivel 2, Nivel 3 din tabelul 5.20; variabila a 4-a are n primele 10 de rnduri, 1 (nivelul 1
pentru factorul 2) i n urmtoarele 10 rnduri, 2 (nivelul 2 al factorului 2)
2. Selectai modulul ANOVA/MANOVA. Se va deschide fereastra General ANOVA/MANOVA.
3. n aceast fereastr apsai Variables. La Independent Variables selectai variabila a 4-a iar la Dependent
Variable selectai primele 3 variabile. Apsai OK.
4. Apsai pe butonul Repeated measures (within SS) design. La No. of levels pe prima linie tastai 3 iar la
Factor Name, tot pe prima linie tastai factor 1. Apsai OK.
5. Apsai OK. Se va deschide o fereastr ANOVA Results.
6. Dac apsai pe butonul All Effects vor fi calculate statisticile F i valoarile p asociate.
Se obin rezultatele:
Sunt calculate statisticile F i valorile p pentru influena factorului 1 strategie de marketing la Effect 2, pentru
influena factorului 2 modalitate de publicitate la Effect 1 i pentru interaciunea dintre cei doi factori la Effect 12.
Astfel:
38
- Statistica F pentru strategia de marketing este 5,278 cu o valoare p de 0,0097, deci acest factor influenez valoarea
vnzrilor;
- Statistica F pentru modalitatea de publicitate este 1,44 cu o valoare p de 0,245, deci acest factor nu influenez
semnificativ valoarea vnzrilor;
- Statistica F pentru interaciunea dintre cei doi factori este 0,086 cu o valoare p de 0,918, deci interaciunea dintre cei
doi factori nu influenez semnificativ valoarea vnzrilor.
Se observ ca aceste valori difer puin de cele obinute prin Excel. Diferenele provin din rotunjirile fcute de
calculator.
39
120-170
35
10
10
55
270-320
10
15
15
40
Total
50
100
75
25
250
S se arate dac influena numrului de camere asupra variaiei cheltuielilor de ntreinere este semnificativ, folosind
testul F de analiz dispersional, pentru o probabilitate de 99%.
2. O mare companie productoare de cosmetice deine n Bucureti 100 de magazine de desfacere a produselor sale.
Despre zona de amplasare a acestor magazine i despre valoarea medie a vnzrilor zilnice (mii RON) se cunosc datele:
Zona de
amplasare
Central
Sud-vest
Sud-est
Nord-vest
Nord-est
Numr de
magazine
35
20
15
10
20
Coeficientul de variaie
a vnzrilor (%)
6,0
12,5
13,0
20,0
12,3
S se arate dac zona de amplasare a magazinelor influeneaz semnificativ variaia valorii vnzrilor, pentru o
probabilitate de 95%, folosind testul F de analiz dispersional.
3. Pentru 20 de magazine situate n zona central, semicentrala i periferic a unui ora, se cunosc valorile vnzrilor
(mil. RON):
Zona
Central
Semicentrala
Periferic
Nr. magazine
9
5
6
S se determine daca zona de amplasare a magazinelor a influentat semnificativ variaia vnzrilor, folosind testul F de
analiza dispersionala (ANOVA); (nivel de semnificatie =0,05).
4. O mare agenie de nchiriat automobile hotrte s-i vnd automobilele dup utilizarea acestora timp de un
an. Managerul firmei presupune c distana parcurs de maini influeneaz costul de ntreinere al autovehiculelor i deci
preul de vnzare al acestora. Pentru a verifica aceast presupunere, se nregistreaz, pentru un numr de 200 de maini,
distana parcurs n ultimul an (n mii km) i costul de ntreinere al acestora (n uniti monetare). Se alctuiesc patru
grupe, dup distana parcurs: sub 40 mii km, 40-60 mii km, 60-80 mii km., 80 i peste 80 mii km.
Grupe dup
distana parcurs
20 40
40 60
tiind c:
40
Total
60
100%
pentru grupa a 3-a (60 80 mii km) s-au nregistrat date pentru 40 de autovehicule, costul mediu de ntreinere este
de 10,4 u.m., cu un coeficient de variaie de 11,538%, iar
pentru grupa a 4-a, ce cuprinde 10% din autovehicule, cheltuielile totale de ntreinere au fost de 264 u.m., iar
abaterea standard de 0,98 u.m.,
Se cere s se aplice testul F de analiz dispersional pentru a verifica dac distana parcurs a avut o influen
semnificativ asupra costului de ntreinere
5. Pentru 300 de angajai se cunosc: vechimea i nivelul salariului:
Grupe de angajai dup
vechime (ani)
0-10
10-20
20-30
30-40
Dispersia salariului
2,5
7,2
8,0
4,0
Nr. magazine
12
10
Dispersia vnzrilor
10,24
20,25
S se determine dac centrul comercial n care sunt amplasate magazinele a influenat semnificativ variaia vnzrilor,
folosind testul F de analiza dispersionala (ANOVA); (probabilitatea de garantare a rezultatelor de 95%).
7. Cnd se recomand utilizarea metodei de analiz dispersional?
8. Care sunt tipurile de varian utilizate n ANOVA i ce reprezint ele?
9. Ce sunt dispersiile corectate?
10. Cum se stabilete regiunea critic pentru testul F?
41
Se cere:
a) reprezentai grafic datele; Comentai graficul.
b) pe baza datelor de la nivelul eantionului, determinai ecuaia de regresie care modeleaz legtura dintre cele dou
variabile i calculai numrul zilnic previzionat de vizitatori;
c) verificai dac modelul de regresie identificat este valid statistic;
d) testai semnificaia statistic a parametrilor modelului, determinnd i intervalele de ncredere pentru acetia;
e) msurai intensitatea legturii dintre cele dou variabile cu ajutorul coeficientului i a raportului de corelaie; testai
semnificaia indicatorilor utilizai;
f) n ce msur variaia numrului de vizitatori este determinat de numrul spoturilor publicitare, pe baza modelului de
regresie determinat?
g) previzionai numrul vizitatorilor ateptai ntr-o zi, n ipoteza c se vor difuza 15 spoturi n acea zi.
h) previzionai numrul mediu zilnic de vizitatori, n ipoteza c se vor difuza 8 spoturi publicitare n medie pe zi.
Rezolvare:
a) Notm cu X variabila factorial, independent nr.spoturi publicitare i cu Y variabila dependent
nr.vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate construim corelograma (figura
4.10).
42
70
60
nr.vizitatori
50
40
30
20
10
0
0
10
12
14
nr.spoturi
na + b xi = yi
2
a xi + b xi = xi yi
n=14 (numrul observaiilor)
Tabelul 4.5
xi
yi
xi2
xiyi
yi2
y i = 2,2858
+ 5,0753 xi
7
5
1
8
10
2
6
7
9
3
12
8
4
11
xi
=93
42
32
10
40
61
8
35
34
45
11
64
37
30
55
y
i
=504
49
25
1
64
100
4
36
49
81
9
144
64
16
121
xi2
=763
294
160
10
320
610
16
210
238
405
33
768
296
120
605
x
i yi
=4085
1764
1024
100
1600
3721
64
1225
1156
2025
121
4096
1369
900
3025
yi2
=22190
43
( yi yi ) 2
( y i y ) 2
(x
37,81
27,66
7,36
42,89
53,04
12,44
32,74
37,81
47,96
17,51
63,19
42,89
22,59
58,11
17,53
18,82
6,96
8,34
63,39
19,68
5,12
14,54
8,78
42,40
0,66
34,67
54,96
9,69
3,29
69,52
820,19
47,44
290,31
555,25
10,64
3,29
143,12
341,82
739,24
47,44
179,91
489,01
0,13
2,70
31,84
1,84
11,27
21,56
0,41
0,13
5,56
13,27
28,70
1,84
6,98
18,98
504
305,53
3740,47
145,21
14 a + 93b = 504
2033
14 763 ( 93)
2033
14 763 ( 93) 2
Ecuaia de regresie este:
yi = 2 ,2858 + 5 ,0753 xi
c) Testarea validitii modelului de regresie determinat.
Pentru testarea validitii modelului se formuleaz cele dou ipoteze:
H0: model nevalid statistic, cu alternativa
H1: model valid statistic
Se completeaz tabelul:
Surs variaiei
Suma ptratelor
(SS-Sum of Squares)
Datorat
regresiei
2y / x =3740,465
Rezidual
2e =305,535
Total
Grade de libertate
(df- degree of
freedom)
s y2 / x =3740,465
k=1
n k 1=14 -2=12
2y =4046,000
Media ptratelor
(MS- Mean of
Squares)
Testul Fisher
(testul F)
Fcalc =
3740,465
=146,90
25,461
8
se2 =25,461
n 1=15-1= 13
yi = a + bxi + ei
Pentru testarea semnificaiei parametrilor modelului de regresie liniar i estimarea lor pe intervalele de ncredere
se procedeaz astfel:
1) pentru parametrul
Ipotezele testate sunt:
H0 : = 0 (b = = 0),
H1 : 0.
44
t calc =
Unde
b b b 0
=
, statistic ce urmeaz o distribuie t cu (n 2) grade de libertate.
sb
sb
sb =
se
n
(x
i =1
=
x)2
n
Iar
(y
2e
se =
=
n2
i =1
5,046
145,21
2
y i )
n2
= 0,4187
305,53
= 5,046
12
2) pentru parametrul a
Ipotezele testate sunt:
H0 : = 0,
H1 : 0
Statistica t este:
t calc =
a a a 0
=
.
sa
sa
n
Unde s a = s e
x
i =1
2
i
n ( xi x ) 2
= 5,046
763
= 3,0912
14 145,21
i =1
Un argument suplimentar pentru concluzia c parametrul este nesemnificativ statistic este acela c intervalul de
ncredere include i valoarea zero.
e) Pentru a msura intensitatea legturii dintre cele dou variabile se va calcula mai nti coeficientul de corelaie
liniar:
45
r=
xi yi xi yi
=
2
2
2
2
n
xi (xi )
n
yi (yi )
10318
yi2
(yi )
10318
= 0 ,9615
10731
Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de valoarea unitar).
Pentru testarea semnificaiei coeficientului de corelaie liniar simpl, se procedeaz astfel:
Ipotezele testate sunt:
H0 : = 0 ( nu este semnificativ statistic)
H1:
Statistica t este:
t calc =
r
r n 2
0,9615 12
=
=
= 12,12 .
2
sr
1r
1 0,9615 2
Cum valoarea tabelar a testului t, pentru un prag de semnificaie de 5% i 12 grade de libertate este 2,179 rezult
c tcalc > t;n 2 , deci coeficientul de corelaie este semnificativ statistic
Un alt indicator utilizat att n cazul legturilor liniare, ct i al celor neliniare este raportul de corelaie R:
R = Ry / x =
( y y )
1
( y y )
i
= 1
305,53
= 0,9615
4046
y=
yi = 504 = 36
n
14
mii pers.
Ry/x = ry/x = 0,9615, deci exist o legtur liniar, puternic i direct ntre cele dou variabile.
Testarea semnificaiei raportului de corelaie se face cu testul F:
F=
n k 1 R 2
= 146,9
k
1 R2
g) Dac numrul spoturilor publicitare difuzate va fi de 15, atunci numrul previzionat al vizitatorilor pe baza acestei
ecuaii de regresie este:
y / x =15 = 2 ,2858 + 5 ,0753 15 78 mii pers. (estimare punctual)
Pentru estimarea pe interval de ncredere, trebuie s determinm dispersia diferenei y n +1 y n +1,i , adic
dispersia erorii de previzionare. Dispersia n eantion este:
46
(x
x) 2
1
s (2y n +1, i ) = s (2y n +1 y n +1, i ) = s e2 1 + + n n +1
n
( x i x) 2
i =1
(15 6,64) 2
1
= 25,461
1+
+
145,21
14
= 39,534 .
y n +1,i t / 2,n 2 s e 1 +
1 ( x n +1 x) 2
+
, adic (64,71; 92,11) mii persoane.
n n
( xi x) 2
i =1
h) Suntem n cazul determinrii intervalului de ncredere pentru media de rspuns, cnd x n+1 x . Pentru aceasta
se determin y n +1 = y + b( x n +1 x) = 36 + 5,0753 ( 8 - 6,64 ) = 42,9
n +1 este:
iar estimatorul dispersiei pentru y
s (2y n +1 )
1 ( x x) 2
= s e2 + n n +1
n
2
xi x
i =1
1
(8 6,64) 2
= 25,461
+
14
145,21
= 2,14
x x
1
+ n n +1
n
xi x
y n +1 t / 2,n 2 s e
i =1
Se poate utiliza, ns, pentru rezolvarea problemei i un pachet informatic specializat, n cazul nostru EXCEL. n
urma selectrii, din meniul principal, a opiunilor
rezultate:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,961501303
R Square
0,924484756
Adjusted R
Square
0,918191819
Standard Error
5,045911528
Observations
14
ANOVA
df
Regression
Residual
Total
SS
1
12
13
Coefficients
3740,465
305,535
4046,000
Standard Error
MS
3740,46
5
25,461
t Stat
Intercept
2,2858
3,0912
0,7394
Nr. spoturi
5,0753
0,4187
12,1206
Significance F
146,908
0,0000000433
P-value
0,473858069
6
0,000000043
3
47
Lower
95%
Upper
95%
-4,4495
9,0210
4,1629
5,9876
2. Se cunosc urmtoarele date, privind cifra de afaceri i cheltuielile pentru cercetare efectuate de 500 de firme:
Grupe de firme dup cifra
de afaceri (U.M.)
sub 50
50 70
70 90
90 110
peste 110
Total
Numr firme
70
100
200
80
50
500
na + b xi ni = yi ni
2
a xi ni + b xi ni = xi yi ni
yi ni xi ni
xi yi ni xi2 ni = yi ni xi2 ni xi yi ni xi ni
a=
2
n
nxi2 ni (xi ni )
xi ni
xi ni xi2 ni
a=
yi ni
xi yi ni
xi ni
xi2 ni
b=
xi ni
n
xi ni
b=
= 0 ,66
xi yi ni xi ni yi ni
nxi2 ni (xi ni )
2
20832
= 0 ,159 0 ,16
130560
Valorile teoretice ale variabilei Y calculate pe baza ecuaei de regresie y i = 0,66 + 0,16 xi sunt redate n
tabelul 4.6.
Tabelul 4.6
xi
ni
xini
yini
70
2800
560
40
xi2
xi2 ni
1600 112.000
48
xiyini
yi2 ni
yi
22.400
4480
5,74
( yi yi ) 2 ni
357,532
60
80
10
0
12
0
-
7
12
15
4900 8,94
28800 12,14
18000 15,34
376,36
3,92
9,248
20
50
14400 720.000
20000 18,54
106,58
6000
1000
ni
xi ni
yi ni
120.000
xi2 ni xi yi n
yi2 ni
i
=3.272.00
=496.400 =76.180
( yi yi ) 2 ni
=853,64
Coeficientul de regresie b are urmtoarea interpretare: dac cifra de afaceri crete cu o U.M., atunci cheltuielile
medii pentru cercetare vor crete cu 0,16 U.M.
b) Coeficientul de corelaie liniar simpl:
cov( x , y )
ry / x =
=
sx s y
( xi x )( yi y )ni
ns x s y
xi yi ni xi ni yi ni
2
2
n
xi2 ni (xi ni ) nyi2 ni (yi ni )
ry / x =
= 0 ,94
( y y ) n
( y y) n
2
R = 1
y=
yi ni
ni
= 1
853,64
= 0,94
7500,8
5860
= 11,72 U.M.
500
Observm c R = ry/x = 0,94, ceea ce nseamn c ntre cele dou variabile exist o legtur liniar, puternic i
direct.
c) Testarea semnificaiei lui :
a
t calc =
.
sa
s a2 = s e2
s e2
2
xi ni
n ( x i x ) 2 ni
( y i y i ) ni
2
x=
ni 2
xi ni
ni
853,64
= 1,714
498
38.800
= 77,6
500
xi
40
60
80
100
120
( xi x )
yi
8
7
12
15
20
ni
98.963,2
30.976
1.152
40.140,8
89.888
49
( yi y )
Tabelul 4.7
2
ni
968,688
2227,84
15,68
860,672
3427,92
s a2 = 1,714
s a = 0,2
t calc =
261.120
7500,8
3272000
= 0,043
500 261120
0,66
0,2
= 3,3
0,16
= 64 > t 0,01; 498 = 2,568 deci este semnificativ.
0,0025
r
1 r
n 2 =
0,94
1 0,94
498 =
0,94
22,31 = 61,5 .
0,341
3. Cheltuielile cu reclama i cantitile din produsul X vndute, pentru 41 de magazine ale unui grup de firme cu
profil comercial, se prezint astfel:
Cheltuieli cu
reclama
(sute RON)
50 150
150 250
250 350
350 450
450 - 550
1
8
1
-
5
8
-
6
-
2
4
Se cere:
a) Ajustai cantitile vndute din produsul X, funcie de cheltuielile cu reclama, folosind funcia de regresie
adecvat.
b) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator de corelaie adecvat.
c) testai semnificaia parametrilor funciei de regresie;
d) verificai validitatea modelului de regresie folosit.
Rezolvare:
a) Notm cu X variabila cheltuieli cu reclama, respectiv cu Y variabila cantiti vndute.
Admitem c ntre cele dou variabile exist o legtur de form liniar prin interpretarea corelogramei. Atunci vom utiliza
funcia de regresie liniar:
yi = a + bxi , unde y i reprezint valorile teoretice, ajustate ale variabilei Y.
Se obine sistemul:
50
a nij + b xi ni = y j n j
i
j
i j
2
a xi ni + b xi ni = xi y j nij
i
i j
i
Calculele intermediare necesre estimrii parametrilor a i b, precum i valorile ajustate se gsesc n tabelul
4.8.
y jn j
x i ni
xi y j nij
2
x i ni
a=
103,4
x i ni
x i ni
xi2 ni
y jn j
b=
3.680.000
xi y j nij
32960 3.680.000
= 0,4465
41
11.200
11.200
xi ni
11.200
xi ni
i
xi ni
i
2
x i ni
41
103,4
11.200 32960
=
= 0,0076
41
11.200
11.200 3.680.000
Observm c valoarea coeficientul de regresie b (panta dreptei) este pozitiv, ceea ce nseamn c ntre cele
dou variabile analizate exist legtur direct.
Interpretarea coeficientului b: dac cheltuielile cu reclama cresc cu 100 RON, vnzrile cresc, n medie, cu 76
buc.
Tabelul 4.8
Cheltuieli cu
reclama
(sute RON)
100
200
300
400
500
nj
1
6
6
Cantiti vndute
(zeci mii buc.)
1,8
2,6
3,4
1
8
5
1
8
6
10
13
6
4,2
2
4
6
y jn j
18
33,8
20,4
25,2
103,4
y 2j n j
32,4
87,88
69,36
105,84
301,48
ni
x i ni
xi2 ni
7
13
9
8
4
41
700
2600
2700
3200
2000
11200
70.000
520.000
810.000
1.280.000
1.000.000
3.680.000
r=
cov( x, y )
=
sx s y
n xi y j nij xi ni y j n j
[n x n ( x n ) ][n y n
2
i
2
j
( y j n j )
r = 0,94 deci exist o legtur puternic direct ntre cele dou variabile.
51
xi y j nij y
i
j
780
5480
6780
11.520
8400
32.960
1,196
1,946
2,696
3,446
4.196
Raportul de corelaie:
2
y
2e
( y j y i ) nij
= 1
2
2
y
y y n
2
2y / x
R=
= 1
2y
( y y )
=
n
j
nj
y=
40,7
= 0,9927 .
41
y j n j 103,4
=
= 2,52 zeci mii buc.
41
n j
R = 1
5,565
= 0,93 , deci o legtur puternic, direct.
40,7
y i
1
0,23
-
1,196
1,946
2,696
3,446
4,196
Total
1,8
0,365
0,1705
0,803
-
2,6
2,138
0,074
-
2
( y i y j ) nij
3,4
0,276
-
4,2
1,508
0,000064
t calc =
2
xi ni
s a2 = s e2
s e2 =
n ( x i x ) 2 ni
y j y i
i
nij 2
i
x=
) 2 nij
x i ni
ni
xi x
5,565
= 0,143
39
= 620.487,76
s a2 = 0,143
t calc =
273,17
= 0,0206
620487,76
0,4465
0,0206
= 3,1
t,n 2 = t 0, 05;39 = 2,021 . Cum tcalc > ttab, rezult c este semnificativ.
52
0,595
2,3085
0,877
1,784
0,000064
5,565
s b2 = s e2
t calc
0,143
= 0,0000002
620487,76
( xi x ) ni
0,0076
=
=16,89 > t tab = 2,021 deci este semnificativ.
0,0000002
d) F =
2
y/x
s y2 / x
s e2
2y / x
k
( y
=
2e
s =
=
n k 1
2
e
y ni
k
( y
40,7 5,565
= 35,135 .
2 1
2
y i ) nij
n k 1
5,565
= 0,1427 .
41 2
Fcalc = 246,2.
Ftab=F,k,n-k-1 = F0,05, 1,39 = 4,08.
Cum Fcalc > Ftab , nseamn c X influeneaz semnificativ pe Y.
4. Pentru vnzrile zilnice ale unui produs s-au nregistrat valorile variabilelor X (pre lei) i Y (cantitate vndut
buci) la nivelul a 10 uniti:
xi
yi
5
70
6
53
10
44
12
38
15
35
20
28
22
26
30
17
35
11
40
5
80
70
60
yi
50
40
30
20
10
0
0
10
20
xi
Figura 4.11
53
30
40
50
1
xi
na
+
b
= yi
a 1 + b 1 = 1 yi
xi
xi
xi2
y
a=
1
x yi
i
n
1
n
b=
1
x
i
1
x2
i
=
1
x
i
1
x2
i
y
1
x y
y x
i
2
i
1
1
yi
xi
xi
1
1
2
xi xi
1
x
i
1
x2
i
1
1
yi yi
xi
xi
1
1
2
xi xi
1
.
xi
xi
yi
5
6
10
12
15
20
22
30
35
40
1/xi
70
53
44
38
35
28
26
17
11
5
0,200
0,160
0,100
0,083
0,067
0,050
0,045
0,033
0,028
0,025
yi(1/xi)
14,000
8,480
4,400
3,154
2,345
1,400
1,170
0,561
0,308
0,125
(1/xi)
0,0400
0,0256
0,0100
0,0069
0,0044
0,0025
0,0020
0,0010
0,0008
0,0006
54
y i
71,58
58,70
39,38
33,90
28,75
23,28
21,67
17,80
16,20
15,23
(yi- y i )2
2,49
32,49
21,34
16,81
39,01
22,28
18,75
0,64
27,04
104,65
( yi y )2
1391,29
412,09
127,69
28,09
5,29
22,09
44,89
246,49
470,89
767,29
R=
327
( y y )
1
( y y )
i
0,791
= 1
y=
yi
n
35,943
0,0938
285,50
3516,10
285,5
= 0,96 .
3516,1
= 32,7 .
asupra lui Y.
5. Un vnztor de automobile second hand ar dori s tie dac preul de vnzare al acestora la licitaie depinde de
numrul de kilometri parcuri de automobilul respectiv. Pentru aceasta el selecteaz 50 de automobile cu o vechime de 3
ani, aceeai marc i aceleai faciliti. Pentru fiecare main a nregistrat preul de vnzare la licitaie i numrul de
kilometri de la bordul autoturismului.
a)
Vnztorul ar dori s tie care este dependena dintre preul de vnzare i numrul de kilometri parcuri.
b)
c)
Preul Nr.K
m
32359 5595
43533 5330
32744 5806
34470 5805
37720 5317
41350 5316
24469 5870
35781 5504
48613 5333
24188 5705
Preul Nr.K
m
38775 5150
45563 5249
28676 5775
38231 5327
36683 5192
32517 5544
39050 5054
45251 5115
34384 5410
38383 5529
Preul Nr.K
m
32161 5507
26561 5873
33533 5303
41849 5237
36668 5383
37495 5286
25629 5827
40099 5483
31014 5440
42233 5215
Preul
37407
34356
30599
42485
38430
40452
26030
46296
34844
27379
Nr.K
m
5105
5685
5788
5208
5168
5128
5750
4965
5238
5763
Rezolvare:
a) Pentru determinarea dependenei ntre cele dou variabile se face un grafic pentru determinarea tipului legturii.
6000
Pre
5800
5600
5400
5200
5000
4800
0
10000
20000
30000
40000
50000
Figura 4.12
55
60000
Deoarece punctele reprezentate sunt grupate n jurul diagonalei secundare, exist o dependen liniar, invers
ntre cele dou variabile. Pentru determinarea modului n care preul variaz n funcie de numrul de kilometri
parcuri se va folosi modelul de regresie liniar.
Rezolvare folosind EXCEL:
1. Introducei datele astfel: n celula A1 tastai Nr.Km. iar n B1 Preul. n prima coloan, ncepnd din A2 se vor
introduce numrul de kilometri parcuri, iar pe coloana a doua, ncepnd din B2 se vor introduce preurile.
2. Apsi Tools-Data Analysis i Regression.
3. La Input Y Range selectai B1:B51. La Input X Range selectai A1:A51. Selectai Labels.
4. Dac dorii s calculai valorile reziduale ( y i y i ), selectai Residuals. Apsi OK.
Se obin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.808922
R Square
0.654355
Adjusted R Square
0.647154
Standard Error
157.8984
Observations
50
ANOVA
Df
Regression
Residual
Total
1
48
49
Coefficients
Intercept
Nr.Km.
SS
2265584
1196732
3462316
Standard
Error
6598.34
124.3322
-0.03224
0.003382
MS
2265584
24931.91
t Stat
53.07024
-9.53262
F
90.87089
P-value
2.78E-44
1.19E-12
Significance F
1.19E-12
6848.326
-0.02544
, egal cu 0,6472.
n cazul n care a fost selectat i Residuals, tot n acest Sheet de rezultate sunt calculate valorile reziduale i
56
RESIDUAL OUTPUT
Observation
1
2
3
4
.....
Predicted Price
Residuals
5392.879821
-74.8798
5155.257064
-94.2571
5120.597029
-112.597
5603.29042
191.7096
Acest tabel se interpreteaz similar cu tabelul 3 din SUMMARY OUTPUT obinut prin EXCEL.
5. Apsi Continue. Apsi Whole model R.
Se obine:
Acest tabel se interpreteaz similar cu tabelul 1 din SUMMARY OUTPUT obinut prin EXCEL.
Dac se dorete calculul valorilor reziduale i al celor previzionate se parcurg paii:
6. Apsi Continue. Apsi Resids. Selectai Extended. Apsi Predicted and residuals.
Se obine:
57
Acest tabel se interpreteaz similar cu tabelul 3 din SUMMARY OUTPUT obinut prin EXCEL.
Dac se dorete calculul valorilor reziduale i al celor previzionate se parcurg paii:
Apsi Continue. Apsi Resids. Selectai Extended. Apsi Predicted and residuals.
Se obine:
58
preul observat;
preul previzionat;
eroarea standard;
intervalul de previziune, pentru o probabilitate de 95%: n cazul unui automobil cu acelai numr de kilometri
parcuri, cu o probabilitate de 95%, preul previzionat al acestuia va fi inclus n intervalul de previziune;
intervalul de ncredere, pentru o probabilitate de 95%: n cazul unui automobil cu acelai numr de kilometri
parcuri, cu o probabilitate de 95%, preul acestuia va fi inclus n intervalul de ncredere.
c) Deoarece datele sunt cantitative, pentru msurarea intensitii legturii dintre dou variabile se calculeaz
1
-0.808922247
Pre
1
Coeficientul de corelaie dintre numrul de kilometri parcuri i pre este -0,809. Deoarece acesta este negativ i
apropiat de unu se poate spune c exist o corelaie invers ntre cele dou variabile.
Rezolvare folosind STATISTICA:
1.
2.
3.
4.
Se obin rezultatele:
Coeficientul de corelaie dintre numrul de kilometri parcuri i pre este -0,81. Deoarece acesta este negativ i
apropiat de unu se poate spune c exist o corelaie invers ntre cele dou variabile.
59
6. Se cunosc indicii populaiei ocupate a Romniei i indicii productivitii muncii, pentru perioada 1990-2005:
Anul
1990
100
100
1991
99,25
87,76
1992
97,49
81,44
1993
94,17
98,27
1994
92,12
114,57
1995
89,51
124,47
1996
86,61
128,69
1997
84,45
115,64
1998
81,85
109,22
1999
79,09
118,94
2000
78,24
129,09
2001
78,9
135,98
2002
77,52
143,3
2003
76,34
145,95
2004
75,92
150,38
2005
77,4
167,55
S se studieze dependena dintre cele dou variabile folosind un model de regresie liniar. Comentai rezultatele.
Rezolvare:
Nivelul ocuprii este factorul extensiv de influen a productivitii muncii. Reflectnd ntr-o form grafic
corelaia dintre cele dou variabile macroeconomice (figura 4.13) se observ c dependena productivitii muncii de
nivelul ocuprii este una invers, variabilele fiind invers proporionale i deci creterea uneia atrage dup sine scderea
Indicii productivitatii muncii (%)
80
R 2 = 0,7218
60
40
70
75
80
85
90
95
100
105
n plus, coeficientul de corelaie dintre cele dou variabile este de -0,85, ceea ce indic o legtur invers
puternic. Indicatorul este semnificativ statistic (i negativ), lucru verificat prin testul t (Student), rezultnd c valoarea
calculat a acestuia este t calc = 6,037 , t calc = 6,037 < t , n 2 = 1,761 (pentru o probabilitate de 95%).
60
Modelul ce red dependena variabilitii n timp a productivitii muncii n funcie de dinamica populaiei
ocupate explic 72,1789 % din variabilitatea primei caracteristici.
Modelnd dependena productivitii muncii de populaia ocupat printr-un model de regresie liniar simpl,
acesta are urmtoarea form:
fiind de p_value = 0,0031 %). Cei doi coeficieni ai modelului de regresie liniar s-au dovedit, de asemenea, semnificativi
statistic, lucru verificat prin aplicarea testului t (Student). Pentru termenul liber, valoarea calculat a testului este de
9,7125 semnificativitatea fiind garantat cu o probabilitate maxim de 99,99998661% (p_value = 0,00001339 %), n timp
ce pentru coeficientul ocuprii valoarea calculat a testului este de -6,0267 semnificativitatea acestuia fiind garantat cu o
probabilitate maxim de 99,9969% (p_value = 0,0031 %). Limita inferioar i superioar a intervalelor de ncredere prin
care se estimeaz valoarea celor doi coeficieni au acelai semn, ntrind concluzia semnificativitii acestora.
61
A fost folosit pentru estimarea parametrilor urmtorul model, ale crui rezultate sunt prezentate mai jos:
Q = + P + .
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.913173052
R Square
0.833885023
Adjusted R Square
0.813120651
Standard Error
10.73509502
Observations
10
ANOVA
df
Regression
Residual
Total
Intercept
Pret vanzare (mii $)
SS
4628.0619
5550
Coefficients
-29.32363674
0.068972606
Standard Error
20.687667
0.0108839
MS
.
.
F
.
2
4
6
12
8
21
11
25
15
20
3. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine relaia dintre preul (mii
euro) obinut pentru articolele licitate i vechimea (ani) a obiectelor. n urma prelucrrii cu EXCEL a datelor culese de la
un eantion aleatoriu de 10 licitaii, s-au obinut rezultatele:
62
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
0,913173
0,833885
0,813121
142,1289
10
Vechime
Mean
Standard Deviation
Smple Variance
100
24.83277
616.6667
ANOVA
df
Regression
Residual
Total
Intercept
Vechim
e
1
..
Coefficient
s
665,991
12,09009
SS
161605
972850
Standar
d Error
1,90781
3
MS
811245
F
.
t Stat
3,397844
...
66
20
43
15
57
18
32
12
18
2
a) Reprezentai grafic datele i determinai modelul liniar de regresie dintre cele dou variabile;
b) Msurai intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie i testai semnificaia
acestuia, pentru un nivel de semnificaie de 5% (tcritic= 3,747);
c) Efectuai o previzionare punctual i pe interval de ncredere a numrului de polie de asigurare ncheiate, dac
ntr-o sptmn s-au efectuat 50 de convorbiri telefonice.
63
5. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine relaia dintre preul obinut
pentru articolele licitate (u.m.) i numrul de persoane ce particip la licitaie. n ipoteza unui model de regresie liniar,
rezultatele prelucrrii n EXCEL sunt:
Regression Statistics
Multiple R
0.860271
R Square
0.740066
Adjusted R Square
0.707575
Standard Error
177.7908
Observations
10
ANOVA
df
Regression
Residual
Total
Intercept
Marimea audientei
SS
719973.5
252876.5
972850
1
8
9
Coefficient
s
1086.691
9.329102
MS
719973.5
31609.56
Standard
Error
174.4825
1.954748
Significance
F
0.001404
F
22.77708
t Stat
6.228079
4.772534
P-value
0.000252
0.001404
a)
b)
autorizaiilor de construcie s-a redus considerabil. Pentru 5 luni s-au nregistrat: rata dobnzii (%) (X) i numrul
autorizaiilor de construcie (Y):
Rata dobnzii (%)
Nr. autorizaiilor de construcie
a)
18
43
11
119
15
82
12
90
16
80
Reprezentai grafic datele i determinai modelul de regresie adecvat analizei legturii dintre cele dou variabile;
7. Pentru a analiza dac ntre valoarea vnzrilor lunare i vrsta agenilor de vnzri, ai unei mari companii ce
comercializeaz produse cosmetice, exist o legtur, un analist selecteaz aleator un eantion de 15 persoane. n urma
prelucrrii n EXCEL a datelor culese pentru cele dou variabile, s-au obinut rezultatele:
SUMMARY
OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
0.100488802
0.010097999
-0.066048309
5.290688304
15
ANOVA
df
Regression
SS
1
MS
3.712025
64
Residual
Total
13
14
367.6
Intercept
Varsta
Coefficients
11.67340114
0.062282291
Standard
Error
..
...
t Stat
.
.
Lower 95%
-0.130924113
-0.307204742
Upper 95%
23.47773
0.431769
a) S se testeze validitatea modelului de regresie liniar pe baza cruia s-au obinut prelucrrile din tabelele de mai
sus.
b) S se testeze semnificatia parametrilor modelului pentru o probabilitate de 95% (tcritic= 2,624)
8. Pentru a analiza n ce mod influeneaz vechimea utilajelor variaia costurilor de ntreinere a acestora, s-au
nregistrat pentru 5 utilaje: vechimea utilajelor (ani) i costurile lunare de ntreinere (sute euro):
Vechimea (ani)
Cost mediu lunar de ntreinere (sute euro)
2
4
6
12
8
31
11
25
15
34
a) Reprezentai grafic datele i determinati modelul liniar de regresie dintre cele dou variabile;
b) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator adecvat i testai semnificaia acestuia,
pentru un nivel de ncredere de 95% (tcritic= 4,541, Fcritic= 10,13)
c) Determinai intervalele de ncredere pentru parametrii modelului i interpretai rezultatele obinute.
9. O agenie imobiliar dorete s previzioneze preul de vnzare al unor case, pe baza unui model de regresie liniar
unifactorial, n funcie de suprafaa locuibil a acestora. Rezultatele obinute n urma prelucrrii n EXCEL a datelor
nregistrate pentru un eantion de 15 locuine sunt:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.903563
R Square
0.816426
Adjusted R Square
0.802305
Standard Error
6.39372
Observations
15
Suprafata (mp)
Mean
Smple Variance
58
160.4286
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
.
.
14
SS
..
531.4355595
2894.933333
Coefficients
21.23556
1.025824
Standard Error
.
MS
2363.497774
F
..
65
2
variana datorat regresiei (sistematic) y / x =
( y
n
i =1
2
y =737,4; variana rezidual 2e = ( y i y i ) =90. S se
2
i =1
testeze semnificaia modelului de regresie folosind testul F, pentru un nivel de semnificaie =0,05.
11. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i numrul
i =9,13+3,98xi. Se
vizitatorilor (mii pers.) timp de 5 zile. Modelul de regresie obinut n urma prelucrrii datelor este: y
n
2
2
2
cunosc: variana datorat regresiei (sistematic) y / x = y i y =740,8; variana rezidual e = ( y i y i ) =60.
i =1
i =1
S se testeze semnificaia modelului de regresie folosind testul F, pentru un nivel de semnificaie =0,05.
12. Pentru un mare magazin alimentar s-au cules date privind vnzrile (mil. RON) i profitul (mil. RON) realizate
n 9 luni ale anului 2003:
Luna
Val. Vnz. (mil. RON)
Profit (mil. RON)
Ian.
70
15
Feb.
20
2
Mar.
60
13
Apr.
40
15
Mai
140
25
Iun.
150
27
Iul.
160
24
Aug.
120
20
Sept.
140
27
30
3
42
4
10
1
62
6
12
1
30
2
21
2
58
5
66
14. Managerul unui magazin alimentar dorete s cunoasc dependena dintre valoarea vnzrilor i profit. Pentru
aceasta nregistreaz timp de 9 luni date privind vnzrile i profitul (mil. RON). n urma prelucrrii datelor (utiliznd
EXCEL) i a specificrii ecuaiei de regresie (n ipoteza legturii liniare) care modeleaz dependena dintre cele 2
variabile se obine :
Val. Vnz. (mil. RON)
Mean
Median
Mode
Standard Deviation
Smple Variance
Sum
Count
10
12
14
5.267826876
27.75
90
9
0.195555556
0.2
0.15
0.064828834
0.004202778
1.76
9
se2 =0.00045311.
Se cere:
a) Validai modelul de regresie obinut.
b) Testati semnificaia parametrilor ecuaiei de regresie.
c) Calculai i testai semnificaia coeficientului liniar de corelaie.
15. Pentru a analiza dependena dintre suprafaa cultivat (ha) i producia la hectar (q/ha) s-au nregistrat date
referitoare la aceste variabile pentru 10 parcele. n urma prelucrrii datelor (utiliznd EXCEL) i a specificrii ecuaiei de
regresie (n ipoteza legturii liniare) care modeleaz dependena dintre cele 2 variabile se obine :
Supr. cultivata. (ha)
Mean
82.4
Standard Deviation
11.296017
Smple Variance
127.6
Sum
824
Count
10
Se cere:
a) Validai modelul de regresie obinut.
b) Determinai intervalul de ncredere pentru parametrii ecuaiei de regresie.
c) Analizai intensitatea legturii dintre cele dou variabile cu ajutorul unui indicator adecvat i testai semnificaia
acestuia.
16. Pentru un mare magazin alimentar s-au cules date privind vnzrile (mii RON) i profitul (mii RON) realizate
n 9 luni ale anului 2007. n urma studierii legturii liniare dintre cele dou variabile, s-au obinut urmtoarele rezultate:
ANOVA
Regression
Residual
Total
df
1
...
8
SS
0,03045
.
.
Intercept
Val. Vnz.
Coefficients
0,078438
0,011712
Standard
Error
.
0,001429
MS
..
0,000453
t Stat
P-value
0,001719
7,8E-05
67
Significance F
0,0000779643
ANOVA
df
Regression
Residual
Total
Intercept
Nr. bilete
vndute
SS
.
0,450829
.
MS
0,438258
..
Coefficient
s
-0,435
Standard
Error
0,856914
t Stat
P-value
0,629823
0,001382
0,05221
Significance F
0,05221
68