Sunteți pe pagina 1din 17

Problema 1.

Un analist dorete s studieze legtura dintre cheltuielile pentru promovarea produselor i nivelul
vnzrilor realizate. n acest scop el sistematizeaz date pentru 15 mrfuri alimentare privind
cheltuielile lunare cu promovarea produsului (mii lei) i ncasrile lunare realizate (mii lei):
Cheltuieli promovare
(mii lei)
20,0
14,8
20,5
12,5
18,0
14,3
24,9
16,5
24,3
20,2
22,0
19,0
12,3
14,0
16,7

Nr. crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

ncasri lunare
(mii lei)
2190
1900
1990
1210
1500
1980
3340
1880
3100
2130
2880
3120
1860
1730
1740

a) Analiza legaturii pe baza metodei grafice:


Pentru analiza de regresie liniar simpl vom construi corelograma:
3800

3400

Incasari (mil. lei)

3000

2600

2200

1800

1400

1000
10

12

14

16

18

20

22

24

26

Cheltuieli de promovare (mil. lei)

Figura 4.8 Distribuia ncasrilor n funcie de cheltuieli

Analiznd corelograma remarcm c ntre cele dou variabile exist o legtur liniar direct ce
poate fi descris printr-o ecuaie de forma:
yi = a + bxi + ei
b) Determinam modelul de regresie liniara in esantion.
Calculele necesre estimrii parametrilor ecuaiei de regresie sunt redate n tabelul urmtor:
Tabelul 4.2

Nr.
crt.

Chelt. ncas.
(X)
(Y)

x2

y2

xy

)
y

)
y y

)
( y y )2

y y

( y y )2

Nr. Chelt. ncas.

xy
y2
x2
(X)
(Y)
crt.
1
12,30 1860 151,29 3459600 22878
2
12,50 1210 156,25 1464100 15125
3
14,00 1730 196,00 2992900 24220
4
14,30 1980 204,49 3920400 28314
5
14,80 1900 219,04 3610000 28120
6
16,50 1880 272,25 3534400 31020
7
16,70 1740 278,89 3027600 29058
8
18,00 1500 324,00 2250000 27000
9
19,00 3120 361,00 9734400 59280
10 20,00 2190 400,00 4796100 43800
11 20,20 2130 408,04 4536900 43026
12 20,50 1990 420,25 3960100 40795
13 22,00 2880 484,00 8294400 63360
14 24,30 3100 590,49 9610000 75330
15 24,90 3340 620,01 11155600 83166
Total 270,00 32550 5086,00 76346500 614492

)
y

)
y y

)
( y y )2

y y

( y y )2

1448,83
1474,14
1663,90
1701,85
1765,11
1980,18
2005,48
2169,94
2296,45
2422,96
2448,26
2486,22
2675,98
2966,95
3042,86
32549,10

411,17
-264,14
66,10
278,15
134,89
-100,18
-265,48
-669,94
823,55
-232,96
-318,26
-496,22
204,02
133,05
297,14
0,90

169058,30
69767,30
4369,21
77365,75
18195,85
10035,03
70478,04
448819,60
678234,60
54270,36
101290,70
246229,33
41624,16
17701,50
88292,77
2095732,52

-310
-960
-440
-190
-270
-290
-430
-670
950
20
-40
-180
710
930
1170
0

96100
921600
193600
36100
72900
84100
184900
448900
902500
400
1600
32400
504100
864900
1368900
5713000

Sistemul de ecuaii, pentru determinarea coeficienilor a i b este:


= 32550
15a + 270b

270a
+
5086b
= 614492

i rezult:
a = -107,24 i b = 126,51
Ecuaia de regresie este:

)
yi = 107 ,24 + 126,51xi
Pe baza datelor din tabelul 4.1 putem determina coeficientul de corelaie:
15 614492 270 32550

r=

(15 5086 270

)(15 76346500 32550 2 )

= 0,796 , ceea ce ne arat o legtur direct i de

intensitate destul de puternic ntre cele dou variabile.


c) Vom valida modelul de regresie determinat mai sus:
Surs
variaiei

Suma ptratelor
(SS-Sum of Squares)

Datorat
regresiei

2y / x =3617268

Rezidual

2e =2095732

n k 1=152=13

2y =5713000

n 1=15-1= 14

Total

Grade de
libertate
(df- degree of
freedom)
k=1

Media ptratelor
(MS- Mean of
Squares)

s y2 / x =3617268

se2 =161210,2

Pentru testarea validitii modelului se formuleaz cele dou ipoteze:


H0: model nevalid statistic, cu alternativa

Tabelul 4.4
Testul Fisher
(testul F)

Fcalc =

3617268 =22,438
161210 ,2

H1: model valid statistic


Valoarea teoretic pentru un prag de semnificaie = 0,05 i 1, respectiv 13 grade de libertate,
preluat din tabelul repartiiei Fisher este F ;k ;n k 1 =4,67.
ntruct Fcalc> F ;k ;nk 1 se respinge H0, adic se concluzioneaz c modelul este valid.
d) Pe baza datelor din exemplul de mai sus putem calcula i testa:
1) Raportul de corelaie

R = 1

2095732 ,52
= 0 ,6332 = 0 ,796 ,ceea ce ne arat o legtur destul de puternic ntre
5713000

variabile.

F=

n k 1 R2

= 22 ,438
k
1 R2

Valoarea teoretic pentru un prag de semnificaie = 0,05 i 1, respectiv 13 grade de


libertate, preluat din tabelul repartiiei Fisher este F ;k ;nk 1 =4,67.
ntruct Fcalc> F ;k ;nk 1 se respinge H0, adic se concluzioneaz c R este semnificativ
statistic.
2) Coeficientul de determinaie
R2 = 0, 6332 ceea ce arat c 63,32% din variaia ncasrilor se explic prin variaia cheltuielilor
de promovare a produsului.
Observm, de asemenea, c r =R =0,796, ceea ce arat c modelul de regresie este liniar.
e) Testarea semnificatiei parametrilor modelului de regresie si determinarea intervalelor lor de
incredere.
1) parametrul
Ipotezele sunt:
H0 : = 0 (b = = 0),
H1 : 0.
Deoarece volumul eantionului este mic (n<30), vom utiliza testul t:

t calc =

b b b 0
=
, statistic ce urmeaz o distribuie t cu (n 2) grade de libertate.
sb
sb

t calc = 4,736, iar sb = 26,7


Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este t/2;13 = 2,16 . Deoarece

t calc >t/2;13 vom concluziona c este foarte improbabil ca estimatorul b s provin dintr-o populaie cu
=0 ( adic este semnificativ diferit de zero).

Intervalul de ncredere pentru parametrul , coeficientul de regresie din colectivitatea general, este:

b t / 2 ,n 2 sb b + t / 2 ,n 2 sb , adic 68 ,81 184 ,21


2) parametrul a
Ipotezele sunt:
H0 : = 0,
H1 : 0
Statistica t este:

t calc =

a a a 0
=
.
sa
sa

tcalc = -0,218, iar sa =491,8


Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este t/2;13 = 2,16 . Deoarece

t calc <t/2;13 vom concluziona c este foarte probabil ca estimatorul a s provin dintr-o populaie cu
=0 ( adic nu este semnificativ diferit de zero).
Intervalul de ncredere pentru parametrul este dat de:

a t / 2 ,n2 sa a + t / 2 ,n2 sa , adic -1169,69 955,22.


Un argument suplimentar pentru concluzia c parametrul este nesemnificativ statistic este acela c
intervalul de ncredere include i valoarea zero.

Problema 2. Proprietarul unui minihotel dezvolt o analiz statistic pentru determinarea


cheltuielilor cu materialele de curenie (Y) n funcie de numrul camerelor ocupate (X). El determin
ecuaia de regresie pentru cheltuielile zilnice (pentru detergent, clor etc.) (zeci mii lei), pe baza datelor
nregistrate pentru n=14 zile:

yi = 10,8 + 3,7 xi

(x
(y

x ) = 26,86

y ) 2 = 163,39

x = 2,3

a) Proprietarul dorete s estimeze cheltuielile cu materialele de curenie pentru o zi n care


are 6 camere ocupate;
b) Proprietarul dorete s estimeze cheltuielile medii cu curenia pentru zilele n care are 6
camere ocupate.
Dac numrul camerelor ocupate este x n +1 = 6 , atunci:

y n+1 = 10,8 + 3,7 6 = 33;


t / 2,n 2 = t 0.025,12 = 2,179;
se =

163,39
= 3,69.
12

t0,025;12 = 2,179
a) Intervalul de ncredere pentru cheltuielile unei zile n care sunt 6 camere ocupate este:

33 2,179 3,69 1 +

1 (6 2,3) 2
,
+
14
26.86

adic (22,89;43,11) garantat cu o probabilitate de 95%;


b) Intervalul de ncredere pentru media cheltuielilor zilnice n cazul n care au 6 camere
ocupate este:

33 2,179 3,69

1 (6 2,3) 2
+
,
14
26.86

adic (30,19;35,82), garantat cu o probabilitate de 95%.

Problema 3
Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i
numrul vizitatorilor (mii pers.) timp de 14 zile.:
Ziua
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Nr. spoturi publicitare


7
5
1
8
10
2
6
7
9
3
12
8
4
11

Nr. vizitatori (mii pers.)


42
32
10
40
61
8
35
34
45
11
64
37
30
55

Se cere:
a) reprezentai grafic datele; Comentai graficul.
b) pe baza datelor de la nivelul eantionului, determinai ecuaia de regresie care modeleaz legtura
dintre cele dou variabile i calculai numrul zilnic previzionat de vizitatori;
c) verificai dac modelul de regresie identificat este valid statistic;

d) testai semnificaia statistic a parametrilor modelului, determinnd i intervalele de ncredere


pentru acetia;
e) msurai intensitatea legturii dintre cele dou variabile cu ajutorul coeficientului i a raportului de
corelaie; testai semnificaia indicatorilor utilizai;
f) n ce msur variaia numrului de vizitatori este determinat de numrul spoturilor publicitare, pe
baza modelului de regresie determinat?
g) previzionai numrul vizitatorilor ateptai ntr-o zi, n ipoteza c se vor difuza 15 spoturi n acea zi.
h) previzionai numrul mediu zilnic de vizitatori, n ipoteza c se vor difuza 8 spoturi publicitare n
medie pe zi.

Rezolvare:
a) Notm cu X variabila factorial, independent nr.spoturi publicitare i cu Y variabila
dependent nr.vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate construim
corelograma (figura 4.10).

70

60

nr.vizitatori

50

40
30

20

10

0
0

10

12

14

nr.spoturi

Figura 4.10 Corelograma (diagrama de mprtiere)


Se observ c legtura dintre variabile este direct i liniar (ntruct dreapta de regresie are
pant pozitiv), iar ecuaia de regresie va avea forma:
yi = a + bxi

b) Pentru a determina estimatorii a i b, rezolvm sistemul de ecuaii normale, folosind datele


din tabelul de lucru 4.5:

na + b xi =
yi

2
a xi + b xi =

xi yi

n=14 (numrul observaiilor)

Tabelul 4.5

xi

xi2

yi

xiyi

yi2

y i = 2,2858

( y i y )2

( yi yi )2

+ 5,0753 xi
7
5
1
8
10
2
6
7
9
3
12
8
4
11

17,53
18,82
6,96
8,34
63,39
19,68
5,12
14,54
8,78
42,40
0,66
34,67
54,96
9,69

3,29
69,52
820,19
47,44
290,31
555,25
10,64
3,29
143,12
341,82
739,24
47,44
179,91
489,01

0,13
2,70
31,84
1,84
11,27
21,56
0,41
0,13
5,56
13,27
28,70
1,84
6,98
18,98

xi yi xi2 xi yi yi2

504

305,53

3740,47

145,21

=763

294
160
10
320
610
16
210
238
405
33
768
296
120
605

37,81
27,66
7,36
42,89
53,04
12,44
32,74
37,81
47,96
17,51
63,19
42,89
22,59
58,11

=504

49
25
1
64
100
4
36
49
81
9
144
64
16
121

1764
1024
100
1600
3721
64
1225
1156
2025
121
4096
1369
900
3025

=93

42
32
10
40
61
8
35
34
45
11
64
37
30
55

(x

=4085

=22190

14 a + 93b = 504

93a + 763b = 4085

504 763 93 4085 4647


a= a =
=
= 2 ,2858
2033

14 763 (93 )2

14 4085 93 504 10318


b= b =
=
= 5 ,0753

2033
14 763 (93 )2

Ecuaia de regresie este:


yi = 2 ,2858 + 5 ,0753 xi

c) Testarea validitii modelului de regresie determinat.


Pentru testarea validitii modelului se formuleaz cele dou ipoteze:
H0: model nevalid statistic, cu alternativa
H1: model valid statistic

Se completeaz tabelul:
Surs
variaiei

Suma ptratelor
(SS-Sum of
Squares)

Datorat
regresiei

2y / x =3740,465

Rezidual

2e =305,535

n k 1=14 2=12

2y =4046,000

n 1=15-1= 13

Total

Grade de
libertate
(df- degree of
freedom)
k=1

Media ptratelor
(MS- Mean of
Squares)

s y2 / x =3740,465

se2 =25,461

Testul Fisher
(testul F)

Fcalc =

3740 , 465 =146,908


25 , 461

Valoarea teoretic pentru un prag de semnificaie = 0,05 i 1, respectiv 12 grade de libertate,


preluat din tabelul repartiiei Fisher este F ;k ;n k 1 =4,75.
ntruct Fcalc> F ;k ;n k 1 se respinge H0, adic se concluzioneaz c modelul este valid.
Calculele intermediare se gsesc n tabelul 4.5.
d) Ecuaia de regresie liniar la nivelul colectivitii generale se scrie:
yi = + xi + i,

iar la nivelul eantionului:

yi = a + bxi + ei
Pentru testarea semnificaiei parametrilor modelului de regresie liniar i estimarea lor pe
intervalele de ncredere se procedeaz astfel:
1) pentru parametrul
Ipotezele testate sunt:
H0 : = 0 (b = = 0),
H1 : 0.
Deoarece volumul eantionului este mic (n<30), vom utiliza testul t:

t calc =

b b b 0
, statistic ce urmeaz o distribuie t cu (n 2) grade de libertate.
=
sb
sb

se

Unde sb =

(x

x)

5,046
145,21

= 0,4187

i =1

Iar s e =

2
e

=
n2

(y

y i )

i =1

n2

305,53
= 5,046
12

Se obine t calc = 12,1206


Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este t/2;13 = 2,179 . Deoarece

tcalc >t/2;13 vom concluziona c este foarte improbabil ca estimatorul b s provin dintr-o populaie cu
=0 ( adic este semnificativ diferit de zero), deci parametrul este semnificativ statistic.
Intervalul de ncredere pentru parametrul , coeficientul de regresie din colectivitatea general, este:

b t / 2 ,n 2 sb b + t / 2 ,n 2 sb , adic 4,1629 5,9876


2) pentru parametrul a
Ipotezele testate sunt:
H0 : = 0,

H1 : 0
Statistica t este:

t calc =

a a a 0
=
.
sa
sa
n

2
i

i =1

Unde s a = se

= 5,046

n ( xi x ) 2

763
= 3,0912
14 145,21

i =1

Se obine t calc = 0,7394


Pentru un prag de semnificaie de 5%, valoarea teoretic a testului este t/2;13 = 2,179 . Deoarece

t calc <t/2;13 vom concluziona c este foarte probabil ca estimatorul a s provin dintr-o populaie cu
=0 ( adic nu este semnificativ diferit de zero).

Intervalul de ncredere pentru parametrul este dat de:

a t / 2 ,n2 sa a + t / 2 ,n2 sa , adic -4,4495 9,0210.


Un argument suplimentar pentru concluzia c parametrul este nesemnificativ statistic este acela c
intervalul de ncredere include i valoarea zero.

e) Pentru a msura intensitatea legturii dintre cele dou variabile se va calcula mai nti
coeficientul de corelaie liniar:
r=

xi yi xi yi
=
n x 2 ( x )2 n y 2 ( y )2
i i i
i
n

10318

2033 14 22190 504 2

b
n

yi2

( yi )

10318
= 0 ,9615
10731

Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de
valoarea unitar).
Pentru testarea semnificaiei coeficientului de corelaie liniar simpl, se procedeaz astfel:
Ipotezele testate sunt:
H0 : = 0 ( nu este semnificativ statistic)

H1: 0 ( este semnificativ statistic).


Statistica t este:

t calc =

r r n 2 0,9615 12
=
=
= 12,12 .
sr
1 r2
1 0,9615 2

Cum valoarea tabelar a testului t, pentru un prag de semnificaie de 5% i 12 grade de


libertate este 2,179 rezult c tcalc > t ;n 2 , deci coeficientul de corelaie este semnificativ statistic

Un alt indicator utilizat att n cazul legturilor liniare, ct i al celor neliniare este raportul de
corelaie R:

R = Ry / x = 1

( y y )
(y y )
i

= 1

305,53
= 0,9615
4046

Calculele necesre determinrii raportului de corelaie sunt redate n 4.5


y=

yi = 504 = 36
n

14

mii pers.

Ry/x = ry/x = 0,9615, deci exist o legtur liniar, puternic i direct ntre cele dou variabile.

Testarea semnificaiei raportului de corelaie se face cu testul F:

F=

n k 1 R2

= 146,9
k
1 R2

Valoarea teoretic pentru un prag de semnificaie = 0,05 i 1, respectiv 12 grade de


libertate, preluat din tabelul repartiiei Fisher este F ;k ;nk 1 =4,75.
ntruct Fcalc> F ;k ;nk 1 se respinge H0, adic se concluzioneaz c R este semnificativ
statistic.
f) Pentru a determina n ce msur variaia numrului de vizitatori este explicat de influena
numrului de spoturi publicitare difuzate zilnic, se calculeaz coeficientul de determinaie:
R y2 / x = 0 ,9615 2 = 0 ,9245 su 92,45% arat c aproximativ 92% din variaia variabilei Y este

explicat de variabila X.
g) Dac numrul spoturilor publicitare difuzate va fi de 15, atunci numrul previzionat al
vizitatorilor pe baza acestei ecuaii de regresie este:
y / x =15 = 2 ,2858 + 5 ,0753 15 78 mii pers. (estimare punctual)

Pentru estimarea pe interval de ncredere, trebuie s determinm dispersia diferenei

y n +1 y n +1,i , adic dispersia erorii de previzionare. Dispersia n eantion este:

2
1 (15 6,64) 2
1 ( x x)
= 39,534 .
s(2y n +1,i ) = s(2y n +1 yn +1,i ) = se2 1 + + n n+1
= 25,461 1+ +
n

14
145,21
2

( xi x)

i =1

Intervalul de ncredere este:

y n +1,i t / 2,n 2 s e 1 +

1 ( x n +1 x ) 2
+ n
, adic (64,71; 92,11) mii persoane.
n
2
( xi x)
i =1

h) Suntem n cazul determinrii intervalului de ncredere pentru media de rspuns, cnd xn+1
x . Pentru aceasta se determin y n +1 = y + b( x n +1 x) = 36 + 5,0753 (8 - 6,64) = 42,9

iar estimatorul dispersiei pentru y n+1 este:

s(2y n +1 )

( x x) 2
2 1
= se
+ n n +1
n
2
xi x

i =1

2
= 25,461 1 + (8 6,64)
14

145,21

= 2,14

Intervalul de ncredere pentru media de rspuns este:

)
)

x x
1
+ n n +1
n
xi x

y n +1 t / 2, n 2 s e

2
2

, adic (39,71; 46,08) mii persoane

i =1

Se poate utiliza, ns, pentru rezolvarea problemei i un pachet informatic specializat, n cazul
nostru EXCEL. n urma selectrii, din meniul principal, a opiunilor

<Tools>+<Data

Analysis>+<Regression>, s-au obinut urmtoarele rezultate:


SUMMARY OUTPUT
Regression Statistics
Multiple R
0,961501303
R Square
0,924484756
Adjusted R
Square
0,918191819
Standard Error
5,045911528
Observations
14
ANOVA
df

Regression
Residual
Total

Intercept
Nr. spoturi

1
12
13

Coefficients
2,2858
5,0753

SS
3740,465
305,535
4046,000

Standard Error
3,0912
0,4187

MS
3740,465
25,461

F
146,908

Significance F
0,0000000433

t Stat
0,7394
12,1206

P-value
0,4738580696
0,0000000433

Lower
95%
-4,4495
4,1629

Upper
95%
9,0210
5,9876

Problema 4. Un vnztor de automobile second hand ar dori s tie dac preul de vnzare al
acestora la licitaie depinde de numrul de kilometri parcuri de automobilul respectiv. Pentru aceasta
el selecteaz 50 de automobile cu o vechime de 3 ani, aceeai marc i aceleai faciliti. Pentru
fiecare main a nregistrat preul de vnzare la licitaie i numrul de kilometri de la bordul
autoturismului.
a)

Vnztorul ar dori s tie care este dependena dintre preul de vnzare i numrul de
kilometri parcuri.

b)

Testai semnificaia parametrilor funciei de regresie i validitatea modelului de regresie


obinut.

c)

Msurai intensitatea legturii dintre variabile.


Preul
37388
44758
45833
30862
31705
34010
45854
19057
40149
40237

Nr.Km
5318
5061
5008
5795
5784
5359
5235
5845
5536
5401

Preul
32359
43533
32744
34470
37720
41350
24469
35781
48613
24188

Nr.Km
5595
5330
5806
5805
5317
5316
5870
5504
5333
5705

Preul
38775
45563
28676
38231
36683
32517
39050
45251
34384
38383

Nr.Km
5150
5249
5775
5327
5192
5544
5054
5115
5410
5529

Preul
32161
26561
33533
41849
36668
37495
25629
40099
31014
42233

Nr.Km
5507
5873
5303
5237
5383
5286
5827
5483
5440
5215

Preul
37407
34356
30599
42485
38430
40452
26030
46296
34844
27379

Nr.Km
5105
5685
5788
5208
5168
5128
5750
4965
5238
5763

Rezolvare:
a) Pentru determinarea dependenei ntre cele dou variabile se face un grafic pentru determinarea
tipului legturii.
6000
5800

Pre

5600
5400
5200
5000
4800
0

10000

20000

30000

40000

50000

60000

Numr de kilometri parcuri

Figura 4.12

Deoarece punctele reprezentate sunt grupate n jurul diagonalei secundare, exist o


dependen liniar, invers ntre cele dou variabile. Pentru determinarea modului n care preul
variaz n funcie de numrul de kilometri parcuri se va folosi modelul de regresie liniar.
Rezolvare folosind EXCEL:

1. Introducei datele astfel: n celula A1 tastai Nr.Km. iar n B1 Preul. n prima coloan,
ncepnd din A2 se vor introduce numrul de kilometri parcuri, iar pe coloana a doua,
ncepnd din B2 se vor introduce preurile.
2. Apsi Tools-Data Analysis i Regression.
3. La Input Y Range selectai B1:B51. La Input X Range selectai A1:A51. Selectai Labels.
4. Dac dorii s calculai valorile reziduale ( y i y i ), selectai Residuals. Apsi OK.
Se obin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.808922
R Square
0.654355
Adjusted R Square
0.647154
Standard Error
157.8984
Observations
50
ANOVA
Df
Regression
Residual
Total

1
48
49
Coefficients

Intercept
Nr.Km.

SS
2265584
1196732
3462316

Standard
Error
6598.34
124.3322
-0.03224
0.003382

MS
2265584
24931.91

t Stat
53.07024
-9.53262

F
90.87089

P-value

Significance F
1.19E-12

Lower 95% Upper 95%

2.78E-44
1.19E-12

6348.353
-0.03904

6848.326
-0.02544

Interpretarea rezultatelor prezente n ultimul tabel din SUMMARY OUTPUT.

Coeficientul b este 0,03224, ceea ce nsemn c la creterea distanei parcurse cu 1


kilometru, preul va descrete cu 0,03224104 lei (322,4 lei).
Intercept este termenul liber, deci coeficientul a este 6598,34. Termenul liber este punctul n
care dreapta de regresie intersecteaz axa y. Aceasta nseamn c x=0, deci a reprezint preul unei
maini care nu a fost condus. Dar, n cazul nostru acest punct nu are semnificaie, deoarece toate
mainile sunt second hand.
Interpretarea rezultatelor prezente n primul tabel din SUMMARY OUTPUT.

Este calculat eroarea standard, Standard Error, egal cu 157,9. n cazul n care aceast
valoare este zero, nseamn c toate punctele observate se afl pe dreapta de regresie. Deci, bine este
ca aceast valoare s fie ct mai apropiat de zero. Ce nseamn mai apropiat de zero este greu de
spus folosind doar eroarea standard. De aceea se calculeaz mrimi derivate din aceasta pentru a spune
ct de apropiate sunt punctele de dreapta de regresie.
Pentru a putea spune n ce msur modelul liniar de regresie explic dependena dintre
variabile se calculeaz coeficientul de determinaie, R-square care n cazul nostru este 0,6544. Deci
65,44% din variaia preului este explicat de variaia numrului de kilometri parcuri de automobil.
2

Este calculat, de asemenea, coeficientul de determinaie ajustat, R , egal cu 0,6472.


n cazul n care a fost selectat i Residuals, tot n acest Sheet de rezultate sunt calculate
valorile reziduale i valorile previzionate pe baza modelului de regresie.

RESIDUAL OUTPUT
Observation
1
2
3
4
.....

Predicted Price
Residuals
5392.879821
-74.8798
5155.257064
-94.2571
5120.597029
-112.597
5603.29042
191.7096

Rezolvare folosind STATISTICA:


1. Creai un fiier cu 2 variabile i 50 de cazuri (File/New data). Introducei datele astfel: prima
variabil este numrul de kilometri parcuri, a doua variabil este preul stabilit la licitaie.
2. Selectai modulul General Linear Model. Selectai apoi Simple Regression.
3. n noua fereastr deschis apsi butonul Variables. Aici selectai la Dependent variable list
a doua variabil i la Predictor prima variabil. Apsi OK.
4. Apsi Summary. Apsi Coefficients.
Se obine:

Acest tabel se interpreteaz similar cu tabelul 3 din SUMMARY OUTPUT obinut prin EXCEL.
5. Apsi Continue. Apsi Whole model R.
Se obine:

Acest tabel se interpreteaz similar cu tabelul 1 din SUMMARY OUTPUT obinut prin EXCEL.
Dac se dorete calculul valorilor reziduale i al celor previzionate se parcurg paii:
6. Apsi Continue. Apsi Resids. Selectai Extended. Apsi Predicted and residuals.
Se obine:

Se observ c n tabelul anterior sunt afiate:


- preul observat;
- preul previzionat;
- valoarea rezidual: preul observat preul previzionat;
- eroarea standard;

b) Rezolvare folosind EXCEL:


Interpretarea rezultatelor prezente n ultimul tabel din SUMMARY OUTPUT.

n coloana a doua (Standard Error) sunt calculate, erorile standard ale parametrilor estimai:
sa = 124,33 i sb = 0,0034. Aceste erori sunt folosite pentru calculul statisticilor t pentru testarea

semnificaiei estimatorilor. Acestea sunt calculate n coloana tStat, ta = 53,07 i tb = - 9,53. Deoarece
valorile p asociate sunt foarte apropiate de zero (n coloana P-value), se poate spune c estimatorii
sunt semnificativi.
Lower 95% i Upper 95% sunt limitele inferioare, respectiv superioare ale coeficienilor estimai.
Interpretarea rezultatelor prezente n tabelul ANOVA.

Validitatea modelului de regresie se testeaz folosind testul F. n tabelul ANOVA sunt


calculate cele trei variaii: cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se
calculeaz Statistica F. n cazul nostru aceasta este 90,87. Deaorece valoarea p asociat este foarte
apropiat de zero (prag de semnificaie sczut), se poate valida modelul de regresie.
n cazul n care a fost selectat i Residuals, tot n acest Sheet de rezultate sunt calculate
valorile reziduale i valorile previzionate pe baza modelului de regresie.
RESIDUAL OUTPUT
Observation

1
2
3
4
.....

Predicted Price Residuals


5392.879821 -74.8798
5155.257064 -94.2571
5120.597029 -112.597
5603.29042 191.7096

Rezolvare folosind STATISTICA:

Acest tabel se interpreteaz similar cu tabelul 3 din SUMMARY OUTPUT obinut prin EXCEL.
Dac se dorete calculul valorilor reziduale i al celor previzionate se parcurg paii:
Apsi Continue. Apsi Resids. Selectai Extended. Apsi Predicted and residuals.

Se obine:

Se observ c n tabelul anterior sunt afiate:


-

preul observat;

preul previzionat;

valoarea rezidual: preul observat preul previzionat;

eroarea standard;

intervalul de previziune, pentru o probabilitate de 95%: n cazul unui automobil cu acelai


numr de kilometri parcuri, cu o probabilitate de 95%, preul previzionat al acestuia va fi
inclus n intervalul de previziune;

intervalul de ncredere, pentru o probabilitate de 95%: n cazul unui automobil cu acelai


numr de kilometri parcuri, cu o probabilitate de 95%, preul acestuia va fi inclus n
intervalul de ncredere.
c) Deoarece datele sunt cantitative, pentru msurarea intensitii legturii dintre dou variabile

se calculeaz coeficientul de corelaie liniar.


Rezolvare folosind EXCEL:
1. Introducei datele ca n Exemplul 5.13.
2. Apsi Tools-Data Analysis i Correlation.
3. Specificai Input Range (A1:B51). Apsi Labels in First Row. Apsi OK.
Se obin rezultatele:
Numr de kilometri parcuri
Numr de kilometri parcuri
Pre

1
-0.808922247

Pre

Coeficientul de corelaie dintre numrul de kilometri parcuri i pre este -0,809. Deoarece acesta
este negativ i apropiat de unu se poate spune c exist o corelaie invers ntre cele dou variabile.
Rezolvare folosind STATISTICA:
1.
2.
3.
4.

Introducei datele ca n Exemplul 5.13.


Selectai modulul Basic Statistics and Tables. Selectai apoi Correlation Matrices.
Apsi butonul One variable list (square matrix). Selectai ambele variabile. Apsi OK.
La Display selectai Detailed table of results. Apsi OK.

Se obin rezultatele:

Coeficientul de corelaie dintre numrul de kilometri parcuri i pre este -0,81. Deoarece
acesta este negativ i apropiat de unu se poate spune c exist o corelaie invers ntre cele dou variabile.

S-ar putea să vă placă și