Sunteți pe pagina 1din 25

UNITATEA DE NVARE 4

Modelul liniar unifactorial


Exemplu
Se cunosc urmtoarele date privind ncasrile medii lunare i suprafaa comercial a 10
societi comerciale avnd acelai profil de activitate:
Tabelul 1.
Suprafaa
comercial
(m
2
)

20

30

50

60

80

90

100

110

120

150
ncasrile
medii lunare
(mil. u. m.)

0,5

0,7

0,8

1,0

1,1

1,3

1,4

1,6

1,8

2,1

Se cere:
a) s se specifice modelul econometric ce descrie legtura dintre cele dou variabile;
b) s se estimeze parametrii modelului i s se calculeze valorile teoretice ale variabilei
endogene;
c) s se verifice ipotezele de fundamentare a metodei celor mai mici ptrate;
d) s se verifice semnificaiile estimatorilor i verosimilitatea modelului;
e) tiind c un antreprenor poate s cumpere o suprafa comercial de 130 m
2
, s se
estimeze ncasrile medii lunare ale acestuia.
Rezolvare:
a) Pe baza datelor problemei se poate construi un model econometric unifactorial de
forma:
u x f y + = ) (
unde:
y - valorile reale ale variabilelor dependente;
x - valorile reale ale variabilelor independente;
u - variabila rezidual, reprezentnd influenele celorlali factori ai variabilei y,
nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra
variabilei y.
Analiza datelor din tabel, n raport cu procesul economic descris conduce la urmtoarea
specificare a variabilelor:
y - ncasrile medii lunare, reprezentnd variabila rezultativ, ale crei valori depind de o
mulime de factori - suprafaa comercial, amplasarea magazinului, reclama societii respective
etc;
x - suprafaa comercial, factorul considerat prin ipoteza de lucru cu influena cea mai
puternic asupra variabilei y.
Specificarea unui model econometric presupune, de asemenea, alegerea unei funcii
matematice ( ) ( )
f x cu ajutorul creia poate fi descris legtura dintre cele variabile. n cazul
unui model unifactorial, procedeul cel mai des folosit l constituie reprezentarea grafic a celor
dou iruri de valori cu ajutorul corelogramei.

Figura 1. Legtura dintre ncasrile medii lunare i suprafaa
comercial
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
20 30 50 60 80 90 100 110 120 150
y
x
Din grafic se poate observa c distribuia punctelor empirice ( ) x y
i i
, poate fi aproximat
cu o dreapt. Ca atare, modelul econometric care descrie legtura dintre cele dou variabile se
transform ntr-un model liniar unifactorial u bx a y + + = , a i b reprezentnd parametrii
modelului, b 0 , panta dreptei fiind pozitiv deoarece legtura dintre cele dou variabile este
liniar.
b) Deoarece parametrii modelului sunt necunoscui, valorile acestora se pot estima cu
ajutorul mai multor metode, n mod curent fiind folosit ns metoda celor mai mici ptrate
(M.C.M.M.P.). Utilizarea acestei metode pornete de la urmtoarea relaie:
y a bx u
i i i
= + +
y
i
=b
0
+b
1
+e
i

i i
x b a y

+ =

unde:
=
i
y reprezint valorile teoretice ale variabilei y obinute numai n funcie de
valorile factorului esenial x i valorile estimatorilor parametrilor a i b, respectiv $ a i
$
b ;
( ) ( ) = + = =
i i i i
x b b a a y y u

estimaiile valorilor variabilei reziduale.


n mod concret, M.C.M.M.P. const n a minimiza funcia
( ) ( ) ( )

= =
= =
10
1
2
10
1
2

min min

,
i
i i
i
i i
x b a y y y b a F
Condiia de minim a acestei funcii rezult din:

( )
( )
= + =
= + =


F a na b x y
F b a x b x y x
i i
i i i i
$ $
$
$
$
$
0
0
2







Tabelul 2.
Nr.
crt.
Suprafaa
comercial
(m
2
)
ncasri
medii
lunare
(mil.lei)

x
i
2


x y
i i


i
i
x
y
0122 , 0
2409 , 0
+
+ =


( ) x x
i

2


i i i
y y u =

u
i
2


y y
i

0 1 2 3 4 5 6 7 8 9
1 20 0,5 400 10 0,4852 3721 0,0148 0,0002 -0,73
2 30 0,7 900 21 0,6073 2601 0,0927 0,0086 -0,53
3 50 0,8 2500 40 0,8515 961 -0,0515 0,0026 -0,43
4 60 1,0 3600 60 0,9736 441 0,0264 0,0007 -0,23
5 80 1,1 6400 88 1,2178 1 -0,1178 0,0139 -0,13
6 90 1,3 8100 117 1,3399 81 -0,0399 0,0016 0,07
7 100 1,4 10000 140 1,4620 361 -0,0620 0,0038 0,17
8 110 1,6 12100 176 1,5841 841 0,0159 0,0003 0,37
9 120 1,8 14400 216 1,7062 1521 0,0938 0,0088 0,57
10 150 2,1 22500 315 2,0725 4761 0,0275 0,0008 0,87
Total 810 12,3 80900 1183 12,3 15290 0 0,0413 0

Tabelul 2. (continuare)

( ) y y
i

2



x x
i


u
i


( ) u x x
i i


u
i 1


( ) u u
i i

1
2


u
i 1
2


u u
i i 1


( )( ) x x y y
i i


10 11 12 13 14 15 16 17 18
0,5329 -61 0,0148 -0,9056 - - - - 44,53
0,2809 -51 0,0927 -4,7298 0,0148 0,0061 0,0002 0,0014 27,03
0,1849 -31 -0,0515 1,5956 0,0927 0,0208 0,0086 -0,0048 13,33
0,0529 -21 0,0264 -0,5549 -0,0515 0,0061 0,0026 -0,0014 4,83
0,0169 -1 -0,1178 0,1178 0,0264 0,0208 0,0007 -0,0031 0,13
0,0049 9 -0,0399 -0,3591 -0,1178 0,0061 0,0139 0,0047 0,63
0,0289 19 -0,0620 -1,1780 -0,0399 0,0005 0,0016 0,0025 3,23
0,1369 29 0,0159 0,4609 -0,0620 0,0061 0,0038 -0,0010 10,73
0,3249 39 0,0938 3,6577 0,0159 0,0061 0,0003 0,0015 22,23
0,7569 69 0,0275 1,8954 0,0938 0,0044 0,0088 0,0026 60,03
2,321 0 0,0148 0,0000 - 0,0768 0,0405 0,0024 186,7

Estimarea parametrului
$
b :
0122 , 0
152900
1867
656100 809000
9963 11830
80900 810
810 10
1183 810
3 . 12 10

2
= =

= = =




i i
i
i i i
i
x x
x n
x y x
y n
b
(vezi calcule tabelul nr. 2.1.2., coloanele 1, 2, 3, 4).
Estimarea parametrului $ a :
na b x y
n
a b
x
n
y
n
a y bx
i i
i i
$
$
* $
$
$
$
+ = + = =

1

2409 , 0 81 * 0122 , 0 23 , 1
23 , 1
10
3 , 12
81
10
810
= =

= = =
= = =

a
n
y
y
n
x
x
i
i


Dispunnd de estimaiile parametrilor se pot calcula valorile teoretice (estimate) ale
variabilei endogene,
i
Y , cu ajutorul relaiei:

i i
x y 0122 , 0 2409 , 0 + = (vezi tabelul 2, coloana 5).
Valorile variabilei reziduale vor rezulta din urmtoarea relaie:

i i i
y y u = (vezi tabelul 2, coloana 13).
Pe baza acestor valori se pot calcula abaterea medie ptratic a variabilei reziduale
u
s

i
abaterile medii ptratice ale celor doi estimatori,
a
s

i
b
s

:
( )
0052 , 0
2 10
0413 , 0
1

2
2

=

k n
y y
s
i i
u


(vezi tabelul 2, coloana 8)
unde:
k - numrul estimatorilor;
0724 , 0 005245 , 0

= =
u
s

( )
0027 , 0
15290
81
10
1
* 0052 , 0
1
2
2
2
2

=
(

+ =
(
(

+ =

x x
x
n
s s
i
u a

(vezi tabelul 2, coloana 6)
0523 , 0 0027 , 0

= =
a
s

( )
0000003 , 0
15290
0052 , 0 1
2
2

= =

x x
s s
i
u
b

0006 , 0 0000003 , 0

= =
b
s
n urma acestor calcule, modelul econometric se poate scrie:

i i
x y 0122 , 0 2409 , 0 + = ; 0718 , 0

=
u
s
(0,0523) (0,0006)

n urma folosirii programului EXCEL s-au obinut urmtoarele rezultate:
SUMMARY OUTPUT
Regression Statistics Semnif. ind.
Multiple R
Raportul de
corelaie (R)
0,9911
( )
( )
( )
( )

=
=
=
=

=
n
i
i
n
i
i i
n
i
i
n
i
i
x y
y y
y y
y y
y y
R
1
2
1
2
1
2
1
2
,


R Square
Coeficientul
(gradul ) de
determinare 0,9822
( )
( )

=
=

= = =
n
i
i
n
i
i
u x
y y
y y
V
V
V
V
R
1
2
1
2
2
0
2
2
0
2
2

1

Adjusted R
Square
Valoarea ajustat
a coeficientului
de determinare 0,9800
( )
2 2
1
1
1 R
n
k n
R
c

=

Standard Error
Abaterea medie
ptratic a
erorilor n
eantion 0,0718
( )
2

2
1
2
2

=
n
y y
n
V
s
n
i
i i
u
u

Observations
Numrul
observaiilor (n) 10
n =

ANOVA
Sursa de
variaie
df

Nr.
gradelor
de
libertate
SS Suma
ptratelor
(Msura
variaiei)
MS Media
ptratel
or
(Dispers
ii
F Significanc
e F
Prag de
semnif.
corectat
e)
Regressio
n (variaia
datorat
regresiei) 1
= k
2,279
7
( )

=
2 2
y y V
i x

2,279
7
= s
y x /
2

441,785
7
F
c
0,0000 <0,005
Residual
(variaia
rezidual) 8
= n k 1
0,041
3
( )

=
2 2

i i u
y y V
0,005
2
2
u
s =
- -
Total
(variaia
total) 9
1 =n
2,321
0
( )

=
2 2
0
y y V
i

- - - -

Variable Coefficients Coef
.
Standard
Error
Abatere
a medie
patratic

t Stat
P-
value
Prag de
semnif.
Intercept
(Termen
liber) 0,2409
a

0,0523
a
s


4,6111
a
c
t


0,001
7
<0,005
x
i
0,0122
b


0,0006
b
s


21,0187
b
c
t


0,000
0
<0,005

Lowe
r 95%
< 95% Upper
95%
>95% Lower
99,0%
<99% Upper
99,0%
>99%
0,120
4
[ ]
a
s t a a
8 ; 05 , 0


0,3614
[ ]
a
s t a a
8 ; 05 , 0
+
0,0656
[ ]
a
s t a a
8 ; 01 , 0


0,4163
[ ]
a
s t a a
8 ; 01 , 0
+
0,010
9
[ ]
b
s t b b
8 ; 05 ; 0


0,0136
[ ]
b
s t b b
8 ; 05 ; 0

+

0,0103
[ ]
b
s t b b
8 ; 01 ; 0



0,0142
[ ]
b
s t b b
8 ; 01 ; 0

+


RESIDUAL OUTPUT
Observation
Predicted Y
i i
x b a y

+ =
Residuals
i i i
y y u =
1 0,4852 0,0148
2 0,6073 0,0927
3 0,8515 -0,0515
4 0,9736 0,0264
5 1,2178 -0,1178
6 1,3399 -0,0399
7 1,4620 -0,0620
8 1,5841 0,0159
9 1,7062 0,0938
10 2,0725 0,0275

Interpretarea indicatorilor:
Intercept este termenul liber, deci coeficientul 2409 , 0 = a . Termenul liber este punctul
n care variabila explicativ (factorial) este egal cu 0. Deci ncasrile medii lunare, dac
suprafaa comercial este egal cu 0, sunt egale cu 0,2409 mil u. m.
Coeficientul 0122 , 0

= b , ceea ce nsemn c, la creterea suprafeei comerciale cu un m


2
,
ncasrile medii lunare vor crete cu 0,0122 mil. u. m.
R= 0,9911 arat c ntre suprafaa comercial i ncasrile medii lunare exist o legtur
puternic, semnificativ;
R
2
=0,9822 arat c aproximativ 98,22% din variaia ncasrilor medii lunare este
explicat de suprafaa comercial a acestora.
Abaterea medie ptratic a erorilor, s
u
= 0,0718. n cazul n care valoarea acestui
indicator este egal cu zero nseamn c toate punctele sunt situate pe dreapta de
regresie.

c) Estimatorii obinui cu ajutorul M.C.M.M.P. sunt estimatori de maxim verosimilitate
dac pot fi acceptate urmtoarele ipoteze:
c
1
) Variabilele observate nu sunt afectate de erori de msur.
Aceast condiie se poate verifica cu regula celor trei sigma, regul care const n
verificarea urmtoarelor relaii:
( )
x i
x x 3
( )
y i
y y 3
Pe baza datelor din tabelul 2., coloanele 6, 10, se obin:

( )
1024 , 39 1529
10
15290
2
= = =

=

n
x x
i
x


( )
4818 , 0 2321 , 0
10
321 , 2
2
= = =

=

n
y y
i
y

( ) 1024 , 39 * 3 81 1024 , 39 * 3 81 3 3 3 + < < + < <
i x i x x i
x x x x x x
( ) 3072 , 198 ; 3072 , 36
i
x
( ) 4818 , 0 * 3 23 , 1 4818 , 0 * 3 23 , 1 3 3 3 + < < + < <
i y i y y i
y y y y y y
( ) 6754 , 2 ; 2154 , 0
i
y
Deoarece valorile acestor variabile aparin intervalelor ( ) 3072 , 198 ; 3072 , 36
i
x i
( ) 6754 , 2 ; 2154 , 0
i
y , ipoteza de mai sus poate fi acceptat fr rezerve.
c
2
) Variabila aleatoare (rezidual) u este de medie nul ( ) 0 = u M , iar dispersia ei
2
u
s este
constant i independent de X - ipoteza de homoscedasticitate, pe baza creia se poate admite c
legtura dintre Y i X este relativ stabil.
Acceptarea ipotezei se poate face prin intermediul mai multor procedee:
c
2.1
.) Procedeul grafic - care const n construirea corelogramei privind valorile variabilei
factoriale x i ale variabilei reziduale u (vezi Figura 2).

Figura 2

Deoarece graficul punctelor empirice prezint o distribuie oscilant, se poate accepta
ipoteza c cele dou variabile sunt independente i nu corelate.
c
2.2
.) Procedeul dispersiilor variabilei reziduale
Acest procedeu se poate aplica numai atunci cnd se dispune de serii lungi de date. n
acest caz, seria valorilor variabilei reziduale se mparte n dou sau mai multe grupe, pentru
fiecare grup calculndu-se dispersiile respective. Dac se acce
pt c dispersiile acestor grupe nu difer semnificativ - se utilizeaz testul Fisher-Snedecor,
atunci se poate accepta ipoteza de homoscedasticitate; n cazul contrar, indicnd
heteroscedasticitatea, se procedeaz la eliminarea acestui fenomen cu ajutorul metodei regresiei
ponderate. n cazul de fa, datorit numrului mic de valori (date), nu se recomand utilizarea
acestui procedeu, deoarece nu s-ar obine rezultate concludente.
c
2.3.
) Acceptarea sau respingerea ipotezei de homoscedasticitate cu ajutorul analizei
variaiei (vezi punctul d)).
c
3
) Valorile variabilei reziduale ( )
$ u
i
sunt independente, respectiv nu exist fenomenul de
autocorelare.
Acceptarea sau respingerea acestei condiii se poate face cu:
-0.14
-0.12
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
20 30 50 60 80 90 100 110 120 150
y
x
c
3.1
.) Procedeul grafic - corelograma ntre valorile variabilei dependente ( ) y i valorile
variabilei reziduale ( )
$ u
i
(vezi Figura 3).
Figura 3

Ca i n graficul precedent, distribuia punctelor empirice fiind oscilant, se poate accepta
ipoteza de independen a erorilor.
c
3.2.
) Testul Durbin-Watson const n calcularea termenului empiric:

( )
d
u u
u
i i
i
n
i
i
n
=


=
=

$ $
$
1
2
2
2
1

i compararea acestei mrimi d cu dou valori teoretice d
1
i d
2
, preluate din tabela Durbin-
Watson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul
variabilelor exogene ( ) k i de valorile observate ( ) n n , 15 .
Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit
regul, care const n:
- dac 0
1
< < d d autocorelare pozitiv;
- dac d d d
1 2
indecizie, recomandndu-se acceptarea autocorelrii pozitive;
-0.14
-0.12
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.5 0.7 0.8 1 1.1 1.3 1.4 1.6 1.8 2.1
u
y
- dac d d d
2 2
4 < < erorile sunt independente;
- dac 4 4
2 1
d d d indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 4
1
< < d d autocorelare negativ.
Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:

( )
86 , 1
0413 , 0
0768 , 0


10
1
2
10
2
2
1
= =

=
=

i
i
i
i i
u
u u
d
Lucrnd cu un prag de semnificaie 01 , 0 = , numrul variabilelor exogene fiind k = 1,
iar numrul observaiilor n = 10, din tabela distribuiei Durbin-Watson se citesc valorile (pentru
cazul n = 15) 81 , 0
1
= d i 107
2
= d .
Deoarece 93 , 2 4 82 , 1 07 , 1
2 2
= < = < = d d d , se poate accepta ipoteza de independen
a valorilor variabilei reziduale.
c
3.3.
) Coeficientul de autocorelaie de ordinul 1

=
n
i
i
n
i
i i
u
u u
r
2
2
1
2
1
1



Se poate demonstra c, dac n , ntre variabila Durbin-Watson i coeficientul de
autocorelaie de ordinul 1 exist urmtoarea relaie:

( )
d
u u
u
u
u
u
u
u u
u
i i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i i
i
n
i
i
n
=

= +

=
=
=
=

=
=

=
=

$ $
$
$
$
$
$
$ $
$
1
2
2
2
1
2
2
2
1
1
2
2
2
1
1
2
2
1
2

Dar, pentru n , se poate accepta c:

$
$
u
u
i
i
n
i
i
n
2
2
2
1
1
=
=

=
$ $
$
$
u u
u
u
i
i
n
i
i
n
i
i
n
i
i
n

= =

=
=

=
1
2
2
2
1
1
2
2
2
1
1

$ $
$
u u
u
r
i i
i
n
i
i
n

=
1
2
1
2
2
1

d r r
d
= + = 1 1 2 1
2
1 1

tiind c:

=
0
2
4
1
0
1
1
d
pozitiva
negativa
strict
strict
re autocorela
indecizie
ta independen
indecizie
re autocorela
r

Calculul coeficientului de autocorelaie de ordinul 1:
059 , 0
0405 , 0
0024 , 0


10
2
2
1
10
2
1
1
= = =

i
i
i
i i
u
u u
r
Deoarece 0 059 , 0
1
= r , i acest indicator arat c ipoteza de independen a valorilor
variabilei reziduale poate fi acceptat.
c
4
)

Verificarea ipotezei de normalitate a valorilor variabilei reziduale
Se tie c, dac erorile urmeaz legea normal de medie zero i de abatere medie ptratic
s
u$
(consecina ipotezelor c
1
, c
2
, c
3
), atunci are loc relaia:

( )
P u t s
i u
$
$
=

1 .
Pe baza acestei relaii, n funcie de diferite praguri de semnificaie , din tabela
distribuiei normale se vor prelua valorile corespunztoare ale lui t

.
Lucrnd cu un prag de semnificaie 05 , 0 = , din tabela distribuiei Student ( ) n < 30 se
preia valoarea variabilei, cu un numr de grade de libertate 306 , 2 , 8 2 10 2
8 ; 05 . 0
= = = = t n v ,
iar pentru un prag de semnificaie 01 , 0 = , avem t
0 01 8
3355
. ;
. = . Cu ajutorul acestor date,
verificarea ipotezei de normalitate se poate face pe baza urmtorului grafic (figura 4): pe axa Ox
se vor reprezenta valorile ajustate ale variabilei y (
i
y - vezi tabelul 2, coloana 5), iar pe axa Oy se
vor trece valorile variabilei reziduale (
i
u - vezi tabelul 2, coloana 7).
Se observ c valorile empirice ale variabilei reziduale se nscriu n banda construit, cu
un prag de semnificaie 05 , 0 = . Ca atare, ipoteza de normalitate a variabilei reziduale poate fi
acceptat cu acest prag de semnificaie.

Figura 4

d) Verificarea semnificaiei estimatorilor i a verosimilitii modelului
d
1
) Verificarea semnificaiei estimatorilor
Estimatorii sunt semnificativ diferii de zero, cu un prag de semnificaie , dac se
verific urmtoarele relaii:

$
;
$
$ $
a
s
t
b
s
t
a
b
> >


-0.16
-0.14
-0.12
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.498 0.618 0.858 0.978 1.218 1.338 1.458 1.578 1.698 2.058
u
Y
u
s t
05 , 0
*
u
s t
05 , 0
* +
tiind c (vezi punctul b) al problemei) 0523 , 0 ; 2409 , 0

= =
a
s a i
0006 , 0 ; 0122 , 0

= =
b
s b i lucrnd cu un prag de semnificaie 05 , 0 = , din tabela distribuiei
Student se preia valoarea 306 , 2
8 ; 05 . 0
= t , iar pentru 01 , 0 = se preia valoarea 355 , 3
8 ; 01 . 0
= t .
355 , 3 6611 , 4
0523 , 0
2409 , 0

8 ; 01 . 0

= > = = = t
s
a
t
a
a

355 , 3 0187 , 21
0006 , 0
0122 , 0

8 ; 01 . 0

= > = = = t
s
b
t
b
b

Pe baza calculelor de mai sus se observ faptul c ambii estimatori sunt semnificativ
diferii de zero, pentru un prag de semnificaie 01 , 0 = , fapt confirmat i de pragul de
semnificaie, P-value, corespunztor celor doi parametri, care este 0,0017<0,01 i, respectiv
0,0000<0,01.
Intervalul de ncredere pentru parametrul a este:


Intervalul de ncredere pentru parametrul b este:


d
2
) Verificarea verosimilitii modelului
Pentru a accepta ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar:
( )
( )( )
9911 , 0
4 , 188
7 , 186
4818 , 0 * 1024 , 39 * 10
7 , 186 , cov
/
= = =

= =

y x
i i
y x
x y
n
x x y y
x y
r


Coeficientul de corelaie liniar fiind definit n intervalul
[ ]
11 ; , rezult c valoarea
obinut de 0,9911 indic o puternic corelaie liniar ntre cele dou variabile.
Verificarea semnificaiei coeficientului de corelaie:
- se stabilete ipoteza nul: H
0
: r = 0;
- se stabilete ipoteza alternativ: H
1
: . 0 r
[ ] [ ] [ ] 4163 , 0 ; 0656 , 0 0523 , 0 355 , 3 2409 , 0
8 ; 01 , 0
= a s t a a
a
[ ] [ ] [ ] 0142 , 0 ; 0103 , 0 0006 , 0 * 355 , 3 0122 , 0

8 ; 01 ; 0
= b s t b b
b
- se calculeaz testul t:
0187 , 21
9911 , 0 1
8 9911 , 0
1
2
2 2
=

= =
r
n r
s
r
t
r
r

Deoarece 355 , 3 0187 , 21
8 ; 01 , 0 1 ;
= = > =

t t t
k n r
coeficientul de corelaie este
semnificativ diferit de zero, pentru un prag de semnificaie =0,01.
Verificarea verosimilitii modelului se face cu ajutorul analizei dispersionale (analiza
variaiei).
Tabelul 3
Sursa de Msura Nr. grade Dispersii Valoarea testului F
variaie variaiei de
libertate
corectate F
c
F
v v ; ;
1 2

Variana
dintre
grupe
( )
2797 , 2

10
1
2 2
=
=

= i
i x
y y V


k = 1
2797 , 2
2
2
/
=
=
k
V
s
x
X Y

7857 , 441
2

2
/
=
=
u
X Y
c
s
s
F


3 , 11
32 , 5
8 ; 1 ; 01 , 0
8 ; 1 ; 05 , 0
=
=
F
F

Variana
rezidual
( )
0413 , 0
10
1
2 2
=
=

= i
i i u
Y y V


n k = 1 8


0052 , 0
1
2
2

=

=
k n
V
s
u
u


-

-
Variana
total
( )
321 , 2
10
1
2 2
0
=
=

= i
i
y y V


n = 1 9


-

-

-

Testul Fisher-Snedecor indic faptul c rezultatele obinute sunt semnificative. cu un prag
de semnificaie de 1%. 3 , 11 52 , 434
8 ; 1 ; 01 . 0
= > = F F
c
, iar Significance F (pragul de semnificatie)
este 0,0000 (valoare mai mic de 0,01), respectiv modelul de regresie construit este valid i poate
fi utilizat pentru analiza dependenei dintre cele dou variabile.
Pe baza datelor din tabel se poate calcula raportul de corelaie dintre cele dou variabile:
9911 , 0
321 , 2
2797 , 2
1
2
0
2
2
0
2
/
= = = =
V
V
V
V
R
u x
x y

Se poate demonstra c, n cazul unei legturi liniare, raportul de corelaie este egal cu
coeficientul de corelaie liniar.

i i i i
x b a Y x b a y u x b a y * ; * * + = + = + + =

( )
( )
( )
( )
( )
( )
=

+
=

=
=
2
2 2
2
2
10
1
2
10
1
2

y y
x x b
y y
x b a bx a
y y
y y
R
i
i
i
i
i
i
i
i


( )
( )
=

= =

$ $
/
b
x x
y y
b r
i
i
x
y
y x
2
2

= +
= +


i i i i
i i
x y x b x a
y x b a n
2



( )
2
2 2
2
2
*

x
n
x
y x
n
x y
x x n
y x x y n
x x
x n
x y x
y n
b
i
i i
i i
i i i i
i i
i
i i i
i

= =









( ) ( )

x
i i i i i
x x
n
x x x x
n
x
n
x
x
n
x
2
2 2 2 2
2
2
2 =

=
+
= + =


= + =

x
n
x x
x
n
x
i i
2
2 2
2
2
2
2
*

x
i i
y x
n
x y
b

=


( )
( )( ) ( )
=
+
=

=

n
y x
n
y x y x y x y x
n
y y x x
x y
i i i i i i i i
*
, cov
y x
n
y x
y x y x x y
n
y x
y x
n
y
x
n
x
y
i i i i i i
* * * * * = + = +



( )
=
$
cov ,
b
y x
x

2


( ) ( )
x y
y
x
y
x
x y x
x y
R b
x y x y
r
/
2
/

, cov , cov
= = = =



Verificarea semnificaiei raportului de corelaie se face cu ajutorul testului Fisher-
Snedecor:
( )
2
2
1
2
R
R
n F
c

= , R fiind semnificativ dac F F


c v v

; ;
1 2
.
3 , 11 7857 , 441 1798 , 55 * 8
0178 , 0
9822 , 0
* 8
8 ; 1 ; 01 . 0
= > = = = F F
c

Deoarece raportul de corelaie este semnificativ diferit de zero, cu un prag de semnificaie
= 0 01 . , rezult modelul econometric:

i i
x y 0122 , 0 2409 , 0 + = ;
9911 , 0 = R

(0,0523) (0,0006) 86 , 1 = d
0718 , 0

=
u
s
care descrie corect dependena dintre cele dou variabile, acesta explicnd 98,22% din variaia
total a variabilei dependente, adic variaia cifrei de afaceri se datoreaz n proporie de 98,22%
suprafeei comerciale a magazinului.
V V V
V
V
V
V
x u
x u
0
2 2 2
2
0
2
2
0
2
100 100 100 = + = + * *
e) Dac un antreprenor va dispune de o suprafa comercial de 130 m
2
( ) 130 = x , n
medie, ncasrile lunare vor fi egale cu:
83 , 1 8283 , 1 130 * 0122 , 0 2409 , 0

130 /
= + = + =
=
x b a Y
x
mil.lei
Pe baza ipotezei formulate la punctele precedente, cifra de afaceri y urmeaz o distribuie
normal (sau distribuia Student, dac n 30 ), de medie Y i de abatere medie ptratic s
Y
,
( ) ( ) L y N Y s
Y
= , .
Pentru 83 , 1 130 = = Y x
( )
( )
( )
0808 , 0
15290
81 130
10
1
1 * 0052 , 0
1
1
2
2
2
2
130 /
=
|
|

\
|

+ + =
|
|

\
|


+ + =

=
x x
x x
n
s s
i
u x Y

Estimarea cifrei de afaceri, care se poate obine dac suprafaa va fi de 130 m
2
pe baza
unui interval de ncredere se calculeaz cu relaia:
( )

= +
= = = = =
1
130 / 130 / 130 / 130 / 130 / x Y x x x Y x
s t Y y s t Y P
Pentru 01 , 0 = i v n k = = 1 8, din tabela distribuiei Student se preia valoarea
variabilei 355 , 3
8 ; 01 . 0 ;
= = t t
v
.
Deci, cu un prag de semnificaie de 0,01 sau cu o probabilitate egal cu 0,99, cifra de
afaceri pe care o va putea realiza ntreprinztorul va fi cuprins n intervalul:
[ ] ( ) 99 , 0 01 , 0 1 0808 , 0 * 355 , 3 83 , 1
130 /
= =
= x
y P
[ ] ( ) 99 , 0 01 , 2 ; 64 , 1
130 /
=
= x
y P
Aplicaii propuse spre rezolvare
1. n scopul evalurii impactului pe care variaia preului unui produs l are asupra variaiei
cantitilor vndute din acel produs a fost selectat un eantion reprezentativ de 10 de
magazine, n care s-au urmrit valorile urmtoarelor variabile:
- Q cantitatea vndut din produsul respectiv (kg)
- P preul produsului (RON)
A fost folosit pentru estimarea parametrilor urmtorul model, ale crui rezultate sunt prezentate
mai jos:
+ + = P Q .



SUMMARY OUTPUT

Regression Statistics
Multiple R 0.913173052
R Square 0.833885023
Adjusted R Square 0.813120651
Standard Error 10.73509502
Observations 10

ANOVA
df SS MS F
Regression 4628.0619 . .
Residual .
Total 9 5550

Coefficients Standard Error
Intercept -29.32363674 20.687667
Pret vanzare (mii $) 0.068972606 0.0108839

a. Testati validitatea modelului de regresie, pentru un nivel de semnificaie de 5%;
b. Testati, interpretai i determinai intervalele de ncredere pentru coeficienii modelului.
2. Pentru a decide n ce zon s fie amplast un magazin de casete video, managerul unei
firme de comercializare i nchiriere de casete video realizeaz un studiu. Astfel, el
consider c succesul afacerii este cuantificat prin profitul anual brut obinut (sute euro).
Principalul factor de influen considerat pentru succesul acestei afaceri este venitul
mediu al locuitorilor de pe o raz de un kilometru (zeci euro). Sunt selectate aleator 5
supermarket-uri i sunt nregistrate valorile celor 2 variabile.

Profit (mii euro) 2 6 8 11 15
Venit (sute euro) 4 12 21 25 20

Observaie!
Aplicaia se rezolv pe baza rezultatelor din tabelele output ului obinut n
urma prelucrrii cu EXCEL a datelor

a) Estimai parametrii ecuaiei de regresie, n ipoteza unei dependene liniare.
b) Testai validitatea modelului de regresie, pentru un nivel de semnificaie de 5%;
c) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator adecvat i
testai semnificaia acestuia, pentru un nivel de ncredere de 95% .
3. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine
relaia dintre preul (mii euro) obinut pentru articolele licitate i vechimea (ani) a obiectelor. n
urma prelucrrii cu EXCEL a datelor culese de la un eantion aleatoriu de 10 licitaii, s-au
obinut rezultatele:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,913173
R Square 0,833885
Adjusted R
Square 0,813121
Standard Error 142,1289
Observations 10

ANOVA
df SS MS F
Regression 1 811245 .
Residual .. 161605
Total 972850

Coefficients
Standard
Error t Stat
Intercept 665,991 3,397844
Vechime 12,09009 1,907813 ...
In ipoteza unui model de regresie liniar, se cere:
a) s se testeze semnificaia modelului, pentru un nivel de semnificaie de 5%;
b) s se determine intervalele de ncredere pentru parametrii modelului i s se comenteze
rezultatele obinute.
4. Managerul unei companii de asigurri dorete s afle dac contactarea potenialilor
clieni prin telefon are influen asupra vnzrilor. Pentru aceasta, au fost selectai aleator 5
ageni de asigurri, de la care s-au nregistrat numrul sptmnal al convorbirilor telefonice (X)
i numrul polielor de asigurare ncheiate ntr-o sptmn (Y):
Nr. de convorbiri telefonice 66 43 57 32 18
Nr. polielor de asigurare 20 15 18 12 2
a) Reprezentai grafic datele i determinai modelul liniar de regresie dintre cele dou
variabile;
b) Msurai intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie
i testai semnificaia acestuia, pentru un nivel de semnificaie de 5%;
Vechime

Mean 100
Standard Deviation 24.83277
Smple Variance 616.6667
c) Efectuai o previzionare punctual i pe interval de ncredere a numrului de polie de
asigurare ncheiate, dac ntr-o sptmn s-au efectuat 50 de convorbiri telefonice.

S-ar putea să vă placă și