Documente Academic
Documente Profesional
Documente Cultură
Modelul Liniar Unifactorial
Modelul Liniar Unifactorial
20
30
50
60
80
90
0,5
0,7
0,8
1,0
1,1
1,3
1,4
1,6
1,8
2,1
Se cere:
a) s se specifice modelul econometric ce descrie legtura dintre cele dou variabile;
b) s se estimeze parametrii modelului i s se calculeze valorile teoretice ale
variabilei endogene;
c) s se verifice ipotezele de fundamentare a metodei celor mai mici ptrate;
d) s se verifice semnificaiile estimatorilor i verosimilitatea modelului;
e) tiind c un antreprenor poate s cumpere o suprafa comercial de 130 m 2, s se
estimeze ncasrile medii lunare ale acestuia.
Rezolvare:
a) Pe baza datelor problemei se poate construi un model econometric unifactorial de
forma:
y f (x ) u
unde:
y - valorile reale ale variabilelor dependente;
x - valorile reale ale variabilelor independente;
u - variabila rezidual, reprezentnd influenele celorlali factori ai variabilei y,
nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra
variabilei y.
Analiza datelor din tabel, n raport cu procesul economic descris conduce la
urmtoarea specificare a variabilelor:
y - ncasrile medii lunare, reprezentnd variabila rezultativ, ale crei valori depind
de o mulime de factori - suprafaa comercial, amplasarea magazinului, reclama societii
respective etc;
x - suprafaa comercial, factorul considerat prin ipoteza de lucru cu influena cea mai
puternic asupra variabilei y.
Specificarea unui model econometric presupune, de asemenea, alegerea unei funcii
matematice f x cu ajutorul creia poate fi descris legtura dintre cele variabile. n cazul
unui model unifactorial, procedeul cel mai des folosit l constituie reprezentarea grafic a
celor dou iruri de valori cu ajutorul corelogramei.
unde:
10
10
i 1
i 1
2
F a , b min y i y i min y i a bxi
F b 0 a x i b x i2 y i x i
Nr.
Tabelul 2.
Suprafaa ncasri
2
x i2
x i y i y i 0,2409 x i x 2 u i y i y i
yi y
ui2
0,0122 xi
1
2
3
4
5
6
7
8
9
10
20
30
50
60
80
90
100
110
120
150
0,5
0,7
0,8
1,0
1,1
1,3
1,4
1,6
1,8
2,1
400
900
2500
3600
6400
8100
10000
12100
14400
22500
10
21
40
60
88
117
140
176
216
315
0,4852
0,6073
0,8515
0,9736
1,2178
1,3399
1,4620
1,5841
1,7062
2,0725
3721
2601
961
441
1
81
361
841
1521
4761
0,0148
0,0927
-0,0515
0,0264
-0,1178
-0,0399
-0,0620
0,0159
0,0938
0,0275
0,0002
0,0086
0,0026
0,0007
0,0139
0,0016
0,0038
0,0003
0,0088
0,0008
-0,73
-0,53
-0,43
-0,23
-0,13
0,07
0,17
0,37
0,57
0,87
Total
810
12,3
80900 1183
12,3
15290
0,0413
Tabelul 2. (continuare)
2
y xi x
ui
ui x i x
ui 1
10
11
12
13
14
0,5329
0,2809
0,1849
0,0529
0,0169
0,0049
0,0289
0,1369
0,3249
0,7569
-61
-51
-31
-21
-1
9
19
29
39
69
0,0148
0,0927
-0,0515
0,0264
-0,1178
-0,0399
-0,0620
0,0159
0,0938
0,0275
-0,9056
-4,7298
1,5956
-0,5549
0,1178
-0,3591
-1,1780
0,4609
3,6577
1,8954
2,321
0,0148
0,0000
yi
ui
ui 1
xi
x y i y
ui21
ui ui 1
15
16
17
18
0,0148
0,0927
-0,0515
0,0264
-0,1178
-0,0399
-0,0620
0,0159
0,0938
0,0061
0,0208
0,0061
0,0208
0,0061
0,0005
0,0061
0,0061
0,0044
0,0002
0,0086
0,0026
0,0007
0,0139
0,0016
0,0038
0,0003
0,0088
0,0014
-0,0048
-0,0014
-0,0031
0,0047
0,0025
-0,0010
0,0015
0,0026
44,53
27,03
13,33
4,83
0,13
0,63
3,23
10,73
22,23
60,03
0,0768
0,0405 0,0024
186,7
Estimarea parametrului b :
n
10 12.3
yi
xi yi xi 810 1183 11830 9963 1867 0,0122
b
10
810
809000 656100 152900
n
xi
2
xi xi 810 80900
(vezi calcule tabelul nr. 2.1.2., coloanele 1, 2, 3, 4).
Estimarea parametrului a :
1
xi
na b x i y i * a b
n
n
y
n
a y bx
x 810 81
i
10
2
y i
n k 1
0,0413
0,0052
10 2
0,005245 0,0724
1
x2
812
0
,
0052
*
0,0027
2
10 15290
n xi x
s a2 su2
0,0027 0,0523
s b2 su2
s b
1
i
0,0052
0,0000003
15290
0,0000003 0,0006
Semnif. ind.
n
Multiple R
Raportul de
corelaie (R)
2
y i y
Ry,x
i 1
n
y y
0,9911
R Square
Coeficientul
(gradul ) de
determinare
i 1
R2
2
u
2
0
V
V
1
V
V
0,9822
i 1
n
i 1
n
y y
y
i 1
i 1
2
x
2
0
y y
Adjusted R
Square
Valoarea ajustat
a coeficientului
de determinare
Standard Error
Abaterea medie
ptratic a
erorilor n
eantion
Observations
Numrul
observaiilor (n)
Rc2 1
nk
1 R 2
n 1
0,9800
n
y y
Vu2
su
n2
0,0718
i 1
n2
10
ANOVA
Sursa de
variaie
df
Nr.
gradelor
de
libertate
SS
Regression
(variaia
datorat
regresiei)
Residual
(variaia
rezidual)
Total
(variaia
total)
1
8
MS
V x2 y i y
n k 1
2,2797
V y i y i
Significance
F
Fc
s y2/ x
2,2797
0,0000
Prag de
semnif.
<0,005
441,7857
2
u
0,0052
V yi y -
2
0
Media
ptratelor
(Dispersii
corectate)
2
u
0,0413
n 1
2,3210
Variable
Coef.
Coefficients
Intercept
Standard Error
(Termen liber)
xi
Lower
95%
Suma ptratelor
(Msura
variaiei)
0,2409
0,0122
< 95%
s a
0,0523
b
Upper
95%
Abaterea
medie
patratic
s b
0,0006
>95%
Lower
99,0%
t Stat
4,6111
21,0187
<99%
Prag de
semnif.
<0,005
Pvalue
t ca
0,0017
t cb
<0,005
0,0000
Upper
99,0%
>99%
0,1204
a a t0, 05;8 sa
0,3614
a a t0 ,05;8 sa
0,0656
a a t0, 01;8 sa
0,0109
b b t 0; 05;8 s b
0,0136
b b t 0;05;8 s b
0,0103
b b t 0;01;8 s b0,0142
b b t 0;01;8 s b
RESIDUAL OUTPUT
Observation
Predicted Y
Residuals
y i a bxi
u i y i y i
0,4852
0,0148
0,6073
0,0927
0,8515
-0,0515
0,9736
0,0264
1,2178
-0,1178
1,3399
-0,0399
1,4620
-0,0620
5
1,5841
0,0159
1,7062
0,0938
10
2,0725
0,0275
Interpretarea indicatorilor:
Intercept este termenul liber, deci coeficientul a 0,2409 . Termenul liber este
punctul n care variabila explicativ (factorial) este egal cu 0. Deci ncasrile medii
lunare, dac suprafaa comercial este egal cu 0, sunt egale cu 0,2409 mil u. m.
Coeficientul b 0,0122 , ceea ce nsemn c, la creterea suprafeei comerciale cu un
m2, ncasrile medii lunare vor crete cu 0,0122 mil. u. m.
R= 0,9911 arat c ntre suprafaa comercial i ncasrile medii lunare exist o
legtur puternic, semnificativ;
R2 =0,9822 arat c aproximativ 98,22% din variaia ncasrilor medii lunare este
explicat de suprafaa comercial a acestora.
Abaterea medie ptratic a erorilor, su = 0,0718. n cazul n care valoarea acestui
indicator este egal cu zero nseamn c toate punctele sunt situate pe dreapta de
regresie.
c) Estimatorii obinui cu ajutorul M.C.M.M.P. sunt estimatori de maxim
verosimilitate dac pot fi acceptate urmtoarele ipoteze:
c1) Variabilele observate nu sunt afectate de erori de msur.
Aceast condiie se poate verifica cu regula celor trei sigma, regul care const n
verificarea urmtoarelor relaii:
xi x 3 x
y i y 3 y
Pe baza datelor din tabelul 2., coloanele 6, 10, se obin:
x
15290
1529 39,1024
n
10
2
y
2,321
y
0,2321 0,4818
n
10
xi x 3 x x 3 x xi x 3 x 81 3 * 39,1024 xi 81 3 * 39,1024
2
xi 36,3072;198,3072
00,020,040,060,080,1
2 0
-0,2
-0,4
-0,6
-0,8
-0,1
-0,12
30
50
60
80
90
10
10
120
150
-0,14
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
-0,02 20
30
50
60
80
90
100
110
120 x 150
-0,04
-0,06
-0,08
-0,1
-0,12
-0,14
Figura 2
Deoarece graficul punctelor empirice prezint o distribuie oscilant, se poate accepta
ipoteza c cele dou variabile sunt independente i nu corelate.
c2.2.) Procedeul dispersiilor variabilei reziduale
Acest procedeu se poate aplica numai atunci cnd se dispune de serii lungi de date. n
acest caz, seria valorilor variabilei reziduale se mparte n dou sau mai multe grupe, pentru
fiecare grup calculndu-se dispersiile respective. Dac se accept c dispersiile acestor grupe
nu difer semnificativ - se utilizeaz testul Fisher-Snedecor, atunci se poate accepta ipoteza de
homoscedasticitate; n cazul contrar, indicnd heteroscedasticitatea, se procedeaz la
eliminarea acestui fenomen cu ajutorul metodei regresiei ponderate. n cazul de fa, datorit
numrului mic de valori (date), nu se recomand utilizarea acestui procedeu, deoarece nu s-ar
obine rezultate concludente.
c2.3.) Acceptarea sau respingerea ipotezei de homoscedasticitate cu ajutorul analizei
variaiei (vezi punctul d)).
c3) Valorile variabilei reziduale u i sunt independente, respectiv nu exist fenomenul
de autocorelare.
Acceptarea sau respingerea acestei condiii se poate face cu:
c3.1.) Procedeul grafic - corelograma ntre valorile variabilei dependente y i valorile
variabilei reziduale u i (vezi Figura 3).
0,14
u 0,12
0,1
0,08
0,06
0,04
0,02
0
-0,02 0,5
-0,04
0,7
0,8
1,1
1,3
1,4
1,6
1,8 y 2,1
-0,06
-0,08
-0,1
-0,12
-0,14
Figura 3
Ca i n graficul precedent, distribuia punctelor empirice fiind oscilant, se poate
accepta ipoteza de independen a erorilor.
c3.2.) Testul Durbin-Watson const n calcularea termenului empiric:
n
i2
u i 1
2
i
i 1
- dac
autocorelare negativ.
1
Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:
10
u
i2
u i 1
10
u
i 1
2
i
0,0768
1,86
0,0413
u u
r1
i 2
n
u
i2
i 1
2
i 1
2
ui ui 1 ui2 ui21
i 2
2
i
i 1
i 2
n
2
i
i 1
i 2
n
2 ui ui 1
2
i
i 1
2
i
2
i
i2
n
i 2
n
2
i
i 1
i 1
u
i2
2
i 1
u i2
i 1
u
i2
n
2
i 1
2
i
i 1
u u
i
i 2
n
u
i 2
i 1
r1
2
i 1
d 1 1 2r1 r1 1
d
2
tiind c:
1 autocorela re strict negativa
4
indecizie
r1 0 independenta
d 2
indecizie
r1
u u
i2
10
u
i 2
i 1
2
i 1
0,0024
0,059
0,0405
t 0 , 05 * s u
Y
0,618
0,858
0,978
1,218
1,338
1,458
1,578
1,698
2,058
t 0,05 * s u
Figura 4
d) Verificarea semnificaiei estimatorilor i a verosimilitii modelului
d1) Verificarea semnificaiei estimatorilor
Estimatorii sunt semnificativ diferii de zero, cu un prag de semnificaie
verific urmtoarele relaii:
a
sa
t ;
b
sb
, dac se
distribuiei Student se preia valoarea t0.05;8 2,306 , iar pentru 0,01 se preia valoarea
t0.01;8 3,355 .
t a
t b
a
s a
b
s b
0,2409
4,6611 t 0.01;8 3,355
0,0523
0,0122
21,0187 t 0.01;8 3,355
0,0006
Pe baza calculelor de mai sus se observ faptul c ambii estimatori sunt semnificativ
diferii de zero, pentru un prag de semnificaie 0,01 , fapt confirmat i de pragul de
semnificaie, P-value, corespunztor celor doi parametri, care este 0,0017<0,01 i, respectiv
0,0000<0,01.
Intervalul de ncredere pentru parametrul a este:
10
0,9911
x y
n x y
10 * 39,1024 * 0,4818 188,4
Coeficientul de corelaie liniar fiind definit n intervalul 1;1 , rezult c valoarea
obinut de 0,9911 indic o puternic corelaie liniar ntre cele dou variabile.
Verificarea semnificaiei coeficientului de corelaie:
- se stabilete ipoteza nul: H0: r = 0;
- se stabilete ipoteza alternativ: H1: r 0.
- se calculeaz testul t:
tr
r
r n2
0,9911 8
21,0187
2
sr
1 r
1 0,99112
Msura
variaiei
Variana
dintre
grupe
V x2 y i y
Variana
rezidual
Vu2 y i Yi
10
Nr. grade
de
libertate
2
i 1
2,2797
10
i 1
0,0413
Variana
total
k 1
10
V02 yi y
i 1
Dispersii
corectate
V x2
s
k
2,2797
2
Y/X
Valoarea testului F
Fc
Fc
F ; v1 ; v2
sY2 / X
F0 , 05;1;8 5,32
s u2
441,7857
F0 , 01;1;8 11,3
Vu2
2
s
n k 1 8 u n k 1
0,0052
n 1 9
2,321
V x2
Vu2
2,2797
0,9911
2
2
2,321
V0
V0
Se poate demonstra c, n cazul unei legturi liniare, raportul de corelaie este egal cu
coeficientul de corelaie liniar.
Ry / x
y i a b * xi u y a b * x ; Yi a b * xi
11
10
i 1
10
y
i 1
x
y
a bx
y
a bx
i y
b x x
y y
b x ry / x
y
na b xi yi
2
a xi b xi yi xi
n
y
x y x n y x x y
b
n
n x x
x
x x
y x
2
i
2x x
2
2
i
2
i
x
n
2
i
n
2
i
2x
y x
i
2 xi x x 2
2
i
i
2
i
2x
x
n
i
x*y
x2
x2
x*y
x2
xi x yi y xi yi xi y x yi x * y
cov y , x
n
n
y
x
n
n
cov y , x
x*y
x y
i
x y
i
x y
i
x*y
2x
cov y, x cov y, x x x
b
Ry / x
x y
y
y
x2
Verificarea semnificaiei raportului de corelaie se face cu ajutorul testului FisherSnedecor:
R2
Fc n 2
, R fiind semnificativ dac Fc F ; v1 ; v2 .
1 R2
ry / x
Fc 8 *
0,9822
8 * 55,1798 441,7857 F0.01;1;8 11,3
0,0178
care descrie corect dependena dintre cele dou variabile, acesta explicnd 98,22% din
variaia total a variabilei dependente, adic variaia cifrei de afaceri se datoreaz n proporie
de 98,22% suprafeei comerciale a magazinului.
12
Vx2
Vu2
*
100
* 100
V02
V02
e) Dac un antreprenor va dispune de o suprafa comercial de 130 m 2 x 130 , n
medie, ncasrile lunare vor fi egale cu:
Y/ x 130 a bx 0,2409 0,0122 * 130 1,8283 1,83 mil.lei
Pe baza ipotezei formulate la punctele precedente, cifra de afaceri y urmeaz o
distribuie normal (sau distribuia Student, dac n 30 ), de medie Y i de abatere medie
ptratic sY , L y N Y , sY .
Pentru x 130 Y 1,83
V02 Vx2 Vu2 100
2
2
1
x x
1 130 81
0,0808
sY / x 130 s 1
0,0052 * 1
2
n
10
15290
Estimarea cifrei de afaceri, care se poate obine dac suprafaa va fi de 130 m 2 pe baza
unui interval de ncredere se calculeaz cu relaia:
P Y/ x 130 t sY / x 130 y / x 130 Y/ x 130 t sY / x 130 1
Pentru 0,01 i v n k 1 8 , din tabela distribuiei Student se preia valoarea
variabilei t ;v t 0.01;8 3,355 .
Deci, cu un prag de semnificaie de 0,01 sau cu o probabilitate egal cu 0,99, cifra de
afaceri pe care o va putea realiza ntreprinztorul va fi cuprins n intervalul:
P y / x 130 1,83 3,355 * 0,0808 1 0,01 0,99
2
u
13