Sunteți pe pagina 1din 21

REGRESIE MULTIFACTORIAL

Concepte generale privind definirea, specificarea i identificarea


modelului multifactorial
Sub form general, un model multifactorial se
definete prin urmtoarea relaie:
y = f(x
j
)+u
unde:
y = variabila endogen, efect sau rezultativ;
x
j
= variabilele exogene sau factoriale sau cauzale;
k = numrul variabilelor exogene;
u = variabila rezidual, aleatoare sau eroare;
f(x
j
) = funcia de regresie cu ajutorul creia vor fi
estimate (aproximate) valorile variabilei y
1
k j , 1
Exemplu
1) Modelarea consumului
C = f (V, P, N) + u
unde:
C = consumul unui produs sau grupe de produse;
V = venitul pe familie;
P = preul produsului sau indicele preurilor grupei de produse;
N = numrul membrilor unei familii.
2) Funcia de producie Cobb-Douglas
Q = f (K, L) + u
unde:
Q = volumul (valoarea) produciei;
K = capitalul;
L = fora de munc.
3) Modelarea evoluiei preurilor
I
p
= f (I
v
, I
cv
, I
m
) + u
unde:
I
p
= indicele preurilor;
I
v
= indicele veniturilor (salariilor) consumatorilor;
I
cv
= indicele cursului valutar;
I
m
= indicele masei monetare.
2
Exemplu
De regul, n economie, principalele funcii de regresie multifactoriale
sunt de forma:
- funcia liniar
Y
t
= b
0
+ b
1
x
1t
+ b
2
x
2t
+ b
k
x
kt
- funcia liniar dublu logaritmic
k
b
kt
b
t
b
t t
x x x b Y
2 1
2 1 0
kt k t t t
x b x b x b b Y ln ln ln ln ln
2 2 1 1 0
+ + + +

- funcia liniar semilogaritmic
kt k t t
x b x b x b b
t
e Y
+ + + +


2 2 1 1 0
kt k t t t
x b x b x b b Y + + + +
2 2 1 1 0
ln
sau
kt t t
x
k
x x
t
b b b b Y
2 1
2 1 0
kt k t t t
x b x b x b b Y + + + + ln ln ln ln ln
2 2 1 1 0


kt k t t t
x x x Y + + + +
2 2 1 1 0
ln
unde: 0 0
lnb
;


k j b
j j
, 1 , ln
3
Estimarea parametrilor modelului multifactorial
Estimarea parametrilor modelului se face n urma etapei de
identificare a acestuia. Deoarece marea majoritate a modelelor
econometrice pot fi liniarizate, un model multifactorial, n form
general, se prezint astfel:
y
t
= b
0
x
0t
+ b
1
x
1t
+ b
2
x
2t
+ + b
j
x
jt
+ + b
k
x
kt
+ u
t
unde:
n t , 1
, n = numrul termenilor seriilor statistice;
k 1, j
, k = numrul variabilelor exogene,
ceea ce analitic devine:

'

+ + + + +
+ + + + +
+ + + + +
n nk k n2 2 n1 n 0 n
2 2k k 22 2 21 1 0 2
1 1k k 12 2 11 1 0 1
u x b x b x b b y
.......... .......... .......... .......... .......... .......... .......... ..........
u x b x b x b b y
u x b x b x b b y
4
Definind cu:

,
_

n
y
y
y
Y

2
1
vectorul coloan al variabilei endogene (y
t
)
n , t 1

de
dimensiune (n, 1);

,
_

k n n
k
k
k
x x
x x
x x
x x
X





1
3 1 3
2 1 2
1 1 1
1
1
1
1
matricea variabilelor exogene (x
j
)
k 0, j
de
dimensiune (n, k + 1);

,
_

n
b
b
b
b
B

2
1
0
vectorul coloan al parametrilor (b
j
)
k 0, j
de dimensiune
(k + 1, 1);
5

,
_

n
u
u
u
u
U

3
2
1
vectorul coloan al variabilei aleatoare (u
t
)

n , t 1

de
dimensiune (n, 1).
Relaia sub form matriceal, devine:
Y = XB + U
Relaia se mai poate scrie astfel:
6
) 1 ( 1 ) 1 ( ) 1 ( ) 1 (
1
1
1
2
1
1
0
1
2 1 2
1 1 1
2
1
+ +

,
_

,
_

,
_

,
_

n k k n n
u
u
u
b
b
b
x x
x x
x x
y
y
y
n k
k n n
k
k
n




7
Funcia de regresie corespunztoare modelului, scris sub
forma unei ecuaii matriceale, este:
B

X Y


Reziduurile
t
(estimaiile variabilei aleatoare u) se definesc
astfel:
B X Y Y Y U


unde: Y

= valorile estimate (ajustate) ale variabilei Y.


n cazul unui model multifactorial parametrii pot fi estimai prin
intermediul mai multor metode cum ar fi: metoda punctelor empirice,
metoda punctelor medii, metoda celor mai mici ptrate (M.C.M.M.P.),
metoda verosimilitii maxime etc.
Metoda punctelor empirice i metoda punctelor medii sunt folosite n
cazul modelelor n care aplicarea metodei celor mai mici ptrate este
anevoioas, necesitnd calcule complicate, de regul pentru funciile
neliniare (funcia logistic).
8
Metoda celor mai mici ptrate este metoda cel mai des utilizat. n
cazul unui model multifactorial aplicarea acesteia presupune minimizarea
funciei:
( ) ( ) ( ) ( ) ( )
F B u U U Y Y Y XB Y XB Y XB
t
t
n

min min min



min

min



2
2 2
1

( ) ( ) ( )
+ min

Y Y B X Y B X X B 2

care implic calculul derivatei funciei n raport cu estimatorul B

i
anularea acesteia:
( )
( ) ( )

F B
B
X Y X X B


+ 0 2 2 0

( ) X X B X Y


n cazul n care matricea (XX) admite invers, prin nmulirea la
stnga a ecuaiei matriceale cu (XX)
1
rezult c:
( ) ( ) ( ) ( )

X X X X B X X X Y
1 1


Estimatorii parametrilor se calculeaz astfel cu ajutorul relaiei:
( ) ( )

,
_



k
b

Y X X X B

2
1
1

La nivelul eantionului, modelul multifactorial liniar format din dou
componente se prezint astfel:


9
t t t t
u x b x b b y + + +
2 2 1 1 0
Valorile ajustate ale variabilei endogene se calculeaz cu ajutorul
relaiei:
Estimarea parametrilor acestui model se realizeaz cu ajutorul
M.C.M.M.P.:
Minimul acestei funcii este dat de calculul derivatelor pariale n
raport cu parametrii modelului:
Dup efectuarea calculelor rezult urmtorul sistem de ecuaii:
Exemplu
Un ntreprinztor cumpr un magazin avnd o suprafa de 230 m
2
ntr-un
cartier n care locuiesc n jur de 6400 de familii. O societate de consultan de
management comercial l informeaz c cifra de afaceri a magazinelor cu profilul
respectiv depinde liniar de suprafaa comercial a magazinului i de numrul familiilor
din cartierul respectiv care, de regul, cumpr de la magazinul cel mai apropiat. n
acest sens, i pune la dispoziie informaiile referitoare la aceti indicatori, nregistrate la
13 magazine avnd acelai profil:
Tabelul 1
10
t t t
x b x b b y
2 2 1 1 0

+ +
( ) ( )


n
t
t t t j
x b x b b y b F
1
2
2 2 1 1 0

min

( ) ( )( ) 0 1

2 0

2 2 1 1 0 0


t
t t t
x b x b b y b F
( ) ( )( ) 0

2 0

1 2 2 1 1 0 1

t
t
t t t
x x b x b b y b F
( ) ( )( ) 0

2 0

2 2 2 1 1 0 2


t
t t t t
x x b x b b y b F

'

+ +
+ +
+ +



t t t t t t
t t t t t t
t t t
y x x b x x b x b
y x x x b x b x b
y x b x b b n
2
2
2 2 2 1 1 2 0
1 2 1 2
2
1 1 1 0
2 2 1 1 0



Nr. de familii (sute) 70 35 55 25 28 43 15 33 23 4 45 20 56
Supr. comercial (zeci m
2
) 21 26 14 10 12 20 5 28 9 6 10 8 36
Cifra de afaceri (mil. lei) 198 209 197 156 85 187 43 211 120 62 176 117 273
Se cere:
a) Pe baza datelor problemei, innd cont de semnificaia economic a
fenomenelor observate, s se construiasc modelul econometric cu ajutorul cruia poate
fi studiat dependena dintre fenomenele respective;
b) S se estimeze parametrii modelului.
Soluie:
a) Descrierea econometric a legturii dintre cele trei variabile, y - cifra de
afaceri,
x
1
- numrul de familii i
x
2
- suprafaa comercial, se poate face cu ajutorul
modelului
( )
t t t t
u x x f y +
2 1
,
, care explic variaia cifrei de afaceri pe seama ambilor
factori.
Identificarea funciei de regresie se realizeaz cu ajutorul reprezentrii grafice a
variabilei y n funcie de celelalte dou variabile factoriale
x
1
, respectiv
x
2
.
Figura 2
Deoarece graficele de mai sus arat c legtura dintre y i
x
1
, respectiv y i
x
2

poate fi aproximat cu o dreapt, modelul de mai sus devine:
t t t t
u x b x b b y + + +
2 2 1 1 0
Acesta este un model multifactorial liniar deoarece y, fiind corelat liniar cu
x
1
,
respectiv cu
x
2
, se deduce uor c va fi corelat liniar i n raport cu ambii factori.
Estimarea parametrilor unui model multifactorial
t t t t
u x b x b b y + + +
2 2 1 1 0

necesit efectuarea urmtoarelor calcule:
11
0
50
100
150
200
250
300
0 10 20 30 40 50 60 70 80
x
1
y
- obinerea sistemului de ecuaii normale prin aplicarea M.C.M.M.P. care const
n:
( ) ( )


n
t
t t t j
x b x b b y b F
1
2
2 2 1 1 0

min

Minimul acestei funcii este dat de calculul derivatelor pariale n raport cu


parametrii modelului :
( ) ( )( ) 0 1

2 0

2 2 1 1 0 0


t
t t t
x b x b b y b F
( ) ( )( ) 0

2 0

1 2 2 1 1 0 1

t
t
t t t
x x b x b b y b F
( ) ( )( ) 0

2 0

2 2 2 1 1 0 2


t
t t t t
x x b x b b y b F
Dup efectuarea calculelor rezult urmtorul sistem de ecuaii:

'

+ +
+ +
+ +



t t t t t t
t t t t t t
t t t
y x x b x x b x b
y x x x b x b x b
y x b x b b n
2
2
2 2 2 1 1 2 0
1 2 1 2
2
1 1 1 0
2 2 1 1 0



Valorile estimatorilor rezult n urma rezolvrii sistemului de ecuaii ale crui
necunoscute sunt cei trei parametrii
2 1 0
, , b b b
, iar valorile termenilor sistemului de
ecuaii se obin pe baza tabelului 2, coloanele 1, 2, 3, 4, 5, 6, 7, 8:
Tabelul 2
Nr.
crt.
t
x
1
x
t 2
y
t
x y
t t 1
x y
t t 2
x x
t t 1 2
x
t 1
2
x
t 2
2
t
t
t
x
x
y
2
1
2446 , 4
4963 , 1
5023 , 37
+
+

t t t
y y u
0 1 2 3 4 5 6 7 8 9 10
1 70 21 198 13860 4158 1470 4900 441 231,3796 -33,3796
2 35 26 209 7315 5434 910 1225 676 200,2326 8,7674
3 55 14 197 10835 2758 770 3025 196 179,2229 17,7771
4 25 10 156 3900 1560 250 625 100 117,3557 38,6443
5 28 12 85 2380 1020 336 784 144 130,3339 -45,3339
6 43 20 187 8041 3740 860 1849 400 186,7352 0,2648
7 15 5 43 645 215 75 225 25 81,1697 -38,1697
12
8 33 28 211 6963 5908 924 1089 784 205,7293 5,2707
9 23 9 120 2760 1080 207 529 81 110,1185 9,8815
10 4 6 62 248 372 24 16 36 68,9552 -6,9552
11 45 10 176 7920 1760 450 2025 100 147,2815 28,7185
12 20 8 117 2340 936 160 400 64 101,3851 15,6149
13 56 36 273 15288 9828 2016 3186 1296 274,1009 -1,1009
Total 452 205 2034 82495 38769 8452 19828 4343 2034 0
Estimarea parametrului
0

b :
4343 8452 205
8452 19828 452
205 452 13
4343 8452 38769
8452 19828 82495
205 452 2034

2
2 2 1 2
2 1
2
1 1
2 1
2
2 2 1 2
2 1
2
1 1
2 1
0







t t t t
t t t t
t t
t t t t t
t t t t t
t t t
x x x x
x x x x
x x n
x x x y x
x x x y x
x x y
b
5023 , 37

0
b
n mod analog se obin valorile celorlali doi parametrii: 4963 , 1

1
b i
2446 , 4

2
b .
O cale mai rapid de estimare a parametrilor se realizeaz utiliznd calculul
matriceal, sistemul de ecuaii de mai sus devenind:
( ) ( ) X X B X Y

nmulind la stnga expresia cu ( )



X X
1
obinem:
( ) ( ) ( ) ( ) Y X X X B X X X X
1 1

Rezult c:
( ) ( ) Y X X X
b
b
b
B

,
_

1
2
1
0

unde matricele sunt de forma:


13
X

_
,

1 70 21
1 35 26
1 55 14
1 25 10
1 28 12
1 43 20
1 15 5
1 33 28
1 23 9
1 4 6
1 45 10
1 20 8
1 56 36

,
_

273
117
176
62
120
211
43
187
85
156
197
209
198
Y

,
_

13
3
2
1

u
u
u
u
U

Se calculeaz matricele:
( )

,
_


4343 8452 205
8452 19828 452
205 452 13
X X
( )

,
_


38769
82495
2034
Y X
X X 36557768
( )


_
,

X X
14676700 230376 244436
230376 14434 17216
244436 17216 53460
( )

,
_






53460 17216 244436
17216 14434 230376
244436 230376 14676700
36557768
1
1
X X
( )

,
_






0015 , 0 0005 , 0 0067 , 0
0005 , 0 0004 , 0 0063 , 0
0067 , 0 0063 , 0 4015 , 0
1
X X
Calculnd produsul:
14
( ) ( )

,
_

,
_



2446 , 4
4963 , 1
5023 , 37

2
1
0
1
b
b
b
Y X X X B
Valorile teoretice ale cifrei de afaceri rezult deci din relaia:
t t t
x x y
2 1
2446 , 4 4963 , 1 5023 , 37 + +
Exersai n EXCEL
Se consider urmtoarele serii de date pentru caracteristica
dependent
Y
i pentru trei variabile explicative 1 2
, X X
i 3
. X
Valorile
corespunztoare celor patru caracteristici sunt prezentate n tabelul de mai
jos:
Tabelul 3. Seriile de date pentru cele 4 variabile statistice
15
Y
1
X
2
X
3
X
7,50 80,00 20,00 0,20
8,50 80,80 22,30 0,40
9,40 81,40 34,80 0,70
10,30 82,00 39,20 0,80
11,20 83,80 44,20 0,90
12,30 84,50 49,00 1,00
12,90 85,10 54,00 1,20
13,70 85,90 60,00 1,40
14,50 86,40 62,90 1,60
15,20 87,20 68,30 1,90
16,00 88,10 74,90 2,30
16,80 88,90 82,90 2,40
17,60 90,00 87,00 2,90
18,40 91,10 93,80 3,10
19,20 92,00 100,00 3,50
20,00 92,90 112,20 4,60
20,70 93,10 130,40 4,70
21,40 93,90 140,70 5,00
22,00 94,20 149,00 5,20
22,70 95,00 155,00 5,80
S se estimeze parametrii modelului de regresie
t t t t t
u x b x b x b b y + + + +
3 3 2 2 1 1 0 prin metoda celor mai mici ptrate i s se
verifice semnificaia acestora (Critical t = 2,12);
Parametrii modelului de regresie t t t t t
u x b x b x b b y + + + +
3 3 2 2 1 1 0 se
estimeaz prin metoda celor mai mici ptrate cu ajutorul programului
EXCEL
Instruciuni n EXCEL:
1. Introducei datele pe 4 coloane. n A1 se introduce variabila Y, iar n
B1, C1, D1 se introduc variabilele 1 2
, X X
i 3
. X
2. Apsai Tools/Data Analysis, iar din fereastra Data Analysis alegei
opiunea Regression.
3. Selectai butonul <OK>.
16
4. Se deschide fereastra din Figura 3 n care sunt introduse
caracteristicile modelului de regresie.
Figura 3. Introducerea caracteristicilor modelului de regresie
5. Introducei cmpul n care se poziioneaz seria valorilor lui Y. n
acest exemplu n cmpul Input Y Range: se introduce $A$2:$A$21.
6. Introducei cmpul n care se poziioneaz seriile valorilor celor 3
variabile exogene. n acest exemplu n cmpul Input X Range: se introduce
$B$2:$D$21.
7. Introducei Worksheet-ul n care se scriu rezultatele. De exemplu,
dac rezultatele se afieaz pe aceeai pagin cu datele se poate selecta
Output Range: $A$25. Implicit, rezultatele se afieaz pe o pagin nou.
8. Selectai opiunea Residuals n urma creia vor fi afiate valorile
estimate (ajustate) ale variabilei endogene i valorile reziduurilor.
9. Selectai butonul <OK> .
In cel de-al treilea tabel afiat de EXCEL sunt prezentate urmtoarele
rezultate:
Coefficients Standard
Error
t Stat P-value Lower 95%
(Limita inf.
Upper 95%
(Limita
17
(Abaterea
medie
Ptratic)
a
intervalulu
i de
ncredere)
sup. a
intervalului
de
ncredere)
Intercept
(Termenul
liber)
0

b =
-64,2601
0

b
s

=
3,9808
0

b
t
=
-16,1424
0,0000>
0,05
-72,6991 -55,8212
X Variable 1
(X
1
)
1

b = 0,8936
1

b
s

=
0,0501
1

b
t
=
17,8318
0,0000<
0,05
0,7874 0,9998
X Variable 2
(X
2
)
2

b = 0,0359
2

b
s

=
0,0106
2

b
t
=
3,3780
0,0038<
0,05
0,0134 0,0584
X Variable 3
(X
3
)
3

b =
-0,6177
3

b
s

=
0.2256
3

b
t
=
-2,7382
0,0146<
0,05
-1,0960 -0,1395
Interpretarea rezultatelor din tabelul 3
Intercept este termenul liber, deci coeficientul
0

b
= -64,2601.
Termenul liber este punctul n care variabilele explicative (factoriale) sunt
egale cu 0. Deci y = -64,2601 uniti de msur, dac x
j
=0. Deoarece
0

b
t
= -
16,1424 > Critical t = 2,12, iar pragul de semnificaie, P-value , este
0,0000<0,05, nseamn c acest coeficient este semnificativ diferit de zero
deoarece probabilitatea cu care se poate accepta ipoteza H
1
(care susine c
parametrul este semnificativ diferit de zero) este de cel mult 100-
0,0000=100%>95%. Intervalul de ncredere pentru acest parametru este
-72,6991

0
b
-55,8212.
18
Coeficientul
1

b = 0,8936, ceea ce nsemn c, la creterea cu o


unitate de msur a variabilei x
1
, variabila endogen y va crete cu 0,8936
uniti de msur. Deoarece
1

b
t
= 17,8318 > Critical t = 2,12, iar
pragul de semnificaie, P-value, este 0,0000<0,05, nseamn c acest
coeficient este semnificativ diferit de zero deoarece probabilitatea cu care se
poate accepta ipoteza H
1
(care susine c parametrul este semnificativ
diferit de zero) este de cel mult 100-0,0000=100%>95%. Intervalul de
ncredere pentru acest parametru este 0,7874

1
b
0,9998.
Coeficientul
2

b = 0,0359 ceea ce nsemn c, la creterea cu o unitate


de msur a variabilei x
2
, variabila endogen y va crete cu 0,0359 uniti
de msur. Deoarece
2

b
t
= 3,3780 > Critical t = 2,12, iar pragul de
semnificaie, P-value, este 0,0038<0,05, nseamn c acest coeficient este
semnificativ diferit de zero deoarece probabilitatea cu care se poate accepta
ipoteza H
1
(care susine c parametrul este semnificativ diferit de zero) este
de cel mult 100-0,38 = 99,62%>95%. Intervalul de ncredere pentru acest
parametru este 0,0134

2
b
0,0584.
Coeficientul
3

b
= -0,6177 ceea ce nsemn c, la creterea cu o
unitate de msur a variabilei x
3
, variabila endogen y va crete cu 0,8936
19
uniti de msur. Deoarece
3

b
t
=-2,7382 > Critical t = 2,12, iar
pragul de semnificaie, P-value, este 0,0146<0,05, nseamn c acest
coeficient este semnificativ diferit de zero deoarece probabilitatea cu care se
poate accepta ipoteza H
1
(care susine c parametrul este semnificativ
diferit de zero) este de cel mult 100-1,46 = 98,54%>95%. Intervalul de
ncredere pentru acest parametru este - 1,0960

3
b
-0,1395.
Lucrare de verificare
I. Se consider modelul liniar de regresie coninnd dou variabile exogene:
t t t t
u x b x b b y + + +
2 2 1 1 0
Pentru estimarea celor trei parametri au fost nregistrate 36 de
valori, rezultatele fiind prezentate dup cum urmeaz:
. 12 18 233 , 0 5 9
32 12 30 85 ) (
2
2
2
1 / 2 1
2
2
2
1
2 2
2 1





x x
t
t t
t
t t
t
t
t
t
t
t
t
t
r x y x y
x x y y y
Folosind relaiile de mai sus se cere:
1. S se estimeze parametrii modelului liniar de regresie;
2. S se testeze dac parametrii j
b
difer semnificativ de zero i
s se interpreteze valorile acestora.
20
II. Pentru un model de regresie cu dou variabile exogene i termen liber se
cunosc urmtoarele rezultate:
. 6 0 0 ,
9 0
5 5
1 7 0
,
8 0 0 0
0 5 0 2 1
0 2 1 4 1
2

1
1
1
]
1

1
1
1
]
1

y
Y X X X
Folosind datele de mai sus se cere:
1. S se determine numrul de valori din care este format fiecare
serie de date;
2. S se estimeze parametrii modelului liniar de regresie.
21

S-ar putea să vă placă și