Documente Academic
Documente Profesional
Documente Cultură
Unitatea de nvare 9
REGRESIE MULTIFACTORIAL - I
Cuprins:
1
3. Concepte generale privind definirea, specificarea i identificarea modelului
multifactorial
Exemplu Exemplu
n economie, modelele multifactoriale au o arie vast de aplicare, acestea putnd fi
utilizate n mai multe situaii i sub diverse forme, ca, de exemplu:
1) Modelarea consumului
C = f (V, P, N) + u
unde:
C = consumul unui produs sau grupe de produse;
V = venitul pe familie;
P = preul produsului sau indicele preurilor grupei de produse;
N = numrul membrilor unei familii.
2
2) Funcia de producie Cobb-Douglas
Q = f (K, L) + u
unde:
Q = volumul (valoarea) produciei;
K = capitalul;
L = fora de munc.
3) Modelarea evoluiei preurilor
I p = f (I v, I cv, I m) + u
unde:
I p = indicele preurilor;
I v = indicele veniturilor (salariilor) consumatorilor;
I cv = indicele cursului valutar;
I m = indicele masei monetare.
Spre deosebire de cazul unifactorial, unde procedeul grafic sau calculele algebrice
ofereau informaii relativ corecte pentru identificarea funciei de regresie, n cazul modelelor
multifactoriale acest lucru rmne valabil doar n cazul n care se va lucra cu serii
bidimensionale: yt, x1t ; yt, x2t ; yt, xjt ; ; yt, xkt.
3
- funcia liniar
Y t = b 0 + b 1 x 1t + b 2 x 2t + b k x kt (9.3.1)
b b b
Y t b 0 x 1t1 x 2t2 x ktk (9.3.2)
ln Y t ln b 0 b1 ln x 1t b 2 ln x 2t b k ln x kt (9.3.3)
Y t e b0 b1x 1t b2 x 2t bk x kt (9.3.4)
lnY t b 0 b1 x 1t b 2 x 2t b k x kt (9.3.5)
sau
x x x
Y t b 0 b1 1t b 2 2t b k kt (9.3.6)
lnY t ln b 0 ln b1 x 1t ln b 2 x 2t ln b k x kt (9.3.7)
lnY t 0 1 x 1t 2 x 2t k x kt (9.3.8)
unde: 0 ln b 0 ;
j ln b j , j 1, k
4
Estimarea parametrilor modelului se face n urma etapei de identificare a acestuia.
Deoarece marea majoritate a modelelor econometrice pot fi liniarizate, un model
multifactorial, n form general, se prezint astfel:
y t = b 0 x 0t + b 1 x 1t + b 2 x 2t + + b j x jt + + b k x kt + u t (9.4.1)
unde:
t 1, n , n = numrul termenilor seriilor statistice;
j 1, k , k = numrul variabilelor exogene,
y 1 b 0 b1 x 11 b 2 x 12 bk x1k u1
y b b x b x b x u
2 0 1 21 2 22 k 2k 2
(9.4.2)
................................................................................
y n b 0 b n x n1 b 2 x n2 bk x nk un
unde: x 0 = (1, 1, ,1) reprezint variabila ce se ataeaz termenului liber, ale crei
valori x t 0 sunt egale cu unitatea t 1, n .
Definind cu:
y 1
y 2
Y vectorul coloan al variabilei endogene (y ) t
t 1, n de dimensiune (n, 1);
y
n
5
1 x 11 x 1 k
1 x 21 x 2 k
X 1 x 31 x 3 k matricea variabilelor exogene (x ) j 0,k de dimensiune (n, k +
j
1 x n 1 x n k
1);
b 0
b 1
B b 2 vectorul coloan al parametrilor (b ) j
j 0,k de dimensiune (k + 1, 1);
b n
u 1
u 2
U u 3 vectorul coloan al variabilei aleatoare (u ) t 1, n
de dimensiune (n,
t
u n
1).
Y = XB + U (9.4.3)
6
Relaia (9.4.3) se mai poate scrie astfel:
y1 1 x 1 x1k b0 u1
y 2 1 x 21 x2k b1 u2
(9.4.4)
y 1 x x b u
n n1 n k k n
(n1) (kn 1 () k 1) 1 (n1)
7
Funcia de regresie corespunztoare modelului, scris sub forma unei ecuaii
matriceale, este:
Y X B (9.4.5)
U Y Y Y X B (9.4.6)
n cazul unui model multifactorial parametrii pot fi estimai prin intermediul mai
multor metode cum ar fi: metoda punctelor empirice, metoda punctelor medii, metoda celor
mai mici ptrate (M.C.M.M.P.), metoda verosimilitii maxime etc.
Metoda punctelor empirice i metoda punctelor medii sunt folosite n cazul modelelor
n care aplicarea metodei celor mai mici ptrate este anevoioas, necesitnd calcule
complicate, de regul pentru funciile neliniare (funcia logistic).
Metoda celor mai mici ptrate este metoda cel mai des utilizat. n cazul unui model
multifactorial aplicarea acesteia presupune minimizarea funciei:
n
F B min u t2 min U U min Y Y
2 2
min Y XB min Y XB Y XB
t 1
min Y Y 2B X Y B X X B (9.4.7)
F B
0 2 X Y 2 X X B 0 (9.4.8)
B
X X B X Y (9.4.9)
8
n cazul n care matricea (XX) admite invers, prin nmulirea la stnga a ecuaiei
matriceale (9.4.9) cu (XX) 1 rezult c:
X X 1 X X B X X 1 X Y (9.4.10)
b1
b 2
B X X
X Y
1
(9.4.11)
b
k
La nivelul eantionului, modelul multifactorial liniar format din dou componente se
prezint astfel:
yt b0 b1 x1t b2 x2t ut
y t b0 b1 x1t b2 x2t
n
F b j min yt b0 b1 x1t b2 x2t
2
t 1
Minimul acestei funcii este dat de calculul derivatelor pariale n raport cu parametrii
modelului:
F b0 0 2 yt b0 b1 x1t b2 x2t 1 0
t
F b1 0 2 yt b0 b1 x1t b2 x2t x1t 0
t
F b2 0 2 yt b0 b1 x1t b2 x2t x2t 0
t
9
nb0 b1 x1t b2 x2t yt
b0 x1t b1 x1t b2 x1t x2t x1t yt
2
b0 x2t b1 x1t x2t b2 x2t x2t yt
2
Exemplu
Un ntreprinztor cumpr un magazin avnd o suprafa de 230 m 2 ntr-un cartier n
care locuiesc n jur de 6400 de familii. O societate de consultan de management comercial l
informeaz c cifra de afaceri a magazinelor cu profilul respectiv depinde liniar de suprafaa
comercial a magazinului i de numrul familiilor din cartierul respectiv care, de regul,
cumpr de la magazinul cel mai apropiat. n acest sens, i pune la dispoziie informaiile
referitoare la aceti indicatori, nregistrate la 13 magazine avnd acelai profil:
Tabelul 1
Nr. de familii (sute) 70 35 55 25 28 43 15 33 23 4 45 20 56
Supr. comercial (zeci m2) 21 26 14 10 12 20 5 28 9 6 10 8 36
Cifra de afaceri (mil. lei) 198 209 197 156 85 187 43 211 120 62 176 117 273
Se cere:
a) Pe baza datelor problemei, innd cont de semnificaia economic a fenomenelor
observate, s se construiasc modelul econometric cu ajutorul cruia poate fi studiat
dependena dintre fenomenele respective;
b) S se estimeze parametrii modelului.
Soluie:
a) Descrierea econometric a legturii dintre cele trei variabile, y - cifra de afaceri, x1
- numrul de familii i x 2 - suprafaa comercial, se poate face cu ajutorul modelului
yt f x1t , x2t ut , care explic variaia cifrei de afaceri pe seama ambilor factori.
10
Figura 2
Deoarece graficele de mai sus arat c legtura dintre y i x1 , respectiv y i x 2 poate
fi aproximat cu o dreapt, modelul de mai sus devine:
y t b0 b1 x1t b2 x 2t u t
n
F b j min y t b0 b1 x1t b2 x 2t
2
t 1
Minimul acestei funcii este dat de calculul derivatelor pariale n raport cu parametrii
modelului :
F b0 0 2 y t b0 b1 x1t b2 x 2t 1 0
t
F b1 0 2 y t b0 b1 x1t b2 x 2t x1t 0
t
F b2 0 2 y t b0 b1 x1t b2 x 2t x 2t 0
t
b0 x2t b1 x1t x2t b2 x 2t x 2t yt
2
Tabelul 2
11
y t 37,5023
Nr.
x1t x2t yt x1t y t x 2 t y t x1t x 2 t x 2
1t x 2
2t
1,4963 x1t ut yt y t
crt. 4,2446 x2t
0 1 2 3 4 5 6 7 8 9 10
1 70 21 198 13860 4158 1470 4900 441 231,3796 -33,3796
2 35 26 209 7315 5434 910 1225 676 200,2326 8,7674
3 55 14 197 10835 2758 770 3025 196 179,2229 17,7771
4 25 10 156 3900 1560 250 625 100 117,3557 38,6443
5 28 12 85 2380 1020 336 784 144 130,3339 -45,3339
6 43 20 187 8041 3740 860 1849 400 186,7352 0,2648
7 15 5 43 645 215 75 225 25 81,1697 -38,1697
8 33 28 211 6963 5908 924 1089 784 205,7293 5,2707
9 23 9 120 2760 1080 207 529 81 110,1185 9,8815
10 4 6 62 248 372 24 16 36 68,9552 -6,9552
11 45 10 176 7920 1760 450 2025 100 147,2815 28,7185
12 20 8 117 2340 936 160 400 64 101,3851 15,6149
13 56 36 273 15288 9828 2016 3186 1296 274,1009 -1,1009
Total 452 205 2034 82495 38769 8452 19828 4343 2034 0
Estimarea parametrului b0 :
y x x
t 1t 2t 2034 452 205
x y x x x
1t t
2
1t 1t 2t 82495 19828 8452
b0
x y x x
2t x t 1t 2t
2
2t
38769 8452 4343
n x x 1t 2t
13 452 205
x x x x
1t
2
1t 1t 2t
452 19828 8452
x x x x
2t 1t 2t
2
2t
205 8452 4343
b0 37,5023
12
X X 1 X X B X X 1 X Y
Rezult c:
b0
B b1 X X X Y
1
b
2
1 70 21 198 u1
u2
1 35 26 209
197 u
1 55 14 3
1 25 10 156
1 28 85
12
1 43 20 187
X 1 15 5 Y 43 U
1 33 28 211
1 23
9 120
1 4 6 62
1 45 10 176
1 20 8 117
1 56 36 273 u
13
Se calculeaz matricele:
13 452 205
X X 452 19828 8452
205 8452 4343
2034
X Y 82495
38769
X X 36557768
13
14676700 230376 244436
1
X X 1
230376 14434 17216
36557768
244436 17216 53460
Calculnd produsul:
b0 37,5023
B X X X Y b1 1,4963
1
b 4,2446
2
Valorile teoretice ale cifrei de afaceri rezult deci din relaia:
y t 37,5023 1,4963 x1t 4,2446 x2t
- su2 u 2
t
n k 1
14
unde: cij = elementul (j+1) situat pe diagonala principal a matricei inverse (XX)-1,
j 0, k .
H 0 : b j 0 b b j 0 ; j
H 1 : b j 0, j 1, k .
b j b b j 0
z j
sb sb
j j
Pentru un prag de semnificaie a vom respinge ipoteza nul (H0) cnd z > za/2 sau z
< za/2 i vom concluziona c este foarte improbabil ca estimatorii b j s provin dintr-o
populaie pentru care b j 0 .
b j b b j 0
tb j
,
j
sb sb j
j
tb ta 2; n k 1
j
b j ta / 2,n k 1 sb b j b j ta / 2,n k 1 sb
j j
6. Exersai n EXCEL
15
Se consider urmtoarele serii de date pentru caracteristica dependent Y i pentru trei
variabile explicative X1, X 2 i X 3. Valorile corespunztoare celor patru caracteristici sunt
prezentate n tabelul de mai jos:
Instruciuni n EXCEL:
1. Introducei datele pe 4 coloane. n A1 se introduce variabila Y, iar n B1, C1, D1 se
introduc variabilele X1, X 2 i X 3.
2. Apsai Tools/Data Analysis, iar din fereastra Data Analysis alegei opiunea
Regression.
3. Selectai butonul <OK>.
16
4. Se deschide fereastra din Figura 3 n care sunt introduse caracteristicile modelului de
regresie.
In cel de-al treilea tabel afiat de EXCEL sunt prezentate urmtoarele rezultate:
Standard
Lower 95% Upper 95%
Error
Coefficients (Limita inf. a (Limita sup. a
(Abaterea t Stat P-value
(Coeficieni) intervalului de intervalului de
medie
ncredere) ncredere)
Ptratic)
Intercept
b0 = -64,2601 sb0 t b 0,0000> 0,05 -72,6991 -55,8212
(Termenul liber) = 3,9808 0
= -16,1424
X Variable 1 (X1) b1 = 0,8936 sb1 = 0,0501 t b1 = 17,8318 0,0000< 0,05 0,7874 0,9998
17
X Variable 2 (X2) b2 = 0,0359 sb 2 tb
2
0,0038< 0,05 0,0134 0,0584
= 0,0106 = 3,3780
t b
msur, dac xj=0. Deoarece 0
= -16,1424 > Critical t = 2,12, iar pragul de semnificaie,
P-value , este 0,0000<0,05, nseamn c acest coeficient este semnificativ diferit de zero
deoarece probabilitatea cu care se poate accepta ipoteza H1 (care susine c parametrul este
semnificativ diferit de zero) este de cel mult 100-0,0000=100%>95%. Intervalul de ncredere
pentru acest parametru este -72,6991 b0 -55,8212.
Coeficientul b1 = 0,8936, ceea ce nsemn c, la creterea cu o unitate de msur a
t b
variabilei x1, variabila endogen y va crete cu 0,8936 uniti de msur. Deoarece 1
= 17,8318 > Critical t = 2,12, iar pragul de semnificaie, P-value, este 0,0000<0,05, nseamn
c acest coeficient este semnificativ diferit de zero deoarece probabilitatea cu care se poate
accepta ipoteza H1 (care susine c parametrul este semnificativ diferit de zero) este de cel
mult 100-0,0000=100%>95%. Intervalul de ncredere pentru acest parametru este 0,7874
b1 0,9998.
tb
variabilei x2, variabila endogen y va crete cu 0,0359 uniti de msur. Deoarece 2
=
3,3780 > Critical t = 2,12, iar pragul de semnificaie, P-value, este 0,0038<0,05, nseamn c
acest coeficient este semnificativ diferit de zero deoarece probabilitatea cu care se poate
accepta ipoteza H1 (care susine c parametrul este semnificativ diferit de zero) este de cel
mult 100-0,38 = 99,62%>95%. Intervalul de ncredere pentru acest parametru este 0,0134
b2 0,0584.
tb
variabilei x3, variabila endogen y va crete cu 0,8936 uniti de msur. Deoarece 3
=-2,7382 > Critical t = 2,12, iar pragul de semnificaie, P-value, este 0,0146<0,05,
nseamn c acest coeficient este semnificativ diferit de zero deoarece probabilitatea cu care
18
se poate accepta ipoteza H1 (care susine c parametrul este semnificativ diferit de zero) este
de cel mult 100-1,46 = 98,54%>95%. Intervalul de ncredere pentru acest parametru este -
1,0960 b3 -0,1395.
7. Bibliografia Unitii de nvare 9
8. Lucrare de verificare 9
Pentru estimarea celor trei parametri au fost nregistrate 36 de valori, rezultatele fiind
prezentate dup cum urmeaz:
(yt
t y ) 2 85 y
t
2
t 30 x
t
2
1t 12 x
t
2
2t 32
y x
t
t 1t 9 y x
t
t 2t 5 rx1 / x2 0,233 12 18 22 12.
II. Pentru un model de regresie cu dou variabile exogene i termen liber se cunosc
urmtoarele rezultate:
19
41 1 02 170
X 21 0 05 , XY5, 260.
y
0 80 90
Folosind datele de mai sus se cere:
1. S se determine numrul de valori din care este format fiecare serie de date;
2. S se estimeze parametrii modelului liniar de regresie.
20