Sunteți pe pagina 1din 4

CURS X

MODELUL REGRESIEI LINIARE MULTIPLE


Identificarea modelului
Identificarea econometric const n alegerea unei forme a funciei matematice care descrie relaia
dintre variabila endogen Y i factorii si de influen, X1, X2, , Xi, , Xk.
Procedee de identificare
Procedeul grafic se reprezint grafic prin nor de puncte perechile (Y, Xi)
Procedeul analitic se estimeaz mai multe forme ale funciei, urmnd sa se decid care model este
cel mai potrivit, folosind o serie de criterii de performan.
Principalele funcii de regresie multifactoriale mbrac n economie una din urmtoarele forme:
funcia liniar: + t
funcia liniar dublu logaritmic:
t
sau
+ t
funcia putere Y = a0 x1a1 x2a2... t
funcia exponenial Y = ea+bx1+cx2+... + t
Modelul regresiei liniare multiple
Acesta are forma:
yt = a1x1t + + apxpt + t
Modelul poate fi scris sub form matricial,
Y = Xa +
DESPRE MATRICI
Se numete matrice cu m linii i n coloane (sau de tip ) un tablou cu m linii i n coloane
Ipoteze fundamentale
Ipotezele modelului regresiei simple se emit si n cazul modelului regresiei multiple.
La acestea se adaug ipoteza de multicoliniaritate nu exist relaie de dependen ntre variabilele
exogene ale modelului.
Estimarea parametrilor modelului
Metoda celor mai mici ptrate:
Depistarea fenomenului de multicolinearitate
reprezentarea grafic a seriilor de valori corespunztoare variabilelor explicative.
- calculul determinantului matricii X`X, Det(X`X) ; cu ct valoarea acestui determinant este mai apropiat de
zero, cu att corelaia dintre variabile este mai puternic.
calculul raportului de corelaie, R2
aceast valoare este comparat cu mrimea aceluiai coeficient obinut n condiiile n care una dintre
variabilele factoriale a fost omis din model.
n cazul n care valorile coeficienilor sunt apropiate ca mrime se poate considera c variabila omis
este coliniar cu celelalte variabile factoriale.
eliminarea acestei variabile din model conduce la diminuarea multicoliniaritii fr a afecta
semnificativ gradul de determinare a celorlalte variabile exogene asupra celei endogene
Atenuarea multicoliniaritii poate fi realizat astfel:
se recomand folosirea unor serii de date ct mai lungi (T > 15), astfel nct eventualele analogii,
datorate hazardului, s fie, pe ct posibil, eliminate;
1
t 0 1 1t 2 2t k kt
Y = a + a x + a x +...a x
1 2 k
a a a
t 0 1t 2t kt
Y = a X X ... X
t 0 1 1t 2 2t k kt
l nY = ln a + a lnX + a lnX +...+ a lnX
11 p1
i
1T pT
x ... x
y
Y= ... , X= ... ... ...
yT
x ... x
1
1
1
1
1
1
1
1
1
1
]
1
1
]
1 1
p p
a
a= ... , ...
a
1 1
1 1
1 1
1 1
] ]
( ) ( ) Y ' X X ' X a

n situaia n care dou variabile exogene sunt intens corelate (una dintre ele este coliniar cu
cealalt), se poate renuna la una dintre ele, considerndu-se c variabila omis este exprimat de cea
reinut n model;
- dac datele sunt prezentate sub form de serii cronologice, se pot calcula diferenele de ordinul 1
((1) = yt yt-1), sau pot fi logaritmate valorile lui Yt, Xi n scopul atenurii coliniaritii cauzate de
prezena trendului n cadrul seriilor de date;
- utilizarea de serii sincrone de date, formate n optic transversal, poate constitui o modalitate de
diminuare sau chiar de eliminare a interdependenei factorilor. Un exemplu de serii sincrone se refer
o observare a unui eantion statistic de ntreprinderi, judee, familii etc. Ca urmare a faptului c datele
sunt culese pentru aceeai perioad de timp, pe baza aceleai metodologii, dar n condiii diferite de
manifestare a factorilor, exist anse mai mari ca ipoteza privind independena factorilor s fie
satisfcut.
Previziunea variabilei endogene Y
Dac se presupun cunoscute la un moment , valorile variabilelor exogene, previziunea variabilei
endogene, respectiv valoarea real a acesteia, vor fi:
Estimare punctual
Estimare prin interval de ncredere
REGRESIA MULTIPL. Modelul liniar general
Regresia multipl analizeaz legtura dintre o variabil explicat y i mai multe variabile explicative
x1, x2, ..., xk, unde k > 2.
Modelul liniar general este o generalizare a regresiei simple, n care apar mai multe variabile
explicative. Pentru serii temporale, t = 1,2, ...n, modelul este:

unde:
yt = variabila de explicat la timpul t;
x1t = variabila explicativ 1 la timpul t;
x2t = variabila explicativ 2 la timpul t;
...
xkt = variabila explicativ k la timpul t
= parametrii modelului;

= eroarea de specificare, necunoscut (diferena dintre modelul adevrat i cel
specificat);
n = numrul de observri.
Ipotezele i proprietile estimatorilor
Se formuleaz urmtoarele ipoteze de natur stochastic i structural,
n legtur cu modelul liniar n variabilele explicative, :
a) ipoteze stochastice
valorile xit, i=1,k sunt observate fr erori,
2

+ + +
p p 2 2 1 1
p
x a ... x a x a y

+ + +
p p 2 2 1 1
p
x a ... x a x a y
$
( )
$
( ) ( )
p p
, ,
P y - t y y + t = 1 -
( ) [ ] 1 x X ' X x
1 T 2
+


t kt k t t t
x a x a x a a y + + + + + ...
2 2 1 1 0
k
a a a ,..., ,
1 0
t

k
x x x ,...., ,
2 1
0 ) (
t
E
, sperana matematic a erorilor este nul,
, variana erorilor este constant pentru orice t=1,n numit i ipoteza de
homoscedascticitate,
,dac erorile sunt necorelate (independena erorilor),
, erorile sunt independente de variabilele
explicative, pentru orice i=1,k;
b) ipoteze structurale
absena multicoliniaritii ntre variabilele explicative, aceasta implic faptul c matricea
este regulat i exist
inversa ,
tinde ctre o matrice finit nesingular,
n > k+1, numrul de observri trebuie s fie mai mare dect numrul variabilelor explicative
(cnd n=k+1, atunci sistemul este cu n ecuaii i n necunoscute, perfect determinat).
Proprietile estimatorilor
Estimatorii sunt liniari, nedeplasai i eficieni.
Modelul regresiei multiple se poate scrie n modurile:

de unde reziduurile sunt:
Estimatorii sunt nedeplasai cnd:
pentru c prin ipotez
Analiza varianei testul Fisher de semnificaie global a regresiei
Testul de semnificaie global a regresiei se formuleaz astfel: exist
cel puin o variabil explicativ semnificativ?
Ipotezele sunt:
H0: a1 = a2 = ... = ak = 0
(toi coeficienii sunt nuli, nici o variabil explicativ nu i aduce
contribuia la explicarea variabilei y; termenul constant a0 nu prezint interes,
deoarece un model n care numai termenul constant este semnificativ,
nu are sens economic.)
H1: exista cel putin un coeficient nenul.
n cazul n care se accept H0 nseamn c nu exist nici o relaie
liniar semnificativ ntre variabila y i variabilele xi cu i=1,2, ..., k.
Testarea ipotezei nule este echivalent cu a testa dac variana SSE
este semnificativ diferit de 0.
REGRESIA MULTIPL
3
2 2
) (
t
E
0 ) (
t t
E
0 ) , cov(
t it
x
) ( X X
1
) (

X X
n X X / ) (
k
a a a ,..., ,
1 0
e a X Y +
Y Y a X Y e


a a E ) (
X X X a X X X Xa X X X Xa X X X Y X X X a + + +
1 1 1 1 1
) ( ) ( ) ( ) ( ) ( ) ( ) (
a E X X X a a E +

) ( ) ( ) (
1

0 ) (
t
E
) 1 /(
/

k n SSR
k SSE
F
Teste statistice i analiza varianei
Testarea semnificaiei individuale a coeficienilor pariali de regresie, folosind testul t Student
Testarea semnificaiei globale a regresiei multiple, prin care se accept sau se infirm ipoteza
nul H0: R2=0, pe baza testului Fisher, F.
Construirea testelor statistice
se refer la contribuia uneia sau mai multor variabile explicative la regresia multipl,
testarea egalitii statistice a unui ansamblu de coeficieni cu un ansamblu de valori fixate,
restriciile asupra estimatorilor coeficienilor i testarea validitii lor,
folosirea testului F pe baza analizei varianei pentru analiza unor ipoteze asupra regresiei
multiple
Compararea unui parametru ai cu o valoare fixat a
Contribuia marginal a fiecrei variabile explicative la formarea variabilei y este valoarea
coeficientului fiecreia dintre ele.
De exemplu, n modelul liniar cu patru variabile explicative:
se poate spune c lunar, creterea cu 1 euro a:
- consumului mediu de combustibil conduce la creterea livrrilor lunare, n medie, cu
aproximativ 62 de peturi,
- creterea cu 1 euro a valorii daunelor i pierderilor lunare determin o cretere a livrrilor, n
medie, de 435 de peturi,
- creterea cu un procent a mrfii returnate, poate influena creterea livrrilor, n medie, cu
159285 de peturi,
- creterea cu 1 euro a fondului mediu net de salarii ale personalului distribuitor genereaz o
scdere a livrrilor lunare, n medie, cu 147 de peturi.
Introducerea uneia sau mai multor variabile explicative n model
Adugarea unor variabile explicative n model mbuntete semnificativ
calitatea ajustrii? Exist oare o diferen semnificativ ntre variana explicat,
SSE, de modelul complet i cea explicat, SSE1, de modelul cu mai puine
variabile independente? Testul de ipoteze este:
Se calculeaz i se compar cu ,
unde k este numrul de variabile explicative, inclusiv cele adugate din modelul
cel mai cuprinztor, iar k este numrul iniial de variabile explicative, k<k.
Regula de decizie este:
se accept H0, nu este nici o diferen ntre cele dou modele i introducerea
variabilelor suplimentare nu mbuntete calitatea ajustrii;
se accept H1, introducerea variabilei sau variabilelor suplimentare a
contribuit la o mai bun explicare a varianei variabilei endogene.
4

'



0 :
0 :
1
1
1
0
SSE SSE H
SSE SSE H
) 1 /(
) /( (
*
1 ) 1

k n SSR
k k SSE SSE
F

1 ,
1
k n k k
F

1 ,
*

<
k n k k
F F

1 ,
*

>
k n k k
F F