Sunteți pe pagina 1din 5

Seminar 6 Econometrie CSIE (11-14 nov.

2013) Exemplu: Modelul liniar de regresie cu dou variabile exogene


Presupunem c dorim s studiem cum evolueaz cheltuielile de consum personal ntr-o ar, n ultimii ani. Se consider regresia Cheltuielilor de Consum personal n raport cu Venitul personal i Timpul, pe o perioad de 15 ani. Observaie: n multe modele de regresie se introduce variabila timp ca variabil explicativ. De multe ori variabila timp poate reprezenta o variabil care afecteaz variabila explicat, dar nu este direct observabil (tehnologia). De asemenea, variabila timp poate reprezenta populaia total. Teoria economic sugereaz c ar trebui s ne ateptm ca cheltuielile de consum s creasc atunci cnd populaia crete. Utilizm modelul liniar cu dou variabile explicative: y i = 0 + 1 xi1 + 2 xi 2 + i , i = 1,2,..., n . Y = Cheltuielile de Consum pe cap de locuitor (n u.m.) X1 = Venitul disponibil pe cap de locuitor (n u.m.) X2 = Timpul (n ani) Datele de observaie se gsesc n fiierul Model Regresie Multipla.xls a) S se estimeze parametrii modelului de regresie i s se interpreteze valorile obinute. Se efectueaz calculele n Excel i se obin sumele ce vor fi utilizate n formule. y =29 135, y =1942,333, x1 =31895, x1 =2126,333, x2 =120, x2 =8,

x 2 =68 922,513, , x22 =1240, x1 x2 =272 144, 2 x1 y =62 905 821, x2 y =247 934, y i =57 420 003, ( xi1 x1 ) 2 =1 103 111,333, ( xi 2 x2 ) 2 =280.
1

1 T X X = x11 x 12

1 x21 x22

1 x11 1 1 x21 L xn1 M M L xn 2 1 x n1 L L

x12 n x22 = xi1 M xi 2 xn 2

xi1 2 xi1 xi1 xi 2

xi 2 xi1 xi 2 , 2 xi 2

y 1 1 yi y x21 L xn1 2 = xi1 yi M x22 L xn 2 y xi 2 yi n 31895 120 15 29135 T T X X = 31895 68922513 272144 , X y = 62905821 120 247934 272144 1240 Se calculeaz 37,232491 0,0225082 1,336707 T 1 ( X X ) = 0,0225082 0,0000137 0,0008319 1,336707 0,0008319 0,054034 1 T X y = x11 x 12 1

Ecuaiile normale ale lui Gauss: = XTy ( X T X )


= ( X T X ) 1 X T y
300,28625 = 0,74198 8,04356

Interpretarea coeficienilor obinui: 0 = parametrul de interceptare 1 , 2 = coeficieni de regresie pariali sau coeficieni pant. Coeficientul de regresie parial, j , msoar modificarea, n medie, a variabilei y, ca rspuns la modificarea variabilei x j cu o unitate, ceilali factori rmnnd constani.
=0,74198 arat c, meninnd celelalte variabile constante, atunci cnd venitul (X1) 1 crete cu 1u.m., cheltuielile de consum cresc, n medie, cu 0,74 u.m. nclinaia marginal spre consum este estimat la 0,74 sau 74 procente. =8,04356 arat c, meninnd celelalte variabile constante, cheltuielile de consum 2 au crescut, n medie, cu aproximativ 8 u.m., pentru fiecare an din perioada de studiu. =300,28625 arat c, dac cele dou variabile explicative, X1 i X2 au valoarea 0, 0 valoarea medie a cheltuielilor de consum pe cap de locuitor este estimat la circa 300u.m.

b) S se estimeze variana variabilelor de perturbaie (variana modelului) Se calculeaz suma ptratelor reziduurilor. T X T y = i ) = ei2 =eT e = y T y SSE = ( yi y
29135 = 57 420 003 (300,28 0,74198 8,04356 ) 62905821 247934

eT e =1976,85574 2 SSE eT e ei 2 = se2 = = = n (k + 1) n (k + 1) n (k + 1) Unde k = numrul de variabile independente din model.


2 2 = se =

1976,85574 = 164,7379 15 3 se = 164,7379 = 12,835

c) S se estimeze matricea de covarian a estimatorilor parametrilor modelului Matricea de covarian a vectorului estimatorilor este: ) = 2 ( X T X ) 1 = Var (
Variana reziduurilor este un estimator nedeplasat al varianei perturbaiilor aleatoare. Un estimator al matricei de covarian a vectorului estimatorilor este: ) = s 2 ( X T X ) 1 = Va r ( e
6133,650 3,70794 220,20634 = 3,70794 0,00226 0,13705 220,20634 0,13705 8,90155
Eementele de pe diagonala acestei matrici sunt varianele estimatorilor j

) = 0,00226 se( ) = 0,00226 = 0,04753 Var ( 1 1 ) = 8,90155 se( ) = 8,90155 = 2,98354 Var ( 2 2 ) = 6133,650 se( ) = 6133,650 = 78,31763 Var (
0 0

d) S se testeze semnificaia statistic a coeficienilor de regresie (nivel de semnificaie = 0,05 ; valoare tabelar: 2,179) Testarea semnificaiei statistice a parametrului 1 H 0 : 1 = 0 H 0 : 1 0 0 0,74198 t calc = 1 = = 15,61077 ) 0,04753 se( 1
t tab = t / 2;n3 = t 0,025;12 = 2,179

Deoarece t calc > t tab respingem H0 acceptm H1 parametrul 1 este semnificativ statistic la pragul de semnificaie de 5%. Determinarea unui interval de ncredere 95% pentru 1
0,74198 (2,179)(0,04753)

.. Coefficients 300,28625 0,74198 8,04356 Standard Err 78,31763 0,04753 2,98354 t Stat 3,83421 15,61077 2,69598 Lower 95% 0,6384 Upper 95% 0,8455

e) S de calculeze coeficientul de determinaie (R Square) i Adjusted R Square.


R2 = SSR SSE . =1 SST SST

Datele necesare calculrii coeficientului de determinaie, R2 sunt: 2 SST = ( yi y ) = yi2 ny 2 = y T y ny 2 =830 121,333 T X T y =1976,855 ) 2 = e 2 = eT e = y T y SSE = ( y y
i i i

T X T y ny 2 =828 144,478 SSR = SST SSE = R 2 =0,9976 Rezult c 99,76% din variaia cheltuielilor de consum, n perioada studiat de 15 ani, este explicat prin cele 2 variabile exogene.
R2 = SSR / k SSE /( n k 1) = 1 SST /( n 1) SST /( n 1)

R 2 = 0,9972

f) Folosind Analiza Dispersional, s se testeze validitatea modelului de regresie (nivel de semnificaie = 0,05 ; valoare tabelar: 3,89) n cazul unui model de regresie linar multipl tabelul cu Analiza varianei este:
Sursa de variaie Regresia Eroarea Total Suma ptratelor abaterilor (SS) SSR SSE SST Numr grade de libertate k n-(k+1) n-1 Media ptratelor (MS) MSR=SSR/k MSE=SSE/(n-k-1) Statistica F

F=MSR/MSE

Testarea validitii modelului de regresie: H 0 : 1 = 2 = 0 (modelul nu este valid statistic) H1 : nonH 0 (modelul este valid statistic) Statistica folosit pentru testul semnificaiei reunite a variabilelor explicative este: T X T y ny 2 ) / k SSR / k ( = T F= ~ F ;k ,nk 1 T X T y ) /(n k 1) SSE /(n k 1) ( y y
Rc : Fcalc > F ;k ,nk 1
Ftab = F ;k ,n k 1 = F0 ,05; 2 ,12 = 3,89
Fcalc = 2513,52 Deoarece Fcalc > Ftab respingem H0 acceptm H1 modelul este valid statistic

la pragul de semnificaie de 5%.

g) S se previzioneze valoarea media a variabilei endogene i apoi o valoare individual a acestei variabile, pentru valorile cunoscute ale variabilelor exogene: 0 0 x10 = 2610 iar x 20 = 16 ( x1 = 2610 iar x 2 = 16 ) A) Predicia mediei T Se d vectorul x0 = (1, x10 , x20 )T
Cunoatem vectorul
1 1 x0 = x10 = 2610 . x 16 20

Dorim

previzionm

T T E ( y | x0 ) = 0 + 1 x10 + 2 x20 = x0

300,286 0 = x = (1 2610 16 ) 0,74198 = 2365,55 Un estimator pt E ( y | x ) = x este y 8,04356 Variana prediciei mediei este T T T 0 | x0 0 | x0 Var ( y ) = se2 x0 ( X T X ) 1 x0 =48,6426 se( y ) =6,9744
T 0 T 0 T 00 T T 0 t crt se( y 0 ) Un interval de ncredere 95% pentru E ( y | x0 ) = x0 este y

B) Predicia unei valori individuale T Se d vectorul x0 = (1, x10 , x20 )T


T Valoarea real a lui y este y0 = ( y0 | x0 ) = x0 +0 T =x Valoarea previzionat este y
0 0

T T ) = x0 Cunoatem vectorul x0 = (1 2610 16 ) . Dorim s previzionm ( y0 | x0 Un estimator pentru y 0 este, i n acest caz: 300,286 T 0 = x0 = (1 2610 16 ) 0,74198 = 2365,55 y 8,04356 Variana erorii de previziune, n cazul prediciei individuale este T T 0 y 0 | x0 0 y0 ) =14,6076 Var ( y ) = se2 [1 + x0 ( X T X ) 1 x0 ] =213,3806 se( y 0 t crt se( y 0 y0 ) Un interval de ncredere 95% pentru y 0 este y T

h) Verificai rezultatele obinute utiliznd Excel i Eviews.


Regression Statistics Multiple R 0.99880859 R Square 0.99761859 Adjusted R Square 0.99722169 Standard Error 12.8350282 Observations 15 ANOVA df 2 12 14 SS 828144.4779 1976.855392 830121.3333 Standard Error 78.3176256 0.047533745 2.983545657 MS 414072.239 164.737949 F 2513.521 Significance F 1.8239E-16

Regression Residual Total

Intercept X Variable 1 X Variable 2

Coefficients 300.286257 0.74198083 8.04356272

t Stat 3.83421044 15.6095598 2.6959744

P-value 0.002377 2.46E-09 0.019454

Lower 95% 129.6468128 0.6384137 1.542975275

Upper 95% 470.9257 0.845548 14.54415

Se vor importa 3 serii de date, cu Upper-left data cell: A3.

S-ar putea să vă placă și