Sunteți pe pagina 1din 5

Econometrie Seminar 6 Sptaru (10-12 nov.

2014)
Exemplu: Modelul liniar de regresie cu dou variabile exogene (explicative)
Presupunem c dorim s studiem cum evolueaz cheltuielile de consum personal ntr-o ar,
n ultimii ani.
Se consider regresia Cheltuielilor de Consum personal n raport cu Venitul personal i Timpul, pe o
perioad de 15 ani. Datele de observaie se gsesc n fiierul Model Regresie Multipla.xls.
Utilizm modelul liniar cu dou variabile explicative:
yi = 0 + 1 xi1 + 2 xi 2 + i , i = 1,2,..., n .
Y = Cheltuielile de Consum pe cap de locuitor (n u.m.)
X1 = Venitul disponibil pe cap de locuitor (n u.m.)
X2 = Timpul (n ani)
Observaie: n multe modele de regresie se introduce variabila timp ca variabil explicativ. De
multe ori variabila timp poate reprezenta o variabil care afecteaz variabila explicat, dar nu este
direct observabil (tehnologia). De asemenea, variabila timp poate reprezenta populaia total. Teoria
economic sugereaz c ar trebui s ne ateptm ca cheltuielile de consum s creasc atunci cnd
populaia crete.
a) S se estimeze parametrii modelului de regresie i s se interpreteze valorile obinute.
Se efectueaz calculele n Excel i se obin sumele ce vor fi utilizate n formule.

y =29 135, y =1942,333, x1 =31895, x1 =2126,333, x 2 =120, x 2 =8,


2
2
x 1 =68 922,513, , x 2 =1240, x1 x 2 =272 144,
2

x1 y =62 905 821, x 2 y =247 934, y i =57 420 003,


2
2
( xi1 x1 ) =1 103 111,333, ( x i 2 x 2 ) =280.

T
X X = x11
x
12

T
X y = x11
x
12

1
x 21
x 22

1
x 21
x 22

1 x11
1
1 x 21
L x n1
M M
L x n 2
1 x n1
L

x12
n
x 22
= xi1
M

xi 2
x n 2

xi1
2
xi1
xi1 xi 2

xi 2

xi1 xi 2 ,
2
xi 2

y
1 1 y i
y

L x n1 2 = x i1 y i
M
L x n 2 xi 2 y i
yn
L

31895
120
15
29135

T
X X = 31895 68922513 272144 , X y = 62905821
120
247934
272144
1240

37,232491 0,0225082 1,336707

T
1
Se calculeaz ( X X ) = 0,0225082 0,0000137 0,0008319
1,336707
0,0008319
0,054034

Ecuaiile normale ale lui Gauss: ( X T X ) = X T y


T

300,28625

= ( X X ) X y = 0,74198
8,04356

Interpretarea coeficienilor obinui:


0 = parametrul de interceptare
1 , 2 = coeficieni de regresie pariali sau coeficieni pant.
Coeficientul de regresie parial, j , arat cu ct crete sau scade, n medie, valoarea variabilei Y, ca
T

rspuns la creterea variabilei x j cu o unitate, ceilali factori rmnnd constani.


1 = 0,74198 arat c, n perioada analizat, meninnd celelalte variabile constante, atunci cnd
venitul (X1) crete cu 1u.m., cheltuielile de consum cresc, n medie, cu 0,74 u.m.
nclinaia marginal spre consum este estimat la 0,74 sau 74 procente.
2 = 8,04356 arat c, meninnd celelalte variabile constante, cheltuielile de consum au crescut, n
medie, cu aproximativ 8 u.m., pentru fiecare an din perioada de studiu.
0 = 300,28625 arat c, dac cele dou variabile explicative, X1 i X2 au valoarea 0, valoarea medie
a cheltuielilor de consum pe cap de locuitor este estimat la circa 300 u.m.

b) S se estimeze variana erorilor aleatoare (variabilelor de perturbaie) (variana modelului)


Se calculeaz suma ptratelor reziduurilor.
SSE = ( y i y i ) = ei2 =e T e = y T y T X T y =

29135

= 57 420 003 (300,28 0,74198 8,04356 ) 62905821


247934

e T e =1976,85574
2
SSE
eT e
ei
,
2 = s e2 =
=
=
n ( k + 1) n (k + 1) n (k + 1)
unde k = numrul de variabile independente din model.
1976,85574
2 = s e2 =
= 164,7379
15 3
s e = 164,7379 = 12,835

c) S se estimeze matricea de covarian a estimatorilor parametrilor modelului


Matricea de covarian a vectorului estimatorilor este:
= Var ( ) = 2 ( X T X ) 1
Variana reziduurilor este un estimator nedeplasat al varianei perturbaiilor aleatoare.
Un estimator al matricei de covarian a vectorului estimatorilor este:
= Var ( ) = s 2 ( X T X ) 1

6133,650 3,70794 220,20634

= 3,70794 0,00226 0,13705

220,20634 0,13705 8,90155

Elementele de pe diagonala acestei matrici sunt varianele estimatorilor j . Avem:

Var ( 1 ) = 0,00226 se( 1 ) = 0,00226 = 0,04753


Var ( 2 ) = 8,90155 se( 2 ) = 8,90155 = 2,98354
Var ( ) = 6133,650 se( ) = 6133,650 = 78,31763
0

d) S se testeze semnificaia statistic a coeficienilor de regresie (nivel de semnificaie = 0,05 ;


valoare tabelar: 2,179)
Testarea semnificaiei statistice a parametrului pant 1
H 0 : 1 = 0 (parametrul pant 1 nu este semnificativ statistic)
H 0 : 1 0 (parametrul pant 1 este semnificativ statistic)
0 0,74198
t calc = 1
=
= 15,61077
se( 1 ) 0,04753
t tab = t / 2;n3 = t 0, 025;12 = 2,179
Deoarece t calc > t tab respingem H0 acceptm H1 parametrul 1 este semnificativ statistic la
pragul de semnificaie de 5%.
Determinarea unui interval de ncredere 95% pentru 1
0,74198 ( 2,179)(0,04753)
Coefficients
300,28625
0,74198
8,04356

Standard Err
78,31763
0,04753
2,98354

t Stat
3,83421
15,61077
2,69598

Lower 95%

Upper 95%

0,6384

0,8455

e) S de calculeze coeficientul de determinaie (R Square) i Adjusted R Square.


SSR
SSE
.
R2 =
=1
SST
SST
Datele necesare calculrii coeficientului de determinaie, R2 sunt:
2
SST = ( y i y ) = y i2 ny 2 = y T y ny 2 =830 121,333
SSE = ( y y ) 2 = e 2 = e T e = y T y T X T y =1976,855
i

SSR = SST SSE = X T y ny 2 =828 144,478


T

R 2 =0,9976 Rezult c 99,76% din variaia cheltuielilor de consum, n perioada studiat de 15

ani, este explicat prin cele 2 variabile exogene.


SSE /( n k 1)
SSR / k
R 2 = 0,9972
R2 =
=1
SST /( n 1)
SST /( n 1)

f) Folosind Analiza Dispersional, s se testeze validitatea modelului de regresie (nivel de


semnificaie = 0,05 ; valoare tabelar: 3,89)
n cazul unui model de regresie linar multipl tabelul cu Analiza varianei este:
Sursa de
variaie
Regresia
Eroarea
Total

Suma ptratelor
abaterilor (SS)
SSR
SSE
SST

Numr grade
de libertate
k
n-(k+1)
n-1

Media ptratelor
(MS)
MSR=SSR/k
MSE=SSE/(n-k-1)

Statistica F

F=MSR/MSE

Testarea validitii modelului de regresie:


H 0 : 1 = 2 = 0 (modelul nu este valid statistic)
H 1 : nonH 0 ( () j 0, j = 1,2 ) (modelul este valid statistic)
Statistica folosit pentru testul semnificaiei reunite a variabilelor explicative este:
SSR / k
( T X T y ny 2 ) / k
= T
~ F ;k , n k 1
F=
SSE /(n k 1) ( y y T X T y ) /(n k 1)

Rc : Fcalc > F ;k , n k 1
Ftab = F ;k ,n k 1 = F0, 05; 2,12 = 3,89
Fcalc = 2513,52 .
Deoarece Fcalc > Ftab respingem H0 acceptm H1 modelul este valid statistic la pragul de
semnificaie de 5%.

g) S se previzioneze valoarea media a variabilei endogene i apoi o valoare individual a


acestei variabile, pentru valorile cunoscute ale variabilelor exogene: x10 = 2610 iar x 20 = 16
A) Predicia mediei
Se d vectorul x0T = (1, x10 , x 20 ) T

1 1


Cunoatem vectorul x 0 = x10 = 2610 .
x 16
20

Dorim s previzionm E ( y | x 0T ) = 0 + 1 x10 + 2 x 20 = x 0T

300,286

Un estimator pt E ( y | x ) = x este y 0 = x = (1 2610 16 ) 0,74198 = 2365,55


8,04356

Variana prediciei mediei este


Var ( y 0 | x 0T ) = s e2 x 0T ( X T X ) 1 x 0 =48,6426 se( y 0 | x 0T ) =6,9744
T
0

T
0

T
0

Un interval de ncredere 95% pentru E ( y | x 0T ) = x 0T este de forma y 0 t crt se( y 0 )

B) Predicia unei valori individuale


Se d vectorul x 0T = (1, x10 , x 20 ) T
Valoarea real a lui y este y 0 = ( y 0 | x 0 ) = x 0T + 0
Valoarea previzionat este y = x T
0

Cunoatem vectorul x 0 = (1 2610 16 ) . Dorim s previzionm ( y 0 | x 0T ) = x0T


T

Un estimator pentru y 0 este, i n acest caz:

300,286

y 0 = x = (1 2610 16 ) 0,74198 = 2365,55


8,04356

Variana erorii de previziune, n cazul prediciei individuale este


Var ( y 0 y 0 | x 0T ) = s e2 [1 + x 0T ( X T X ) 1 x 0 ] =213,3806 se( y 0 y 0 ) =14,6076
Un interval de ncredere 95% pentru y 0 este de forma y 0 t crt se( y 0 y 0 )
T
0

h) Verificai rezultatele obinute utiliznd Excel i Eviews.

Se vor importa 3 serii de date, cu Upper-left data cell: A3.