Documente Academic
Documente Profesional
Documente Cultură
ECONOMETRIE
Analiza prin regresia
multipla
Ref: Mns Sderbom, Universitatea Gothenburg
Damodar Gujarati, Basic Econometrics
Modelul cu m variabile
independente
Modelul regresiei multiple:
y 0 1 x1 2 x2 .... m xm u
3.6
unde
0 este parametrul liber
1 este parametrul asociat cu x1 (masoara
modificarea lui y in functie de x1, mentinand
ceilalti factori ficsi)
2 este parametrul asociat cu x1 (masoara modificarea
lui y in functie de x2, mentinand ceilalti factori
7
ficsi)
Modelul cu m variabile
independente
y 0 1 x1 2 x2 .... m xm u
x1,x2,,xm
Variabil dependent
Variabile independente
Variabil explicat
Variabile explicative
Variabil de rspuns
Variabile de control
Variabil predicionat
Variabile predictoare
Regresand
Regresori
8
Interpretarea parametrilor
modelului regresiei
multiple
Abilitatea de a interpreta parametrii
10
2 estimatia lui 2
si palaria de pe y inseamna predictia
11 lui y (in
Modelul cu m variabile
independente
y 0 1 x1 2 x2 .... m xm
1 , 2 ,..., m
Estimatiile CMMP
n
minimizeaza:
y
i 1
i 1
14
astfel
i 1
x y
i 1
i1
(...)
x y
n
i 1
im
Interpretarea functiei de
regresie CMMP
stimatiile
Obs
Mean
colGPA
hsGPA
ACT
141
141
141
3.056738
3.402128
24.15603
Std. Dev.
Min
.3723103
.3199259
2.844252
2.2
2.4
16 18
Max
4
4
33
Rezultatele regresiei
. regress colGPA hsGPA ACT
Source
SS
df
MS
Model
Residual
3.42365506
15.9824444
2
138
1.71182753
.115814814
Total
19.4060994
140
.138614996
colGPA
Coef.
hsGPA
ACT
_cons
.4534559
.009426
1.286328
Std. Err.
.0958129
.0107772
.3408221
t
4.73
0.87
3.77
Number of obs
F( 2,
138)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.383
0.000
=
=
=
=
=
=
141
14.78
0.0000
0.1764
0.1645
.34032
.6429071
.0307358
1.960237
Analizati rezultatele
urmatoarei regresii
. reg colGPA ACT
Source
SS
df
MS
Model
Residual
.829558811
18.5765406
1
139
.829558811
.133644177
Total
19.4060994
140
.138614996
colGPA
Coef.
ACT
_cons
.027064
2.402979
Std. Err.
.0108628
.2642027
t
2.49
9.10
Number of obs
F( 1,
139)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
141
6.21
0.0139
0.0427
0.0359
.36557
P>|t|
0.014
0.000
.0055862
1.880604
.0485417
2.925355
Interpretarea ecuatiilor cu
m variabile independente
Cazul cu mai mult de doua variabile
independente este similar.
Spre exemplu, coeficientul lui x1
masoara modificarea lui
cauzata de o
crestere cu o unitate a lui x1, tinand fixe
celelalte variabile independente:
a) Regresie multipla
. ge logwage=ln(wage)
Source
SS
df
MS
Model
Residual
27.5606288
120.769123
1 27.5606288
524 .230475425
Total
148.329751
525
Number of obs
F( 1, 524)
Prob > F
R-squared
Adj R-squared
Root MSE
.28253286
=
=
=
=
=
=
526
119.58
0.0000
0.1858
0.1843
.48008
SS
Coef.
educ
_cons
.0827444
.5837727
Std. Err.
.0075667
.0973358
t
10.94
6.00
P>|t|
0.000
0.000
.0678796
.3925563
.0976091
.7749891
MS
Model
Residual
46.8741776
3 15.6247259
101.455574 522 .194359337
Total
logwage
logwage
df
educ
exper
tenure
_cons
Date: WAGE1.XLS.
.0073299
.0017233
.0030936
.1041904
t
12.56
2.39
7.13
2.73
22
Number of obs
F( 3, 522)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
526
80.39
0.0000
0.3160
0.3121
.44086
P>|t|
0.000
0.017
0.000
0.007
.0776292
.0007357
.0159897
.0796756
.1064288
.0075065
.0281448
.4890435
Matricea de corelatie
. corr educ exper tenure
(obs=526)
educ
exper
tenure
educ
exper
tenure
1.0000
-0.2995
-0.0562
1.0000
0.4993
1.0000
Valorile ajustate si
rezidualele CMMP
25
Proprietati:
1. Media de sondaj a rezidualelor este
zero,y deci
y
2. Covarianta de sondaj dintre fiecare
variabila independenta si
rezidualele CMMP este zero. Atunci,
covarianta de sondaj dintre valorile
ajustate CMMP si rezidualele CMMP
este zero
( x1 ,(de
x2 ,..., ce?)
xm , y )
3. Punctul
este
y o 1 x1 ... m xm
intotdeauna pe dreapta de regresie
26
Comparatie intre
estimatiile regresiei simple
si
multiple
Regresia
simpla :
Regresia multipla:
Stim ca regresia simpla a coeficientului lui
x1 este in general diferita de regresia
multipla a coeficientului lui x1. Iata cum
sunt legati cei doi parametri:
unde
este coeficientul de panta al
regresiei simple a lui x2 pe x1. Cum
se
27
y
1. Efectul partial al lui x2 asupra
2 0
este zero in esantion
si/sau
~
(1 0)
esantion
28
Calitatea ajustarii:
La fel ca in regresia simpla
SST = Total Sum of Squares
SSE = Explained Sum of Squares
SSR = Residual Sum of Squares
29
30
Comparati si interpretati R2
a) Simple regression
a) Multiple regression
. ge logwage=ln(wage)
Source
SS
df
MS
Model
Residual
27.5606288
120.769123
1 27.5606288
524 .230475425
Total
148.329751
525
Number of obs
F( 1, 524)
Prob > F
R-squared
Adj R-squared
Root MSE
.28253286
=
=
=
=
=
=
526
119.58
0.0000
0.1858
0.1843
.48008
SS
Coef.
educ
_cons
.0827444
.5837727
Std. Err.
.0075667
.0973358
t
10.94
6.00
P>|t|
0.000
0.000
.0678796
.3925563
.0976091
.7749891
MS
Model
Residual
46.8741776
3 15.6247259
101.455574 522 .194359337
Total
logwage
logwage
df
educ
exper
tenure
_cons
Date: WAGE1.XLS.
.0073299
.0017233
.0030936
.1041904
t
12.56
2.39
7.13
2.73
31
Number of obs
F( 3, 522)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
526
80.39
0.0000
0.3160
0.3121
.44086
P>|t|
0.000
0.017
0.000
0.007
.0776292
.0007357
.0159897
.0796756
.1064288
.0075065
.0281448
.4890435
Supozitii
Supozitia RLM.1: Lineara in parametrii:
y = 0 + 1x1 + 2x2 ++ u.
Supozitia RLM.2: Esantion aleator:
{xi1, xi2,,xim,y): i=1,2,,n}
urmand modelul populatiei din supozitia RLM.1
Supozitia RLM.3: Nu exista colinearitate
perfecta: In esantion, niciuna din variabilele
independente nu este constanta si nu exista o
relatie lineara exacta intre variabilele
independente.
Supozitia RLM.4: Medie conditionata zero eroarea u are o valoare asteptata zero date
fiind
33
oricare valori ale variabilelor independente:
Precizare: Dependenta
nelineara este in regula!
Teorema 3.1:
Sub RLM.1-4, estimatorii
CMMP sunt nedeplasati
E ( j ) j , j 0,1,..., m
Deplasarea cauzata de
omiterea unei variabile:
cazul
simplu ca omitem o
Sa presupunem
variabila care apartine modelului
adevarat (al populatiei)
Motivul poate fi lipsa datelor (ex.
Abilitatea in regresia venitului)
Aceasta in general cauzeaza ca
estimatorii CMMP sa fie deplasati
Sa studiem deplasarea mai in detaliu
39
Exemplu:
venit 0 1 educ 2 abil u
Modelul adevarat
Modelul estimatvenit 0 1 educ v
undev 2 abil u
Estimatorul1
din aceasta regresie simpla este
~
ceea ce
1 numim
Reprezentam relatia dintre educ si abil printr-o
regresie liniara simpla
abil 0 1 educ
Stim ca:
~ ~
1 1 2 1
Atunci
3.45
Deplasarea (Bias)
Semnul deplasarii
~
deplasarii 1lui
Semnul
cand x2 este
omis in estimarea ecuatiei (3.40)
Corr(x1,x2)
>0
2> Depl.poziti
va
0
2< Depl.negat
iva
0
Corr(x1,x2)
<0
Depl.negat
iva
Depl.poziti
va
43
Cazul
general
Determinarea semnului deplasarii
44
3.4 Variana
estimatorilor CMMP
Vom obine acum variana
estimatorilor CMMP, astfel nct s
dispunem de o mprtiere in
distribuiile lor de sondaj.
Supozitia RLM.5: Homoscedasticitate.
Eroarea u are aceeai varian oricare ar fi
variabilele explicative:
Asta nseamna ca variana termenului de eroare
u, condiionat de variabilele explicative, este
aceeai penru toate valorile variabilelor
explicative.
Daca nu se intampla asta, avem
45
Interpretarea formulei
varianei
Variana estimatorului este mare (ceea
ce de obicei nu este de dorit), dac:
unde
48
SS
df
MS
Model
Residual
3.42365506
15.9824444
2
138
1.71182753
.115814814
Total
19.4060994
140
.138614996
colGPA
Coef.
hsGPA
ACT
_cons
.4534559
.009426
1.286328
Std. Err.
.0958129
.0107772
.3408221
t
4.73
0.87
3.77
Number of obs
F( 2,
138)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.383
0.000
=
=
=
=
=
=
141
14.78
0.0000
0.1764
0.1645
.34032
50
.6429071
.0307358
1.960237
Cateva probleme
Vom lucra pe cel putin doua
probleme (pentru inceput)
52