Sunteți pe pagina 1din 22

ECONOMETRIE

CURS 12
IAI
- 2012 -
IPOTEZE ALE MODELULUI DE REGRESIE I PROBLEME
ALE NCLCRII LOR

Ipoteze asupra componentei aleatoare:
1. Media variabilei reziduale este nul
2. Homoscedasticitatea
3. Normalitatea erorilor
4. Autocorelarea erorilor

Ipoteze asupra componentei deterministe:
1. Coliniaritatea
Testarea ipotezei de
homoscedasticitate
Testarea homoscedaticitatii se poate face cu
ajutorul testelor:
pentru modele simple:
Testul Glejer
Testul corelaiei neparametrice dintre valoarea absolut a
erorilor estimate i variabila independent (Spearman)
Testul Goldfeld-Quandt
pentru modele multiple:
Testul Breusch-Pagan-Godfrey
Testul White
Testul Breusch-Pagan-Godfrey
Plecand de la ipoteza ca exista o legatura multipla liniara intre variabila Y
si variabilele X
1
si X
2
descrisa de relatia: Y=
0
+
1
X
1
+
2
X
2
+, testarea
homoscedasticitatii presupune parcurgerea urmatoarilor pasi:
estimarea parametrilor modelului de regresie liniara multipla:
0
;
1
si
2
pe baza modelului estimat se obtin valorile erorii de modelare;
construirea modelului auxiliar de regresie:
e
i
2
=
0
+
1
X
1
+
2
X
2
+u

se estimeaza raportul de determinatie a modelului auxiliar (R

2
). Pe baza
acestuia se caluleaza valoarea statisticii
2
= n R

2
care va fi comparata cu o
valoare teoretica
2
, k-1
, unde k reprezinta numarul parametrilor din modelul
auxiliar;
prin compararea valorii teoretice cu cea calculata a statisticii
2
se va accepta/
respinge ipoteza de homoscedasticitate a erorilor:


2
<
2
, k-1
=>AH
0
respectiv
2

2
, k-1
=>RH
0
Estimarea parametrilor modelului de baza
SAL salariul curent anual ($) ->Y
SAL
0
salariul anual la angajare ($) -> X
1

ED nivelul educatie (ani de scoala)-> X
2


Forma modelului liniar multiplu de estimat:
SAL =
0
+
1
*SAL
0
+
2
*ED+

Modelul estimat:
SAL = -7808.71415718 +1.67263052172*SAL
0
+
1020.3901421*ED+
Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 27.28751 Prob. F(2,471) 0.0000
Obs*R-squared 49.21954 Prob. Chi-Square(2) 0.0000
Scaled explained SS 245.2163 Prob. Chi-Square(2) 0.0000

Test Equation:
Dependent Variable: ^2
Method: Least Squares
Date: 01/15/13 Time: 20:38
Sample: 1 474
Included observations: 474

Var. Coefficient Std. Error t-Statistic P

0
-1.31E+08 40991028 -3.203380 0.0015
SAL
0
6150.668 1375.365 4.472026 0.0000
ED 6452228 3752366 1.719509 0.0862

R-sq. 0.103839 Mean dependent var 60401068
Adjusted R-sq. 0.100033 S.D. dependent var 1.92E+08
S.E. of reg. 1.82E+08 Akaike info criterion 40.88563
Sum sq. resid 1.56E+19 Schwarz criterion 40.91197
Log likelihood -9686.895 Hannan-Quinn criter. 40.89599
F-statistic 27.28751 Durbin-Watson stat 1.796592
Prob(F-statistic) 0.000000
Testul White
Testul White urmeaza acelasi algoritm ca
in cazul testului Breusch-Pagan-Godfrey,
singura diferenta consta in faptul ca se
utilizeaza o alta forma mult mai complexa a
modelului auxiliar:

e
i
2
=
0
+
1
X
1
+
2
X
2
+
3
X
1
X
2
+
4
X
1
2
+
5
X
2
2
+u

Calculul statisticii
2
si luarea deciziei se
realizeaza ca in cazul testului precedent.
Heteroskedasticity Test: White
F-statistic 11.97360 Prob. F(5,468) 0.0000
Obs*R-sq. 53.75859 Prob. Chi-Square(5) 0.0000
Scaled expl. SS 267.8303 Prob. Chi-Square(5) 0.0000

Test Equation:
Dependent Variable: ^2
Method: Least Squares
Date: 01/15/13 Time: 23:19
Sample: 1 474
Included observations: 474

Variable Coefficient Std. Error t-Statistic Prob.

0
-2.13E+08 1.67E+08 -1.275593 0.2027
SAL
0
13826.12 9771.187 1.414989 0.1577
SAL
0
^2 -0.138886 0.082003 -1.693663 0.0910
SAL
0
*ED 72.27410 765.1561 0.094457 0.9248
ED 9214356. 26870194 0.342921 0.7318
ED^2 -291287.7 1381016. -0.210923 0.8330

R-sq. 0.113415 Mean dependent va 60401068
Adj R-sq 0.103943 S.D. dependent var 1.92E+08
S.E. of reg 1.82E+08 Akaike info criterion 40.88755
Sum sq. res 1.55E+19 Schwarz criterion 40.94022
Log likelihood -9684.348 Hannan-Quinn criter 40.90826
F-statistic 11.97360 Durbin-Watson stat 1.799331
Prob(F-statistic) 0.000000
TESTAREA COLINIARITII (1)
Ipoteza de necoliniaritate presupune c ntre variabilele independente
ale unui model de regresie nu exist o legtur de tip liniar
Probleme:
- identificarea gradului de coliniaritate,
- stabilirea cauzelor nclcrii ipotezei,
- stabilirea efectelor coliniaritii,
- testarea ipotezei de coliniaritate i
- - corectarea modelului n cazul existenei acesteia.
Grade de coliniaritate:
1. Coliniaritate perfect dac exist p constante , nu toate nule,

2. Coliniaritate imperfect dac are loc relaia:

unde u este o variabil aleatoare care respect ipotezele modelului
clasic de regresie.
0 X ... X X
p p 2 2 1 1
= + + +
0 u X ... X X
p p 2 2 1 1
= + + + +
TESTAREA COLINIARITII (2)
Identificarea coliniaritii
Testarea coeficienilor de regresie n cazul unui model cu un
coeficient de determinaie ridicat (de obicei peste 0.8).
Dac coeficienii de regresie sunt nesemnificativ diferii de zero, atunci
ipoteza de necoliniaritate este nclcat.
Testarea coeficienilor de corelaie bivariai pentru variabilele
independente din modelul de regresie
Dac aceti coeficieni au valori ridicate (de regul, peste 0.8), atunci
exist posibilitatea coliniaritii ntre variabilele independente.
Estimarea i testarea parametrilor modelelor de regresie auxiliar
dintre variabilele independente .
Ipoteza de necoliniaritate este nclcat dac aceti coeficieni de
regresie sunt semnificativ diferii de zero.
Detectare a coliniaritii pe baza a doi indicatori (utilizati n SPSS):
- Tolerance
- VIF (Variance Inflation Factor).
TESTAREA COLINIARITII (3)
10,00 8,00 6,00 4,00 2,00 0,00
X1
20,00
15,00
10,00
5,00
0,00
X
2
R Sq Linear = 1
Figura 1. Reprezentarea grafic a coliniaritii
perfecte dintre dou variabile independente, X
1
i X
2
TESTAREA COLINIARITII (4)
14,00 12,00 10,00 8,00 6,00 4,00 2,00 0,00
X1
20,00
15,00
10,00
5,00
0,00
X
2
R Sq Linear = 0,902
Figura 2. Reprezentarea grafic a coliniaritii imperfecte
dintre dou variabile independente, X1 i X2
TESTAREA COLINIARITII (5)
Matricea corelaiilor - arat valoarea coeficienilor de
corelaie dintre variabile, considerate dou cte dou.
Valori ridicate ale coeficienilor de corelaie, mai mari de
0.8, arat existena coliniaritii puternice ntre variabilele
independente.
Exemplu: Cor relations
1 ,161 -,213
,566 ,446
15 15 15
,161 1 -,494
,566 ,061
15 15 15
-,213 -,494 1
,446 ,061
15 15 15
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
X1
X2
X3
X1 X2 X3
TESTAREA COLINIARITII (6)
Indicatorul Tolerance se definete prin relaia:



este raportul de determinaie din modelul de
regresie auxiliar, construit pe baza variabilelor
independente, n care variabila j este
considerat variabila dependent, iar celelalte
variabile factoriale sunt considerate variabile
independente.

Dac TOL = 1, nu exist coliniaritate, iar dac TOL = 0 suntem n situaia
extrem, de coliniaritate perfect.

( )
2
1
j j
R TOL =
2
j
R
TESTAREA COLINIARITII (6)
Indicatorul VIF (Variation Inflation Factor) se definete prin relaia:



Lipsa coliniaritii d o valoare VIF = 1
Existena coliniaritii determin o valoare mare a indicatorului, n cazul unei
coliniariti perfecte avem relaia


n practic, se consider c o valoare VIF>10 (dupa alti autori VIF>5) indic
prezena coliniaritii.
2
1
(1 )
j
j
VIF
R
=

2
1,
j
R VIF =
Exemplu: n urma analizei legturilor dintre variabilele
independente ale unui model de regresie, s-au obinut urmtoarele
rezultate:









TESTAREA COLINIARITII (9)
Coefficients
a
5.787 1.773 3.263 .001
2.459 .104 .558 23.623 .000 .904 1.106
-.059 .190 -.008 -.309 .757 .835 1.198
.115 .018 .154 6.263 .000 .831 1.203
(Constant)
Highest Year of
School Completed
Number of Children
Age of Respondent
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: R's Occupational Prestige Score (1980)
a.
Exemple
Pentru ecuaia Y = 0 + 1D1 + 2D2 sunt
valabile urmtoarele afirmaii:
a) este ecuaia corespunzatoare unui model
ANOVA
b) este ecuatia corespunztoare unui model
ANCOVA
c) D1 i D2 sunt variabile distribuite normal
d) D1 i D2 pot apare ca urmare a construirii
unui model de regresie ntre Y i o variabil
nominal cu trei categorii



Testul Fisher poate fi utilizat pentru:
Verificarea ipotezei de homoscedasticitate
verificarea semnificaiei raportului de corelaie
verificarea ipotezei de multicoliniaritate a variabilelor independente
verificarea corectitudinii modelului de regresie ales

Prin autocorelare nelegem c
variabilele independente X
i
din model sunt corelate ntre ele
erorile de modelare nu sunt independente
erorile de modelare sunt corelate cu una sau mai multe variabile
independente

O agenie imobiliar efectueaz un studiu privind influena pe care o are
Suprafaa apartamentelor (X) i a Vechimea apartamentelor (Apartamente noi,
Apartamente vechi (D1) i Apartamente foarte vechi (D2)) asupra Preul de
vnzare a apartamentelor.






Rezultatele modelrii sunt prezentate n tabelul
de mai sus. Se poate considera c:
modelul prezentat este un model de tip ANCOVA
modelul prezentat este un model de tip ANOVA
apartamentele vechi nu determin diferene semnificative de pre
fa de apartamentele noi
Apartamentele vechi costa mai mult cu 8326.245 lei decat cele
foarte vechi

Pentru un eantion de 20 de angajai ai unei firme s-au nregistrat vechimea la locul
actual de munc (ani), sexul persoanei i venitul familiei angajatului (mil.). n urma
modelrii celor trei variabile a rezultat tabelul de mai jos. Pe care dintre urmtoarele
afirmaii le considerai ca fiind corecte?





Vechimea angajailor de sex masculin este mai mare, n
medie, dect cea a angajailor de sex feminin cu 0,493 ani
Vechimea medie a angajailor de sex feminin este de 6,335
ani, in conditiile unui venit nul
ntre vechimea angajailor i venitul familiei acestora exist o
legtur direct

Coefficients
a
6.335 .325 19.473 .000
-.493 .198 -.025 -2.489 .013
.072 .001 .579 56.829 .000
(Constant)
sexul persoanei
venitul f amiliei
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Vechimea la locul actual de munca
a.
n urma modelrii Acceleraiei autoturismelor n funcie de Puterea motorului printr-un
model compus a rezultat o eroare de modelare pentru care am obinut urmtorii indicatori
statistici descriptivi:







Pe baza datelor din tabel alegei afirmaiile
adevrate:
media nu difer semnificativ de zero
distribuia erorilor nu este normal
distribuia seriei este autocorelat
Statistics
Unstandardized Residual
1415
102
-.0030732
.29692224
11.16917
.005
.065
-.248
.130
Valid
Missing
N
Mean
Std. Error of Mean
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
n urma modelrii Salariului n funcie de Vechime, pentru verificarea ipotezelor
de regresie s-a obtinut rezultatul de mai jos. Pentru un risc asumat de 5%, care
dintre urmatoarele afirmatii sunt adevarate?
Erorile sunt homoscedastice
Variatia erorii de modelare este influentata semnificativ de
variatia variabilei Vechime
Variantele erorii de modelare sunt egale si constante
Modelul este heteroscedastic

Coefficients
a
65.656 1.429 45.931 .000
-2.034 .126 -.418 -16.126 .000
(Constant)
Vechime
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Erorile in valoare absoluta
a.

S-ar putea să vă placă și