Documente Academic
Documente Profesional
Documente Cultură
Unitatea de învăţare 11
TESTAREA IPOTEZELOR MODELULUI LINIAR DE REGRESIE - I
Cuprins:
– măsurată prin cele două dispersii – diferă semnificativ şi, deci, se poate trece
la discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu
modelul real.
yˆ : y yˆ
2
y
2
s y2 / x
F i i i
su2 k n k 1
Regula de decizie:
Dacă Fcalc≤ Fα,k,n-k-1, atunci se acceptă H0 şi deci modelul nu este semnificativ
statistic;
Dacă Fcalc> Fα,k,n-k-1, atunci se respinge H0 şi se acceptă H1, deci modelul este
semnificativ statistic (valid).
Coeficientul de determinare
V x2 Vu2
R 2
y/x 2 1 2
V0 V0
Raportul de corelaţie
V x2 V u2
R y / x R y2 / x 1
V 02 V 02
0 x şi y sunt independente
corelatieslabă
Ry / x 0,5
corelatie puternică
1 corelatiedeterministă - y este corelat strict cu x
Testarea semnificaţiei unui model econometric se poate face tot cu testul „F”, dar,
pornind de la valoarea raportului de corelaţie, R y / x , sau a coeficientului de determinare,
R y2 / x :
s y2 / x V x2 V u2 R2 n k 1
Fcal :
s u2 k n k 1 1 R 2 k
Astfel:
n k 1 R 2
- dacă Fcal F ;v 1 k ;v 2 n k 1 R y / x 0 se renunţă la
k 1 R 2
modelul econometric obţinut;
n k 1 R 2
- dacă Fcal F ;v 1 k ;v 2 n k 1 R y / x 0 se trece la discuţia
k 1 R 2
econometrică a ecuaţiei analizei variaţiei – V 02 V x2 V u2 .
R a 1
n 1
n k
1 R 2
pătratică s Yˆ * :
n v
P Yˆn* v t ;v sYˆ * y n v Yˆn* v t ;v sYˆ * 1
nv nv
unde:
- y n +v = valoarea reală a variabilei y în momentul de prognoză ( n v );
- Yˆn v estimaţia punctuală a valorii de prognoză pentru variabila y, care se
Yˆ nv b̂ 0 b̂ 1 x n v ,1 b̂ 2 x n v , 2 b̂ k x n v , k
Yˆ n*v X v B̂ X v X X
1 X Y
unde:
1
x n v , 1
Xv x n v , 2 = vectorul coloană a valorilor de prognoză ale variabilelor x j pentru
x n v , k
momentul ( n v ).
- t;v = variabila aleatoare Student (sau variabila normală z, dacă n>30), preluată din
tabelul distribuţiei respective, în funcţie de pragul de semnificaţie şi de numărul gradelor
de libertate v = n –k - 1 ;
-s
Yˆ nv
s2
Yˆ nv
s u2 1 X v
'
X X
' 1
X v reprezintă abaterea de prognoză a
variabilei endogene Y, care exprimă eroarea de previziune.
homoscedastice şi nu heteroscedastice D 2 ( u1 ) D 2 ( u 2 ) D 2 ( u n ) u2 ;
În afara acestor ipoteze care sunt aceleaşi şi în cazul unui model multifactorial, există
o ipoteză specifică modelului multifactorial şi anume:
I5: Variabilele exogene Xj sunt independente între ele, formând un sistem de vectori
liniari independenţi. În caz contrar, apare fenomenul de multicoliniaritate, care implică
imposibilitatea calculării matricei inverse(X’X) –1, precum şi a estimării parametrilor.
y t y 3 y y 3 y y t y 3 y
unde:
x t x
2
x
n
y t y
2
y
n
Dacă valorile acestor variabile aparţin intervalelor x t x 3 x şi y t y 3 y ,
û û
x x
sau, în cazul modelului multifactorial care cuprinde două variabile exogene, x1 şi x2, relaţia
anterioară devine (între paranteze este trecut termenul încrucişat, regresia putându-se efectua
cu sau fără acesta):
uˆi2 0 1x1i 2 x2i 3 x12i 4 x22i 5 x1i x2i i (11.5.2)
şi calcularea coeficientului de determinare, R2, corespunzător acestei regresii auxiliare;
- verificarea semnificaţiei parametrilor modelului nou construit, iar dacă unul dintre
aceştia este nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptată.
Există două variante de aplicare a testului White:
- utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza nulităţii parametrilor,
respectiv: H0: 0 1 2 0 ;
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt nesemnificative
( Fc F ;v1 ;v2 ), este acceptată, atunci ipoteza de homoscedasticitate se verifică, cazul contrar
An 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Investiţii
15424,9 24998,5 53540,1 67919,9 96630,4 151947,2 241153,6 322836 422535,1 526555,8
(mld. lei)
Rata
dobânzii 36,5 38,1 51,6 38,3 45,4 32,4 26,2 18,4 10,8 11,3
(%)
yˆ t 554842,3 11731,01 xt
LM n R 2 10 0,2659 2,66
300000
200000
100000
0
-100000 0 10 20 30 40 50 60
-200000
Rata dobanzii
Figura 3
ŷ t â b̂x t (11.5.5)
y a bx u (11.5.6)
________________
(11.5.4) – (11.5.6) y t y b ( x t x ) u t (11.5.7)
y t* y t y y t* b x t* u t
Notând cu:
x t* x t x Yˆt * bˆ x t*
n
F bˆ min y t* Y t *
t 1
2 min tn1y t* bˆ x t* 2
şi calculul derivatei parţiale a funcţiei:
F ' (bˆ) 0 2 y t* bˆ x t* x t* 0 u t x t x 0 covu t , x t 0
u2 1 u2
1
u2 2 u2
2
……………. (11.5.8)
u2 n u2
n
exogene x, adică:
u u x1
1
u u x2
2
…………… (11.5.10)
u u xn
n
Dar relaţia (11.5.11) este echivalentă cu aplicarea M.C.M.M.P. modelului iniţial, după
ce, în prealabil, a fost împărţit la xt:
yt 1 u
yt a bxt u t |: xt a b t
xt xt xt
2 2
n u n y 1 (11.5.12)
min F ( â , b̂ ) min t min t â b̂
t 1 t
x t 1 t
x x t
1 yt 1 yt
x x x x
2 2
bˆ t t t t
1 1
2
n 2
xt xt
(11.5.14)
y 1
x t2 x
aˆ t
bˆ t
1 1
x2 x2
t t
aplicată regresia ponderată asupra datelor iniţiale, care vor fi împărţite la xi , rezultând
yi a1 ui
astfel un model de forma: b1 xi .
xi xi xi
2)
ût
yt
Figura 4
Grafic, autocorelaţia erorilor se manifestă fie printr-un număr foarte mic sau foarte
mare de schimbări ale semnului variabilei aleatoare, fie ca urmare a unor schimbări simetrice
(o oscilaţie regulată a valorilor variabilei reziduale faţă de valorile lui y ).
û t û t 1
n 2
d t 2 n
(11.6.2)
2
û t
t 1
Această valoare empirică ,„d”, se compară cu două valori teoretice, d1 şi d2, preluate
din tabelul distribuţiei Durbin-Watson în funcţie de un prag de semnificaţie , arbitrar ales,
( = 0,05 sau = 0,01), de numărul de variabile exogene (k) şi de valorile observate
n, n 15 .
n n n
d t 2 t 2
n
t 2
uˆ
2
t
t 1
n n n
Pentru un n suficient de mare, cele trei sume, uˆ t , uˆ t21 , uˆ t , fiind aproximativ
2 2
t 2 t 2 t 1
uˆ uˆ t t 1
d 22 t 2
n 1
uˆt 1
2
t
uˆ uˆ t t 1
Se notează cu: r1 t 2
n 1
coeficientul de autocorelaţie de ordinul 1 a reziduurilor
uˆ
t 1
2
t
ut.
d 2 1 r 1 r 1 1
d
2
(11.6.3)
d [0,4]
cu semnificaţia:
1 autocorelare strict negativă 4
indecizie
r1 0 independenţă d 2
indecizie
1 autocorelare strict pozitivă
0
Exemplu – continuare
Residuals 30000
-55000
-20000 45000 145000 245000 345000 445000
-70000
-120000 Investitii
Figura 5
Deoarece graficul punctelor empirice prezintă o distribuţie oscilantă, se poate accepta
ipoteza de independenţă a erorilor, respectiv erorile nu sunt corelate.
uˆ uˆt 1
2
t
d t 2
n
1,85
uˆ
2
t
t 1
d
variabilelor reziduale, I3, nu poate fi acceptată ( r1 0 , r1 1 ), aceasta presupune o
2
autocorelare de ordinul întâi a erorilor, respectiv:
uˆt r(1) uˆt 1 zt (11.6.8)
u u t t 1
r(1) t 2
n 1
u t 1
2
t
unde: ( yt r(1) yt 1 ) reprezintă diferenţele teoretice (ajustate) de ordinul întâi ale variabilei
Procedeul prin baleiaj constă în atribuirea de valori lui r(1) în intervalul [0,1]
autocorelare pozitivă, sau între [-1,0] autocorelare negativă.
De exemplu, în cazul unei autocorelări pozitive, i se atribuie lui r(1) următoarele valori:
r(1) 0,1 zt2 = 1,75;
r(1) 0,2 zt2 = 2,75;
r(1) 0,3 zt2 = 3,75.
Deci minimul se situează în intervalul [0,2; 0,3].
Se dau apoi valori lui r = 0,21; 0,22;…0,27, oprindu-ne la valoarea pentru care se obţine
min zt2. Pentru această valoare se păstrează estimatorii â şi b̂ obţinuţi în acest caz.
model se verifică dacă s-a eliminat sau nu autocorelaţia erorilor. În caz contrar, se continuă
procedeul până când se atinge acest deziderat.
e) Procedeul Durbin
y t aˆ bˆxt r(1) ( y t 1 aˆ bˆxt 1 ) z t
I. Se consideră modelul:
yt = a + bxt + ut
În urma prelucrării electronice a calculelor econometrice privind modelul de mai sus s-au
obţinut următoarele rezultate:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,6809
R Square
Adjusted R Square 0,4223
Standard Error 7,5104
Observations 15
ANOVA
Significance
df SS MS F F
Regression … 633,6594 … … 0,0052
Residual … … 56,4057
Total 14 …
Standard Upper
Coefficients Error t Stat P-value Lower 95% 95%
Intercept -8,5185 … -0,6355 0,5361 -37,4749 …
X Variable 1 0,1812 0,0541 … 0,0052 … 0,2981
Durbin – Watson Statistics = 1,54 ( d1 = 1,08; d2 = 1,36)
F (White Heteroskedasticity Test) =2,03 (Critical F (White Heteroskedasticity Test) = 3,88)
Se cere:
1) Să se verifice semnificaţia parametrilor modelului, să se interpreteze valorile
acestora şi să se determine intervalele de încredere corespunzătoare acestora (Critical t = 2,16);
2) Să se completeze tabelul ANOVA şi să se verifice validitatea modelului de regresie
pentru un prag de semnificaţie de 5% (Critical F = 4,67);
3) Să se verifice ipotezele de independenţă a erorilor şi de homoscedasticitate a
erorilor.
4) Ştiind că în perioada imediat următoare xt+1 = 20 să se estimeze yt+1 pe baza unui
interval de încredere.
II. În urma prelucrării datelor a rezultat următorul model econometric (n = 15):
yˆ t 4,0840 0,9411x1t 0,1124x 2t
4,8906 0,0934 0,0468
R2 0,992; d 1,67; F White heteroskedasticity Test 2,44; su 1,9313.
yˆ t 15,5970 1,1532x1t
1,1229 0,0355
R 2 0,989; d 1,30; F White heteroskedasticity Test 2,038; su 2,2576.