Documente Academic
Documente Profesional
Documente Cultură
y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
x1
17
19
15
21
19
24
26
24
26
21
24
26
30
26
x2
3
2
4
7
8
9
9
6
6
9
5
10
13
8
42
40
40
44
39
38
29
30
38
35
29
28
32
26
x3
115
126
148
139
123
150
126
141
122
157
155
166
168
174
yt1
yt2
18
17
18
19
23
23
27
24
22
24
23
27
28
26
18
17
19
20
22
23
26
24
21
24
23
27
28
26
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.838264
R Square
0.702687
Adjusted R
0.613493
Square
Standard Error
2.597069
Observations
14
ANOVA
df
Regression
3
Residual
10
Total
13
Coefficient
s
Intercept
35.72254
X Variable 1
0.801901
X Variable 2
-0.38136
X Variable 3
-0.03713
SS
159.4095
67.44767
226.8571
Standard
Error
10.9942
0.298436
0.156581
0.052023
MS
F
53.13649 7.878181
6.744767
t Stat
P-value
Significance F
0.005452
Lower 95%
3.249218 0.008732
2.687012 0.022816
-2.43556 0.035114
-0.71377 0.491694
Upper 95%
11.22594
0.136944
-0.73025
-0.15305
60.21914
1.466857
-0.03248
0.078782
i
a) Raia Student pentru fiecare coeficient de regresie, calculat dup formula t a , se
a
i
/ 2 0.025
compar cu valoarea teoretic Student pentru =5% i 10 grade de libertate, t10 grd .lib. 2.228 .
t a 2.687 2.228 , rezult c a1 0 , variabila x1 contribuie la explicarea variaiei variabilei y;
1
a 2
y;
variabilei y, i poate fi retras din model. Se poate vedea n tabele de regresie din Tabelul 2.5 c
P-value pentru estimatorul a 3 , indic un prag de semnificaie de 49%, care este mult prea mare.
Intervalul de ncredere al coeficientului ai se stabilete n funcie de valoarea
estimatorului, estimaia abaterii sale i valoarea teoretic Student pentru un prag de semnificaie
/2
/2
ales, de obicei =5%: ICa i [a i ai t grd .lib. ; a i ai t grd .lib. .
Intervalele de ncredere pentru cei trei estimatori ai coeficienilor variabilelor explicative sunt:
ICa1 : 0.137;1.467 , semnul + indic legtura direct dintre y i x1;
ICa 2 : 0.730;0.032 , semnul - indic legtura invers dintre y i x2 (Figura 2.17);
ICa3 : 0.153;0.079 , se schimb semnul de la - la +, a 3 poate lua valoarea 0, nu este
semnificativ diferit de 0. Numai variabilele x1 i x2 sunt variabile exogene semnificative.
Pentru noul model cu dou variabile explicative, se obine tabela de regresie prezentat n
Tabelul 2.6. Valorile teoretice calculate cu acest model: y t 29.143 0.715 x 0.328 x 2 se af
n Tabelul 2.4 i pe graficul din Figura 2.19.
Se poate observa c acest model are coeficienii semnificativ diferii de 0, dup cum
indic raiile Student calculate, care sunt mai mari dect valoarea teoretic din tabela Student,
valorile P-value, care sunt mai mici dect 5%, precum i intervalele de ncredere ale
coeficienilor, care nu schimb semnul de la limita inferioar la cea superioar, deci nu conin
valoarea 0.
ICa 0 : 16.25;42.03 ,
ICa1 : 0.129;1.301 ,
Intervalele
de
ncredere
sunt:
ICa 2 : 0.624;0.032 .
Coeficientul de determinaie de 68.7% indic validitatea modelului liniar, iar coeficientul de
corelaie multipl de 0.83 indic o corelaie puternic ntre cele trei variabile y, x1 i x2.
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.82918
R Square
0.68754
Adjusted R
0.630729
Square
Standard Error
2.538501
Observations
14
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
X Variable 2
2
11
13
Coefficient
s
29.1429
0.714896
-0.32811
SS
MS
Significanc
eF
0.001665
Lower 95%
16.25317
0.128853
-0.62428
Upper
95%
42.03263
1.300939
-0.03195
H0: a1=1
H1: a1<1
Testul este unilateral la stnga, iar valoarea teoretic Student pentru 10 grade de libertate
i =5%, este 1.81. Presupunnd adevrat ipoteza nul, raportul critic sau raia Student
a 1
1
calculat, devine: t a
a
1
0.80 1
0.68 1.81 . Se accep ipoteza nul, coeficientul a1
0.298
H0:
a 2 0.5
a1 1
H1:
a 2 0 .5
Valoarea q = 2 reprezint numrul coeficienilor supui testrii. Vectorul estimatorilor este
0.80
a q
0.38
a 3
a 2
-0.47956
0
a
0
a
120.87236
1
a
-0.00133
-1.47229
1
a
a 2
-0.00133
-1.47229
0.08906
0.00806
0.00806
0.02452
-0.00634
0.00388
a 3
-0.47956
-0.00634
0.00388
0.00271
0.08906
0.00806
0.00806
0.02452
1 :
Se calculeaz
aq
f
Vectorul (a q aq ) este
11.57181
-3.802262
-3.802262
42.03652
0.80 1
0.80 1
0.20
.
0.38 (0.5)
0.38 0.5
0.12
(
a
a
)
Vectorul q
este 0.80 1
q
Statistica F
1
1 (a a f ) 1 0.2
( a q a qf )
aq
q
q
q
2
0.12 .
11.572
3.802
0.12
3.802 0.2
0.612
42.036 0.12
.
Valoarea Fisher calculat se compar cu o valoare teoretic pentru q=2 i n-k-1=10 grade de
0.05
libertate, F( q , n k 1) F( 2,10 ) grd .lib. 4.10 . Cum 0.612<4.10, se accept ipoteza nul H0, adic
cei doi coeficieni pot avea simultan valorile 1 i -0.5. Aceast concluzie se poate verifica privind
intervalele de ncredere, care conin cele dou valori testate.
d) Pentru a stabili intervalul de ncredere al varianei erorilor se citesc cele dou valori 12 i
22 , pentru 10 grade de libertate i pentru =5%, astfel: 12 pentru /2=0.025 este 20.4831 i
22 pentru (1-/2)=0.975 este 3.24697.
(n k 1) 2 (n k 1) 2
;
,
2
2
1
2
2
Intervalul de ncredere al varianei erorilor este IC ( )
10 6.745 10 6.745
;
3.30;20.75 . Cu o probabilitate de 95%, variana
20.4831 3.24697
2
adic IC ( )
Sum de ptrate
(Sum of Squares) SS
n
2
SSE= ( y t y )
Grade de
libertate
(degrees
freedom) df
k
(Modified
Sums) MS
SSE/k
n-k-1
SSR/(n-k-1)
n-1
Testul Fisher F
t 1
n
2
SSR= ( yt y t )
SSE / k
SSR /( n k 1)
t 1
n
2
SST= ( yt y )
t 1
df
2
11
13
SS
155.9733
70.88389
226.8571
MS
77.98663
6.44399
F
12.10223
Significance F
0.001665
SSE / k
12.10 se compar cu o valoare
SSR /(n k 1)
teoretic Fisher cu 2 i 11 grade de libertate, care pentru un prag de semnificaie =5% este
global semnificativ, modelul este bine construit. Valoarea calculat F* corespunde unui prag de
semnificaie de 0.16%, mult mai mic dect 5%.
i regresia prezentat n Tabelul 2.5, cu trei variabile explicative, este global
5%
semnificativ pentru c F3,10 3.71 , iar valoarea calculat F*=7.87>3.71, pentru un prag de
semnificaie de 0.54%.
Numai cnd modelul are termen constant, F* se poate scrie n funcie de coeficientul de
SSE
, se poate exprima SSE SST R 2 , iar SSR se poate
SST
SSR
2
2
exprima n funcie de coeficientul de nedeterminaie N 1 R
, SSR SST (1 R 2 ) .
SST
2
determinaie R2. Din relaia R
nlocuind n formula statisticii F*, valorile astfel exprimate SSE i SSR, se simplific cu
SST i rmne astfel: F *
R2 / k
.
(1 R 2 ) /(n k 1)
SSE
.
SST
Dac R 2 1 nseamn variana total SST, este aproape n ntregime explicat SSE, modelul
este bine ales. Coeficientul de determinaie multipl: R R 2 , arat intensitatea corelaiei
simultane a variabilelor explicative asupra variabilei dependente y.
Problema este dac modelul se poate considera ca fiind stabil pe ntreaga perioad sau
este mai bine s se considere dou subperioade distincte de estimare? Specificarea modelului
este aceeai, dar valorile coeficienilor pot fi diferite.
Verificarea stabilitii coeficienilor const n a testa dac exist o diferen semnificativ
ntre variana neexplicat SSR pe ansamblul perioadei i suma varianelor neexplicate pe cele
dou subperioade SSR1 + SSR2? Dac rspunsul este negativ, nseamn c divizarea pe
subperioade nu mbuntete calitatea modelului, modelul iniial este stabil pe ntreaga perioad.
n caz contrar se declar modelul ca fiind instabil i este mai bine s se estimeze pe subperioade.
Testul de ipoteze este:
1
2
0
Se calculeaz valoarea Fisher, considernd n1, numrul de observri n prima subperioad i n2,
numrul de observri n a doua subperioad, iar suma lor n1 n2 n , este numrul total de
observri din modelul iniial:
[ SSR ( SSR 1 SSR 2 )] /[(n k 1) ( n1 k 1) (n 2 k 1)]
F*
Gradele de liberate de la numrtor se obin scznd gradele de libertate ale modelului iniial din
gradele de libertate ale modelului restricionat: (n k 1) (n k -1) = k k.
SS
MS
F
117.6589 117.6589 12.92975
109.1983 9.099855
226.8571
Standard
t Stat
P-value
Error
2.1469
7.2472 1.02E-05
0.2814
3.5958 0.003674
Significance F
0.003674
Lower 95%
Upper 95%
10.8816
0.3987
20.2371
1.6249
3.09
SSR /(n k 1)
67.448 /(14 3 1)
Fk k 1 ,n k 1 F31,514%31 F2,105% 4.10
F*
Cum 3.09 < 4.10, rezult c se accept ipoteza nul H0, adugarea variabilelor x2 i x3 nu
este important. Introducerea acestor variabile nu contribuie semnificativ la mbuntirea
calitii ajustrii.
S-a discutat deja mai sus, i se poate vedea n tabela de regresie din Tabelul 2.5, c
variabila x3, nu este semnificativ, deoarece raia sa Student este mai mic dect valoarea
teoretic, fapt care a condus apoi la excluderea sa din model. Este interesant s se analizeze dac
introducerea unei singure variabile suplimentare, i anume x2, mbuntete calitatea ajustrii.
Se vor parcurge aceeai pai, ca cei prezentai mai sus:
- calculul varianei totale, a celei explicate i a celei reziduale pentru modelul cu dou variabile
explicative, x1 i x2:
SSE=155.973
SSR= 70.884
SST=226.857
- calculul varianei totale, a celei explicate i a celei reziduale pentru modelul cu o singur
variabil explicativ, x1. Tabela de regresie se afl n Tabelul 2.9:
SSE=117.659
SSR=109.198
SST=226.857
Valoarea calculat Fisher este:
( SSE SSE 1) /( k k 1 ) (155.973 117 .659) /(2 1)
5.946
SSR /( n k 1)
70.884 /(14 2 1)
Fk k 1 ,n k 1 F21,514% 2 1 F1,115% 4.84
F*
Cum 5.946 > 4.84, rezult c se respinge ipoteza nul H 0, i se accept ipoteza
alternativ, H1, conform creia adugarea variabilei x2 aduce o modificare semnificativ a
varianei explicate. Introducerea variabilei x2 contribuie semnificativ la mbuntirea calitii
ajustrii. Acest fapt este dovedit i de valoarea coeficientului de determinaie, care n cazul
modelului cu dou variabile explicative este R2=0.6875 mai mare dect n modelul cu o singur
variabil explicativ, x1, R2=0.5186.
b) Testul Chow pentru verificarea stabilitii n timp a modelului
Se va testa stabilitatea modelului cu trei variabile explicative.
Pasul 1: se estimeaz coeficienii modelului pentru prima subperioad, de la 1 la 7. Tabela de
regresie obinut este prezentat n Tabelul 2.10:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.8322
R Square
0.6926
Adjusted RSquare
0.3851
Standard Error
3.0176
Observations
7
ANOVA
df
SS
Regression
Residual
Total
61.5396
27.3176
88.8571
3
3
6
subperioada 1
MS
20.5132
9.1059
F
2.2527
Significance
F
0.2610
Intercept
X Variable 1
X Variable 2
X Variable 3
Coefficient
s
28.5471
0.7739
-0.2932
-0.0125
Standard
Error
15.8986
0.5290
0.3137
0.1008
t Stat
P-value
1.7956
1.4629
-0.9346
-0.1240
0.1704
0.2397
0.4189
0.9091
Lower 95%
Upper 95%
-22.0494
-0.9097
-1.2914
-0.3333
79.1436
2.4575
0.7051
0.3083
subperioada 2
SS
24.7067
20.7219
45.4286
Standard
Error
34.3309
0.6852
0.5224
0.1528
MS
8.2356
6.9073
t Stat
1.8391
1.7924
-1.1885
-1.2062
F
Significance F
1.1923
0.44423
P-value
0.1632
0.1710
0.3201
0.3142
Lower 95%
-46.1175
-0.9525
-2.2832
-0.6707
Upper 95%
172.3955
3.4089
1.0416
0.3020
0.606
( 27.32 20.72) /[14 2(3 1)]
48.04 / 6
5%
5%
Valoarea teoretic Fisher cu care se compar este Fk 1,n 2 ( k 1) F31,14 2 ( 31) F4, 6 4.53 .
Cum 0.606 < 4.53, rezult c se accept ipoteza nul, H 0, adic nu exist diferene semnificative
ntre variana reziduurilor pe ntreaga perioad i suma varianelor reziduale pe cele dou
subperioade. Se poate accepta stabilitatea coeficienilor pe ntreaga perioad.
c) Testarea restriciilor asupra coeficienilor
Ipotezele sunt:
H0: SSR1=SSR (toate restriciile sunt verificate, nu exist modificri semnificative ale
varianei reziduurilor)
H1: SSR1SSR (exist cel puin o restricie neverificat, care determin modificarea
semnificativ a varianei reziduurilor)
SSR1 reprezint variana reziduurilor modelului transformat, rezultat n urma restriciilor,
iar SSR este variana reziduurilor modelului iniial cu trei variabile explicative.
Restriciile sunt: a1=1 i a2=a3.
Dac acest ipotez se verific atunci modelul y t a 0 a1 x1t a 2 x 2t a3 x3t et , devine
y t a 0 1 x1t a 2 x 2t a 2 x 3t et sau y t x1t a0 a 2 ( x 2t x3t ) et .
Se pot defini noi variabile z t y t x1t i vt x 2t x3t . Modelul devine
z t a 0 a 2 vt et . Tabelul 2.12 prezint variabilele iniiale i noile variabile definite, zt i vt.
Tabela de regresie pentru obinerea modelului transformat sub ipoteza de verificare a restriciilor
este prezentat n Tabelul 2.13.
t
yt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
x1
17
19
15
21
19
24
26
24
26
21
24
26
30
26
x2
3
2
4
7
8
9
9
6
6
9
5
10
13
8
42
40
40
44
39
38
29
30
38
35
29
28
32
26
x3
115
126
148
139
123
150
126
141
122
157
155
166
168
174
zt
vt
14
17
11
14
11
15
17
18
20
12
19
16
17
18
157
166
188
183
162
188
155
171
160
192
184
194
200
200
SS
0.4255
108.7888
109.2143
StandardErro
MS
0.4255
9.0657
t Stat
F
0.0469
P-value
Significance F
0.8321
Lower 95%
Upper 95%
Intercept
X Variable 1
s
17.6348
-0.0112
r
9.2298
0.0515
1.9106
-0.216
0.0802
0.8321
-2.4753
-0.1233
37.7448
0.1010
3.065
SSR /( n k 1)
67.448 /(14 3 1)
6.7448
5%
5%
5%
Valoarea teroretic Fisher este: Fk k , n k 1 F3 1,14 3 1 F2,10 4.10 . Cum 3.065 < 4.10,
F
rezult c se accept ipoteza nul, adic toate restriciile sunt compatibile cu datele, pentru c nu
exist diferena semnificative ntre variana reziduurilor a modelului iniial i cea a modelului
transformat. Intervalele de ncredere ale estimatorilor din Tabelul 2.5, dovedesc c restriciile pot
fi ndeplinite: intervalul de ncredere pentru a1, cuprinde valoarea 1, iar intervalul pentru a3 este
cuprins n intervalul de valori al coeficientului a2, deci cei doi coeficieni pot fi egali ntre ei.
2.7. Previziuni folosind modelul regresiei multiple
Procedura de estimare a valorilor viitoare ale variabilei dependente, y, este similar cu
cea utilizat la regresia simpl. Se cunosc valorile viitoare ale variabilelor explicative i n
funcie de acestea se stabilesc previziunile punctuale, dup care, cu o anumit probabilitate se
estimeaz intervalele de ncredere ale acestor valori viitoare.
Pentru perioada de la 1 la n, cu t=1,n, modelul este: y t a 0 a1 x1,t a 2 x2,t ... a k x k ,t .
Previziunea pentru unitatea de timp t+h, unde h este orizontul de previziune, sau i+h,
dac datele sunt observate n mod instantaneu este: y t h a 0 a1 x1,t h a 2 x 2,t h ... a k x k ,t h .
Eroarea de previziune este: et h y t h y t h .
Conform ipotezelor modelului liniar general, previziunea y t h este nedeplasat i se
obine prin aplicarea direct a modelului de regresie estimat. Se calculeaz variana erorii de
previziune, care permite determinarea unui interval de ncredere pentru previziune. Aceast
varian se calculeaz astfel:
e2t h 2 [ X t h ( X X ) 1 X t h 1]
Cunoscnd vectorul X t h , care conine valorile viitoare ale variabilelor explicative, se
dorete obinerea vectorului valorilor previzionate Yt h .
1
x1,t h
X t h x 2 ,t h
...
x
k ,t h
2
2
Eroarea de previziune et h urmeaz o lege normal de medie 0 i varian et h , N(0, et h ).
2
2
nlocuind variana erorilor cu variana estimat, cea a reziduurilor , se deduce c raportul
y t h y t h
urmeaz o lege Student cu n-k-1 grade de libertate, k este numrul
2
[ X t h ( X X ) 1 X t h 1]