Sunteți pe pagina 1din 14

2.6.2.

Execiiu Teste asupra coeficienilor i varianei erorilor


Despre o firm, se cunosc datele referitoare la vnzrile de marf, y, exprimate n mii
euro, pe o perioad de 14 luni, numrul de angajai (persoane), x1, cheltuielile de ntreinere a
utilajelor, exprimate n euro, x2, i cheltuielile de publicitate pentru promovarea produselor,
exprimate n euro, x3. Datele sunt prezentate n Tabelul 2.4:
t

y
1
2
3
4
5
6
7
8
9
10
11
12
13
14

x1
17
19
15
21
19
24
26
24
26
21
24
26
30
26

x2
3
2
4
7
8
9
9
6
6
9
5
10
13
8

42
40
40
44
39
38
29
30
38
35
29
28
32
26

x3
115
126
148
139
123
150
126
141
122
157
155
166
168
174

yt1

yt2
18
17
18
19
23
23
27
24
22
24
23
27
28
26

18
17
19
20
22
23
26
24
21
24
23
27
28
26

Tabelul 2.4. Datele referitoare la un agent economic


Se cere:
a) Sunt semnificative variabilele exogene n explicarea variaiei variabilei endogene? S se
argumenteze i prin calculul intervalelor de ncredere ale estimatorilor coeficienilor.
b) Coeficientul a1 este semnificativ mai mic dect 1?
c) Coeficienii a1 i a2 sunt semnificativi i simultan diferii de 1, respectiv -0.5?
d) Care este intervalul de ncredere pentru variana erorii pentru un prag de semnificaie =5%?
Soluie:
n Figurile 2.16, 2.17, i 2.18 sunt prezentate corelaiile dintre variabila dependent,
stabilit ca fiind vnzrile de marf, influenat de celelalte variabile, considerate factori.

Figura 2.16. Legtura direct dintre valoarea vnzrilor i numrul de angajai

Figura 2.17. Legtura invers dintre valoarea vnzrilor i cheltuielile cu utilajele


Se observ n cele trei grafice legturile de natur direct ale vaorii vnzrilor cu numrul
de angajai i cheltuielile de publicitate i de sens invers cu cheltuielile de ntreinere a utilajelor.
Cu ct sunt mai mari aceste cheltuieli de ntreinere, cu att se reduc vnzrile din cauza
stagnrilor n producie pentru repararea utilajelor, creterii costurilor de fabricaie i implicit a
preurilor de vnzare a produselor, reducerii altor cheltuieli, cum ar fi cele de aprovizionare cu
materii prime i materiale, salariile personalului angajat, etc.

Figura 2.18. Legtura direct dintre valoarea vnzrilor i cheltuielile de publicitate


n urma analizei de regresie, se ateapt un coeficient negativ pentru variabila explicativ
a cheltuielilor de ntreinere a utilajelor, x2 i coeficieni pozitivi pentru celelalte dou variabile
independente x1 i x3.
Tabela de regresie este prezentat n Tabelul 2.5:

SUMMARY OUTPUT
Regression Statistics
Multiple R
0.838264
R Square
0.702687
Adjusted R
0.613493
Square
Standard Error
2.597069
Observations
14
ANOVA
df
Regression
3
Residual
10
Total
13
Coefficient
s
Intercept
35.72254
X Variable 1
0.801901
X Variable 2
-0.38136
X Variable 3
-0.03713

SS
159.4095
67.44767
226.8571
Standard
Error
10.9942
0.298436
0.156581
0.052023

MS
F
53.13649 7.878181
6.744767
t Stat

P-value

Significance F
0.005452

Lower 95%

3.249218 0.008732
2.687012 0.022816
-2.43556 0.035114
-0.71377 0.491694

Upper 95%

11.22594
0.136944
-0.73025
-0.15305

60.21914
1.466857
-0.03248
0.078782

Tabelul 2.5. Tabela de regresie a modelului cu trei variabile explicative


Modelul este y t 35.72 0.802 x1 0.381x 2 0.037 x3 , iar valorile teoretice, yt1, se
afl n Tabelul 2.4 i pe acelai grafic care arat evoluia n timp a valorilor observate, n Figura
2.19.

Figura 2.19. Evoluia vnzrilor i ajustarea lor


a

i
a) Raia Student pentru fiecare coeficient de regresie, calculat dup formula t a , se
a
i

/ 2 0.025

compar cu valoarea teoretic Student pentru =5% i 10 grade de libertate, t10 grd .lib. 2.228 .
t a 2.687 2.228 , rezult c a1 0 , variabila x1 contribuie la explicarea variaiei variabilei y;
1

a 2

y;

2.435 2.228 , rezult c a 2 0 , variabila x2 contribuie la explicarea variaiei variabilei

t a3 0.714 2.228 , rezult c a 3 0 , variabila x3 nu contribuie la explicarea variaiei

variabilei y, i poate fi retras din model. Se poate vedea n tabele de regresie din Tabelul 2.5 c
P-value pentru estimatorul a 3 , indic un prag de semnificaie de 49%, care este mult prea mare.
Intervalul de ncredere al coeficientului ai se stabilete n funcie de valoarea
estimatorului, estimaia abaterii sale i valoarea teoretic Student pentru un prag de semnificaie
/2
/2
ales, de obicei =5%: ICa i [a i ai t grd .lib. ; a i ai t grd .lib. .
Intervalele de ncredere pentru cei trei estimatori ai coeficienilor variabilelor explicative sunt:
ICa1 : 0.137;1.467 , semnul + indic legtura direct dintre y i x1;
ICa 2 : 0.730;0.032 , semnul - indic legtura invers dintre y i x2 (Figura 2.17);
ICa3 : 0.153;0.079 , se schimb semnul de la - la +, a 3 poate lua valoarea 0, nu este
semnificativ diferit de 0. Numai variabilele x1 i x2 sunt variabile exogene semnificative.
Pentru noul model cu dou variabile explicative, se obine tabela de regresie prezentat n
Tabelul 2.6. Valorile teoretice calculate cu acest model: y t 29.143 0.715 x 0.328 x 2 se af
n Tabelul 2.4 i pe graficul din Figura 2.19.
Se poate observa c acest model are coeficienii semnificativ diferii de 0, dup cum
indic raiile Student calculate, care sunt mai mari dect valoarea teoretic din tabela Student,
valorile P-value, care sunt mai mici dect 5%, precum i intervalele de ncredere ale
coeficienilor, care nu schimb semnul de la limita inferioar la cea superioar, deci nu conin
valoarea 0.
ICa 0 : 16.25;42.03 ,
ICa1 : 0.129;1.301 ,
Intervalele
de
ncredere
sunt:
ICa 2 : 0.624;0.032 .
Coeficientul de determinaie de 68.7% indic validitatea modelului liniar, iar coeficientul de
corelaie multipl de 0.83 indic o corelaie puternic ntre cele trei variabile y, x1 i x2.
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.82918
R Square
0.68754
Adjusted R
0.630729
Square
Standard Error
2.538501
Observations
14
ANOVA
df
Regression
Residual
Total

Intercept
X Variable 1
X Variable 2

2
11
13
Coefficient
s
29.1429
0.714896
-0.32811

SS

MS

155.9733 77.98663 12.10223


70.88389 6.44399
226.8571
Standard
t Stat
P-value
Error
5.856343 4.976297 0.000418
0.266264 2.684916 0.021221
0.134561 -2.43839 0.032916

Significanc
eF
0.001665

Lower 95%
16.25317
0.128853
-0.62428

Upper
95%
42.03263
1.300939
-0.03195

Tabelul 2.6. Tabela de regresie a modelului cu dou variabile explicative


b) ntrebrile b), c) i d) ale exerciiului, se refer la modelul iniial, cel cu trei variabile
explicative, a crui tabel de regresie se afl n Tabelul 2.5.
Pentru a testa valoarea coeficientului a1 dac este semnificativ diferit de 1, ipotezele
testului sunt:

H0: a1=1
H1: a1<1
Testul este unilateral la stnga, iar valoarea teoretic Student pentru 10 grade de libertate
i =5%, este 1.81. Presupunnd adevrat ipoteza nul, raportul critic sau raia Student
a 1

1
calculat, devine: t a
a
1

0.80 1
0.68 1.81 . Se accep ipoteza nul, coeficientul a1
0.298

nu este semnificativ inferior valorii 1.


b) Pentru a testa dac valorile coeficienilor a1 i a2 sunt semnificativi i simultan diferii de 1,
respectiv -0.5, se vor testa valorile estimatorilor lor, iar ipotezele sunt:
a1 1

H0:
a 2 0.5
a1 1

H1:
a 2 0 .5
Valoarea q = 2 reprezint numrul coeficienilor supui testrii. Vectorul estimatorilor este
0.80

a q
0.38

. Matricea de varian covarian a


i vectorul valorilor este a q
0 .5

2 ( X X ) 1 , iar 2 2.597 2 6.745 .


este:
estimatorilor este
a
a

a 3
a 2
-0.47956

0
a

0
a
120.87236

1
a
-0.00133

-1.47229

1
a
a 2

-0.00133
-1.47229

0.08906
0.00806

0.00806
0.02452

-0.00634
0.00388

a 3

-0.47956

-0.00634

0.00388

0.00271

se decupeaz numai poriunea corespunztoare coeficienilor a


1
Din matricea
a
care conine pe diagonala principal varianele celor doi estimatori, iar n
i a 2 ,
aq
rest covarianele:

0.08906
0.00806

0.00806
0.02452

1 :
Se calculeaz
aq

f
Vectorul (a q aq ) este

11.57181
-3.802262
-3.802262
42.03652
0.80 1

0.80 1
0.20


.
0.38 (0.5)
0.38 0.5
0.12

(
a

a
)
Vectorul q
este 0.80 1
q

Statistica F

0.38 0.5 0.20

1
1 (a a f ) 1 0.2
( a q a qf )
aq
q
q
q
2

0.12 .

11.572
3.802

0.12

3.802 0.2

0.612
42.036 0.12

.
Valoarea Fisher calculat se compar cu o valoare teoretic pentru q=2 i n-k-1=10 grade de

0.05
libertate, F( q , n k 1) F( 2,10 ) grd .lib. 4.10 . Cum 0.612<4.10, se accept ipoteza nul H0, adic
cei doi coeficieni pot avea simultan valorile 1 i -0.5. Aceast concluzie se poate verifica privind
intervalele de ncredere, care conin cele dou valori testate.
d) Pentru a stabili intervalul de ncredere al varianei erorilor se citesc cele dou valori 12 i
22 , pentru 10 grade de libertate i pentru =5%, astfel: 12 pentru /2=0.025 este 20.4831 i
22 pentru (1-/2)=0.975 este 3.24697.

(n k 1) 2 (n k 1) 2
;
,
2
2

1
2

2
Intervalul de ncredere al varianei erorilor este IC ( )

10 6.745 10 6.745
;
3.30;20.75 . Cu o probabilitate de 95%, variana
20.4831 3.24697

2
adic IC ( )

erorilor are anse s se gseasc n acest interval.


2.6.3. Analiza varianei testul Fisher de semnificaie global a regresiei
Tabelul de analiz a varianei, ANOVA este de forma celui din Tabelul 2.7:
Natura
variaiei,
datorat:
Regresiei
(variabilelor
explicative)
Reziduurilor
(variana
neexplicat)
Total (toi
factorii)

Sum de ptrate
(Sum of Squares) SS
n

2
SSE= ( y t y )

Grade de
libertate
(degrees
freedom) df
k

(Modified
Sums) MS
SSE/k

n-k-1

SSR/(n-k-1)

n-1

Testul Fisher F

t 1
n

2
SSR= ( yt y t )

SSE / k
SSR /( n k 1)

t 1
n

2
SST= ( yt y )
t 1

Tabelul 2.7. Tabelul ANOVA la regresia multipl


Testul de semnificaie global a regresiei se formuleaz astfel: exist cel puin o variabil
explicativ semnificativ?
Ipotezele sunt:
H0: a1 = a2 = ... = ak = 0
(toi coeficienii sunt nuli, nici o variabil explicativ nu i
aduce contribuia la explicarea variabilei y; termenul constant a0 nu
prezint interes, deoarece un model n care numai termenul
constant este semnificativ, nu are sens economic.)
H1: exista cel putin un coeficient nenul.
n cazul n care se accept H0 nseamn c nu exist nici o relaie liniar semnificativ ntre
variabila y i variabilele xi cu i=1,2, ..., k. Testarea ipotezei nule este echivalent cu a testa dac
variana SSE este semnificativ diferit de 0.
n cazul exerciiului prezentat, tabelul de analiza varianei pentru modelul cu dou
variabile explicative, dup eliminarea variabilei nesemnificative x3, este extras din Tabelul 2.6, n
Tabelul 2.8:
Natura variaiei
Regression
Residual
Total

df
2
11
13

SS
155.9733
70.88389
226.8571

MS
77.98663
6.44399

F
12.10223

Significance F
0.001665

Tabelul 2.8. Tabelul ANOVA pentru modelul cu dou variabile explicative


Ipoteza de normalitate a erorilor implic sub ipoteza H 0, c statistica F* urmeaz o lege
Fisher cu k i n-k-1 grade de libertate. F *

SSE / k
12.10 se compar cu o valoare
SSR /(n k 1)

teoretic Fisher cu 2 i 11 grade de libertate, care pentru un prag de semnificaie =5% este

Fk, n5k%1 3.98. Cum F * Fteoretic

se accept ipoteza alternativ, H1, deci regresia este

global semnificativ, modelul este bine construit. Valoarea calculat F* corespunde unui prag de
semnificaie de 0.16%, mult mai mic dect 5%.
i regresia prezentat n Tabelul 2.5, cu trei variabile explicative, este global
5%
semnificativ pentru c F3,10 3.71 , iar valoarea calculat F*=7.87>3.71, pentru un prag de
semnificaie de 0.54%.
Numai cnd modelul are termen constant, F* se poate scrie n funcie de coeficientul de
SSE
, se poate exprima SSE SST R 2 , iar SSR se poate
SST
SSR
2
2
exprima n funcie de coeficientul de nedeterminaie N 1 R
, SSR SST (1 R 2 ) .
SST
2
determinaie R2. Din relaia R

nlocuind n formula statisticii F*, valorile astfel exprimate SSE i SSR, se simplific cu
SST i rmne astfel: F *

R2 / k
.
(1 R 2 ) /(n k 1)

Pe langa testul global de semnificaie, se efectueaz testele de semnificatie individual a


coeficienilor pentru fiecare variabila explicativa din model.
Calitatea ajustrii se determin n funcie de coeficientul de determinaie: R 2

SSE
.
SST

Dac R 2 1 nseamn variana total SST, este aproape n ntregime explicat SSE, modelul
este bine ales. Coeficientul de determinaie multipl: R R 2 , arat intensitatea corelaiei
simultane a variabilelor explicative asupra variabilei dependente y.

Verificarea stabilitii n timp a modelului testul CHOW

Problema este dac modelul se poate considera ca fiind stabil pe ntreaga perioad sau
este mai bine s se considere dou subperioade distincte de estimare? Specificarea modelului
este aceeai, dar valorile coeficienilor pot fi diferite.
Verificarea stabilitii coeficienilor const n a testa dac exist o diferen semnificativ
ntre variana neexplicat SSR pe ansamblul perioadei i suma varianelor neexplicate pe cele
dou subperioade SSR1 + SSR2? Dac rspunsul este negativ, nseamn c divizarea pe
subperioade nu mbuntete calitatea modelului, modelul iniial este stabil pe ntreaga perioad.
n caz contrar se declar modelul ca fiind instabil i este mai bine s se estimeze pe subperioade.
Testul de ipoteze este:
1
2
0

H : SSR (SSR SSR ) 0

H1 : SSR (SSR1 SSR 2 ) 0

Se calculeaz valoarea Fisher, considernd n1, numrul de observri n prima subperioad i n2,
numrul de observri n a doua subperioad, iar suma lor n1 n2 n , este numrul total de
observri din modelul iniial:
[ SSR ( SSR 1 SSR 2 )] /[(n k 1) ( n1 k 1) (n 2 k 1)]
F*

( SSR 1 SSR 2 ) /[(n1 k 1) ( n2 k 1)]


[ SSR ( SSR 1 SSR 2 )] /( k 1)
( SSR 1 SSR 2 ) /[ n 2(k 1)]
Regula de decizie:

- F * Fk 1, n 2 ( k 1) se accept H0, nu este nici o diferen ntre variana reziduurilor calculat pe


ntreaga perioad i suma varianelor reziduurilor calculate pe subperioade; coeficienii sunt
stabili pe ntreaga perioad;

- F * Fk 1,n 2 ( k 1) se accept H1, exist diferene semnificative ntre variana reziduurilor pe


ntreaga perioad i suma varianelor reziduurilor pe subperioade; coeficienii nu sunt constani;
modelul este instabil.

2.6.4.3. Testarea restriciilor asupra coeficienilor


Estimarea econometric valideaz restriciile asupra coeficienilor, prin testul de ipoteze:
H0: SSR1=SSR (sunt verificate toate restriciile?)
H1: SSR1 SSR (exist cel puin o restricie neverificat),
unde SSR1 reprezint variana reziduurilor n modelul rezultat n urma restriciilor, iar k este
numrul de variabile explicative din modelul restricionat. Variana reziduurilor din modelul
iniial este SSR, iar k este numrul variabilelor explicative din modelul iniial.
Valoarea empiric a testului Fisher este valoarea sa calculat: F

( SSR 1 SSR ) /(k k )


.
SSR /(n k 1)

Gradele de liberate de la numrtor se obin scznd gradele de libertate ale modelului iniial din
gradele de libertate ale modelului restricionat: (n k 1) (n k -1) = k k.

Dac F Fk k ,n k 1 , atunci se accept ipoteza nul H0, restriciile asupra coeficienilor


sunt compatibile cu datele.
2.6.5. Exerciiu Teste pornind de la analiza varianei
Relund datele din aplicaia anterioar, referitoare la modelul cu trei variabile explicative:
y t 35.72 0.802 x1 0.381x 2 0.037 x3

(10.99) (0.298) (0.156) (0.052)


( ) abaterea standard a coeficienilor
R2=0.7027
n=14
S se testeze urmtoarele ipoteze:
a) Adugarea variabilelor explicative x2 i x3 amelioreaz semnificativ calitatea ajustrii fa de
estimarea numai n raport de variabila x1? Dar adugarea numai a variabilei x2?
b) Se poate considera modelul cu trei variabile, ca fiind stabil pe ansamblul perioadei sau
trebuie s se procedeze la estimarea pe subperioade: de la perioada 1 la 7 i de la 7 la 14?
c) Un economist sugereaz c n acest model a1=1 i a2=a3. Care este rezultatul testului asupra
coeficienilor?
Soluie:
a) Introducerea a dou variabile explicative suplimentare
Se execut urmtoarele operaiuni:
1. Calculul varianei totale, a celei explicate i a celei reziduale pentru modelul complet cu trei
variabile explicative. Aceste valori se gsesc n tabela de regresie din Tabelul 2.5:
SSE=159.409
SSR= 67.448
SST=226.857
2. Calculul varianei totale, a celei explicate i a celei reziduale pentru modelul cu o singur
variabil explicativ, x1. Aceste valori se gsesc n tabela de regresie din Tabelul 2.9:
SSE=117.659
SSR=109.198
SST=226.857 este evident aceeai, indiferent de numrul variabilelor explicative, pentru c
msoar variaia datorat tuturor factorilor (nregistrai i reziduali).
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.720172
R Square
0.518647
Adjusted R
0.478535
Square
Standard Error
3.016597
Observations
14
ANOVA
df
Regression
1
Residual
12
Total
13
Coefficient
s
Intercept
15.55935
X Variable 1
1.011809

SS
MS
F
117.6589 117.6589 12.92975
109.1983 9.099855
226.8571
Standard
t Stat
P-value
Error
2.1469
7.2472 1.02E-05
0.2814
3.5958 0.003674

Significance F
0.003674

Lower 95%

Upper 95%

10.8816
0.3987

20.2371
1.6249

Tabelul 2.9. Tabele de regresie a modelului cu o singur variabil explicativ


Se observ c R2=0.5186 este mai mic dect n cazul modelului iniial, cu trei variabile
explicative.
3. Testul statistic asupra ipotezelor:
H0: SSE-SSE1=0
H1: SSE-SSE1 0
Valoarea calculat Fisher este:

( SSE SSE 1) /( k k 1 ) (159.409 117 .659) /(3 1)

3.09
SSR /(n k 1)
67.448 /(14 3 1)
Fk k 1 ,n k 1 F31,514%31 F2,105% 4.10

F*

Cum 3.09 < 4.10, rezult c se accept ipoteza nul H0, adugarea variabilelor x2 i x3 nu
este important. Introducerea acestor variabile nu contribuie semnificativ la mbuntirea
calitii ajustrii.
S-a discutat deja mai sus, i se poate vedea n tabela de regresie din Tabelul 2.5, c
variabila x3, nu este semnificativ, deoarece raia sa Student este mai mic dect valoarea
teoretic, fapt care a condus apoi la excluderea sa din model. Este interesant s se analizeze dac
introducerea unei singure variabile suplimentare, i anume x2, mbuntete calitatea ajustrii.
Se vor parcurge aceeai pai, ca cei prezentai mai sus:
- calculul varianei totale, a celei explicate i a celei reziduale pentru modelul cu dou variabile
explicative, x1 i x2:
SSE=155.973
SSR= 70.884
SST=226.857
- calculul varianei totale, a celei explicate i a celei reziduale pentru modelul cu o singur
variabil explicativ, x1. Tabela de regresie se afl n Tabelul 2.9:
SSE=117.659
SSR=109.198
SST=226.857
Valoarea calculat Fisher este:
( SSE SSE 1) /( k k 1 ) (155.973 117 .659) /(2 1)

5.946
SSR /( n k 1)
70.884 /(14 2 1)
Fk k 1 ,n k 1 F21,514% 2 1 F1,115% 4.84

F*

Cum 5.946 > 4.84, rezult c se respinge ipoteza nul H 0, i se accept ipoteza
alternativ, H1, conform creia adugarea variabilei x2 aduce o modificare semnificativ a
varianei explicate. Introducerea variabilei x2 contribuie semnificativ la mbuntirea calitii
ajustrii. Acest fapt este dovedit i de valoarea coeficientului de determinaie, care n cazul
modelului cu dou variabile explicative este R2=0.6875 mai mare dect n modelul cu o singur
variabil explicativ, x1, R2=0.5186.
b) Testul Chow pentru verificarea stabilitii n timp a modelului
Se va testa stabilitatea modelului cu trei variabile explicative.
Pasul 1: se estimeaz coeficienii modelului pentru prima subperioad, de la 1 la 7. Tabela de
regresie obinut este prezentat n Tabelul 2.10:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.8322
R Square
0.6926
Adjusted RSquare
0.3851
Standard Error
3.0176
Observations
7
ANOVA
df

SS

Regression
Residual
Total

61.5396
27.3176
88.8571

3
3
6

subperioada 1

MS
20.5132
9.1059

F
2.2527

Significance
F
0.2610

Intercept
X Variable 1
X Variable 2
X Variable 3

Coefficient
s
28.5471
0.7739
-0.2932
-0.0125

Standard
Error
15.8986
0.5290
0.3137
0.1008

t Stat

P-value

1.7956
1.4629
-0.9346
-0.1240

0.1704
0.2397
0.4189
0.9091

Lower 95%

Upper 95%

-22.0494
-0.9097
-1.2914
-0.3333

79.1436
2.4575
0.7051
0.3083

Tabelul 2.10. Tabela de regresie pentru prima subperioad de la 1 la 7


Se observ n Tabelul 2.10, c nici unul din coeficienii de regresie nu este semnificativ diferit de
0, valorile P-value sunt mai mari dect pragul acceptat de 0.05, toate intervalele de ncredere ale
estimatorilor coeficienilor schimb semnul de la la +, deci conin valoarea 0. Nici testul Fisher
nu indic o regresie global semnificativ, Significance F avnd o valoare mult prea mare de
26.1%, fa de 5%, ct se accept n mod obinuit.
Varianele din tabelul ANOVA sunt:
SSE1=61.54
SSR1=27.32
SST2=88.86
Pasul 2: se estimeaz coeficienii modelului pentru a doua subperioad, de la 8 la 14; tabela de
regresie se afl n Tabelul 2.11.
Concluzia este asemntoare cu cea de la prima subperioad: c nici unul din coeficienii
de regresie nu este semnificativ, intervalele de ncredere ale estimatorilor coeficienilor conin
valoarea 0, testul Fisher nu indic o regresie global semnificativ.
Varianele din tabelul ANOVA, corespunztor celei de a doua subperioade, sunt:
SSE2=24.71
SSR2=20.72
SST2=45.43
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.7375
R Square
0.5439
Adjusted RSquare
0.0877
Standard Error
2.6282
Observations
7
ANOVA
df
Regression
3
Residual
3
Total
6
Coefficient
s
Intercept
63.1390
X Variable 1
1.2282
X Variable 2
-0.6208
X Variable 3
-0.1843

subperioada 2

SS
24.7067
20.7219
45.4286
Standard
Error
34.3309
0.6852
0.5224
0.1528

MS
8.2356
6.9073
t Stat
1.8391
1.7924
-1.1885
-1.2062

F
Significance F
1.1923
0.44423

P-value
0.1632
0.1710
0.3201
0.3142

Lower 95%
-46.1175
-0.9525
-2.2832
-0.6707

Upper 95%
172.3955
3.4089
1.0416
0.3020

Tabelul 2.11. Tabela de regresie pentru a doua subperioad de la 8 la 14


[ SSR ( SSR 1 SSR 2 )] /( k 1)
.
( SSR 1 SSR 2 ) /[ n 2(k 1)]
[67.448 ( 27.32 20.72)] /(3 1) (67.448 48.04) / 4
F*

0.606
( 27.32 20.72) /[14 2(3 1)]
48.04 / 6

5%
5%
Valoarea teoretic Fisher cu care se compar este Fk 1,n 2 ( k 1) F31,14 2 ( 31) F4, 6 4.53 .

Pasul 3: se calculeaz valoarea Fisher: F *

Cum 0.606 < 4.53, rezult c se accept ipoteza nul, H 0, adic nu exist diferene semnificative
ntre variana reziduurilor pe ntreaga perioad i suma varianelor reziduale pe cele dou
subperioade. Se poate accepta stabilitatea coeficienilor pe ntreaga perioad.
c) Testarea restriciilor asupra coeficienilor
Ipotezele sunt:
H0: SSR1=SSR (toate restriciile sunt verificate, nu exist modificri semnificative ale
varianei reziduurilor)
H1: SSR1SSR (exist cel puin o restricie neverificat, care determin modificarea
semnificativ a varianei reziduurilor)
SSR1 reprezint variana reziduurilor modelului transformat, rezultat n urma restriciilor,
iar SSR este variana reziduurilor modelului iniial cu trei variabile explicative.
Restriciile sunt: a1=1 i a2=a3.
Dac acest ipotez se verific atunci modelul y t a 0 a1 x1t a 2 x 2t a3 x3t et , devine
y t a 0 1 x1t a 2 x 2t a 2 x 3t et sau y t x1t a0 a 2 ( x 2t x3t ) et .
Se pot defini noi variabile z t y t x1t i vt x 2t x3t . Modelul devine
z t a 0 a 2 vt et . Tabelul 2.12 prezint variabilele iniiale i noile variabile definite, zt i vt.
Tabela de regresie pentru obinerea modelului transformat sub ipoteza de verificare a restriciilor
este prezentat n Tabelul 2.13.
t

yt
1
2
3
4
5
6
7
8
9
10
11
12
13
14

x1
17
19
15
21
19
24
26
24
26
21
24
26
30
26

x2
3
2
4
7
8
9
9
6
6
9
5
10
13
8

42
40
40
44
39
38
29
30
38
35
29
28
32
26

x3
115
126
148
139
123
150
126
141
122
157
155
166
168
174

zt

vt
14
17
11
14
11
15
17
18
20
12
19
16
17
18

157
166
188
183
162
188
155
171
160
192
184
194
200
200

Tabelul 2.12. Variabilele iniiale i cele transformate


SUMMARY OUTPUT
Regression Statistics
Multiple R
0.0624
R Square
0.0039
Adjusted R
-0.0791
Square
Standard Error
3.0109
Observations
14
ANOVA
df
Regression
1
Residual
12
Total
13
Coefficient

SS
0.4255
108.7888
109.2143
StandardErro

MS
0.4255
9.0657
t Stat

F
0.0469

P-value

Significance F
0.8321

Lower 95%

Upper 95%

Intercept
X Variable 1

s
17.6348
-0.0112

r
9.2298
0.0515

1.9106
-0.216

0.0802
0.8321

-2.4753
-0.1233

37.7448
0.1010

Tabelul 2.13. Tabela de regresie a variabilelor transformate


n noul model transformat z t 17.635 0.0112 vt , varianele sunt: SSE1 = 0.425,
SSR1=108.789, SST1 = 109.214. Valoarea k=1 reprezint numrul variabilelor explicative din
modelul trasformat, iar k=3.
( SSR 1 SSR ) /( k k ) (108.789 67.448) /(3 1) 41.341 / 2

3.065
SSR /( n k 1)
67.448 /(14 3 1)
6.7448
5%
5%
5%
Valoarea teroretic Fisher este: Fk k , n k 1 F3 1,14 3 1 F2,10 4.10 . Cum 3.065 < 4.10,
F

rezult c se accept ipoteza nul, adic toate restriciile sunt compatibile cu datele, pentru c nu
exist diferena semnificative ntre variana reziduurilor a modelului iniial i cea a modelului
transformat. Intervalele de ncredere ale estimatorilor din Tabelul 2.5, dovedesc c restriciile pot
fi ndeplinite: intervalul de ncredere pentru a1, cuprinde valoarea 1, iar intervalul pentru a3 este
cuprins n intervalul de valori al coeficientului a2, deci cei doi coeficieni pot fi egali ntre ei.
2.7. Previziuni folosind modelul regresiei multiple
Procedura de estimare a valorilor viitoare ale variabilei dependente, y, este similar cu
cea utilizat la regresia simpl. Se cunosc valorile viitoare ale variabilelor explicative i n
funcie de acestea se stabilesc previziunile punctuale, dup care, cu o anumit probabilitate se
estimeaz intervalele de ncredere ale acestor valori viitoare.
Pentru perioada de la 1 la n, cu t=1,n, modelul este: y t a 0 a1 x1,t a 2 x2,t ... a k x k ,t .
Previziunea pentru unitatea de timp t+h, unde h este orizontul de previziune, sau i+h,
dac datele sunt observate n mod instantaneu este: y t h a 0 a1 x1,t h a 2 x 2,t h ... a k x k ,t h .
Eroarea de previziune este: et h y t h y t h .
Conform ipotezelor modelului liniar general, previziunea y t h este nedeplasat i se
obine prin aplicarea direct a modelului de regresie estimat. Se calculeaz variana erorii de
previziune, care permite determinarea unui interval de ncredere pentru previziune. Aceast
varian se calculeaz astfel:
e2t h 2 [ X t h ( X X ) 1 X t h 1]
Cunoscnd vectorul X t h , care conine valorile viitoare ale variabilelor explicative, se
dorete obinerea vectorului valorilor previzionate Yt h .
1

x1,t h
X t h x 2 ,t h

...
x

k ,t h
2
2
Eroarea de previziune et h urmeaz o lege normal de medie 0 i varian et h , N(0, et h ).
2
2
nlocuind variana erorilor cu variana estimat, cea a reziduurilor , se deduce c raportul
y t h y t h
urmeaz o lege Student cu n-k-1 grade de libertate, k este numrul
2
[ X t h ( X X ) 1 X t h 1]

variabilelor explicative din model. Intervalul de ncredere pentru un prag de semnificaie de ,


este: ICy t h y t h t n/k21 2 [ X t h ( X X ) 1 X t h 1] .

S-ar putea să vă placă și