Sunteți pe pagina 1din 25

2.

Regresia liniar simpl


a) Realizai i prezentai un grafic de tip scatter ntre rentabilitile aciunii (variabila
dependent) i rentabilitile indicelui (variabila explicativ). Comentai posibilitatea existen ei
unei relaii liniare ntre cele dou variabile i semnul acestei relaii.

innd cont de coeficientul foarte mic aferent indicelui DJIA din ecuaia de regresie a
rentabilitii logaritmice a aciunii, putem afirma c ntre evoluia preului ac iunii companiei
General Electric i evoluia indicelui DJIA exist o corelaie slab, dar i negativ.
Este normal s existe o corelaie ntre cele dou variabile, mai ales dac inem cont de
faptul c aciunile General Electric sunt o parte constituent a indicelui bursier DJIA.
b) Estimai un model de regresie ntre rentabilitile aciunii i rentabilit ile indicelui de
Raciune = + Rindice
forma:
. Prezentai rezultatele obinute, comentai semnificaia celor doi
coeficieni estimai i interpretai nivelul coeficientului de determinare

R2 .

n ceea ce privete coeficientul variabilei independente observm c la o modificare cu 1


a valorii sale variabila dependent se modific cu -0,091536.
Referitor la coeficientul liber observm c la o modificare cu 1 a valorii sale variabila
dependent se modific cu 0.0000242.
2
Analiznd valoarea coeficientului de determinare R
vom constata c variaia
variabilei
dependente (preul aciunii) este explicat n proporie de 0,3073% de variaia variabilei
independente (valoarea indicelui DJIA). Putem afirma c aciunile General Electric au o
sensibilitate mai mic la riscul systemic.

c) Comentai rezultatele t-statistic pentru cei doi coeficieni pentru un prag de


semnificaie de 1%, respectiv de 5%. Sunt coeficienii estimai semnificativi din punct de vedere
statistic?
n general, numrul gradelor de libertate este egal cu n-2. n cazul de fa avem 2566 de
grade de libertate. Din tabelul testului t vom avea urmtoarele valori corespunztoare: pentru un
t tabelat
prag de semnificaie de 1% avem
= 2,330, respectiv prag de semnificaie de 5%
t tabelat

= 1,646.
Vom compara aceste valori cu cele obinute n output-ul ecuaiei de regresie.
t
Pentru coeficientul liber calculat are valoarea 0,059220.

Pentru coeficientul indicelui DJIA

t calculat

are valoarea n modul egal cu 2,700647.

Testul t are ca ipotez nul faptul c acela dintre coeficieni care este analizat este egal cu
zero. Ipoteza alternativ ar fi c coeficientul este semnificativ diferit de zero.
Pentru coeficientul liber

t calculat

=0,059220 < ttabelat = 2,330.

Pentru coeficientul liber

t calculat

=0,059220 < ttabelat = 1,646.

Att pentru un prag de semnificaie de 1%, ct i pentru un prag de semnifica ie de 5%


coeficientul termenului liber nu este semnificativ diferit de zero.
Pentru coeficientul indicelui DJIA

t calculat

= 2,700647 >

t tabelat

= 2,330.

Pentru coeficientul indicelui DJIA

t calculat

= 2,700647 >

t tabelat

= 1,646.

Att pentru un prag de semnificaie de 1%, ct i pentru un prag de semnifica ie de 5%


coeficientul termenului indicelui DJIA este semnificativ diferit de zero.
d) Realizai un test two-sided cu H0: =1

, H1:

prin trei metode: test de

semnificaie (valorile tabelate ale distribuiei t se pot obine n Excel sau din Anexa 2 a crii lui
Brooks), interval de ncredere i cu ajutorul p-value. Se va avea n vedere att un prag de
semnificaie de 1%, ct i un prag de semnificaie de 5%. Prezentai comparativ i comenta i
rezultatele obinute prin cele trei metode.
Am ales s folosim testul Wald.

t calculat = 32,20436 > 2,330


t calculat = 32,20436 > 1,646

Valoarea calculat a testului t depeste valoarea tabelat a testului t pentru ambele nivele
de semnificaie.
Prin urmare, att pentru un nivel de semnficaie de 1%, ct i pentru un nivel de
semnificaie de 5% vom respinge ipoteza nul i vom accepta ipoteza alternativ conform creia
coeficientul indicelui DJIA este diferit de 1.

Pentru niciunul dintre cele 3 nivele de semnificaie valoarea 1 nu este inclus n


intervalele de ncredere ale coeficientului indicelui DJIA, aadar vom accepta ipoteza alternativ
conform creia coeficientul indicelui DJIA este diferit de 1.

Analiznd valoarea p-value = 0,0000, att pentru pragul de semnificaie de 1%, ct i


pentru cel de 5%, aceasta este situat sub valoarea critic. Vom accepta ipoteza conform creia
coeficientul indicelui DJIA este diferit de 1.
e) Realizai un test one-sided cu H0: =0,25

, H1:

> 0.25 prin metoda testului de

semnificaie pentru un prag de semnificaie de 1% (valorile tabelate ale distribuiei t se pot obine
n Excel sau din Anexa 2 a crii lui Brooks). Prezentai i comentai rezultatele testului.

t calculat =10.37161 > 2,330


t calculat =10.37161 > 1,646

Pentru ambele praguri de semnificaie (att cel de 1%, ct i cel de 5%) valoarea testului t
este mai mare dect valoare critic, prin urmare n ambele cazuri vom respinge ipoteza nul i
putem afirma c coeficientul aferent indicelui DJIA este semnificativ diferit de 0,25.
u
f) Testai dac modelul de regresie estimat respect ipoteza 1 a CLRM: ( E[ t ]=0) i
prezentai rezultatul obinut. Explicai de ce a fost obinut acest rezultat.
Testarea ipotezei 1 se poate face cu ajutorul histogramei.

Media erorilor este foarte apropiat de zero, prin urmare este respectat una dintre
principalele condiii ale unui model de regresie valid. Ipoteza 1 a CLRM este verificat.
g) Re-estimai modelul de regresie fr termen liber i testai din nou dac se respect
ipoteza 1 a CLRM. Exist diferene fa de situaia de la punctul anterior? Comentai.

Observm c n cazul n care modelul de regresie este fr termen liber, media erorilor
tinde ctre zero fiind totui un pic mai mare dect n cazul ecuaiei iniiale.
Reiese c eroarea de estimare este mai mare atunci cnd nu exist termen liber n ecua ie,
ceea ce confirm rezultatul obinut anterior prin intermediul coeficientului de determinare:
variana rentabilitii logaritmice a preului aciunilor General Electric nu este explicate n
totalitate de variana indicelui bursier DJIA.

h) Testai ipoteza de homoscedasticitate a erorilor cu ajutorul testului White i prezenta i


rezultatul obinut. Este respectat aceast ipotez a CLRM?

Probabilitile aferente testului F sub situate sub pragurile critice de 1%, respectiv 5%.
De asemenea toate elementele ecuaiei au probabilitatea sub cel mai restrictiv nivel de 1%. Prin
urmare, putem afirma c ipoteza de homoscedasticitate a erorilor este respectat.
i) Re-estimai modelul de regresie iniial utiliznd erori standard ajustate (White) pentru a
ine cont de heteroscedasticitatea erorilor i prezentai rezultatul obinut. Explicai diferenele
nregistrate fa de modelul estimat iniial i consecinele acestora.

Principalele diferene sunt urmtoarele:


- probabilitatea aferent coeficientului indicelui DJIA depeste chiar i cel mai permisiv
nivel de 10%, prin urmare acest coeficient nu mai este semnificativ din punct de vedere statistic
- eroarea de estimare este mai mare n cazul acestui model fa de cel initial, eroare
standard crete de la 0,033894 la 0,068740
j) Testai ipoteza de necorelare a erorilor cu ajutorul testelor Durbin-Watson i BreuschGodfrey (cu 10 lag-uri). Prezentai i comentai rezultatele obinute. Este respectat aceast
ipotez a CLRM?
Testul Durbin Watson poate fi observat n output-ul ecuaiei de regresie.
Acesta are valoare de 1,954158.
Durbin Watson statistic (DW) este un test statistic care testeaz corelaia serial a erorilor.
Dac erorile nu sunt corelate, atunci valoarea lui DW va fi n jur de 2. n regresia de mai sus
acest indicator are valoarea 1,954158, i ca urmare, exist corelaie serial slab a erorilor.

Probabilitile aferente testului F i coeficienilor ecuaiei nu confirm prezena corelaiei


seriale a erorilor, fiind mai mici dect ambele praguri de seminificaie (1% i 5%).
k) Re-estimai modelul de regresie iniial utiliznd erori standard ajustate pentru a ine
cont att de prezena heteroscedasticitii ct i a autocorelaiilor la nivelul erorilor (HAC prin
procedura Newey-West) i prezentai rezultatul obinut. Explicai diferenele nregistrate fa de
modelul estimat iniial i consecinele acestora.

Principalele diferene sunt urmtoarele:


- probabilitatea aferent coeficientului indicelui DJIA depeste nivelul critic de 5%, prin
urmare acest coeficient nu mai este semnificativ din punct de vedere statistic pentru acest nivel
de semnificaie
- eroarea de estimare este mai mare n cazul acestui model fa de cel initial, eroare
standard crete de la 0,033894 la 0,054405

l) Pornind de la modelul iniial estimai un model de tipul autoregressive distributed lag


i testai din nou ipoteza de necorelare a erorilor cu ajutorul testului Breusch-Godfrey (cu 12 laguri). Prezentai i comentai rezultatele obinute n comparaie cu cele obinute iniial (punctul j).

Probabilitile aferente ne confirm prezena corelaiei seriale a erorilor, fiind mai mari
dect ambele praguri de seminificaie (1% i 5%).
Totui testul Durbin-Watson (1,952477) poate sugera prezena corelaiei seriale slabe a
erorilor.

m) Testai dac modelul iniial de regresie respect ipoteza 4 a CLRM (sub forma (E[
x tu t

]=0)) i prezentai rezultatul obinut.

Observm c media este foarte apropiat de zero, prin urmare putem afirma ca ipoteza 4
a CLRM este respectat.
n) Testai ipoteza de normalitate a erorilor modelului cu ajutorul testului Jarque-Bera.
Prezentai i comentai rezultatele obinute.

Conform rezultatelor testului Jarque-Bera i probabilitii aferente erorile nu sunt


distribuite normal. Distribuia normal a erorilor este important n special cnd se dorete

realizarea de prognoze pe baza ecuaiei econometrice estimate. n cazul nostru nu este posibil
previzionarea preului aciunii GE n funcie de evoluia indicelui DJIA.
o) Prezentai graficul reziduurilor modelului. Examinai seria reziduurilor i identificai
valoarea cea mai mare (n modul) nregistrat la nivelul acestora. Definii o variabil dummy
pentru eliminarea influenei acestei valori i re-estimai modelul de regresie iniial incluznd
variabila dummy definit. Testai ipoteza de normalitate a erorilor pentru noua regresie estimat,
prezentai i comentai rezultatele obinute.

Conform rezultatelor testului Jarque-Bera i probabilitii aferente erorile nu sunt


distribuite normal. Distribuia normal a erorilor este important n special cnd se dorete
realizarea de prognoze pe baza ecuaiei econometrice estimate. n cazul nostru nu este posibil
previzionarea preului aciunii GE n funcie de evoluia indicelui DJIA.

p) Testai dac forma liniar a modelului este corect cu ajutorul testului RESET al lui
Ramsey (considernd puterile a doua i a treia ale lui y). Prezenta i i comentai rezultatele
obinute.

Conform probabilitilor aferente, mai micidect cele dou praguri de seminifiaie (1% i
5%), modelul este liniar att pentru puterea a doua, ct i pentru puterea a treia ale lui y.
q) Testai stabilitatea n timp a parametrilor estimai prin intermediul unui test Chow
(divizai seria de date iniial n dou sub-perioade egale) i a unui test predictive failure de tip

forward (se va face predicia ultimelor 10% din observaiile seriei de date iniiale). Prezenta i i
comentai rezultatele obinute.

Probabilitile aferente fiind mari dect pragurile de semnificaie alese (1% i 5%) reiese
c ipoteza nul este acceptat.

Probabilitatea aferente fiind mai mari dect pragurile de semnificaie alese (1% i 5%)
reiese c ultimele 10% valori nu sunt estimate corect.

r) Testai stabilitatea n timp a parametrilor cu ajutorul testului QLR, asigurnd existen a


a cel puin 100 observaii la fiecare capt al seriei de date. Prezenta i i comenta i rezultatele
obinute. Care este momentul de timp, identificat de testul QLR, unde este cel mai probabil s se
fi nregistrat o modificare structural?

Probabilitile aferente fiind peste pragurile de semnificaie, reiese c parametrii nu sunt


stabili n timp. Conform testului QLR n data de 28 ianuarie 2009 este cel mai probabil s se fi
ntmplat o modificare structural.

s) Prezentai graficele evoluiei valorilor estimate pentru cei doi parametri prin regresii
recursive. Se observ o stabilizare n timp a acestora? Prezentai graficele de evolu ie a
statisticilor testelor CUSUM i CUSUMSQ i stabilii pe baza lor dac parametrii modelului sunt
stabili n timp.

Pentru ecuaia analizat coeficienii sunt stabili acetia nedepind benzile de variaie.

Conform graficelor de evoluie a statisticilor testelor CUSUM i CUSUMSQ observm


c parametrii nu sunt stabili n timp, linia albastr depind limitele stabilite.
3. Regresia liniar multipl.
a) Estimai un nou model de regresie pentru rentabilitatea ac iunii alese n care ve i
introduce ca variabile explicative att rentabilitatea indicelui ales iniial dar i variabilele
suplimentare selectate mai sus.
- Prezentai rezultatele obinute i, pe baza rezultatelor t-statistic, stabilii dac coeficienii
estimai sunt semnificativi pentru un prag de semnificaie de 1%, respectiv de 5%.

- Interpretai valoarea estimat a fiecrui coeficient. Sunt valorile/semnele acestora n


concordan cu teoria financiar sau cu intuiia proprie?
- Interpretai rezultatul testului F-statistic pentru modelul de regresie estimat.

Pentru termenul liber:


t calculat =0,767136 < t tabelat = 2,330.
t calculat =0,767136 < t tabelat = 1,646.

Pentru DJIA:
t calculat =1,469750 < t tabelat = 2,330.
t calculat =1,469750 < t tabelat = 1,646.

Pentru DUMMY:
t calculat =0,047113 < t tabelat = 2,330.

t calculat =0,047113 < t tabelat = 1,646.


Pentru VOLUM:
t calculat =0,491095 < t tabelat = 2,330.
t calculat =0,491095 < t tabelat = 1,646.
Pentru RUSSELL3000:
t calculat =0,491095 > t tabelat = 2,330.
t calculat =0,491095 > t tabelat = 1,646.

Observm c valoarea

t calculat

este mai mic dect valoarea

t tabelat

att pentru pragul

de semnificaie 1%, ct i pentru pragul de semnificaie 5%, pentru parametrii C, DJIA,DUMMY


i VOLUM, prin urmare nu vom respinge ipoteza nul, deci aceti coeficien i nu este
semnificativ diferii de zero.
Pentru RUSSELL 3000 valoarea

t calculat

este mai mare dect valoarea

t tabelat

att

pentru pragul de semnificaie 1%, ct i pentru pragul de semnifica ie 5%, prin urmare vom
respinge ipoteza nul, deci acest coeficient este semnificativ diferit de zero.
Valoarea VOLUM nu este n concordan cu teoria economic, n timp ce celelalte valori
sunt n concordan cu teoria economic.
Ftabelat =3,02
F statistic =769,6743 > 3,02

=>

modelul este semnificativ din punct de vedere statistic, lucru

confirmat i de probabilitatea foarte mic aferent testului (0,0000).


b) Testai ipoteza multipl conform creia toi coeficienii variabilelor suplimentare
incluse n model sunt egali cu 0. Prezentai i interpretai rezultatele acestui test, precum i
consecinele asupra modelului estimat.

Eroarea estimrii acestor coeficieni este una destul de mic, prin urmare probabilitatea
ca ei s nu fie semnificativi diferii de zero este una mic.
c) Cretei gradual numrul de variabile incluse n model pornind de la regresia simpl
iniial i adugnd pe rnd fiecare variabil suplimentar pn le include i pe toate. Prezenta i i
explicai evoluia lui R2 i a lui cu fiecare variabil introdus n model.

Coeficientul de determinare

R2

crete cu fiecare variabil introdus de la 0,3073%

pn la 56,57%.
d) Studiai prezena multicoliniaritii la nivelul modelului de regresie care include toate
variabilele suplimentare selectate. n acest sens, prezentai i analizai matricea de corela ie a
variabilelor explicative i identificai cel mai mare coeficient de corelaie nregistrat (n modul).
Pentru cazul identificat, estimai dou noi modele de regresie n care vei elimina pe rnd
cte una dintre cele dou variabile corelate. Comentai rezultatele obinute i efectele asupra
celorlali coeficieni estimai.

Cel mai mare coeficient de corelaie este ntre RUSSELL 3000 i variabila DUMMY.

n cazul ecuaiei care conine RUSSELL 3000 valorile coeficienilor sunt mai apropiate
de teoria economic.

S-ar putea să vă placă și