Interpretare Regresie

1
I. Sursa de date

Ca baz de date pentru realizarea acestei aplicaii am ales tipurile de evenimente care
afecteaz riscul operaional i am dorit sa analizez modul n care influeneaz pierderea ateptat
a bncii. n scopul facilitrii calculelor pe care le presupune realizarea de prognoze bazate pe
modele econometrice este indicat utilizarea programelor specializate. Un astfel de program este
EViews a crui aplicare, pe lng faptul c reduce semnificativ timpul destinat analizelor
econometrice, asigur i o mare exactitate a calculelor, iar interpretarea rezultatelor este facil.
O condiie fundamental ce trebuie ndeplini nainte de a realiza previziuni pe baza
modelelor econometrice este verificarea caracterului staionar al seriilor de timp
1
. Este esenial
ca seriile nestaionare s fie tratate ntr-un mod diferit fa de seriile staionare. Corelaia dintre
seriile nestaionare tinde s fie foarte ridicat (de obicei, n astfel de cazuri, coeficienii R ptrat
i R ptrat ajustat sunt foarte ridicai), dar corelaia nu este concludent deoarece ea se poate
datora unor trenduri comune (stohastice) existente n seriile respective. Exist mai multe
modaliti de a defini o serie staionar, dar se poate afirma n cel mai simplist scenariu c o serie
staionar este aceea ce nu i schimb proprietile n timp. Are medie constant, variana
constant i autocovariana pentru fiecare lag constant.

Analiza staionaritii seriilor
Aceast etap presupune verificarea msurii n care procesul stohastic este staionar
(medie i dispersie constant). Aceasta implic eliminarea componentei sezoniere a procesului
(dac acesta conine astfel de fluctuaii). n cazul n care seria nu este staionar, prin
difereniere, se obine o serie staionar. Astfel, ordinul de integrare a seriei reprezint numrul
de diferenieri succesive necesare pentru obinerea unei serii staionare (sau numrul de rdcini
unitare al seriei). n economie, cele mai ntlnite serii nestaionare sunt integrate de ordinul I
(necesit o singur difereniere, au o rdcin unitar).

1
Caraterul staionar al seriilor de timp pentru aceast analiz este ilustrat n Anex

2

Eviews pune la dispoziie mai multe teste de staionaritate printre care cel mai cunoscut este
Augumented Dickey-Fuller).
Prima parte a testului prezint informaii cu privire la tipul testului (AFD, variabilele
exogene introduse constant, trend) i cuprinde rezultatul testului, valorile critice pentru fiecare
nivel de relevan (1, 5 i 10 la sut), i probabilitatea, p, asociat rezultatului testului.
Perechea de ipoteze este urmtoarea: :
0
H seria este nestaionar, are o radacin unitate
:
1
H seria este staionar
Utiliznd valoarea p, este acceptat ipoteza nul seria este nestaionar pentru un
anumit nivel de relevan, ori de cte ori probabilitatea p este mai mare dect acel nivel de
relevan.
Trebuie menionat c testele de radacin unitar folosesc ipoteza random-walk. Statistica ce
apare aici se numete X (tau), iar repartiia ei a fost studiat de Dickey i Fuller. Se calculeaz
din datele eantionului valoarea X , fie ea X , care se compar cu valorile critice
crt
X
corespunztoare unui prag de ncredere de 1%, 5%, sau 10%. Apoi lum decizia:
y dac X <
crt
X , respingem ipoteza nul, acceptm c seria nu e RW (staionar)
y dac X >
crt
X , acceptam :
0
H seria analizat este considerat RW, are o radacin unitate.
O consecin a nestaionaritii este regresia fals, dat de faptul c seriile de timp
nestaionare pot determina concluzii statistice neconforme cu realitatea. Punem n eviden toate
regulile de validare, prezena unei dependene liniare ntre dou variabile observate prin serii de
timp, variabile care de fapt nu sunt dependente.
Decizia n testul ADF este la fel ca i n cazul testului t-Student de semnificaie pentru
coeficientul modulului de regresie, doar c aici statistica folosit este statistica . Testul prezint
urmtorul output:

3

Figura nr. 10 : Testul Augmented Dickey-Fuller

Dup cum se poate observa, constanta inclus n testul ADF este semnificativ din punct
de vedere statistic (probabilitatea asociat testului t este mai mic dect 5%, i anume 0.00000).

4

Durbin Watson statistic (DW) este un test statistic care testeaz corelaia serial a
erorilor. Dac erorile nu sunt corelate, atunci valoarea lui DW va fi n jur de 2. n exemplul de
mai sus acest indicator are valoarea 1,85, i ca urmare, nu exist corelaie serial a erorilor.
Testul ADF are ipoteza nul c seria analizat conine o rdcin unitar, un unit root
(nu este staionar). Dup cum se poate observa n figura de mai sus, probabilitatea asociat
acestui test este 0.0000, deci ipoteza nul se respinge i putem afirma c seria este staionar.
De asemenea decizia pe care o lum n urma comparaiei dintre X i
crt
X este urmtoarea
: Cum X <
crt
X , adic -6.513623< -3.584743 , resping ipoteza nul i accept c seria este
staionar. Cum valoarea testului este mai mic dect valoarea critic pentru oricare dintre
nivelele de relevan, alegnd nivelul de relevan cel mai restrictiv, 1 la sut, se poate spune c
la 1% nivel de relevan, ipoteza nul (seria este nestaionar) este respins.
Din outputul testului DF putem obine si coeficieni modelului :
y
t
=- 3061139 1,024279* y
t-1

Rezultatul regresiei
Forma general a unui model de regresie liniar multipl este: Yt=0+1*Xt+.nXn+
Regresia modelului ales cuprinde dou variabile independente, astfel forma modelului este:
Yt=
0
+
1
X
1
+
2
X
2
+
3
X
3
+
4
X
4
+ ; unde:
Yt=variabila dependent reprezentat de pierderea ateptat;
X
1
=variabila independent reprezentat de frauda extern;
X
2
=variabila independent reprezentat de frauda intern;
X
3
=variabila independent reprezentat de perturbrile n activitate i defeciuni de sistem
X
4
=variabila independent reprezentat de practicile angajailor i msurile de siguran
0
=termen liber;
1=senzitivitatea lui Y n raport cu X
1
i arat cu cte uniti se modific Y (pierderea
ateptat) atunci cnd X
1
(frauda extern) crete cu o unitate
2=senzitivitatea lui Y n raport cu X
2
i arat cu cte uniti se modific Y (PIB-ul) atunci
cnd X2 (frauda intern) crete cu o unitate
3
= senzitivitatea lui Y n raport cu X
3
ateptat) atunci cnd X1 (perturbrile n activitate i defectuni de sistem) crete cu o unitate
4
= senzitivitatea lui Y n raport cu X
3
ateptat) atunci cnd X1 (practicile angajailor i msurile de siguran) crete cu o unitate

5

n urma estimrii parametrilor n Eviews,s-a obinut ecuaia:

PIERDERE_ASTEPTATA = C(1) + C(2)*FRAUDA_EXTERNA(-1) +
C(3)*FRAUDA_INTERNA(-1) + C(4)*PERTURBARI_ACT + C(5)*PRACTICI_ANG

Prin nlocuirea parametrilor obinem:

PIERDEREA_ASTEPTATA = 5049642.862 + 0.9391557287*FRAUDA_EXTERNA(-1) +
1.121910904*FRAUDA_INTERNA(-1) - 0.349877787*PERTURBARI_ACT -
156.8919048*PRACTICI_ANG

Am folosit variabilele independente reprezentate de frauda intern i frauda extern
deoarece sunt mai greu de observant n timp real.
Figura nr. 11: Rezultatele regresiei

Verificarea ipotezei nule (testul t)
Pentru a verifica ipoteza nul, vom testa, parial, modelul econometric cu ajutorul
testului t. Acest test verific daca parametrii modelului difer sau nu semnificativ de 0. n acest
caz, emitem ipoteza nul, conform creia parametrii (0,1, 2) ar fi 0.

6

b0= estimaia parametrului 0= 5.049.643
b1=estimaia parametrului 1= 0,939156
b2=estimaia parametrului 2= 1,121911
b
3
=estimaia parametrului
3
= -0,349878
b
4
=estimaia parametrului
4
= -156,8919
Testul t pentru b0 = 4,129812
Testul t pentru b1= 4,393366
Testul t pentru b2= 4.526475
Testul t pentru b3 =-0,096365
Testul t pentru b4 = -3,698217
Probabilitatea asociat parametrilor este:
Pt 0=0.0002 < 0,05 ,ceea ce nseamn c acest parametru este statistic semnificativ
Pt 1=0.0001 < 0.05, adic i acest parametru difer semnificativ de 0
Pt 2=0.001 < 0.05, ceea ce nseamn c acest parametru este statistic semnificativ
Pt 3=0,9237 >0,05 nu este semnificativ diferit de 0, adica perturbrile n activitate i defeciuni
de sistem nu sunt relevante n evaluarea modelului
Pt 4=0,007 <0.05, acest parametru este semnificativ diferit de 0
tim ca validitatea modelului de regresie este dat de testul F-statistic. Astfel,
probabilitatea testului F-statistic este de 0,0000 are o valoare foarte mic , deci acceptam ipoteza
alternativ conform creia modelul de regresie construit este valid. Probabilitatea asociat
termenului liber este de 0,0002 i se afl n intervalul de incertitudine deoarece valoarea acestuia
este mai mic decat 5%. Valoarea testului Durbin-Watson este de 1,72 , fiind apropiat de
valoarea 2 rezult c erorile sunt independente.

Raportul de determinaie (R
2
)
Acest raport se utilizeaz pentru a stabili calitatea modelului. Valorile posibile ale acestui raport
se regsesc n intervalul [0,1].Cu ct valorile sunt mai apropiate de valoarea 1,cu att modelul
este mai bun.
R
2
=

=60,37%
Raportul de determinaie ne arat ce procent din variana lui Y poate fi atribuit
factorilor semnificativi. n cazul nostru acesta are valoarea: 0.603714, fapt ce relev c
aproximativ 60,37% din Y (pierderea asteptata) se datoreaz variaiei fraudei externa ,fraudei
interne, perturbarilor in activitate si defectiuni de system si practicilor angajatilor si masurile de
siguranta, restul variaiei fiind influenat n proporie de 39,63 % de ctre alti factori.
Coeficientul de determinatie nu este ajustat cu gradele de libertate. Vom calcula valoarea
ajustat a acestuia dupa formula: 1
. (k=numrul de grade de libertate) Astfel

obinem R
2
ajustat = 0,564085.

7

Testul Jarque-Bera
Construirea ipotezelor
S i K ia iuuilo ua o aii noal
B S au K ia nu noal aia

Testul Jarque-Bera msoar diferena dintre Skewness i Kurtosis-ul seriei fa de
cele corespunztoare distribuiei normale. Statistica testului se calculeaz astfel:
? A
2 2
) 3 (
6

! K S
k N
JB

unde: S - Skewness
K- Kurtosis
k numrul de coeficieni estimai care sunt folosii pentru a crea seriile
Sub ipoteza nul a unei distribuii normale statistica Jarque-Bera este distribuit G
2
cu 2
grade de libertate. Probabilitatea ataat testului reprezint probabilitatea ca statistica Jarque-
Bera s fie mai mare dect valoarea observat sau ipoteza nul. Aadar, o probabilitate mic
duce la respingerea ipotezei nule (de normalitate).
Figura nr.12 : Testul Jarque-Bera

8

Coeficientul de asimetrie (skewness) este: 1.204771 ceea ce indica o asimetrie catre
dreapta kurtosis are valoarea de 4,34 inseamna ca distributia este mai inalta,seria este
leptocurtica,exista o abatere larga a valorilor extreme de la media lor.

Figura nr. 13: Evoluia tipurilor de evenimente i a pierderii ateptate n perioada 2007-2010

9

Testarea prezenei heteroscedasticitii-Testul White

Testul White se refera la egala mprastiere a erorii n raport cu ansamblul factorilor,
motiv pentru care apeleaza la analiza de regresie a erorii n raport cu factorii.
Pasul 1. Se estimeaz parametrii din modelul liniar de regresie multipl (sau unui alt
model de tip estimare a mediei):
0 1 ,1 ,
... 1, 2,....,
t t k t k t
y x x e t T F F F ! ! i salvm reziduurile
1 2
, ,...,
T
r r r .
Pasul 2. Folosim modelul de regresie
2 2 2
0 1 1
... 1, 2,....,
t t q t q t
r r r v t T K K K

! ! unde
t
v este termenul eroare (presupus
normal de medie 0).
Pasul 3. Testm ipotez nul:
0 1
: 0 H K ! i
2
0 K ! i 0
q
K ! cu alternativa
1
: H mcar unul dintre coeficieni este diferit de zero.

10

Figura nr. 14: Rezultatul testului White:

Folosim concluziile: 1) fiecare coeficient din regresia auxiliar este statistic diferit de
zero ( p-value corespunztoare mici);
2) testul F ne spune acelai lucru pentru ansamblul coeficienilor.
Deci, putem respinge ipoteza nul:
0 1
: 0 H K ! i
2
0 K !
i prin asta acceptm ipoteza alternativ:
1
: H mcar unul dintre coeficieni este diferit de zero.
Vom completa analiza termenilor reziduali cu testul White pentru a verifica urmele de
heteroschedasticitate. Pentru a ne asigura c nu mai exist efecte de heteroschedasticitate (sau

11

efecte GARCH) reziduale din nou valoarea probabilitii trebuie s fie mai mare de 0.05. n acest
caz coeficientul vizat este STD_REZID^2(-1). Valoarea probabilitii pentru acest coeficient de
0.1457 indic faptul c putem accepta ipoteza nul nu exist efecte GARCH reziduale.
Concluzionm faptul c avem heteroscedasticitate n date.Cea mai important parte a
output-ului testului este prima parte care prezint cele dou teste statistice F-Statistic i R-
squared i probabilitile asociate acestor teste. Ipoteza nul a celor dou teste este c nu exist
corelaie serial a erorilor ecuaiei de regresie pn la lag-ul k (specificat mai sus). Dac
probabilitatea asociat celor dou teste este inferioar nivelului de relevan la care se lucreaz,
atunci ipoteza nul este respins, deci se respinge inexistena corelaiei seriale. n caz contrar
ipoteza nul este acceptat, (nu exist corelaie serial).

12

4. Analiza coeficienilor de autocolelaie a erorilor

Dac coeficientul de autocorelaie estimat V
j
nu aparine intervalului (

, atunci ipoteza nul este respins i decidem c seria de timp nu provine dintr-un zgomot alb
Gaussian.
Avnd n vedere faptul c T=45 (numrul de valori al seriei de timp) un interval de
ncredere 95% este I= (-0.292179; 0.292179)
Lag 1 : 0.122(-0.292179; 0.292179) ipoteza nul este acceptat , iar coeficientul de
corelaie estimate pentru lagul q este zero.

13

Lag 2 : -0.009 ( (-0.295481; 0.295481), ipoteza nul este acceptat , iar coeficientul de
corelaie estimate pentru lagul 2 este zero.
n forma de mai sus intervalele de ncredere 95% nu depind de lag. Acest aspect nu este natural,
n special pentru lag-urile apropiate de momentul final T. O corecie n acest sens este obtinut prin
nlocuierea variaei s
j
2
cu valoarea s
j
2
=
n descrierea intervalelor de ncredere. De exemplu,

intervalul de ncredere 95% pentru coeficientul de autocorelaie V
j
este (

).

Testul de multicoliniaritate

Multicoliniaritatea se refer strict la existena mai multor relaii liniare, iar termenul dec
oliniaritate se refer la existena unei singure relaii liniare.Aceast distincie nu se face n practic,
folosindu-se n ambele situaii termenul de multicoliniaritate.

In cazul a dou variabile explicative, intercorelaia lor se msoar cu coeficientul
de corelaie simpl dintre ele. Intercorelaia n cazul mai multor variabile
explicative se msoar cu ajutorul coeficienilor de corelaie parial sau prin
coeficientul de corelaie multiplR ntre variabilay i variabilelexi.

Interpretare Regresie

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Interpretare Regresie

Încărcat de

Drepturi de autor:

Formate disponibile

1

. (k=numrul de grade de libertate) Astfel

S i K ia iuuilo ua o aii noal

n descrierea intervalelor de ncredere. De exemplu,

S-ar putea să vă placă și