Sunteți pe pagina 1din 13

1

I. Sursa de date

Ca baz de date pentru realizarea acestei aplicaii am ales tipurile de evenimente care
afecteaz riscul operaional i am dorit sa analizez modul n care influeneaz pierderea ateptat
a bncii. n scopul facilitrii calculelor pe care le presupune realizarea de prognoze bazate pe
modele econometrice este indicat utilizarea programelor specializate. Un astfel de program este
EViews a crui aplicare, pe lng faptul c reduce semnificativ timpul destinat analizelor
econometrice, asigur i o mare exactitate a calculelor, iar interpretarea rezultatelor este facil.
O condiie fundamental ce trebuie ndeplini nainte de a realiza previziuni pe baza
modelelor econometrice este verificarea caracterului staionar al seriilor de timp
1
. Este esenial
ca seriile nestaionare s fie tratate ntr-un mod diferit fa de seriile staionare. Corelaia dintre
seriile nestaionare tinde s fie foarte ridicat (de obicei, n astfel de cazuri, coeficienii R ptrat
i R ptrat ajustat sunt foarte ridicai), dar corelaia nu este concludent deoarece ea se poate
datora unor trenduri comune (stohastice) existente n seriile respective. Exist mai multe
modaliti de a defini o serie staionar, dar se poate afirma n cel mai simplist scenariu c o serie
staionar este aceea ce nu i schimb proprietile n timp. Are medie constant, variana
constant i autocovariana pentru fiecare lag constant.

Analiza staionaritii seriilor
Aceast etap presupune verificarea msurii n care procesul stohastic este staionar
(medie i dispersie constant). Aceasta implic eliminarea componentei sezoniere a procesului
(dac acesta conine astfel de fluctuaii). n cazul n care seria nu este staionar, prin
difereniere, se obine o serie staionar. Astfel, ordinul de integrare a seriei reprezint numrul
de diferenieri succesive necesare pentru obinerea unei serii staionare (sau numrul de rdcini
unitare al seriei). n economie, cele mai ntlnite serii nestaionare sunt integrate de ordinul I
(necesit o singur difereniere, au o rdcin unitar).


1
Caraterul staionar al seriilor de timp pentru aceast analiz este ilustrat n Anex

2

Eviews pune la dispoziie mai multe teste de staionaritate printre care cel mai cunoscut este
Augumented Dickey-Fuller).
Prima parte a testului prezint informaii cu privire la tipul testului (AFD, variabilele
exogene introduse constant, trend) i cuprinde rezultatul testului, valorile critice pentru fiecare
nivel de relevan (1, 5 i 10 la sut), i probabilitatea, p, asociat rezultatului testului.
Perechea de ipoteze este urmtoarea: :
0
H seria este nestaionar, are o radacin unitate
:
1
H seria este staionar
Utiliznd valoarea p, este acceptat ipoteza nul seria este nestaionar pentru un
anumit nivel de relevan, ori de cte ori probabilitatea p este mai mare dect acel nivel de
relevan.
Trebuie menionat c testele de radacin unitar folosesc ipoteza random-walk. Statistica ce
apare aici se numete X (tau), iar repartiia ei a fost studiat de Dickey i Fuller. Se calculeaz
din datele eantionului valoarea X , fie ea X , care se compar cu valorile critice
crt
X
corespunztoare unui prag de ncredere de 1%, 5%, sau 10%. Apoi lum decizia:
y dac X <
crt
X , respingem ipoteza nul, acceptm c seria nu e RW (staionar)
y dac X >
crt
X , acceptam :
0
H seria analizat este considerat RW, are o radacin unitate.
O consecin a nestaionaritii este regresia fals, dat de faptul c seriile de timp
nestaionare pot determina concluzii statistice neconforme cu realitatea. Punem n eviden toate
regulile de validare, prezena unei dependene liniare ntre dou variabile observate prin serii de
timp, variabile care de fapt nu sunt dependente.
Decizia n testul ADF este la fel ca i n cazul testului t-Student de semnificaie pentru
coeficientul modulului de regresie, doar c aici statistica folosit este statistica . Testul prezint
urmtorul output:



3

Figura nr. 10 : Testul Augmented Dickey-Fuller


Dup cum se poate observa, constanta inclus n testul ADF este semnificativ din punct
de vedere statistic (probabilitatea asociat testului t este mai mic dect 5%, i anume 0.00000).

4

Durbin Watson statistic (DW) este un test statistic care testeaz corelaia serial a
erorilor. Dac erorile nu sunt corelate, atunci valoarea lui DW va fi n jur de 2. n exemplul de
mai sus acest indicator are valoarea 1,85, i ca urmare, nu exist corelaie serial a erorilor.
Testul ADF are ipoteza nul c seria analizat conine o rdcin unitar, un unit root
(nu este staionar). Dup cum se poate observa n figura de mai sus, probabilitatea asociat
acestui test este 0.0000, deci ipoteza nul se respinge i putem afirma c seria este staionar.
De asemenea decizia pe care o lum n urma comparaiei dintre X i
crt
X este urmtoarea
: Cum X <
crt
X , adic -6.513623< -3.584743 , resping ipoteza nul i accept c seria este
staionar. Cum valoarea testului este mai mic dect valoarea critic pentru oricare dintre
nivelele de relevan, alegnd nivelul de relevan cel mai restrictiv, 1 la sut, se poate spune c
la 1% nivel de relevan, ipoteza nul (seria este nestaionar) este respins.
Din outputul testului DF putem obine si coeficieni modelului :
y
t
=- 3061139 1,024279* y
t-1

Rezultatul regresiei
Forma general a unui model de regresie liniar multipl este: Yt=0+1*Xt+.nXn+
Regresia modelului ales cuprinde dou variabile independente, astfel forma modelului este:
Yt=
0
+
1
X
1
+
2
X
2
+
3
X
3
+
4
X
4
+ ; unde:
Yt=variabila dependent reprezentat de pierderea ateptat;
X
1
=variabila independent reprezentat de frauda extern;
X
2
=variabila independent reprezentat de frauda intern;
X
3
=variabila independent reprezentat de perturbrile n activitate i defeciuni de sistem
X
4
=variabila independent reprezentat de practicile angajailor i msurile de siguran

0
=termen liber;
1=senzitivitatea lui Y n raport cu X
1
i arat cu cte uniti se modific Y (pierderea
ateptat) atunci cnd X
1
(frauda extern) crete cu o unitate
2=senzitivitatea lui Y n raport cu X
2
i arat cu cte uniti se modific Y (PIB-ul) atunci
cnd X2 (frauda intern) crete cu o unitate

3
= senzitivitatea lui Y n raport cu X
3
i arat cu cte uniti se modific Y (pierderea
ateptat) atunci cnd X1 (perturbrile n activitate i defectuni de sistem) crete cu o unitate

4
= senzitivitatea lui Y n raport cu X
3
i arat cu cte uniti se modific Y (pierderea
ateptat) atunci cnd X1 (practicile angajailor i msurile de siguran) crete cu o unitate


5

n urma estimrii parametrilor n Eviews,s-a obinut ecuaia:

PIERDERE_ASTEPTATA = C(1) + C(2)*FRAUDA_EXTERNA(-1) +
C(3)*FRAUDA_INTERNA(-1) + C(4)*PERTURBARI_ACT + C(5)*PRACTICI_ANG

Prin nlocuirea parametrilor obinem:


PIERDEREA_ASTEPTATA = 5049642.862 + 0.9391557287*FRAUDA_EXTERNA(-1) +
1.121910904*FRAUDA_INTERNA(-1) - 0.349877787*PERTURBARI_ACT -
156.8919048*PRACTICI_ANG

Am folosit variabilele independente reprezentate de frauda intern i frauda extern
deoarece sunt mai greu de observant n timp real.
Figura nr. 11: Rezultatele regresiei


Verificarea ipotezei nule (testul t)
Pentru a verifica ipoteza nul, vom testa, parial, modelul econometric cu ajutorul
testului t. Acest test verific daca parametrii modelului difer sau nu semnificativ de 0. n acest
caz, emitem ipoteza nul, conform creia parametrii (0,1, 2) ar fi 0.

6

b0= estimaia parametrului 0= 5.049.643
b1=estimaia parametrului 1= 0,939156
b2=estimaia parametrului 2= 1,121911
b
3
=estimaia parametrului
3
= -0,349878
b
4
=estimaia parametrului
4
= -156,8919
Testul t pentru b0 = 4,129812
Testul t pentru b1= 4,393366
Testul t pentru b2= 4.526475
Testul t pentru b3 =-0,096365
Testul t pentru b4 = -3,698217
Probabilitatea asociat parametrilor este:
Pt 0=0.0002 < 0,05 ,ceea ce nseamn c acest parametru este statistic semnificativ
Pt 1=0.0001 < 0.05, adic i acest parametru difer semnificativ de 0
Pt 2=0.001 < 0.05, ceea ce nseamn c acest parametru este statistic semnificativ
Pt 3=0,9237 >0,05 nu este semnificativ diferit de 0, adica perturbrile n activitate i defeciuni
de sistem nu sunt relevante n evaluarea modelului
Pt 4=0,007 <0.05, acest parametru este semnificativ diferit de 0
tim ca validitatea modelului de regresie este dat de testul F-statistic. Astfel,
probabilitatea testului F-statistic este de 0,0000 are o valoare foarte mic , deci acceptam ipoteza
alternativ conform creia modelul de regresie construit este valid. Probabilitatea asociat
termenului liber este de 0,0002 i se afl n intervalul de incertitudine deoarece valoarea acestuia
este mai mic decat 5%. Valoarea testului Durbin-Watson este de 1,72 , fiind apropiat de
valoarea 2 rezult c erorile sunt independente.

Raportul de determinaie (R
2
)
Acest raport se utilizeaz pentru a stabili calitatea modelului. Valorile posibile ale acestui raport
se regsesc n intervalul [0,1].Cu ct valorile sunt mai apropiate de valoarea 1,cu att modelul
este mai bun.
R
2
=

=60,37%
Raportul de determinaie ne arat ce procent din variana lui Y poate fi atribuit
factorilor semnificativi. n cazul nostru acesta are valoarea: 0.603714, fapt ce relev c
aproximativ 60,37% din Y (pierderea asteptata) se datoreaz variaiei fraudei externa ,fraudei
interne, perturbarilor in activitate si defectiuni de system si practicilor angajatilor si masurile de
siguranta, restul variaiei fiind influenat n proporie de 39,63 % de ctre alti factori.
Coeficientul de determinatie nu este ajustat cu gradele de libertate. Vom calcula valoarea
ajustat a acestuia dupa formula: 1

. (k=numrul de grade de libertate) Astfel


obinem R
2
ajustat = 0,564085.



7

Testul Jarque-Bera
Construirea ipotezelor

S i K ia iuuilo ua o aii noal

B S au K ia nu noal aia


Testul Jarque-Bera msoar diferena dintre Skewness i Kurtosis-ul seriei fa de
cele corespunztoare distribuiei normale. Statistica testului se calculeaz astfel:
? A
2 2
) 3 (
6

! K S
k N
JB

unde: S - Skewness
K- Kurtosis
k numrul de coeficieni estimai care sunt folosii pentru a crea seriile
Sub ipoteza nul a unei distribuii normale statistica Jarque-Bera este distribuit G
2
cu 2
grade de libertate. Probabilitatea ataat testului reprezint probabilitatea ca statistica Jarque-
Bera s fie mai mare dect valoarea observat sau ipoteza nul. Aadar, o probabilitate mic
duce la respingerea ipotezei nule (de normalitate).
Figura nr.12 : Testul Jarque-Bera


8

Coeficientul de asimetrie (skewness) este: 1.204771 ceea ce indica o asimetrie catre
dreapta kurtosis are valoarea de 4,34 inseamna ca distributia este mai inalta,seria este
leptocurtica,exista o abatere larga a valorilor extreme de la media lor.

Figura nr. 13: Evoluia tipurilor de evenimente i a pierderii ateptate n perioada 2007-2010


9


Testarea prezenei heteroscedasticitii-Testul White

Testul White se refera la egala mprastiere a erorii n raport cu ansamblul factorilor,
motiv pentru care apeleaza la analiza de regresie a erorii n raport cu factorii.
Pasul 1. Se estimeaz parametrii din modelul liniar de regresie multipl (sau unui alt
model de tip estimare a mediei):
0 1 ,1 ,
... 1, 2,....,
t t k t k t
y x x e t T F F F ! ! i salvm reziduurile
1 2
, ,...,
T
r r r .
Pasul 2. Folosim modelul de regresie
2 2 2
0 1 1
... 1, 2,....,
t t q t q t
r r r v t T K K K

! ! unde
t
v este termenul eroare (presupus
normal de medie 0).
Pasul 3. Testm ipotez nul:
0 1
: 0 H K ! i
2
0 K ! i 0
q
K ! cu alternativa
1
: H mcar unul dintre coeficieni este diferit de zero.












10

Figura nr. 14: Rezultatul testului White:


Folosim concluziile: 1) fiecare coeficient din regresia auxiliar este statistic diferit de
zero ( p-value corespunztoare mici);
2) testul F ne spune acelai lucru pentru ansamblul coeficienilor.
Deci, putem respinge ipoteza nul:
0 1
: 0 H K ! i
2
0 K !
i prin asta acceptm ipoteza alternativ:
1
: H mcar unul dintre coeficieni este diferit de zero.
Vom completa analiza termenilor reziduali cu testul White pentru a verifica urmele de
heteroschedasticitate. Pentru a ne asigura c nu mai exist efecte de heteroschedasticitate (sau

11

efecte GARCH) reziduale din nou valoarea probabilitii trebuie s fie mai mare de 0.05. n acest
caz coeficientul vizat este STD_REZID^2(-1). Valoarea probabilitii pentru acest coeficient de
0.1457 indic faptul c putem accepta ipoteza nul nu exist efecte GARCH reziduale.
Concluzionm faptul c avem heteroscedasticitate n date.Cea mai important parte a
output-ului testului este prima parte care prezint cele dou teste statistice F-Statistic i R-
squared i probabilitile asociate acestor teste. Ipoteza nul a celor dou teste este c nu exist
corelaie serial a erorilor ecuaiei de regresie pn la lag-ul k (specificat mai sus). Dac
probabilitatea asociat celor dou teste este inferioar nivelului de relevan la care se lucreaz,
atunci ipoteza nul este respins, deci se respinge inexistena corelaiei seriale. n caz contrar
ipoteza nul este acceptat, (nu exist corelaie serial).















12

4. Analiza coeficienilor de autocolelaie a erorilor

Dac coeficientul de autocorelaie estimat V
j
nu aparine intervalului (

, atunci ipoteza nul este respins i decidem c seria de timp nu provine dintr-un zgomot alb
Gaussian.
Avnd n vedere faptul c T=45 (numrul de valori al seriei de timp) un interval de
ncredere 95% este I= (-0.292179; 0.292179)
Lag 1 : 0.122(-0.292179; 0.292179) ipoteza nul este acceptat , iar coeficientul de
corelaie estimate pentru lagul q este zero.

13

Lag 2 : -0.009 ( (-0.295481; 0.295481), ipoteza nul este acceptat , iar coeficientul de
corelaie estimate pentru lagul 2 este zero.
n forma de mai sus intervalele de ncredere 95% nu depind de lag. Acest aspect nu este natural,
n special pentru lag-urile apropiate de momentul final T. O corecie n acest sens este obtinut prin
nlocuierea variaei s
j
2
cu valoarea s
j
2
=

n descrierea intervalelor de ncredere. De exemplu,


intervalul de ncredere 95% pentru coeficientul de autocorelaie V
j
este (

).

Testul de multicoliniaritate


Multicoliniaritatea se refer strict la existena mai multor relaii liniare, iar termenul dec
oliniaritate se refer la existena unei singure relaii liniare.Aceast distincie nu se face n practic,
folosindu-se n ambele situaii termenul de multicoliniaritate.

In cazul a dou variabile explicative, intercorelaia lor se msoar cu coeficientul
de corelaie simpl dintre ele. Intercorelaia n cazul mai multor variabile
explicative se msoar cu ajutorul coeficienilor de corelaie parial sau prin
coeficientul de corelaie multiplR ntre variabilay i variabilelexi.