Documente Academic
Documente Profesional
Documente Cultură
SEMINAR 1
1
Gestiune Bancară.
An universitar 2023 - 2024
NOȚIUNI INTRODUCTIVE
1. Partea administrativă
Test - 2
Proiect pct.
1.5 pct.
Activitate
- 0.5 pct.
Detalii TEST:
- Test: penultima activitate de seminar; din toată materia predată pe parcursul
semestrului;
Detalii PROIECT:
- Proiect realizat individual
- Tema propusă: dezvoltarea unui model de scoring pe un eșantion de clienți
- Prezentare în activitate de seminar;
Detalii ACTIVITATE:
- Teme /quiz/răspunsuri la seminar
2
Gestiune Bancară.
An universitar 2023 - 2024
2. Riscul de credit
2.1 Aspecte generale cu privire la riscul de credit. (Seminar 2)
2.2 Conceptul de credit scoring. Indicatorii WoE și IV. Prezentarea regresiei LOGIT și a
rolului ei în crearea unui credit scoring. (Seminar 3)
2.3 Dezvoltarea unui model de credit scoring pentru persoanele fizice. Analiza
performanței unui model de credit scoring (GINI, KS, AUC). (Seminar 4)
2.4 Calculul ratei de default istorice și previzionarea evoluției probabilității de default.
(Seminar 5)
4. Riscul valutar
4.1 Aspecte generale cu privire la riscul valuar. (Seminar 10)
4.2 Aplicație practică – Value at Risk (VaR) pentru portofolii de valute. (Seminar 11)
Gestiune Bancară.
An universitar 2023 - 2024
Pasul 3.
Dupa instalare, se deschide RStudio si se ruleaza codul de mai jos, destinat instalării librăriilor
(trebuie să existe conexiune la internet pentru finalizarea acestui pas):
######################
install.packages("smbinning")
install.packages("tcltk")
install.packages("ROCR")
install.packages("Hmisc")
install.packages("astsa")
install.packages("forecast")
install.packages("ggplot2")
install.packages("graphics")
install.packages("tseries")
install.packages("rugarch")
install.packages("urca")
4
Gestiune Bancară.
An universitar 2023 - 2024
install.packages("xts")
install.packages("zoo")
install.packages("MatchIt")
install.packages("optmatch")
install.packages("gbm")
install.packages("tcltk")
install.packages("twang")
install.packages("survey")
install.packages("MatchIt")
install.packages("optmatch")
install.packages("gbm")
install.packages("tcltk")
install.packages("twang")
install.packages("survey")
######################
ATENȚIE!!! Acest cod poate fi copiat în integralitate și introdus (lipit) în RStudio în partea
stângă, în zona unde apare următorul simbol:
Gestiune Bancară.
An universitar 2023 - 2024
library("ROCR")
library("Hmisc")
library("astsa")
library("forecast")
library("ggplot2")
library("graphics")
library("tseries")
library("rugarch")
library("urca")
library("xts")
library("zoo")
######################
Pentru a verifica dacă librăria a fost activată, vă puteți uita în partea dreaptă la mijloc, la meniul
Packages, dacă caseta aferentă librăriei specificate de dumneavoastră pentru activare a fost
bifată. Pentru "smbinning" de exemplu, activarea corectă presupune afișarea următoarei imagini:
Gestiune Bancară.
An universitar 2023 - 2024
ATENȚIE!!!! Contactați profesorul de seminar pe mail dacă apar probleme la oricare din
pașii precizați în acest suport de seminar doar dacă nu ați găsit o rezolvare pe internet sau
discutând cu colegii. Realizați acest lucru înaintea zilei desfășurării Seminarului 2.
BIBLIOGRAFIE
Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and regression
trees. Pacific Grove, CA: Wadsworth and Brooks/Cole.
Dumitrescu, B. (2020). Instrumente financiare derivate: o abordare practica.Editura ASE.
Siddiqi, N. (2005). Credit Risk Scorecards: Developing and Implementing Intelligent Credit
Scoring. John Wiley, New York.
Steiner, B. (2012). Mastering Financial Calculations, 3rd ed. Harlow: Pearson Education.
Thomas, L.C. (2009). Consumer Credit Models: Pricing, Profit and Portfolios. Oxford University
Press, Oxford.
Resurse online:
Ghidurile emise de Autoritatea Bancară Europeană (ABE) privind Standardele gestionării
riscului de rată a dobânzii: https://www.eba.europa.eu/eba-publishes-final-standards-and-
guidelines-interest-rate-risk-arising-non-trading-book-activities
7
Gestiune Bancară.
An universitar 2023 - 2024
SEMINAR 2
2. Riscul de Credit
Gestiune Bancară.
An universitar 2023 - 2024
Pentru analiza predictibilității comportamentului viitor al unui client generat de o variabilă dată,
care conține mai multe caracteristici sau „bin-uri”, în practică se folosesc doi indicatori:
• Weights of Evidence (WoE) arată puterea predictivă a unei variabile explicative în raport cu
variabila dependentă. Acest indicator este descris în general ca o măsură a separării clienților
buni de cei răi. Denumirea de „Clienți răi” se referă la persoanele care nu au rambursat parțial
sau integral un credit și a fost scoși din portofoliu (de obicei, un client activ este considerat rău
atunci când creditul contractat devine neperformant, adică are mai mult de 90 de zile de
întârziere). „Clienții Buni” sunt aceia care au rambursat integral împrumutul plus dobânda sau
cei activi care au mai puțin de 30 de zile de întârziere la un credit în desfășurare. Formula pentru
indicatorul WoE este redată mai jos:
WoEGi=ln
( % ClientibuniGi
% ClientiraiGi ) (1)
unde % Clienti buni Gi reprezintă procentul clienților buni în total clienți din cadrul unui grup Gi
iar % Clienti raiGi reprezintă procentul clienților răi în total clienți din cadrul aceluiași grup Gi.
Din punct de vedere statistic, indicatorul WoE ne arată punctajele ipotetice pe care ar trebui să le
alocăm fiecărei caracteristici din compoziția unei variabile în condițiile în care acesta este
singura pe care o avem la dispoziție pentru dezvoltarea sistemului de scoring (convențional,
puctajul se calculează ca fiind WoE*100, rotunjit prin lipsă).
• Information Value (IV) este una dintre cele mai utilizate tehnici pentru selecția variabilelor
importante într-un model predictiv. IV este calculat folosind următoarea formulă:
IV Gi=ln
( % Clientibuni Gi
% ClientiraiGi )× ( % Clienti buni Gi−% Clienti raiGi )=WoEGi × ( % Clientibuni Gi−%(2)
Clientirai Gi)
unde % Clienti buni Gi reprezintă procentul clienților buni în total clienți din cadrul unui grup Gi
iar % Clienti raiGi reprezintă procentul clienților răi în total clienți din cadrul aceluiași grup Gi.
Clasificarea unei variabile în funcție de valoarea ei informațională poate fi făcută pe baza
metodologiei propuse de Siddiqi (2006).
9
Gestiune Bancară.
An universitar 2023 - 2024
În cele ce urmează vom calcula acești doi indicatori pentru Rezidență (variabilă
categorială) precum și pentru Vârstă (variabilă continuă).
Analiza Rezidenței
Tabel 2 Statistici descriptive - Rezidență
Caracteristic 1 2
BR3 GR4 Puncta
CR CB % CR % CB WoE IV
i j
39
Chirias 70 109 61% 23.33% 15.57% -0.4044 -41 3.13%
%
41
Cu parintii 44 64 59% 14.67% 9.14% -0.4726 -48 2.61%
%
26
Proprietar 186 527 74% 62.00% 75.29% 0.1942 19 2.58%
%
TOTAL 300 700 100% 100% 8.33%
Pe baza informațiilor din Tabelul 2, putem spune că potențialii clienți care stau în chirie sau
cu părinții vor pleca cu un dezavantaj la accesarea unui împrumut în comparație cu clienții care
dețin proprietatea în care locuiesc deoarece prezintă un risc de default mai ridicat (WoE negativ).
Per total, puterea de discriminare a rezidenței este slabă, valoarea informațională totală fiind
puțin peste 8%. Good Rate (%) se calculează ca fiind procentul clienților buni in total clienți pe
1
CR= număr clienți răi
2
CB= număr clienți buni
3
BR= Bad Rate (%)
4
GR=Good Rate (%)
10
Gestiune Bancară.
An universitar 2023 - 2024
un anumit segment al Rezidenței. De exemplu, Good Rate (%) pentru caracterstica Chirias este
109/(70+109)=61%. Bad Rate (%)=1- Good Rate (%)=39%.
18%
11%
71%
Se poate observa din Figura 1 că majoritatea clienților din eșation (71.3%) dețin o
proprietate însă și celelalte două caracteristici au ponderi destul de însemnate. Din moment ce
fiecare caractersitică deține cel puțin 5% din total observații, putem spune că variabila Rezidență
este bine proporționată.
Analiza Vârstei
Spre deosebire de Rezidență care este o variabilă categorială, vârsta este una continuă.
Pentru a o analiza statistic este nevoie de o împărțire preliminară pe 10 intervale (percentile)
11
Gestiune Bancară.
An universitar 2023 - 2024
egale ca și pondere în total (alegerea numărului de percentile este subiectivă). Rezultatele sunt
prezentate în tabelul de mai jos:
Pe baza informațiilor din Tabelul 3, putem spune cu certitudine că acei potențiali clienți
cu vărsta sub 26 de ani vor pleca cu un dezavantaj la accesarea unui împrumut în comparație cu
clienții care au între 34 și 52 de ani deoarece prezintă un risc de default mai ridicat (WoE
negativ). Clienții cu vârsta între 27 și 33 de ani nu oferă valoare adaugată în perspectiva evaluării
comportamentului viitor comparativ cu celelate două intervale anterior menționate (WoE nu are
un semn stabil iar valoarea informațională a acestui segment este destul de scăzută:
IV 27−33=0.00 % +0.24 %+0.05 %=0.29 %. La nivel agregat, Vârsta are o putere de discriminare
medie.
Gestiune Bancară.
An universitar 2023 - 2024
Pentru asigurarea robusteței unui scorcard este necesar ca numărul de caracteristici ale unei
variabile să nu fie foarte ridicat (patru sau cinci maxim) și, în același timp, fiecare din aceste
caracterstici să conțină cel puțin 5% din numărul total de observații. Este absolut necesar ca bin-
urile create să aibă valori ale WoE diferite ca intensitate, de aceea se recomandă unirea
caracteristicilor cu WoE apropiate și semne identice. După finalizarea etapei anterioare va
trebui să codăm cu _0, _1, ... etc. fiecare grupare în parte în funcție de valoarea ei informațională.
Codarea Rezidenței
TOTAL 8.30%
Codarea Vârstei
Spre deosebire de Rezidență, gruparea Vârstei este mai problematică. După cum am
menționat anterior, primul criteriu de grupare este cel al WoE. În cazul în care avem o variabilă
13
Gestiune Bancară.
An universitar 2023 - 2024
cu mai mult de două bin-uri se recomandă ca reperul (_0) să aibă valoare informațională cea mai
scăzută. Cu toate acestea, la variabilele continue trebuie respectat și principiul ordinii (evitarea
grupării intervalelor care nu sunt consecutive).
Pe baza celor spuse până acum, dacă ne uităm cu atenție la Tabelul 3, putem defini patru
bin-uri. Primul dintre ele este format din clienții cu vârsta până în 25 de ani denumit „18-25”;
această grupare am construit-o deoarece intervalele din componența ei, asa cum au fost
prezentate în Tabelul 3 prezintă valori ale WoE apropiate și identice ca semn. Am decis la
segmentarea grupării inițiale 24-26 ca urmare a realizării unei analize privind importanța acestei
variabile și valorile sale critice pe piața din România. Gruparea „26-34” a fost construită avându-
se în vedere faptul că valoarea ei informațională este scăzută iar intervalele componente nu au
WoE cu același semn. Ultima grupare „35-52” a fost construită mergând de la ideea alipirii
intervalelor cu WoE identice ca semn. Cu toate acestea, clienții cu vârsta de peste 52 de ani au un
WoE negativ, lucru care complică puțin lucrurile. În acestă speță avem două soluții: a) fie
păstrăm intervalul 53+ ca grupare de sine stătătoare, deoarece are cel puțin 5% din observații sau
b) o combinăm cu intervalul 34-52 cu riscul de a diminua puterea de discriminare a acestuia. În
analiza de față am ales prima variantă.
Tabel 5 Analiza statistică a vârstei după grupare
Vârstă Descriere WoE Punctaj IV
_0 53+ -0.0099 0 0.00%
_1 26-34 -0.0605 6 0.13%
_2 35-52 0.4073 41 5.39%
TOTAL 11.31%
În Tabelul 5 sunt prezentate noile rezultate. Se observă că prin această segmentare, valoarea
informațională a acestei caracteristici a crscut cu un punct procentual, dar păstrându-și puterea
medie de discriminare. Un aspect pozitiv care se poate observa totuși după grupare este
14
Gestiune Bancară.
An universitar 2023 - 2024
caracterul monoton crescător pe care il are evoluția WoE, odată cu creșterea vârstei, după cum se
poate observa în Figura 2:
Vârstă
0.6
0.4
0.2
0
18-25 26-34 35-52 53+
-0.2
-0.4
-0.6
WoE Linear (WoE)
Excepție de la această regulă o realizează gruparea 53+, motivația păstrării fiind evidențiată
mai sus. Putem concluziona că pe măsura ce vârstă unui client este mai mare, șansele ca acesta
să își ducă la bun sfârșit obligațiile de plată cresc. Mențiunea este că pentru clienții care depășeșc
vârsta de 53 de ani pot apărea disfuncționalități în achitarea ratelor, printre argumente fiind
reducerea veniturilor acestora sau deteliorarea stării de sănătate.
15
Gestiune Bancară.
An universitar 2023 - 2024
SEMINAR 3
2. Riscul de Credit
Regresia LOGIT
Să presupunem că avem la dispoziție un eșantion al unei bănci comerciale care cuprinde
atât clienți non-default (buni) cât și clienți aflață în stadiul de default (răi). Variabila binară Y i
reprezintă statusul tuturor clienților din eșantion și ia valoarea zero dacă clientul i a intrat în
default și unu în cazul în care clientul este non-default. Fie X i =( X i 1 , X i 2 , … , X ¿ )o matrice care ne
oferă informații calitative și cantitative despre clientul i în momentul în care acesta și-a depus
dosarul de creditare. Situația ideală este cea în care ponderile celor două categorii de clienți
(default și non-default) sunt cât mai apropiate de 50%. În fapt, în bănci și IFN-uri acestea variază
în funcție de tipul de client, de tipul de produs sau alte segmentări disponibile.
Pentru construcția unui scorecard pe baza eșantionului amintit mai sus va trebui să estimăm
următoarea ecuație:
Din păcate, ecuația (1) estimată prin metoda celor mai mici pătrate nu va oferi soluții
eficiente și consistente deoarece ipoteza privind normalitatea erorilor va fi încălcată. Într-adevăr,
pentru ca erorile ε i să aibă o distribuție normală este necesar ca variabila Y i să fie una continuă,
ceea ce nu este cazul. Mai mult decât atât, trebuie să avem în vedere faptul că suma
β 0 + β 1 X i 1 + β 2 X i 2+ …++ β n X ¿ poate lua, cel puțin teoretic, orice valoare din intervalul (−∞ ; ∞ )
pe când E [ Y i ] va putea lua doar două valori, zero și unu. Pentru a rezolva această problemă este
necesar să identificăm o funcție f (•) care, odată aplicată lui E [ Y i ], să ofere un model valid în
contextul în care Y i este binară si să aibă următoarea formă:
16
Gestiune Bancară.
An universitar 2023 - 2024
( ) pi (3)
ln =β 0 + β 1 X i 1+ β2 X i 2 +…+ β n X ¿
1− pi
e
( )=e
ln
pi
1− pi ^β + ^β X + β^ X +…+ ^β X¿
0 1 i1 2 i2 n
(4)
Gestiune Bancară.
An universitar 2023 - 2024
1− pi
^ ^ X + ^β X + …+ ^β X
e β +β
0 1 i1 2 i2 n ¿
(6)
pi = β^ 0+ ^β1 Xi 1+ ^β2 X i2 +…+ ^βn X¿
1+e
Gestiune Bancară.
An universitar 2023 - 2024
coef punctaj
24 de ani 0 -50
Propietar 0 0
Intercept 1,0734 107
Punctaj=107+0-50=57
19
Gestiune Bancară.
An universitar 2023 - 2024
1,0734+0−0,4954
e
Probabilitate sa fie client bun= 1,0734 +0−0,4954 =64,06%
1+ e
Probabilitate = 1-0,6406= 35,94%
Care este probab de default pe baza modelului prezentat pt un client care sta cu parintii si
are 28 ani?
Coef punctaj
28 ani -0,1624 -16
Cu parintii -0,5735 -57
Intercept 1,0734 107
Punctaj=107-57-16=32
1,0734−0,5735−0 , 1624
e
Probabilitatea sa fie client bun= 1,0734−0,5735−0 ,1624
1+ e
=>probabilitatea=58,35%=>probab(client rau)=1-58,35%=35,94%
1.0734+ 0−0.4954
e
pi = 1.0734+0−0.4954
=64.06 %
1+e
Probabilitatea de default este 1-64.06%=35.94%.
Gestiune Bancară.
An universitar 2023 - 2024
#Rezidenta
date$Rezidenta <- as.factor(date$Rezidenta)
result.Rezidenta0=smbinning.factor(df=date,y="Status", x="Rezidenta")
View(result.Rezidenta0$ivtable)
levels(date$Rezidenta)<-c("_1","_1","_0")
date$Rezidenta= factor(date$Rezidenta,levels=c("_0","_1"))
result.Rezidenta=smbinning.factor(df=date,y="Status",x="Rezidenta")
View(result.Rezidenta$ivtable)
#Varsta
# gruparea initiala a variabilei
date$Varsta<-as.factor(
ifelse(date$Varsta<=25,'18-25',
ifelse(date$Varsta<=34,'26-34',
ifelse(date$Varsta<=52,'35-52','53+'))))
result.Varsta0=smbinning.factor(df=date,y="Status",x="Varsta")
View(result.Varsta0$ivtable)
levels(date$Varsta)<-c("_3","_1","_2","_0")
date$Varsta = factor(date$Varsta,levels=c("_0","_1","_2","_3"))
result.Varsta=smbinning.factor(df=date,y="Status",x="Varsta")
View(result.Varsta $ivtable)","WoE","IV")
View(B)
Gestiune Bancară.
An universitar 2023 - 2024
Rezidenta 0 si varsta 0 nu sunt raportate deoarece ele reprezint clasele reper si au by default
coeficientul 0.
***,**,*,. Echivalent coef semnifixativ statistic cu un grad de incredere de risc de
100%,99%,95%,90%
Rezidenta o(propietar) rezulta coeficient 0
Rezidenta 1(churias) rezulta coeficient 0 0,5735