Sunteți pe pagina 1din 22

Gestiune Bancară.

Suport seminar 2023 - 2024


Cadru didactic:
Asist. univ. dr. Cosmin Octavian CEPOI
Email: cosmin.cepoi@fin.ase.ro

SEMINAR 1
1

Gestiune Bancară.
An universitar 2023 - 2024

NOȚIUNI INTRODUCTIVE

1. Partea administrativă

Test - 2
Proiect pct.
1.5 pct.

Activitate
- 0.5 pct.

Punctaj obținut la seminar


4 pct. max.

Detalii TEST:
- Test: penultima activitate de seminar; din toată materia predată pe parcursul
semestrului;
Detalii PROIECT:
- Proiect realizat individual
- Tema propusă: dezvoltarea unui model de scoring pe un eșantion de clienți
- Prezentare în activitate de seminar;
Detalii ACTIVITATE:
- Teme /quiz/răspunsuri la seminar
2

Gestiune Bancară.
An universitar 2023 - 2024

PLANIFICARE ACTIVITĂȚI SEMINAR:


1. Prezentarea materiei (Seminar 1)

2. Riscul de credit
2.1 Aspecte generale cu privire la riscul de credit. (Seminar 2)
2.2 Conceptul de credit scoring. Indicatorii WoE și IV. Prezentarea regresiei LOGIT și a
rolului ei în crearea unui credit scoring. (Seminar 3)
2.3 Dezvoltarea unui model de credit scoring pentru persoanele fizice. Analiza
performanței unui model de credit scoring (GINI, KS, AUC). (Seminar 4)
2.4 Calculul ratei de default istorice și previzionarea evoluției probabilității de default.
(Seminar 5)

3. Riscul de rată a dobânzii


3.1 Analiza bilanțieră a riscului de rată a dobânzii. (Seminar 6)
3.2 Analiza extra-bilanțieră a riscului de rată a dobânzii. (Seminar 7 + Seminar 8)
3.3 Aplicație practică – Modelul GAP. (Seminar 9)

4. Riscul valutar
4.1 Aspecte generale cu privire la riscul valuar. (Seminar 10)
4.2 Aplicație practică – Value at Risk (VaR) pentru portofolii de valute. (Seminar 11)

5. Test (Seminar 12)


6. Proiect (Seminar 13)
3

Gestiune Bancară.
An universitar 2023 - 2024

ASPECTE ESENȚIALE PRIVIND DESFĂȘURAREA SEMINARULUI


1. Instalarea R și Rstudio
Pasul 1.
Se descarca programul R de la acest link: https://cran.r-project.org/bin/windows/base/ și se
instalează pe laptopul personal. Versiunea curentă este 4.3.2 („Download R 4.3.2 for Windows”).
Pasul 2.
Se descarca RStudio de la acest link: https://rstudio.com/products/rstudio/download/ și se
instalează pe laptopul personal. ATENȚIE!!! Instalarea R de la Pasul 1 trebuie finalizată cu
succes pentru a putea trece la Pasul 2. Intalarea este finalizată dacă, căutând din meniul de start
„Rstudio”, va apărea următorul icon:

Pasul 3.
Dupa instalare, se deschide RStudio si se ruleaza codul de mai jos, destinat instalării librăriilor
(trebuie să existe conexiune la internet pentru finalizarea acestui pas):
######################
install.packages("smbinning")
install.packages("tcltk")
install.packages("ROCR")
install.packages("Hmisc")
install.packages("astsa")
install.packages("forecast")
install.packages("ggplot2")
install.packages("graphics")
install.packages("tseries")
install.packages("rugarch")
install.packages("urca")
4

Gestiune Bancară.
An universitar 2023 - 2024

install.packages("xts")
install.packages("zoo")
install.packages("MatchIt")
install.packages("optmatch")
install.packages("gbm")
install.packages("tcltk")
install.packages("twang")
install.packages("survey")
install.packages("MatchIt")
install.packages("optmatch")
install.packages("gbm")
install.packages("tcltk")
install.packages("twang")
install.packages("survey")
######################
ATENȚIE!!! Acest cod poate fi copiat în integralitate și introdus (lipit) în RStudio în partea
stângă, în zona unde apare următorul simbol:

O librărie precum"smbinning" de exemplu este instalată corespunzător dacă în urma executării


primei linii din codul de mai sus va apărea următorul mesaj:
„package ‘smbinning’ successfully unpacked and MD5 sums checked”
Pasul 4. Pentru începerea analizei statistice trebuie activate librăriile (se face de fiecare dată
când se deschide RStudio):
######################
library ("smbinning")
library ("tcltk")
5

Gestiune Bancară.
An universitar 2023 - 2024

library("ROCR")
library("Hmisc")
library("astsa")
library("forecast")
library("ggplot2")
library("graphics")
library("tseries")
library("rugarch")
library("urca")
library("xts")
library("zoo")
######################
Pentru a verifica dacă librăria a fost activată, vă puteți uita în partea dreaptă la mijloc, la meniul
Packages, dacă caseta aferentă librăriei specificate de dumneavoastră pentru activare a fost
bifată. Pentru "smbinning" de exemplu, activarea corectă presupune afișarea următoarei imagini:

Figura 1 Activarea unei librării

Pentru curățarea consolei de lucru puteți tasta următorul cod: cat("\014").


6

Gestiune Bancară.
An universitar 2023 - 2024

ATENȚIE!!!! Contactați profesorul de seminar pe mail dacă apar probleme la oricare din
pașii precizați în acest suport de seminar doar dacă nu ați găsit o rezolvare pe internet sau
discutând cu colegii. Realizați acest lucru înaintea zilei desfășurării Seminarului 2.

BIBLIOGRAFIE
Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and regression
trees. Pacific Grove, CA: Wadsworth and Brooks/Cole.
Dumitrescu, B. (2020). Instrumente financiare derivate: o abordare practica.Editura ASE.
Siddiqi, N. (2005). Credit Risk Scorecards: Developing and Implementing Intelligent Credit
Scoring. John Wiley, New York.
Steiner, B. (2012). Mastering Financial Calculations, 3rd ed. Harlow: Pearson Education.
Thomas, L.C. (2009). Consumer Credit Models: Pricing, Profit and Portfolios. Oxford University
Press, Oxford.
Resurse online:
Ghidurile emise de Autoritatea Bancară Europeană (ABE) privind Standardele gestionării
riscului de rată a dobânzii: https://www.eba.europa.eu/eba-publishes-final-standards-and-
guidelines-interest-rate-risk-arising-non-trading-book-activities
7

Gestiune Bancară.
An universitar 2023 - 2024

SEMINAR 2
2. Riscul de Credit

2.1 Conceptul de credit scoring; indicatorii WoE și IV

a) Definiția credit scoring-ului


Credit scoring-ul sau scorecard-ul este un instrument utilizat de către bănci pentru
evaluarea nivelul de risc asociat solicitanților noi de credite sau a clienților aflați deja în
portofoliu. Alfel spus, pe baza unui scorecard, o bancă poate calcula probabilitatea ca un
solicitant să fie „bun” (nu se așteaptă un comportament negativ din partea acestuia) sau „rău”
(comportament negativ așteptat). Punctajul aferent unui client, rezultat dintr-un scorecard,
reprezintă o măsură a riscului asociat acestuia sau, altfel spus, reprezintă o probabilitate de
default și se calculează avându-se în vedere o multitudine de caracterstici cum ar fi: vârsta, sexul,
experiența, statutul matrimonial, comportamentul anterior în raport cu alte bănci etc.

b) Etapele dezvoltării unui scorecard


Pentru crearea unui scorecard este necesar ca variabilele sau caracteristicile colectate de către
bancă de la solicitanții de credite să aibă o putere de discriminare între viitorii clienți buni și cei
răi cât mai ridicată. În cele ce urmează, pentru a exemplifica pașii necesari construcției unui
scorecard, vom lua in considerare un eșantion al băncii comeciale X, format din 1000 clienți
(700 non-default și 300 default). Pentru acești clienți sunt disponibile următoarele caracteristici:
Vechime în Raport cu Banca, Comportament Anterior, Suma Datorată, Sex, Vârstă, Rezidență,
Credite în Raport cu Banca, Ocupație (atasată acestui document este și baza de date în format txt
și xlsx). Pe lângă aceste variabile o avem și pe cea denumită Status (variabilă dummy care ia
valoarea zero în cazul în care clientul a intrat în default și unu în caz contrar).

 Analiza preliminară a datelor


8

Gestiune Bancară.
An universitar 2023 - 2024

Pentru analiza predictibilității comportamentului viitor al unui client generat de o variabilă dată,
care conține mai multe caracteristici sau „bin-uri”, în practică se folosesc doi indicatori:

• Weights of Evidence (WoE) arată puterea predictivă a unei variabile explicative în raport cu
variabila dependentă. Acest indicator este descris în general ca o măsură a separării clienților
buni de cei răi. Denumirea de „Clienți răi” se referă la persoanele care nu au rambursat parțial
sau integral un credit și a fost scoși din portofoliu (de obicei, un client activ este considerat rău
atunci când creditul contractat devine neperformant, adică are mai mult de 90 de zile de
întârziere). „Clienții Buni” sunt aceia care au rambursat integral împrumutul plus dobânda sau
cei activi care au mai puțin de 30 de zile de întârziere la un credit în desfășurare. Formula pentru
indicatorul WoE este redată mai jos:

WoEGi=ln
( % ClientibuniGi
% ClientiraiGi ) (1)

unde % Clienti buni Gi reprezintă procentul clienților buni în total clienți din cadrul unui grup Gi
iar % Clienti raiGi reprezintă procentul clienților răi în total clienți din cadrul aceluiași grup Gi.
Din punct de vedere statistic, indicatorul WoE ne arată punctajele ipotetice pe care ar trebui să le
alocăm fiecărei caracteristici din compoziția unei variabile în condițiile în care acesta este
singura pe care o avem la dispoziție pentru dezvoltarea sistemului de scoring (convențional,
puctajul se calculează ca fiind WoE*100, rotunjit prin lipsă).

• Information Value (IV) este una dintre cele mai utilizate tehnici pentru selecția variabilelor
importante într-un model predictiv. IV este calculat folosind următoarea formulă:

IV Gi=ln
( % Clientibuni Gi
% ClientiraiGi )× ( % Clienti buni Gi−% Clienti raiGi )=WoEGi × ( % Clientibuni Gi−%(2)
Clientirai Gi)

unde % Clienti buni Gi reprezintă procentul clienților buni în total clienți din cadrul unui grup Gi
iar % Clienti raiGi reprezintă procentul clienților răi în total clienți din cadrul aceluiași grup Gi.
Clasificarea unei variabile în funcție de valoarea ei informațională poate fi făcută pe baza
metodologiei propuse de Siddiqi (2006).
9

Gestiune Bancară.
An universitar 2023 - 2024

Tabel 1 Semnificație IV. Sursa: Sidiqi (2006)


Valoare informațională Putere de Predicție
Mai mică de 2% Foarte Slabă
Între 2% și 10% Slabă
Între 10% și 30% Medie
Între 30% și 50% Puternică
Peste 50% Suspicios de Puternică

În cele ce urmează vom calcula acești doi indicatori pentru Rezidență (variabilă
categorială) precum și pentru Vârstă (variabilă continuă).

Analiza Rezidenței
Tabel 2 Statistici descriptive - Rezidență
Caracteristic 1 2
BR3 GR4 Puncta
CR CB % CR % CB WoE IV
i j
39
Chirias 70 109 61% 23.33% 15.57% -0.4044 -41 3.13%
%
41
Cu parintii 44 64 59% 14.67% 9.14% -0.4726 -48 2.61%
%
26
Proprietar 186 527 74% 62.00% 75.29% 0.1942 19 2.58%
%
TOTAL 300 700 100% 100% 8.33%

Pe baza informațiilor din Tabelul 2, putem spune că potențialii clienți care stau în chirie sau
cu părinții vor pleca cu un dezavantaj la accesarea unui împrumut în comparație cu clienții care
dețin proprietatea în care locuiesc deoarece prezintă un risc de default mai ridicat (WoE negativ).
Per total, puterea de discriminare a rezidenței este slabă, valoarea informațională totală fiind
puțin peste 8%. Good Rate (%) se calculează ca fiind procentul clienților buni in total clienți pe

1
CR= număr clienți răi
2
CB= număr clienți buni
3
BR= Bad Rate (%)
4
GR=Good Rate (%)
10

Gestiune Bancară.
An universitar 2023 - 2024

un anumit segment al Rezidenței. De exemplu, Good Rate (%) pentru caracterstica Chirias este
109/(70+109)=61%. Bad Rate (%)=1- Good Rate (%)=39%.

18%

11%

71%

Chirias Cu parintii Proprietar


Figura 2. Pondere caracteristici Rezidență. Sursa: Calcule proprii

Se poate observa din Figura 1 că majoritatea clienților din eșation (71.3%) dețin o
proprietate însă și celelalte două caracteristici au ponderi destul de însemnate. Din moment ce
fiecare caractersitică deține cel puțin 5% din total observații, putem spune că variabila Rezidență
este bine proporționată.

Analiza Vârstei

Spre deosebire de Rezidență care este o variabilă categorială, vârsta este una continuă.
Pentru a o analiza statistic este nevoie de o împărțire preliminară pe 10 intervale (percentile)
11

Gestiune Bancară.
An universitar 2023 - 2024

egale ca și pondere în total (alegerea numărului de percentile este subiectivă). Rezultatele sunt
prezentate în tabelul de mai jos:

Tabel 3 Statistici descriptive ale vârstei. Sursa: Prelucrare proprie


Vârstă CR CB BR GR % CR % CB WoE Punctaj IV
min-23 42 63 40% 60% 14.00% 9.00% -0.4418 -45 2.21%

24-26 52 83 39% 61% 17.33% 11.86% -0.3797 -38 2.08%

27-28 28 66 30% 70% 9.33% 9.43% 0.0102 1 0.00%

29-30 26 51 34% 66% 8.67% 7.29% -0.1736 -18 0.24%

31-33 33 72 31% 69% 11.00% 10.29% -0.0671 -7 0.05%

34-36 23 88 21% 79% 7.67% 12.57% 0.4945 49 2.43%

37-39 18 56 24% 76% 6.00% 8.00% 0.2877 29 0.58%

40-45 31 82 27% 73% 10.33% 11.71% 0.1254 13 0.17%

46-52 18 72 20% 80% 6.00% 10.29% 0.5390 54 2.31%

53-max 29 67 30% 70% 9.67% 9.57% -0.0099 -1 0.00%

TOTAL 300 700 100 % 100% 10.06%

Pe baza informațiilor din Tabelul 3, putem spune cu certitudine că acei potențiali clienți
cu vărsta sub 26 de ani vor pleca cu un dezavantaj la accesarea unui împrumut în comparație cu
clienții care au între 34 și 52 de ani deoarece prezintă un risc de default mai ridicat (WoE
negativ). Clienții cu vârsta între 27 și 33 de ani nu oferă valoare adaugată în perspectiva evaluării
comportamentului viitor comparativ cu celelate două intervale anterior menționate (WoE nu are
un semn stabil iar valoarea informațională a acestui segment este destul de scăzută:
IV 27−33=0.00 % +0.24 %+0.05 %=0.29 %. La nivel agregat, Vârsta are o putere de discriminare
medie.

 Definirea grupărilor (bin-uri)


12

Gestiune Bancară.
An universitar 2023 - 2024

Pentru asigurarea robusteței unui scorcard este necesar ca numărul de caracteristici ale unei
variabile să nu fie foarte ridicat (patru sau cinci maxim) și, în același timp, fiecare din aceste
caracterstici să conțină cel puțin 5% din numărul total de observații. Este absolut necesar ca bin-
urile create să aibă valori ale WoE diferite ca intensitate, de aceea se recomandă unirea
caracteristicilor cu WoE apropiate și semne identice. După finalizarea etapei anterioare va
trebui să codăm cu _0, _1, ... etc. fiecare grupare în parte în funcție de valoarea ei informațională.

Codarea Rezidenței

Dacă ne uităm cu atenție la Tabelul 2, observăm că bin-urile „Chirias” și „Cu parintii” au


WoE destul de apropiate ceea ce ne îndreptățește să unim aceste două caracteristici ale
Rezidenței. În cazul în care avem o variabilă cu cel puțin două bin-uri se recomandă ca reperul
(_0) să fie alocat caracteristicii cu valoarea informațională cea mai scăzută. În cazul de față
acesta va fi caracteristica „Proprietar”. Rezultatele finale, după grupare, sunt sumarizate în
tabelul de mai jos:

Tabel 4 Analiza statistică a rezidenței după grupare


Rezidență Descriere WoE Punctaj IV
_0 Proprietar 0.1942 19 2.58%
_1 Chirias, Cu părinții -0.4302 -44 5.72%

TOTAL 8.30%

Se observă că prin gruparea „Chirias” și „Cu parintii” valoarea informațională finală nu a


scăzut foarte mult (în primă fază era 8.32% iar ulterior 8.30%). Acest lucru este unul foarte bun
și de natură să ofere un plus de siguranță estimărilor viitoare din regresia logistică.

Codarea Vârstei

Spre deosebire de Rezidență, gruparea Vârstei este mai problematică. După cum am
menționat anterior, primul criteriu de grupare este cel al WoE. În cazul în care avem o variabilă
13

Gestiune Bancară.
An universitar 2023 - 2024

cu mai mult de două bin-uri se recomandă ca reperul (_0) să aibă valoare informațională cea mai
scăzută. Cu toate acestea, la variabilele continue trebuie respectat și principiul ordinii (evitarea
grupării intervalelor care nu sunt consecutive).

Pe baza celor spuse până acum, dacă ne uităm cu atenție la Tabelul 3, putem defini patru
bin-uri. Primul dintre ele este format din clienții cu vârsta până în 25 de ani denumit „18-25”;
această grupare am construit-o deoarece intervalele din componența ei, asa cum au fost
prezentate în Tabelul 3 prezintă valori ale WoE apropiate și identice ca semn. Am decis la
segmentarea grupării inițiale 24-26 ca urmare a realizării unei analize privind importanța acestei
variabile și valorile sale critice pe piața din România. Gruparea „26-34” a fost construită avându-
se în vedere faptul că valoarea ei informațională este scăzută iar intervalele componente nu au
WoE cu același semn. Ultima grupare „35-52” a fost construită mergând de la ideea alipirii
intervalelor cu WoE identice ca semn. Cu toate acestea, clienții cu vârsta de peste 52 de ani au un
WoE negativ, lucru care complică puțin lucrurile. În acestă speță avem două soluții: a) fie
păstrăm intervalul 53+ ca grupare de sine stătătoare, deoarece are cel puțin 5% din observații sau
b) o combinăm cu intervalul 34-52 cu riscul de a diminua puterea de discriminare a acestuia. În
analiza de față am ales prima variantă.
Tabel 5 Analiza statistică a vârstei după grupare
Vârstă Descriere WoE Punctaj IV
_0 53+ -0.0099 0 0.00%
_1 26-34 -0.0605 6 0.13%
_2 35-52 0.4073 41 5.39%

_3 18-25 -0.5288 53 5.79%

TOTAL 11.31%

În Tabelul 5 sunt prezentate noile rezultate. Se observă că prin această segmentare, valoarea
informațională a acestei caracteristici a crscut cu un punct procentual, dar păstrându-și puterea
medie de discriminare. Un aspect pozitiv care se poate observa totuși după grupare este
14

Gestiune Bancară.
An universitar 2023 - 2024

caracterul monoton crescător pe care il are evoluția WoE, odată cu creșterea vârstei, după cum se
poate observa în Figura 2:

Vârstă
0.6

0.4

0.2

0
18-25 26-34 35-52 53+
-0.2

-0.4

-0.6
WoE Linear (WoE)

Figura 3. Dinamica WoE pentru Vârstă

Excepție de la această regulă o realizează gruparea 53+, motivația păstrării fiind evidențiată
mai sus. Putem concluziona că pe măsura ce vârstă unui client este mai mare, șansele ca acesta
să își ducă la bun sfârșit obligațiile de plată cresc. Mențiunea este că pentru clienții care depășeșc
vârsta de 53 de ani pot apărea disfuncționalități în achitarea ratelor, printre argumente fiind
reducerea veniturilor acestora sau deteliorarea stării de sănătate.
15

Gestiune Bancară.
An universitar 2023 - 2024

SEMINAR 3
2. Riscul de Credit

2.2 Conceptul de credit scoring; Regresia LOGIT

 Regresia LOGIT
Să presupunem că avem la dispoziție un eșantion al unei bănci comerciale care cuprinde
atât clienți non-default (buni) cât și clienți aflață în stadiul de default (răi). Variabila binară Y i
reprezintă statusul tuturor clienților din eșantion și ia valoarea zero dacă clientul i a intrat în
default și unu în cazul în care clientul este non-default. Fie X i =( X i 1 , X i 2 , … , X ¿ )o matrice care ne
oferă informații calitative și cantitative despre clientul i în momentul în care acesta și-a depus
dosarul de creditare. Situația ideală este cea în care ponderile celor două categorii de clienți
(default și non-default) sunt cât mai apropiate de 50%. În fapt, în bănci și IFN-uri acestea variază
în funcție de tipul de client, de tipul de produs sau alte segmentări disponibile.
Pentru construcția unui scorecard pe baza eșantionului amintit mai sus va trebui să estimăm
următoarea ecuație:

E [ Y i ]=β 0 + β 1 X i 1+ β 2 X i 2+ …++ β n X ¿ + ε i (1)

Din păcate, ecuația (1) estimată prin metoda celor mai mici pătrate nu va oferi soluții
eficiente și consistente deoarece ipoteza privind normalitatea erorilor va fi încălcată. Într-adevăr,
pentru ca erorile ε i să aibă o distribuție normală este necesar ca variabila Y i să fie una continuă,
ceea ce nu este cazul. Mai mult decât atât, trebuie să avem în vedere faptul că suma
β 0 + β 1 X i 1 + β 2 X i 2+ …++ β n X ¿ poate lua, cel puțin teoretic, orice valoare din intervalul (−∞ ; ∞ )

pe când E [ Y i ] va putea lua doar două valori, zero și unu. Pentru a rezolva această problemă este
necesar să identificăm o funcție f (•) care, odată aplicată lui E [ Y i ], să ofere un model valid în
contextul în care Y i este binară si să aibă următoarea formă:
16

Gestiune Bancară.
An universitar 2023 - 2024

f ( E [ Y i ] )=β 0 + β 1 X i 1+ β 2 X i 2+ …++ β n X ¿ (2)

Fie pi probabilitatea ca Y i să fie egal cu unu, i.e., probabilitatea ca alegând aleatoriu un


client din eșantion acesta să nu fi intrat în default. Evident, probabilitatea ca un client să fie în
default, adică Y i=0 va fi egală cu 1− pi . Raportul șanselor (en. “odds ratio”) va fi raportul celor
pi
două probabilități, adică π i= . Valoarea acestui raport este un număr din intervalul ( 0 ; ∞ ) ,
1− pi
pentru orice eșantion care are cel putin un client non-default, i.e., pi ≠0 . Pentru a reprezenta
pi
ecuația (2) in context probabilistic putem aplica transformarea LOGIT pentru π i= și folosi
1− pi
noua serie de date ca variabilă dependentă în ecuația (2):

( ) pi (3)
ln ⁡ =β 0 + β 1 X i 1+ β2 X i 2 +…+ β n X ¿
1− pi

Prin logaritmarea raportului sanselor, si implicit a intervalului ( 0 ; ∞ ) , ne asigurăm că


valorile rezultate vor fi în intervalul (−∞ ; ∞ ) . În acest fel, vom avea aceeași unitate de măsură
atunci când estimăm ecuația (3).
După obținerea coeficienților ^β ivom putea să îi atribuim o probabilitate de default
oricărui client care va pune la dispoziția băncii matricea de informații X i =( X i 1 , X i 2 , … , X ¿ ). Într-
adevăr, să presupunem că în urma aplicării metodei verosimilității maxime ecuației (3) am
obținut următoarele valori: ^β= { ^β 0 , ^β 1 , … , ^β n }. Dacă, în acest context, aplicăm funcția exponent
natural ecuației (3) după estimarea ei, vom avea relația:

e
( )=e
ln ⁡
pi
1− pi ^β + ^β X + β^ X +…+ ^β X¿
0 1 i1 2 i2 n
(4)

Din ecuația (4) obținem valoarea raportului sanselor, adică:


17

Gestiune Bancară.
An universitar 2023 - 2024

pi ^β + ^β Xi 1+ ^β2 X i2 +…+ ^βn X¿ (5)


=e 0 1

1− pi

de unde va rezulta probabilitatea de non-default aferentă fiecărui client din eșantion:

^ ^ X + ^β X + …+ ^β X
e β +β
0 1 i1 2 i2 n ¿
(6)
pi = β^ 0+ ^β1 Xi 1+ ^β2 X i2 +…+ ^βn X¿
1+e

Evident, din moment ce am obținut pentru un potențial client probabilitatea de a rambursa


suma împrumutată și dobânda aferentă, putem determina și probabilitatea de default, adică 1− pi .
!!! Exemplificare
Pornind de la eșantionul de 1000 de clienți (700 non-default și 300 default), dorim să alocăm
un punctaj pentru clientul cu numărul 1001 construind un scorecard. Acest punctaj, care nu este
altceva decât o măsură a riscului asociat clientului respectiv, ne va spune dacă este cazul ca
banca să respingă sau nu aplicația de credit. Vom considera în modelul de tip LOGIT, pe lângă
variabila dependentă denumită Status și cele două variabile explicative care au fost prelucrate
statistic până acum, Rezidența și Vârsta. Astfel regresia LOGIT va avea următoarea formă:

Statusi=β 0 + β 1 Rezidență+ β2 Vârstă+ ε i (7)

Rezultatele sunt sumarizate în tabelul de mai jos:


Tabel 6 Estimări LOGIT și Punctaj
(1) (2) (3) (4) (5) (6) (7)
Variabilă Categorie Descriere Estimare WoE Semn Punctaj
Identic?
_0 Proprietar 0 0.1942 - 0
Rezidență _1 Chirias, Cu - -58
-0.4302 
părinții 0.5735***
Vârsta _0 53+ 0 -0.0099 - 0
_1 26-34 -0.1624 -0.0605  -17
_2 35-52 0.3501 0.4073  35
18

Gestiune Bancară.
An universitar 2023 - 2024

_3 18-25 -0.4954* -0.5288  -50


Constantă - - 1.0734*** - - 107
*, **, *** semnificativ statistic cu un grad de eroare de 10%, 5%, respectiv 1%

Pe baza informațiilor din Tabelul 1 se pot trage următoarele concluzii:


a) Caracteristicile reper, codate _0 au în mod implicit coeficientul zero. Estimațiile
celorlalte caracteristici sunt calculate având în vedere acest aspect.
b) Cu excepția caracteristicilor „18-25” și „35-52” a variabilei vârstă toate celelalte estimații
sunt semnificative din punct de vedere statistic, adică sunt diferite de zero. Pentru a
obține un scoring robust, este absolut necesar ca variabila vârstă să fie regrupată astfel
încât estimațiile rezultate în urma rulării regresiei LOGIT să aibă semnificativitate
statistică.
c) Pentru a se asigura o și mai mare robustețe sistemului de scorare este necesar ca semnele
coeficienților estimați să coincidă cu cele ale indicatorului WoE, cu excepția reperelor
„_0”. Se poate vedea că totul este în regula din această privință uitându-ne la coloana (6).
d) Punctajul se obține înmulțind estimația aferentă fiecărei caracteristici cu 100 și rotunjind-
o ulterior prin lipsă.
e) Un client de 24 de ani care este proprietar va avea un punctaj egal cu 57 (0-50+107).
Probabilitatea ca acesta să fie client bun este egală cu:
Nu ne raportam la semificativitatea statistica a coef.

coef punctaj
24 de ani 0 -50
Propietar 0 0
Intercept 1,0734 107
Punctaj=107+0-50=57
19

Gestiune Bancară.
An universitar 2023 - 2024
1,0734+0−0,4954
e
Probabilitate sa fie client bun= 1,0734 +0−0,4954 =64,06%
1+ e
Probabilitate = 1-0,6406= 35,94%
Care este probab de default pe baza modelului prezentat pt un client care sta cu parintii si
are 28 ani?

Coef punctaj
28 ani -0,1624 -16
Cu parintii -0,5735 -57
Intercept 1,0734 107
Punctaj=107-57-16=32
1,0734−0,5735−0 , 1624
e
Probabilitatea sa fie client bun= 1,0734−0,5735−0 ,1624
1+ e
=>probabilitatea=58,35%=>probab(client rau)=1-58,35%=35,94%

1.0734+ 0−0.4954
e
pi = 1.0734+0−0.4954
=64.06 %
1+e
Probabilitatea de default este 1-64.06%=35.94%.

ANEXA 2. RULAREA REGRESIEI LOGISTICE ÎN RSUDIO

#Pasul 1 Încărcarea librăriilor


library("gbm")
library("smbinning")
library("Hmisc")
library("twang")

# Pasul 2: Citirea datelor


date <- read.delim("C:/FABBV/Gestiune_Bancara/date.txt")

#Pasul 3: Analiza statistica a datelor


20

Gestiune Bancară.
An universitar 2023 - 2024

#Rezidenta
date$Rezidenta <- as.factor(date$Rezidenta)
result.Rezidenta0=smbinning.factor(df=date,y="Status", x="Rezidenta")
View(result.Rezidenta0$ivtable)

levels(date$Rezidenta)<-c("_1","_1","_0")
date$Rezidenta= factor(date$Rezidenta,levels=c("_0","_1"))

result.Rezidenta=smbinning.factor(df=date,y="Status",x="Rezidenta")
View(result.Rezidenta$ivtable)

#Varsta
# gruparea initiala a variabilei

# regruparea variabilei in functie de criteriile prezentate in seminar


Varsta_20p=quantile(date$Varsta, probs=seq(0,1,0.05), na.rm=TRUE)
Varsta_20p.Breaks=as.vector(Varsta_20p)
Cuts.Varsta_20p=Varsta_20p.Breaks[2:(length(Varsta_20p.Breaks)-1)]
result_Varsta=smbinning.custom(df=date,y="Status",x="Varsta",cuts=Cuts.Varsta_20p)
View(result_Varsta $ivtable)

date$Varsta<-as.factor(
ifelse(date$Varsta<=25,'18-25',
ifelse(date$Varsta<=34,'26-34',
ifelse(date$Varsta<=52,'35-52','53+'))))
result.Varsta0=smbinning.factor(df=date,y="Status",x="Varsta")
View(result.Varsta0$ivtable)

levels(date$Varsta)<-c("_3","_1","_2","_0")
date$Varsta = factor(date$Varsta,levels=c("_0","_1","_2","_3"))

result.Varsta=smbinning.factor(df=date,y="Status",x="Varsta")
View(result.Varsta $ivtable)","WoE","IV")
View(B)

#Pasul 5: Rularea regresiei LOGIT


Rezultat=glm(Status~
Rezidenta
+Varsta
,data=date,family=binomial(link = "logit"))
View(Rezultat$coefficients)
summary(Rezultat)
21

Gestiune Bancară.
An universitar 2023 - 2024

Rezidenta 0 si varsta 0 nu sunt raportate deoarece ele reprezint clasele reper si au by default
coeficientul 0.
***,**,*,. Echivalent coef semnifixativ statistic cu un grad de incredere de risc de
100%,99%,95%,90%
Rezidenta o(propietar) rezulta coeficient 0
Rezidenta 1(churias) rezulta coeficient 0 0,5735

Varsta 0 (537) => coef 0


Varsta 1 (26-34) => nu este semnificativ => va fi 0
Varsta 2(35-52) => coef o,3501=>nu este seminificativ statistic => va fi 0
Varsta 3(18-25) => coef (-0,4954) => semnificativ statisticilor la un prag de incredere de 90% nu si
la 95% si 99% =>

S-ar putea să vă placă și