Sunteți pe pagina 1din 53

Cuantificarea probabilității de

nerambursare

Prof. univ. dr. Bogdan Gabriel Moinescu


Cuprins
1) Metodologii de estimare
 Modele
 Clasificarea erorilor de prognoză și indicatori de performanță
 Fluxul operațiunilor preliminare
2) Limite privind calitatea datelor
 Valori extreme
 Observații lipsă
 Numitori cu valori negative sau zero
3) Dezvoltarea sistemului de evaluare a probabilității de
nerambursare
4) Validarea sistemelor de rating
 Testarea ex-post
 Testarea față de referențial
Metodologii de estimare
Modelele statistice
• Analiza liniară discriminantă
• Regresia logistică
• Rețele neurale
• Funcții de supraviețuire

Modelele bazate pe informaţii de piaţă


• modelul Merton KMV

 Modelele statistice presupun configurarea funcției explicative a


evenimentelor de nerambursare a creditelor folosind o serie de indicatori
de avertizare timpurie → operativitate în evaluare + obiectivitate
 Modelele bazate pe informaţii de piaţă evalueazǎ riscul de colaps la
nivelul unei firme pe baza volatilității prețului acțiunii sale → aplicabilitate
și acuratețe dependente de dezvoltarea și eficiența pieței de capital
Modelul Altman
 Altman (1968) a publicat unul dintre primele modele de credit
scoring, construit pe baza analizei discriminante liniare Fisher (1936)
o Analiza discriminantǎ liniară are ca obiect delimitarea firmelor solvabile
de cel insolvabile cu ajutorul unei funcţii liniare ce depinde de o serie de
variabile independente (https://www.youtube.com/watch?v=eBm8Uo9yhwI ).
• Avantaj → forma funcţională a modelului obţinut este uşor de interpretat,
valoarea coeficienţilor asociaţi variabilelor independente putând fi
interpretată ca elasticitate.
• Dezavantaj → caracterul restrictiv al ipotezelor de lucru (eșantion relativ
echilibrat de debitori în stare de nerambursare și bun-platnici)
o Factorii determinanți sunt reprezentați exclusiv de indicatori financiari
• X1 → (activ circulant-pasiv circulant)/ activ total (coeficient 1,2)
• X2 → profit reinvestit/activ total (coeficient 1,4)
• X3 → EBIT/activ total (coeficient 3,3)
• X4 → capitalizare bursieră/total datorii (coeficient 0,6)
• X5 → rata utilizării activelor = Cifră de afaceri/total activ (coeficient 1,0)
prag decizional = 1,8 → risc ridicat de default pentru scor inferior pragului
Regresia Logistică
 Aparţine mulţimii modelelor de clasificare şi reprezintă o
metodă directă de estimare a probabilităţii de nerambursare.
o Transformă scorul generat de o combinație liniară de variabile
(σ𝑛𝑖=0 𝛽𝑖 × 𝑋𝑖 ) în valori în intervalul (0;1) folosind funcția sigmoidă
(https://www.youtube.com/watch?v=OCwZyYH14uw )
1
P( yi = 1 / xi ,  ) =

Funcție Sigmoidă
− xi, 
1+ e
Noțiuni statistice fundamentale:
 https://www.youtube.com/watch?v=zAULhNrnuL4&list=PLIeGtxpvyG-JmBQ9XoFD4rs-b3hkcX7Uu
 https://www.youtube.com/watch?v=ckkiG-SDuV8&list=PLIeGtxpvyG-JmBQ9XoFD4rs-b3hkcX7Uu&index=2
 https://www.youtube.com/watch?v=NmjT1_nClzg&list=PLIeGtxpvyG-JmBQ9XoFD4rs-b3hkcX7Uu&index=3
 https://www.youtube.com/watch?v=gcr3qy0SdGQ&list=PLIeGtxpvyG-JmBQ9XoFD4rs-b3hkcX7Uu&index=4
 https://www.youtube.com/watch?v=Rj3pVkjAwY0&list=PLIeGtxpvyG-JmBQ9XoFD4rs-b3hkcX7Uu&index=5
 https://www.youtube.com/watch?v=scVUuaLmb9o&list=PLIeGtxpvyG-JmBQ9XoFD4rs-b3hkcX7Uu&index=6

 Avantaje:
o Permite analiza setului de date şi în condiţiile unor mulţimi
inegale între situaţiile de default şi situaţiile de rambursare
o Facilitează includerea unor variabile calitative în analiză (precum
tipul creditului şi situaţia juridică), însă numai după codificarea
prealabilă a acestora
Modelul Merton
 Estimează riscul de nerambursare pe baza probabilității ca valoarea
economicǎ a activului să scadă sub cea a datoriilor → riscul de credit este
o funcţie de structura financiară a firmei, valorificând informațiile de
piață privind nivelul și volatilitatea prețului bursier al acțiunilor firmei
o Capitalul propriu (S) este considerat echivalent cu o opţiune call pe activul firmei
(V), cu preţul de exerciţiu egal cu valoarea nominală a datoriei (F)
https://www.youtube.com/watch?v=pZtRU-t9194
Bilanț val. piață: 𝑆𝑡 + 𝑉𝐴𝑡 𝐹 = 𝑉𝑡
Merton (1974) 𝑆 = 𝑉 × 𝑁 𝑑1 − 𝐹 × 𝑒 −𝑟×𝑇 × 𝑁(𝑑2 )

𝑃𝑑𝑒𝑓 = 𝑃𝑟𝑜𝑏 𝐹 > 𝑉𝑡+1 = 𝑁(−𝑑2 )

 Utilizarea acestei abordări are dezavantajul că poate fi aplicată doar


firmelor cotate la bursă, precum și variabilitatea relativ ridicată a nivelului
măsurii de risc (uneori prețul acțiunii poate devia substanțial de la
fundamente)
Clasificarea erorilor de prognoză
8

Predictie:
Predictie:
6 Rambursare
NERAMBURSARE

Fara incidente de plata (rambursare)


4 Nerambursare

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Eroare de tip 1 Eroare de tip 2 scor

Eroarea de tip I: Cazurile în care am Eroarea de tip II: Cazurile în care am prezis
prezis incorect „RAMBURSARE” incorect „NERAMBURSARE” (debitor bunplatnic
(Nerambursare neindicată de model → clasificat incorect de model ca răuplatnic →
prob./scor ≤ 0,4, dar default) prob./scor ≥ 0,4, dar rambursare)

Cost E1 ≈ LGD Cost E2 ≈ DAE


Clasificarea erorilor de prognoză (2)

Matricea de clasificare  True Positive (TP): Cazurile în care am prezis


(Confusion matrix) corect „ NERAMBURSARE”
(nerambursare identificată corect)
Efectiv (Actual)
 True Negative (TN): Cazurile în care am prezis
R D corect „RAMBURSARE”
(debitor bun-platnic clasificat corect)
Estimat (Predicted)

Ramb. Neramb
R Corect Incorect  False Positive (FP): Cazurile în care am prezis
(True negative) → er. tip I
(False negative)
incorect „NERAMBURSARE”
Ramb. Neramb
(debitor bun-platnic clasificat incorect de
D Incorect→ Corect model ca rău-platnic → eroare de tip II)
(er. tip II) (True positive)
 False Negative (FN): Cazurile în care am prezis
(False positive)
incorect „RAMBURSARE”
D Default (nerambursare) (Nerambursare neindicată de model → eroare
de tip I)

! Matricea de clasificare presupune alegerea unui prag decizional


Indicatori de performanță
 Acuratețe → proporția tuturor debitorilor clasificați corect
(buni-platnici și rău-platnici)
𝑇𝑃+𝑇𝑁
Ac=
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁
 Precizie rău-platnici → proporția debitorilor rău-platnici
clasificați corect (rata previziunilor corecte – hit rate)
𝑇𝑃
P_positive=
𝑇𝑃+𝐹𝑃
 Precizie buni-platnici → proporția debitorilor buni-platnici
clasificați corect 𝑇𝑁
P_negative=
𝑇𝑁+𝐹𝑁

! Stabilirea pragului decizional presupune realizarea unui


compromis între eroarea de tip I și eroarea de tip II, cuantificabil
prin costul relativ al erorilor (ex. LGD/DAE)
Fluxul operațiunilor de estimare a probabilității
de nerambursare prin modele statistice

Analiza univariată
Criterii •Dezvoltarea catalogului de indicatori Criterii •Elaborarea setului de variabile
cantitative •Analiza respectării ipotezelor modelului calitative •Codificarea variabilelor calitative
•Analiza univariată a puterii de •Verificarea respectării ipotezelor
discriminare economice privind influenţa asupra
•Transformarea indicatorilor nerambursării
•Identificarea corelaţiilor • Tratamentul valorilor lipsă

Lista scurtă a indicatorilor economico-financiari Lista scurtă a criteriilor calitative

Analiza multivariată
Dezvoltarea funcţiei scoring cu informaţii Dezvoltarea score-cardului cu informaţii
cantitative calitative

Conectarea scalei de notare aferente funcţiei scoring cu cea a scorecard-ului calitativ

Sursa: adaptare după „Guidelines on Credit Risk Management – Rating Models and Validation”
Indicatori de avertizare timpurie a
evenimentelor de nerambursare a creditelor
 Criterii de evaluare a capacității de rambursare în cazul firmelor
o Micro
❑Financiare (indicatori de profitabilitate, lichiditate, solvabilitate)
❑Nefinanciare (structura juridică, vechimea afacerii, guvernanța
corporativă)
❑Comportament în raport cu creditorii (istoricul rambursării
creditelor anterioare, mixul de facilități utilizate)
❑Amprenta digitală (calitate feedback – review-uri, comportament
online etc.)
o Macro
❑Evoluția sectorului de activitate și dinamica relativă a operațiunilor
solicitantului față de competitori
❑Reziliența la șocuri macroeconomice, precum modificări ample ale
cursului de schimb sau ratei dobânzii
Indicatori financiari folosiţi în evaluarea
probabilităţii de nerambursare a creditelor firmelor
Influenta asupra
Nume Formula nerambursarii
Profitabilitate
Rata profitului net Profit net / Cifra de afaceri -
Rentabilitatea economică (EBIT-impozit) /Activ Total -
Solvabilitate
Rata de solvabilitate Datorii totale / Capital propriu +
Gradul de îndatorare financiară Datorii la bănci/Capital propriu +
Lichiditate
Lichiditatea generală Active circulante / Datorii pe termen scurt -
Lichiditatea curentă (Active circulante-Stocuri) / Datorii pe termen scurt -
Lichiditatea imediată Casa/ Datorii pe termen scurt -
Managementul bilanţului
Termenul mediu de încasare a creantelor Creanţe / Cifra de afaceri x 360 +
Rata stocurilor Stocuri / Activ total +/-
Indicatorul de acoperire a cheltuielilor cu -
EBIT / Cheltuieli cu dobânzile
dobânzile
Rate de creştere
Ritmul de creştere a profitului Profit net curent / Profit net precedent -
Ritmul de creştere a cifrei de afaceri Cifra de afaceri curentă / Cifra de afaceri +/-
precedentă
Ritmul de creştere a activului total Activ total curent / Activ total precedent -
Dezvoltări recente în contextul revoluției digitale
 Extinderea gamei de date și informații prelucrate cu elemente
ale amprentei digitale → de la sute de variabile la mii de
criterii
 variabile comportamentale pentru mediul online și indicatori de
rețea, care par mai puțin volatile decât informațiile din bilanț
(date de social-media + platforme tehnologice);
 informații de piață și date despre tranzacții în timp real de pe
platformele comerț electronic, care aproximează bine situația
financiară curentă comparativ cu datele disponibile în raportările
financiare obișnuite
 Valorificarea tehnologiilor de analiză automatizată, precum
machine learning, inteligență artificială etc.
 metodele de învățare automatizată pot capta mai bine relațiile
neliniare dintre variabile candidate și manifestarea nerambursării
decât modelele tradiționale, care sunt, în general, liniare
 Performanță așteptată superioară în identificarea debitorilor
cu risc, în condiții de alarme false reduse
Filtrarea univariată a variabilelor candidate
1) Gradul de suprapunere dintre funcţiile de densitate probabilistică
aferente celor două mulțimi de observaţii (rambursare, respectiv
nerambursare) → cât mai redus
2) Indicatorul de cuprins al curbei ROC → cât mai apropiat de
valoarea unitară; peste 0,6 este rezonabil
3) Probabilitatea de nerambursare pe centile/decile → formă
exponențială a scalei de risc (sau dublare a probabilității de la o
subclasă la alta)
4) Ponderile de evidență statistică (weights of evidence) → relație
monotonă pe subclase de risc, relativ liniară, cu pantă cât mai mare
%rambursare
 𝑊𝑜𝐸𝑖 = ln %nerambursare𝑖 𝑖

5) Valoarea informațională (information value) → cât mai ridicată;


peste 0,2 este rezonabil
 𝐼𝑛𝑓𝑜𝑉𝑎𝑙𝑢𝑒 = σ𝑘𝑖=1 %𝑟𝑎𝑚𝑏𝑢𝑟𝑠𝑎𝑟𝑒𝑖 − %𝑛𝑒𝑟𝑎𝑚𝑏𝑢𝑠𝑎𝑟𝑒𝑖 × 𝑊𝑜𝐸𝑖
6) Puterea explicativă la nivel univariat cât mai ridicată
Compararea statisticilor principale ale distribuţiei
debitorilor buni-platnici cu cea a celor rău-platnici
 Evaluare preliminară → cu cât diferenţa dintre cele două medii
este mai mare, cu atât este mai probabil ca cele două distribuţii
să fie distincte şi, astfel, variabila în cauză să conţină o putere
de discriminare relevantă
Prob cf.
Variabile Rambursare Nerambursare
KS test
Rata profitului net 0,108483 -0,033370 0,00%
Rentabilitatea economică 0,233434 0,201213 4,32%
Gradul de îndatorare financiară 3,358782 10,33666 35,78%
Termenul mediu de încasare a creanţelor 62,66491 66,29374 11,63%
Lichiditatea imediată 0,424281 0,454841 1,28%
Gradul de suprapunere dintre funcţiile de densitate
probabilistică aferente celor două mulțimi de
observaţii (rambursare, respectiv nerambursare)
8

Predictie:
Predictie:
6 Rambursare
NERAMBURSARE

Fara incidente de plata (rambursare)


4 Nerambursare

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Eroare de tip 1 Eroare de tip 2 scor

 Optim → cele două distribuții ar trebui să fie disjuncte


Indicatorul de cuprins al curbei ROC
Curba ROC Reprezintă abordarea cea mai
utilizată pentru cuantificarea puterii
1 de discriminare
Rata previziunilor corecte (HR)

AUROC = 76.52%
Expresia grafică a relaţiei dintre
0.8 procentul debitorilor răuplatnici
corect identificaţi de
Model
0.6
perfect
indicatorul/modelul considerat (eng.
Sistem „Hit Rate”) şi rata alarmei false (eng.
0.4 de rating „false alarm rate”)
Model Concavitatea curbei ROC pune în
0.2 aleator evidenţă faptul că variabilele alese
au o putere de discriminare suficient
de mare, astfel încât
0
0 0.2 0.4 0.6 0.8 1 indicatorul/modelul să realizeze o
Rata alarmei false (FAR)
bună ordonare a debitorilor în
funcţie de probabilitatea acestora de
nerambursare
Probabilitatea de nerambursare pe centile/decile
 Împărțirea pe subclase sau intervale valorice fixe a variabilei candidate
 Calcularea ponderii numărului de debitori în stare de nerambursare la
nivelul fiecărei subclase → probabilitatea empirică de default la nivel de
subclasă
 Gruparea subclaselor cu probabilități apropiate de default → dublare a
PD de la o subclasă la alta
0.4

0.35
37,7%

0.3

0.25

0.2
19,6%
0.15

0.1
7,6%

4,1%
0.05 1,9%
0,4% 0,9%
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Ponderile de evidență statistică (WoE)
Interval valoric Ramb Default Odds WoE Info PD
(zile) Value
1 2 3 4=2/3 5=LN(%2/%3) 7=3/(2+3)
<11.9 7636 40 190.9 0.94 0.12 0.5%
[11.9;41) 11422 92 124.2 0.51 0.06 0.8%
[41;53.8) 3798 40 95.0 0.24 0.01 1.0%
[53.8;71) 3787 51 74.3 0.00 0.00 1.3%
[71;98) 3777 61 61.9 -0.18 0.00 1.6%
[98,162) 3738 100 37.4 -0.69 0.07 2.6%
>162 3713 125 29.7 -0.92 0.14 3.3%
Total 37871 509 74.4 0.39 1.3%
Predictor puternic (IV:0,3-0,5)
Interval Ramb Default Odds WoE Info PD
valoric Value
(zile)
1 2 3 4=2/3 5=LN(%2/%3) 7=3/(2+3)
<0.44 3811 26 146.58 0.68 0.03 0.7%
[0.44;0.58) 3808 29 131.31 0.57 0.02 0.8%
[0.58;0.76) 7611 63 120.81 0.49 0.04 0.8%
[0.76;0.82) 3803 34 111.85 0.41 0.01 0.9%
[0.82;0.88) 3789 47 80.62 0.08 0.00 1.2%
[0.88;0.93) 3781 56 67.52 -0.10 0.00 1.5%
[0.93,0.97) 3777 60 62.95 -0.17 0.00 1.6%
[0.97,1.03) 3762 76 49.50 -0.41 0.02 2.0%
>1.03 3718 118 31.51 -0.86 0.11 3.1%
Totals 37860 509 74.38114 0.249361 1.3%
Predictor mediu (IV:0,2-0,3)
Puterea explicativă la nivel univariat
Estimare regresie logistică cu câte o variabilă explicativă
Variabilă Coeficient Std. Error z-Statistic Prob. R2 McFadden

Dat.Tot/Ven.Expl 0.172536 0.011219 15.37835 0 4.48%


T.RecuperareCreanțe 0.473292 0.034344 13.78079 0 3.37%
T.PlatăDatorii 0.211853 0.013359 15.85836 0 4.79%
CashFlow/Dat.T.Scurt 0.244194 0.014261 17.12261 0 4.29%
Chelt.dob/VenExpl 0.389083 0.025946 14.99596 0 3.70%
ROA 0.298356 0.02209 13.50665 0 2.65%
Dat.Tot/AT 0.519395 0.045017 11.53773 0 2.18%
Rata capitalului propriu 0.181245 0.012447 14.56126 0 3.07%
Act.Circ/AT 0.494393 0.038384 12.88027 0 2.66%
Val.Adăugată/AT 0.470638 0.03779 12.45415 0 2.50%
Rata restanțelor furnizor 0.304095 0.020537 14.80742 0 3.27%
• Variabile cu valori discretizate pe baza probabilității relative de default
(multiplu față de subclasa cu riscul cel mai redus) → transformarea datelor de
intrare din format continuu (valori indicatori) în valori discrete (punctaje pe
subclase de risc) prin PD relativ sau WoE, mai ales în contextul regresiei
logistice, reprezintă un tratament eficace al problemei valorilor extreme.
1) Metodologii de estimare
2) Limite privind calitatea datelor
 Valori extreme
 Observații lipsă
 Numitori cu valori negative sau zero
3) Dezvoltarea sistemului de evaluare a probabilității
de nerambursare
4) Validarea sistemelor de rating
 Testarea ex-post
 Testarea față de referențial
Provocări analitice
 Limite privind calitatea datelor
o Valori extreme
o Observații lipsă
o Numitori cu valori negative sau zero

 Influențează calitatea estimărilor


o însă eliminarea datelor respective reduce volumul de
informație modelată

 Uneori un compromis este fezabil


Provocări analitice (2)
 Provocări suplimentare privind profilul datelor
o Relații neliniare/nemonotone

 Aplicarea mecanică a verificării îndeplinirii ipotezelor


de lucru poate exclude informație substanțială
o Relațiile de tip parabolă pot fi ignorate, deși puterea
explicativă este substanțială

 Transformarea datelor de intrare prin aplicarea de


operatori matematici (logaritmare, ridicare la pătrat
etc.) poate valorifica informația cu profil nemonoton
Coordonate principiale în depășirea
problemelor legate de calitatea datelor
Valori extreme
Valori lipsă
Numitori negativi
Verificarea îndeplinirii ipotezelor modelului de
estimare
• Variabilele explicative trebuie să îndeplinească cerințele
funcționale ale modelului de discriminare ales
o În cazul optării pentru modelul logit, se respectă monotonia?
o Dacă nu, se pot accepta transformări ale variabilelor?;
logaritmare, ridicare la pătrat etc.
Transformarea datelor
 Incidența nerambursării poate depinde ne-monotom de
variabile financiare precum indicatori de profitabilitate (ROA,
ROE)
o La valori foarte reduse sau foarte ridicate riscul de credit este ridicat, în
timp ce la valori moderate riscul de default este redus → relație
pătratică/parabolică cu punct de minim
 În cazul regresiei logistice, relația dintre indicatorul log(odd)
și profitabilitate nu ar fi de tip liniar
(crescătoare/descrescătoare) → factorul în cauză nu ar fi
valorificat
o Conținutul informațional poate fi utilizat în măsura în care găsim o
metodă analitică de liniarizare a relației → transformare valori intrare
pe bază de ridicare la pătrat în cazul relațiilor de tip parabolă sau prin
înlocuire date primare cu valoarea PD de intervale valorice (a se vedea
slide-ul următor)
Relațiile neliniare pot fi valorificate prin
transformarea variabilei independente
Transformare → (X-X(risc min))^2
1) Metodologii de estimare
2) Limite privind calitatea datelor
 Valori extreme
 Observații lipsă
 Numitori cu valori negative sau zero
3) Dezvoltarea sistemului de evaluare a probabilității de
nerambursare
 Configurarea modelelor multivariate
 Construirea scalelor de notare
 Stabilirea pragului decizional
4) Validarea sistemelor de rating
 Testarea ex-post
 Testarea față de referențial
Revizuirea listei scurte de variabile explicative
• Construirea modelelor este precedată de filtrarea univariată a
variabilelor candidate → testarea conținutului informațional al
fiecărei variabile considerate relevante pentru explicarea
evenimentelor de intrare în stare de nerambursare a debitorilor
(a se vedea cursul anterior), respectiv:
o Indice de cuprins al curbei ROC cât mai ridicat (peste 60%)
o Probabilitate de nerambursare pe subintervale cu profil clar diferit
de funcția constantă → relație exponențială, pătratică
o Estimare model univariat relevant din punct de vedere statistic
• În baza rezultatelor acestei verificări preliminare, este selectată
o listă scurtă de variabile cu putere explicativă promițătoare →
sursa de factori determinanți pentru etapa elaborării
configurațiilor multivariate
Revizuirea listei scurte de variabile explicative (2)
Tabel sintetic rezultate analiză univariată
Formă valorică Variabile
indicatori candidate

(valorile efective
ale indicatorilor)

(valori transformate
pe subintervale în
baza PD relativ)

AU – rata utilizării activelor


D2A – Gradul de îndatorare Semn Relevanță din Putere Indice de
ICR – Rata acoperii chelt. cu dob. punct de explicativă cuprins al
PM – Rata profitului net
coeficient/
RCA – Rata activelor circulante consistență vedere statistic model logistic curbei ROC
RREST – Rata restanțelor cu teoria ec. (<20%) univariat (>1%) (>60%)
Analiza corelațiilor: riscuri legate de
multicolinearitate
 Variabilele explicative selectate nu trebuie să fie
corelate
o Deși multicolinearitatea nu influențează performanța
previziunilor, aceasta
➢ afectează robustețea coeficienților
➢ majorează intervalele de încredere
➢ poate genera apariția semnelor contrare intuiției economice la
coeficienții variabilelor în cauză
 Clasificarea variabilelor în blocuri informaționale,
respectiv cu conținut economic similar (profitabilitate,
lichiditate etc.)
Analiza corelațiilor:
riscuri legate de multicolinearitate

Max 50%

A_ROA/ROE – ROA/ROE transformare pătratică; RLC/RLI – rata lichidității curente/imediate;


CP/DT_AT – capital/datorii pe active; VRC/S – viteza de rotație a creanțelor/stocurilor
Construirea modelelor multifactoriale
 Scopul analizei multivariate este dezvoltarea mai multor variante
de funcţii scoring cu o putere predictivă cât mai ridicată, în
condiţiile unui număr cât mai redus de factori determinanţi slab
corelaţi între ei.
 Tehnicile utilizate în acest sens sunt:
o selecţia regresivă (engl. “backward”) → presupune eliminarea
secvenţială a câte o variabilă explicativă fără semnificație
statistică din structura funcţiei multivariată care include
totalitatea variabilelor reţinute după analiza univariată
o selecţia progresivă (engl. “forward”) → presupune includerea
iterativă a câte o variabilă suplimentară în structura funcţiei
multivariate, în ordinea descrescătoare a puterii de discriminare
o selecţia mixtă (engl. “stepwise”) → combină în diferite măsuri
cele două abordari anterioare.
Construirea modelelor multifactoriale (2)
 Funcţiile de scoring sunt selectate din mulţimea de configurațiilor
estimate, pe baza următoarelor criterii:
o verificarea semnelor (consistență cu teoria de profil) şi semnificaţia
statistică a coeficienţilor (P-value<5%)
o număr de variabile explicative corespunzător caracteristicilor setului
de date disponibil (maximum un factor explicativ pentru fiecare 10
evenimente de nerambursare în cazul regresiei logistice)
o putere de discriminare ridicată → AUROC de minimum 75%
 Funcţiile scoring dezvoltate respectând criteriile enunţate anterior,
atât pentru datele cantitative, cât şi pentru cele calitative, pot fi
utilizate în dezvoltarea de indicatori sintetici multidimensionali.
o pentru conectarea/integrarea diferitelor modelele de scoring este
necesară stabilirea importanţei fiecărei componente în determinarea
funcţiei scor multidimensională; coeficienții de ponderare se pot
obține reestimând modelul folosind ca factori determinanți tocmai
scorurile generate de funcțiile de scoring intermediare
Configurații multivariate folosind regresia logit
Model 1 Model 2 Model 3
7,336 6,849 7,447
Pătratul abaterii ROA
(1,527)*** (1,574)*** (1,483)***
-0,318 -0,306 -0,299
Rata lichidității curente
(0,157)** (0,177)* (0,152)**
1,765 1,868 1,875
Gradul de îndatorare
(0,748)** (0,831)** (0,737)**
0,005 0,005 0,005
Termenul de recuperare a creanțelor
(0,002)** (0,002)** (0,002)**
0,007 0,005 0,006
Rotația stocurilor
(0,002)*** (0,002)** (0,002)***
-0,432
Activitate industrie
(0,374)
0,861 0,820
Activitate construcții
(0,379)** (0,379)**
-4,124 -4,112 -4,094
Constantă
(0,157)** (0,177)* (0,152)**
R-pătrat McFadden 0,256 0,259 0,243
Statistica
Notă: coeficienții variabilelor explicative selectate sunt însoțiți de eroarea standard
performanței și semnificația statistică (folosind notația uzuală)
modelului logit
Interconectarea sistemelor de rating
 În funcție de numărul de funcții de scoring rezultate, scorurile
furnizate pot fi tratate ca ingrediente ale unui sistem superior
→ ameliorare risc de model + reducere variabilitate estimări
Construirea scalei de notare

 Obiectivul construirii scalei de notare este ataşarea unei


probabilităţi de default fiecărui scor posibil generat
 Scala de rating utilizată trebuie să conţină cel puţin şapte
clase de rating pentru debitorii non-default şi o clasă de
rating pentru debitorii în default.
 Criteriile utilizate în acest sens sunt omogenitatea
debitorilor din aceiaşi clasă şi delimitarea semnificativă a
probabilităţii empirice de nerambursare între diferitele
categorii de risc.
 Inputuri: scor și status client (default/non-default)
Construirea scalei de notare (2)
 Observațiile se
ordonează crescător în
funcție de scor
 În funcție de
dimensiunea bazei de
date, se împarte
eșantionul pe
centile/decile
 Pentru fiecare
subgrupă se determină
ponderea clienților în
default
 Se agregă subgrupele
cu niveluri similare ale
probabilității de
nerambursare
Construirea scalei de notare (3)
 Agregând subclasele din etapa anterioară rezultă 7 categorii
de risc de nerambursare

Segmentarea debitorilor pe clase de risc -


scala din stânga
Valoarea emprică a probabilităţii de default -
scala din dreapta
32% 8%
28% 7%
24% 6%
20% 5%
16% 4%
12% 3%
8% 2%
4% 1%
0% 0%
R1 R2 R3 R4 R5 R6 R7
Stabilirea pragului decizional
 Stabilirea pragului de decizie pentru acordarea unui credit are la
bază distribuţia clienţilor solvabili şi răuplatnici pe clase de risc şi
costul relativ dintre erorile de predicţie.
 astfel, pragul decizional pentru acordarea creditelor este condiționat de
costul relativ dintre eroarea de tip I și cea de tip II
 Respingerea solicitării de credit unui client care se dovedeşte
solvabil cauzează instituţiei de credit o pierdere echivalentă cu
rata dobânzii percepute debitorilor (DAE); în acelaşi timp,
aprobarea solicitării de credit unui client care se dovedeşte
răuplatnic cauzează instituţiei de credit un o pierdere de nivelul
LGD
 Punctajul minim de la care se acordă împrumuturi este dat de grupa de la
care raportul dintre numărul debitorilor performanți și cei neperformanți
este superior costului relativ al erorilor de predicție, respectiv nivelul
pierderii în caz de nerambursare raportat la valoarea dobânzii anuale
efective
𝑃𝑒𝑟𝑓𝑖 𝐸1 𝐿𝐺𝐷
𝑃𝑚𝑖𝑛 = 𝑚𝑖𝑛 > =
𝑖=1…𝑛 𝐷𝑒𝑓𝑎𝑢𝑙𝑡𝑖 𝐸2 𝐷𝐴𝐸
Stabilirea pragului decizional (2)
 Determinați scorul minim pe care banca ABC trebuie să îl practice
în activitatea de selectare a clienților în condițiile în care, la
nivelul portofoliul său de debitori, pierderea în caz de
nerambursare este de 50%, dobânda anuală efectivă de 10%, iar
distribuția în funcție de scorul aferent capacității de rambursare
este următoarea:
Punctaj sub 20 p 21-40 41-60 61-80 81-100

Nerambursare 20 10 5 1 1

Performant 20 40 95 200 400

Nr debitori 40 50 100 201 401

Performant/neramb 1 4 19 200 400

PD 50% 20% 5% 0,5% 0,25%

 Raportul dintre costul defaultului neidentificat, respectiv


pierderea în caz de nerambursare, și costul ratei alarmei false,
respectiv dobânda anuală efectivă neîncasată, este 5. Astfel,
punctajul minim de la care banca ABC acordă credit este 41.
1) Metodologii de estimare
2) Limite privind calitatea datelor
 Valori extreme
 Observații lipsă
 Numitori cu valori negative sau zero
3) Dezvoltarea sistemului de evaluare a probabilității
de nerambursare
4) Validarea sistemelor de rating
 Testarea ex-post
 Testarea față de referențial
Componentele procesului de validare
Validarea modelelor
 Metode
o Testare ex-post (backtesting) → compararea rezultatelor estimate
cu cele efectiv înregistrate
▪ Evaluare pe grup distinct de debitori decât cei incluși în eșantionul de
estimare (out-of-sample), în interval de timp similar
▪ Evaluare pe interval de timp ulterior celui folosit în estimare (out-of-
time) cu menținere grup de debitori
o Testare în raport cu un referențial → compararea rezultatelor
estimate de model cu cele prognozate de un sistem referențial
(rating-uri acordate de o agenție de profil, scor generat prin rularea
unui model alternativ etc.)
▪ Evaluarea grad de concordanță între evaluările de risc → presupune
construirea matricei de concordanță și calcularea indicelui de
discordanță
▪ Identificarea și analiza aprofundată a evaluărilor divergente a debitorilor
→ diagnosticare cauze clasificare cu risc ridicat a debitorilor cu rating
foarte bun la nivelul sistemului referențial și viceversa, cu considerarea
incidenței evenimentelor de nerambursare în aceste cazuri
Validarea modelelor (2)
 Parametri
o Puterea de discriminare → ordonare corespunzătoare a debitorilor
în funcție de riscul de nerambursare
▪ curba ROC și AUROC (a se revedea slide 17)
1
▪ scorul Brier = × σ𝑛𝑖=1 𝑃𝐷𝑖 − 𝑆𝑖 2 → suma pătratelor diferențelor
𝑛
dintre probabilitățile de nerambursare estimate și valoarea binară a
status-ului debitorilor, respectiv 1 pentru default și zero pentru non-
default (cu cât valoarea indicatorului este mai apropiată de zero cu atât
puterea de discriminare este mai ridicată)
o Acuratețe → măsurare precisă a nivelului riscului
pd (1 − pd )
▪ La nivel de fiecare clasă de risc → testul binomial: p *  pd + 1.6449
2n
k
(ni pd i −  i )
▪ La nivel de scală de notare → Testul Chi-pătrat: Tk = 
i =1 ni pd i (1 − pd i )
o Stabilitate → robustețe în timp a configurației modelului și scalei de
notare aferente
Robustețea scalei de notare → lipsa suprapunerii
intervalelor de încredere asociate probabilităților de
nerambursare pentru clasele de risc alăturate
Stabilitatea puterii de discriminare

Model logit 2
Testarea față de un sistem referențial
 Benchmarking → metodă utilizată mai ales atunci când
eşantionul debitorilor evaluaţi prin modelul scoring este
caracterizat de seturi cu observaţii numeroase de entităţi, însă
reduse ca acoperire în timp
 Gradul de similitudine în evaluarea riscului este exprimat de
indicele de discordanță
 Etape ale procesului de benchmarking
o Maparea celor două scale de notare pe o scală comună generală
(masterscale)
o Identificarea eşantionului comun
o Construirea tabelului de corespondenţă
o Analizarea diferenţelor de clase de risc
Testarea față de un sistem referențial (2)
Etapa 1 Integrarea a două scale de notare
Logit 2

NN1
Etapa 2 Selectarea eșantionului comun
Etapa 3 Crearea tabelului de corespondență
C1 C2 C3 C4 C5 C6
(ABC 1) (ABC 2) (ABC 3) (ABC 4) (ABC 5) (ABC 6) Sub-total
C1 (R1) 686 775 95 12 20 11 1,599
100%
C2 (R2+R3) 1,334 8,714 3,982 1,275 319 95 15,719
C3 (R4) 136 1,715 1,868 1,751 484 85 6,039 80%

C4 (R5) 64 885 958 1,677 1,093 170 4,847 60%


C5 (R6) 26 501 413 878 1,743 994 4,555
40%
C6 (R7) 1 3 4 17 58 217 300
Sub-total 2,247 12,593 7,320 5,610 3,717 1,572 33,059 20%

Etapa 4 Indicele de discordanță 0%


Dis 0 Dis 1 Dis 2 Dis 3
Referințe bibliografice

S-ar putea să vă placă și