Sunteți pe pagina 1din 72

UNIVERSIT DU QUBEC MONTRAL

MODLES DE RISQUE DE CRDIT LA CONSOMMATION: TUDE DU RLE DE


L'CONOMIE DANS LA PROBABILIT DE DFAUT
MMOIRE
PRSENT
COMME EXIGENCE PARTIELLE
DE LA MATRISE EN CONOMIQUE
PAR
JAVIER BRAILOVSKY
DCEMBRE 2008
UNIVERSIT DU QUBEC MONTRAL
Service des bibliothques
Avertissement
La diffusion de ce mmoire se fait dans le respect des droits de son auteur, qui a sign
le formulaire Autorisation de reproduire et de diffuser un travail de recherche de cycles
suprieurs (SDU-522 - Rv.01-200G). Cette autorisation stipule que conformment
l'article 11 du Rglement no 8 des tudes de cycles suprieurs, [l'auteur] concde
l'Universit du Qubec Montral une licence non exclusive d'utilisation et de
publication de la totalit ou d'une partie importante de [son] travail de recherche pour
des fins pdagogiques et non commerciales. Plus prcisment, [l'auteur] autorise
l'Universit du Qubec Montral reproduire, diffuser, prter, distribuer ou vendre des
copies de [son] travail de recherche des fins non commerciales sur quelque support
que ce soit, y compris l'Internet. Cette licence et cette autorisation n'entranent pas une
renonciation de [la] part [de l'auteur] [ses] droits moraux ni [ses] droits de proprit
intellectuelle. Sauf entente contraire, [l'auteur] conserve la libert de diffuser et de
commercialiser ou non ce travail dont [il] possde un exemplaire.
REMERCIEMENTS
Je tiens d'abord remerCIer mon directeur de mmoire, Monsieur Douglas Hodgson,
professeur au dpartement des sciences conomiques de l'Universit du Qubec Montral,
d'avoir supervis mes travaux de recherche. Je tiens aussi souligner et remercier la
contribution de la Fdration des caisses Desjardins du Qubec qui a rendu possible les
analyses empiriques qui sont prsentes dans le prsent mmoire. Merci spcialement
Pascale ma conjointe pour son appui tout au long de la matrise et salutations ma famille, et
particulirement mon pre Carlos pour ses encouragements depuis le tout dbut, et mon
fils Charles pour son inspiration.
TABLE DES MATIRES
LISTE DES TABLEAUX v
RESlJME Vll
CHAPITREI
INTRODUCTION 1
REVUE DE LA LITTRATURE 4
1.1 Introduction 4
1.2 Origine des modles statistiques pour les risques de crdit de dtail ............... 5
1.3 Effets sur l'offre de crdit, le prix et le risque 9
1.4 Cadre rglementaire ................................................................ 14
1.5 Critiques l'utilisation des notations pour l'attribution de prts 16
1.6 Modlisation des risques de crdit pour un portefeuille de dtail 18
1.7 Utilisation de variables macroconomiques ........................................... 22
1.8 Conclusion .................................................................................26
CHAPITRE II
MODLE DE DFAUT 28
2.1 Introduction 28
2.2 Hypothse de travail 28
2.3 Structure du modle 30
2.4 Dfinition de l'vnement .............................................................. 31
2.5 Caractristiques individuelles utilises 32
2.5.1 Caractristiques du risque de l'emprunteur ................................. 32
2.5.2 Caractristiques du risque transactionnel ................................. 33
2.6 Variables macroconomiques 35
2.7 Forme fonctionnelle du modle 36
IV
2.8 Tests statistiques ....................................................................... 37
2.9 Transfonnation des variables 39
2.10 Analyses de perfonnance 41
2.10.1 Pouvoir de diffrenciation .................................................... 41
2.10.2 Pouvoir de prdiction .43
2.11 Conclusion ................................................................................. 44
CHAPITRE III
RSULTATS D'ESTIMATION ...........................................................45
3.1 Introduction 45
3.2 Estimation des paramtres du modle gnral 45
3.3 Rsultats de l'estimation du modle gnral 48
3.4 Estimation des paramtres du modle avec variables macroconomiques .49
3.5 Rsultats de l'estimation du modle avec variables macroconomiques 52
3.6 Capacit des modles diffrencier les populations .................................. 53
3.6.1 Diffrenciation sur l'chantillon de dveloppement ....................... 53
3.6.2 Diffrenciation sur l'chantillon de validation in-sample ............. 54
3.6.3 Diffrenciation sur l'chantillon de validation out-of-sample 55
3.7 Capacit des modles estimer la probabilit de dfaut 56
3.7.1 Test du Chi-carr sur l'chantillon de dveloppement ., .56
3.7.2 Test du Chi-carr sur les chantillons de validation 57
3.7.3 volution du taux de chmage et de la probabilit de dfaut .............58
3.8 Conclusion ................................................................................. 59
CONCLUSION 60
BIBLIOGRAPHIE 62
v
LISTE DES TABLEAUX
Tableau
2.5.1 Caractristiques du risque de l'emprunteur 33
2.5.2.1 Caractristiques du prt 33
2.5.2.2 Caractristiques de le fiche de crdit .34
2.5.2.3 Caractristiques du compte d'opration 34
2.6 Variables macroconomiques 35
2.10.1 Courbe Cumulative Accuracy Profile (CAP) .42
3.2.1 Analysis of Effects Eligible for Removal Model1 .45
3.2.2 Analysis of Maximum Likelihood Estimates Model 1 .46
3.3.1 Testing Global Null Hypothesis: BETA=O Modell .48
3.3.2 Model Fit Statistics Model 1 .49
3.4.1 Analysis of Effects Eligible for Removal Model2 50
3.4.2 Analysis of Maximum Likelihood Estimates Model2 51
3.5.1 Testing Global Null Hypothesis: BETA=O Model2 52
3.5.2 Model Fit Statistics Model2 .53
3.6.1 AUROC et KS pour l'chantillon de dveloppement 54
3.6.2 AUROC)} et KS pour l'chantillon de validation in-sample , 54
3.6.3 AUROC et KS pour l'chantillon de validation out-of-sample )} 55
3.6.4 AUROC et KS pour les clientles non-membres 55
3.7.1 Test du Chi-carr)} sur l'chantillon de dveloppement 56
VI
3.7.2.1 Test du Chi-carr pour les chantillons de validation 57
3.7.2.2 Probabilit de dfaut pour la validation out-of-sample 57
3.8 volution du taux de dfaut et du taux de chmage 58
RSUM
Cette recherche vise tudier les modles de risque de crdit la consommation et valuer
les effets des conditions conomiques sur la probabilit de dfaut des emprunteurs. Dans le
cadre des travaux, un modle empirique lmentaire sera dvelopp et estim. Il sera tent de
vrifier si l'incorporation de variables macroconomiques permet d'augmenter la
performance du modle de base.
Une rglementation internationale a vu le jour dans les annes quatre-vingt suite de
nombreuses crises bancaires. Une gestion saine et responsable du crdit doit considrer, entre
autres, une valuation adquate du risque de crdit, et permettre de calculer le capital
conomique rglementaire qui est requis en fonction du niveau de risque de la banque. Cette
pratique a comme objectif d'assurer une stabilit financire et d'viter des faillites de
banques lors de crises de crdit.
L'utilisation des statistiques pour estimer ce type de risque remonte aux annes cinquante.
Initialement, les modles taient utiliss lors des dcisions d'octroyer un prt un
demandeur. Aujourd'hui, ils sont galement utiliss pour estimer la probabilit de dfaut des
portefeuilles de crdit. L'analyse discriminante est la premire teclmique d'estimation qui a
t utilise. Plusieurs autres mthodes sont couramment utilises depuis. Ces mthodes sont
soit paramtriques (rgression linaire, rgression logistique, modle de panel, etc.) ou bien,
non paramtriques (arbres de dcision, rseaux de neurones, etc.).
Les variables prdictives du risque d'un emprunteur sont bien connues et documentes.
Traditionnellement, les modles utilisaient des caractristiques individuelles qui valuent le
risque de l'individu (ge, sexe, occupation, revenus, etc.) et le risque transactionnel
(historique de crdit, historique bancaire, etc.). De nos jours, les tendances de la recherche
dans le domaine consistent ajouter des dimensions conomiques qui permettent d'valuer le
risque inhrent au march et ainsi mieux anticiper la probabilit de dfaut.
Une rgression logistique sera employe pour estimer le modle. Des variables
microconomiques d'emprunteurs seront utilises pour estimer la composante individuelle du
risque, alors que des variables macroconomiques rgionales et nationales seront utilises
pour reprsenter le risque inhrent aux conditions du march.
Les rsultats obtenus ont dmontr que l'ajout de variables macroconomiques au modle
permettait de mieux reprsenter l'vnement de dfaut. La capacit du modle diffrencier
les types d'emprunteurs ainsi que son pouvoir prdire l'vnement de dfaut ont aussi t
amliors quoique faiblement.
Mots-cls: crdit la consommation, risque de crdit, rgression logistique
INTRODUCTION
Le secteur financier joue un rle important dans l'conomie o il sert d'intenndiaire entre
l'pargne, la consommation, l'investissement et la production (Bofondi et Lotti, 2006). Nous
remarquons que des crises financires se sont produites rptition depuis les annes
soixante-dix et que leur nombre n'a cess d'augmenter. Nous n'avons qu' penser aux tats
Unis rcemment, mais aussi l'Argentine (2001), la Russie (1999), l'Asie du sud/est
(1997) et au Mexique (1994) pour n'en nommer que quelques-unes.
Ces chocs ont des effets dvastateurs sur l'conomie des pays touchs et particulirement sur
la pauvret. Les causes de ces perturbations sont complexes et comme le font remarquer
Boyer, Dehove et Plihon (2004), chaque crise financire est unique parce qu'elle se ralise
dans un contexte diffrent. Elles partagent toutes nanmoins certains fondements. Dans la
plupart des cas, un emballement du crdit se propage aux marchs boursiers, des changes et
immobiliers.
Les crises financires et particulirement les crises bancaires ne surviennent pas uniquement
dans les pays en dveloppement. Nous avons vu dernirement des faillites de banques dans
des pays comme l'Allemagne, les tats-Unis et l'Angleterre. Nous avons aussi not que
certaines crises se sont propages au niveau international. La libralisation et l'intgration des
marchs financiers ne sont pas trangres cet effet. Les changements dans les
environnements lgislatifs nationaux et internationaux du secteur bancaire ont modifi
l'environnement concurrentiel et ouvert les marchs.
Combins une croissance de la consommation, ces changements ont stimul l'innovation
financire et l'apparition de produits de crdit diversifis. L'augmentation de la concurrence
entre banques favorise l'octroi de prts plus risqus et le dveloppement d'instruments
financiers complexes qui transfrent le risque des tiers. Ce contexte encourage l'utilisation
d'une quantit de fonds propres plus faibles. Une rserve montaire faible ne peut pas
2
ncessairement couvrir les pertes sur prts additionnelles non planifies surtout si elles sont
importantes. De ce problme peut d'ailleurs en dcouler un autre qui consiste crer un
climat de mfiance envers la banque qui aura de la difficult obtenir de nouvelles liquidits.
Les crises bancaires se caractrisent d'ailleurs par un problme de capitalisation et de
liquidits. Elles mettent risque les dpts des pargnants et les capitaux des actionnaires.
Elles favorisent la propagation de l'onde de choc d'autres marchs et un resserrement de
l'offre de crdit s'en suit gnralement. C'est pourquoi d'ailleurs que lors de crises bancaires
majeures, il n'est pas rare de voir des plans de renflouement des gouvernements afin d'viter
des crises de liquidits et des faillites de banques.
Des normes internationales ont t adoptes rcemment pour rglementer les pratiques de
l'industrie bancaire. Cette normalisation a comme objectif de garantir une concurrence loyale
entre banques et d'assurer une saine gestion du risque de crdit pour favoriser une stabilit
financire et diminuer le risque de crises bancaires.
C'est dans ce champ d'intrt que s'inscrit le prsent mmoire. Le travail de recherche qui est
entrepris consiste tudier l'volution et les avantages escompts de la modlisation du risque
de crdit. Dans le cadre des travaux, un modle empirique sera dvelopp pour un portefeuille
de prts la consommation d'une institution financire. Les avances des dernires annes en
matire de recherche consistent valuer les rpercussions des conditions conomiques sur la
probabilit de dfaut des emprunteurs. Dans cet esprit, le modle qui sera dvelopp intgrera
des variables macroconomiques afin de dterminer si elles apportent un pouvoir prdictif
additionnel.
L'approche qui est retenue consiste tudier un modle d'octroi de nouveaux prts. Cette
approche est privilgie tout en tant conscient que divers facteurs survenant aprs l'octroi du
crdit ont une influence sur l'vnement de dfaut. L'objectif de la recherche consiste
dterminer si les conditions conomiques au moment de l'autorisation du prt peuvent aider
en quelque sorte expliquer la probabilit de dfaut futur.
3
Le chapitre 1 fera un survol de la littrature pertinente sur le sujet. Dans ce chapitre, nous
discuterons de l'origine et de l'volution des modles de risque de crdit. Nous discuterons
aussi des effets de la diffusion de cette innovation sur la productivit, l'offre, le prix et le
risque des banques. Nous aborderons brivement la rforme des capitaux rglementaires des
Accords de Ble II et de ses effets sur les pratiques des institutions financires. Nous
prsenterons galement quelques critiques l'gard de l'utilisation des modles lors de
l'attribution du crdit. Nous dvoilerons par ailleurs les principales mthodes de modlisation
qui sont couramment utilises et finalement, nous dcrirons les derniers avancements en ce
qui a trait l'utilisation de variables macroconomiques dans les modles de risque de crdit.
Le chapitre II prsentera les deux modles de dfaut qui seront valus et compars
empiriquement. Dans ce chapitre, nous prsenterons l'hypothse de travail qui consiste
dterminer si l'ajout de variables macroconomiques permet d'augmenter la performance du
modle gnral. Nous dcrirons la structure des modles, la dfinition de dfaut qui a t
retenue, les caractristiques des emprunteurs et les variables macroconomiques qui seront
utilises pour modliser le risque. Nous y discuterons aussi de la forme fonctionnelle et des
tests statistiques qui seront utiliss pour valider les modles. Finalement, nous y aborderons la
notion de transformation des variables et d'analyse de performance en termes de capacit
diffrencier les emprunteurs, et de pouvoir prdire l'vnement de dfaut.
Le chapitre III prsentera les rsultats d'estimation. Nous y discuterons des valeurs obtenues
pour les paramtres des diverses variables retenues. Nous dvoilerons les rsultats des tests
statistiques raliss pour valider les modles comme galement ceux utiliss pour valuer le
pouvoir de diffrenciation et de prdiction. Pour terminer, nous conclurons la recherche en
faisant un retour sur l'objectif du mmoire, les rsultats obtenus et la dmonstration de
l'hypothse de travail.
CHAPITRE 1
REVUE DE LA LITTRATURE
1.1 Introduction
Divers articles de recherche et ouvrages ont t publis au fil des ans sur les systmes de
notation des risques de crdit et les modles statistiques qui les composent. La documentation
rpertorie est varie et aborde les modles de risque de crdit sous diffrents aspects. Cette
documentation a contribu situer le sujet de recherche et dtenniner les objectifs de travail
pour le dveloppement du modle de risque qui sera prsent dans le chapitre Il. La revue
littraire se limite prsenter l'origine et l'volution des modles au fil du temps, en mettant
l'accent sur divers aspects conomiques tels que l'offre de crdit, le prix et la productivit,
mais aussi sur d'autres telles la slection adverse, la modlisation des risques et l'utilisation
de variables macroconomiques.
La revue de la littrature a t rpartie en sept sections afin d'en faciliter la synthse et la
prsentation. La premire section dcrit l'origine et l'volution des modles et systmes au fil
du temps. La deuxime traite des effets de la diffusion de cette innovation sur la productivit,
l'offre, le prix et le risque des banques. La troisime section aborde la rforme des capitaux
rglementaires de l'Accord de Ble II et de ses effets sur les pratiques d'octroi et d'valuation
des risques de crdit des institutions financires. Dans la quatrime section, il y est discut de
certaines critiques l'gard de l'utilisation des modles de notation lors de l'attribution du
crdit. La cinquime section survole les mthodes de modlisation des risques de crdit qui
sont couramment utilises. Finalement, la septime section aborde l'utilisation de variables
macroconomiques dans les modles et de certaines approches rpertories.
Les rpercussions des conditions conomiques sur la probabilit de dfaut des emprunteurs
ne sont pas trs bien connues. Peu de thorie conomique existe sur l'utilisation de variables
macroconomiques dans les modles de risque de crdit la consommation. Le sujet
intresse plusieurs chercheurs et diffrentes approches sont proposes.
5
1.2 Origine des modles statistiques pour les risques de crdit de dtail
Pour dbuter la revue de la littrature, il faut mentionner Thomas (2003) qui fait rfrence
Lewis (1992) qui retrace les premires utilisations du crdit au temps des Babyloniens il y a
trois milles ans. Thomas (2003) poursuit en nous informant que le crdit la consommation
de masse tel que nous le connaissons aujourd'hui date seulement des cinquante dernires
annes. L'auteur nous mentionne que: Vers les annes 1920, Henry Ford et A. P. Sloan ont
reconnu que ce n'tait pas suffisant de fabriquer des produits tels que des voitures, pour la
consommation de masse, mais qu'il fallait aussi dvelopper des faons de financer ces
achats. (p. 1) Ce fut le coup d'envoi pour le dveloppement des compagnies de finance aux
tats-Unis au dbut du XXe sicle et celui des cartes de crdit plus tard dans les annes
soixante.
Thomas (2000) nous fait remarquer que depuis les trente dernires annes, l'importance de
l'valuation des risques financiers a contribu la croissance de l'utilisation des statistiques
et des modles de probabilit. Il nous mentionne que lorsqu'on pense au risque financier, on
se rfre aux portefeuilles d'actions, obligations et autres actifs du genre. Cependant, il existe
la catgorie du crdit la consommation qui est moins connue et dont l'valuation du risque
est tout aussi importante. Le crdit sous forme de prts de dtail peut tre regroup et former
un actif financier. L'valuation du risque de cet actif s'effectue l'aide de diverses approches
statistiques qui seront dcrites dans la prsente recherche.
La premire mthode a avoir vu le jour, et qui est encore couramment utilise aujourd'hui, est
l'analyse discriminante. Thomas (2000) nous apprend que l'origine de cette forme d'analyse
remonte aux annes trente: Cette ide de diffrencier des groupes l'intrieur d'une
population a t introduite dans les statistiques par Fisher (1936). (p. 151) Cette premire
application avait lieu en sciences naturelles. Elle permit de diffrencier deux varits d'iris
comme galement de diffrencier l'origine de crnes distincts en comparant les tailles
physiques respectives. Il nous rvle aussi que: David Duran (1941) a t le premier
reconnatre que ces mmes techniques pouvaient tre utilises pour diffrencier les bons des
mauvais prts. (p. 151)
6
Schreiner (2000) rsume bien l'approche. Il nous mentionne qu'il est possible d'anticiper la
perfonnance future de prts en se basant sur des caractristiques prdictives, et en l'estimant
partir de la perfonnance passe de prts dont les caractristiques sont similaires.
Thomas (2000) explique que les dbuts de l'automatisation des dcisions de crdit remontent
l'poque de la deuxime guerre mondiale. Alors que les analystes de crdit taient appels
au service militaire, le manque de main-d'uvre spcialise obligea les fIrmes automatiser
les rgles de dcision humaine sous fonne de systmes experts. Au dbut des annes
cinquante, le groupement de ces systmes et des techniques d'analyse discriminante est
l'origine de l'utilisation des notations des risques dans les attributions des prts. C'est par
ailleurs l'avnement des cartes de crdit la fIn des annes soixante qui a fait raliser aux
metteurs l'importance des notations puisque sans elles, il aurait t impossible d'automatiser
les dcisions de crdit et de rpondre la demande en tenne conomique et de main d'uvre.
L'utilisation de modles statistiques a t rendue possible grce , entre autres, l'innovation
technologique dans l'utilisation et l'change d'infonnation sur les emprunteurs. Ce volet sera
abord dans la prochaine section.
Thomas (2000) nous rvle galement que les mthodes de dcision taient bases
traditionnellement sur un jugement mental des 3 Cs et mme des 5 Cs du crdit. Ces
critres d'valuation sont tirs de l'anglais et correspondent aux tennes suivants:
i) Character : rputation de l'emprunteur.
ii) Capital : montant du prt.
iii) Collateral : mise de fonds et valeur marchande versus le prt.
iv) Capacity : capacit rembourser.
v) Condition : conditions du march.
L'inconsistance dans les dcisions de crdit attribue au jugement humain a galement t un
facteur dterminant dans le dveloppement des approches statistiques pour l'valuation des
risques de crdit. L'auteur souligne fInalement un lment qui nous intresse particulirement
7
dans le cadre de la recherche actuelle. Il mentionne la ncessit d'incorporer dans les modles
une dimension qui capte les changements des conditions conomiques puisqu'ils peuvent
affecter le risque de l'emprunteur.
Allen, Deong et Saunders (2004) nous font remarquer dans le mme ordre d'ides les
pratiques traditionnelles: Historiquement, les banquiers se confiaient aux analystes de
crdit et leurs systmes experts bass sur les 5 Cs du crdit [... ]. (p. 734) Les auteurs
soulvent le fait que les systmes experts traditionnels ne sont pas en mesure de pondrer
l'importance relative de chacun des Cs lors de l'estimation de la probabilit de dfaut. Ils
soulvent par ailleurs que: Les modles de notation de crdit sont relativement peu coteux
implanter et ne souffrent pas de subjectivit ni d'inconsistance comme les systmes
experts. (p. 736) Un des avantages des modles de notation des risques est qu'ils sont bass
sur des variables statistiquement reprsentatives et ne souffrent pas de l'inconsistance du
jugement humain.
Straka (2000) fait aussi mention des Cs du crdit dans son article portant sur les
changements de pratique d'valuation des prts du secteur hypothcaire au cours des annes
quatre-vingt-dix. Suite aux succs de l'utilisation de ces modles pour l'valuation des cartes
de crdit et des prts la consommation dans les annes soixante-dix et quatre-vingt, il
mentionne que l'application de modles statistiques pour la notation des prts hypothcaires a
littralement transform les pratiques de ce march. Ceci est d au fait que: [ ... ] les
modles statistiques d'automatisation des dcisions de crdit ne semblent pas tre seulement
plus rapides mais aussi plus efficaces, consistants, objectifs et prcis que les pratiques
habituelles de dcision du pass. (p. 208) L'auteur souligne que l'utilisation des notations
statistiques, a permis d'valuer l'ampleur du problme reli au phnomne d'anti-slection,
prsent dans la relation principal agent lors d'une demande de crdit: Les pertes de
l'industrie relies au dfaut de paiement ont t rduites et mieux couvertes l'aide d'une
mthode amliore de dpistage des emprunteurs risqus et de tarification qu'en comparaison
aux mthodes d'valuation manuelle traditionnelles (p. 217) Ce dernier aspect nous
intresse particulirement sous un point de vue conomique puisqu'une valuation plus
prcise de la qualit des emprunteurs permet de mieux provisionnel' et contrler l'exposition
8
au risque et ainsi favoriser une stabilit financire. Autre point d'intrt, l'auteur mentionne
l'importance de faire de la recherche dans le domaine et spcialement sur les rpercussions de
la situation conomique sur les projections du risque. Il suggre aussi de faire du stressed
testing sur les modles, qui consiste anticiper les conditions conomiques futures, afin
d'valuer l'effet des chocs et cycles conomiques sur le risque du portefeuille de crdit.
L'objectif de la prsente recherche consiste valuer les effets des conditions
contemporaines du march lors de la demande de crdit sur la probabilit de dfaut futur,
l'aspect du stressed testing ne sera pas abord.
Le secteur des prts aux petites et moyennes entreprises a suivi la tendance des autres
secteurs d'valuation du risque de crdit en terme d'utilisation des notations. Akhavein,
Frame et Wllite (2005) soulignent: Pendant que les notations du risque de crdit taient
utilises depuis un certain temps pour les autorisations de prts et hypothques aux
particuliers, cette technologie a dbut seulement vers la moiti de la dcennie des annes
quatre-vingt-dix tre utilise pour les prts aux entreprises. (p. 578-579)
Comme le suggre divers auteurs, l'augmentation du nombre de dcisions de crdit
automatises par rapport aux dcisions humaines tend dmontrer une meilleure
performance des modles statistiques en terme de pouvoir de prdiction du dfaut de
paiement et de productivit. La diffusion et l'adoption de cette technologie aux divers
secteurs d'autorisation du crdit sont des rponses l'efficacit dmontre de ces modles au
cours des dernires dcennies.
En rsum, pour le premier groupe d'articles, nous remarquons qu'il y a eu une adoption
rapide de cette innovation financire dans le secteur bancaire au cours des cinquante
dernires annes. Aujourd'hui, l'utilisation de modles prdictifs est rpandue dans plusieurs
activits telles la gestion de portefeuille, la perception et la relation client. La comptitivit
du march du crdit fait en sorte qu'il y a une pression constante sur les cots. Ces modles
permettent d'augmenter la productivit et de diminuer les dlais de traitement.
9
Une meilleure valuation du risque a des rpercussions sur les quantits offertes et les prix.
La prochaine section abordera plus spcifiquement ces aspects qui ont contribu modifier,
au cours des dernires dcennies, les pratiques d'octroi et les mthodes d'valuation des
risques de crdit des institutions financires.
1.3 Effets sur l'offre de crdit, le prix et le risque
Pour dbuter la revue du deuxime groupe d'articles qui traite des rpercussions de cette
technologie sur le march du crdit, Berger (2003) mentionne que: Des recherches sur les
notations du crdit aux tats-Unis ont gnralement dmontr que les notations taient les
meilleurs prdicteurs de la probabilit de paiement [... ] (e.g., Avery et al. 2000). (p. 152)
Plus prcisment, Avery et al. (2000) mentionnent que leur recherche a permis de trouver que
les notations bases sur les historiques de crdit sont des estimateurs trs robustes du dfaut
de paiement et de la dlinquance.
Les conclusions des articles de recherche consults abondent toutes dans la mme direction,
les modles statistiques permettent de mieux estimer et prdire le risque de crdit que le
jugement humain. Le dveloppement et l'utilisation de ces notations requirent cependant
l'implication de diverses technologies.
Berger (2003) a analys des progrs technologiques et leurs effets sur l'industrie bancaire. Il
remarque qu'en plus d'tre un excellent estimateur du risque, les modles statistiques
permettent d'augmenter la productivit des firmes. Dans son article, il cite trois innovations
technologiques qui ont eu des rpercussions importantes sur les cots des institutions
financires : les paiements lectroniques, les services bancaires par Internet et le partage de
l'information. L'auteur soulve l'importance du partage de l'information sur les activits de
crdit. Il souligne que: Une analyse travers diffrents pays a trouv que l'offre de crdit
des banques tait plus leve et le niveau de dfaut tait plus faible dans les nations dans
lesquelles les prteurs utilisaient et changeaient de l'information publique ou bien prive.
(p. 151) L'information publique dont il est question provient des registres o sont rpertoris
les poursuites et les jugements contre les individus. L'information prive quant elle peut
10
provenir de sources internes des institutions prteuses ou encore des agences de
renseignement qui rpertorient l'historique de crdit des emprunteurs. Le constat de l'auteur
est intuitif dans le contexte du problme du principal et de l'agent. En prsence d'asymtrie
d'information, le prteur sera plus enclin prter lorsqu'il dtient plus d'information qui lui
permette de mieux valuer le type d'emprunteur auquel il fait face.
L'auteur souligne galement: L'utilisation de l'change d'information a aussi dmontr
une amlioration de la disponibilit du crdit dans les nations moins dveloppes (e.g.,
Klapper and Krauss 2002). (p. 152) L'information financire permet d'amliorer la
performance des modles statistiques et sert de signal afin de prdire les problmes futurs
relis au crdit.
Leonard (1996) prsente aussi les bienfaits des modles statistiques pour l'valuation du
risque de crdit. L'auteur va plus loin par rapport l'importance d'utiliser et d'changer de
l'information. Il soulve le point que les firmes prteuses auraient avantage partager de
l'information technique sur les modles et les variables prdictives du risque qui sont
utilises. D'ailleurs au Canada, une association a t mise en place afin de faciliter ces
changes entre spcialistes. Selon l'auteur, l'industrie s'en portera mieux puisqu'il appert que
les problmes et solutions relis aux modles d'valuation des risques sont partags de tous:
Il va y avoir moins de pertes sur prt et de radiations puisque les institutions prteuses
prteront de faon plus responsable. Finalement, comme avec les modles de dtection de la
fraude, les conomies pourront tre passes aux consommateurs sous forme de taux d'intrt
plus faibles ou d'un meilleur service la clientle. (p. 43-44) Cet nonc est tout de mme
paradoxal. Il n'est pas certain que les institutions financires prteront de faon plus
responsable dans un march concurrentiel. L'adoption de modles statistiques qui permettent
d'valuer plus prcisment le risque permet d'adresser des segments d'emprunteurs
marginaux qui n'taient pas desservis jusqu' prsent, et o le risque et les cots de service
sont plus levs. L'apparition de produits financiers drivs telle la titrisation des
portefeuilles de dtail, qui permet de transfrer le risque des tiers, peut aussi favoriser des
pratiques plus risques.
Il
Des recherches rcentes ont contribu valuer les effets de l'utilisation de ces nouvelles
pratiques d'estimation des risques comparativement aux anciennes. Ces tudes ont t faites
dans le secteur des prts aux petites entreprises o le risque du propritaire est prdictif de
celui de l'entreprise. Berger (2003) comme galement Akhavein, Frame et White (2005) ont
analys le risque de dfaut des petites entreprises. Ces auteurs arrivent aux mmes
conclusions, soit que le risque du propritaire est prdictif de celui de la firme dans ce
segment et que l'estimation du risque pour les prts aux petites entreprises est similaire aux
approches d'estimation du risque de crdit la consommation.
Dans cet ordre d'ides, Berger, Frame et Miller (2002) ont analys les effets de l'adoption
des notations des risques sur la disponibilit, le prix et le risque des prts aux petites
entreprises. Ils se penchent sur l'introduction des notations pour l'attribution des prts dans
ce secteur la fin des annes quatre-vingt-dix aux tats-Unis. Ils remarquent que l'adoption
des notations a eu des effets mixtes diffrents selon le type de la firme et le profil de
l'emprunteur.
Dans leur recherche, les auteurs sparent les emprunteurs en deux groupes, les marginaux
(risqus) et les non marginaux (non risqus) afin d'valuer sparment l'effet de l'utilisation
des notations. Pour les non risqus, ils soulvent le fait que l'adoption des nouvelles
mthodes d'valuation peut avoir trois effets diffrents sur les cots et le prix. Le premier
effet est reli au traitement des demandes de crdit. Si la productivit augmente et les cots
diminuent, les rductions peuvent tre transfres aux emprunteurs sous forme de taux
d'intrt plus faibles. Cet effet dpend cependant du type de la firme. Si la technologie vient
remplacer la prcdente, les cots diminuent pour la banque alors que si elle est utilise en
complment, les cots augmentent.
Le deuxime effet est reli une rduction des problmes de slection adverse et d'ala
moral. Une meilleure valuation du risque permet d'liminer les pires emprunteurs et de
diminuer les chances qu'un comportement plus risqu se dveloppe une fois le prt octroy.
La diminution de cots dcoulant de cet effet peut galement tre transfre aux emprunteurs
sous forme de taux d'intrt plus faibles.
12
Finalement, l'ajout d'information additionnelle dans le processus dcisionnel permet de
mieux qualifier l'emprunteur. Ainsi, des emprunteurs pourraient se voir attribuer une
meilleure ou une pire notation qui reprsenterait une qualit de risque suprieure ou
infrieure la prcdente. Dans le premier cas, le prix diminuerait pour l'emprunteur
puisqu'il est considr conune un risque de meilleure qualit alors que dans le second, le prix
augmenterait puisqu'il serait jug plus risqu. L'effet net escompt par les auteurs pour le
groupe des non marginaux est une amlioration de la qualit du risque et une rduction du
prix. Il n'y a pas ncessairement d'augmentation de l'offre puisque cette clientle est dj
desservie.
Pour ce qui est du groupe des marginaux, une diminution des cots de traitement peut faire en
sorte que des prts qui taient jugs non rentables par le pass le deviennent maintenant.
galement, un meilleur modle d'valuation du risque qui prend en considration plus
d'information fait en sorte que des clientles qui taient refuses par le pass pourraient
maintenant tre acceptes puisque des informations diffrentes sont prises en compte. Une
valuation plus prcise du risque fait en sorte que les emprunteurs plus risqus se verront
attribuer un prix plus lev considrant les cots de traitement, de suivi et le risque plus
levs qu'ils reprsentent. L'effet net fait en sorte qu'il y aura une augmentation de l'offre,
du prix et du risque pour ce groupe d'emprunteurs.
Berger (2003) mentionne que la croissance de l'offre et du risque provient principalement des
banques qui ont adopt les notations de crdit conune mthode d'valuation alors que celles,
o son utilisation est utilise en complment, ont plutt vu une augmentation des cots et une
amlioration de l'valuation du risque. Il mentionne aussi que ce sont les grandes banques qui
sont les plus propices adopter cette nouvelle technologie afin de faire des gains en
productivit. C'est d'ailleurs consquent avec Schumpeter (1950) qui soulve que ce sont les
grandes firmes qui voluent sur des marchs concentrs qui sont les premires adopter des
nouvelles technologies qui leur feront bnficier d'conomies d'chelle. Akhavein, Frame et
White (2005) ainsi que Bofondi et Lotti (2006) mentionnent galement ce fait et trouvent des
rsultats similaires dans leurs recherches.
13
Dans leur article version rvise, Berger, Frame et Miller (2005) concluent que suite
l'adoption des notations des risques dans le march des prts aux petites entreprises aux
tats-Unis, l'offre comme aussi le prix et le risque moyens ont augment en raison de
l'accroissement du crdit des emprunteurs plus risqus: Ces rsultats sont consistants
avec les hypothses que l'utilisation des systmes de notation pour les petites entreprises
augmente la disponibilit du crdit, premirement pour des emprunteurs relativement plus
risqus qui paient relativement des prix plus levs pour le crdit. (p. 220)
Dans leurs travaux, les auteurs n'abordent pas la question des conditions de march et leur
relation avec l'valuation du risque. Ils terminent cependant en mentiolU1ant des effets
adverses qui peuvent dcouler de problmes de spcification ou de variables omises dans les
modles. Ils soulignent, par exemple, que l'utilisation d'un modle en priode de rcession
alors qu'il a t dvelopp avec des dOlU1es provenant d'une priode d'expansion peut crer
des erreurs systmatiques. Ils notent aussi que ce type de problmatique fait dj l'objet de
proccupations pour les modles utiliss dans les secteurs des cartes de crdit et des prts la
consommation o les notations sont utilises depuis longtemps. Plus rcemment, ces
problmes ont aussi t soulevs pour le secteur des hypothques. Il est donc de l'intrt des
modlisateurs de valider et faire voluer les modles en permanence. Le but consiste
s'assurer que les modles continuent bien prdire le risque mais aussi vrifier si
l'introduction de variables omises ne pourrait pas amliorer la performance.
Le deuxime groupe d'articles a survol l'effet de l'utilisation des systmes de notation des
risques dans l'industrie bancaire. Des recherches de divers auteurs ont dmontr que
l'change d'information et l'utilisation de modles statistiques ont permis de faire des gains
en productivit et d'valuer le risque plus prcisment. Cette ilU1ovation a finalement permis
d'augmenter l'offre de crdit et de desservir des clientles marginales. Les bnfices
tangibles des modles de risque ont contribu l'expansion rapide de cette ilU1ovation aux
diffrents segments du crdit (crdit la consommation, hypothques et plus rcemment,
prts aux petites entreprises). En bout de ligne, le prix et le risque ont augment puisque ces
nouvelles clientles marginales sont plus chres desservir et elles reprsentent un risque de
dfaut plus lev.
14
lA Cadre rglementaire
Thomas (2000) nous rvle comment la rglementation a favoris la diffusion des notations
aux tats-Unis: L'vnement qui a assur une acceptation complte des notations des
risques de crdit est l'adoption de la loi Equal Credit Opportunity Act aux tats-Unis en
1975 et 1976. (p. 151) Dans le mme ordre d'ides, Straka (2000) mentionne pour le
march des hypothques: La ratification du gouvernement sur l'utilisation des notations de
crdit, importante pour plusieurs banques, est arrive lorsque le Federal Reserve Board a
publi ses propres recherches sur la validit statistique de la capacit des notations de crdit
prdire les dfauts de paiement sur les prts hypothcaires (Avery et al. 1996). (p. 215-216)
L'utilisation des notations est devenue une pratique courante dans les activits d'octroi de
crdit et sa reconnaissance un niveau gouvernemental a contribu sa diffusion et son
acceptation, mais galement transformer littralement le march du crdit de masse au
cours du dernier demi-sicle. L'acceptation complte des notations des risques de crdit a t
assure par l'adoption d'une norme d'valuation un niveau international.
Suite des crises bancaires majeures dans divers pays, un comit de travail a t mandat
pour se pencher sur les solutions possibles pour solidifier la stabilit du systme bancaire
international. Le Comit de Ble sur le contrle bancaire (CBCB) a t institu la fin de
1974. Il rassemble les hauts reprsentants des autorits de contrle bancaire et des banques
centrales de divers pays (Belgique, Canada, France, Allemagne, Italie, Japon, Luxembourg,
Pays-bas, Espagne, Sude, Suisse, Grande-Bretagne et tats-Unis). Sans bnficier de
pouvoir supranational, les standards que le comit propose ont t majoritairement adopts
par les pouvoirs gouvernementaux des pays membres travers les processus dmocratiques
en place.
En 1988, le CBCB a introduit un ensemble de mesures qui encadrent la gestion du risque et le
calcul des fonds propres minimaux requis pour viter des dsquilibres concurrentiels entre
banques internationales. Plus prcisment, cette rglementation obligeait dornavant les
banques dtenir des fonds propres d'un niveau quivalant 8 % au moins du total de leurs
actifs pondrs en fonction des risques (CBCB, 2007). Le Comit a mis en place des
15
dispositifs pour encadrer la gestion des nsques l'aide de pratiques de supervision
prudentielle et de normes de discipline de march. Comme le soulvent Thoroval et
Duchateau (2003), cet accord visait prvenir les faillites des banques par des normes de
fonds propres et limiter les crises sectorielles ou macroconomiques et ainsi amliorer la
stabilit financire.
L'incapacit des dbiteurs d'honorer les contrats de prts est une source de problmes pour
les institutions prteuses puisque les prts improductifs ont des rpercussions sur le risque, le
prix, l'offre et la stabilit du systme financier. L'valuation des risques des portefeuilles de
prts est primordiale. Le CBCB a mis en 2004 une version rvise de son rglement. Il tait
maintenant permis aux banques, sous certaines conditions, d'utiliser les systmes de notation
internes des risques comme principaux intrants pour valuer le risque de crdit lors du calcul
des fonds propres requis (CBCB, 2004). Les principaux intrants dont il est question sont la
probabilit de dfaut, la perte en cas de dfaut et l'exposition en cas de dfaut (CBCB, 2005).
Dans la prsente recherche, nous nous intressons uniquement au premier intrant qui est le
calcul de la probabilit de dfaut.
Comme nous avons pu le constater jusqu' prsent, l'utilisation des systmes de notation est
dj largement rpandue dans les activits d'octroi de crdit. Avec cette rglementation, les
mmes notations des risques peuvent dsormais servir d'intrants pour le calcul des capitaux
rglementaires. L'amendement mis de l'avant par le CBCB vise de ce fait mettre en place
des standards internationaux pour le calcul du capital conomique requis et assurer une saine
gestion des risques de crdit. Avec l'adoption de cette norme, il ne fait plus aucun doute que
les notations des risques de crdit ont t adoptes et intgres dans les pratiques d'valuation
des risques de crdit.
Lors de l'amendement de 2004, le CBCB a mis la recommandation suivante pour
l'utilisation des notations internes dans le calcul de la probabilit de dfaut: La notation
doit reprsenter l'valuation par la banque de l'aptitude et de la volont d'un emprunteur
d'honorer son contrat, mme dans des conditions conomiques dfavorables ou en cas
d'vnements imprvus. [... ] La gamme des situations conomiques envisageables doit
16
intgrer la situation du moment et celles qui peuvent se produire pendant la dure d'un cycle
conomique pour le secteur conomique ou la rgion gographique en question. (p. 75) Les
notations internes doivent donc non seulement prendre en considration le risque reli
l'emprunteur et au prt, mais aussi valuer le risque que reprsente le contexte conomique
avec son incidence sur la probabilit de dfaut du dbiteur.
Nous remarquons que le cadre d'utilisation des systmes de notation des risques a volu au
fil du temps. Les notations, qui taient initialement utilises pour augmenter la productivit et
mieux valuer la qualit du risque des emprunteurs lors de la demande de prt, peuvent aussi
tre utilises afin d'estimer le risque des portefeuilles de prts de dtail et valuer les effets
des conditions conomiques contemporaines et futures sur la probabilit de dfaut.
1.5 Critiques l'utilisation des notations pour l'attribution de prts
Les avantages de l'utilisation des notations des risques de crdit sont reconnus aujourd'hui.
Tout de mme, diverses critiques ont t souleves quant leur utilisation dans les activits
d'octroi de crdit. La premire concerne l'utilisation de caractristiques qui pOUlTaient
s'avrer discriminatoires pour certains individus comme le souligne Capon (1982). En 1976,
le Equal Credit Opportunity Act a t amend aux tats-Unis afin de proscrire
l'utilisation dans les systmes des notation des risques de caractristiques comme la race, le
sexe, le statut matrimonial, l'ethnie, l'ge, la religion et le fait de recevoir des prestation de
programmes sociaux.
Dans son article de recherche, Capon (1982) dcrit un ensemble d'exemples qui peuvent
mener des pratiques discriminatoires et rendre l'accs au crdit plus difficile pour certains
segments de la population. Par exemple, les donnes qui ont servi modliser proviennent
des demandeurs de prts pour lesquels un historique de crdit existe, l'estimation du risque
pour des individus qui n'ont pas d'historique de crdit et qui ne rpondent pas aux
caractristiques de la population de dveloppement est donc biaise et peut crer un problme
d'anti-slection pour cette clientle.
17
Avery et al. (2000) font des mises en garde lors du dveloppement de modles statistiques. Ils
abordent particulirement le biais possible dans l'valuation des risques qui est d
l'omission des conditions conomiques spcifiques l'emprunteur. Les auteurs soulignent
dans leur travail de recherche qu'il existe des problmes statistiques dans la mthode
actuellement utilise pour le dveloppement des modles de notation et spcialement pour les
notations qui proviennent des agences de renseignement : En effet, le succs gnral du
pouvoir prdictif prsent dans les tudes antrieures n'exclut pas l'existence de problmes
statistiques lors du dveloppement et de l'implantation des modles de notation des risques
de crdit qui pourraient mener une valuation incorrecte du risque d'un individu. (p. 525)
Les problmes que soulvent Avery et al. (2000) peuvent entraner des erreurs systmatiques
dans l'estimation du risque. Ils identifient trois types de problmes potentiels. Le premier
concerne l'omission de variables explicatives qui fait que la fonction d'estimation du risque
ne reprsente pas la fonction relle et peut donc introduire un biais dans l'estimation. Le
deuxime problme entoure l'utilisation des donnes de 1'historique de crdit des individus.
Si cet historique est incomplet ou contient des erreurs, un biais est transport dans
l'estimation du modle. Finalement, le troisime type de problmes dcoule des populations
de dveloppement par opposition aux populations pour lesquelles le modle est utilis. Si un
segment de march a t sous reprsent lors du dveloppement du modle, dans la pratique,
la notation pourrait ne pas reprsenter le risque rel de ces individus.
Comme le soulignent les auteurs, ces problmes statistiques peuvent avoir des incidences tant
conomiques que rglementaires. Une valuation incorrecte du risque des demandeurs de
crdit peut avoir des effets sur l'offre de crdit, le risque et le prix. Une survaluation du
risque peut restreindre l'offre de crdit puisque les emprunteurs sont jugs plus risqus qu'ils
ne le sont en ralit. Cette surestimation peut aussi engendrer un prix plus lev puisque les
emprunteurs sont valus comme tant plus risqus. Dans le cas contraire, une sous
valuation ferait en sorte que les prts seraient plus risqus qu'ils ne le sont en ralit et un
prix moins lev pourrait tre demand. Comme le font remarquer les auteurs, cet tat de fait
peut avoir des consquences rglementaires: D'un point de vue rglementaire, les effets
cumuls de ces biais potentiels peuvent soulever des questions sur l'adquation des
18
provisions pour pertes et du capital conomique. (p. 528) Les auteurs soulvent galement
une proccupation par rapport aux pratiques quitables en octroi de crdit: Par exemple, la
conformit avec les lois sur les pratiques quitables en matire d'octroi de crdit peut tre
affecte par ces biais si les groupes protgs sont disproportionnellement affects par les
erreurs statistiques ou d'omission. (p. 528)
Tout comme Capon (1982), Avery et al. (2000) mentionnent la possibilit que certains
segments de la population aient un accs plus difficile au march du crdit. Cependant, ils
n'abordent pas la question sous une forme de discrimination par l'utilisation de certaines
variables mais plutt par le problme de biais que peut reprsenter un modle mal dfini.
Cette question nous intresse particulirement dans le cadre de la recherche actuelle o il sera
tent d'intgrer des donnes de march dans un modle. Cette approche permettra d'valuer
l'effet possible des conditions conomiques tant sur la probabilit de dfaut que sur le
pouvoir de diffrenciation d'un modle.
Nous remarquons que les notations des risques de crdit ont t reconnues au ruveau
gouvernemental et que cette reconnaissance a favoris sa diffusion dans l'industrie du crdit.
Nous remarquons galement que le CBCB a aussi contribu l'adoption des notations des
risques de crdit par l'laboration d'une norme internationale. Nous remarquons finalement
que l'utilisation des notations a volu au fil des dcennies. Originalement, elles taient
principalement utilises pour octroyer du crdit, elles ont ensuite t utilises pour raliser le
suivi et valuer le comportement des prts. Aujourd'hui, ces modles servent de base au
calcul du capital conomique en fonction du niveau de risque pour les prts de dtail.
1.6 Modlisation des risques de crdit pour un portefeuille de dtail
Plusieurs mthodes sont utilises pour modliser les risques de crdit, Hayden et Porath
(2006) rpertorient l'ensemble des mthodes utilises pour valuer les risques de crdit pour
un portefeuille de dtail. Ils classifient les diffrentes approches d'estimation du risque en
deux groupes, soit les modles paramtriques et les non paramtriques. Pour le premier
groupe, ils identifient six approches mthodologiques qui sont l'analyse discriminante, la
19
rgression linaire, les modles logit, probit, de panel et d'ala. Pour le deuxime groupe, ils
identifient deux mthodes qui consistent aux rseaux de neurones et aux arbres de dcisions.
Dans le cadre de la prsente recherche, nous nous intressons uniquement au premier groupe
de mthodes puisqu'un modle paramtrique sera utilis pour estimer la probabilit de dfaut.
Plus particulirement, nous tudierons les quatre principales approches de modlisation que
l'on retrouve maintes reprises dans la littrature et qui sont les plus utilises dans la
pratique, soit l'analyse discriminante, la rgression linaire, les modles logit et probit. Les
modles d'ala, dont le plus COIUlU selon Hayden et Porath (2006), le Cox proportional
hazard model , ne seront pas couverts puisqu'ils sont semi-paramtriques. Les modles de
panel ne seront pas couverts non plus puisqu'ils font appel l'analyse de donnes croise.
D'ailleurs, ce type de dOIUles cre des problmes sur le plan technique tels que
l'htroscdasticit et l'autocorrlation des termes d'erreurs.
Hand et Henley (1997) ont aussi rpertori les mthodes que dcrivent Hayden et Porath
(2006). Ils listent dans leurs travaux les diffrentes approches utilises pour modliser les
risques de crdit et exposent les forces et faiblesses de chacune d'elles. Ils nous rvlent entre
autres dans leur article que des tudes ralises par le pass ont dmontr que peu importe la
mthode utilise, le niveau d'exactitude pour classifier le risque de crdit est similaire et que
les modles non paramtriques sont beaucoup plus difficiles dvelopper et requirent des
algorithmes complexes en comparaison aux modles paramtriques. Les auteurs nous
informent qu'en gnral, l'amlioration de la performance d'un modle ne dpend pas tant de
l'approche utilise mais bien de l'ajout de nouvelles variables qui s'avrent prdictives du
risque de dfaut.
Dans le mme ordre d'ides, Altman et Saunders (1998) soulvent qu'il existe au moins
quatre approches mthodologiques pour dvelopper des systmes de notation des risque de
crdit, soit l'analyse discriminante, la rgression linaire, le logit et le probit. Ils soulignent
que de loin, la mthode la plus utilise est l'analyse discriminante suivie de la rgression
logistique.
20
Allen, Delong et Saunders (2004) abondent dans la mme direction et notent que l'utilisation
des notations des risques de crdit est largement rpandue tant pour le crdit la
consommation que pour les prts aux petites entreprises : La mthodologie traditiormelle
d'estimation des risques de crdit la plus gnralement utilise est l'analyse discriminante
multivarie dont Altman (1968) en a t le piormier. (p. 736) Les auteurs soulvent que:
Il y a quatre formes mthodologiques pour les modles de notation des risques de crdit
multivaries: (1) le modle de probabilit linaire, (2) le modle logit, (3) le modle probit,
et (4) le modle d'analyse discriminante multiple. (p. 736)
Comme soulign plus tt, nous nous arrterons dans la prsente recherche dcrire ces quatre
approches paramtriques. Hayden et Porath (2006) expliquent que pour valuer le niveau de
risque du crdit de dtail l'aide de l'analyse discriminante, il faut procder en deux tapes.
La premire consiste calculer un score pour chacun des emprunteurs et la deuxime,
consiste calculer les chances (de l'anglais odds ) d'tre en dfaut selon le niveau de
score. Ces odds reprsentent la probabilit de dfaut. Une prmisse de base doit
cependant tre faite lors de l'utilisation de cette teclmique. Il est considr que les
caractristiques suivent une distribution multivarie normale pour les individus d'un mme
groupe de risque.
Dans la ralit, ce ne serait pas le cas et ce constat est la plincipale critique souleve pour
cette mthode. Hand et Henley (1997) abordent d'ailleurs ce problme et concluent qu'il n'y
aurait cependant pas de rpercussion sur l'exactitude de la classification des individus en
terme de risque et que son utilisation est de ce fait largement rpandue dans la pratique.
Une deuxime approche utilise pour l'valuation du risque de crdit est la rgression
linaire. Ce modle est estim par moindres carres ordinaires. Selon Hayden et Porath
(2006), cette teclmique est intressante puisqu'elle a l'avantage d'tre facile utiliser et
comprendre. Elle comporte cependant deux problmes majeurs. Le premier concerne la
variable explique qui est calcule. Comme la variable dpendante recherche est une
probabilit, sa valeur doit tre comprise entre 0 et 1. Lorsque la rgression linaire est
utilise, les valeurs calcules pourraient tre infrieures 0 ou suprieures 1. Les rsultats
21
ne peuvent donc pas tre interprts en terme de probabilit de dfaut. Le deuxime problme
de cette approche concerne la prsence d'htroscdasticit qui peut se prsenter lors de
l'analyse de dOill1es transversales. Nous pouvons penser que la variance des termes d'erreur
Uj n'est pas constante pour tout i. Les auteurs concluent pour cette mthode: Conune
consquence, l'estimation de fJ est inefficace et de plus, les carts types des coefficients b
estims sont biaiss. (p.3) Les auteurs soulvent qu'une faon de contourner l'obstacle
d'htroscdasticit des termes d'erreur serait d'estimer le modle par moindres carres
pondres. L'estimation de fJ serait efficace mais les carts types des b demeureraient biaiss
en raison du fait que les termes d'erreur ne sont pas normalement distribus.
Dans le mme ordre d'ides, Dielman (1989) soulve le problme d'htroscdasticit lors de
l'analyse de dOill1es transversales mais aussi celui d'autocorrlation des termes d'erreurs
lorsque des sries chronologiques sont utilises. L'auteur souligne que l'utilisation
simultane de ces types de dOill1es sous forme de panel, cre un problme additioill1el
spcifique l'tude de dOill1es croises. Il rvle que des chocs transversaux peuvent avoir
des effets parallles sur des individus diffrents d'une mme priode et les termes d'erreurs
sont donc corrls. Hayden et Porath (2006) soulvent aussi ce point, ils soulignent que la
prsomption d'indpendance des observations pour des dOill1es transversales ne tient plus.
Ils font tout de mme remarquer que plusieurs dveloppeurs ignorent cette dynamique
particulire et procdent sans appliquer de correction.
Finalement, Hayden et Porath (2006) dOill1ent une description des deux dernires mthodes
d'estimation qui sont analyses dans le cadre de cette revue littraire. Ces mthodes
consistent aux modles logit et probit. Ces mthodes d'estimation s'avrent tout fait
appropries pour l'analyse de variables discrtes et l'estimation de probabilits. La principale
diffrence entre ces deux modles se situe au niveau de leur fonction de densit. Alors que le
modle probit est reprsent par une fonction de densit normale, le modle logit est quant
lui reprsent par une fonction de densit logistique. La diffrence rside dans les queues des
distributions, celles du probit tant plus paisses. Ces deux approches dOill1ent des rsultats
similaires et les diffrences entre les rsultats sont ngligeables. Toujours selon Hayden et
Porath (2006), l'estimation du modle par un maximum de vraisemblance est thoriquement
22
convaincante et facile manipuler. Le modle logit est plus simple estimer que le modle
probit qui demande des algorithmes plus complexes. La signification des paramtres du logit
est facile comprendre: un changement dans la valeur d'une variable indpendante rsulte
en un changement dans le logarithme des odds et de la probabilit de dfaut de l'individu.
En plus de gnrer un rsultat en terme de probabilit, il est possible de tester le degr de
significativit du modle et des coefficients. Les auteurs soulignent finalement que cette
forme fonctionnelle est parfaitement adapte pour faire du stressed testing .
La mthode de rgression logistique sera privilgie lors des travaux de dveloppement et
d'estimation du modle empirique qui seront prsents dans le chapitre II.
1.7 Utilisation de variables macroconomiques
Il est intuitif de penser que les conditions conomiques ont une incidence sur la probabilit de
dfaut des emprunteurs. Plusieurs auteurs cits jusqu' prsent ont soulev cette hypothse
sans ncessairement en dmontrer l'effet par des analyses empiriques. Avery et al. (2000) se
sont penchs sur la question du potentiel biais prsent dans les modles actuels qui dcoule,
entre autres, de l'omission de variables reprsentant les conditions conomiques. Les auteurs
soulvent qu' leur connaissance, ils seraient les premiers examiner ces enjeux statistiques.
Pour leur analyse ralise aux tats-Unis, ils ont utilis un ensemble de donnes
conomiques et dmographiques rgionalises qu'ils ont combin par le code postal au score
de risque d'individus d'un chantillon reprsentatif d'une agence de renseignement.
Dans leur tude, ils soulvent l'interrogation suivante: La stabilit du classement travers
les rgions et la robustesse des prdictions des modles aux changements dans les conditions
conomiques locales n'ont pas t typiquement explores et il n'est pas clair que les modles
performent uniformment bien pour tous les sous-groupes de la population. (p. 525) Ils
soulvent que l'omission de variables non relies l'historique de crdit de l'emprunteur,
mais qui le sont aux conditions conomiques individuelles ou locales, peut ainsi crer un
problme de classement erron du risque. Ils citent l'exemple suivant: Par exemple, en
n'incluant pas des circonstances conomiques individuelles, les modles traitent
23
implicitement un individu qui perfonne pauvrement quand il est sans emploi de la mme
faon que quelqu'un qui perfonne de la mme manire lorsqu'il en occupe un. (p. 526) Ils
ajoutent que de la mme faon, en ne considrant pas les facteurs conomiques rgionaux, les
modles vont attribuer les mmes niveaux de risque pour les individus qui ont une mauvaise
perfonnance en temps de rcession qu'en temps de meilleures conditions conomiques.
Cette omission fait en sorte qu'une valuation unifonne du risque peut mener une
projection future errone puisqu'elle ne tient pas compte des probabilits de dfaut sous
jacentes qui sont diffrentes. Les rpercussions de cette valuation biaise se notent tel que
dcrit prcdenunent sur le risque global, l'offre et le prix du crdit conune galement sur le
niveau de capital conomique requis pour assurer une stabilit financire.
Dans cette tude, les auteurs utilisent les variables conomiques et dmographiques par
rgion qui sont le taux d'inoccupation des logements, la croissance dmographique, le taux
de chmage, le revenu mdian, le prix mdian des maisons, le taux de propritaire-occupant,
le taux de pauvret, le taux de minorit visible et le taux de scolarisation. galement, ils
ajoutent une srie de variables individuelles qui sont l'ge, le revenu et le niveau d'ducation.
En plus du score de risque, l'agence de renseignement leur a fourni des indicateurs qui
dtenninent si l'individu fait partie d'un mnage et s'il dtient une hypothque. De plus, les
auteurs crent une variable qui pennet de dtenniner si l'individu habite dans une zone
urbaine ou rurale. Ils sont ainsi en mesure de crer une nouvelle variable qui identifie le
revenu mdian relatif de la zone urbaine par rapport la zone rurale pour chacune des
rgions.
Les conclusions de l'tude mettent en lumire que les variables omises crent un problme
potentiel. Ils remarquent que tout en contrlant les autres facteurs, les scores de risque
moyens varient en fonction des conditions conomiques locales et qu'ils sont statistiquement
infrieurs dans les rgions avec un taux de chmage lev par rapport aux rgions o le taux
est faible. Ils remarquent aussi que la dynamique du taux de chmage joue un rle mais pas
celui qui est attendu. Les rgions qui ont un taux de chmage faible persistant ou qui ont vu
le taux de chmage pass d'un niveau faible un niveau lev ont un score de risque mdian
24
plus faible que les rgions o le taux de chmage est lev de faon persistante. Cet effet
serait d au fait que les prteurs ont des standards plus stricts (prtent moins) dans les rgions
o le chmage est lev, ce qui minimiserait les effets d'un taux de chmage lev sur la
dlinquance des emprunteurs (moins de dlinquance).
D'autres variables utilises ont dmontr tre statistiquement significatives. Les scores de
risque moyens se sont avrs tre infrieurs dans les rgions o il y a un taux lev
d'inoccupation des logements, de pauvret et de minorit visible comme galement o le
revenu mdian, la valeur des maisons et le niveau d'ducation taient plus faibles que la
moyenne nationale. Les auteurs concluent partir de leur recherche que les variables omises
qui reprsentent les conditions conomiques locales et rgionales sont des sources de biais
dans les modles de notation des risques de crdit. Une des solutions qu'ils proposent pour
solutionner ce problme consiste stratifier les modles en fonction des considrations
conomiques. Jusqu' prsent, ces informations n'ont pas t utilises dans les modles. Les
auteurs soulignent que: Une des raisons pour ceci est que les mthodes appropries pour
incorporer de l'information macroconomique et rgionale dans les modles de notation des
risques de crdit n'ont pas t tablies. Ceci est un secteur potentiel de recherche future.
(p. 544) Ils ajoutent un autre commentaire intressant: Notre vidence suggre que
l'utilisation des notations des risques de crdit, en l'absence d'ajustements bass sur des
informations conomiques et rgionales, peut rsulter en des dcisions de dtermination de
prix errones. (p. 545)
Avery et al. (2000) ont prsent dans leur article les enjeux statistiques qui entourent
l'utilisation des scores de risque des agences de renseignement aux tats-Unis. Ils soulignent
la prsence d'un biais due l'omission de variables et au problme de couverture et de
reprsentation dans l'chantillon de dveloppement. Ils concluent que ces facteurs ont une
influence sur l'valuation du risque d'un individu qui peut tre sur ou sous estim. Dans notre
tude, nous tenterons d'introduire des variables macroconomiques dans un modle de risque
afin de vrifier si nous sommes en mesure d'amliorer la prdiction de l'vnement de dfaut
par rapport au modle de base. Notre objectif de travail ne consiste pas vrifier la prsence
ou non d'un biais mais bien vrifier si la performance du modle peut tre amliore.
25
Avery et al. (2004) tudient les effets potentiels de ne pas inclure ce qu'ils appellent des
donnes circonstancielles dans les modles de risque de crdit. Ils examinent galement les
difficults entourant l'ajout de ce type d'information dans les modles. Ils soulvent que
l'omission de ces donnes peut causer une valuation errone du risque de crdit et avoir des
incidences tant sur la stabilit financire que les politiques rglementaires. Ils citent en
exemple le cas de deux individus. Le premier subit un problme de sant temporaire qui
l'empche de rencontrer ses obligations. Le deuxime a perdu son emploi momentanment en
raison d'une dtrioration de l'conomie. Dans les deux cas, le risque de dfaut est trait de
la mme faon qu'un individu qui n'a pas fait face ce type de problmes et qui est en dfaut
de paiement.
La projection future, tant base principalement sur la performance passe, est donc biaise
par l'omission de ce type d'information. Par ailleurs, les auteurs soulvent le fait que de ne
pas inclure des variables qui captent des circonstances personnelles (autres que l'historique
de crdit) ni des variables conomiques locales ou rgionales, peut avoir deux consquences
conomiques primaires. La premire concerne un classement du risque erron, et par le fait
mme une tarification inapproprie, tandis que la deuxime, concerne une inefficacit en
terme d'octroi de crdit, qui peut rsulter en des pertes plus leves et une profitabilit plus
faible. Ils nous font aussi remarquer qu'il existe des obstacles majeurs pour l'utilisation des
informations circonstancielles.
En ce qui a trait aux circonstances personnelles de l'individu, il est difficile de rpertorier ces
vnements en raison de la complexit que cela peut reprsenter mais aussi pour des
questions d'ordre thique. Avec les lois de protection des informations personnelles, il n'est
pas vident que ces informations pourraient tre utilises dans les modles. galement, sous
un point de vue technique, il serait difficile de lier la date d'occurrence de ces vnements
celle du dfaut de paiement et d'intgrer correctement dans les modles cette notion de cause
effet. En ce qui a trait aux domes conomiques locales ou rgionales, les auteurs
soulvent: Bien que l'information gnrale sur les conditions conomiques locales telles
que le taux de chmage soient disponibles, il peut tre difficile de dterminer l'endroit de
rsidence de l'individu lorsque les problmes de dfaut se sont prsents. Obtenir plus
26
d'infonnation spcifique sur les circonstances conomiques affectant l'individu telle que les
mises pied dans une industrie particulire o il est employ reprsente un dfi encore plus
important. (p. 6)
Dans cette tude, Avery et al. (2004) labore tout de mme un modle empirique afin de
tester les effets de certaines variables circonstancielles sur les notations des risques de crdit
d'une agence de renseignement aux tats-Unis. Ils crent un chantillon de nouveaux
comptes de crdit pour chacun desquels ils assignent la perfonnance mauvaise si le
compte a t 60 jours dlinquants ou pire, sinon il est jug bon . Les auteurs testent deux
modles. Le premier consiste tester l'effet du taux de chmage du lieu de rsidence et celui
du statut matrimonial de l'individu (les mnages sont plus solides financirement que les
clibataires ou les rcents divorcs). Le deuxime modle quant lui consiste vrifier si la
squence des vnements de dfaut passs ne suit pas un schma particulier qui pennet de
dtecter des dfauts circonstanciels qui sont dus des dclencheurs spciftques. Plus
prcisment, ce modle consiste vrifier si les dfauts de paiement arrivent tous au mme
moment ou s'ils sont plutt disperss dans le temps. Dans le premier cas, les auteurs
supposent que c'est d un vnement particulier alors que dans le deuxime, ils s'attendent
plutt au schma d'un emprunteur qui a des problmes rcurrents. Les rsultats de leur tude
dmontrent que les conditions conomiques tout conune les conditions particulires de
l'emprunteur influencent la probabilit de dfaut. Ils concluent que l'omission de ces
variables dans les modles actuels cause un problme de spcification et engendre des
extemalits telles que des pertes additionnelles, des prix plus levs et une offre de crdit
plus faible.
1.8 Conclusion
Nous avons vu tout au long de la revue littraire conunent les modles statistiques et les
systmes de notation des risques de crdit se sont dvelopps au cours du dernier demi-sicle.
L'origine de ces modles remonte aux annes quarante avec l'apparition des analyses
discriminantes. L'efficacit de ces modles a t dmontre par des gains en productivit et
une amlioration de la qualit des dcisions de crdit. La reconnaissance de leur utilisation au
27
niveau gouvernemental a galement favoris leur dveloppement. Leur intgration dans les
pratiques de l'industrie du crdit a eu des rpercussions sur l'offre, le prix et le risque du
crdit. Ces modles prdictifs ont eu comme utilisation originale les activits d'autorisation
de prts, ils ont t par la suite utiliss pour suivre le comportement des emprunteurs et
valuer le risque des portefeuilles. Le CBCB avec l'adoption d'une nonne internationale a t
le dernier dclencheur de l'acceptation complte de ces modles. Aujourd'hui, la recherche
s'oriente du ct des conditions conomiques afin d'en valuer les rpercussions sur la
probabilit de dfaut des emprunteurs.
CHAPITRE II
MODLE DE DFAUT
2.1 Introduction
Un modle de dfaut sur des emprunteurs sera estim afin d'valuer si les conditions
conomiques ont un effet sur la probabilit de dfaut. Le modle sera estim partir de
donnes d'un portefeuille de crdit la consommation d'une institution financire. Le cadre
d'analyse consiste valuer un modle qui inclut des caractristiques d'emprunteurs et des
variables macroconomiques, et comparer sa performance un modle qui contient
seulement des caractristiques d'emprunteurs. Des statistiques seront calcules et compares
afin de dterminer si les variables macroconomiques augmentent la performance du modle.
2.2 Hypothse de travail
Le modle a la forme gnrale Y =a + pX + OZ . Le vecteur Yreprsente la performance de
l'emprunteur, la matrice X reprsente ses caractristiques et la matrice Z correspond aux
variables macroconomiques. Les vecteurs a ,p ,et li sont les paramtres estimer.
Il sera valu si ce modle est en mesure de mieux classifier le risque qu'un modle de
rfrence qui a la forme Y = ex + pX et de mieux prdire l'vnement. Par mieux classifier,
nous faisons rfrence un modle o la sparation entre la distribution des emprunteurs qui
font dfaut par rapport ceux qui ne le font pas est la plus grande. En ce qui a trait la
capacit des modles bien prdire l'vnement de dfaut, elle sera compare pour
dterminer lequel performe le mieux. L'hypothse nulle correspond Ho: 8 =0, o 8 est le
vecteur des coefficients des variables macroconomiques.
Si 8 =0 est rejete, les variables macroconomiques apportent un pouvoir additionnel de
diffrenciation et les coefficients sont statistiquement significatifs. Deux types de donnes
29
seront utiliss pour estimer le modle de risque. Des micro-donnes seront utilises pour les
caractristiques individuelles X des emprunteurs. Des sries macroconomiques seront
utilises pour reprsenter les informations de type agrg Z. Nous pourrons vrifier si la
probabilit de dfaut varie en fonction des conditions conomiques.
La probabilit de dfaut d'un emprunteur est caractrise par une valuation de sa capacit et
volont de rembourser ses dettes. La matrice X peut donc inclure une multitude de
caractristiques qui valuent ce risque. Dans le cadre de la prsente recherche, cette
valuation se fait partir de caractristiques connues et disponibles au moment de la
demande de prt. Ces variables ont servi l'analyse du crdit et permettront d'une part,
d'valuer le risque de l'emprunteur (ge, revenus, occupation, etc.) et d'autre part, le risque
de la transaction (type de prt, terme, provenance, historique de paiement, etc.). Le segment
tudi consiste celui des nouveaux prts ouverts au point d'observation. Le modle
n'utilisera pas de donnes comportementales sur la performance courante du prt ni de
donnes conomiques devances puisque le but consiste valuer le pouvoir de
diffrenciation et de prdiction au moment de l'autorisation. Le modle se base uniquement
sur des faits connus au moment o la dcision d'octroyer le crdit a t prise.
Traditionnellement, les systmes de notation des risques utilisent seulement de l'information
de type individuel (demande de crdit eUou comportement). Il est intuitif, par contre, de
penser que le contexte conomique dans lequel volue l'emprunteur influence galement sa
capacit d'honorer ses obligations en tant que dbiteur. La matrice Z inclura des variables
macroconomiques (taux d'intrt, taux de chmage, etc.) dont les niveaux taient connus au
moment de l'analyse du prt. Ces variables permettront d'valuer le risque reli
l'environnement de l'emprunteur.
La structure thorique du modle s'inspire des meilleures pratiques de l'industrie et de la
littrature pertinente ce suj et. L'utilisation des systmes de notation des risques est
largement rpandue et plusieurs tudes ont t publies sur ce type de modles de risque de
crdit. Le caractre prdictif de certaines caractristiques d'un emprunteur sur sa probabilit
de dfaut est bien document et reconnu tant dans la thorie que dans la pratique.
30
2.3 Structure du modle
Trois points importants sur la structure du modle doivent tre mentionns. Tout d'abord, les
donnes pour X sont considres comme transversales et plusieurs cohortes sont utilises.
L'emprunteur se retrouve qu'une seule fois dans l'chantillon de dveloppement. En ce qui a
trait aux variables macroconomiques, des sries chronologiques trimestrielles seront
utilises.
Le deuxime point est reli au type de probabilit de dfaut qui sera calcul. Les donnes
utilises permettront d'estimer une probabilit de dfaut unstressed . Ce type de
probabilit fait rfrence un estimateur non biais qui estime la chance qu'un emprunteur
fasse dfaut dans la prochaine anne base sur les informations statiques et dynamiques
disponibles qu'elles soient individuelles ou agrges. Cet estimateur prend en considration
des donnes macroconomiques observables (CBCB, 2004). Cet estimateur est diffrent du
type stressed qui inclut de l'information comportementale dynamique et qui est
conditionnel l'volution de la situation conomique. L'estimateur unstressed ne permet
pas de faire des stressed scenarios pour valuer la probabilit de dfaut futur. Nous nous
attendons ce que la probabilit de dfaut soit plus faible ou leve lorsque la situation
conomique est meilleure ou moins bonne.
Le dernier point concerne l'approche point-in-time qui sera retenue. La probabilit de
dfaut est calcule avec un modle qui considre des informations individuelles et agrges
connues et disponibles au point d'observation qui est le moment de la demande de crdit. La
probabilit de dfaut qui sera estime peut donc changer dans le temps et est statique au point
d'observation. Cette approche diffre de l'approche through-the-cycle qui permet de
calculer une probabilit de dfaut dynamique et qui n'est pas corrle aux alas conomiques
mais bien aux changements du risque de l'individu (CBCB, 2005). L'approche point-in
time nous intresse dans le cas prsent puisque nous cherchons diffrencier des catgories
d'emprunteurs au moment de l'autorisation et non pas travers un cycle. Nous voulons
dterminer si la probabilit de dfaut au moment du prt varie en fonction du contexte
conomique contemporain du moment de l'autorisation de crdit.
31
L'infonnation sur le contexte conomique est gnralement agrge au niveau national et
quelques indicateurs sont disponibles rgionalement. Il n'y a pas d'infonnation conomique
disponible au niveau local ou personnel de l'individu. Les conditions conomiques sont donc
identiques pour un ensemble d'emprunteurs. Comme le modle cherche capter l'tat de la
situation conomique et la tendance au point d'observation, les variables macroconomiques
qui le composent seront introduites de faon reprsenter cette dynamique. Dans le modle
projet, un compromis sera fait quant au niveau d'agrgation des variables retenues. Des
variables de niveaux rgional et national seront utilises. Ainsi au point d'observation, des
groupes d'emprunteurs auront des valeurs macroconomiques diffrentes en fonction de leur
rgion de rsidence tandis que l'ensemble des emprunteurs partagera d'autres valeurs
macroconomiques agrges identiques.
2.4 Dfinition de l'vnement
Diffrentes dfinitions de perfonnance peuvent tre retenues pour le dveloppement des
modles de probabilit de dfaut. La dfinition dpend de l'objectif qui est poursuivi savoir
s'il consiste diffrencier les clientles traites en anticipant leur perfonnance sur le court ou
le long tenne. Dans le cas prsent, le prt est considr en dfaut lorsque l'une ou l'autre des
situations suivantes survient sur une priode de douze mois aprs son ouverture:
l'emprunteur est en retard de paiement depuis 90 jours et plus;
le prt est radi ou il est certain que le capital ne sera pas rcupr avant mme qu'lUl
retard de paiement de 90 jours et plus ne se soit ralis.
La variable dpendante Y est dichotomique et peut prendre deux valeurs. Elle se ralise t
priodes aprs que X et Z aient t observs:
={l, si l'individu est en dfaut
Yi O'
, SI non
i = indice de l'emprunteur avec i = 1, 2, 3, ... , N .
32
Le segment du portefeuille analys correspond aux nouveaux emprunteurs uniquement. Les
prts dont les donnes d'autorisation sont incompltes sont exclus de la population sous
observation. Les prts ferms durant la priode d'analyse feront partie de l'chantillon et se
verront attribuer la performance observe avant la fermeture.
2.5 Caractristiques individuelles utilises
La matrice X contient les variables qui caractrisent l'vnement de dfaut. Ces variables
proviennent de diffrentes sources et peuvent tre introduites dans le modle de diverses
faons (par exemple: taux d'endettement qui est le ratio des dettes sur le revenu) :
X ji = caractristiques individuelles j pour l'emprunteur i
j = indice de la caractristique avec j = l, 2, 3, ... , J,
i = indice de l'emprunteur avec i = l, 2, 3, ... , N .
Afin de faciliter certaines tapes du dveloppement du modle, un ensemble prliminaire de
caractristiques d'emprunteurs sera choisi arbitrairement. Ce choix est fait considrant le
pouvoir prdictif dj reconnu de certaines caractristiques. Ces variables ont t testes dans
le pass et sont couramment utilises dans des modles (Fair Isaac, 2002). Ce choix repose
galement sur l'objectif de recherche qui ne consiste pas valider des variables individuelles
mais bien le faire pour des variables macroconomiques.
Les caractristiques de l'emprunteur se classent dans deux catgories, soit le risque de
l'emprunteur et le risque transactionnel. Ces deux catgories et les caractristiques qui les
composent sont prsentes dans les sous-sections qui suivent.
2.5.1 Caractristiques du risque de l'emprunteur
Le risque de l'emprunteur peut tre valu partir de diffrentes caractristiques. Le tableau
qui suit prsente les caractristiques prslectionnes afin d'estimer ce risque. Ces
caractristiques dressent un profil gnral de l'emprunteur.
33
Tableau 2.5.1 Caractristiques du risque de l'emprunteur
Provenance Numro Variable
1 ge
2 Sexe
.....
;j
-0
0
3 Revenus
C
ro
S
0
4 Statut rsidentiel
Cl
Rgion
5
administrative
Dfinition Relation avec Y
ge du demandeur -
Sexe du demandeur Neutre
Revenus annuels -
Propritaire, locataire,
avec parents, autre
+ /
Lieu de rsidence + /
Ces informations prliminaires proviennent du dossier du demandeur. La variable rgion
administrative permet de faire la jonction entre les variables macroconomiques agrges et
la rgion de rsidence de l'emprunteur.
2.5.2 Caractristiques du risque transactionnel
En ce qui a trait aux caractristiques du risque transactionnel, trois sources de donnes sont
utilises. La premire correspond au prt proprement dit, la deuxime provient du bureau de
crdit et la dernire du compte bancaire. Le tableau qui suit prsente la premire source de
donnes:
Tableau 2.5.2.1 Caractristiques du prt
Provenance Numro Variable Dfinition Relation avec Y
6 Type du crdit
A terme, REER ou
crdit rotatif
+ /
......
<0
.....
p.,
7 Garantie Co-emprunteur, caution -
8 Client Nouveau ou existant -
Tel que dcrit antrieurement, le portefeuille tudi correspond aux prts nouvellement
ouverts et aucune donne comportementale ne sera utilise. Nous ne nous baserons donc pas
sur la performance courante du prt pour valuer le risque transactionnel. Une partie du
risque transactionnel peut cependant tre estim partir de la performance courante ou passe
de d'autres produits de crdit que dtient l'emprunteur au moment de l'analyse de crdit. Ces
informations sont disponibles entres autres sur la fiche de crdit de l'individu.
34
Le tableau ci-dessous prsente les caractristiques prslectioIUles provenant du bureau de
crdit qui correspond la deuxime source de dOIUles utilises pour valuer le risque
transactioIUle1.
Tableau 2.5.2.2 Caractristiques de le fiche de crdit
Provenance Numro Variable Dfinition Relation avec Y
Drogations Nombre de retards
II +
mineures mineurs
Drogations Nombre de retards
12 +
majeures majeurs
....
Lignes Nombre de transactions
:.a 13
'<l)
....
satisfaisantes satisfaisantes
(,)
<l) Pire cote de
"0 14 Pire cote de retard +
;:l
dlinquance
~
Historique de la Nombre de mois depuis
<l)
'-<
;:l
15
fiche de crdit la cration de la fiche
CO
Nombre de Nombre de requtes de
16 +
requtes crdit rcentes
Fardeau net du Pourcentage d'utilisation
17 +
crdit rotatif du crdit renouvelable
Finalement, la troisime source de dOIUles utilise sera le compte d'opration. Cette source
d'information additioIUlelle devrait aussi contribuer la performance du modle de par la
nature des dOIUles qui y sont disponibles. Le tableau qui suit prsente les caractristiques
prslectionnes.
Tableau 2.5.2.3 Caractristiques du compte d'opration
Provenance Numro Variable Dfinition Relation avec Y
t::
18 Actif Actif montaire dtenu +
<l) .S
........
o . ~
Chques sans Nombre de chques
19 +
S . ~
fonds retourns
0 0.
Up
Historique du Nombre de mois depuis
"0
20
compte l'ouverture du compte
Un compromis devra tre fait quant au nombre de variables individuelles qui seront utilises.
L'ide consiste retenir entre douze et quinze variables pour l'estimation du modle final
afin d'optimiser la performance.
35
2.6 Variables macroconomiques
La forme fonctionnelle des variables macroconomiques demande une certaine rflexion. Les
quelques rares tudes disponibles sur la matire et le manque de thorie conomique dans ce
domaine nous obligent tenter des expriences avant d'en arriver une forme finale. Le
choix des variables est bas sur leurs effets anticips sur les revenus et le cot du crdit, et
donc sur la capacit rembourser des emprunteurs. La matrice Z prendra la forme suivante:
Z)i = variables macroconomiques) de l'emprunteur i
) = indice de la variable avec) = l, 2, 3, ... , J
M
i = indice de l'emprunteur avec i = l, 2, 3, ... , N .
Ces variables seront introduites de deux faons. La premire consiste capter le contexte
conomique contemporain qui prvalait au point d'observation. La deuxime consiste
reprsenter la tendance qui se dessinait au point d'observation. Plus prcisment, ces
variables prendront les formes suivantes:
valeur de la variable au trimestre courant ou prcdent;
ratio de la variable au trimestre prcdent sur la moyenne des huit derniers trimestres.
Tableau 2.6 Variables macroconomiques
Provenance Numro Variable Dfinition Relation avec Y
Statistique
21 Taux d'inflation Taux d'inflation national +
Canada
Conference Indice de Indice de confiance des
22
Board confiance consommateurs
Banque du Taux d'intrt Taux d'intrt
23 +
Canada prfrentiel prfrentiel
Taux de croissance du
24 PIE
PIE rgional
Taux de Taux de chmage
25 +
chmage rgional
36
Les donnes macroconomiques proviennent de Statistique Canada pour les valeurs agrges
au niveau national et de Statistique Qubec pour les donnes rgionales. Le taux d'intrt
prfrentiel provient de la Banque du Canada. Les variables utilises sont trimestrielles. Le
2.7 Forme fonctionnelle du modle
La rgression logistique s'avre tre la forme fonctionnelle idale pour estimer un vnement
telle dfaut de paiement. Cette mthode est d'ailleurs communment utilise pour modliser
les risques de crdit pour des expositions de dtail. Nous cherchons estimer la probabilit
de dfaut de l'individu au point d'observation, algbriquement, cette probabilit est
reprsente par la fonction de densit:
ln ('j(_P, J= a + flX + 8Z ,
o p =Pr(Yi =lI
X
ji,Zji) = F(xji,zji).
La rgression logistique est reprsente par l'expression mathmatique gnrale
suivante (Jonhston et Dinardo, 1997) :
e<a+{3X+Z)
Pr(Y =11 X, Z) =F(X, Z) o F(X, Z) = 1+ e<a+{3X+Z)
Le logit est estim l'aide d'un maximum de vraisemblance qui permet d'viter la
problmatique du biais reli au regroupement des donnes puisqu'on estime une fonction de
densit de probabilit. La forme gnrale du maximum de vraisemblance correspond :
[1-p(a+bx+8zt
Yi
].
Pour respecter les meilleures pratiques lors du dveloppement de modles, des tests doivent
tre effectus afin de dtecter s'il y a prsence d'autocorrlation, de multicolinarit ou
d' htroscdasticit.
37
Le test d'htroscdasticit est complexe pour les modles logit et ne sera pas ralis dans le
cas prsent. La littrature consulte en fait d'ailleurs peu mention. Cet aspect n'tait pas
considr dans la documentation consulte sur le dveloppement des modles de risques de
crdit pour les expositions de dtail. Nous remarquons cependant que la structure particulire
des donnes utilises pour ce type de modles suscite l'intrt de plusieurs chercheurs. Pour
la pratique, les paramtres qui seront estims sont jugs efficaces et convergents et nous
posons l'hypothse que E(E/I x, ) =pour tout i (voir Jonhston et Dinardo 1997 pour une
discussion plus approfondie sur l'htroscdasticit et les modles logit).
2.8 Tests statistiques
La prochaine tape consiste rduire le nombre de variables prslectionnes jusqu' prsent
afin de retenir les plus significatives. Des tests seront raliss afin de vrifier la corrlation, le
pouvoir prdictif et le seuil de significativit de chacune des variables (Hayden, 2006). Selon
les rsultats obtenus, une slection finale sera faite et les variables retenues feront partie du
modle final qui sera estim.
En ce qui a trait la corrlation, un indice de corrlation sera calcul pour chaque
combinaison possible de deux variables explicatives l'aide de la l'quation mathmatique:
cov(x,Z)
xz
corr(x z)= =
, ~ v a r ( x ) v a r ( z ) x
z
Les variables hautement corrles sont une source d'instabilit dans les modles et il est
pratique courante de les exclure lorsque l'indice de corrlation est suprieur 0,7. Dans de
tels cas, le choix de retenir l'une ou l'autre des variables sera bas sur le rsultat des autres
tests, de l'exprience et de l'intuition.
Pour le caractre prdictif des variables, nous calculerons leurs Information value (IV) et
Accuracy Ratio (Coefficient Gini). Ces statistiques permettent d'valuer la capacit de la
caractristique diffrencier les groupes d'individus. Les caractristiques avec les valeurs les
38
plus leves seront slectionnes pour faire partie du modle final. Le IV se calcule en
diffrentes tapes (Fair Isaac, 2002). Tout d'abord, il faut compter le nombre de dfauts et de
non dfauts pour chaque catgorie k de chacune des caractristiques:
YO,k =L(y =0), (1)
k
(2)
Ensuite, on calcule les ratios de (1) et (2) pour chacune des catgories k de chaque
caractristique:
o/c - YO,k
oYO,k- , (3)
(YO,k + YI,k)
0/ Y _ YI,k
/0 1 k - (4)
, ( yO,k + YI,k)
L'tape suivante consiste calculer le Weight of Evidence pour chacune des catgories k
partir de (3) et (4) :
% YO,k J
(5)
Woe k = ln
(
% YI,k .
Le IV de la caractristique correspond la somme de la diffrence entre (3) et (4) multiplie
par (5) de chaque catgorie. Algbriquement:
Cl
lfj = L.J(%Yo,k - %YI,k) *Woe d .
k=l
Plus la valeur de l'IV est leve, plus la caractristique dtient une capacit de sparer les
types d'emprunteurs. Les variables qui auront l'IV le plus grand seront slectionnes pour
faire partie du modle final. Tel que le souligne Porath (2006), certaines rgles doivent tre
39
respectes pour assurer une catgorisation valide. Il doit y avoir au minimum 50 individus de
type y= 1 et 50 de type y=0 dans chacune des catgories. Les groupes doivent galement avoir
des profils de risque similaires et le classement doit avoir une reprsentation intuitive.
En ce qui a trait au Coefficient Gini, il se calcule l'aide d'une rgression univarie entre la
variable explicative et Y. Cette statistique sera galement utilise pour comparer la
performance des deux modles qui seront estims. La reprsentation algbrique du
Coefficient Gini est prsente au point 2.10.1. Tout comme pour l'IV, les variables avec les
valeurs du Coefficient Gini les plus leves seront slectiOlll1es pour le modle final.
2.9 Transformation des variables
Le modle inclut des variables explicatives de type binaire, quelques transformations doivent
tre apportes aux dOlll1es pour tre en mesure d'estimer le modle. Par exemple, une
caractristique qualitative tel le statut rsidentiel peut prendre la valeur propritaire ,
locataire , avec parents et autres . Cette variable doit tre transforme pour pouvoir
tre utilise l'intrieur du modle. Dans de tels cas, une condition de k - 1 catgories est
ncessaire afin d'viter de la colinarit et fait en sorte qu'une catgorie est laisse de ct.
Bien que non obligatoire, une pratique courante consiste catgoriser toutes les variables du
modle incluant celles qui sont quantitatives. Plusieurs raisons sont derrire cette pratique. La
premire est que la distribution du risque d'une variable n'est pas COlll1ue a priori (Porath,
2006). La linarit entre une caractristique et la probabilit est une hypothse inhrente aux
modles logit (Hayden, 2006) et chaque caractristique doit tre teste par rapport :
Dans l'ventualit o une caractristique n'est pas linaire, l'emploi d'un filtre est ncessaire.
La transformation en catgorie permet donc de s'assurer de la linarit de la caractristique.
galement, cette catgorisation permet de dOlll1er plus de robustesse au modle lors de
40
l'estimation. Finalement, elle permet une normalisation du modle puisque dj plusieurs
variables binaires sont utilises. Durant la procdure de transformation, chaque variable se
voit attribuer un nombre de catgories en fonction de sa nature. Les variables se retrouvent
ainsi chacune avec k - 1 catgories corrune dans le cas des variables binaires. Voici un
exemple avec une variable continue telle que les revenus . Cinq catgories pourraient tre
cres pour classer les emprunteurs : 0 $ , 1 $ 15 000 $ , 15 001 $ 30 000 $ ,
30 001 $ 50000 $ et 50 001 $ et plus . Le nombre de catgories et les intervalles de
valeurs sont dtermins par l'intuition et le logiciel informatique qui optimise les
regroupements. Nous cherchons linariser la distribution de la caractristique en fonction
du risque. Suite la catgorisation, le vecteur de variables optimiser prend la forme
algbrique suivante:
) = indice de la variable avec} = 1,2,3, ... , J, ou} = 1,2,3, ... ,J.1vf
k= indice de la catgorie de la variable avec k = l, 2, 3, ... , C
Nous remarquons que plus le nombre de variables et de catgories augmente, plus le modle
devient complexe. La dcision de catgoriser les variables macroconomiques sera
dtermine lors de l'estimation du modle.
La dernire tape consiste maintenant estimer le modle l'aide des variables retenues lors
des dernires tapes de validation et de transformation. L'estimation du logit peut se faire
l'aide d'une procdure backward elimination multivarie qui est disponible dans la
plupart des logiciels statistiques. Le modle est estim avec l'ensemble des variables retenues
et celles qui sont le moins significative sont limines tour de rle jusqu'au moment o le
seuil de significativit de l'ensemble des variables restantes, tant en groupe
qu'individuellement, est 99 %. C'est la statistique de Wald qui est utilise lors de ce test.
L'avantage de la procdure stepwise est qu'elle permet de classer les variables par seuil
de significativit et d'valuer leur contribution marginale respective.
41
2.10 Analyses de perfonnance
En plus des tests courants qui sont raliss lors du dveloppement et de l'estimation d'un
modle logit, des tests additionnels de validation sont aussi entrepris afin de vrifier le
pouvoir de diffrenciation et de prdiction du modle. Ces tests pennettent de comparer la
perfonnance de deux modles. La perfonnance des modles de risque de crdit de dtail est
actuellement value sous deux principaux angles (Medema, Koning et Lensink, 2007). La
perfonnance des modles est value partir du pouvoir de diffrenciation entre les bons
et les mauvais prts (de l'anglais discrimination ) ainsi qu' partir de sa capacit non
biaise d'estimer la probabilit de dfaut (de l'anglais calibration ).
Harrell (2001), le BCBC (2005) ainsi que Engelmann et Rauhmeier (2006) rsument les
aspects techniques entourant l'valuation de la perfonnance des modles. Le CBCB (2005)
propose d'ailleurs un cadre standard de validation. Dans le cas prsent, deux mesures du
pouvoir de sparation et une de la capacit prdire l'vnement seront utilises.
2.10.1 Pouvoir de diffrenciation
La premire mesure utilise est la statistique Kolmogorov - Smimov (KS). Cette
statistique reprsente le point o la distance est la plus grande entre la fonction de distribution
cumule des emprunteurs qui font dfaut par rapport ceux qui ne le font pas. Plus le KS est
lev, meilleure est la capacit du modle bien diffrencier les types d'emprunteurs. Celte
statistique se classe dans la catgorie des tests non paramtriques. Les diffrentes tapes de
son calcul sont dcrites ci-dessous:
1- les observations sont classes en fonction de la probabilit de dfaut de la plus leve
la plus faible;
2- la frquence, la frquence cumule et le pourcentage cumul des bons et des
mauvais sont calculs pour chaque niveau de probabilit de dfaut;
42
3 la diffrence entre le pourcentage cumul des bons et des mauvais est calcule
pour chaque niveau de probabilit de dfaut;
4 l'cart le plus grand correspond la statistique KS.
La deuxime mesure consiste calculer la courbe Cumulative Accuracy Profile (CAP).
Cette courbe est reprsente en ordonne par les bads , soit la fonction de distribution
cumule des emprunteurs qui font dfaut et en abscisse, par les ail , la fonction de
distribution cumule de l'ensemble des emprunteurs.
Graphique 2.10.1 Courbe Cumulative Accuracy Profile (CAP)
'JJ wting model
] .------ pelfect model
A
a11
o ~ - - - - - - - - - - - - - - - - - - - . - - -
o
CBCB (2005)
Plus la courbe du modle est loigne vers le haut et la gauche, plus le modle perforrne bien
alors que la diagonale reprsente le modle alatoire. partir de ce graphique, nous pouvons
calculer le Coefficient Gini qui reprsente le quotient de deux surfaces. Le Coefficient Gini
est aussi connu sous le nom de Accuracy Ratio (AR), il se calcule de la faon suivante:
OR = aire sous la courbe entre le rating model et le random model
Op = aire sous la courbe entre le perfect model et le rating model .
43
La courbe Receiver Operating Characteristic est une autre option pour calculer la
perfonnance du modle. Au lieu de mettre en perspective la distribution des prts en dfaut
par rapport la distribution de l'ensemble des emprunteurs comme le fait la courbe CAP, elle
la met en relation avec la distribution des emprunteurs qui ne font pas dfaut. De cette courbe
dcoule la statistique Area Under Curve (AUROC) qui n'est en fait qu'une
transfonnation linaire du Coefficient Gini.
Le Coefficient Gini pennet de valider le pouvoir de diffrenciation d'une caractristique,
mais aussi d'un modle dans sa globalit. Tout comme le KS, plus sa valeur est leve, plus
le modle est capable de bien diffrencier les sous-groupes de la population sous tude. Un
Coefficient Gini prs de 0 consiste en un modle qui a de la difficult diffrencier les
emprunteurs puisqu'une fois sur deux, il se trompe alors qu'un modle avec un Coefficient
Gini de 1 signifie qu'il arrive diffrencier les sous-groupes parfaitement.
2.1 0.2 Pouvoir de prdiction
La dernire tape de l'analyse de perfonnance consiste valuer la capacit du modle bien
prdire la probabilit de dfaut. Cette analyse consiste raliser une analyse comparative
entre la probabilit de dfaut estime et celle qui s'est effectivement ralise. Le modle a t
dvelopp en utilisant des donnes d'un chantillon in-sample . Un chantillon hold-out
sample a galement t prpar pour la validation, il contient des donnes in-sample et
out-of-sample . Plus prcisment, les donnes de validation in-sample proviennent de
la mme priode que celle utilise pour le dveloppement du modle alors que les donnes
out-of-sample proviennent d'une priode diffrente. Les probabilits de dfaut estimes
sur les chantillons de dveloppement et de validation peuvent donc tre compares aux
dfauts rels par une approche historique. La stabilit du modle peut ainsi tre
sommairement value.
Cette capacit bien prdire l'vnement de dfaut sera mesure l'aide de la statistique du
goodness-of-fit connue comme tant la statistique Chi-square ou encore Hosmer
Lesmeshow (T). La statistique T pennet de vrifier la capacit du modle de prvoir la
44
c
probabilit de dfaut dans des catgories d'emprunteurs (BCBC, 2005). Plus la statistique T
est faible, plus le modle est en mesure de bien estimer la ralit. Elle se calcule en crant
pralablement des groupes comme par exemple des dciles, et en appliquant la fonnule
mathmatique:
Y
c
"
Pc
= le nombre d'emprunteurs dans la catgorie c
= la probabilit de dfaut de la catgorie c
r/Jc = le nombre de dfaut de la catgorie c
= le nombre de catgories avec c = 1, 2, 3, ... , C
2.11 Conclusion
La mthode de travail, prsente tout au long du chapitre, dfinit les diverses tapes qui
seront suivies lors du dveloppement du modle. L'application de cette mthode pennet de
fonnaliser les travaux et d'assurer une validit des rsultats qui seront obtenues lors de
l'estimation du modle.
CHAPITRE III
RSULTATS D'ESTIMATION
3.1 Introduction
Les variables composant le modle initial ont t prslectionnes en fonction du Coefficient
Gini, de l'IV, des tests de corrlation qui ont t raliss et de l'intuition. Le modle a t
estim l'aide d'une rgression logistique multivarie en utilisant une procdure
stepwise comme le proposent Hosmer et Lemeshow (2000).
3.2 Estimation des paramtres du modle gnral
L'hypothse consiste rejeter Ho et vrifier que f3 est diffrent de zro. Les premiers
rsultats dmontrent que les variables retenues rencontrent individuellement le seuil de
significativit qui a t fix 0,01 %. L'analyse des variables ligibles pour un rejet est
prsente ci-dessous. Le test de Wald a t ralis pour chaque variable du modle.
Tableau 3.2.1 Analysis of Effects Eligible for Removal Modell
Wald
Effect DF Pr > ChiSq
Chi-Square
Catactif 3 4017.5027 <.0001
Catutili 4 1805.2179 <.0001
Catnsf 2 1200.8302 <.0001
Calresidence 2 654.2928 <.0001
Homme 1 538.6600 <0001
Catworsl 4 485.2190 <.0001
Calage 3 197.8066 <.0001
Garantie 1 38.7313 <.0001
Membre 1 30.2252 <.0001
Nous remarquons que les variables prslectionnes ont toutes t retenues lors du processus
d'limination du logiciel statistique et qu'elles sont statistiquement significatives et
reprsentatives de l'vnement de dfaut. La variable de l'pargne est celle qui apporte le
46
plus d'information pour prdire la probabilit de dfaut de l'emprunteur. EUe est suivie par le
pourcentage d'utilisation du crdit disponible et par le nombre de chques sans provision que
l'emprunteur a ralis au cours de la dernire anne. Par la suite, viennent dans l'ordre les
caractristiques relatives au statut rsidentiel, au sexe, la pire cote de crdit au bureau de
crdit et l'ge du dbiteur. L'avant dernire variable entrer dans le modle correspond la
notion de garantie sur le prt. La dernire caractristique quant elle reprsente le type de
relation qui existe entre l'institution financire et l'emprunteur. Le tableau qui suit prsente
les rsultats des paramtres de chacune des variables.
Tableau 3.2.2 Analysis of Maximum Likelihood Estimates Modell
Standard Wald
Parameter DF Estimate Pr> ChiSq
Error Chi-Square
Intercept 1 -3.6460 0.0967 1422.4292 <.0001
Membre 1 0.1799 0.0327 30.1678 <.0001
Garantie 1 -0.2984 0.0477 39.1324 <.0001
Homme 1 0.4942 0.0217 517.6788 <.0001
Catnsf 01 nsf= 0 1 -1.0483 0.0461 517.1468 <.0001
Catnsf 02 nsf= 1 1 -0.3756 0.0588 40.7523 <.0001
Catage 01 - de 35 ans 1 -0.1043 0.0345 9.1525 0.0025
Catage 0346 65 ans 1 -0.4136 0.0403 105.5506 <.0001
Catage 0466 ans et + 1 -0.7215 0.0706 104.3832 <.0001
Catactif 01 - de 0 $ 1 2.2363 0.1014 485.9752 <.0001
Catactif 02 - de 1 000 $ ou inconnue 1 1.5355 0.0424 1313.0134 <.0001
Catactif 03 1 001 $ et 5 000 $ 1 0.2948 0.0500 34.7830 <.0001
Catresidence 02 Locataire 1 0.5863 0.0321 334.4940 <.0001
Catresidence 03 Autre 1 0.1237 0.0370 11.2004 0.0008
Catutili 01 Util=0%-19% 1 -0.9007 0.0393 524.3987 <.0001
Catutili 02 Util = 20 % - 49 % 1 -0.6575 0.0456 207.9403 <.0001
Catutili 03 Util = 50 % - 99 % 1 -0.2991 0.0399 56.1917 <.0001
Catutili 04 Util >= 100% 1 0.3039 0.0717 17.9763 <.0001
Catworst 0\ 1 et + major 1 1.0026 0.0666 226.7287 <.0001
Catworst 02 1, 2 or 3 minor et no major 1 0.8897 0.0688 167.3522 <.0001
Catworst 04 1 9 stat no der. 1 0.3902 0.0608 41.2356 <.0001
Catworst 0399 NHNS 1 0.4217 0.0677 38.8205 <.0001
Le modle cherche dmontrer la relation qui existe entre le profil de l'emprunteur et
l'vnement de dfaut. Dans cet ordre d'ides, les variables continues ont t discrtises afin
de reprsenter cette relation qualitative. La catgorisation est galement ncessaire en raison
47
du caractre particulier des variables utilises. Les coefficients de chacune des catgories
rencontrent individuellement le seuil de 0,01 %. Nous remarquons par ailleurs que les
estimations vont pratiquement toutes dans la direction attendue l'exception d'une seule qui
sera discute un peu plus loin.
Les paramtres de la variable pargne dmontrent bien la dynamique qui existe entre
l'emprunteur et la probabilit de dfaut; plus le niveau d'pargne est faible au moment de la
demande de crdit plus le risque qu'un dfaut survienne durant la priode de performance
augmente. Nous remarquons galement que le niveau d'utilisation du crdit disponible au
moment de la demande de crdit est un dterminant de la probabilit de dfaut. Le risque de
dfaut de paiement est plus lev pour les emprunteurs qui n'ont pas de rfrences de crdit
ou dont le niveau de crdit dj allou est trs utilis. Nous remarquons de la mme faon
que le demandeur de crdit qui a peu ou pas de chques sans provision dans l'anne qui
prcde sa demande de crdit possde un risque infrieur celui qui s'est vu retourner
plusieurs chques. Le statut rsidentiel est galement un lment significatif. Les
emprunteurs qui louent leur logement sont plus risqus que ceux qui sont propritaires. Nous
remarquons paralllement que les hommes sont plus risqus que les femmes, nous n'avons
pas cette tape-ci d'indices qui peut expliquer ce constat.
Le comportement pass par rapport la consommation de crdit allou est aussi prdictif du
comportement futur. Les emprunteurs qui utilisent du crdit sans jamais avoir eu de clauses
drogatoires sont mois risqus que ceux qui ont eu des retards, soit mineurs ou majeurs, ou
bien qui ont eu des dfauts de paiement ou encore qui ne sont tout simplement pas tablis au
crdit. Le cycle de vie a galement des rpercussions sur la consommation du crdit et la
probabilit de dfaut. Cette relation est reprsente par les coefficients des catgories de la
variable ge. Le risque est plus lev pour les personnes des segments de 45 ans et moins que
pour ceux des 46 ans et plus. Ceci est certainement expliqu par un besoin accru de crdit
dans la premire partie du cycle de vie o les revenus sont plus faibles et les engagements
financiers plus levs alors que dans la deuxime, la richesse augmente et les besoins en
crdit diminuent. Nous remarquons que le degr de significativit du segment 35 ans et moins
est plus faible que les autres au niveau du test de Wald . Mme si le niveau de 0,01 % est
48
atteint, nous remarquons que cette catgorie est la moins reprsentative de toutes. Nous
aurions pu nous attendre ce que la relation entre ce segment et celui de rfrence, qui est les
36 45 ans, soit reprsente par un signe ngatif. Plus prcisment, nous aurions pu nous
attendre ce que le segment des plus jeunes soit le plus risqu de tous et que sa probabilit de
dfaut soit lgrement suprieure celle du segment de rfrence. Ce rsultat est peut tre d
au fait que les jeunes doivent bien souvent prsenter des garanties pour se voir octroyer du
crdit. Ces rsultats vaudraient la peine d'tre investigus plus en dtail.
La variable garantie dmontre que le risque est infrieur lorsque le crdit est cautionn par un
moyen quelconque, comme par exemple, l'aide d'un co-emprunteur ou d'une caution. Fait
tonnant, nous aurions pu nous attendre un effet diffrent pour la variable membre. Mme
si son niveau prdictif est plutt faible, nous aurions pu nous attendre un niveau de risque
infrieur pour les clients membres par rapport ceux qui ne le sont pas. Cette situation
pourrait tre due au fait que l'institution financire prend moins de risque avec la clientle
qu'elle ne connat pas et accepte des dossiers de meilleure qualit dans ce segment.
3.3 Rsultats de l'estimation du modle gnral
Le modle a par la suite t test dans sa globalit afin de vrifier que l'ensemble des
variables sont significatives simultanment. Le tableau qui suit prsente les diffrents
rsultats obtenus pour les tests statistiques Likelihood Ratio , Score et Wald .
Tableau 3.3.1 Testing Global Nul! Hypothesis: BETA=O Model1
Test Chi-Square DF Pr > ChiSq
Likelihood Ratio 9295.1126 21 <.0001
Score 8800.7693 21 <.000\
Wald 7066.9304 21 <.0001
Les statistiques calcules pour valuer le modle dans sa globalit rencontrent toutes le seuil
critique de 0,01 %. Les variables dans leur ensemble sont significatives tout comme elles
l'taient au niveau individuel. Le modle est considr comme convenable.
49
Des statistiques comparatives tels le Akaike Information Criterion , le Schwarz
Criterion et le -2 Log L ont par la suite t calcules. Le tableau ci-dessous prsente les
diffrentes valeurs qui ont t obtenues pour le modle gnral. Ces statistiques n'ont pas de
valeur en soit sinon qu'elles doivent tre compares celles d'un autre modle pour leur
donner une signification.
Tableau 3.3.2 Model Fit Statistics Modell
Criterion
Intercept Intercept
Only And Covariates
AIC 70695.211 61442.099
SC 70704.749 61651.931
-2 Log L 70693.211 61398.099
Nous nous intressons particulirement la colonne Intercept and Covariates . Nous
cherchons le modle qui a les valeurs les plus petites. Ceci signifie que le modle de
rfrence reprsente mieux la ralit que le modle auquel il est compar. Une meilleure
reprsentation ne se fait pas pour autant au dtriment d'une suradaptation puisque les
statistiques allouent une pnalit pour l'accroissement du nombre de degrs de libert. Les
valeurs de ces statistiques seront confrontes celles qui seront obtenues lors de l'estimation
du modle gnral avec variables macroconomiques.
Par ailleurs, d'autres tests seront raliss afin d'valuer la capacit du modle diffrencier
les types d'emprunteurs et estimer leur probabilit de dfaut.
3.4 Estimation des paramtres du modle avec variables macroconomiques
L'hypothse de travail consiste rejeter Ho et vrifier que 8 est diffrent de zro. Suite la
premire estimation du modle prsente prcdemment, des variables macroconomiques
ont t introduites afin de vrifier la capacit prdictive du modle et ainsi vrifier si
l'intgration de ces nouvelles variables permet d'augmenter la performance. Un choix a d
tre fait lors de la slection des variables macroconomiques afin d'viter d'introduire de la
colinarit dans le modle.
50
Le tableau ci-dessous prsente les rsultats du test de Wald et les niveaux de
significativit pour chacune des variables du modle qui inclut les variables
macroconomiques Model 2 . Seulement deux des variables macroconomiques
introduites dans le modle ont t retenues dans le processus d'limination itratif.
Tableau 3.4.1 Analysis of Effects Eligible for Removal Model2
Wald
Effect DF Pr> ChiSq
Chi-Square
Catactif 3 4017.5027 <.0001
Catutili 4 1805.2179 <.0001
Catnsf 2 J200.8302 <.0001
Catresidence 2 654.2949 <.0001
Homme 1 538.6292 <.0001
Catworst 4 485.1988 <.0001
Catage 3 197.8042 <.0001
Garantie 1 38.7312 <.0001
Tx_ch_T-1 1 36.5474 <.0001
Ind conf T-I 1 32.6514 <.0001
Membre 1 10.6066 0.0011
Nous remarquons que les variables macroconomiques introduites dans le modle sont
statistiquement significatives et peuvent expliquer en partie l'vnement de dfaut. Chacune
d'elles rencontre le seuil critique de 0,01 %. Mise part la variable membre, la classification
des variables individuelles et la valeur du test de Wald pour chacune d'elles sont
identiques que dans le cas du modle gnral. L'pargne est la caractristique la plus
significative (elle gnre galement l'effet empirique le plus important), suivie du
pourcentage d'utilisation du crdit disponible, du nombre de chques sans provision, du statut
rsidentiel, du sexe, de la pire cote de crdit au bureau de crdit, de l'ge du dbiteur et de la
garantie.
Le taux de chmage et l'indice de confiance des consommateurs du trimestre prcdant la
demande de crdit sont plus significatifs que la variable membre, qui identifie le type de
relation entre le client et l'institution financire, en comparaison au modle gnral. La
statistique de Wald a diminu pour la caractristique membre.
51
Le tableau qui suit prsente les paramtres estims pour le deuxime modle qui inclut les
variables macroconomiques. Encore une fois, tous les coefficients rencontrent le seuil de
0,01 %.
Tableau 3.4.2 Analysis of Maximum Likelihood Estimates Model2
Standard Wald
Parameter DF Estimate Pr > ChiSq
Error Chi-Square
Intercept 1 -3.1982 0.1778 323.5183 <.0001
Membre 1 01132 0.0348 10.6000 0.0011
Garantie 1 -0.2906 0.0477 37.0450 <.0001
Homme 1 0.4946 0.0217 518.2142 <.0001
Catnsf 01 nsf= 0 1 -1.0489 0.0461 517.3971 <.0001
Calnsf 02 nsf= 1 1 -0.3754 0.0589 40.6846 <.0001
Calage 01 - de 35 ans 1 -00990 0.0345 8.2426 0.0041
Calage 0346 65 ans 1 -0.4149 0.0403 106.1781 <.0001
Calage 0466 ans el + 1 -0.7202 0.0707 103.8490 <.0001
Catactif 01 - de 0 $ 1 2.2211 0.1015 478.4117 <.0001
Cataclif 02 - de 1 000 $ ou inconnue 1 1.5331 0.0424 1308.5125 <.0001
Calaclif 03 1 001 $ el 5 000 $ 1 0.2946 0.0500 34.7129 <.0001
Catresidence 02 Lo<.:alaire 1 0.5760 0.0321 322.0286 <.0001
Calresidence 03 Autre 1 0.1230 00370 Il.0674 0.0009
Catulili 01 Uli1 = 0% - 19% 1 -0.9063 0.0393 530.6023 <.0001
Calulili 02 Util = 20% - 49% 1 -0.6618 0.0456 210.5975 <.0001
Catutili 03 Uti1 = 50% - 99% 1 -0.3005 0.0399 56.6798 <.0001
Catutili 05 Ulil >= 100% 1 0.2961 0.0717 17.0516 <.0001
Catworst 01 1 et + major 1 0.9996 0.0666 225.2053 <.0001
Catworst 02 J, 2 or 3 minor el no major J 0.8865 0.0688 165.9716 <.0001
Catworsl 04 1 9 stat no der. 1 0.3870 0.0608 40.5230 <.0001
Catworst 0399 NHNS 1 0.4160 0.0677 37.7472 <.0001
Tx ch T-1 1 0.0252 000439 32.7986 <.0001
Ind conf T-I 1 -0.00648 0.00151 18.4795 <.0001
Les variables macroconomiques ont seulement un degr de libert. Elles n'ont pas t
catgorises quoique l'option ait t value. Ce choix a t fait considrant qu' la
diffrence des autres variables qui sont utilises pour le modle, ces dernires n'ont pas de
dimension qualitative et sont continues. La linarit entre les variables macroconomiques
utilises et l'vnement de dfaut a tout de mme t vrifie pour s'en assurer.
52
Nous remarquons que le log des odds de la probabilit de dfaut est plus lev de 0,0252
lorsque le taux de chmage du trimestre prcdent est plus lev de 1 %. Par ailleurs, la
relation entre cette variable et la probabilit de dfaut va dans la direction attendue. Nous
nous attendions ce que la probabilit de dfaut soit plus leve dans les rgions et priodes
o le taux de chmage est plus lev. Pour l'indice de confiance des consommateurs du
trimestre prcdent la demande de crdit, la relation va galement dans la direction attendue.
Le log des odds est plus faible de 0,00648 lorsque l'indice de confiance est plus lev de
1. Ces rsultats sont donc conformes aux attentes.
Lorsque nous comparons les paramtres de chacune des variables du modle, nous
remarquons que les variables macroconoDques, malgr qu'elles soient statistiquement
significatives, ont trs peu d'effet sur la probabilit de dfaut. Tel que prsent ci-dessus, le
changement dans le log des odds indue par une variation de ces variables est trs faible
comparativement aux variables individuelles qui ont t utilises.
3.5 Rsultats de l'estimation du modle avec variables macroconoDques
Le modle a par la suite t test dans sa globalit afin de vrifier que l'ensemble des
variables sont significatives simultanment en incluant les nouvelles variables
macroconomiques. Le tableau qui suit prsente les diffrents rsultats obtenus pour les tests
statistiques Likelihood Ratio , Score et Wald .
Tableau 3.5.1 Testing Global Null Hypothesis: BETA=O Model 2
Test Chi-Square DF Pr> ChiSq
Likelihood Ratio 9343.7277 21 <.0001
Score 8841.0095 21 <.0001
Wald 7096.3367 2l <.0001
Les statistiques calcules pour valuer le modle dans sa globalit rencontrent toutes le seuil
critique de 0,01 %. Les variables sont donc significatives dans leur ensemble tout comme
elles l'taient au niveau individuel. Le modle est considr comme convenable.
53
Le Akaike Information Criterion , le Schwarz Criterion et le -2 Log L ont par la
suite t calculs. Le tableau ci-dessous prsente les diffrentes valeurs qui ont t obtenues
pour le modle avec variables macroconomiques.
Tableau 3.5.2 Model Fit Statistics Model2
Criterion
Intercept Intercept
Only And Covariates
AIC 70695.211 61397.483
SC 70704.749 61626.392
-2 Log L 70693.211 61349.483
Tel que signal au point 4.3.2, ces statistiques permettent de comparer des modles entre eux.
Nous nous intressons au modle pour lequel les statistiques sont les plus faibles. Nous
remarquons que le modle avec variables macroconomiques possde les valeurs les plus
faibles pour les trois statistiques. Nous sommes donc en mesure de confirmer que le modle
qui inclut des variables macroconomiques reprsente mieux l'vnement de dfaut que le
modle gnral.
3.6 Capacit des modles diffrencier les populations
La prochaine tape consiste dterminer la capacit des modles diffrencier les bons
des mauvais emprunteurs. cette fin, des statistiques comparatives ont t calcules et
compares. Deux principaux indicateurs sont utiliss pour raliser cet exercice. Le premier
consiste calculer l' AUROC qui est une transformation linaire du Coefficient Gini, le
deuxime, consiste calculer le KS . Les dfinitions de ces statistiques et les quations
mathmatiques pour les calculer ont t prsentes au chapitre II aux sections 2.8 et 2.10.1.
L'utilisation de ces deux statistiques est reconnue tant dans la thorie que dans la pratique.
3.6.1 Diffrenciacion sur l'chantillon de dveloppement
Le tableau ci-aprs prsente les statistiques AUROC et KS qui ont t calcules sur
les chantillons de dveloppement du modle gnral et du modle avec variables
macroconomiques.
54
Notre premire constatation est que les valeurs obtenues pour ces statistiques sont trs prs
l'une de l'autre et que le modle avec les variables macroconomiques obtient tout de mme
des valeurs suprieures.
Tableau 3.6.1 AUROC et KS pour l'chantillon de dveloppement
Modle AUROC KS
Modle gnral 0.767 0.4\0
Modle avec variables
macroconomiques
0.768 0.412
Les valeurs obtenues pour le AUROC et le KS dmontrent que le modle gnral et le
modle avec variables macroconomiques arrivent bien diffrencier le risque pour les
nouvelles expositions qui ont t octroyes. Les rsultats illustrent que l'ajout de variables
macroconomiques permet d'augmenter, bien que trs modestement, la performance du
modle en terme de capacit diffrencier les types d'emprunteurs.
3.6.2 Diffrenciation sur l'chantillon de validation in-sample
La robustesse du modle a t teste sur deux chantillons prvus cette fin. La premire
validation a t ralise sur un chantillon in-sample . Ces dOill1es provieill1ent de la
mme priode que celle qui a t utilise pour dvelopper le modle. Le tableau ci-dessous
prsente les rsultats qui ont t obtenus.
Tableau 3.6.2 AUROC et KS pour l'chantillon de validation in-sample
Modle AUROC KS
Modle gnral 0.767 0.411
Modle avec variables
0.768 0.411
macroconomiques
Nous remarquons que la performance des modles se maintient sur ce premier chantillon de
validation. Les valeurs obtenues pour le AUROC dmontrent que le modle avec
variables macroconomiques obtient une performance modestement suprieure. Le KS
quant lui dmontre une performance pour le moins similaire.
55
3.6.3 Diffrenciation sur l'chantillon de validation out-of-sample
La deuxime validation a t ralise sur un chantillon out-of-sample . Ces donnes
proviennent d'une priode diffrente de celle qui a t utilise pour dvelopper le modle. Le
tableau ci-dessous prsente les rsultats de l' AUROC et du KS qui ont t obtenus.
Tableau 3.6.3 AUROC et KS pour l'chantillon de validation out-of-sample
Modle AUROC KS
Modle gnral 0.756 0.399
Modle avec variables
macroconomiques
0.756 0.395
Nous remarquons que la performance des deux modles est infrieure sur l'chantillon de
validation out-of-sample comparativement celle utilise pour le dveloppement ou pour
la validation in-sample . La perfom1ance des modles s'est lgrement dgrade mais
l'cart par rapport l'chantillon de dveloppement est faible. Il est galement not que le
modle avec les variables macroconooques ne performe pas oeux que le modle gnral
(la statistique AUROC est identique pour les deux modles alors que le KS est de 0,004
infrieur dans le cas du modle avec variables macroconooques).
Des recherches additionnelles ont t ralises sur cet chantillon afin de vrifier si certains
segments pouvaient bnficier de faon plus importante de l'apport d'information des
variables macroconooques.
Tableau 3.6.4 AUROC et KS pour les clientles non-membres
Modle AUROC KS
Modle gnral 0.712 0.320
Modle avec variables
0.715 0.326
macroconomiques
Nous avons remarqu que lorsque nous segmentons les clientles non-membres de celles qui
le sont, le modle avec les variables macroconooques obtient les meilleurs rsultats. Cette
56
situation pourrait tre d au fait que l'infonnation de type individuel tant plus limite
lorsque l'emprunteur est non-client de l'institution, l'ajout de variables de march
compenserait ce manque.
3.7 Capacit des modles estimer la probabilit de dfaut
La dernire tape pour valuer la perfonnance des modles consiste valuer leur capacit
prdire l'vnement de dfaut. Cet exercice sera ralis en effectuant le test du Chi-carr
qui est galement connu sous le nom du test de Hosmer et Lemeshow . Lors de cette
tape, nous valuerons le nombre de dfauts prdits par les modles que nous comparerons au
nombre de dfauts qui se sont effectivement raliss. Tout comme pour la section sur la
capacit des modles diffrencier les emprunteurs, les estimations de la probabilit de
dfaut seront valides sur un chantillon in-sample et out-of-sample .
3.7.1 Test du Chi-carr sur l'chantillon de dveloppement
Nous avons voulu, dans une premire tape, vrifier et comparer la capacit des modles
estimer la probabilit de dfaut sur l'chantillon de dveloppement. Pour cet exercice, nous
avons utilis un regroupement par rgion gographique afin de comparer les probabilits de
dfaut prdites et celles ralises dans chacune des rgions utilises pour le dveloppement
du modle.
Tableau 3.7.1 Test du Chi-carr sur l'chantillon de dveloppement
Modle Dveloppement
Modle gnral 313
Modle avec variables
295
macroconomiques
Nous remarquons que pour l'chantillon de dveloppement, le test du Chi-carr est plus
faible pour le modle avec les variables macroconomiques que pour le modle gnral. Ce
rsultat dmontre que le modle qui inclut les variables macroconomiques arrive mieux
prdire la probabilit de dfaut que le modle gnral pour l'chantillon de dveloppement.
57
3.7.2 Test du Chi-carr sur les chantillons de validation
Nous voulons maintenant vrifier le pouvoir prdictif des modles sur les chantillons de
validation. Pour cet exercice, nous allons vrifier la capacit des modles prdire
l'vnement de dfaut pour chacun des trimestres de la priode d'observation.
Tableau 3.7.2.1 Test du Chi-carr pour les chantillons de validation
Validation Validation
Modle
in-sample out-of-sample
Modle gnral 81 48
Modle avec variables
71 79
macroconomiques
Nous remarquons que pour l'chantillon de validation in-sample , le modle avec les
variables macroconomiques performe mieux que le modle gnral. En ce qui a trait aux
rsultats pour l'chantillon de validation out-of-sample , nous observons que le modle
avec variables macroconomiques performe moins bien. Ce rsultat est contre-intuitif et
mrite d'tre explor.
Tableau 3.7.2.2 Probabilit de dfaut pour le validation out-of-sample
PD
Trimestre PD Modle avec variables
macroconomiques
PD
Modle gnral
2003-TI 7.42% 6.7l4% 6.99l%
2006-T2 6.62% 6.159% 6.097%
2006-T3 6.60% 6.034% 6.233%
Le modle gnral performe mieux pour TI-2003 et T3-2006. Ces deux trimestres
correspondent respectivement aux premier et dernier trimestres de la priode d'observation
qui a servi la validation des modles. Nous distinguons que la probabilit de dfaut est
suprieure pour cette priode comparativement celle observe lors du dveloppement des
modles qui tait en moyenne de 5,79 %. Cette diffrence dans la composition du portefeuille
pourrait expliquer en partie la difficult du modle avec variables macroconomiques lors de
ces deux trimestres. Nous remarquons galement au cours de cette priode des variations au
niveau du taux de chmage qui pourraient aussi expliquer en partie les difficults du modle.
58
3.7.3 volution du taux de chmage et de la probabilit de dfaut
Le graplque ci-dessous prsente les taux de chmage canadien et qubcois retards d'un
trimestre et la probabilit de dfaut relle et projete par les deux modles. Nous remarquons
que la probabilit de dfaut suit la tendance du taux de chmage. Elle est plus leve pour les
prts octroys lorsque le taux de chmage tait plus lev alors qu'elle est plus faible lorsque
le taux de chmage tait plus faible.
Graphique 3.8 volution du taux de dfaut et du taux de chmage
10.00% - - - - ~ - - - 1 - - - -1- - - - r- - - - T - - - ., - - -
9.00% - - _. - -
,
8.00% . --- --
.---.'
5.00%
4.00% + - - - r - - ~ - - - , - - - ~ - - ~ - - . . _ _ - . . . ; _ - ~ - _ _ ; . . - ~ -
- _ PD _ - -PDmod.gn. --PDmod.macro.--Tilldech.Qct-l--Tx.dech,Cant-l
Nous observons qu'en dbut et en fin de priode d'observation, la probabilit de dfaut ne
suit pas la tendance dsire, elle diminue alors que le taux de chmage monte et elle
augmente alors que le taux diminue. Conune le modle ne couvre pas une priode
suffisanunent longue, la totalit d'un cycle conomique n'est pas capte. Mise part les
premier et dernier trimestres de la priode de validation, nous remarquons que la tendance de
long tenne du modle qui inclut les variables macroconomiques dmontre une perfonnance
suprieure. D'ailleurs, sur quinze trimestres observs, ce modle a mieux prdit la probabilit
de dfaut dix fois comparativement cinq pour le modle gnrai. Une priode de
dveloppement plus longue pennettrait d'augmenter la robustesse du modle.
59
3.8 Conclusion
Dans le cours du chapitre III, nous avons prsent les travaux d'estimation des modles.
Nous avons dbut par estimer les paramtres du modle gnral et nous avons calcul par la
suite les diffrentes statistiques permettant de valider les variables individuellement tout
comme en groupe. Les rsultats obtenus dmontrent que les variables retenues sont
statistiquement significatives et que le modle prdit convenablement l'vnement de dfaut.
Dans une deuxime tape, nous avons procd intgrer des variables macroconomiques au
modle gnral. Par les rsultats obtenus, nous avons remarqu que les variables
additionnelles sont galement statistiquement significatives et que ce deuxime modle prdit
aussi convenablement l'vnement de dfaut.
Lors de la troisime tape, nous avons compar la performance des deux modles et nous
avons remarqu que le modle qui inclut les variables macroconomiques reprsente mieux
l'vnement de dfaut que le modle gnral. Nous avons aussi calcul et compar les
diverses statistiques qui permettent d'valuer la performance des modles. Nous avons
remarqu qu'ils arrivent bien diffrencier les populations et prdisent convenablement la
probabilit de dfaut. Les rsultats obtenus ont dmontr que Ho: 8 1:- O. Nous pouvons
conclure que les variables macroconomiques introduites dans le modle ajoutent de
l'information au modle de base.
CONCLUSION
Les modles de risque de crdit la consommation sont largement utiliss et leur origine
remonte aux annes cinquante. Le projet de mmoire a consist en une premire tape
tudier les origines et l'volution de ce type de modles l'aide de la littrature pertinente
disponible sur le sujet. En une deuxime tape, le projet a consist valuer empiriquement
un modle l'aide de donnes provenant d'un portefeuille de crdit d'une institution
financire. L'objectif de travail consistait vrifier si l'ajout de variables macroconomiques
permettait d'augmenter la performance du modle gnral.
Les avantages du recours aux modles de risque dans l'industrie du crdit sont bien connus et
les auteurs cits ont ralis des tudes sur le sujet pour le dmontrer. Dans le cas prsent,
nous avons voulu valuer un modle de base auquel nous avons ajout des variables de
march afin de vrifier leur apport prdictif. Nous voulions aussi vrifier si la probabilit de
dfaut variait en fonction de l'tat de l'conomie.
L'hypothse de travail ~ : 5 = 0 a t rejete, nous avons trouv que les variables
macroconomiques retenues taient statistiquement significatives et que le nouveau modle
reprsentait mieux l'vnement de dfaut que le modle de base. Au niveau du pouvoir de
diffrenciation et de prdiction, nous avons remarqu que les deux modles performaient
des niveaux satisfaisants. Le modle avec variables macroconomiques a tout de mme
dmontr une performance marginalement suprieure pour les trimestres de la priode de
dveloppement et de validation in-sample . Dans l'chantillon de validation out-of
sample , le modle n'a pas t en mesure de dmontrer significativement une performance
suprieure. Cette sous-performance pourrait tre due des effets externes tels que les niveaux
de dfaut diffrents dans les deux chantillons et l'utilisation d'une priode d'observation qui
n'est pas suffisamment longue pour capter un cycle conomique. Ces questions mriteraient
d'tre approfondies.
61
Le modle empirique qui a t prsent se voulait une tentative lmentaire d'intgrer des
variables de march dans un modle de risque de crdit l'octroi. Tel que mentionn au
cours de la recherche, d'autres approches et mthodes auraient pu tre utilises. Dans le cadre
d'une recherche future, de nouvelles avenues pourraient tre explores afin de mieux intgrer
ce type de variables.
En bout de ligne, corrune les projections futures sont bases sur des relations entre des
caractristiques et des vnements passs, une meilleure connaissance des raisons menant au
dfaut de paiement aurait des rpercussions positives sur l'exactitude des anticipations et
amliorerait la gestion du risque de crdit des banques.
BIBLIOGRAPHIE
Akhavein, J., W. Scott et L. J. White. 2005. The diffusion of financial innovations: an
examination of the adoption of small business credit scoring by large banking
organizations. Journal ofBusiness, vol. 78, no 2, p. 577-596.
Allen, L., G. Delong et A. Saunders. 2004. Issues in the credit risk modeling of retail
markets. Journal ofBanking & Finance, no 28, p. 727-752.
Altman, E. 1. 1968. Financial ratios, discriminant analysis and the prediction of corporate
bankruptcy. Journal Finance, no 23, p. 589-609.
Altman, E. 1. et A. Saunders. 1998. Credit risk measurement : Developments over the last
20 years. Journal ofBanking & Finance, no 21, p. 1721-1742.
Avery, R. B., R. W. Bostic, P. S. Calem et G. B. Canner. 1996. Credit Risk, Credit
Scoring, and the Performance of Home Mortgages. Federal Reserve Bulletin, vol. 82, no
7, p. 621-648.
Avery, R. B., R. W. Bostic, P. S. Calem et G. B. Canner. 2000. Credit Scoring: Statistical
Issues and Evidence from Credit-Bureau Files. Real Estate Economies, vol. 28, no 3, p.
523-547.
Avery, R. B., P. S. Calem et G. B. Canner. 2004. Consumer credit scoring: Do situational
circwnstances matter?. Working paper 146. Banque des Rglements Internationaux, Ble.
Berger, A. N., W. S. Frame et N. H. Miller. 2002 (avril). Credit scoring and the
availability, price, and risk of small business credit. Paper. Federal Reserve Board.
Berger, A. N. 2003. The economic effects of technological progress: Evidence from the
banking industry. Journal ofMoney, Credit and Banking, vol. 35, no 2 (avril), p. 141-176.
Berger, A. N., W. S. Frame et N. H. Miller. 2005. Credit scoring and the availability,
price, and risk of small business credit. Journal ofMoney, Credit and Banking, vol. 37, no
2 (avril), p. 191-222.
Bofondi, M. et F. Lotti. 2006. Innovation in the retail banking industry: The diffusion of
credit scoring. Review ofIndustrial Organization, no 28 (dcembre), p. 343-358.
Boyer, R., M. Dehove et D. Plihon. 2004. Les crises financires. Conseil d'analyse
conomique, Rapport du 1er trimestre 2004, Banque de France, 413 p.
63
Cont de Ble sur le contrle bancaire. 2004. Convergence internationale de la mesure et
des normes de fonds propres. Banque des Rglements Internationaux, Ble.
Cont de Ble sur le contrle bancaire. 2005. Studies on the validation of internai rating
systems. Working paper 14. Banque des Rglements Internationaux, Ble.
Cont de Ble sur le contrle bancaire. 2007. History of the Basel Committee and its
membership. Banque des Rglements Internationaux, Ble.
Dielman, T. E. 1998. The Pooled cross-sectional and time series data analysis. Marcel
Dekker. New York.
Durand, D. 1941. Risk e1ements in consumer instalment financing. National Bureau of
Economies Research, New York.
Engelmann, B. et R. Rauhmeier. 2006. The Basel II risk parameters: Estimation,
validation and stress testing. Bernd Engelmann and Robert Rauhmeier (Editors). Berlin
Heidelberg: Springer.
Fair Isaac Corporation. 2002. VISA Desjardins technical review. Document confidentiel.
Montral.
Fisher, R. A. 1936. The use of multiple measurements in taxonomie problems. Annals of
Eugenics, no 7, p. 179-188.
Greene, W. II. 1992. <<A statistica1 model for credit scoring. Paper. New York University.
Hand, D. J. et W. E. Henley. 1997. Statistical Classification Methods in Consumer Credit
Scoring: A Review. Journal ofthe Royal Statistical Society. Vol. 160, No. 3, p. 523-541.
Harrell, F. E. 2001. Regression modeling strategies. New York: Springer.
Hayden, E. 2006. Estimation of a rating model for corporate exposures. In The Basel Il
Risk Parameters. Bernd Engelmann and Robert Rauhmeier (Editors), p. 13-24. Berlin
Heidelberg: Springer.
Hayden, E. et D. Porath. 2006. Statistical methods to develop rating models. In The
Basel II Risk Parameters. Bernd Engelmann and Robert Rauhmeier (Editors), p. 1-12.
Berlin Heidelberg: Springer.
Hosmer, D. W. et S. Lemeshow. 2000. <<Applied Logistic Regression. John Wiley & Sons
(Editors). Second Edition, Wiley Inter-Science.
Johnston, 1. et 1. Dinardo. 1997. Econometries methods. Lucille Sulton and Curt
Berkowitz (Editors). Fourth Edition, McGraw-Hill.
64
Klapper, L. F. et E. Krauss. 2002. The Information Infrastructure of South Africa.
Mimeo, World Banle
Leonard, K. 1. 1996. Information systems and benchmarking the credit scoring industry.
Benchmarkingfor Quality Management & Technology, vol. 3, no l, p. 38-44.
Medema, L., R. Koning et R. Lensink. 2007. <tA practical approach to validating a PD
model. Discussion paper, University of Groningen.
Porath, D. 2006. Scoring models for retai! exposures. In The Basel II Risk Parameters.
Bemd Engelmann and Robert Rauhmeier (Editors), p. 26-37. Berlin Heidelberg: Springer.
Schreiner, M. 2000. Credit Scoring for Microfinance: Can It Work? Journal of
Microfinance, vol. 2, no. 2, p. 105-118.
Straka, J. W. 2000. <tA shift in the mortgage landscape: The 1990s move to automated
credit evaluations. Journal ofHousing Research, vol. 11, no 2, p. 207-232.
Thomas, L. C. 2000. <tA survey of credit and behavioural scoring: Forecasting financial
risk of lending to consumers. International Journal ofForecasting, no 16, p. 149-72.
Thomas, L. C. 2003. Consumer Credit Modelling: Context and CUITent Issues. Paper.
University of Soutliliampton.
Thoroval, P.-y. et A. Duchateau. 2003. Stabilit financire et nouvel accord de Ble.
Revue de la stabilit financire, Banque de France, no 3, p. 53-67.

S-ar putea să vă placă și