MODLES DE RISQUE DE CRDIT LA CONSOMMATION: TUDE DU RLE DE
L'CONOMIE DANS LA PROBABILIT DE DFAUT MMOIRE PRSENT COMME EXIGENCE PARTIELLE DE LA MATRISE EN CONOMIQUE PAR JAVIER BRAILOVSKY DCEMBRE 2008 UNIVERSIT DU QUBEC MONTRAL Service des bibliothques Avertissement La diffusion de ce mmoire se fait dans le respect des droits de son auteur, qui a sign le formulaire Autorisation de reproduire et de diffuser un travail de recherche de cycles suprieurs (SDU-522 - Rv.01-200G). Cette autorisation stipule que conformment l'article 11 du Rglement no 8 des tudes de cycles suprieurs, [l'auteur] concde l'Universit du Qubec Montral une licence non exclusive d'utilisation et de publication de la totalit ou d'une partie importante de [son] travail de recherche pour des fins pdagogiques et non commerciales. Plus prcisment, [l'auteur] autorise l'Universit du Qubec Montral reproduire, diffuser, prter, distribuer ou vendre des copies de [son] travail de recherche des fins non commerciales sur quelque support que ce soit, y compris l'Internet. Cette licence et cette autorisation n'entranent pas une renonciation de [la] part [de l'auteur] [ses] droits moraux ni [ses] droits de proprit intellectuelle. Sauf entente contraire, [l'auteur] conserve la libert de diffuser et de commercialiser ou non ce travail dont [il] possde un exemplaire. REMERCIEMENTS Je tiens d'abord remerCIer mon directeur de mmoire, Monsieur Douglas Hodgson, professeur au dpartement des sciences conomiques de l'Universit du Qubec Montral, d'avoir supervis mes travaux de recherche. Je tiens aussi souligner et remercier la contribution de la Fdration des caisses Desjardins du Qubec qui a rendu possible les analyses empiriques qui sont prsentes dans le prsent mmoire. Merci spcialement Pascale ma conjointe pour son appui tout au long de la matrise et salutations ma famille, et particulirement mon pre Carlos pour ses encouragements depuis le tout dbut, et mon fils Charles pour son inspiration. TABLE DES MATIRES LISTE DES TABLEAUX v RESlJME Vll CHAPITREI INTRODUCTION 1 REVUE DE LA LITTRATURE 4 1.1 Introduction 4 1.2 Origine des modles statistiques pour les risques de crdit de dtail ............... 5 1.3 Effets sur l'offre de crdit, le prix et le risque 9 1.4 Cadre rglementaire ................................................................ 14 1.5 Critiques l'utilisation des notations pour l'attribution de prts 16 1.6 Modlisation des risques de crdit pour un portefeuille de dtail 18 1.7 Utilisation de variables macroconomiques ........................................... 22 1.8 Conclusion .................................................................................26 CHAPITRE II MODLE DE DFAUT 28 2.1 Introduction 28 2.2 Hypothse de travail 28 2.3 Structure du modle 30 2.4 Dfinition de l'vnement .............................................................. 31 2.5 Caractristiques individuelles utilises 32 2.5.1 Caractristiques du risque de l'emprunteur ................................. 32 2.5.2 Caractristiques du risque transactionnel ................................. 33 2.6 Variables macroconomiques 35 2.7 Forme fonctionnelle du modle 36 IV 2.8 Tests statistiques ....................................................................... 37 2.9 Transfonnation des variables 39 2.10 Analyses de perfonnance 41 2.10.1 Pouvoir de diffrenciation .................................................... 41 2.10.2 Pouvoir de prdiction .43 2.11 Conclusion ................................................................................. 44 CHAPITRE III RSULTATS D'ESTIMATION ...........................................................45 3.1 Introduction 45 3.2 Estimation des paramtres du modle gnral 45 3.3 Rsultats de l'estimation du modle gnral 48 3.4 Estimation des paramtres du modle avec variables macroconomiques .49 3.5 Rsultats de l'estimation du modle avec variables macroconomiques 52 3.6 Capacit des modles diffrencier les populations .................................. 53 3.6.1 Diffrenciation sur l'chantillon de dveloppement ....................... 53 3.6.2 Diffrenciation sur l'chantillon de validation in-sample ............. 54 3.6.3 Diffrenciation sur l'chantillon de validation out-of-sample 55 3.7 Capacit des modles estimer la probabilit de dfaut 56 3.7.1 Test du Chi-carr sur l'chantillon de dveloppement ., .56 3.7.2 Test du Chi-carr sur les chantillons de validation 57 3.7.3 volution du taux de chmage et de la probabilit de dfaut .............58 3.8 Conclusion ................................................................................. 59 CONCLUSION 60 BIBLIOGRAPHIE 62 v LISTE DES TABLEAUX Tableau 2.5.1 Caractristiques du risque de l'emprunteur 33 2.5.2.1 Caractristiques du prt 33 2.5.2.2 Caractristiques de le fiche de crdit .34 2.5.2.3 Caractristiques du compte d'opration 34 2.6 Variables macroconomiques 35 2.10.1 Courbe Cumulative Accuracy Profile (CAP) .42 3.2.1 Analysis of Effects Eligible for Removal Model1 .45 3.2.2 Analysis of Maximum Likelihood Estimates Model 1 .46 3.3.1 Testing Global Null Hypothesis: BETA=O Modell .48 3.3.2 Model Fit Statistics Model 1 .49 3.4.1 Analysis of Effects Eligible for Removal Model2 50 3.4.2 Analysis of Maximum Likelihood Estimates Model2 51 3.5.1 Testing Global Null Hypothesis: BETA=O Model2 52 3.5.2 Model Fit Statistics Model2 .53 3.6.1 AUROC et KS pour l'chantillon de dveloppement 54 3.6.2 AUROC)} et KS pour l'chantillon de validation in-sample , 54 3.6.3 AUROC et KS pour l'chantillon de validation out-of-sample )} 55 3.6.4 AUROC et KS pour les clientles non-membres 55 3.7.1 Test du Chi-carr)} sur l'chantillon de dveloppement 56 VI 3.7.2.1 Test du Chi-carr pour les chantillons de validation 57 3.7.2.2 Probabilit de dfaut pour la validation out-of-sample 57 3.8 volution du taux de dfaut et du taux de chmage 58 RSUM Cette recherche vise tudier les modles de risque de crdit la consommation et valuer les effets des conditions conomiques sur la probabilit de dfaut des emprunteurs. Dans le cadre des travaux, un modle empirique lmentaire sera dvelopp et estim. Il sera tent de vrifier si l'incorporation de variables macroconomiques permet d'augmenter la performance du modle de base. Une rglementation internationale a vu le jour dans les annes quatre-vingt suite de nombreuses crises bancaires. Une gestion saine et responsable du crdit doit considrer, entre autres, une valuation adquate du risque de crdit, et permettre de calculer le capital conomique rglementaire qui est requis en fonction du niveau de risque de la banque. Cette pratique a comme objectif d'assurer une stabilit financire et d'viter des faillites de banques lors de crises de crdit. L'utilisation des statistiques pour estimer ce type de risque remonte aux annes cinquante. Initialement, les modles taient utiliss lors des dcisions d'octroyer un prt un demandeur. Aujourd'hui, ils sont galement utiliss pour estimer la probabilit de dfaut des portefeuilles de crdit. L'analyse discriminante est la premire teclmique d'estimation qui a t utilise. Plusieurs autres mthodes sont couramment utilises depuis. Ces mthodes sont soit paramtriques (rgression linaire, rgression logistique, modle de panel, etc.) ou bien, non paramtriques (arbres de dcision, rseaux de neurones, etc.). Les variables prdictives du risque d'un emprunteur sont bien connues et documentes. Traditionnellement, les modles utilisaient des caractristiques individuelles qui valuent le risque de l'individu (ge, sexe, occupation, revenus, etc.) et le risque transactionnel (historique de crdit, historique bancaire, etc.). De nos jours, les tendances de la recherche dans le domaine consistent ajouter des dimensions conomiques qui permettent d'valuer le risque inhrent au march et ainsi mieux anticiper la probabilit de dfaut. Une rgression logistique sera employe pour estimer le modle. Des variables microconomiques d'emprunteurs seront utilises pour estimer la composante individuelle du risque, alors que des variables macroconomiques rgionales et nationales seront utilises pour reprsenter le risque inhrent aux conditions du march. Les rsultats obtenus ont dmontr que l'ajout de variables macroconomiques au modle permettait de mieux reprsenter l'vnement de dfaut. La capacit du modle diffrencier les types d'emprunteurs ainsi que son pouvoir prdire l'vnement de dfaut ont aussi t amliors quoique faiblement. Mots-cls: crdit la consommation, risque de crdit, rgression logistique INTRODUCTION Le secteur financier joue un rle important dans l'conomie o il sert d'intenndiaire entre l'pargne, la consommation, l'investissement et la production (Bofondi et Lotti, 2006). Nous remarquons que des crises financires se sont produites rptition depuis les annes soixante-dix et que leur nombre n'a cess d'augmenter. Nous n'avons qu' penser aux tats Unis rcemment, mais aussi l'Argentine (2001), la Russie (1999), l'Asie du sud/est (1997) et au Mexique (1994) pour n'en nommer que quelques-unes. Ces chocs ont des effets dvastateurs sur l'conomie des pays touchs et particulirement sur la pauvret. Les causes de ces perturbations sont complexes et comme le font remarquer Boyer, Dehove et Plihon (2004), chaque crise financire est unique parce qu'elle se ralise dans un contexte diffrent. Elles partagent toutes nanmoins certains fondements. Dans la plupart des cas, un emballement du crdit se propage aux marchs boursiers, des changes et immobiliers. Les crises financires et particulirement les crises bancaires ne surviennent pas uniquement dans les pays en dveloppement. Nous avons vu dernirement des faillites de banques dans des pays comme l'Allemagne, les tats-Unis et l'Angleterre. Nous avons aussi not que certaines crises se sont propages au niveau international. La libralisation et l'intgration des marchs financiers ne sont pas trangres cet effet. Les changements dans les environnements lgislatifs nationaux et internationaux du secteur bancaire ont modifi l'environnement concurrentiel et ouvert les marchs. Combins une croissance de la consommation, ces changements ont stimul l'innovation financire et l'apparition de produits de crdit diversifis. L'augmentation de la concurrence entre banques favorise l'octroi de prts plus risqus et le dveloppement d'instruments financiers complexes qui transfrent le risque des tiers. Ce contexte encourage l'utilisation d'une quantit de fonds propres plus faibles. Une rserve montaire faible ne peut pas 2 ncessairement couvrir les pertes sur prts additionnelles non planifies surtout si elles sont importantes. De ce problme peut d'ailleurs en dcouler un autre qui consiste crer un climat de mfiance envers la banque qui aura de la difficult obtenir de nouvelles liquidits. Les crises bancaires se caractrisent d'ailleurs par un problme de capitalisation et de liquidits. Elles mettent risque les dpts des pargnants et les capitaux des actionnaires. Elles favorisent la propagation de l'onde de choc d'autres marchs et un resserrement de l'offre de crdit s'en suit gnralement. C'est pourquoi d'ailleurs que lors de crises bancaires majeures, il n'est pas rare de voir des plans de renflouement des gouvernements afin d'viter des crises de liquidits et des faillites de banques. Des normes internationales ont t adoptes rcemment pour rglementer les pratiques de l'industrie bancaire. Cette normalisation a comme objectif de garantir une concurrence loyale entre banques et d'assurer une saine gestion du risque de crdit pour favoriser une stabilit financire et diminuer le risque de crises bancaires. C'est dans ce champ d'intrt que s'inscrit le prsent mmoire. Le travail de recherche qui est entrepris consiste tudier l'volution et les avantages escompts de la modlisation du risque de crdit. Dans le cadre des travaux, un modle empirique sera dvelopp pour un portefeuille de prts la consommation d'une institution financire. Les avances des dernires annes en matire de recherche consistent valuer les rpercussions des conditions conomiques sur la probabilit de dfaut des emprunteurs. Dans cet esprit, le modle qui sera dvelopp intgrera des variables macroconomiques afin de dterminer si elles apportent un pouvoir prdictif additionnel. L'approche qui est retenue consiste tudier un modle d'octroi de nouveaux prts. Cette approche est privilgie tout en tant conscient que divers facteurs survenant aprs l'octroi du crdit ont une influence sur l'vnement de dfaut. L'objectif de la recherche consiste dterminer si les conditions conomiques au moment de l'autorisation du prt peuvent aider en quelque sorte expliquer la probabilit de dfaut futur. 3 Le chapitre 1 fera un survol de la littrature pertinente sur le sujet. Dans ce chapitre, nous discuterons de l'origine et de l'volution des modles de risque de crdit. Nous discuterons aussi des effets de la diffusion de cette innovation sur la productivit, l'offre, le prix et le risque des banques. Nous aborderons brivement la rforme des capitaux rglementaires des Accords de Ble II et de ses effets sur les pratiques des institutions financires. Nous prsenterons galement quelques critiques l'gard de l'utilisation des modles lors de l'attribution du crdit. Nous dvoilerons par ailleurs les principales mthodes de modlisation qui sont couramment utilises et finalement, nous dcrirons les derniers avancements en ce qui a trait l'utilisation de variables macroconomiques dans les modles de risque de crdit. Le chapitre II prsentera les deux modles de dfaut qui seront valus et compars empiriquement. Dans ce chapitre, nous prsenterons l'hypothse de travail qui consiste dterminer si l'ajout de variables macroconomiques permet d'augmenter la performance du modle gnral. Nous dcrirons la structure des modles, la dfinition de dfaut qui a t retenue, les caractristiques des emprunteurs et les variables macroconomiques qui seront utilises pour modliser le risque. Nous y discuterons aussi de la forme fonctionnelle et des tests statistiques qui seront utiliss pour valider les modles. Finalement, nous y aborderons la notion de transformation des variables et d'analyse de performance en termes de capacit diffrencier les emprunteurs, et de pouvoir prdire l'vnement de dfaut. Le chapitre III prsentera les rsultats d'estimation. Nous y discuterons des valeurs obtenues pour les paramtres des diverses variables retenues. Nous dvoilerons les rsultats des tests statistiques raliss pour valider les modles comme galement ceux utiliss pour valuer le pouvoir de diffrenciation et de prdiction. Pour terminer, nous conclurons la recherche en faisant un retour sur l'objectif du mmoire, les rsultats obtenus et la dmonstration de l'hypothse de travail. CHAPITRE 1 REVUE DE LA LITTRATURE 1.1 Introduction Divers articles de recherche et ouvrages ont t publis au fil des ans sur les systmes de notation des risques de crdit et les modles statistiques qui les composent. La documentation rpertorie est varie et aborde les modles de risque de crdit sous diffrents aspects. Cette documentation a contribu situer le sujet de recherche et dtenniner les objectifs de travail pour le dveloppement du modle de risque qui sera prsent dans le chapitre Il. La revue littraire se limite prsenter l'origine et l'volution des modles au fil du temps, en mettant l'accent sur divers aspects conomiques tels que l'offre de crdit, le prix et la productivit, mais aussi sur d'autres telles la slection adverse, la modlisation des risques et l'utilisation de variables macroconomiques. La revue de la littrature a t rpartie en sept sections afin d'en faciliter la synthse et la prsentation. La premire section dcrit l'origine et l'volution des modles et systmes au fil du temps. La deuxime traite des effets de la diffusion de cette innovation sur la productivit, l'offre, le prix et le risque des banques. La troisime section aborde la rforme des capitaux rglementaires de l'Accord de Ble II et de ses effets sur les pratiques d'octroi et d'valuation des risques de crdit des institutions financires. Dans la quatrime section, il y est discut de certaines critiques l'gard de l'utilisation des modles de notation lors de l'attribution du crdit. La cinquime section survole les mthodes de modlisation des risques de crdit qui sont couramment utilises. Finalement, la septime section aborde l'utilisation de variables macroconomiques dans les modles et de certaines approches rpertories. Les rpercussions des conditions conomiques sur la probabilit de dfaut des emprunteurs ne sont pas trs bien connues. Peu de thorie conomique existe sur l'utilisation de variables macroconomiques dans les modles de risque de crdit la consommation. Le sujet intresse plusieurs chercheurs et diffrentes approches sont proposes. 5 1.2 Origine des modles statistiques pour les risques de crdit de dtail Pour dbuter la revue de la littrature, il faut mentionner Thomas (2003) qui fait rfrence Lewis (1992) qui retrace les premires utilisations du crdit au temps des Babyloniens il y a trois milles ans. Thomas (2003) poursuit en nous informant que le crdit la consommation de masse tel que nous le connaissons aujourd'hui date seulement des cinquante dernires annes. L'auteur nous mentionne que: Vers les annes 1920, Henry Ford et A. P. Sloan ont reconnu que ce n'tait pas suffisant de fabriquer des produits tels que des voitures, pour la consommation de masse, mais qu'il fallait aussi dvelopper des faons de financer ces achats. (p. 1) Ce fut le coup d'envoi pour le dveloppement des compagnies de finance aux tats-Unis au dbut du XXe sicle et celui des cartes de crdit plus tard dans les annes soixante. Thomas (2000) nous fait remarquer que depuis les trente dernires annes, l'importance de l'valuation des risques financiers a contribu la croissance de l'utilisation des statistiques et des modles de probabilit. Il nous mentionne que lorsqu'on pense au risque financier, on se rfre aux portefeuilles d'actions, obligations et autres actifs du genre. Cependant, il existe la catgorie du crdit la consommation qui est moins connue et dont l'valuation du risque est tout aussi importante. Le crdit sous forme de prts de dtail peut tre regroup et former un actif financier. L'valuation du risque de cet actif s'effectue l'aide de diverses approches statistiques qui seront dcrites dans la prsente recherche. La premire mthode a avoir vu le jour, et qui est encore couramment utilise aujourd'hui, est l'analyse discriminante. Thomas (2000) nous apprend que l'origine de cette forme d'analyse remonte aux annes trente: Cette ide de diffrencier des groupes l'intrieur d'une population a t introduite dans les statistiques par Fisher (1936). (p. 151) Cette premire application avait lieu en sciences naturelles. Elle permit de diffrencier deux varits d'iris comme galement de diffrencier l'origine de crnes distincts en comparant les tailles physiques respectives. Il nous rvle aussi que: David Duran (1941) a t le premier reconnatre que ces mmes techniques pouvaient tre utilises pour diffrencier les bons des mauvais prts. (p. 151) 6 Schreiner (2000) rsume bien l'approche. Il nous mentionne qu'il est possible d'anticiper la perfonnance future de prts en se basant sur des caractristiques prdictives, et en l'estimant partir de la perfonnance passe de prts dont les caractristiques sont similaires. Thomas (2000) explique que les dbuts de l'automatisation des dcisions de crdit remontent l'poque de la deuxime guerre mondiale. Alors que les analystes de crdit taient appels au service militaire, le manque de main-d'uvre spcialise obligea les fIrmes automatiser les rgles de dcision humaine sous fonne de systmes experts. Au dbut des annes cinquante, le groupement de ces systmes et des techniques d'analyse discriminante est l'origine de l'utilisation des notations des risques dans les attributions des prts. C'est par ailleurs l'avnement des cartes de crdit la fIn des annes soixante qui a fait raliser aux metteurs l'importance des notations puisque sans elles, il aurait t impossible d'automatiser les dcisions de crdit et de rpondre la demande en tenne conomique et de main d'uvre. L'utilisation de modles statistiques a t rendue possible grce , entre autres, l'innovation technologique dans l'utilisation et l'change d'infonnation sur les emprunteurs. Ce volet sera abord dans la prochaine section. Thomas (2000) nous rvle galement que les mthodes de dcision taient bases traditionnellement sur un jugement mental des 3 Cs et mme des 5 Cs du crdit. Ces critres d'valuation sont tirs de l'anglais et correspondent aux tennes suivants: i) Character : rputation de l'emprunteur. ii) Capital : montant du prt. iii) Collateral : mise de fonds et valeur marchande versus le prt. iv) Capacity : capacit rembourser. v) Condition : conditions du march. L'inconsistance dans les dcisions de crdit attribue au jugement humain a galement t un facteur dterminant dans le dveloppement des approches statistiques pour l'valuation des risques de crdit. L'auteur souligne fInalement un lment qui nous intresse particulirement 7 dans le cadre de la recherche actuelle. Il mentionne la ncessit d'incorporer dans les modles une dimension qui capte les changements des conditions conomiques puisqu'ils peuvent affecter le risque de l'emprunteur. Allen, Deong et Saunders (2004) nous font remarquer dans le mme ordre d'ides les pratiques traditionnelles: Historiquement, les banquiers se confiaient aux analystes de crdit et leurs systmes experts bass sur les 5 Cs du crdit [... ]. (p. 734) Les auteurs soulvent le fait que les systmes experts traditionnels ne sont pas en mesure de pondrer l'importance relative de chacun des Cs lors de l'estimation de la probabilit de dfaut. Ils soulvent par ailleurs que: Les modles de notation de crdit sont relativement peu coteux implanter et ne souffrent pas de subjectivit ni d'inconsistance comme les systmes experts. (p. 736) Un des avantages des modles de notation des risques est qu'ils sont bass sur des variables statistiquement reprsentatives et ne souffrent pas de l'inconsistance du jugement humain. Straka (2000) fait aussi mention des Cs du crdit dans son article portant sur les changements de pratique d'valuation des prts du secteur hypothcaire au cours des annes quatre-vingt-dix. Suite aux succs de l'utilisation de ces modles pour l'valuation des cartes de crdit et des prts la consommation dans les annes soixante-dix et quatre-vingt, il mentionne que l'application de modles statistiques pour la notation des prts hypothcaires a littralement transform les pratiques de ce march. Ceci est d au fait que: [ ... ] les modles statistiques d'automatisation des dcisions de crdit ne semblent pas tre seulement plus rapides mais aussi plus efficaces, consistants, objectifs et prcis que les pratiques habituelles de dcision du pass. (p. 208) L'auteur souligne que l'utilisation des notations statistiques, a permis d'valuer l'ampleur du problme reli au phnomne d'anti-slection, prsent dans la relation principal agent lors d'une demande de crdit: Les pertes de l'industrie relies au dfaut de paiement ont t rduites et mieux couvertes l'aide d'une mthode amliore de dpistage des emprunteurs risqus et de tarification qu'en comparaison aux mthodes d'valuation manuelle traditionnelles (p. 217) Ce dernier aspect nous intresse particulirement sous un point de vue conomique puisqu'une valuation plus prcise de la qualit des emprunteurs permet de mieux provisionnel' et contrler l'exposition 8 au risque et ainsi favoriser une stabilit financire. Autre point d'intrt, l'auteur mentionne l'importance de faire de la recherche dans le domaine et spcialement sur les rpercussions de la situation conomique sur les projections du risque. Il suggre aussi de faire du stressed testing sur les modles, qui consiste anticiper les conditions conomiques futures, afin d'valuer l'effet des chocs et cycles conomiques sur le risque du portefeuille de crdit. L'objectif de la prsente recherche consiste valuer les effets des conditions contemporaines du march lors de la demande de crdit sur la probabilit de dfaut futur, l'aspect du stressed testing ne sera pas abord. Le secteur des prts aux petites et moyennes entreprises a suivi la tendance des autres secteurs d'valuation du risque de crdit en terme d'utilisation des notations. Akhavein, Frame et Wllite (2005) soulignent: Pendant que les notations du risque de crdit taient utilises depuis un certain temps pour les autorisations de prts et hypothques aux particuliers, cette technologie a dbut seulement vers la moiti de la dcennie des annes quatre-vingt-dix tre utilise pour les prts aux entreprises. (p. 578-579) Comme le suggre divers auteurs, l'augmentation du nombre de dcisions de crdit automatises par rapport aux dcisions humaines tend dmontrer une meilleure performance des modles statistiques en terme de pouvoir de prdiction du dfaut de paiement et de productivit. La diffusion et l'adoption de cette technologie aux divers secteurs d'autorisation du crdit sont des rponses l'efficacit dmontre de ces modles au cours des dernires dcennies. En rsum, pour le premier groupe d'articles, nous remarquons qu'il y a eu une adoption rapide de cette innovation financire dans le secteur bancaire au cours des cinquante dernires annes. Aujourd'hui, l'utilisation de modles prdictifs est rpandue dans plusieurs activits telles la gestion de portefeuille, la perception et la relation client. La comptitivit du march du crdit fait en sorte qu'il y a une pression constante sur les cots. Ces modles permettent d'augmenter la productivit et de diminuer les dlais de traitement. 9 Une meilleure valuation du risque a des rpercussions sur les quantits offertes et les prix. La prochaine section abordera plus spcifiquement ces aspects qui ont contribu modifier, au cours des dernires dcennies, les pratiques d'octroi et les mthodes d'valuation des risques de crdit des institutions financires. 1.3 Effets sur l'offre de crdit, le prix et le risque Pour dbuter la revue du deuxime groupe d'articles qui traite des rpercussions de cette technologie sur le march du crdit, Berger (2003) mentionne que: Des recherches sur les notations du crdit aux tats-Unis ont gnralement dmontr que les notations taient les meilleurs prdicteurs de la probabilit de paiement [... ] (e.g., Avery et al. 2000). (p. 152) Plus prcisment, Avery et al. (2000) mentionnent que leur recherche a permis de trouver que les notations bases sur les historiques de crdit sont des estimateurs trs robustes du dfaut de paiement et de la dlinquance. Les conclusions des articles de recherche consults abondent toutes dans la mme direction, les modles statistiques permettent de mieux estimer et prdire le risque de crdit que le jugement humain. Le dveloppement et l'utilisation de ces notations requirent cependant l'implication de diverses technologies. Berger (2003) a analys des progrs technologiques et leurs effets sur l'industrie bancaire. Il remarque qu'en plus d'tre un excellent estimateur du risque, les modles statistiques permettent d'augmenter la productivit des firmes. Dans son article, il cite trois innovations technologiques qui ont eu des rpercussions importantes sur les cots des institutions financires : les paiements lectroniques, les services bancaires par Internet et le partage de l'information. L'auteur soulve l'importance du partage de l'information sur les activits de crdit. Il souligne que: Une analyse travers diffrents pays a trouv que l'offre de crdit des banques tait plus leve et le niveau de dfaut tait plus faible dans les nations dans lesquelles les prteurs utilisaient et changeaient de l'information publique ou bien prive. (p. 151) L'information publique dont il est question provient des registres o sont rpertoris les poursuites et les jugements contre les individus. L'information prive quant elle peut 10 provenir de sources internes des institutions prteuses ou encore des agences de renseignement qui rpertorient l'historique de crdit des emprunteurs. Le constat de l'auteur est intuitif dans le contexte du problme du principal et de l'agent. En prsence d'asymtrie d'information, le prteur sera plus enclin prter lorsqu'il dtient plus d'information qui lui permette de mieux valuer le type d'emprunteur auquel il fait face. L'auteur souligne galement: L'utilisation de l'change d'information a aussi dmontr une amlioration de la disponibilit du crdit dans les nations moins dveloppes (e.g., Klapper and Krauss 2002). (p. 152) L'information financire permet d'amliorer la performance des modles statistiques et sert de signal afin de prdire les problmes futurs relis au crdit. Leonard (1996) prsente aussi les bienfaits des modles statistiques pour l'valuation du risque de crdit. L'auteur va plus loin par rapport l'importance d'utiliser et d'changer de l'information. Il soulve le point que les firmes prteuses auraient avantage partager de l'information technique sur les modles et les variables prdictives du risque qui sont utilises. D'ailleurs au Canada, une association a t mise en place afin de faciliter ces changes entre spcialistes. Selon l'auteur, l'industrie s'en portera mieux puisqu'il appert que les problmes et solutions relis aux modles d'valuation des risques sont partags de tous: Il va y avoir moins de pertes sur prt et de radiations puisque les institutions prteuses prteront de faon plus responsable. Finalement, comme avec les modles de dtection de la fraude, les conomies pourront tre passes aux consommateurs sous forme de taux d'intrt plus faibles ou d'un meilleur service la clientle. (p. 43-44) Cet nonc est tout de mme paradoxal. Il n'est pas certain que les institutions financires prteront de faon plus responsable dans un march concurrentiel. L'adoption de modles statistiques qui permettent d'valuer plus prcisment le risque permet d'adresser des segments d'emprunteurs marginaux qui n'taient pas desservis jusqu' prsent, et o le risque et les cots de service sont plus levs. L'apparition de produits financiers drivs telle la titrisation des portefeuilles de dtail, qui permet de transfrer le risque des tiers, peut aussi favoriser des pratiques plus risques. Il Des recherches rcentes ont contribu valuer les effets de l'utilisation de ces nouvelles pratiques d'estimation des risques comparativement aux anciennes. Ces tudes ont t faites dans le secteur des prts aux petites entreprises o le risque du propritaire est prdictif de celui de l'entreprise. Berger (2003) comme galement Akhavein, Frame et White (2005) ont analys le risque de dfaut des petites entreprises. Ces auteurs arrivent aux mmes conclusions, soit que le risque du propritaire est prdictif de celui de la firme dans ce segment et que l'estimation du risque pour les prts aux petites entreprises est similaire aux approches d'estimation du risque de crdit la consommation. Dans cet ordre d'ides, Berger, Frame et Miller (2002) ont analys les effets de l'adoption des notations des risques sur la disponibilit, le prix et le risque des prts aux petites entreprises. Ils se penchent sur l'introduction des notations pour l'attribution des prts dans ce secteur la fin des annes quatre-vingt-dix aux tats-Unis. Ils remarquent que l'adoption des notations a eu des effets mixtes diffrents selon le type de la firme et le profil de l'emprunteur. Dans leur recherche, les auteurs sparent les emprunteurs en deux groupes, les marginaux (risqus) et les non marginaux (non risqus) afin d'valuer sparment l'effet de l'utilisation des notations. Pour les non risqus, ils soulvent le fait que l'adoption des nouvelles mthodes d'valuation peut avoir trois effets diffrents sur les cots et le prix. Le premier effet est reli au traitement des demandes de crdit. Si la productivit augmente et les cots diminuent, les rductions peuvent tre transfres aux emprunteurs sous forme de taux d'intrt plus faibles. Cet effet dpend cependant du type de la firme. Si la technologie vient remplacer la prcdente, les cots diminuent pour la banque alors que si elle est utilise en complment, les cots augmentent. Le deuxime effet est reli une rduction des problmes de slection adverse et d'ala moral. Une meilleure valuation du risque permet d'liminer les pires emprunteurs et de diminuer les chances qu'un comportement plus risqu se dveloppe une fois le prt octroy. La diminution de cots dcoulant de cet effet peut galement tre transfre aux emprunteurs sous forme de taux d'intrt plus faibles. 12 Finalement, l'ajout d'information additionnelle dans le processus dcisionnel permet de mieux qualifier l'emprunteur. Ainsi, des emprunteurs pourraient se voir attribuer une meilleure ou une pire notation qui reprsenterait une qualit de risque suprieure ou infrieure la prcdente. Dans le premier cas, le prix diminuerait pour l'emprunteur puisqu'il est considr conune un risque de meilleure qualit alors que dans le second, le prix augmenterait puisqu'il serait jug plus risqu. L'effet net escompt par les auteurs pour le groupe des non marginaux est une amlioration de la qualit du risque et une rduction du prix. Il n'y a pas ncessairement d'augmentation de l'offre puisque cette clientle est dj desservie. Pour ce qui est du groupe des marginaux, une diminution des cots de traitement peut faire en sorte que des prts qui taient jugs non rentables par le pass le deviennent maintenant. galement, un meilleur modle d'valuation du risque qui prend en considration plus d'information fait en sorte que des clientles qui taient refuses par le pass pourraient maintenant tre acceptes puisque des informations diffrentes sont prises en compte. Une valuation plus prcise du risque fait en sorte que les emprunteurs plus risqus se verront attribuer un prix plus lev considrant les cots de traitement, de suivi et le risque plus levs qu'ils reprsentent. L'effet net fait en sorte qu'il y aura une augmentation de l'offre, du prix et du risque pour ce groupe d'emprunteurs. Berger (2003) mentionne que la croissance de l'offre et du risque provient principalement des banques qui ont adopt les notations de crdit conune mthode d'valuation alors que celles, o son utilisation est utilise en complment, ont plutt vu une augmentation des cots et une amlioration de l'valuation du risque. Il mentionne aussi que ce sont les grandes banques qui sont les plus propices adopter cette nouvelle technologie afin de faire des gains en productivit. C'est d'ailleurs consquent avec Schumpeter (1950) qui soulve que ce sont les grandes firmes qui voluent sur des marchs concentrs qui sont les premires adopter des nouvelles technologies qui leur feront bnficier d'conomies d'chelle. Akhavein, Frame et White (2005) ainsi que Bofondi et Lotti (2006) mentionnent galement ce fait et trouvent des rsultats similaires dans leurs recherches. 13 Dans leur article version rvise, Berger, Frame et Miller (2005) concluent que suite l'adoption des notations des risques dans le march des prts aux petites entreprises aux tats-Unis, l'offre comme aussi le prix et le risque moyens ont augment en raison de l'accroissement du crdit des emprunteurs plus risqus: Ces rsultats sont consistants avec les hypothses que l'utilisation des systmes de notation pour les petites entreprises augmente la disponibilit du crdit, premirement pour des emprunteurs relativement plus risqus qui paient relativement des prix plus levs pour le crdit. (p. 220) Dans leurs travaux, les auteurs n'abordent pas la question des conditions de march et leur relation avec l'valuation du risque. Ils terminent cependant en mentiolU1ant des effets adverses qui peuvent dcouler de problmes de spcification ou de variables omises dans les modles. Ils soulignent, par exemple, que l'utilisation d'un modle en priode de rcession alors qu'il a t dvelopp avec des dOlU1es provenant d'une priode d'expansion peut crer des erreurs systmatiques. Ils notent aussi que ce type de problmatique fait dj l'objet de proccupations pour les modles utiliss dans les secteurs des cartes de crdit et des prts la consommation o les notations sont utilises depuis longtemps. Plus rcemment, ces problmes ont aussi t soulevs pour le secteur des hypothques. Il est donc de l'intrt des modlisateurs de valider et faire voluer les modles en permanence. Le but consiste s'assurer que les modles continuent bien prdire le risque mais aussi vrifier si l'introduction de variables omises ne pourrait pas amliorer la performance. Le deuxime groupe d'articles a survol l'effet de l'utilisation des systmes de notation des risques dans l'industrie bancaire. Des recherches de divers auteurs ont dmontr que l'change d'information et l'utilisation de modles statistiques ont permis de faire des gains en productivit et d'valuer le risque plus prcisment. Cette ilU1ovation a finalement permis d'augmenter l'offre de crdit et de desservir des clientles marginales. Les bnfices tangibles des modles de risque ont contribu l'expansion rapide de cette ilU1ovation aux diffrents segments du crdit (crdit la consommation, hypothques et plus rcemment, prts aux petites entreprises). En bout de ligne, le prix et le risque ont augment puisque ces nouvelles clientles marginales sont plus chres desservir et elles reprsentent un risque de dfaut plus lev. 14 lA Cadre rglementaire Thomas (2000) nous rvle comment la rglementation a favoris la diffusion des notations aux tats-Unis: L'vnement qui a assur une acceptation complte des notations des risques de crdit est l'adoption de la loi Equal Credit Opportunity Act aux tats-Unis en 1975 et 1976. (p. 151) Dans le mme ordre d'ides, Straka (2000) mentionne pour le march des hypothques: La ratification du gouvernement sur l'utilisation des notations de crdit, importante pour plusieurs banques, est arrive lorsque le Federal Reserve Board a publi ses propres recherches sur la validit statistique de la capacit des notations de crdit prdire les dfauts de paiement sur les prts hypothcaires (Avery et al. 1996). (p. 215-216) L'utilisation des notations est devenue une pratique courante dans les activits d'octroi de crdit et sa reconnaissance un niveau gouvernemental a contribu sa diffusion et son acceptation, mais galement transformer littralement le march du crdit de masse au cours du dernier demi-sicle. L'acceptation complte des notations des risques de crdit a t assure par l'adoption d'une norme d'valuation un niveau international. Suite des crises bancaires majeures dans divers pays, un comit de travail a t mandat pour se pencher sur les solutions possibles pour solidifier la stabilit du systme bancaire international. Le Comit de Ble sur le contrle bancaire (CBCB) a t institu la fin de 1974. Il rassemble les hauts reprsentants des autorits de contrle bancaire et des banques centrales de divers pays (Belgique, Canada, France, Allemagne, Italie, Japon, Luxembourg, Pays-bas, Espagne, Sude, Suisse, Grande-Bretagne et tats-Unis). Sans bnficier de pouvoir supranational, les standards que le comit propose ont t majoritairement adopts par les pouvoirs gouvernementaux des pays membres travers les processus dmocratiques en place. En 1988, le CBCB a introduit un ensemble de mesures qui encadrent la gestion du risque et le calcul des fonds propres minimaux requis pour viter des dsquilibres concurrentiels entre banques internationales. Plus prcisment, cette rglementation obligeait dornavant les banques dtenir des fonds propres d'un niveau quivalant 8 % au moins du total de leurs actifs pondrs en fonction des risques (CBCB, 2007). Le Comit a mis en place des 15 dispositifs pour encadrer la gestion des nsques l'aide de pratiques de supervision prudentielle et de normes de discipline de march. Comme le soulvent Thoroval et Duchateau (2003), cet accord visait prvenir les faillites des banques par des normes de fonds propres et limiter les crises sectorielles ou macroconomiques et ainsi amliorer la stabilit financire. L'incapacit des dbiteurs d'honorer les contrats de prts est une source de problmes pour les institutions prteuses puisque les prts improductifs ont des rpercussions sur le risque, le prix, l'offre et la stabilit du systme financier. L'valuation des risques des portefeuilles de prts est primordiale. Le CBCB a mis en 2004 une version rvise de son rglement. Il tait maintenant permis aux banques, sous certaines conditions, d'utiliser les systmes de notation internes des risques comme principaux intrants pour valuer le risque de crdit lors du calcul des fonds propres requis (CBCB, 2004). Les principaux intrants dont il est question sont la probabilit de dfaut, la perte en cas de dfaut et l'exposition en cas de dfaut (CBCB, 2005). Dans la prsente recherche, nous nous intressons uniquement au premier intrant qui est le calcul de la probabilit de dfaut. Comme nous avons pu le constater jusqu' prsent, l'utilisation des systmes de notation est dj largement rpandue dans les activits d'octroi de crdit. Avec cette rglementation, les mmes notations des risques peuvent dsormais servir d'intrants pour le calcul des capitaux rglementaires. L'amendement mis de l'avant par le CBCB vise de ce fait mettre en place des standards internationaux pour le calcul du capital conomique requis et assurer une saine gestion des risques de crdit. Avec l'adoption de cette norme, il ne fait plus aucun doute que les notations des risques de crdit ont t adoptes et intgres dans les pratiques d'valuation des risques de crdit. Lors de l'amendement de 2004, le CBCB a mis la recommandation suivante pour l'utilisation des notations internes dans le calcul de la probabilit de dfaut: La notation doit reprsenter l'valuation par la banque de l'aptitude et de la volont d'un emprunteur d'honorer son contrat, mme dans des conditions conomiques dfavorables ou en cas d'vnements imprvus. [... ] La gamme des situations conomiques envisageables doit 16 intgrer la situation du moment et celles qui peuvent se produire pendant la dure d'un cycle conomique pour le secteur conomique ou la rgion gographique en question. (p. 75) Les notations internes doivent donc non seulement prendre en considration le risque reli l'emprunteur et au prt, mais aussi valuer le risque que reprsente le contexte conomique avec son incidence sur la probabilit de dfaut du dbiteur. Nous remarquons que le cadre d'utilisation des systmes de notation des risques a volu au fil du temps. Les notations, qui taient initialement utilises pour augmenter la productivit et mieux valuer la qualit du risque des emprunteurs lors de la demande de prt, peuvent aussi tre utilises afin d'estimer le risque des portefeuilles de prts de dtail et valuer les effets des conditions conomiques contemporaines et futures sur la probabilit de dfaut. 1.5 Critiques l'utilisation des notations pour l'attribution de prts Les avantages de l'utilisation des notations des risques de crdit sont reconnus aujourd'hui. Tout de mme, diverses critiques ont t souleves quant leur utilisation dans les activits d'octroi de crdit. La premire concerne l'utilisation de caractristiques qui pOUlTaient s'avrer discriminatoires pour certains individus comme le souligne Capon (1982). En 1976, le Equal Credit Opportunity Act a t amend aux tats-Unis afin de proscrire l'utilisation dans les systmes des notation des risques de caractristiques comme la race, le sexe, le statut matrimonial, l'ethnie, l'ge, la religion et le fait de recevoir des prestation de programmes sociaux. Dans son article de recherche, Capon (1982) dcrit un ensemble d'exemples qui peuvent mener des pratiques discriminatoires et rendre l'accs au crdit plus difficile pour certains segments de la population. Par exemple, les donnes qui ont servi modliser proviennent des demandeurs de prts pour lesquels un historique de crdit existe, l'estimation du risque pour des individus qui n'ont pas d'historique de crdit et qui ne rpondent pas aux caractristiques de la population de dveloppement est donc biaise et peut crer un problme d'anti-slection pour cette clientle. 17 Avery et al. (2000) font des mises en garde lors du dveloppement de modles statistiques. Ils abordent particulirement le biais possible dans l'valuation des risques qui est d l'omission des conditions conomiques spcifiques l'emprunteur. Les auteurs soulignent dans leur travail de recherche qu'il existe des problmes statistiques dans la mthode actuellement utilise pour le dveloppement des modles de notation et spcialement pour les notations qui proviennent des agences de renseignement : En effet, le succs gnral du pouvoir prdictif prsent dans les tudes antrieures n'exclut pas l'existence de problmes statistiques lors du dveloppement et de l'implantation des modles de notation des risques de crdit qui pourraient mener une valuation incorrecte du risque d'un individu. (p. 525) Les problmes que soulvent Avery et al. (2000) peuvent entraner des erreurs systmatiques dans l'estimation du risque. Ils identifient trois types de problmes potentiels. Le premier concerne l'omission de variables explicatives qui fait que la fonction d'estimation du risque ne reprsente pas la fonction relle et peut donc introduire un biais dans l'estimation. Le deuxime problme entoure l'utilisation des donnes de 1'historique de crdit des individus. Si cet historique est incomplet ou contient des erreurs, un biais est transport dans l'estimation du modle. Finalement, le troisime type de problmes dcoule des populations de dveloppement par opposition aux populations pour lesquelles le modle est utilis. Si un segment de march a t sous reprsent lors du dveloppement du modle, dans la pratique, la notation pourrait ne pas reprsenter le risque rel de ces individus. Comme le soulignent les auteurs, ces problmes statistiques peuvent avoir des incidences tant conomiques que rglementaires. Une valuation incorrecte du risque des demandeurs de crdit peut avoir des effets sur l'offre de crdit, le risque et le prix. Une survaluation du risque peut restreindre l'offre de crdit puisque les emprunteurs sont jugs plus risqus qu'ils ne le sont en ralit. Cette surestimation peut aussi engendrer un prix plus lev puisque les emprunteurs sont valus comme tant plus risqus. Dans le cas contraire, une sous valuation ferait en sorte que les prts seraient plus risqus qu'ils ne le sont en ralit et un prix moins lev pourrait tre demand. Comme le font remarquer les auteurs, cet tat de fait peut avoir des consquences rglementaires: D'un point de vue rglementaire, les effets cumuls de ces biais potentiels peuvent soulever des questions sur l'adquation des 18 provisions pour pertes et du capital conomique. (p. 528) Les auteurs soulvent galement une proccupation par rapport aux pratiques quitables en octroi de crdit: Par exemple, la conformit avec les lois sur les pratiques quitables en matire d'octroi de crdit peut tre affecte par ces biais si les groupes protgs sont disproportionnellement affects par les erreurs statistiques ou d'omission. (p. 528) Tout comme Capon (1982), Avery et al. (2000) mentionnent la possibilit que certains segments de la population aient un accs plus difficile au march du crdit. Cependant, ils n'abordent pas la question sous une forme de discrimination par l'utilisation de certaines variables mais plutt par le problme de biais que peut reprsenter un modle mal dfini. Cette question nous intresse particulirement dans le cadre de la recherche actuelle o il sera tent d'intgrer des donnes de march dans un modle. Cette approche permettra d'valuer l'effet possible des conditions conomiques tant sur la probabilit de dfaut que sur le pouvoir de diffrenciation d'un modle. Nous remarquons que les notations des risques de crdit ont t reconnues au ruveau gouvernemental et que cette reconnaissance a favoris sa diffusion dans l'industrie du crdit. Nous remarquons galement que le CBCB a aussi contribu l'adoption des notations des risques de crdit par l'laboration d'une norme internationale. Nous remarquons finalement que l'utilisation des notations a volu au fil des dcennies. Originalement, elles taient principalement utilises pour octroyer du crdit, elles ont ensuite t utilises pour raliser le suivi et valuer le comportement des prts. Aujourd'hui, ces modles servent de base au calcul du capital conomique en fonction du niveau de risque pour les prts de dtail. 1.6 Modlisation des risques de crdit pour un portefeuille de dtail Plusieurs mthodes sont utilises pour modliser les risques de crdit, Hayden et Porath (2006) rpertorient l'ensemble des mthodes utilises pour valuer les risques de crdit pour un portefeuille de dtail. Ils classifient les diffrentes approches d'estimation du risque en deux groupes, soit les modles paramtriques et les non paramtriques. Pour le premier groupe, ils identifient six approches mthodologiques qui sont l'analyse discriminante, la 19 rgression linaire, les modles logit, probit, de panel et d'ala. Pour le deuxime groupe, ils identifient deux mthodes qui consistent aux rseaux de neurones et aux arbres de dcisions. Dans le cadre de la prsente recherche, nous nous intressons uniquement au premier groupe de mthodes puisqu'un modle paramtrique sera utilis pour estimer la probabilit de dfaut. Plus particulirement, nous tudierons les quatre principales approches de modlisation que l'on retrouve maintes reprises dans la littrature et qui sont les plus utilises dans la pratique, soit l'analyse discriminante, la rgression linaire, les modles logit et probit. Les modles d'ala, dont le plus COIUlU selon Hayden et Porath (2006), le Cox proportional hazard model , ne seront pas couverts puisqu'ils sont semi-paramtriques. Les modles de panel ne seront pas couverts non plus puisqu'ils font appel l'analyse de donnes croise. D'ailleurs, ce type de dOIUles cre des problmes sur le plan technique tels que l'htroscdasticit et l'autocorrlation des termes d'erreurs. Hand et Henley (1997) ont aussi rpertori les mthodes que dcrivent Hayden et Porath (2006). Ils listent dans leurs travaux les diffrentes approches utilises pour modliser les risques de crdit et exposent les forces et faiblesses de chacune d'elles. Ils nous rvlent entre autres dans leur article que des tudes ralises par le pass ont dmontr que peu importe la mthode utilise, le niveau d'exactitude pour classifier le risque de crdit est similaire et que les modles non paramtriques sont beaucoup plus difficiles dvelopper et requirent des algorithmes complexes en comparaison aux modles paramtriques. Les auteurs nous informent qu'en gnral, l'amlioration de la performance d'un modle ne dpend pas tant de l'approche utilise mais bien de l'ajout de nouvelles variables qui s'avrent prdictives du risque de dfaut. Dans le mme ordre d'ides, Altman et Saunders (1998) soulvent qu'il existe au moins quatre approches mthodologiques pour dvelopper des systmes de notation des risque de crdit, soit l'analyse discriminante, la rgression linaire, le logit et le probit. Ils soulignent que de loin, la mthode la plus utilise est l'analyse discriminante suivie de la rgression logistique. 20 Allen, Delong et Saunders (2004) abondent dans la mme direction et notent que l'utilisation des notations des risques de crdit est largement rpandue tant pour le crdit la consommation que pour les prts aux petites entreprises : La mthodologie traditiormelle d'estimation des risques de crdit la plus gnralement utilise est l'analyse discriminante multivarie dont Altman (1968) en a t le piormier. (p. 736) Les auteurs soulvent que: Il y a quatre formes mthodologiques pour les modles de notation des risques de crdit multivaries: (1) le modle de probabilit linaire, (2) le modle logit, (3) le modle probit, et (4) le modle d'analyse discriminante multiple. (p. 736) Comme soulign plus tt, nous nous arrterons dans la prsente recherche dcrire ces quatre approches paramtriques. Hayden et Porath (2006) expliquent que pour valuer le niveau de risque du crdit de dtail l'aide de l'analyse discriminante, il faut procder en deux tapes. La premire consiste calculer un score pour chacun des emprunteurs et la deuxime, consiste calculer les chances (de l'anglais odds ) d'tre en dfaut selon le niveau de score. Ces odds reprsentent la probabilit de dfaut. Une prmisse de base doit cependant tre faite lors de l'utilisation de cette teclmique. Il est considr que les caractristiques suivent une distribution multivarie normale pour les individus d'un mme groupe de risque. Dans la ralit, ce ne serait pas le cas et ce constat est la plincipale critique souleve pour cette mthode. Hand et Henley (1997) abordent d'ailleurs ce problme et concluent qu'il n'y aurait cependant pas de rpercussion sur l'exactitude de la classification des individus en terme de risque et que son utilisation est de ce fait largement rpandue dans la pratique. Une deuxime approche utilise pour l'valuation du risque de crdit est la rgression linaire. Ce modle est estim par moindres carres ordinaires. Selon Hayden et Porath (2006), cette teclmique est intressante puisqu'elle a l'avantage d'tre facile utiliser et comprendre. Elle comporte cependant deux problmes majeurs. Le premier concerne la variable explique qui est calcule. Comme la variable dpendante recherche est une probabilit, sa valeur doit tre comprise entre 0 et 1. Lorsque la rgression linaire est utilise, les valeurs calcules pourraient tre infrieures 0 ou suprieures 1. Les rsultats 21 ne peuvent donc pas tre interprts en terme de probabilit de dfaut. Le deuxime problme de cette approche concerne la prsence d'htroscdasticit qui peut se prsenter lors de l'analyse de dOill1es transversales. Nous pouvons penser que la variance des termes d'erreur Uj n'est pas constante pour tout i. Les auteurs concluent pour cette mthode: Conune consquence, l'estimation de fJ est inefficace et de plus, les carts types des coefficients b estims sont biaiss. (p.3) Les auteurs soulvent qu'une faon de contourner l'obstacle d'htroscdasticit des termes d'erreur serait d'estimer le modle par moindres carres pondres. L'estimation de fJ serait efficace mais les carts types des b demeureraient biaiss en raison du fait que les termes d'erreur ne sont pas normalement distribus. Dans le mme ordre d'ides, Dielman (1989) soulve le problme d'htroscdasticit lors de l'analyse de dOill1es transversales mais aussi celui d'autocorrlation des termes d'erreurs lorsque des sries chronologiques sont utilises. L'auteur souligne que l'utilisation simultane de ces types de dOill1es sous forme de panel, cre un problme additioill1el spcifique l'tude de dOill1es croises. Il rvle que des chocs transversaux peuvent avoir des effets parallles sur des individus diffrents d'une mme priode et les termes d'erreurs sont donc corrls. Hayden et Porath (2006) soulvent aussi ce point, ils soulignent que la prsomption d'indpendance des observations pour des dOill1es transversales ne tient plus. Ils font tout de mme remarquer que plusieurs dveloppeurs ignorent cette dynamique particulire et procdent sans appliquer de correction. Finalement, Hayden et Porath (2006) dOill1ent une description des deux dernires mthodes d'estimation qui sont analyses dans le cadre de cette revue littraire. Ces mthodes consistent aux modles logit et probit. Ces mthodes d'estimation s'avrent tout fait appropries pour l'analyse de variables discrtes et l'estimation de probabilits. La principale diffrence entre ces deux modles se situe au niveau de leur fonction de densit. Alors que le modle probit est reprsent par une fonction de densit normale, le modle logit est quant lui reprsent par une fonction de densit logistique. La diffrence rside dans les queues des distributions, celles du probit tant plus paisses. Ces deux approches dOill1ent des rsultats similaires et les diffrences entre les rsultats sont ngligeables. Toujours selon Hayden et Porath (2006), l'estimation du modle par un maximum de vraisemblance est thoriquement 22 convaincante et facile manipuler. Le modle logit est plus simple estimer que le modle probit qui demande des algorithmes plus complexes. La signification des paramtres du logit est facile comprendre: un changement dans la valeur d'une variable indpendante rsulte en un changement dans le logarithme des odds et de la probabilit de dfaut de l'individu. En plus de gnrer un rsultat en terme de probabilit, il est possible de tester le degr de significativit du modle et des coefficients. Les auteurs soulignent finalement que cette forme fonctionnelle est parfaitement adapte pour faire du stressed testing . La mthode de rgression logistique sera privilgie lors des travaux de dveloppement et d'estimation du modle empirique qui seront prsents dans le chapitre II. 1.7 Utilisation de variables macroconomiques Il est intuitif de penser que les conditions conomiques ont une incidence sur la probabilit de dfaut des emprunteurs. Plusieurs auteurs cits jusqu' prsent ont soulev cette hypothse sans ncessairement en dmontrer l'effet par des analyses empiriques. Avery et al. (2000) se sont penchs sur la question du potentiel biais prsent dans les modles actuels qui dcoule, entre autres, de l'omission de variables reprsentant les conditions conomiques. Les auteurs soulvent qu' leur connaissance, ils seraient les premiers examiner ces enjeux statistiques. Pour leur analyse ralise aux tats-Unis, ils ont utilis un ensemble de donnes conomiques et dmographiques rgionalises qu'ils ont combin par le code postal au score de risque d'individus d'un chantillon reprsentatif d'une agence de renseignement. Dans leur tude, ils soulvent l'interrogation suivante: La stabilit du classement travers les rgions et la robustesse des prdictions des modles aux changements dans les conditions conomiques locales n'ont pas t typiquement explores et il n'est pas clair que les modles performent uniformment bien pour tous les sous-groupes de la population. (p. 525) Ils soulvent que l'omission de variables non relies l'historique de crdit de l'emprunteur, mais qui le sont aux conditions conomiques individuelles ou locales, peut ainsi crer un problme de classement erron du risque. Ils citent l'exemple suivant: Par exemple, en n'incluant pas des circonstances conomiques individuelles, les modles traitent 23 implicitement un individu qui perfonne pauvrement quand il est sans emploi de la mme faon que quelqu'un qui perfonne de la mme manire lorsqu'il en occupe un. (p. 526) Ils ajoutent que de la mme faon, en ne considrant pas les facteurs conomiques rgionaux, les modles vont attribuer les mmes niveaux de risque pour les individus qui ont une mauvaise perfonnance en temps de rcession qu'en temps de meilleures conditions conomiques. Cette omission fait en sorte qu'une valuation unifonne du risque peut mener une projection future errone puisqu'elle ne tient pas compte des probabilits de dfaut sous jacentes qui sont diffrentes. Les rpercussions de cette valuation biaise se notent tel que dcrit prcdenunent sur le risque global, l'offre et le prix du crdit conune galement sur le niveau de capital conomique requis pour assurer une stabilit financire. Dans cette tude, les auteurs utilisent les variables conomiques et dmographiques par rgion qui sont le taux d'inoccupation des logements, la croissance dmographique, le taux de chmage, le revenu mdian, le prix mdian des maisons, le taux de propritaire-occupant, le taux de pauvret, le taux de minorit visible et le taux de scolarisation. galement, ils ajoutent une srie de variables individuelles qui sont l'ge, le revenu et le niveau d'ducation. En plus du score de risque, l'agence de renseignement leur a fourni des indicateurs qui dtenninent si l'individu fait partie d'un mnage et s'il dtient une hypothque. De plus, les auteurs crent une variable qui pennet de dtenniner si l'individu habite dans une zone urbaine ou rurale. Ils sont ainsi en mesure de crer une nouvelle variable qui identifie le revenu mdian relatif de la zone urbaine par rapport la zone rurale pour chacune des rgions. Les conclusions de l'tude mettent en lumire que les variables omises crent un problme potentiel. Ils remarquent que tout en contrlant les autres facteurs, les scores de risque moyens varient en fonction des conditions conomiques locales et qu'ils sont statistiquement infrieurs dans les rgions avec un taux de chmage lev par rapport aux rgions o le taux est faible. Ils remarquent aussi que la dynamique du taux de chmage joue un rle mais pas celui qui est attendu. Les rgions qui ont un taux de chmage faible persistant ou qui ont vu le taux de chmage pass d'un niveau faible un niveau lev ont un score de risque mdian 24 plus faible que les rgions o le taux de chmage est lev de faon persistante. Cet effet serait d au fait que les prteurs ont des standards plus stricts (prtent moins) dans les rgions o le chmage est lev, ce qui minimiserait les effets d'un taux de chmage lev sur la dlinquance des emprunteurs (moins de dlinquance). D'autres variables utilises ont dmontr tre statistiquement significatives. Les scores de risque moyens se sont avrs tre infrieurs dans les rgions o il y a un taux lev d'inoccupation des logements, de pauvret et de minorit visible comme galement o le revenu mdian, la valeur des maisons et le niveau d'ducation taient plus faibles que la moyenne nationale. Les auteurs concluent partir de leur recherche que les variables omises qui reprsentent les conditions conomiques locales et rgionales sont des sources de biais dans les modles de notation des risques de crdit. Une des solutions qu'ils proposent pour solutionner ce problme consiste stratifier les modles en fonction des considrations conomiques. Jusqu' prsent, ces informations n'ont pas t utilises dans les modles. Les auteurs soulignent que: Une des raisons pour ceci est que les mthodes appropries pour incorporer de l'information macroconomique et rgionale dans les modles de notation des risques de crdit n'ont pas t tablies. Ceci est un secteur potentiel de recherche future. (p. 544) Ils ajoutent un autre commentaire intressant: Notre vidence suggre que l'utilisation des notations des risques de crdit, en l'absence d'ajustements bass sur des informations conomiques et rgionales, peut rsulter en des dcisions de dtermination de prix errones. (p. 545) Avery et al. (2000) ont prsent dans leur article les enjeux statistiques qui entourent l'utilisation des scores de risque des agences de renseignement aux tats-Unis. Ils soulignent la prsence d'un biais due l'omission de variables et au problme de couverture et de reprsentation dans l'chantillon de dveloppement. Ils concluent que ces facteurs ont une influence sur l'valuation du risque d'un individu qui peut tre sur ou sous estim. Dans notre tude, nous tenterons d'introduire des variables macroconomiques dans un modle de risque afin de vrifier si nous sommes en mesure d'amliorer la prdiction de l'vnement de dfaut par rapport au modle de base. Notre objectif de travail ne consiste pas vrifier la prsence ou non d'un biais mais bien vrifier si la performance du modle peut tre amliore. 25 Avery et al. (2004) tudient les effets potentiels de ne pas inclure ce qu'ils appellent des donnes circonstancielles dans les modles de risque de crdit. Ils examinent galement les difficults entourant l'ajout de ce type d'information dans les modles. Ils soulvent que l'omission de ces donnes peut causer une valuation errone du risque de crdit et avoir des incidences tant sur la stabilit financire que les politiques rglementaires. Ils citent en exemple le cas de deux individus. Le premier subit un problme de sant temporaire qui l'empche de rencontrer ses obligations. Le deuxime a perdu son emploi momentanment en raison d'une dtrioration de l'conomie. Dans les deux cas, le risque de dfaut est trait de la mme faon qu'un individu qui n'a pas fait face ce type de problmes et qui est en dfaut de paiement. La projection future, tant base principalement sur la performance passe, est donc biaise par l'omission de ce type d'information. Par ailleurs, les auteurs soulvent le fait que de ne pas inclure des variables qui captent des circonstances personnelles (autres que l'historique de crdit) ni des variables conomiques locales ou rgionales, peut avoir deux consquences conomiques primaires. La premire concerne un classement du risque erron, et par le fait mme une tarification inapproprie, tandis que la deuxime, concerne une inefficacit en terme d'octroi de crdit, qui peut rsulter en des pertes plus leves et une profitabilit plus faible. Ils nous font aussi remarquer qu'il existe des obstacles majeurs pour l'utilisation des informations circonstancielles. En ce qui a trait aux circonstances personnelles de l'individu, il est difficile de rpertorier ces vnements en raison de la complexit que cela peut reprsenter mais aussi pour des questions d'ordre thique. Avec les lois de protection des informations personnelles, il n'est pas vident que ces informations pourraient tre utilises dans les modles. galement, sous un point de vue technique, il serait difficile de lier la date d'occurrence de ces vnements celle du dfaut de paiement et d'intgrer correctement dans les modles cette notion de cause effet. En ce qui a trait aux domes conomiques locales ou rgionales, les auteurs soulvent: Bien que l'information gnrale sur les conditions conomiques locales telles que le taux de chmage soient disponibles, il peut tre difficile de dterminer l'endroit de rsidence de l'individu lorsque les problmes de dfaut se sont prsents. Obtenir plus 26 d'infonnation spcifique sur les circonstances conomiques affectant l'individu telle que les mises pied dans une industrie particulire o il est employ reprsente un dfi encore plus important. (p. 6) Dans cette tude, Avery et al. (2004) labore tout de mme un modle empirique afin de tester les effets de certaines variables circonstancielles sur les notations des risques de crdit d'une agence de renseignement aux tats-Unis. Ils crent un chantillon de nouveaux comptes de crdit pour chacun desquels ils assignent la perfonnance mauvaise si le compte a t 60 jours dlinquants ou pire, sinon il est jug bon . Les auteurs testent deux modles. Le premier consiste tester l'effet du taux de chmage du lieu de rsidence et celui du statut matrimonial de l'individu (les mnages sont plus solides financirement que les clibataires ou les rcents divorcs). Le deuxime modle quant lui consiste vrifier si la squence des vnements de dfaut passs ne suit pas un schma particulier qui pennet de dtecter des dfauts circonstanciels qui sont dus des dclencheurs spciftques. Plus prcisment, ce modle consiste vrifier si les dfauts de paiement arrivent tous au mme moment ou s'ils sont plutt disperss dans le temps. Dans le premier cas, les auteurs supposent que c'est d un vnement particulier alors que dans le deuxime, ils s'attendent plutt au schma d'un emprunteur qui a des problmes rcurrents. Les rsultats de leur tude dmontrent que les conditions conomiques tout conune les conditions particulires de l'emprunteur influencent la probabilit de dfaut. Ils concluent que l'omission de ces variables dans les modles actuels cause un problme de spcification et engendre des extemalits telles que des pertes additionnelles, des prix plus levs et une offre de crdit plus faible. 1.8 Conclusion Nous avons vu tout au long de la revue littraire conunent les modles statistiques et les systmes de notation des risques de crdit se sont dvelopps au cours du dernier demi-sicle. L'origine de ces modles remonte aux annes quarante avec l'apparition des analyses discriminantes. L'efficacit de ces modles a t dmontre par des gains en productivit et une amlioration de la qualit des dcisions de crdit. La reconnaissance de leur utilisation au 27 niveau gouvernemental a galement favoris leur dveloppement. Leur intgration dans les pratiques de l'industrie du crdit a eu des rpercussions sur l'offre, le prix et le risque du crdit. Ces modles prdictifs ont eu comme utilisation originale les activits d'autorisation de prts, ils ont t par la suite utiliss pour suivre le comportement des emprunteurs et valuer le risque des portefeuilles. Le CBCB avec l'adoption d'une nonne internationale a t le dernier dclencheur de l'acceptation complte de ces modles. Aujourd'hui, la recherche s'oriente du ct des conditions conomiques afin d'en valuer les rpercussions sur la probabilit de dfaut des emprunteurs. CHAPITRE II MODLE DE DFAUT 2.1 Introduction Un modle de dfaut sur des emprunteurs sera estim afin d'valuer si les conditions conomiques ont un effet sur la probabilit de dfaut. Le modle sera estim partir de donnes d'un portefeuille de crdit la consommation d'une institution financire. Le cadre d'analyse consiste valuer un modle qui inclut des caractristiques d'emprunteurs et des variables macroconomiques, et comparer sa performance un modle qui contient seulement des caractristiques d'emprunteurs. Des statistiques seront calcules et compares afin de dterminer si les variables macroconomiques augmentent la performance du modle. 2.2 Hypothse de travail Le modle a la forme gnrale Y =a + pX + OZ . Le vecteur Yreprsente la performance de l'emprunteur, la matrice X reprsente ses caractristiques et la matrice Z correspond aux variables macroconomiques. Les vecteurs a ,p ,et li sont les paramtres estimer. Il sera valu si ce modle est en mesure de mieux classifier le risque qu'un modle de rfrence qui a la forme Y = ex + pX et de mieux prdire l'vnement. Par mieux classifier, nous faisons rfrence un modle o la sparation entre la distribution des emprunteurs qui font dfaut par rapport ceux qui ne le font pas est la plus grande. En ce qui a trait la capacit des modles bien prdire l'vnement de dfaut, elle sera compare pour dterminer lequel performe le mieux. L'hypothse nulle correspond Ho: 8 =0, o 8 est le vecteur des coefficients des variables macroconomiques. Si 8 =0 est rejete, les variables macroconomiques apportent un pouvoir additionnel de diffrenciation et les coefficients sont statistiquement significatifs. Deux types de donnes 29 seront utiliss pour estimer le modle de risque. Des micro-donnes seront utilises pour les caractristiques individuelles X des emprunteurs. Des sries macroconomiques seront utilises pour reprsenter les informations de type agrg Z. Nous pourrons vrifier si la probabilit de dfaut varie en fonction des conditions conomiques. La probabilit de dfaut d'un emprunteur est caractrise par une valuation de sa capacit et volont de rembourser ses dettes. La matrice X peut donc inclure une multitude de caractristiques qui valuent ce risque. Dans le cadre de la prsente recherche, cette valuation se fait partir de caractristiques connues et disponibles au moment de la demande de prt. Ces variables ont servi l'analyse du crdit et permettront d'une part, d'valuer le risque de l'emprunteur (ge, revenus, occupation, etc.) et d'autre part, le risque de la transaction (type de prt, terme, provenance, historique de paiement, etc.). Le segment tudi consiste celui des nouveaux prts ouverts au point d'observation. Le modle n'utilisera pas de donnes comportementales sur la performance courante du prt ni de donnes conomiques devances puisque le but consiste valuer le pouvoir de diffrenciation et de prdiction au moment de l'autorisation. Le modle se base uniquement sur des faits connus au moment o la dcision d'octroyer le crdit a t prise. Traditionnellement, les systmes de notation des risques utilisent seulement de l'information de type individuel (demande de crdit eUou comportement). Il est intuitif, par contre, de penser que le contexte conomique dans lequel volue l'emprunteur influence galement sa capacit d'honorer ses obligations en tant que dbiteur. La matrice Z inclura des variables macroconomiques (taux d'intrt, taux de chmage, etc.) dont les niveaux taient connus au moment de l'analyse du prt. Ces variables permettront d'valuer le risque reli l'environnement de l'emprunteur. La structure thorique du modle s'inspire des meilleures pratiques de l'industrie et de la littrature pertinente ce suj et. L'utilisation des systmes de notation des risques est largement rpandue et plusieurs tudes ont t publies sur ce type de modles de risque de crdit. Le caractre prdictif de certaines caractristiques d'un emprunteur sur sa probabilit de dfaut est bien document et reconnu tant dans la thorie que dans la pratique. 30 2.3 Structure du modle Trois points importants sur la structure du modle doivent tre mentionns. Tout d'abord, les donnes pour X sont considres comme transversales et plusieurs cohortes sont utilises. L'emprunteur se retrouve qu'une seule fois dans l'chantillon de dveloppement. En ce qui a trait aux variables macroconomiques, des sries chronologiques trimestrielles seront utilises. Le deuxime point est reli au type de probabilit de dfaut qui sera calcul. Les donnes utilises permettront d'estimer une probabilit de dfaut unstressed . Ce type de probabilit fait rfrence un estimateur non biais qui estime la chance qu'un emprunteur fasse dfaut dans la prochaine anne base sur les informations statiques et dynamiques disponibles qu'elles soient individuelles ou agrges. Cet estimateur prend en considration des donnes macroconomiques observables (CBCB, 2004). Cet estimateur est diffrent du type stressed qui inclut de l'information comportementale dynamique et qui est conditionnel l'volution de la situation conomique. L'estimateur unstressed ne permet pas de faire des stressed scenarios pour valuer la probabilit de dfaut futur. Nous nous attendons ce que la probabilit de dfaut soit plus faible ou leve lorsque la situation conomique est meilleure ou moins bonne. Le dernier point concerne l'approche point-in-time qui sera retenue. La probabilit de dfaut est calcule avec un modle qui considre des informations individuelles et agrges connues et disponibles au point d'observation qui est le moment de la demande de crdit. La probabilit de dfaut qui sera estime peut donc changer dans le temps et est statique au point d'observation. Cette approche diffre de l'approche through-the-cycle qui permet de calculer une probabilit de dfaut dynamique et qui n'est pas corrle aux alas conomiques mais bien aux changements du risque de l'individu (CBCB, 2005). L'approche point-in time nous intresse dans le cas prsent puisque nous cherchons diffrencier des catgories d'emprunteurs au moment de l'autorisation et non pas travers un cycle. Nous voulons dterminer si la probabilit de dfaut au moment du prt varie en fonction du contexte conomique contemporain du moment de l'autorisation de crdit. 31 L'infonnation sur le contexte conomique est gnralement agrge au niveau national et quelques indicateurs sont disponibles rgionalement. Il n'y a pas d'infonnation conomique disponible au niveau local ou personnel de l'individu. Les conditions conomiques sont donc identiques pour un ensemble d'emprunteurs. Comme le modle cherche capter l'tat de la situation conomique et la tendance au point d'observation, les variables macroconomiques qui le composent seront introduites de faon reprsenter cette dynamique. Dans le modle projet, un compromis sera fait quant au niveau d'agrgation des variables retenues. Des variables de niveaux rgional et national seront utilises. Ainsi au point d'observation, des groupes d'emprunteurs auront des valeurs macroconomiques diffrentes en fonction de leur rgion de rsidence tandis que l'ensemble des emprunteurs partagera d'autres valeurs macroconomiques agrges identiques. 2.4 Dfinition de l'vnement Diffrentes dfinitions de perfonnance peuvent tre retenues pour le dveloppement des modles de probabilit de dfaut. La dfinition dpend de l'objectif qui est poursuivi savoir s'il consiste diffrencier les clientles traites en anticipant leur perfonnance sur le court ou le long tenne. Dans le cas prsent, le prt est considr en dfaut lorsque l'une ou l'autre des situations suivantes survient sur une priode de douze mois aprs son ouverture: l'emprunteur est en retard de paiement depuis 90 jours et plus; le prt est radi ou il est certain que le capital ne sera pas rcupr avant mme qu'lUl retard de paiement de 90 jours et plus ne se soit ralis. La variable dpendante Y est dichotomique et peut prendre deux valeurs. Elle se ralise t priodes aprs que X et Z aient t observs: ={l, si l'individu est en dfaut Yi O' , SI non i = indice de l'emprunteur avec i = 1, 2, 3, ... , N . 32 Le segment du portefeuille analys correspond aux nouveaux emprunteurs uniquement. Les prts dont les donnes d'autorisation sont incompltes sont exclus de la population sous observation. Les prts ferms durant la priode d'analyse feront partie de l'chantillon et se verront attribuer la performance observe avant la fermeture. 2.5 Caractristiques individuelles utilises La matrice X contient les variables qui caractrisent l'vnement de dfaut. Ces variables proviennent de diffrentes sources et peuvent tre introduites dans le modle de diverses faons (par exemple: taux d'endettement qui est le ratio des dettes sur le revenu) : X ji = caractristiques individuelles j pour l'emprunteur i j = indice de la caractristique avec j = l, 2, 3, ... , J, i = indice de l'emprunteur avec i = l, 2, 3, ... , N . Afin de faciliter certaines tapes du dveloppement du modle, un ensemble prliminaire de caractristiques d'emprunteurs sera choisi arbitrairement. Ce choix est fait considrant le pouvoir prdictif dj reconnu de certaines caractristiques. Ces variables ont t testes dans le pass et sont couramment utilises dans des modles (Fair Isaac, 2002). Ce choix repose galement sur l'objectif de recherche qui ne consiste pas valider des variables individuelles mais bien le faire pour des variables macroconomiques. Les caractristiques de l'emprunteur se classent dans deux catgories, soit le risque de l'emprunteur et le risque transactionnel. Ces deux catgories et les caractristiques qui les composent sont prsentes dans les sous-sections qui suivent. 2.5.1 Caractristiques du risque de l'emprunteur Le risque de l'emprunteur peut tre valu partir de diffrentes caractristiques. Le tableau qui suit prsente les caractristiques prslectionnes afin d'estimer ce risque. Ces caractristiques dressent un profil gnral de l'emprunteur. 33 Tableau 2.5.1 Caractristiques du risque de l'emprunteur Provenance Numro Variable 1 ge 2 Sexe ..... ;j -0 0 3 Revenus C ro S 0 4 Statut rsidentiel Cl Rgion 5 administrative Dfinition Relation avec Y ge du demandeur - Sexe du demandeur Neutre Revenus annuels - Propritaire, locataire, avec parents, autre + / Lieu de rsidence + / Ces informations prliminaires proviennent du dossier du demandeur. La variable rgion administrative permet de faire la jonction entre les variables macroconomiques agrges et la rgion de rsidence de l'emprunteur. 2.5.2 Caractristiques du risque transactionnel En ce qui a trait aux caractristiques du risque transactionnel, trois sources de donnes sont utilises. La premire correspond au prt proprement dit, la deuxime provient du bureau de crdit et la dernire du compte bancaire. Le tableau qui suit prsente la premire source de donnes: Tableau 2.5.2.1 Caractristiques du prt Provenance Numro Variable Dfinition Relation avec Y 6 Type du crdit A terme, REER ou crdit rotatif + / ...... <0 ..... p., 7 Garantie Co-emprunteur, caution - 8 Client Nouveau ou existant - Tel que dcrit antrieurement, le portefeuille tudi correspond aux prts nouvellement ouverts et aucune donne comportementale ne sera utilise. Nous ne nous baserons donc pas sur la performance courante du prt pour valuer le risque transactionnel. Une partie du risque transactionnel peut cependant tre estim partir de la performance courante ou passe de d'autres produits de crdit que dtient l'emprunteur au moment de l'analyse de crdit. Ces informations sont disponibles entres autres sur la fiche de crdit de l'individu. 34 Le tableau ci-dessous prsente les caractristiques prslectioIUles provenant du bureau de crdit qui correspond la deuxime source de dOIUles utilises pour valuer le risque transactioIUle1. Tableau 2.5.2.2 Caractristiques de le fiche de crdit Provenance Numro Variable Dfinition Relation avec Y Drogations Nombre de retards II + mineures mineurs Drogations Nombre de retards 12 + majeures majeurs .... Lignes Nombre de transactions :.a 13 '<l) .... satisfaisantes satisfaisantes (,) <l) Pire cote de "0 14 Pire cote de retard + ;:l dlinquance ~ Historique de la Nombre de mois depuis <l) '-< ;:l 15 fiche de crdit la cration de la fiche CO Nombre de Nombre de requtes de 16 + requtes crdit rcentes Fardeau net du Pourcentage d'utilisation 17 + crdit rotatif du crdit renouvelable Finalement, la troisime source de dOIUles utilise sera le compte d'opration. Cette source d'information additioIUlelle devrait aussi contribuer la performance du modle de par la nature des dOIUles qui y sont disponibles. Le tableau qui suit prsente les caractristiques prslectionnes. Tableau 2.5.2.3 Caractristiques du compte d'opration Provenance Numro Variable Dfinition Relation avec Y t:: 18 Actif Actif montaire dtenu + <l) .S ........ o . ~ Chques sans Nombre de chques 19 + S . ~ fonds retourns 0 0. Up Historique du Nombre de mois depuis "0 20 compte l'ouverture du compte Un compromis devra tre fait quant au nombre de variables individuelles qui seront utilises. L'ide consiste retenir entre douze et quinze variables pour l'estimation du modle final afin d'optimiser la performance. 35 2.6 Variables macroconomiques La forme fonctionnelle des variables macroconomiques demande une certaine rflexion. Les quelques rares tudes disponibles sur la matire et le manque de thorie conomique dans ce domaine nous obligent tenter des expriences avant d'en arriver une forme finale. Le choix des variables est bas sur leurs effets anticips sur les revenus et le cot du crdit, et donc sur la capacit rembourser des emprunteurs. La matrice Z prendra la forme suivante: Z)i = variables macroconomiques) de l'emprunteur i ) = indice de la variable avec) = l, 2, 3, ... , J M i = indice de l'emprunteur avec i = l, 2, 3, ... , N . Ces variables seront introduites de deux faons. La premire consiste capter le contexte conomique contemporain qui prvalait au point d'observation. La deuxime consiste reprsenter la tendance qui se dessinait au point d'observation. Plus prcisment, ces variables prendront les formes suivantes: valeur de la variable au trimestre courant ou prcdent; ratio de la variable au trimestre prcdent sur la moyenne des huit derniers trimestres. Tableau 2.6 Variables macroconomiques Provenance Numro Variable Dfinition Relation avec Y Statistique 21 Taux d'inflation Taux d'inflation national + Canada Conference Indice de Indice de confiance des 22 Board confiance consommateurs Banque du Taux d'intrt Taux d'intrt 23 + Canada prfrentiel prfrentiel Taux de croissance du 24 PIE PIE rgional Taux de Taux de chmage 25 + chmage rgional 36 Les donnes macroconomiques proviennent de Statistique Canada pour les valeurs agrges au niveau national et de Statistique Qubec pour les donnes rgionales. Le taux d'intrt prfrentiel provient de la Banque du Canada. Les variables utilises sont trimestrielles. Le 2.7 Forme fonctionnelle du modle La rgression logistique s'avre tre la forme fonctionnelle idale pour estimer un vnement telle dfaut de paiement. Cette mthode est d'ailleurs communment utilise pour modliser les risques de crdit pour des expositions de dtail. Nous cherchons estimer la probabilit de dfaut de l'individu au point d'observation, algbriquement, cette probabilit est reprsente par la fonction de densit: ln ('j(_P, J= a + flX + 8Z , o p =Pr(Yi =lI X ji,Zji) = F(xji,zji). La rgression logistique est reprsente par l'expression mathmatique gnrale suivante (Jonhston et Dinardo, 1997) : e<a+{3X+Z) Pr(Y =11 X, Z) =F(X, Z) o F(X, Z) = 1+ e<a+{3X+Z) Le logit est estim l'aide d'un maximum de vraisemblance qui permet d'viter la problmatique du biais reli au regroupement des donnes puisqu'on estime une fonction de densit de probabilit. La forme gnrale du maximum de vraisemblance correspond : [1-p(a+bx+8zt Yi ]. Pour respecter les meilleures pratiques lors du dveloppement de modles, des tests doivent tre effectus afin de dtecter s'il y a prsence d'autocorrlation, de multicolinarit ou d' htroscdasticit. 37 Le test d'htroscdasticit est complexe pour les modles logit et ne sera pas ralis dans le cas prsent. La littrature consulte en fait d'ailleurs peu mention. Cet aspect n'tait pas considr dans la documentation consulte sur le dveloppement des modles de risques de crdit pour les expositions de dtail. Nous remarquons cependant que la structure particulire des donnes utilises pour ce type de modles suscite l'intrt de plusieurs chercheurs. Pour la pratique, les paramtres qui seront estims sont jugs efficaces et convergents et nous posons l'hypothse que E(E/I x, ) =pour tout i (voir Jonhston et Dinardo 1997 pour une discussion plus approfondie sur l'htroscdasticit et les modles logit). 2.8 Tests statistiques La prochaine tape consiste rduire le nombre de variables prslectionnes jusqu' prsent afin de retenir les plus significatives. Des tests seront raliss afin de vrifier la corrlation, le pouvoir prdictif et le seuil de significativit de chacune des variables (Hayden, 2006). Selon les rsultats obtenus, une slection finale sera faite et les variables retenues feront partie du modle final qui sera estim. En ce qui a trait la corrlation, un indice de corrlation sera calcul pour chaque combinaison possible de deux variables explicatives l'aide de la l'quation mathmatique: cov(x,Z) xz corr(x z)= = , ~ v a r ( x ) v a r ( z ) x z Les variables hautement corrles sont une source d'instabilit dans les modles et il est pratique courante de les exclure lorsque l'indice de corrlation est suprieur 0,7. Dans de tels cas, le choix de retenir l'une ou l'autre des variables sera bas sur le rsultat des autres tests, de l'exprience et de l'intuition. Pour le caractre prdictif des variables, nous calculerons leurs Information value (IV) et Accuracy Ratio (Coefficient Gini). Ces statistiques permettent d'valuer la capacit de la caractristique diffrencier les groupes d'individus. Les caractristiques avec les valeurs les 38 plus leves seront slectionnes pour faire partie du modle final. Le IV se calcule en diffrentes tapes (Fair Isaac, 2002). Tout d'abord, il faut compter le nombre de dfauts et de non dfauts pour chaque catgorie k de chacune des caractristiques: YO,k =L(y =0), (1) k (2) Ensuite, on calcule les ratios de (1) et (2) pour chacune des catgories k de chaque caractristique: o/c - YO,k oYO,k- , (3) (YO,k + YI,k) 0/ Y _ YI,k /0 1 k - (4) , ( yO,k + YI,k) L'tape suivante consiste calculer le Weight of Evidence pour chacune des catgories k partir de (3) et (4) : % YO,k J (5) Woe k = ln ( % YI,k . Le IV de la caractristique correspond la somme de la diffrence entre (3) et (4) multiplie par (5) de chaque catgorie. Algbriquement: Cl lfj = L.J(%Yo,k - %YI,k) *Woe d . k=l Plus la valeur de l'IV est leve, plus la caractristique dtient une capacit de sparer les types d'emprunteurs. Les variables qui auront l'IV le plus grand seront slectionnes pour faire partie du modle final. Tel que le souligne Porath (2006), certaines rgles doivent tre 39 respectes pour assurer une catgorisation valide. Il doit y avoir au minimum 50 individus de type y= 1 et 50 de type y=0 dans chacune des catgories. Les groupes doivent galement avoir des profils de risque similaires et le classement doit avoir une reprsentation intuitive. En ce qui a trait au Coefficient Gini, il se calcule l'aide d'une rgression univarie entre la variable explicative et Y. Cette statistique sera galement utilise pour comparer la performance des deux modles qui seront estims. La reprsentation algbrique du Coefficient Gini est prsente au point 2.10.1. Tout comme pour l'IV, les variables avec les valeurs du Coefficient Gini les plus leves seront slectiOlll1es pour le modle final. 2.9 Transformation des variables Le modle inclut des variables explicatives de type binaire, quelques transformations doivent tre apportes aux dOlll1es pour tre en mesure d'estimer le modle. Par exemple, une caractristique qualitative tel le statut rsidentiel peut prendre la valeur propritaire , locataire , avec parents et autres . Cette variable doit tre transforme pour pouvoir tre utilise l'intrieur du modle. Dans de tels cas, une condition de k - 1 catgories est ncessaire afin d'viter de la colinarit et fait en sorte qu'une catgorie est laisse de ct. Bien que non obligatoire, une pratique courante consiste catgoriser toutes les variables du modle incluant celles qui sont quantitatives. Plusieurs raisons sont derrire cette pratique. La premire est que la distribution du risque d'une variable n'est pas COlll1ue a priori (Porath, 2006). La linarit entre une caractristique et la probabilit est une hypothse inhrente aux modles logit (Hayden, 2006) et chaque caractristique doit tre teste par rapport : Dans l'ventualit o une caractristique n'est pas linaire, l'emploi d'un filtre est ncessaire. La transformation en catgorie permet donc de s'assurer de la linarit de la caractristique. galement, cette catgorisation permet de dOlll1er plus de robustesse au modle lors de 40 l'estimation. Finalement, elle permet une normalisation du modle puisque dj plusieurs variables binaires sont utilises. Durant la procdure de transformation, chaque variable se voit attribuer un nombre de catgories en fonction de sa nature. Les variables se retrouvent ainsi chacune avec k - 1 catgories corrune dans le cas des variables binaires. Voici un exemple avec une variable continue telle que les revenus . Cinq catgories pourraient tre cres pour classer les emprunteurs : 0 $ , 1 $ 15 000 $ , 15 001 $ 30 000 $ , 30 001 $ 50000 $ et 50 001 $ et plus . Le nombre de catgories et les intervalles de valeurs sont dtermins par l'intuition et le logiciel informatique qui optimise les regroupements. Nous cherchons linariser la distribution de la caractristique en fonction du risque. Suite la catgorisation, le vecteur de variables optimiser prend la forme algbrique suivante: ) = indice de la variable avec} = 1,2,3, ... , J, ou} = 1,2,3, ... ,J.1vf k= indice de la catgorie de la variable avec k = l, 2, 3, ... , C Nous remarquons que plus le nombre de variables et de catgories augmente, plus le modle devient complexe. La dcision de catgoriser les variables macroconomiques sera dtermine lors de l'estimation du modle. La dernire tape consiste maintenant estimer le modle l'aide des variables retenues lors des dernires tapes de validation et de transformation. L'estimation du logit peut se faire l'aide d'une procdure backward elimination multivarie qui est disponible dans la plupart des logiciels statistiques. Le modle est estim avec l'ensemble des variables retenues et celles qui sont le moins significative sont limines tour de rle jusqu'au moment o le seuil de significativit de l'ensemble des variables restantes, tant en groupe qu'individuellement, est 99 %. C'est la statistique de Wald qui est utilise lors de ce test. L'avantage de la procdure stepwise est qu'elle permet de classer les variables par seuil de significativit et d'valuer leur contribution marginale respective. 41 2.10 Analyses de perfonnance En plus des tests courants qui sont raliss lors du dveloppement et de l'estimation d'un modle logit, des tests additionnels de validation sont aussi entrepris afin de vrifier le pouvoir de diffrenciation et de prdiction du modle. Ces tests pennettent de comparer la perfonnance de deux modles. La perfonnance des modles de risque de crdit de dtail est actuellement value sous deux principaux angles (Medema, Koning et Lensink, 2007). La perfonnance des modles est value partir du pouvoir de diffrenciation entre les bons et les mauvais prts (de l'anglais discrimination ) ainsi qu' partir de sa capacit non biaise d'estimer la probabilit de dfaut (de l'anglais calibration ). Harrell (2001), le BCBC (2005) ainsi que Engelmann et Rauhmeier (2006) rsument les aspects techniques entourant l'valuation de la perfonnance des modles. Le CBCB (2005) propose d'ailleurs un cadre standard de validation. Dans le cas prsent, deux mesures du pouvoir de sparation et une de la capacit prdire l'vnement seront utilises. 2.10.1 Pouvoir de diffrenciation La premire mesure utilise est la statistique Kolmogorov - Smimov (KS). Cette statistique reprsente le point o la distance est la plus grande entre la fonction de distribution cumule des emprunteurs qui font dfaut par rapport ceux qui ne le font pas. Plus le KS est lev, meilleure est la capacit du modle bien diffrencier les types d'emprunteurs. Celte statistique se classe dans la catgorie des tests non paramtriques. Les diffrentes tapes de son calcul sont dcrites ci-dessous: 1- les observations sont classes en fonction de la probabilit de dfaut de la plus leve la plus faible; 2- la frquence, la frquence cumule et le pourcentage cumul des bons et des mauvais sont calculs pour chaque niveau de probabilit de dfaut; 42 3 la diffrence entre le pourcentage cumul des bons et des mauvais est calcule pour chaque niveau de probabilit de dfaut; 4 l'cart le plus grand correspond la statistique KS. La deuxime mesure consiste calculer la courbe Cumulative Accuracy Profile (CAP). Cette courbe est reprsente en ordonne par les bads , soit la fonction de distribution cumule des emprunteurs qui font dfaut et en abscisse, par les ail , la fonction de distribution cumule de l'ensemble des emprunteurs. Graphique 2.10.1 Courbe Cumulative Accuracy Profile (CAP) 'JJ wting model ] .------ pelfect model A a11 o ~ - - - - - - - - - - - - - - - - - - - . - - - o CBCB (2005) Plus la courbe du modle est loigne vers le haut et la gauche, plus le modle perforrne bien alors que la diagonale reprsente le modle alatoire. partir de ce graphique, nous pouvons calculer le Coefficient Gini qui reprsente le quotient de deux surfaces. Le Coefficient Gini est aussi connu sous le nom de Accuracy Ratio (AR), il se calcule de la faon suivante: OR = aire sous la courbe entre le rating model et le random model Op = aire sous la courbe entre le perfect model et le rating model . 43 La courbe Receiver Operating Characteristic est une autre option pour calculer la perfonnance du modle. Au lieu de mettre en perspective la distribution des prts en dfaut par rapport la distribution de l'ensemble des emprunteurs comme le fait la courbe CAP, elle la met en relation avec la distribution des emprunteurs qui ne font pas dfaut. De cette courbe dcoule la statistique Area Under Curve (AUROC) qui n'est en fait qu'une transfonnation linaire du Coefficient Gini. Le Coefficient Gini pennet de valider le pouvoir de diffrenciation d'une caractristique, mais aussi d'un modle dans sa globalit. Tout comme le KS, plus sa valeur est leve, plus le modle est capable de bien diffrencier les sous-groupes de la population sous tude. Un Coefficient Gini prs de 0 consiste en un modle qui a de la difficult diffrencier les emprunteurs puisqu'une fois sur deux, il se trompe alors qu'un modle avec un Coefficient Gini de 1 signifie qu'il arrive diffrencier les sous-groupes parfaitement. 2.1 0.2 Pouvoir de prdiction La dernire tape de l'analyse de perfonnance consiste valuer la capacit du modle bien prdire la probabilit de dfaut. Cette analyse consiste raliser une analyse comparative entre la probabilit de dfaut estime et celle qui s'est effectivement ralise. Le modle a t dvelopp en utilisant des donnes d'un chantillon in-sample . Un chantillon hold-out sample a galement t prpar pour la validation, il contient des donnes in-sample et out-of-sample . Plus prcisment, les donnes de validation in-sample proviennent de la mme priode que celle utilise pour le dveloppement du modle alors que les donnes out-of-sample proviennent d'une priode diffrente. Les probabilits de dfaut estimes sur les chantillons de dveloppement et de validation peuvent donc tre compares aux dfauts rels par une approche historique. La stabilit du modle peut ainsi tre sommairement value. Cette capacit bien prdire l'vnement de dfaut sera mesure l'aide de la statistique du goodness-of-fit connue comme tant la statistique Chi-square ou encore Hosmer Lesmeshow (T). La statistique T pennet de vrifier la capacit du modle de prvoir la 44 c probabilit de dfaut dans des catgories d'emprunteurs (BCBC, 2005). Plus la statistique T est faible, plus le modle est en mesure de bien estimer la ralit. Elle se calcule en crant pralablement des groupes comme par exemple des dciles, et en appliquant la fonnule mathmatique: Y c " Pc = le nombre d'emprunteurs dans la catgorie c = la probabilit de dfaut de la catgorie c r/Jc = le nombre de dfaut de la catgorie c = le nombre de catgories avec c = 1, 2, 3, ... , C 2.11 Conclusion La mthode de travail, prsente tout au long du chapitre, dfinit les diverses tapes qui seront suivies lors du dveloppement du modle. L'application de cette mthode pennet de fonnaliser les travaux et d'assurer une validit des rsultats qui seront obtenues lors de l'estimation du modle. CHAPITRE III RSULTATS D'ESTIMATION 3.1 Introduction Les variables composant le modle initial ont t prslectionnes en fonction du Coefficient Gini, de l'IV, des tests de corrlation qui ont t raliss et de l'intuition. Le modle a t estim l'aide d'une rgression logistique multivarie en utilisant une procdure stepwise comme le proposent Hosmer et Lemeshow (2000). 3.2 Estimation des paramtres du modle gnral L'hypothse consiste rejeter Ho et vrifier que f3 est diffrent de zro. Les premiers rsultats dmontrent que les variables retenues rencontrent individuellement le seuil de significativit qui a t fix 0,01 %. L'analyse des variables ligibles pour un rejet est prsente ci-dessous. Le test de Wald a t ralis pour chaque variable du modle. Tableau 3.2.1 Analysis of Effects Eligible for Removal Modell Wald Effect DF Pr > ChiSq Chi-Square Catactif 3 4017.5027 <.0001 Catutili 4 1805.2179 <.0001 Catnsf 2 1200.8302 <.0001 Calresidence 2 654.2928 <.0001 Homme 1 538.6600 <0001 Catworsl 4 485.2190 <.0001 Calage 3 197.8066 <.0001 Garantie 1 38.7313 <.0001 Membre 1 30.2252 <.0001 Nous remarquons que les variables prslectionnes ont toutes t retenues lors du processus d'limination du logiciel statistique et qu'elles sont statistiquement significatives et reprsentatives de l'vnement de dfaut. La variable de l'pargne est celle qui apporte le 46 plus d'information pour prdire la probabilit de dfaut de l'emprunteur. EUe est suivie par le pourcentage d'utilisation du crdit disponible et par le nombre de chques sans provision que l'emprunteur a ralis au cours de la dernire anne. Par la suite, viennent dans l'ordre les caractristiques relatives au statut rsidentiel, au sexe, la pire cote de crdit au bureau de crdit et l'ge du dbiteur. L'avant dernire variable entrer dans le modle correspond la notion de garantie sur le prt. La dernire caractristique quant elle reprsente le type de relation qui existe entre l'institution financire et l'emprunteur. Le tableau qui suit prsente les rsultats des paramtres de chacune des variables. Tableau 3.2.2 Analysis of Maximum Likelihood Estimates Modell Standard Wald Parameter DF Estimate Pr> ChiSq Error Chi-Square Intercept 1 -3.6460 0.0967 1422.4292 <.0001 Membre 1 0.1799 0.0327 30.1678 <.0001 Garantie 1 -0.2984 0.0477 39.1324 <.0001 Homme 1 0.4942 0.0217 517.6788 <.0001 Catnsf 01 nsf= 0 1 -1.0483 0.0461 517.1468 <.0001 Catnsf 02 nsf= 1 1 -0.3756 0.0588 40.7523 <.0001 Catage 01 - de 35 ans 1 -0.1043 0.0345 9.1525 0.0025 Catage 0346 65 ans 1 -0.4136 0.0403 105.5506 <.0001 Catage 0466 ans et + 1 -0.7215 0.0706 104.3832 <.0001 Catactif 01 - de 0 $ 1 2.2363 0.1014 485.9752 <.0001 Catactif 02 - de 1 000 $ ou inconnue 1 1.5355 0.0424 1313.0134 <.0001 Catactif 03 1 001 $ et 5 000 $ 1 0.2948 0.0500 34.7830 <.0001 Catresidence 02 Locataire 1 0.5863 0.0321 334.4940 <.0001 Catresidence 03 Autre 1 0.1237 0.0370 11.2004 0.0008 Catutili 01 Util=0%-19% 1 -0.9007 0.0393 524.3987 <.0001 Catutili 02 Util = 20 % - 49 % 1 -0.6575 0.0456 207.9403 <.0001 Catutili 03 Util = 50 % - 99 % 1 -0.2991 0.0399 56.1917 <.0001 Catutili 04 Util >= 100% 1 0.3039 0.0717 17.9763 <.0001 Catworst 0\ 1 et + major 1 1.0026 0.0666 226.7287 <.0001 Catworst 02 1, 2 or 3 minor et no major 1 0.8897 0.0688 167.3522 <.0001 Catworst 04 1 9 stat no der. 1 0.3902 0.0608 41.2356 <.0001 Catworst 0399 NHNS 1 0.4217 0.0677 38.8205 <.0001 Le modle cherche dmontrer la relation qui existe entre le profil de l'emprunteur et l'vnement de dfaut. Dans cet ordre d'ides, les variables continues ont t discrtises afin de reprsenter cette relation qualitative. La catgorisation est galement ncessaire en raison 47 du caractre particulier des variables utilises. Les coefficients de chacune des catgories rencontrent individuellement le seuil de 0,01 %. Nous remarquons par ailleurs que les estimations vont pratiquement toutes dans la direction attendue l'exception d'une seule qui sera discute un peu plus loin. Les paramtres de la variable pargne dmontrent bien la dynamique qui existe entre l'emprunteur et la probabilit de dfaut; plus le niveau d'pargne est faible au moment de la demande de crdit plus le risque qu'un dfaut survienne durant la priode de performance augmente. Nous remarquons galement que le niveau d'utilisation du crdit disponible au moment de la demande de crdit est un dterminant de la probabilit de dfaut. Le risque de dfaut de paiement est plus lev pour les emprunteurs qui n'ont pas de rfrences de crdit ou dont le niveau de crdit dj allou est trs utilis. Nous remarquons de la mme faon que le demandeur de crdit qui a peu ou pas de chques sans provision dans l'anne qui prcde sa demande de crdit possde un risque infrieur celui qui s'est vu retourner plusieurs chques. Le statut rsidentiel est galement un lment significatif. Les emprunteurs qui louent leur logement sont plus risqus que ceux qui sont propritaires. Nous remarquons paralllement que les hommes sont plus risqus que les femmes, nous n'avons pas cette tape-ci d'indices qui peut expliquer ce constat. Le comportement pass par rapport la consommation de crdit allou est aussi prdictif du comportement futur. Les emprunteurs qui utilisent du crdit sans jamais avoir eu de clauses drogatoires sont mois risqus que ceux qui ont eu des retards, soit mineurs ou majeurs, ou bien qui ont eu des dfauts de paiement ou encore qui ne sont tout simplement pas tablis au crdit. Le cycle de vie a galement des rpercussions sur la consommation du crdit et la probabilit de dfaut. Cette relation est reprsente par les coefficients des catgories de la variable ge. Le risque est plus lev pour les personnes des segments de 45 ans et moins que pour ceux des 46 ans et plus. Ceci est certainement expliqu par un besoin accru de crdit dans la premire partie du cycle de vie o les revenus sont plus faibles et les engagements financiers plus levs alors que dans la deuxime, la richesse augmente et les besoins en crdit diminuent. Nous remarquons que le degr de significativit du segment 35 ans et moins est plus faible que les autres au niveau du test de Wald . Mme si le niveau de 0,01 % est 48 atteint, nous remarquons que cette catgorie est la moins reprsentative de toutes. Nous aurions pu nous attendre ce que la relation entre ce segment et celui de rfrence, qui est les 36 45 ans, soit reprsente par un signe ngatif. Plus prcisment, nous aurions pu nous attendre ce que le segment des plus jeunes soit le plus risqu de tous et que sa probabilit de dfaut soit lgrement suprieure celle du segment de rfrence. Ce rsultat est peut tre d au fait que les jeunes doivent bien souvent prsenter des garanties pour se voir octroyer du crdit. Ces rsultats vaudraient la peine d'tre investigus plus en dtail. La variable garantie dmontre que le risque est infrieur lorsque le crdit est cautionn par un moyen quelconque, comme par exemple, l'aide d'un co-emprunteur ou d'une caution. Fait tonnant, nous aurions pu nous attendre un effet diffrent pour la variable membre. Mme si son niveau prdictif est plutt faible, nous aurions pu nous attendre un niveau de risque infrieur pour les clients membres par rapport ceux qui ne le sont pas. Cette situation pourrait tre due au fait que l'institution financire prend moins de risque avec la clientle qu'elle ne connat pas et accepte des dossiers de meilleure qualit dans ce segment. 3.3 Rsultats de l'estimation du modle gnral Le modle a par la suite t test dans sa globalit afin de vrifier que l'ensemble des variables sont significatives simultanment. Le tableau qui suit prsente les diffrents rsultats obtenus pour les tests statistiques Likelihood Ratio , Score et Wald . Tableau 3.3.1 Testing Global Nul! Hypothesis: BETA=O Model1 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 9295.1126 21 <.0001 Score 8800.7693 21 <.000\ Wald 7066.9304 21 <.0001 Les statistiques calcules pour valuer le modle dans sa globalit rencontrent toutes le seuil critique de 0,01 %. Les variables dans leur ensemble sont significatives tout comme elles l'taient au niveau individuel. Le modle est considr comme convenable. 49 Des statistiques comparatives tels le Akaike Information Criterion , le Schwarz Criterion et le -2 Log L ont par la suite t calcules. Le tableau ci-dessous prsente les diffrentes valeurs qui ont t obtenues pour le modle gnral. Ces statistiques n'ont pas de valeur en soit sinon qu'elles doivent tre compares celles d'un autre modle pour leur donner une signification. Tableau 3.3.2 Model Fit Statistics Modell Criterion Intercept Intercept Only And Covariates AIC 70695.211 61442.099 SC 70704.749 61651.931 -2 Log L 70693.211 61398.099 Nous nous intressons particulirement la colonne Intercept and Covariates . Nous cherchons le modle qui a les valeurs les plus petites. Ceci signifie que le modle de rfrence reprsente mieux la ralit que le modle auquel il est compar. Une meilleure reprsentation ne se fait pas pour autant au dtriment d'une suradaptation puisque les statistiques allouent une pnalit pour l'accroissement du nombre de degrs de libert. Les valeurs de ces statistiques seront confrontes celles qui seront obtenues lors de l'estimation du modle gnral avec variables macroconomiques. Par ailleurs, d'autres tests seront raliss afin d'valuer la capacit du modle diffrencier les types d'emprunteurs et estimer leur probabilit de dfaut. 3.4 Estimation des paramtres du modle avec variables macroconomiques L'hypothse de travail consiste rejeter Ho et vrifier que 8 est diffrent de zro. Suite la premire estimation du modle prsente prcdemment, des variables macroconomiques ont t introduites afin de vrifier la capacit prdictive du modle et ainsi vrifier si l'intgration de ces nouvelles variables permet d'augmenter la performance. Un choix a d tre fait lors de la slection des variables macroconomiques afin d'viter d'introduire de la colinarit dans le modle. 50 Le tableau ci-dessous prsente les rsultats du test de Wald et les niveaux de significativit pour chacune des variables du modle qui inclut les variables macroconomiques Model 2 . Seulement deux des variables macroconomiques introduites dans le modle ont t retenues dans le processus d'limination itratif. Tableau 3.4.1 Analysis of Effects Eligible for Removal Model2 Wald Effect DF Pr> ChiSq Chi-Square Catactif 3 4017.5027 <.0001 Catutili 4 1805.2179 <.0001 Catnsf 2 J200.8302 <.0001 Catresidence 2 654.2949 <.0001 Homme 1 538.6292 <.0001 Catworst 4 485.1988 <.0001 Catage 3 197.8042 <.0001 Garantie 1 38.7312 <.0001 Tx_ch_T-1 1 36.5474 <.0001 Ind conf T-I 1 32.6514 <.0001 Membre 1 10.6066 0.0011 Nous remarquons que les variables macroconomiques introduites dans le modle sont statistiquement significatives et peuvent expliquer en partie l'vnement de dfaut. Chacune d'elles rencontre le seuil critique de 0,01 %. Mise part la variable membre, la classification des variables individuelles et la valeur du test de Wald pour chacune d'elles sont identiques que dans le cas du modle gnral. L'pargne est la caractristique la plus significative (elle gnre galement l'effet empirique le plus important), suivie du pourcentage d'utilisation du crdit disponible, du nombre de chques sans provision, du statut rsidentiel, du sexe, de la pire cote de crdit au bureau de crdit, de l'ge du dbiteur et de la garantie. Le taux de chmage et l'indice de confiance des consommateurs du trimestre prcdant la demande de crdit sont plus significatifs que la variable membre, qui identifie le type de relation entre le client et l'institution financire, en comparaison au modle gnral. La statistique de Wald a diminu pour la caractristique membre. 51 Le tableau qui suit prsente les paramtres estims pour le deuxime modle qui inclut les variables macroconomiques. Encore une fois, tous les coefficients rencontrent le seuil de 0,01 %. Tableau 3.4.2 Analysis of Maximum Likelihood Estimates Model2 Standard Wald Parameter DF Estimate Pr > ChiSq Error Chi-Square Intercept 1 -3.1982 0.1778 323.5183 <.0001 Membre 1 01132 0.0348 10.6000 0.0011 Garantie 1 -0.2906 0.0477 37.0450 <.0001 Homme 1 0.4946 0.0217 518.2142 <.0001 Catnsf 01 nsf= 0 1 -1.0489 0.0461 517.3971 <.0001 Calnsf 02 nsf= 1 1 -0.3754 0.0589 40.6846 <.0001 Calage 01 - de 35 ans 1 -00990 0.0345 8.2426 0.0041 Calage 0346 65 ans 1 -0.4149 0.0403 106.1781 <.0001 Calage 0466 ans el + 1 -0.7202 0.0707 103.8490 <.0001 Catactif 01 - de 0 $ 1 2.2211 0.1015 478.4117 <.0001 Cataclif 02 - de 1 000 $ ou inconnue 1 1.5331 0.0424 1308.5125 <.0001 Calaclif 03 1 001 $ el 5 000 $ 1 0.2946 0.0500 34.7129 <.0001 Catresidence 02 Lo<.:alaire 1 0.5760 0.0321 322.0286 <.0001 Calresidence 03 Autre 1 0.1230 00370 Il.0674 0.0009 Catulili 01 Uli1 = 0% - 19% 1 -0.9063 0.0393 530.6023 <.0001 Calulili 02 Util = 20% - 49% 1 -0.6618 0.0456 210.5975 <.0001 Catutili 03 Uti1 = 50% - 99% 1 -0.3005 0.0399 56.6798 <.0001 Catutili 05 Ulil >= 100% 1 0.2961 0.0717 17.0516 <.0001 Catworst 01 1 et + major 1 0.9996 0.0666 225.2053 <.0001 Catworst 02 J, 2 or 3 minor el no major J 0.8865 0.0688 165.9716 <.0001 Catworsl 04 1 9 stat no der. 1 0.3870 0.0608 40.5230 <.0001 Catworst 0399 NHNS 1 0.4160 0.0677 37.7472 <.0001 Tx ch T-1 1 0.0252 000439 32.7986 <.0001 Ind conf T-I 1 -0.00648 0.00151 18.4795 <.0001 Les variables macroconomiques ont seulement un degr de libert. Elles n'ont pas t catgorises quoique l'option ait t value. Ce choix a t fait considrant qu' la diffrence des autres variables qui sont utilises pour le modle, ces dernires n'ont pas de dimension qualitative et sont continues. La linarit entre les variables macroconomiques utilises et l'vnement de dfaut a tout de mme t vrifie pour s'en assurer. 52 Nous remarquons que le log des odds de la probabilit de dfaut est plus lev de 0,0252 lorsque le taux de chmage du trimestre prcdent est plus lev de 1 %. Par ailleurs, la relation entre cette variable et la probabilit de dfaut va dans la direction attendue. Nous nous attendions ce que la probabilit de dfaut soit plus leve dans les rgions et priodes o le taux de chmage est plus lev. Pour l'indice de confiance des consommateurs du trimestre prcdent la demande de crdit, la relation va galement dans la direction attendue. Le log des odds est plus faible de 0,00648 lorsque l'indice de confiance est plus lev de 1. Ces rsultats sont donc conformes aux attentes. Lorsque nous comparons les paramtres de chacune des variables du modle, nous remarquons que les variables macroconoDques, malgr qu'elles soient statistiquement significatives, ont trs peu d'effet sur la probabilit de dfaut. Tel que prsent ci-dessus, le changement dans le log des odds indue par une variation de ces variables est trs faible comparativement aux variables individuelles qui ont t utilises. 3.5 Rsultats de l'estimation du modle avec variables macroconoDques Le modle a par la suite t test dans sa globalit afin de vrifier que l'ensemble des variables sont significatives simultanment en incluant les nouvelles variables macroconomiques. Le tableau qui suit prsente les diffrents rsultats obtenus pour les tests statistiques Likelihood Ratio , Score et Wald . Tableau 3.5.1 Testing Global Null Hypothesis: BETA=O Model 2 Test Chi-Square DF Pr> ChiSq Likelihood Ratio 9343.7277 21 <.0001 Score 8841.0095 21 <.0001 Wald 7096.3367 2l <.0001 Les statistiques calcules pour valuer le modle dans sa globalit rencontrent toutes le seuil critique de 0,01 %. Les variables sont donc significatives dans leur ensemble tout comme elles l'taient au niveau individuel. Le modle est considr comme convenable. 53 Le Akaike Information Criterion , le Schwarz Criterion et le -2 Log L ont par la suite t calculs. Le tableau ci-dessous prsente les diffrentes valeurs qui ont t obtenues pour le modle avec variables macroconomiques. Tableau 3.5.2 Model Fit Statistics Model2 Criterion Intercept Intercept Only And Covariates AIC 70695.211 61397.483 SC 70704.749 61626.392 -2 Log L 70693.211 61349.483 Tel que signal au point 4.3.2, ces statistiques permettent de comparer des modles entre eux. Nous nous intressons au modle pour lequel les statistiques sont les plus faibles. Nous remarquons que le modle avec variables macroconomiques possde les valeurs les plus faibles pour les trois statistiques. Nous sommes donc en mesure de confirmer que le modle qui inclut des variables macroconomiques reprsente mieux l'vnement de dfaut que le modle gnral. 3.6 Capacit des modles diffrencier les populations La prochaine tape consiste dterminer la capacit des modles diffrencier les bons des mauvais emprunteurs. cette fin, des statistiques comparatives ont t calcules et compares. Deux principaux indicateurs sont utiliss pour raliser cet exercice. Le premier consiste calculer l' AUROC qui est une transformation linaire du Coefficient Gini, le deuxime, consiste calculer le KS . Les dfinitions de ces statistiques et les quations mathmatiques pour les calculer ont t prsentes au chapitre II aux sections 2.8 et 2.10.1. L'utilisation de ces deux statistiques est reconnue tant dans la thorie que dans la pratique. 3.6.1 Diffrenciacion sur l'chantillon de dveloppement Le tableau ci-aprs prsente les statistiques AUROC et KS qui ont t calcules sur les chantillons de dveloppement du modle gnral et du modle avec variables macroconomiques. 54 Notre premire constatation est que les valeurs obtenues pour ces statistiques sont trs prs l'une de l'autre et que le modle avec les variables macroconomiques obtient tout de mme des valeurs suprieures. Tableau 3.6.1 AUROC et KS pour l'chantillon de dveloppement Modle AUROC KS Modle gnral 0.767 0.4\0 Modle avec variables macroconomiques 0.768 0.412 Les valeurs obtenues pour le AUROC et le KS dmontrent que le modle gnral et le modle avec variables macroconomiques arrivent bien diffrencier le risque pour les nouvelles expositions qui ont t octroyes. Les rsultats illustrent que l'ajout de variables macroconomiques permet d'augmenter, bien que trs modestement, la performance du modle en terme de capacit diffrencier les types d'emprunteurs. 3.6.2 Diffrenciation sur l'chantillon de validation in-sample La robustesse du modle a t teste sur deux chantillons prvus cette fin. La premire validation a t ralise sur un chantillon in-sample . Ces dOill1es provieill1ent de la mme priode que celle qui a t utilise pour dvelopper le modle. Le tableau ci-dessous prsente les rsultats qui ont t obtenus. Tableau 3.6.2 AUROC et KS pour l'chantillon de validation in-sample Modle AUROC KS Modle gnral 0.767 0.411 Modle avec variables 0.768 0.411 macroconomiques Nous remarquons que la performance des modles se maintient sur ce premier chantillon de validation. Les valeurs obtenues pour le AUROC dmontrent que le modle avec variables macroconomiques obtient une performance modestement suprieure. Le KS quant lui dmontre une performance pour le moins similaire. 55 3.6.3 Diffrenciation sur l'chantillon de validation out-of-sample La deuxime validation a t ralise sur un chantillon out-of-sample . Ces donnes proviennent d'une priode diffrente de celle qui a t utilise pour dvelopper le modle. Le tableau ci-dessous prsente les rsultats de l' AUROC et du KS qui ont t obtenus. Tableau 3.6.3 AUROC et KS pour l'chantillon de validation out-of-sample Modle AUROC KS Modle gnral 0.756 0.399 Modle avec variables macroconomiques 0.756 0.395 Nous remarquons que la performance des deux modles est infrieure sur l'chantillon de validation out-of-sample comparativement celle utilise pour le dveloppement ou pour la validation in-sample . La perfom1ance des modles s'est lgrement dgrade mais l'cart par rapport l'chantillon de dveloppement est faible. Il est galement not que le modle avec les variables macroconooques ne performe pas oeux que le modle gnral (la statistique AUROC est identique pour les deux modles alors que le KS est de 0,004 infrieur dans le cas du modle avec variables macroconooques). Des recherches additionnelles ont t ralises sur cet chantillon afin de vrifier si certains segments pouvaient bnficier de faon plus importante de l'apport d'information des variables macroconooques. Tableau 3.6.4 AUROC et KS pour les clientles non-membres Modle AUROC KS Modle gnral 0.712 0.320 Modle avec variables 0.715 0.326 macroconomiques Nous avons remarqu que lorsque nous segmentons les clientles non-membres de celles qui le sont, le modle avec les variables macroconooques obtient les meilleurs rsultats. Cette 56 situation pourrait tre d au fait que l'infonnation de type individuel tant plus limite lorsque l'emprunteur est non-client de l'institution, l'ajout de variables de march compenserait ce manque. 3.7 Capacit des modles estimer la probabilit de dfaut La dernire tape pour valuer la perfonnance des modles consiste valuer leur capacit prdire l'vnement de dfaut. Cet exercice sera ralis en effectuant le test du Chi-carr qui est galement connu sous le nom du test de Hosmer et Lemeshow . Lors de cette tape, nous valuerons le nombre de dfauts prdits par les modles que nous comparerons au nombre de dfauts qui se sont effectivement raliss. Tout comme pour la section sur la capacit des modles diffrencier les emprunteurs, les estimations de la probabilit de dfaut seront valides sur un chantillon in-sample et out-of-sample . 3.7.1 Test du Chi-carr sur l'chantillon de dveloppement Nous avons voulu, dans une premire tape, vrifier et comparer la capacit des modles estimer la probabilit de dfaut sur l'chantillon de dveloppement. Pour cet exercice, nous avons utilis un regroupement par rgion gographique afin de comparer les probabilits de dfaut prdites et celles ralises dans chacune des rgions utilises pour le dveloppement du modle. Tableau 3.7.1 Test du Chi-carr sur l'chantillon de dveloppement Modle Dveloppement Modle gnral 313 Modle avec variables 295 macroconomiques Nous remarquons que pour l'chantillon de dveloppement, le test du Chi-carr est plus faible pour le modle avec les variables macroconomiques que pour le modle gnral. Ce rsultat dmontre que le modle qui inclut les variables macroconomiques arrive mieux prdire la probabilit de dfaut que le modle gnral pour l'chantillon de dveloppement. 57 3.7.2 Test du Chi-carr sur les chantillons de validation Nous voulons maintenant vrifier le pouvoir prdictif des modles sur les chantillons de validation. Pour cet exercice, nous allons vrifier la capacit des modles prdire l'vnement de dfaut pour chacun des trimestres de la priode d'observation. Tableau 3.7.2.1 Test du Chi-carr pour les chantillons de validation Validation Validation Modle in-sample out-of-sample Modle gnral 81 48 Modle avec variables 71 79 macroconomiques Nous remarquons que pour l'chantillon de validation in-sample , le modle avec les variables macroconomiques performe mieux que le modle gnral. En ce qui a trait aux rsultats pour l'chantillon de validation out-of-sample , nous observons que le modle avec variables macroconomiques performe moins bien. Ce rsultat est contre-intuitif et mrite d'tre explor. Tableau 3.7.2.2 Probabilit de dfaut pour le validation out-of-sample PD Trimestre PD Modle avec variables macroconomiques PD Modle gnral 2003-TI 7.42% 6.7l4% 6.99l% 2006-T2 6.62% 6.159% 6.097% 2006-T3 6.60% 6.034% 6.233% Le modle gnral performe mieux pour TI-2003 et T3-2006. Ces deux trimestres correspondent respectivement aux premier et dernier trimestres de la priode d'observation qui a servi la validation des modles. Nous distinguons que la probabilit de dfaut est suprieure pour cette priode comparativement celle observe lors du dveloppement des modles qui tait en moyenne de 5,79 %. Cette diffrence dans la composition du portefeuille pourrait expliquer en partie la difficult du modle avec variables macroconomiques lors de ces deux trimestres. Nous remarquons galement au cours de cette priode des variations au niveau du taux de chmage qui pourraient aussi expliquer en partie les difficults du modle. 58 3.7.3 volution du taux de chmage et de la probabilit de dfaut Le graplque ci-dessous prsente les taux de chmage canadien et qubcois retards d'un trimestre et la probabilit de dfaut relle et projete par les deux modles. Nous remarquons que la probabilit de dfaut suit la tendance du taux de chmage. Elle est plus leve pour les prts octroys lorsque le taux de chmage tait plus lev alors qu'elle est plus faible lorsque le taux de chmage tait plus faible. Graphique 3.8 volution du taux de dfaut et du taux de chmage 10.00% - - - - ~ - - - 1 - - - -1- - - - r- - - - T - - - ., - - - 9.00% - - _. - - , 8.00% . --- -- .---.' 5.00% 4.00% + - - - r - - ~ - - - , - - - ~ - - ~ - - . . _ _ - . . . ; _ - ~ - _ _ ; . . - ~ - - _ PD _ - -PDmod.gn. --PDmod.macro.--Tilldech.Qct-l--Tx.dech,Cant-l Nous observons qu'en dbut et en fin de priode d'observation, la probabilit de dfaut ne suit pas la tendance dsire, elle diminue alors que le taux de chmage monte et elle augmente alors que le taux diminue. Conune le modle ne couvre pas une priode suffisanunent longue, la totalit d'un cycle conomique n'est pas capte. Mise part les premier et dernier trimestres de la priode de validation, nous remarquons que la tendance de long tenne du modle qui inclut les variables macroconomiques dmontre une perfonnance suprieure. D'ailleurs, sur quinze trimestres observs, ce modle a mieux prdit la probabilit de dfaut dix fois comparativement cinq pour le modle gnrai. Une priode de dveloppement plus longue pennettrait d'augmenter la robustesse du modle. 59 3.8 Conclusion Dans le cours du chapitre III, nous avons prsent les travaux d'estimation des modles. Nous avons dbut par estimer les paramtres du modle gnral et nous avons calcul par la suite les diffrentes statistiques permettant de valider les variables individuellement tout comme en groupe. Les rsultats obtenus dmontrent que les variables retenues sont statistiquement significatives et que le modle prdit convenablement l'vnement de dfaut. Dans une deuxime tape, nous avons procd intgrer des variables macroconomiques au modle gnral. Par les rsultats obtenus, nous avons remarqu que les variables additionnelles sont galement statistiquement significatives et que ce deuxime modle prdit aussi convenablement l'vnement de dfaut. Lors de la troisime tape, nous avons compar la performance des deux modles et nous avons remarqu que le modle qui inclut les variables macroconomiques reprsente mieux l'vnement de dfaut que le modle gnral. Nous avons aussi calcul et compar les diverses statistiques qui permettent d'valuer la performance des modles. Nous avons remarqu qu'ils arrivent bien diffrencier les populations et prdisent convenablement la probabilit de dfaut. Les rsultats obtenus ont dmontr que Ho: 8 1:- O. Nous pouvons conclure que les variables macroconomiques introduites dans le modle ajoutent de l'information au modle de base. CONCLUSION Les modles de risque de crdit la consommation sont largement utiliss et leur origine remonte aux annes cinquante. Le projet de mmoire a consist en une premire tape tudier les origines et l'volution de ce type de modles l'aide de la littrature pertinente disponible sur le sujet. En une deuxime tape, le projet a consist valuer empiriquement un modle l'aide de donnes provenant d'un portefeuille de crdit d'une institution financire. L'objectif de travail consistait vrifier si l'ajout de variables macroconomiques permettait d'augmenter la performance du modle gnral. Les avantages du recours aux modles de risque dans l'industrie du crdit sont bien connus et les auteurs cits ont ralis des tudes sur le sujet pour le dmontrer. Dans le cas prsent, nous avons voulu valuer un modle de base auquel nous avons ajout des variables de march afin de vrifier leur apport prdictif. Nous voulions aussi vrifier si la probabilit de dfaut variait en fonction de l'tat de l'conomie. L'hypothse de travail ~ : 5 = 0 a t rejete, nous avons trouv que les variables macroconomiques retenues taient statistiquement significatives et que le nouveau modle reprsentait mieux l'vnement de dfaut que le modle de base. Au niveau du pouvoir de diffrenciation et de prdiction, nous avons remarqu que les deux modles performaient des niveaux satisfaisants. Le modle avec variables macroconomiques a tout de mme dmontr une performance marginalement suprieure pour les trimestres de la priode de dveloppement et de validation in-sample . Dans l'chantillon de validation out-of sample , le modle n'a pas t en mesure de dmontrer significativement une performance suprieure. Cette sous-performance pourrait tre due des effets externes tels que les niveaux de dfaut diffrents dans les deux chantillons et l'utilisation d'une priode d'observation qui n'est pas suffisamment longue pour capter un cycle conomique. Ces questions mriteraient d'tre approfondies. 61 Le modle empirique qui a t prsent se voulait une tentative lmentaire d'intgrer des variables de march dans un modle de risque de crdit l'octroi. Tel que mentionn au cours de la recherche, d'autres approches et mthodes auraient pu tre utilises. Dans le cadre d'une recherche future, de nouvelles avenues pourraient tre explores afin de mieux intgrer ce type de variables. En bout de ligne, corrune les projections futures sont bases sur des relations entre des caractristiques et des vnements passs, une meilleure connaissance des raisons menant au dfaut de paiement aurait des rpercussions positives sur l'exactitude des anticipations et amliorerait la gestion du risque de crdit des banques. BIBLIOGRAPHIE Akhavein, J., W. Scott et L. J. White. 2005. The diffusion of financial innovations: an examination of the adoption of small business credit scoring by large banking organizations. Journal ofBusiness, vol. 78, no 2, p. 577-596. Allen, L., G. Delong et A. Saunders. 2004. Issues in the credit risk modeling of retail markets. Journal ofBanking & Finance, no 28, p. 727-752. Altman, E. 1. 1968. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. Journal Finance, no 23, p. 589-609. Altman, E. 1. et A. Saunders. 1998. Credit risk measurement : Developments over the last 20 years. Journal ofBanking & Finance, no 21, p. 1721-1742. Avery, R. B., R. W. Bostic, P. S. Calem et G. B. Canner. 1996. Credit Risk, Credit Scoring, and the Performance of Home Mortgages. Federal Reserve Bulletin, vol. 82, no 7, p. 621-648. Avery, R. B., R. W. Bostic, P. S. Calem et G. B. Canner. 2000. Credit Scoring: Statistical Issues and Evidence from Credit-Bureau Files. Real Estate Economies, vol. 28, no 3, p. 523-547. Avery, R. B., P. S. Calem et G. B. Canner. 2004. Consumer credit scoring: Do situational circwnstances matter?. Working paper 146. Banque des Rglements Internationaux, Ble. Berger, A. N., W. S. Frame et N. H. Miller. 2002 (avril). Credit scoring and the availability, price, and risk of small business credit. Paper. Federal Reserve Board. Berger, A. N. 2003. The economic effects of technological progress: Evidence from the banking industry. Journal ofMoney, Credit and Banking, vol. 35, no 2 (avril), p. 141-176. Berger, A. N., W. S. Frame et N. H. Miller. 2005. Credit scoring and the availability, price, and risk of small business credit. Journal ofMoney, Credit and Banking, vol. 37, no 2 (avril), p. 191-222. Bofondi, M. et F. Lotti. 2006. Innovation in the retail banking industry: The diffusion of credit scoring. Review ofIndustrial Organization, no 28 (dcembre), p. 343-358. Boyer, R., M. Dehove et D. Plihon. 2004. Les crises financires. Conseil d'analyse conomique, Rapport du 1er trimestre 2004, Banque de France, 413 p. 63 Cont de Ble sur le contrle bancaire. 2004. Convergence internationale de la mesure et des normes de fonds propres. Banque des Rglements Internationaux, Ble. Cont de Ble sur le contrle bancaire. 2005. Studies on the validation of internai rating systems. Working paper 14. Banque des Rglements Internationaux, Ble. Cont de Ble sur le contrle bancaire. 2007. History of the Basel Committee and its membership. Banque des Rglements Internationaux, Ble. Dielman, T. E. 1998. The Pooled cross-sectional and time series data analysis. Marcel Dekker. New York. Durand, D. 1941. Risk e1ements in consumer instalment financing. National Bureau of Economies Research, New York. Engelmann, B. et R. Rauhmeier. 2006. The Basel II risk parameters: Estimation, validation and stress testing. Bernd Engelmann and Robert Rauhmeier (Editors). Berlin Heidelberg: Springer. Fair Isaac Corporation. 2002. VISA Desjardins technical review. Document confidentiel. Montral. Fisher, R. A. 1936. The use of multiple measurements in taxonomie problems. Annals of Eugenics, no 7, p. 179-188. Greene, W. II. 1992. <<A statistica1 model for credit scoring. Paper. New York University. Hand, D. J. et W. E. Henley. 1997. Statistical Classification Methods in Consumer Credit Scoring: A Review. Journal ofthe Royal Statistical Society. Vol. 160, No. 3, p. 523-541. Harrell, F. E. 2001. Regression modeling strategies. New York: Springer. Hayden, E. 2006. Estimation of a rating model for corporate exposures. In The Basel Il Risk Parameters. Bernd Engelmann and Robert Rauhmeier (Editors), p. 13-24. Berlin Heidelberg: Springer. Hayden, E. et D. Porath. 2006. Statistical methods to develop rating models. In The Basel II Risk Parameters. Bernd Engelmann and Robert Rauhmeier (Editors), p. 1-12. Berlin Heidelberg: Springer. Hosmer, D. W. et S. Lemeshow. 2000. <<Applied Logistic Regression. John Wiley & Sons (Editors). Second Edition, Wiley Inter-Science. Johnston, 1. et 1. Dinardo. 1997. Econometries methods. Lucille Sulton and Curt Berkowitz (Editors). Fourth Edition, McGraw-Hill. 64 Klapper, L. F. et E. Krauss. 2002. The Information Infrastructure of South Africa. Mimeo, World Banle Leonard, K. 1. 1996. Information systems and benchmarking the credit scoring industry. Benchmarkingfor Quality Management & Technology, vol. 3, no l, p. 38-44. Medema, L., R. Koning et R. Lensink. 2007. <tA practical approach to validating a PD model. Discussion paper, University of Groningen. Porath, D. 2006. Scoring models for retai! exposures. In The Basel II Risk Parameters. Bemd Engelmann and Robert Rauhmeier (Editors), p. 26-37. Berlin Heidelberg: Springer. Schreiner, M. 2000. Credit Scoring for Microfinance: Can It Work? Journal of Microfinance, vol. 2, no. 2, p. 105-118. Straka, J. W. 2000. <tA shift in the mortgage landscape: The 1990s move to automated credit evaluations. Journal ofHousing Research, vol. 11, no 2, p. 207-232. Thomas, L. C. 2000. <tA survey of credit and behavioural scoring: Forecasting financial risk of lending to consumers. International Journal ofForecasting, no 16, p. 149-72. Thomas, L. C. 2003. Consumer Credit Modelling: Context and CUITent Issues. Paper. University of Soutliliampton. Thoroval, P.-y. et A. Duchateau. 2003. Stabilit financire et nouvel accord de Ble. Revue de la stabilit financire, Banque de France, no 3, p. 53-67.