Introduction l!Informatique Dcisionnelle et la Business Intelligence (1)
Bernard ESPINASSE Professeur Aix-Marseille Universit (AMU) Ecole Polytechnique Universitaire de Marseille
Septembre 2013
Emergence de l!Informatique Dcisionnelle et la Business Intelligence Problmatique de l!ID Les outils de l!ID Un exemple de l!ID dans l!entreprise : la relation client
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 2
1. Emergence de l!Informatique Dcisionnelle (ID) / Business Intelligence (BI) 2. Des SI oprationnels aux SI dcisionnels 3. Les outils de l!ID/BI 4. Un exemple de l!ID/BI dans l!entreprise : la relation client
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 3
1 11 E EEm mme eer rrg gge een nnc cce ee d dde ee l ll! !!I IIn nnf ffo oor rrm mma aat tti iiq qqu uue ee D DD c cci iis ssi iio oon nnn nne eel lll lle ee ( ((I IID DD) )) / // B BBu uus ssi iin nne ees sss ss I IIn nnt tte eel lll lli iig gge een nnc cce ee ( ((B BBI II) ))
! Contextes conomique et informationnel actuel ! Pilotage de l!entreprise et ID ! Historique de l!ID ! Problmatique de l!ID ! Domaines d!application de l!ID
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 4 Contexte conomique : ! Mondialisation de l'conomie, ouverture de nouveaux marchs ! Concurrence toujours plus accrue ! Besoin d!informations pour prises de dcisions de plus en plus rapides Contexte informationnel : ! Dcentralisation des donnes vers les utilisateurs ! Difficult d'accs l'information qui est en trop grande quantit ! Un enjeu stratgique d!entreprise ! Les informations, une source de revenu et de comptitivit Contexte informatique : ! Puissance de calcul croissante ! Capacit de stockage croissante ! Bases de donnes de plus en plus importantes ! SGBD de plus en plus performants (paralllisme, ) ! Ouverture sur le Web,
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 5 ! Le pilotage d!une entreprise dpend de ses objectifs stratgiques ! Ce pilotage doit prendre en considration : ! Une organisation de plus en plus oriente clients ! Des cycles conception/fabrication de plus en plus courts ! De nouveau canaux de distribution notamment les ventes en ligne sur le Web ! L!exigence d!internationalisation ! ! Dans ce contexte l!entreprise se doit : ! d!anticiper les besoins des client, ! de contrler l!intgrit et la qualit des flux de gestion ! d!valuer la performance des diffrentes entits la composant !
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 6 Outils d!analyse : ! pour constituer et mettre jour partir de diverses sources des rservoirs de grande quantits de donnes historises et multidimensionnelles, ! pour extraire selon divers critres des sous ensembles de donnes de tels rservoirs ! pour analyser ces donnes selon diffrents axes (OLAP), d!identifier des tendances, des corrlations, faire de la prvision (Data Mining) Outils de veille stratgique, de recherche d!information (RI) : ! issus de l!intelligence conomique (Competitive Intelligence), ces outils ont pour finalit de recueillir des informations sur le march et la concurrence ! collecter sur le Web d!importante quantit de donnes, les filtrer et en extraire les informations pertinentes (Web Mining) pour les analyser ensuite => Outils relevant de l!Informatique Dcisionnelle (ID) ou Business Intelligence (BI),
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 7 L!Informatique Dcisionnelle (ID), en anglais Business Intelligence (BI), est l'informatique l'usage des dcideurs et des dirigeants des entreprises Les systmes de ID/BI sont utiliss par les dcideurs pour obtenir une connaissance approfondie de l'entreprise et de dfinir et de soutenir leurs stratgies d'affaires, par exemple : ! d!acqurir un avantage concurrentiel, ! d!amliorer la performance de l!entreprise, ! de rpondre plus rapidement aux changements, ! d!augmenter la rentabilit, et ! d!une faon gnrale la cration de valeur ajoute de l'entreprise.
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 8 Annes 70-90 : dbuts de l!Informatique Dcisionnelle : ! Dveloppement d'outils d'dition de rapports, de statistiques, exploitant les BD oprationnelles ! Dveloppement de petits systmes d!aide la dcision base de tableurs (simulation budgtaire, ) ! Dveloppement de systmes experts (IA) systmes base de rgles, conus par extraction de la connaissance d'un ou plusieurs experts : intrts et rsultats limits ! Dveloppement de systmes spcifiques d'aide la dcision : bass sur des techniques de Recherche Oprationnelle (RO), la simulation, l!optimisation, => Systmes en gnral mal intgrs au SI oprationnel
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 9 Annes 90 - 2000 : essor de l!informatique dcisionnelle : ! Technologie informatique permettant le dveloppement d!Entrepts de Donnes (Data Warehouse) ! Nouveaux algorithmes : ! souvent issus des statistiques et de l!IA, permettant d'extraire des informations partir de donnes brutes ! permettant l!extraction d'informations nouvelles ou caches, de connaissances partir de donnes ! regroups dans des logiciels de Fouille de donnes (Data Mining) ! Donnes issues du Web : Recherche d!Information (RI) et Fouille de donnes sur le Web ( Web Mining )
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 10 La ID/BI est un ensemble de processus, d'outils et de technologies pour transformer les donnes de l'entreprise en informations exactes et jour pour soutenir des processus dcisionnels: ! Data Warehousing (DW) ! On-Line Analytical Processing (OLAP) ! Data Mining (DM) et visualisation de donnes (VIS) ! Analyse des dcisions (what-if) ! Customer Relationship Management (CRM) La ID/BI peut tre considre comme l!oppos de l'Intelligence Artificielle (IA) : ! les systmes d'IA prennent des dcisions pour les utilisateurs ! les systmes de BI permettent aux utilisateurs de prendre les bonnes dcisions sur la base des donnes disponibles ! mais de nombreuses techniques de BI ont leurs racines dans l!IA.
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 11
J. Gamper, Free University of Bolzano, DWDM 2012/13 10 !"# %& '()*+,- OPERATONAL APPLCATONS data sources OLAP ANALYSS data warehouse NFORMATON EXPLORATON statistical techniques DATA MNNG learning models WHAT-F ANALYSS simulation models decisions data information knowIedge
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 12
! Q1: Le 11 Octobre 2013, trouver les 5 produits les plus vendus pour chaque sous-catgorie de produits qui reprsente plus de 20% des ventes dans sa catgorie de produits
! Q2: En date du 15 Dcembre 2012, dterminer la priorit d'expdition (shipping priority) et de revenu brut potentiel (potential gross revenue) des commandes qui ont les 10 plus grandes recettes brutes (largest gross revenues) parmi les commandes qui n'avaient pas encore t expdies. On ne considre seulement que les commandes du segment du march du livre.
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 13 Selon Meta Group : DW seul = 15 billion de $ en 2000 Selon Palo Alto Management Group : BI = $ 113 billion de $ en 2002 Le Web rend l!ID/ BI encore plus ncessaire : ! Les clients ne sont pas physiquement dans le magasin ! Les clients peuvent changer d'autres magasins plus facilement ! Comment connatre ses clients : Analyser les Web log pour analyser le comportement des clients sur le site Combiner ces donnes Web avec les donnes traditionnelles des clients Internet sans fil ajoute cela : ! Les clients sont toujours "en ligne" ! La position de la clientle est connue ! Combiner la position et la connaissance sur le client => trs utile
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 14 Selon une tude du Gartner Group en 2009 : Les entreprises rechercheront de plus en plus des cadres qui auront en charge l!ID/BI et la gestion de la performance pour contribuer la transformation et l!amlioration de leurs affaires Jusqu'en 2012, par d!outils de ID/BI plus de 35% des 5000 principales entreprises mondiales ont rgulirement chou dans la prise de dcisions cruciales concernant leurs marchs et leurs affaires En 2010, 20% des entreprises auront une application analytique spcifique de ID/BI En 2009, la prise de dcision collaborative va s'imposer et ncessiter la combinaison d!outils de ID/BI et de logiciels sociaux Pour S. Chaudhuri, U. Dayal, V. Narasayya [CACM 2011]: Aujourd'hui, il est difficile de trouver une entreprise prospre qui n'a pas d!effet de levier technologie ID/BI pour leurs affaires
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 15 Modles de BD oprationnelles complexes et inutilisables : ! souvent difficiles comprendre ! ne concerne pas un objectif unique d!affaire Donnes des BD oprationnelles : ! identiques dans diffrentes BD ! mme concept souvent dfini diffremment ! adaptes pour les systmes oprationnels (comptabilit, facturation, ), pas pour l'analyse des fonctions d'affaires ! de qualit mauvaise : donnes manquantes, donnes imprcises, ! volatiles : elles sont supprimes priodiquement dans les systmes oprationnels (6 mois) la modification des donnes au fil du temps - aucune information historique
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 16
Termes anglais Termes franais Business Intelligence (BI) Informatique Dcisionnelle (ID) Decision Support Systems (DSS) Systmes d!aide la dcision (SIAD) Competitive Intelligence (CI) Intelligence Economique (IE) Data Warehouse (DW) Entrept de donnes (ED) On-Line Analytical Processing (OLAP) Analyse en ligne de donnes Knowledge Discovery in databases (KDD) Extraction de Connaissances dans les donnes Data Mining (DM) fouille de donnes, orpaillage Customer Relationship Management (CRM) Gestion de la Relation Client
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 17 ! Domaines concerns : ! commercial, financier, transport, tlcommunications, sant, services, ... ! Applications : ! gestion de la relation client ! gestion de commandes, de stocks ! prvisions de ventes ! dfinition de profil utilisateur ! analyse de transactions bancaires ! dtection de fraudes !
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 18
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 19
2 22 D DDe ees ss S SSI II o oop pp r rra aat tti iio oon nnn nne eel lls ss a aau uux xx S SSI II d dd c cci iis ssi iio oon nnn nne eel lls ss
! Systmes d!information oprationnels : traitement en ligne des donnes (OLTP) ! Nouveaux besoins : du traitement en ligne des donnes leur analyse en ligne (OLAP) ! Des SI Oprationnels aux SI Dcisionnels
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 20 ! Supportent en gnral une ou plusieurs grandes fonctions de l!entreprise (production, marketing, commercial, ressources humaines, finance, comptabilit, recherche, ) ! Parfois intgrs dans un ERP, ils s!appuient sur des SGBD traditionnels (Oracle, DB2, ) pour grer des BD oprationnelles ou de production (Mega- Giga octets) ! Permettent des processus de traitement en ligne des donnes OLTP (On line Transactionnal Processing) : Interactifs, Concurrents, Nombreux, Rptitifs, Structurs, Simples ! Ces processus OLTP concernent : ! La mise jour de donnes ! Un nombre restreint d!enregistrements ! Des donnes prcises et jour
Exemple : un supermarch ENREGISTRANT ses ventes
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 21 Pour prendre de bonnes dcisions , on doit pouvoir accder en temps rel aux donnes de l'entreprise, traiter ces donnes, extraire l'information pertinente de ces donnes, par exemple pour savoir : ! Quels sont les rsultats des ventes par gamme de produit et par rgion pour l'anne dernire ? ! Quelle est l'volution des chiffres d'affaires par type de magasin et par priode ? ! Comment qualifier les acheteurs de mon produit X ? Nouvelles attentes des SI : ! Considrer des quantits de donnes historises de plus en plus importantes (Tera, Penta octets), organises selon diffrentes dimensions (temps, espace gographique, gammes de produit, ) ! Passer du traitement en ligne des donnes (OLTP) l!analyse en ligne de ces donnes (On Line Analysis Processing - OLAP) selon diffrentes dimensions pour procder des analyses de ces donnes pour construire des indicateurs indispensables au pilotage de l!entreprise
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 22 L!informatique oprationnelle ne peut satisfaire ces besoins : ! BD oprationnelles trop complexes pour tre apprhendes facilement par tout utilisateur dcideur ! SI oprationnel ne peut tre interrompu pour rpondre des questions ncessitant des calculs importants ! Processus d!entreposage des donnes mal adapt ! Analyse en ligne des donnes trs limite
=> recours l!ID pour l!laboration de SI Dcisionnels
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 23
3 33 L LLe ees ss o oou uut tti iil lls ss d dde ee l ll! !!i iin nnf ffo oor rrm mma aat tti iiq qqu uue ee d dd c cci iis ssi iio oon nnn nne eel lll lle ee
! Entrept de donnes ! Analyse en ligne (OLAP) ! Fouille de donnes ! Architecture multi-niveaux
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 24 Entrept de donnes (Data Warehouse) : ! Il rcolte, stocke et gre efficace des gros volumes de donnes pour la prise de dcision ! Il assure un regroupement homogne et exploitable de donnes htrognes, trs nombreuses et distribues Analyse en ligne des donnes OLAP (On Line Analytical processing) : ! donnes organises selon plusieurs axes d!analyse et selon diffrents niveaux de dtail ! traitements permettant interactivement de changer de points de vue, de de niveau de dtail, et effectuer les oprations OLTP classiques Fouille de donnes (Data Mining): ! extraction automatique de connaissances (proprits caches) dans de grands volumes de donnes : ! connaissances valides, nouvelles, comprhensibles, pertinentes et implicites
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 25 Dfinition de Inmon (1992) : une collection de donnes thmatiques, intgres, non volatiles et historises, organises pour le support d'un processus d'aide la dcision Donnes : thmatiques : donnes pertinentes pour un sujet ou thme et ncessaire aux besoins d!analyse intgres : donnes rsultant de l!intgration de donnes provenant de diffrentes sources pouvant tre htrognes historises : donnes reprsentent l!activit d!une entreprise durant une certaine priode (plusieurs annes) non-volatiles : donnes essentiellement utilises en interrogation (consultation) et ne peuvent pas tre modifies
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 26 Caractristiques des processus d!analyse en ligne OLAP : ! Interactifs ! Concurrents ! Peu nombreux ! Non prvisibles ! Complexes Les processus OLAP concernent : ! L!exploitation des donnes ! Un nombre d!enregistrement trs important ! Des donnes consolides et synthtiques ! Exploration et analyse de donnes historiques !
Exemple : un supermarch ANALYSANT l!ensemble de ses ventes
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 27
Caractristiques OLTP OLAP Conception Orientation Transaction Analyse Conception Entit-Relation Star/snowflake Donnes Granularit Dtail Rsumes, agrges Nature Relationnelle Multidimentionnelle Actualisation Actualises, mises jour Historises, recalcules Taille 100 Mo/Go 100 Go/To Traitements Unit de travail Transaction simple Requte complexe Accs Lecture/criture Lecture Nb de tuples accds Dizaines Millions Mtrique Dbit de transactions Temps de rponse Utilisateurs Utilisateur Agent oprationnel Analyste/dcideur Nombre d!utilisateurs Milliers Centaines
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 28 ! recherche de la connaissance sous forme de modles de comportement cach dans les donnes : Extraction de connaissance partir de donnes (Knowledge Discovery in Database - KDD) ! domaine jeune l!intersection de l!Intelligence artificielle (IA) , les statistique, l!analyse de donnes, et les BD ! techniques de fouille traditionnelles : issues des statistiques et de l!analyse de donnes ! nouvelles techniques de fouille : l!induction d!arbre de dcision, les algorithmes gntiques, les rseaux de neurones, ! tendance une intgration croissante de ces techniques de fouille dans les entrepts de donnes (notamment dans l!offre commerciale)
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 29 0 Sources externes 1 Entrept 2 OLAP 3 Front-ends BD SGBDR BD Relationnelle tableur Fichiers HTML BD Data Mining (fouille de donnes) Fichiers plats Multidimensionnelle Outils statistiques Combinaison des 2
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 30
4 44 U UUn nn e eex xxe eem mmp ppl lle ee d dde ee l ll! !!I IID DD d dda aan nns ss l ll! !!e een nnt ttr rre eep ppr rri iis sse ee : :: l lla aa r rre eel lla aat tti iio oon nn c ccl lli iie een nnt tt
! Contexte conomique gnral ! la Gestion de la Relation Client ! ID/BI pour la Gestion de la Relation Client
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 31
Evolution historique gnrale :
! Annes 40: pr-industrialisation ! Annes 50 et 60: production de masse ! Annes 70: optimisation de la production ! Annes 80: gestion de la qualit ! Annes 90: gestion du client ! 2000: intensification de la tendance client (Marketing One to One, customisation, services personnaliss, )
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 32 Dans un climat de concurrence mondiale tendu : ! Conqurir un nouveau client cote 5 fois plus cher que de fidliser un client existant ! 5% d'amlioration de la fidlit des clients entrane une augmentation des profits de 10 15% ! Tous les clients ne sont pas gaux : 30% des clients gnrent 70% du CA ! Le Client attend un service personnalis, sur-mesure ! La personnalisation est une source de profit
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 33 ! Gestion de la relation client (Customer Relationship Management CRM) : dmarche mergente dans les domaines du marketing et du commercial ! Afin de rpondre aux questions : ! Quels sont les besoins et les attentes des clients? Comment y rpondre? ! Quels sont les clients prts acheter de nouveaux produits? ! Quels sont les clients les plus profitables, fidles et pourquoi? ! Quels sont les clients mcontents, et pourquoi? ! Besoin de mieux connatre et comprendre ses clients pour : ! Rduire les cots (clients infidles) ! Comment augmenter les profits ? ! Comment fidliser une clientle? ! Comment identifier les nouvelles opportunits? ! Les concurrents s!attaquent certains de nos clients? => Une rponse par l!informatique dcisionnelle
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 34 Dfinition du CRM : ! capacit identifier, acqurir et fidliser les meilleurs clients dans le but d!augmenter le chiffre d!affaires et les bnfices. ! capacit btir une relation profitable sur le long terme avec les meilleurs clients en capitalisant sur l!ensemble des points de contacts ! Principales dimensions de la Gestion de la Relation Client : stratgique, temporelle et gographique
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 35 Enjeux du CRM : ! Connatre ses clients rentables et se concentrer sur les clients fort potentiel ! Augmenter la fidlit des clients ! Comprendre le comportement de ses clients ! Augmenter le panier moyen ! Diminuer les cots des programmes marketing avec un meilleur ciblage des meilleurs clients ! Adapter les produits au march ! Aider les commerciaux vendre ! Rentabiliser la BD Clients ! Mesurer les rsultats des actions CRM !
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 36
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 37
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 38
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 39
Introduction l!informatique dcisionnelle - Bernard ESPINASSE - 40
Cot du contact Client sur le Web trs faible : ! Web = un point de contact important ! En 2001, 1/3 des contacts clients provenaient d'Internet ! En 2003, Internet et les applications de commerce lectronique gnrent 60% du volume de contact des centres d'appels
Intgration du Web dans le CRM : ! e-CRM ! Web Mining !