Documente Academic
Documente Profesional
Documente Cultură
1. OLTP et OLAP
Appli. Appli. Appli. Reports & Analysis
OLAP
ETL
OLTP
DW
DM
Aides la dcision
Introduction DW
Explosion de l OLAP
Facteurs conomiques & technologiques
18 16
CA en Milliards de $
Introduction DW
accder toutes les donnes de lentreprise regrouper les informations dissmines analyser et prendre des dcisions rapidement (OLAP) Grande distribution : marketing, maintenance, ...
Introduction DW
Datawarehouse : dfinition
Entrept de donnes
Ensemble de donnes historises variant dans le temps, organis par sujets, consolid dans une base de donnes unique, gr dans un environnement de stockage particulier, aidant la prise de dcision dans lentreprise. collecte de donnes de bases existantes et chargement gestion des donnes dans lentrept analyse de donnes pour la prise de dcision
Introduction DW
Architecture type
Introduction DW
2. Concevoir le DW
Export de donnes des sources
Conception DW
Exemple: ventes Exemple: Ventes (N, produit, priode, magasin, ) Exemple: Produits(IDprod, description, couleur, taille, ) Magasins(IDmag, nom, ville, dept, pays) Periodes(IDper, anne, trimestre, mois, jour)
Conception DW
Schmas en toile
Une table de faits encadres par N tables de dimensions Produits
Periodes
IDper anne trimestre mois jour
Magasins
IDmag nom ville dpartement pays
Conception DW
Schmas en flocons
Raffinement du schma toile avec des tables normalises par dimensions Produits Fournisseurs
IDprod description couleur taille IDfour IDfour description type Adresse
Ventes Avantages
vite les redondances Conduit aux constellations (plusieurs tables de faits dimensions partages)
Conception DW
Intgrer l'ensemble
(constellation dtoiles)
Conception DW
Bilan conception
Le datawarehouse regroupe, historise, rsume les donnes de l'entreprise Le concepteur dfinit schma exports et intgrs
Conception DW
3. Alimenter le DW
ETL = Extracteur+Intgrateur
Extraction
Push = rgles (triggers) Pull = requtes (queries) Dater ou marquer les donnes envoyes Ne pas perturber les applications OLTP
Priodique et rpte
Difficult
L'alimentation
Transformation
Accs unifis aux donnes
Traduction de fichiers, BD rseaux, annuaires en tables Evolution vers XML (modle d'change) plus riche Rowset, SQL limit, SQL complet,
Appeler pareil les mmes choses et diffremment les choses diffrentes Application des "business rules"
Data Cleaning
Valeurs manquantes (nulles)
Ignorer le tuple Remplacer par une valeur fixe ou par la moyenne Gnres en prsence de bruits Dtecter par une analyse de voisinage
Chargement
Pas de mise jour
Insertion de nouvelles donnes Archivage de donnes anciennes Priodicit parfois longue Chargement en blocs (bulk load) Mise jour des index et rsums
Cohabitation avec l'OLAP ? Procdures de reprises ?
De gros volumes
Problmes
L'alimentation
4. Grer l'entrept
Base relationnelle
Support de larges volumes (qq 100 gigas qq tras) Historisation des donnes (fentres) Importance des agrgats et chargements en blocs
Base multidimensionnelle Combinaison des deux Multiprocesseurs Mmoire partage, cluster, bus partag, etc.
Base spcialise
Le multidimensionnel
Le multidimensionnel
Dimensions:
Indicateurs:
Le multidimensionnel
Cube de donnes
Date
NumFou
NumPro
2000 250
200
F1
F2
P1
Le multidimensionnel
P2
P3
Variables analyses: Nb units, CA, marge... Axe d'analyse: Les produits (classe, produit) Axe d'analyse: Le temps (Anne, trimestre, mois, semaine) Le multidimensionnel Axes d'analyse: dimensions Variables analyses: indicateurs
Mois
Trimestres
Annes
Gographie
Villes
Rgions
Pays
Produits
Le multidimensionnel
Numros
Types
Gammes
Marques
Exemple
Montant des ventes fonction de (Mois, rgion, Produit)
Granularit des dimensions : Type Rgion Anne Trimestre Mois Semaine Jour
Catgorie Pays
Produit
Produit
Ville
Magasin
Mois
Le multidimensionnel
La navigation multidimensionnelle
Projection en 2 dimensions
Produits
Coupe d un cube
Produits pour une rgion donne
CA
Rgion
CA
Temps en semaines
CA
Temps en mois
Est Lyon
Sud
Ouest Nice
Marseille
Le multidimensionnel
Semaine Mois
Drill down :
Mois Semaine
Slice et Dice:
Pivot :
(Rgion,Produit)(Rgion, Mois)
Le multidimensionnel
NumPro
Le multidimensionnel
NumFou
Date
Extension de SQL
ROLLUP:
CUBE:
Cre 2n combinaisons d'agrgats, n tant le nombre de colonne de groupage n, n-1, n-2,0 colonnes
Implmentation
Exemple CUBE
Animal Chien Chat Tortue Chien Chat Chien Tortue Lieu Paris Paris Rome Rome Naples Naples Naples Quantite 12 18 4 14 9 5 1
SELECT Animal, Lieu, SUM(Quantite) as Quantite FROM Animaux GROUP BY Animal, Magasin WITH CUBE
Implmentation
Animal Chat Chat Chat Chien Chien Chien Chien Tortue Tortue Tortue -
Lieu Paris Naples Paris Naples Rome Naples Rome Paris Naples Rome
Quantite 18 9 27 12 5 14 31 1 4 5 63 30 15 18
Exemple ROLLUP
Animal Chien Chat Tortue Chien Chat Chien Tortue Lieu Paris Paris Rome Rome Naples Naples Naples Quantite 12 18 4 14 9 5 1
SELECT Animal, Lieu, SUM(Quantite) as Quantite FROM Animaux GROUP BY Animal,Magasin WITH ROLLUP
Implmentation
Animal Chat Chat Chat Chien Chien Chien Chien Tortue Tortue Tortue -
Quantite 18 9 27 12 5 14 31 1 4 5 63
Cognos
Business Object
Hyperion
Implmentation
6. Le march du BI
BI= Business Intelligence
Conclusion
Datamart
Datamining
Datacube
Datawebhouse
Conclusion