Documente Academic
Documente Profesional
Documente Cultură
Le processus d'ETL
2014-2015 -- O. Boussaid
2014-2015 -- O. Boussaid
27/11/14
Construction d'un ED
Aprs avoir conu le modle des donnes, comment
alimenter l'ED ?
Processus d'ETL
( Extracting Transforming Loading )
2014-2015 -- O. Boussaid
Alimenter un ED
Le principe de l'entreposage des donnes est de
rassembler de multiples donnes sources qui souvent
sont htrognes en les rendant homognes afin de
les analyser.
Ce travail d'homoginisation ncessite des rgles
prcises servant de dictionnaire (ou de rfrentiel) et
qui seront mmorises sous forme de mtadonnes
(information sur les donnes).
Ces rgles permettent d'assurer des tches
d'administration et de gestion des donns entreposes.
4
2014-2015 -- O. Boussaid
27/11/14
2014-2015 -- O. Boussaid
vde charger les donnes dans un entrept de donnes dans et/ou les
propager vers les data-marts.
2014-2015 -- O. Boussaid
27/11/14
Le processus d'ETL
L'alimentation d'un ED est un processus qui s'effectue en plusieurs
tapes :
2014-2015 -- O. Boussaid
27/11/14
2014-2015 -- O. Boussaid
27/11/14
11
12
2014-2015 -- O. Boussaid
27/11/14
13
14
donnes cibles
m, f
m, f
m, f
Donns sources
Appli 1 : $150,000
Appli 2 : 16 000
Appli 3 : 200.000
donnes cibles
2014-2015 -- O. Boussaid
27/11/14
2014-2015 -- O. Boussaid
15
Transformation (suite)
q L'ensemble des donnes sources, aprs nettoyage ou
16
2014-2015 -- O. Boussaid
27/11/14
2014-2015 -- O. Boussaid
17
Alimenter un ED
Le dictionnaire (ou rfrentiel) de donnes est constitu de
l'ensemble des mtadonnes.
de l'ED.
18
2014-2015 -- O. Boussaid
27/11/14
2014-2015 -- O. Boussaid
19
2014-2015 -- O. Boussaid
10
27/11/14
21
2014-2015 -- O. Boussaid
11
27/11/14
23
Administration d'un ED
L'ED est un aspect physique du SI de l'entreprise. Il doit tre par consquent
volutif. Les donnes doivent donc changer. On doit procder d'autres
alimentations et donc grer l'actualisation des donnes.
Il existe des outils qui prennent en charge les tches de rafrachissement des
donnes.
Ils procdent par rplication pour propager les maj effectues dans les BD
sources, dans l'ED.
ou
2014-2015 -- O. Boussaid
12
27/11/14
@ Les requtes portent plus souvent sur les agrgats que sur les donnes de base
(80% - 20%)
2014-2015
--
O.
Boussaid
25
2014-2015 -- O. Boussaid
13
27/11/14
Rles et responsabilits
Kimball (2004) a dfinit 8 rles dont les plus sont :
1.Gestionnaire ETL
Grer quotidiennement l'quipe ETL.
Dfinir les standards et procdures de l'environnement de dveloppement ETL
(Rgles de nomenclature, Meilleures pratiques)
2.Architecte ETL
27
3. Dveloppeur ETL
Dvelopper les routines ETL.
Tester les routines ETL.
S'assurer que les rsultats du processus ETL rpondent aux besoins d'affaire
(Collaboration troite avec l'architecte ETL)
4. Analyste systme
Rassembler des besoins d'affaire.
Documenter les besoins d'affaire.
Travailler en collaboration avec toute l'quipe du DW (Non seulement celle du
systme ETL).
28
2014-2015 -- O. Boussaid
14
27/11/14
6.DBA
Installer, configurer, migrer et maintenir la base de donnes.
Traduire le modle logique de donnes en modle physique.
2014-2015 -- O. Boussaid
29
ETL ou ELT
La
dirence
entre
les
2
approches
est
dans
les
mthodes
d'alimenta>on
des
entrepts
de
donnes.
2014-2015 -- O. Boussaid
15