Documente Academic
Documente Profesional
Documente Cultură
0)
Prsentation
dition MDM multidomaine Prsentation Version 9.1.0 Juin 2011 Copyright (c) 2001-2011 . Tous droits rservs. Ce logiciel et sa documentation contiennent des informations appartenant Informatica Corporation, protges par les lois sur le copyright et fournies dans le cadre dun accord de licence contenant des restrictions dutilisation et de divulgation. Toute ingnierie inverse du logiciel est interdite. Il est interdit de reproduire ou transmettre sous quelque forme et par quelque moyen que ce soit (lectronique, photocopie, enregistrement ou autre) tout ou partie de ce document sans le consentement pralable dInformatica Corporation. Ce logiciel est protg par des brevets amricains et/ou internationaux, ainsi que dautres brevets en attente. Lutilisation, la duplication ou la divulgation du Logiciel par le gouvernement amricain est sujette aux restrictions dcrites dans laccord de licence applicable du logiciel conformment aux documents DFARS 227.7202-1(a) et 227.7702-3(a) (1995), DFARS 252.227-7013(1)(ii) (OCT 1988), FAR 12.212(a) (1995), FAR 52.227-19 ou FAR 52.227-14 (ALT III) le cas chant. Les informations dans ce produit ou cette documentation sont sujettes modification sans pravis. Si vous rencontrez des problmes dans ce produit ou la documentation, veuillez nous en informer par crit. Informatica, Informatica Platform, Informatica Data Services, PowerCenter, PowerCenterRT, PowerCenter Connect, PowerCenter Data Analyzer, PowerExchange, PowerMart, Metadata Manager, Informatica Data Quality, Informatica Data Explorer, Informatica B2B Data Transformation, Informatica B2B Data Exchange, Informatica On Demand et Siperian sont des marques de commerce ou des marques dposes dInformatica Corporation aux tats-Unis et dans dautres juridictions du monde. Tous les autres noms de socit ou de produit peuvent tre des marques de commerce ou des marques dposes de leurs dtenteurs respectifs. Des portions de ce logiciel et/ou de la documentation sont sujettes au copyright dtenu par des tierces parties, dont Copyright DataDirect Technologies. Tous droits rservs. Copyright Sun Microsystems. Tous droits rservs. Ce produit contient des logiciels dvelopps par Apache Software Foundation (http://www.apache.org/) et dautres logiciels sous licence Apache License, Version 2.0 (la Licence ). Vous pouvez obtenir une copie de la Licence ladresse http://www.apache.org/licenses/ LICENSE-2.0. Sauf dispositions contraires de la loi en vigueur ou accord crit, le logiciel distribu sous cette licence est livr EN LTAT , SANS GARANTIE NI CONDITION DAUCUNE SORTE, expresse ou implicite. Se reporter la Licence pour la langue spcifique rgissant les droits et limitations dans le cadre de la Licence. Ce produit inclut les logiciels sous licence selon laccord de licence GNU Lesser General Public, disponible ladresse http://www.gnu.org/licenses/lgpl.html. Les matriaux sont fournis gratuitement par Informatica, en ltat , sans garantie daucune sorte, expresse ou implicite, notamment les garanties implicites de conformit lgale et dusage normal. Ce produit inclut les logiciels sous licence selon CDDL (la Licence ). Vous pouvez obtenir une copie de la Licence ladresse http://www.sun.com/cddl/cddl.html. Les matriaux sont fournis gratuitement par Informatica, en ltat , sans garantie daucune sorte, expresse ou implicite, notamment les garanties implicites de conformit lgale et dusage normal. Se reporter la Licence pour la langue spcifique rgissant les droits et limitations dans le cadre de la Licence. Ce produit inclut les logiciels sous licence selon la licence BSD (la Licence ). Vous pouvez obtenir une copie de la Licence ladresse http://www.opensource.org/licenses/ bsd-license.php. Les matriaux sont fournis gratuitement par Informatica, en ltat , sans garantie daucune sorte, expresse ou implicite, notamment les garanties implicites de conformit lgale et dusage normal. Se reporter la Licence pour la langue spcifique rgissant les droits et limitations dans le cadre de la Licence. Ce produit inclut les logiciels Copyright (c) 2003-2008, Terence Parr, tous droits rservs, sous licence selon la licence BSD (la Licence ). Vous pouvez obtenir une copie de la Licence ladresse http://www.antlr.org/license.html. Les matriaux sont fournis gratuitement par Informatica, en ltat , sans garantie daucune sorte, expresse ou implicite, notamment les garanties implicites de conformit lgale et dusage normal. Se reporter la Licence pour la langue spcifique rgissant les droits et limitations dans le cadre de la Licence. Ce produit inclut les logiciels Copyright (c) 2000 - 2009 The Legion Of The Bouncy Castle (http://www.bouncycastle.org) sous licence sous la forme dune licence MIT (la Licence ). Vous pouvez obtenir une copie de la Licence ladresse http://www.bouncycastle.org/licence.html. Les matriaux sont fournis gratuitement par Informatica, en ltat , sans garantie daucune sorte, expresse ou implicite, notamment les garanties implicites de conformit lgale et dusage normal. Se reporter la Licence pour la langue spcifique rgissant les droits et limitations dans le cadre de la Licence. EXCLUSION DE RESPONSABILIT : Informatica Corporation fournit cette documentation en ltat sans garantie daucune sorte, expresse ou implicite, notamment les garanties implicites de non-infraction, de conformit lgale ou dusage normal. Informatica Corporation ne garantit pas que ce logiciel et cette documentation sont exempts derreurs. Les informations fournies dans ce logiciel ou cette documentation peuvent inclure des inexactitudes techniques ou des erreurs typographiques. Les informations contenues dans ce logiciel et sa documentation sont sujettes modification tout moment sans pravis. AVIS Ce produit Informatica (le Logiciel ) peut inclure certains pilotes (les Pilotes DataDirect ) de DataDirect Technologies, une socit dexploitation de Progress Software. Corporation (DataDirect) soumise aux conditions et termes suivants : 1. LES PILOTES DATADIRECT SONT FOURNIS EN LTAT , SANS GARANTIE DAUCUNE SORTE, EXPRESSE OU IMPLICITE, NOTAMMENT LES GARANTIES IMPLICITES DE CONFORMIT LGALE, DUSAGE NORMAL ET DE NON-INFRACTION. 2. DATADIRECT OU SES FOURNISSEURS TIERS NE POURRONT EN AUCUN CAS TRE TENUS RESPONSABLES ENVERS LE CLIENT UTILISATEUR FINAL DE TOUT DOMMAGE DIRECT, ACCESSOIRE, INDIRECT, SPCIAL, CONSCUTIF OU AUTRE RSULTANT DE LUTILISATION DES PILOTES ODBC, QUILS SOIENT INFORMS OU NON LAVANCE DE LA POSSIBILIT DE TELS DOMMAGES. CES LIMITATIONS SAPPLIQUENT TOUTES LES CAUSES DACTION, NOTAMMENT TOUTE INFRACTION AU CONTRAT, INFRACTION LA GARANTIE, NGLIGENCE, RESPONSABILIT STRICTE, REPRSENTATION INCORRECTE ET AUTRES TORTS. Numro de rfrence : MDM-OVG-91000-0001
Sommaire
Prface. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
En savoir plus sur lInformatica MDM Hub. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii Ressources Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Portail des clients Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Documentation Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Site Web Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Bibliothque de procdures Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Base de connaissances Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Base de connaissances multimdia Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi Support client international Informatica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Sommaire
Traitement par lots et en temps rel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Flux des processus de lots. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Flux de processus en temps rel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Traitement par lots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Processus de liaison. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Processus d'activation de donnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Processus de chargement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Processus de marquage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Processus de correspondance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Processus de consolidation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Processus de publication. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Traitement en temps rel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Bases de donnes dans le Stockage Hub. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Mtadonnes de contenu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Objets de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Tables des rfrences (XREF). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Tables d'historique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Intgration de workflow et gestion d'tat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Gestion des hirarchies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Relations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Hirarchies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Entits. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Index. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
ii
Sommaire
Prface
Bienvenue dans la Prsentation de Informatica MDM Hub Ce document propose une prsentation de la suite de produits de Informatica MDM Hub, dcrit l'architecture des produits et dfinit les concepts cls comprendre pour utiliser le Informatica MDM Hub dans votre entreprise. Ce document est conu pour prsenter des concepts importants de Informatica MDM Hub tout utilisateur prenant part l'implmentation de Informatica MDM Hub. Ce document s'adresse principalement aux personnes charges de la gestion, l'implmentation ou l'utilisation de Informatica MDM Hub dans une entreprise. Son public comprend (mais n'est pas limit ) les chefs de projets, les installateurs, les dveloppeurs, les administrateurs, les intgrateurs de systmes, les administrateurs de bases de donnes, les gestionnaires des donnes et autres spcialistes techniques associs une implmentation Informatica MDM Hub. L'objectif de ce document est de fournir aux utilisateurs une comprhension parfaite succincte mais complte de la suite de produits, avec les instructions pour les guider dans la documentation des produits et leur permettre de trouver plus d'informations sur des sujets prcis.
iii
iv
Prface
Pour tout renseignement sur les cours de formation ou pour connatre le lieu et la date de la prochaine sance de formation, veuillez visiter le site Web dInformatica (http://www.informatica.com) ou contacter directement Informatica.
Ressources Informatica
Portail des clients Informatica
En tant que client Informatica, vous avez accs au portail des clients Informatica sur http://mysupport.informatica.com Ce site contient des informations sur les produits et les groupes dutilisateurs, des bulletins dinformation, un lien vers le systme de gestion des dossiers dassistance la client dInformatica (ATLAS), une bibliothque de procdures Informatica, une base de connaissances Informatica, une base de connaissances multimdia Informatica, ainsi que la documentation ncessaire sur les produits Informatica et laccs sa communaut dutilisateurs.
Documentation Informatica
Lquipe Documentation dInformatica sefforce de fournir une documentation prcise et utilisable. Nhsitez pas contacter lquipe Documentation dInformatica par courriel ladresse infa_documentation@informatica.com pour lui faire part de vos questions, commentaires ou suggestions concernant cette documentation. Ces commentaires et suggestions nous permettront damliorer notre documentation. Veuillez prciser si vous acceptez dtre contact au sujet de ces commentaires. Lquipe Documentation met jour la documentation chaque fois que ncessaire. Pour obtenir la toute dernire version de la documentation concernant votre produit, consultez la Documentation de produit sur http://mysupport.informatica.com.
Prface
Base de connaissances Informatica par courriel ladresse KB_Feedback@informatica.com pour lui faire part de vos questions, commentaires et suggestions concernant la base de connaissances.
Tarif standard France : 0805 804632 Allemagne : 01805 702702 Pays-Bas : 030 6022 797
vi
Prface
CHAPITRE 1
Enfin, MDM est dploy dans le cadre d'un programme plus vaste de gouvernance des donnes qui implique une combinaison de technologie, personnel, stratgie et processus.
Les entreprises implmentent des solutions de gestion des donnes principales pour amliorer les procdures de gestion et de fiabilit des donnes. Les contrles stricts des donnes impliquent une comprhension parfaite des nombreuses entits de donnes qui existent dans l'entreprise, les processus de gestion des donnes et les pratiques d'excellence, ainsi que l'accs scuris l'utilisation des donnes.
Les entreprises implmentent les solutions de gestion des donnes principales pour atteindre les objectifs suivants :
Conformit aux rglements, les exigences de protection des donnes et de rapports financiers, par exemple. conomies de cots en rationalisant les processus d'entreprise, en consolidant les licences de logiciels et en
rduisant les cots associs l'administration des donnes, au dveloppement des applications, au nettoyage des donnes, aux fournisseurs de donnes tiers et aux cots d'investissement.
Amliorations de la productivit dans l'entreprise en rduisant les donnes dupliques, imprcises et de
mauvaise qualit, en aidant recentrer les ressources sur des activits plus stratgiques ou plus lucratives.
Augmentation des revenus en amliorant la transparence et l'accs aux donnes clients prcises, entranant
ainsi une augmentation des revenus pour les campagnes de marketing et de meilleures opportunits pour la vente croise et incitative aux clients et aux prospects.
Objectifs stratgiques, tels que la fidlisation et la rtention des clients, l'excellence de la chane
d'approvisionnement, le sourage stratgique et la passation des marchs, l'expansion gographique et l'efficacit du marketing.
Souple
Fonctionnalits de base
La figure suivante illustre une prsentation gnrale des fonctionnalits de base de Informatica MDM Hub.
mesure que les donnes arrivent sur le hub, il est frquent qu'elles ne soient pas normalises. Cette normalisation comprend les corrections de noms (par exemple, Mike en Michael), normalisations d'adresses (par exemple, 123 Elm St., NY NY en 123 Elm Street, New York, NY), ainsi que les modifications de donnes (un modle de donnes en un autre). Les donnes peuvent tre amliores ou optimises l'aide de donnes provenant de fournisseurs de donnes tiers tels que D&B et Acxiom. Informatica MDM Hub propose une intgration prte l'emploi avec des fournisseurs de donnes tiers majeurs au sein de son interface utilisateur. Une fois la normalisation et l'amlioration des donnes termines, les enregistrements communs sont identifis en les faisant correspondre rapidement. Une fois les enregistrements communs identifis, vous pouvez les lier
comme style de registre ou fusionner les meilleurs attributs provenant des enregistrements correspondants pour crer la meilleure version de la vrit. Ce processus de rconciliation, obtenu l'intrieur de l'environnement d'approbation Informatica et rgi par des rgles d'entreprise configures, propose les meilleurs attributs provenant des systmes contributeurs. L'association du personnel et des entreprises est une condition cl pour de nombreuses organisations. Les fonctionnalits de gestion de hirarchies de Informatica MDM Hub permettent de regrouper les personnes en foyers et les socits en hirarchies d'entreprises. Informatica MDM Hub propose galement des fonctionnalits de type Interface utilisateur graphique, permettant de dfinir et de configurer des rgles d'entreprise qui affectent le mode de nettoyage, de correspondance et de fusion des donnes. Ce workflow de gestion des donnes prsente les exceptions ou correspondances non automatiques avec le gestionnaire des donnes pour la rsolution. Toutes les donnes de Informatica MDM Hub sont disponibles selon les rgles d'ligibilit en vigueur, garantissant ainsi que seuls les utilisateurs autoriss peuvent afficher ou modifier les donnes et, si ncessaire, masquer des donnes importantes (telles que les numros d'identification fiscale). Un des objectifs communs du partage des donnes dans le Informatica MDM Hub est de les synchroniser avec des systmes sources contributeurs ainsi que des systmes en aval. Informatica MDM Hub peut tre configur pour grer ces synchronisations en temps rel, en temps quasi rel ou en mode batch. Si en temps rel ou en temps quasi rel, le Informatica MDM Hub est suffisamment intelligent pour viter des retours de boucle avec le systme qui a effectu au dpart ce changement. Informatica MDM Hub peut galement agrger de manire dynamique les donnes de transactions et d'activits dans un registre central, exploitant ainsi la technologie de requte fdre intgre au hub. Ceci permet aux entreprises de stocker uniquement les donnes de rfrence dans le hub tout en fournissant l'accs toutes les donnes de transactions en temps rel. Avec une vue complte du client et de ses transactions, il est possible de configurer des vnements de notification dclenchs lors de modifications de donnes et de dmarrer un processus de workflow, un e-mail ou d'appeler un service Web. Ceci permet aux entreprises de ragir aux changements lorsqu'ils se produisent. Enfin, le Informatica MDM Hub peut tre configur pour partager des donnes l'aide de services Web prconfigurs, ou des entreprises peuvent assembler des fonctions de niveau suprieur en orchestrant plusieurs services.
CHAPITRE 2
Gre le nettoyage des donnes et contient les fonctionnalits de correspondance et de consolidation pour crer les enregistrements principaux les plus prcis. Gnre et gre les donnes dcrivant les relations entre les enregistrements principaux. galement appel HM. Contient des mcanismes de scurit complets et trs prcis pour garantir que seuls les utilisateurs authentifis et autoriss ont accs aux donnes, ressources et fonctionnalits de Informatica MDM Hub. galement appel GAS. Permet aux administrateurs de grer des mtadonnes dans leur implmentation de Informatica MDM Hub. galement appel MET.
Description Permet aux applications externes de demander des oprations de Informatica MDM Hub et d'accder aux ressources de Informatica MDM Hub l'aide d'une interface de programmation d'applications (API). galement appel SIF. Application de gouvernance de donnes qui permet aux utilisateurs professionnels de crer, de grer, d'utiliser et de contrler les donnes principales dans le Hub Informatica. galement appel IDD.
Composants de base
La figure suivante illustre les composants de base de Informatica MDM Hub :
Stockage Hub
Le Stockage Hub est l'endroit o les donnes d'entreprise sont stockes et consolides. Le Stockage Hub contient des informations communes sur toutes les bases de donnes qui font partie de l'implmentation de Informatica MDM Hub. Le Stockage Hub figure dans un environnement de serveur de base de donnes pris en charge. Le Stockage Hub contient :
tous les enregistrements principaux pour toutes les entits sur des systmes sources diffrents les mtadonnes riches et les rgles associes requises pour dterminer et mettre jour continuellement
uniquement les attributs de cellules les plus fiables dans chaque enregistrement matre
la logique des fonctions de consolidation des donnes, la fusion et l'annulation de la fusion des donnes, par
exemple
Composants de base
Concepts Configuration
Serveur Hub
Le Serveur Hub est le composant d'excution qui gre les services de base et communs de Informatica MDM Hub. Le Serveur Hub est une application J2EE, dploye dans le serveur d'applications, qui orchestre le traitement des donnes dans le Stockage Hub ainsi que l'intgration avec les applications externes. Pour en savoir plus sur le Serveur Hub, consultez la documentation suivante.
Tche Installation Rubrique(s) Installation du Serveur Hub dans le Guide dinstallation de Informatica MDM Hub applicable votre plate-forme. propos du Serveur Hub dans Installation du Serveur Hub dans le Guide dinstallation de Informatica MDM Hub Configuration du Serveur Hub dans Installation du Serveur Hub dans le Guide dinstallation de Informatica MDM Hub Guide de l'administrateur de Informatica MDM Hub
Concepts
Configuration
Le Cleanse Match Server fournit une interface aux moteurs de nettoyage pris en charge, comme dcrit dans le Guide de ladaptateur de nettoyage de Informatica MDM Hub. Le Cleanse Match Server et le moteur de nettoyage fonctionnent conjointement pour normaliser et optimiser les donnes pour la correspondance et la consolidation.
Pour en savoir plus sur les Cleanse Match Servers, voir la documentation suivante.
Tche Installation Rubrique(s) Installation du Cleanse Match Server dans le Guide dinstallation de Informatica MDM Hub applicable votre plateforme propos du Cleanse Match Server dans Installation du Cleanse Match Server dans le Guide dinstallation de Informatica MDM Hub applicable votre plate-forme Configuration des Cleanse Match Servers dans Configuration du nettoyage des donnes dans le Guide de l'administrateur de Informatica MDM Hub
Concepts
Configuration
Console Hub
La Console Hub est l'interface utilisateur de Informatica MDM Hub qui comprend un ensemble d'outils pour les administrateurs et gestionnaires de donnes. Chaque outil permet d'effectuer une action spcifique, ou un ensemble d'actions associes, telles que la gnration du modle de donnes, l'excution de tches de lots, la configuration du flux de donnes, la configuration de l'accs des applications externes aux ressources de Informatica MDM Hub, et autres tches de fonctionnement et de configuration systme. La Console Hub est livre avec l'application Serveur Hub. Elle peut tre lance sur tout ordinateur client via une URL l'aide d'un navigateur et de Java Web Start de Sun.
Remarque: Les outils disponibles dans la Console Hub dpendent de l'accord de licence Informatica. Ainsi, il se peut que votre outil Console Hub soit diffrent de la figure prcdente.
Composants de base
Configuration
Hierarchy Manager
Hierarchy Manager Informatica (HM) est bas sur Master Reference Manager. Comme son nom l'indique, Hierarchy Manager permet de grer les donnes de hirarchie associes aux enregistrements grs dans MRM. Hierarchy Manager permet de dfinir les relations hirarchiques et de grer de faon centrale les donnes de manire hirarchique. De nombreux systmes compris dans l'environnement de la gestion des donnes principales (Master Data Management - MDM) conservent les informations sur les relations entre les diffrentes entits de donnes, ainsi que des entits elles-mmes. Ces systmes distincts rendent difficile l'affichage et la gestion des donnes de relations car chaque application possde une hirarchie diffrente (client-compte, ventescompte ou produit-ventes, par exemple). Pendant ce temps, chaque entrept de donnes (et sous-ensemble d'entrept de donnes) est conu pour reflter les relations ncessaires des fins de rapports spcifiques, ventes par rgion par produit sur une priode spcifique, par exemple. Hierarchy Manager comprend deux outils dans la Console Hub :
Outil Outil de hirarchies Description Utilis par les administrateurs de Informatica MDM Hub pour configurer les structures (types d'entits, hirarchies, types de relations, packages et profils) ncessaires l'affichage et la manipulation des relations de donnes dans Hierarchy Manager. Utilis par les gestionnaires de donnes pour dfinir et grer les relations hirarchiques dans leur Stockage Hub.
Le composant d'excution de Hierarchy Manager est intgr et dploy avec l'application Serveur Hub dans l'environnement du serveur d'applications J2EE.
10
Dveloppement de l'application
Metadata Manager
Le Metadata Manager (MET) est un outil dans la Console Hub qui permet aux administrateurs de grer des mtadonnes dans leur implmentation de Informatica MDM Hub. Les mtadonnes dcrivent les diffrents composants de conception et de configuration du schma tels que les objets de base et les colonnes associes, les fonctions de nettoyage, les rgles de correspondance et les mappages dans le Stockage Hub. l'aide de Metadata Manager, les administrateurs peuvent :
Valider les mtadonnes dans un rfrentiel de Informatica MDM Hub et gnrer un rapport d'incidents
(diffrences ou problmes entre les schmas physiques et logiques) qui justifient une attention particulire.
11
Comparer les rfrentiels et gnrer des listes de modifications qui dcrivent les diffrences entre eux Copier des objets de conception depuis un rfrentiel vers un autre tel que promouvoir un objet de conception
du dveloppement vers la production, ou exporter/importer des objets de conception entre les implmentations Informatica MDM Hub. Dans un environnement de dveloppement distribu, les dveloppeurs peuvent utiliser l'outil Metadata Manager pour partager et rutiliser des objets de conception.
Exporter les mtadonnes du rfrentiel vers un fichier XML des fins d'importation ou d'archivage ultrieur. Visualiser le schma l'aide d'un affichage de modle graphique du rfrentiel.
Pour plus d'informations sur le Metadata Manager, consultez le Guide de Informatica MDM Hub Metadata Manager.
Ces fonctionnalits permettent Informatica MDM Hub de prendre en charge plusieurs modes d'accs aux donnes, de prsenter plusieurs services de donnes de Informatica MDM Hub travers le kit de dveloppement logiciel de SIF, et de gnrer des vnements en fonction des modifications dans le Hub Informatica. Ceci facilite l'intgration entrante et sortante avec les applications externes et les sources de donnes, qui peuvent tre utilises en modes synchrone et asynchrone. Pour plus d'informations sur Services Integration Framework, consultez la documentation suivante :
Tche Concepts Rubrique(s) Introduction du kit de dveloppement logiciel de SIF dans le Guide de Services Integration Framework de Informatica MDM Hub Configuration du kit de dveloppement logiciel de SIF dans le Guide de Services Integration Framework de Informatica MDM Hub Section 5, Configuration de l'accs l'application dans le Guide de l'administrateur de Informatica MDM Hub Utilisation du kit de dveloppement logiciel de SIF dans le Guide de Services Integration Framework de Informatica MDM Hub propos des oprations de Informatica MDM Hub dans le Guide de Services Integration Framework de Informatica MDM Hub Javadoc de Informatica MDM Hub
Configuration
12
Informatica Data Director permet aux gestionnaires des donnes et d'autres utilisateurs professionnels d'effectuer les oprations suivantes :
Crer des donnes principales. Travailler de manire individuelle ou collective dans diffrents secteurs
d'activit. Les utilisateurs peuvent ajouter des entits et enregistrements au Stockage Hub. Proposer des fonctionnalits telles que le nettoyage des donnes en ligne ainsi que l'identification et la rsolution des enregistrements dupliqus lors de la saisie des donnes. Informatica Data Director permet aux utilisateurs de valider, d'augmenter et d'amliorer leurs donnes principales de manire proactive.
Grer les donnes principales. Les utilisateurs peuvent approuver et grer des mises jour de donnes
principales, grer des hirarchies l'aide du glisser-dposer, rsoudre des correspondances potentielles et fusionner des doublons, ainsi que crer des tches et les attribuer d'autres utilisateurs.
Utiliser des donnes principales. Les utilisateurs peuvent rechercher toutes les donnes principales
provenant d'un emplacement central, puis afficher les dtails et hirarchies des donnes principales. Les utilisateurs peuvent galement intgrer les composants de l'interface utilisateur dans les applications d'entreprise.
Contrler les donnes principales. Les utilisateurs peuvent suivre le lignage et l'historique des donnes
principales, auditer leurs donnes principales des fins de conformit et utiliser un tableau de bord personnalisable qui leur prsente les informations les plus utiles.
13
Avec Informatica Data Director, les socits peuvent rduire le cot de qualit en grant de manire proactive les donnes, amliorer la productivit en trouvant plus rapidement des informations prcises, permettre la conformit en proposant une vue complte et cohrente des donnes et du lignage, et augmenter les revenus en agissant sur les relations des donnes principales.
14
CHAPITRE 3
Concepts cls
Ce chapitre comprend les rubriques suivantes :
Flux de donnes entrants et sortants, 15 Traitement par lots et en temps rel, 18 Traitement par lots , 19 Traitement en temps rel, 25 Bases de donnes dans le Stockage Hub, 25 Mtadonnes de contenu, 26 Intgration de workflow et gestion d'tat, 27 Gestion des hirarchies, 27
15
Dans le Informatica MDM Hub, les entits d'entreprise telles que les clients, comptes, produits ou employs sont reprsentes dans des tables appeles objets de base. Pour un objet de base donn :
Le Informatica MDM Hub obtient des donnes auprs d'un ou de plusieurs systmes sources, un systme
oprationnel ou une application tierce qui fournit des donnes Informatica MDM Hub pour le nettoyage, la correspondance, la consolidation et la maintenance. La rconciliation peut impliquer le nettoyage de donnes au pralable pour optimiser le processus de correspondance et de consolidation des enregistrements. Le nettoyage est le processus par lequel les donnes sont normalises par validation, correction, excution ou amlioration.
Une entit individuelle (telle qu'un client ou compte spcifique) peut tre reprsente par plusieurs
principal, la meilleure version de la vrit, pour chaque entit individuelle. La consolidation est le processus de fusion d'enregistrements dupliqus pour crer un enregistrement consolid qui contient les valeurs de cellules les plus fiables provenant des enregistrements sources. Par exemple, supposez que les applications de gestion de facturation, service financier et relations client possdent toutes des adresses de facturation diffrentes pour un client spcifique. Le Informatica MDM Hub peut tre configur pour dterminer quelles donnes reprsentent la meilleure version de la vrit selon la fiabilit
16
relative des donnes de la colonne provenant des systmes sources diffrents selon des facteurs tels que l'anciennet des donnes (l'achat le plus rcent du client).
Les donnes dans l'enregistrement principal peuvent provenir d'un seul enregistrement (l'adresse de facturation la plus rcente du systme de facturation, par exemple), ou elles peuvent reprsenter une combinaison des donnes provenant d'enregistrements diffrents.
Par exemple, si l'adresse de facturation d'une entreprise a chang dans le Informatica MDM Hub, ce dernier peut informer d'autres systmes de l'entreprise (via la messagerie JMS) concernant les informations mises jour pour que les donnes principales soient synchronises dans l'entreprise.
17
18
d Pour le traitement par lots, les donnes sont charges partir de systmes sources et traites dans Informatica MDM Hub travers une srie de processus.
Processus Arrive Description Transfre les donnes d'un systme source (externe Informatica MDM Hub) vers des tables d'arrive dans le stockage Hub. Partie du processus de rconciliation dcrit dans Flux de donnes entrants principal (rconciliation) la page 16. Rcupre les donnes provenant de la table d'arrive, les nettoie (le cas chant) et les copie dans une table temporaire du stockage Hub. Partie du processus de rconciliation. Charge les donnes depuis la table temporaire dans la table Stockage Hub correspondante (objet de base). Partie du processus de rconciliation.
19
Processus Marquage
Description Gnre des jetons de correspondance dans une table des cls de correspondance qui sont utiliss ensuite par le processus de correspondance pour identifier les enregistrements d'objets de base candidats pour la correspondance. Compare les points de similarit des enregistrements (selon les rgles de correspondance), dtermine si les enregistrements sont des doublons, et indique les enregistrements dupliqus pour la consolidation. Partie du processus de rconciliation. Fusionne les donnes dans les enregistrements dupliqus pour crer un enregistrement consolid qui contient les valeurs de cellules les plus fiables provenant des enregistrements sources. Partie du processus de rconciliation. Publie la meilleure version de la vrit sur d'autres systmes ou processus utilisant des files d'attente de messages JMS sortants. Partie du processus de distribution dcrit dans Flux de donnes sortant principal (distribution) la page 17.
Correspondance
Consolider
Publier
Les processus de lots de Informatica MDM Hub sont implments comme procdures stockes de bases de donnes qui peuvent tre appeles depuis la Console Hub ou travers des scripts personnaliss utilisant des outils de gestion de tches tiers. Dans les implmentations Informatica MDM Hub, le traitement par lots est utilis selon les besoins. Par exemple, le traitement par lots est souvent utilis pour le chargement de donnes initiale (le premier chargement des donnes d'entreprise dans le stockage Hub), car ceci peut tre la mthode la plus efficace de chargement d'un grand nombre d'enregistrements dans Informatica MDM Hub. Le traitement par lots est galement utilis lorsque c'est le seul moyen ou la mthode la plus efficace d'obtenir des donnes provenant d'un systme source spcifique. Pour en savoir plus sur les processus de lots, consultez le Guide de l'administrateur de Informatica MDM Hub, le Guide de Services Integration Framework de Informatica MDM Hub, le Guide du gestionnaire des donnes de Informatica MDM Hub et le Javadoc de Informatica MDM Hub.
Processus de liaison
Le processus de liaison transfre les donnes d'un systme source vers les tables d'arrive dans le Stockage Hub. Une table d'arrive fournit le stockage intermdiaire dans le flux de donnes depuis les systmes sources dans le Informatica MDM Hub. En effet, les tables d'arrive sont l o les donnes arrivent depuis les systmes sources contributeurs.
20
Les tables d'arrive sont remplies lors du processus de liaison de l'une des deux manires suivantes :
Mode traitement par lots Description Un outil ETL (Extract-Transform-Load) tiers ou autre processus externe enregistre les donnes dans une ou plusieurs tables d'arrive. De tels outils ou processus ne font pas partie de la suite de produits de Informatica MDM Hub. Une application externe remplit les tables d'arrive dans le Stockage Hub. Cette application ne fait pas partie de la suite de produits de Informatica MDM Hub.
Le processus de liaison est externe Informatica MDM Hub et est excut l'aide d'un processus de lot externe tel qu'un outil ETL (Extract-Transform-Load) tiers, ou en ligne, en temps rel o une application externe remplit directement les tables d'arrive dans le Stockage Hub. Les processus suivants pour la gestion des donnes sont internes Informatica MDM Hub.
Le processus d'activation de donnes lit les donnes provenant de la table d'arrive, nettoie les donnes si ncessaire et dplace les donnes nettoyes vers une table temporaire du Stockage Hub. La table temporaire fournit un stockage intermdiaire temporaire dans le flux de donnes provenant des tables d'arrive vers les objets de base. Les mappages facilitent le transfert et le nettoyage des donnes entre les tables d'arrive et temporaires lors du processus d'activation de donnes. Un mappage dfinit :
quelle colonne de table d'arrive est utilise pour remplir une colonne dans la table temporaire quelle normalisation et vrification (nettoyage) doit tre effectue, le cas chant, avant que la table
temporaire soit remplie. Le Informatica MDM Hub normalise et vrifie les donnes l'aide des fonctions de nettoyage. Chaque fonction de nettoyage donne accs des fonctionnalits spcifiques de nettoyage, telles que vrification des adresses, dcomposition des adresses, dtermination du genre, titre/majuscules/minuscules, compression de l'espace vide, etc. La sortie de la fonction de nettoyage devient l'entre de la colonne cible dans la table temporaire.
21
Processus de chargement
Le processus de chargement permet de charger les donnes de la table temporaire vers la table Stockage Hub correspondante, appele objet de base. Si une colonne dans un objet de base tire ses donnes de plusieurs systmes sources, le Informatica MDM Hub utilise l'approbation pour aider comparer la fiabilit relative des donnes de la colonne provenant de diffrents systmes sources. Par exemple, le systme de commandes peut tre une source plus fiable des adresses de facturation que le systme de ventes. L'approbation fournit un mcanisme pour mesurer le facteur de confiance associ chaque cellule selon son systme source, historique des modifications et autres rgles d'entreprise. L'approbation prend en compte l'anciennet des donnes, le degr de dclin de sa fiabilit au cours du temps et l'intgrit des donnes. L'approbation permet de dterminer la survie (quand deux enregistrements sont consolids) et si les mises jour provenant d'un systme source sont suffisamment fiables pour mettre jour l'enregistrement principal. L'approbation est souvent utilise conjointement avec les rgles de validation, qui indiquent Informatica MDM Hub la condition pour laquelle une valeur de donnes n'est pas valide. Quand les donnes rpondent aux critres spcifis par la rgle de validation, la valeur d'approbation pour ces donnes est mise au niveau infrieur par le pourcentage indiqu dans la rgle de validation. Par exemple :
Downgrade trust on First_Name by 50% if Length < 3
Processus de marquage
Le processus de marquage gnre des jetons de correspondance utiliss ensuite par le processus de correspondance pour identifier les enregistrements d'objets de base candidats pour la correspondance. Les jetons de correspondance sont des chanes qui reprsentent des valeurs codes (cl de correspondance) et non codes (brutes) dans les colonnes de correspondance de l'objet de base. Les cls de correspondance sont des valeurs compresses et codes de longueur fixe, gnres partir d'une combinaison des mots et des nombres dans un nom ou une adresse, de sorte que les variations pertinentes ont la mme valeur de cl de correspondance. Les jetons de correspondance gnrs sont stocks dans une table de cls de correspondance associe l'objet de base. Pour chaque enregistrement de l'objet de base, le processus de marquage stocke un ou plusieurs enregistrements contenant des jetons de correspondance gnrs dans la table de cls de correspondance. Le processus de correspondance dpend des donnes actuelles dans la table de cls de correspondance et excute automatiquement le processus de marquage si des jetons de correspondance n'ont pas t gnrs pour les enregistrements dans l'objet de base. Le processus de marquage peut tre excut avant le processus de
22
correspondance, automatiquement la fin du processus de chargement, ou manuellement, comme tche de lots ou procdure stocke. La Console Hub permet d'examiner la distribution des cls de correspondance dans la table de cls de correspondance. Les utilisateurs peuvent identifier les zones sensibles potentielles dans leurs donnes (concentrations leves de cls de correspondance pouvant entraner un surclassement) o le processus de correspondance gnre trop de correspondances, dont celles qui ne sont pas pertinentes.
Processus de correspondance
Le processus de correspondance identifie les donnes conformes aux rgles de correspondance que vous avez dfinies. Ces rgles dfinissent les donnes dupliques consolider par le Informatica MDM Hub. La correspondance est le processus de comparaison des points de similarit de deux enregistrements. Si un nombre suffisant de points de similarit est trouv pour indiquer que les deux enregistrements sont probablement identiques et forment un doublon, le Informatica MDM Hub marque ces enregistrements pour la consolidation. Dans un objet de base, les colonnes utiliser des fins de comparaison sont appeles colonnes de correspondance. Chaque colonne de correspondance est base sur une ou plusieurs colonnes provenant de l'objet de base. Les colonnes de correspondance sont combines en rgles de correspondance pour dterminer les conditions dans lesquelles deux enregistrements sont considrs comme suffisamment semblables pour la consolidation. Chaque rgle de correspondance indique Informatica MDM Hub la combinaison des colonnes de correspondance requises pour examiner les points de similarit. Quand le Informatica MDM Hub trouve deux enregistrements qui rpondent une rgle de correspondance, il enregistre les cls principales des enregistrements ainsi que l'identificateur de la rgle de correspondance. Les enregistrements sont marqus pour la consolidation automatique ou manuelle selon la catgorie de la rgle de correspondance. La correspondance externe permet de faire correspondre les nouvelles donnes avec celles existantes dans un objet de base, de tester les correspondances et d'inspecter les rsultats sans rellement charger les donnes dans l'objet de base. La correspondance externe est utilise pour effectuer un pr-test des donnes, tester les rgles de correspondance et inspecter les rsultats avant d'excuter le rel processus de correspondance sur les donnes.
23
Processus de consolidation
Une fois les enregistrements dupliqus dans le processus de correspondance, le processus de consolidation les fusionne en un seul enregistrement.
L'objectif de Informatica MDM Hub est d'identifier toutes les donnes dupliques et de les fusionner en un seul enregistrement principal consolid contenant les valeurs de cellules les plus fiables provenant des enregistrements sources. Pour en savoir plus sur le processus de consolidation, consultez le Guide de l'administrateur de Informatica MDM Hub.
Processus de publication
24
Le processus de publication peut tre configur pour publier le BVT dans une file d'attente de messages JMS sortants. D'autres systmes, processus ou applications externes qui surveillent la file d'attente de messages peuvent rcuprer le message et le traiter en consquence. Pour plus d'informations sur le processus de publication, consultez Configuration du processus de publication dans le Guide de l'administrateur de Informatica MDM Hub.
25
La base de donnes principale est une base de donnes du Stockage Hub qui contient les paramtres de configuration de l'environnement Informatica MDM Hub, les comptes d'utilisateurs, la configuration de la scurit, le registre ORS, les paramtres de file d'attente des messages, etc. Une seule base de donnes principale peut tre affecte un environnement Informatica MDM Hub donn. Un stockage de rfrence oprationnelle (ORS) est une base de donnes dans le Stockage Hub qui contient les donnes principales, les mtadonnes de contenu, les rgles de traitement des donnes principales, les rgles de gestion de l'ensemble des objets de donnes principales, ainsi que les rgles de traitement et la logique auxiliaire utilise par le Informatica MDM Hub pour dfinir la meilleure version de la vrit (BVT). Une ou plusieurs bases de donnes ORS peuvent tre affectes une configuration de Informatica MDM Hub.
Mtadonnes de contenu
Pour chaque objet de base du schma, Informatica MDM Hub conserve automatiquement les tables de prise en charge contenant les mtadonnes de contenu concernant les donnes charges dans le Stockage Hub. Pour en savoir plus sur les mtadonnes de contenu et les tables de prise en charge, consultez Gnration du schma dans le Guide de l'administrateur de Informatica MDM Hub.
Objets de base
Un objet de base (parfois abrg par OB) est une table dans le stockage Hub permettant de dcrire des entits centrales d'entreprise telles que les clients, les comptes, les produits, les employs, etc. L'objet de base est le point d'extrmit pour consolider les donnes provenant de plusieurs systmes sources. Dans une implmentation Informatica MDM Hub, le schma (ou modle de donnes) d'une organisation comprend gnralement un ensemble d'objets de base. L'objectif de Informatica MDM Hub est de crer l'enregistrement principal pour chaque instance de chaque entit unique au sein d'un objet de base. L'enregistrement principal contient la meilleure version de la vrit (abrge BVT), qui est un enregistrement qui a t consolid avec les meilleures valeurs de cellules les plus fiables provenant des enregistrements sources. Par exemple, pour un objet de base Client, vous souhaitez aboutir un enregistrement matre pour chaque client individuellement. L'enregistrement principal de l'objet de base contient la meilleure version de la vrit pour ce client.
Tables d'historique
Les tables d'historique permettent de suivre cet historique de modifications dans un objet de base et de remonter son lignage vers le systme source. Informatica gre plusieurs tables d'historique diffrentes, dont les tables
26
d'historique de rfrences et d'objets de base, pour fournir des options dtailles de suivi de modifications, dont l'historique de fusion et d'annulation de la fusion, l'historique des donnes pr-nettoyes, l'historique de l'objet de base et l'historique de la rfrence.
Relations
Dans le Hierarchy Manager, une relation dcrit l'affiliation entre deux entits spcifiques. Les relations du Hierarchy Manager sont dfinies en indiquant le type de relation, le type de hirarchie, les attributs de la relation et les dates d'activation de la relation. Les informations sur une entit de Hierarchy Manager sont stockes dans une relation du base object. Un type de relation dcrit les classes de relations. Un type de relation dfinit les types d'entits qu'une relation de ce type peut inclure, le sens de la relation (si prsent) et le mode d'affichage de la relation dans la console Hub.
Hirarchies
Une hirarchie est un ensemble de types de relations. Ces types de relations ne sont pas classs, ni forcment associs entre eux. Ce sont simplement des types de relations regroups pour faciliter leur classification et leur identification. Le mme type de relation peut tre associ plusieurs hirarchies. Un type de hirarchie est une classification logique de hirarchies.
Entits
Dans le Hierarchy Manager, une entit est un objet, une personne, un lieu, une entreprise ou autre lment significatif pouvant tre utilis dans votre base de donnes. Les exemples incluent le nom d'une personne spcifique, un numro de compte-chques spcifique, une socit spcifique, une adresse spcifique, etc. Les informations sur une entit de Hierarchy Manager sont stockes dans un objet de base d'entit, que vous crez et configurez dans la Console Hub. Un type d'entit est une classification logique d'une ou de plusieurs entits. Les exemples incluent les mdecins, les compte-chques, les banques, etc. Toutes les entits du mme type sont stockes dans le mme objet d'entit.
27
CHAPITRE 4
Administrateurs
Cette section dcrit les activits et ressources pour les administrateurs de Informatica MDM Hub.
Les administrateurs accdent Informatica MDM Hub par la Console Hub, qui comprend un ensemble d'outils pour grer une implmentation de Informatica MDM Hub.
28
Administration
Dveloppeurs
Cette section dcrit les activits et ressources pour les dveloppeurs de Informatica MDM Hub.
Configuration
Dveloppeurs
29
Data Manager
Hierarchy Manager
Ressources de documentation pour les gestionnaires des donnes de Informatica MDM Hub
Vous pouvez consulter la documentation suivante de Informatica MDM Hub pour les gestionnaires de donnes :
Rubrique(s) Prsentation de Informatica MDM Hub Guide du gestionnaire des donnes de Informatica MDM Hub
30
INDEX
A
propos du traitement par lots 19 administrateurs 28 administrateurs de bases de donnes 28 administrateurs systme 28 approbation 22
H
Hirarchies 27 Hierarchy Manager (HM) 10 hotspots 22
I
Informatica Data Director 13 Informatica MDM Hub propos de Informatica MDM Hub 4 architecture 6 composants de 6 fonctionnalits de base 4
B
Base de donnes principale 25
C
chargement de donnes initiales 19 charges de donnes incrmentielles 25 Cleanse Match Server 8 cls de correspondance 22 colonnes de correspondance 23 Console Hub 9 correspondance externe 23
J
jetons de correspondance 22
M
mappages 21 Master Reference Manager (MRM) 10 meilleure version de la vrit (BVT) 16 Metadata Manager (MET) 11 mtadonnes de contenu 26 modle de donnes 26
D
dveloppeurs 29 distribution 17 donnes principales 1
E
enregistrement consolid 16 enregistrements principaux 16 entits 27
O
objets de base 16, 26 Outils ETL 20 Outils extraction-transformation-load 20
F
files d'attente de messages 24 Files d'attente de messages JMS 24 fonctions de nettoyage 21 fusion des enregistrements dupliqus 24
P
prface iii processus d'activation de donnes 21 processus de chargement 22 processus de consolidation 24 processus de correspondance 23 processus de liaison 20 processus de marquage 22 processus de publication 24
G
gestion d'tat 27 Gestion des donnes principales (Master Data Management - MDM) 1 gestionnaires des donnes 30
R
rconciliation 16 rgles de correspondance 23 rgles de validation 22
31
relations 27
S
schma 26 Security Access Manager (SAM) 11 Serveur Hub 8 Services Integration Framework (SIF) 12, 25 Stockage de rfrence oprationnelle (Operational Record Store - ORS) 25 Stockage Hub 7 surclassement 22 systmes source 16
T
tables d'arrive 20
tables d'historique 26 tables de cls de correspondance 22 tables de rfrences 26 tables temporaires 21 Tables XREF 26 traitement en temps rel propos du traitement en temps rel 25 flux global 19 traitement par lots flux global 18 processus d'activation de donnes 21 processus de chargement 22 processus de consolidation 24 processus de correspondance 23 processus de liaison 20 processus de marquage 22 processus de publication 24
32
Index