Introducere
In urmtorul studiu de caz ne propunem s construim un depozit de date pentru
activitile comerciale ale unei societi, activiti legate de aprovizionarea cu produse de la
furnizori i desfacerea acestora ctre clieni.
Datele rezultate din tranzacii sunt stocate n tabele relaionale. Pentru construirea
depozitului se creeaz tabele sau tabele virtuale noi care vor reprezenta sursele de date pentru
obiectele depozitului. n urma unor prelucrri i transformri preliminare se obin tabelele surs
prezentate n schema urmtoare:
Pas 1: Stabilim tipurile de obiecte pe care vrem s le importm:tabele, viziuni, secvene etc.
Pas 2: Alegem din nodul TABLE tabela T_CLIENTI.
Pas 3: Dup acest pas n modulul surs sunt incluse obiectele selectate.
Se apas Finish.
La final se vor importa tabelele, rezultatul fiind vizibil n nodul Tables al bazei de date din
modulul surs:
Sursa de date o consultm alegnd opiunea Data din meniul contextual deschis prin click
dreapta pe tabela surs T_CLIENTI.
Se observ neconcordane privind datele stocate la nivelul:
- rii: nu exist o variant unic de stocare a datelor
- oraului: nu exist o variant unic de stocare a datelor
- clasei clientului: exist valori eronate
- telefonului: nu exist o variant unic de stocare a datelor
Construirea unui proces de Data Profiling
Dup import construim un proces Data Profile alegnd opiunea New din meniul de context
deschis la click dreapta pe Data Profiles:
Denumim profilul i selectm tabelele pentru care urmeaz a fi aplicat:
Pentru a realiza coreciile se alege din meniul Profile opiunea Create Correction
Se cere construirea unui modul destinaie (Target Module) n care s fie plasate tabelele cu
corecturile de rigoare.
restriciile de tip CHECK care implementeaz alegerile limitate pentru valorile acceptate
n coloanele ar_client i clas_client.
La pasul 5 al asistentului de tip wizard, vom selecta din opiunile aferente coloanei Cleanse
Strategy strategiile de aplicare a regulilor, astfel:
- similarity Match pentru regula de curare a clasei clientului
- custom pentru regula de curare aferent rii (va fi implementat printr-o funcie PL/SQL)
Dup realizarea coreciei, se verific obiectele create n tab-ul Corrected Modules din Data
Profile Editor:
Dnd dublu click pe mapare, putem alege s o examinm, n scopul vizualizrii fluxului de
transformare parcurs:
Pentru a implementa funcia de transformare pentru coloana tara_client efectum dublu click pe
funcie, iar n tabul Implementation completm codul PL/SQL necesar:
Implementm funcia CUS_TARA_CLIENT i o testm (opiunea Test Deploy Function).
Pentru a rula coreciile i a ncrca datele din surs n destinaie, din meniul Tools alegem
Control Center Manager.
Alegei obiectele corespunztoare locaiei destinaie stabilite i parcurgei pe rnd etapele
urmtoare pentru fiecare dintre grupurile de obiecte: 1) tabele, 2) funcii, 3) maparea:
selectai pentru Deploy Action CREATE
alegei opiunea Deploy (genereaz metadatele aferente obiectelor)
Dac totul se finalizeaz cu succes, selectai maparea i alegei execuia acesteia:
La final putem observa datele corectate n tabela t_clienti din schema proprie:
EXERCITII: