Documente Academic
Documente Profesional
Documente Cultură
S1 DataProfiling MV PDF
S1 DataProfiling MV PDF
Introducere
In următorul studiu de caz ne propunem să construim un depozit de date pentru
activităţile comerciale ale unei societăţi, activităţi legate de aprovizionarea cu produse de la
furnizori şi desfacerea acestora către clienţi.
Datele rezultate din tranzacţii sunt stocate în tabele relaţionale. Pentru construirea
depozitului se creează tabele sau tabele virtuale noi care vor reprezenta sursele de date pentru
obiectele depozitului. În urma unor prelucrări şi transformări preliminare se obţin tabelele sursă
prezentate în schema următoare:
Fluxuri de date (process flows) = reprezintă definiţii ale fluxurilor de procese. Acestea
sunt conţinute de module, iar în cadrul modulului sunt conţinute de pachete de fluxuri de date.
Codul pe care Warehouse Builder-ul îl generează pentru a reprezenta definiţiile fluxurilor de date
respectă standardul XML Process Definition Language(XPDL).
Pas 3: După acest pas în modulul sursă sunt incluse obiectele selectate.
Se apasă Finish.
La final se vor importa tabelele:
Sursa de date o consultăm alegând opţiunea Data din meniul contextual deschis prin click
dreapta pe tabela sursă T_CLIENTI.
Pentru a genera profilul datelor din tabelă, selectăm din meniul Profile opţiunea Profile.
La prima generare a unui profil se va solicita crearea unei scheme noi pentru stocarea datelor
generate de-a lungul procesului. Este necesară specificarea datelor de autentificare pentru
utilizatorul sys / oracle. Selectaţi opţiunea Show Details pentru a stabili parola pentru noul user
ataşat schemei noi create şi pentru a verifica setările propuse (folosiţi ca parola: oracle).
Realizarea profilului se urmăreşte în zona Monitor Panel
Asteptăm finalizarea procesului. După ce se acesta se execută, sunt afişate detaliat statistici
privitoare la date:
Pentru a realiza corectările la nivel de ţară şi clasă de client vom selecta tab-ul Domain
Pentru definirea unei reguli de corectare a ţării clientului selectăm valorile din
TARA_CLIENT şi alegem opţiunea Derive Data Rule.
Eliminăm din lista posibilă a ţărilor variantele prescurtate şi adăugăm manual variantele
complete acolo unde ele nu pot fi preluate, conform imaginii de mai jos:
Asemenător construim regula de validare pentru CLASA_CLIENT, care trebuie să
păstreze numai valorile corecte:
Pentru a realiza corecţiile se alege din meniul Profile opţiunea Create Correction
Se cere construirea unui modul destinaţie (Target Module) în care să fie plasate tabelele cu
corecturile de rigoare. Il vom denumi CLIENT_CORECTAT.
Stabiliţi locaţia ca fiind schema proprie, a utilizatorului cu care sunteţi conectat în OWB.
Se urmează paşii indicaţi, prin alegerea tabelei asupra căreia se vor realiza corecţiile şi a
regulilor de corecţie stabilite anterior:
La pasul 4 se observă faptul că apar în tab-uri distincte informaţii privind:
restricţiile de tip CHECK care implementează alegerile limitate pentru valorile acceptate
în coloanele ţară_client şi clasă_client.
La pasul 5 al asistentului de tip wizard, vom selecta din lista derulantă ataşată coloanei Cleanse
Strategy strategiile de aplicare a regulilor, astfel:
- similarity Match – pentru regula de curăţare a clasei clientului
- custom – pentru regula de curăţare aferentă ţării (va fi implementată printr-o funcţie PL/SQL)
După realizarea corecţiei, se verifică obiectele create în tab-ul Corrected Modules din Data
Profile Editor:
Opţional: Dând dublu click pe mapare, putem alege să o examinăm, în scopul vizualizării
fluxului de transformare parcurs:
Pentru a implementa funcţia de transformare pentru coloana tara_client efectuăm dublu click pe
funcţie, iar în tabul Implementation alegem opţiunea Code Editor.
Codul PL/SQL necesar este: