Documente Academic
Documente Profesional
Documente Cultură
CUPRINS
Introducere ................................................................................................................................................... 3 Orientarea pe subiect ............................................................................................................................... 4 Integrarea.................................................................................................................................................. 4 Non volatilitatea..................................................................................................................................... 4 Variabilitatea n timp ................................................................................................................................ 4 Arhitectura unui depozit de date .................................................................................................................. 5 Organizarea datelor n depozite ................................................................................................................... 8 Metadatele.................................................................................................................................................... 9 Oracle pentru depozite de date .................................................................................................................. 10 Bibliografie .................................................................................................................................................. 11 ANEXA Aplicaie: Oracle Warehouse Builder ........................................................................................... 12 Pasul 1: Configurarea mediului Oracle Warehouse Builder ................................................................... 13 Pasul 2 Generarea Surselor De Date .................................................................................................... 16 Pasul 3 Vizualizarea Depozitului .......................................................................................................... 20
Depozit de date
ORIENTAREA
aplicaiilor funcionale ale companiei. De exemplu, pentru o companie de asigurri aplicaiile sunt orientate pentru auto, via, sntate i depozitele de date se construiesc pe aceste subiecte.
NON
stocate pe perioade lungi de timp, de aceea nu se permite modificarea acestora odat ce ele au fost deja ncrcate din sistemul operaional.
VARIABILITATEA
(time-variancy) i de aceea nregistrrile conin o informaie privind momentul sau perioada de timp pentru care sunt valabile.
Date externe
Date interne
Date arhivate
T r a n s f o r m a r e
Date detaliate
OLAP
Fig. 2 Arhitectura unui depozit de date Depozitul de date conine mai multe tipuri de date care corespund diferitelor cerine informaionale ale utilizatorilor: date detaliate, date agregate, metadate (dicionarul de date). Metadatele descriu datele coninute n depozitul de date i modul n care ele sunt obinute i stocate. Prin metadate se precizeaz structura datelor, proveniena lor, regulile de transformare, de agregate i de calcul. Ele sunt utilizate la ncrcarea datelor, la consultare, la actualizare, adic pe parcursul ntregului ciclu de via al depozitului.
Datele agregate, dei determin o cretere a redundanei datelor i sunt necesare deoarece n acest fel se poate asigura un timp mediu de rspuns ct mai redus. Aceste date presupun un grad de prelucrare prealabil, astfel nct s fie pregtite pentru nevoile managementului: consolidare, totalizare, sumarizare, mpachetare (n formate accesibile interfeelor de analiz utilizate).
Datele detaliate sunt cele relativ recente, livrate utilizatorilor, de regul la nivel de execuie. Tot aici se gsesc i date avnd o anumit vechime, tot n form detaliat.
Sursele de date sunt: datele operaionale curente (BD i/sau fiiere din sistemul informatic al organizaiei), datele vechi arhivate, datele externe (BD i fiiere din sistemele informatice ale altor organizaii). Construirea depozitului de date, pornind de la sursele de date, presupune parcurgerea unor etape n cadrul unui proces de transformare: extragerea datelor din datele operaionale sau din surse externe, urmat de copierea lor n depozitul de date. Acest proces trebuie, cel mai adesea, s transforme datele n structura i formatul intern al depozitului; filtrarea datelor, pentru a exista certitudinea c datele sunt corecte i pot fi utilizate pentru luarea deciziilor; ncrcarea datelor corecte n depozitul de date; agregarea datelor: totaluri precalculate, subtotaluri, valori medii, sume etc., care se preconizeaz c vor fi cerute i folosite de utilizatori. Aceste agregri sunt stocate n depozitul de date mpreun cu datele importate din sursele interne i externe. Interfeele de analiz sunt produse software care implementeaz tehnologii informatice pentru extragerea i analiza datelor din depozit : concentrri de date (Data Mart), extrageri i analize de date (Data Mining), analiza multidimensional a datelor (OLAP).
Datele n depozite sunt subiect orientate, deci organizate mai puin dup aplicaie sau proces. Ele sunt extrase i remprosptate periodic de ctre sistemul operaional. Dup arhitectura prezentat anterior (figura 2), serverul depozitului de date este punctul central (inima) aplicaiei. Totui, mai exist o arhitectur pe vertical, mai simpl, cu dou niveluri, n care primul nivel include sistemul operaional ct i baza de date iar al doilea aplicaiile client.
Metadata
Date vechi
Concentrrile de date (data marts) pot fi construite s funcioneze pe configuraii mai modeste dect depozitele de date i sunt specifice unei anumite aplicaii. Depozitul de date conine informaii care pot fi utilizate pentru a rspunde oricrei ntrebri privind afacerile unei organizaii, iar concentrrile de date conin datele necesare unui anumit compartiment al organizaiei. Conectnd mpreun concentrrile de date aferente diferitelor compartimente ale organizaiei, formnd astfel o infrastructur specific, departamentele pot folosi n comun datele lor i se poate crea astfel un sistem de suport al deciziei mai uor de construit i mai flexibil. Interfeele OLAP se bazeaz pe reprezentarea multidimensional a datelor (cub de date) i permite analiza interactiv i rapid a datelor prin operaiuni specifice. Utilizatorul poate obine rezultate immediate parcurgnd dinamic dimensiunile cubului de date, lucrnd cu niveluri diferite de sintez/detaliere. Interfeele de tip Data Mining asigur extragerea i transformarea datelor n cunotine. Se utilizeaz tehnici ale analizei statistice superioare i de inteligen artificial care permit descoperirea de corelaii, reguli, cunotiine utile sprijinirii deciziilor.
METADATELE
Metadatele sunt informaii despre datele existente n depozite, care descriu structura (coninutul) depozitului i furnizeaz referine directe la date. Ele sunt folosite pentru administrarea depozitului de date, deoarece conin informaii despre: sursa datelor, algoritmii de sumarizare, statisticile de utilizare etc. Metadatele sunt create pentru toate numele de date i definiiile din depozit. Metadate adiionale sunt create pentru a asocia intervale de timp la datele extrase i alte cmpuri care vor fi adugate prin filtrarea datelor sau prin procesele de integrare. Metadatele unui depozit de date conin urmtoarele informaii: o descriere a structurii de date din depozit, care include schema depozitului, dimensiunile, ierarhiile, definiiile datelor derivate; metadatele operaionale, care includ: date privind evoluia n timp (istoricul datelor i secvena de transformare aplicat asupra lor), circulaia datelor (active, arhivate, terse) i informaii de monitorizare (statistici privind utilizarea depozitului de date, rapoarte de erori etc.); algoritmii utilizai pentru sumarizare, care includ: msura i dimensiunea algoritmilor definii, date despre granularitate, partiii, arii de subiecte, agregri, sumarizri, rapoarte i filtre predefinite; maprile (transformrile) de la mediul operaional la depozitul de date care includ: bazele de date surs i coninutul lor, descrierile interfeelor (gateways), partiionarea datelor, extragerea datelor, filtrarea datelor, regulile de ntreinere, securitate a datelor; 9
date referitoare la performanele sistemului care include indici i profiluri care mbuntesc accesul la date i performanele de cutare; metadatele economice (business metadata), care includ termenii economici i definiiile aferente.
Sistem operaional
Sisteme Oracle
Sisteme legacy
DSS
Oracle Reports
10
BIBLIOGRAFIE
1. Oracle Database, Data Warehousing Guide, 11g Release 1, September 2007 2. F. Ionescu, note de curs 3. Muhammad Ahmad Shazad, Data Warehousing with Oracle, Oracular 5.http://www.oracle.com/webfolder/technetwork/tutorials/obe/db/11g/r1/owb/owb11g_update_g etting_started_intro/lesson1/less1_start.htm
11
12
13
14
Pentru a obine accesul, n command window se introduce: C:> sqlplus sql> username: sys as sysba password: password Iar pentru OWBSYS, se vor introduce: sql> alter user owbsys identified by password account unlock;
15
16
Ne vom loga din cmd din nou la sqlplus i vom genera comanda: Sql> @d:\newowbdemo\create_users.sql; Se vor crea doi useri: xsales i eul_from_owb.
17
Se editeaz fiierul owbdemoinit.tcl cu valorile corespunztoare mediului creat prin Repository Assistant.
#define global variables used in procedures global debug global iconlocation global owbclient global owbclientpwd global host global port global service global udoappdefname global themodule #Set all common variables set owbclient rep_owner set owbclientpwd rep_owner set sysuser sys set syspwd orcl set host localhost set port 1521 set service orcl set project OWB_DEMO set sourcedir d:/newowbdemo set dataspace USERS set indexspace USERS set tempspace TEMP set snapspace USERS set sqlpath C:\app\Illy\product\11.1.0\db_1\BIN set sid orcl #set the workspace info set workspaceOwner rep_owner set workspaceName my_workspace
18
Apoi, n OMB Plus (Start > Programs > [Oracle - OWB11gR1clientHome] > Warehouse Builder > OMB Plus) se introduc comenzile: cd d:\\newowbdemo\\ source owbdemoinit.tcl source loadall.tcl
19
20