Sunteți pe pagina 1din 33

TEHNOLOGIA OLAP

- NOTE DE CURS -

Conf.univ.dr. Adela BRA
CUPRINS:
1. CERINELE FUNCIONALE ALE
SISTEMELOR OLAP
2. ARHITECTURA SISTEMELOR OLAP
3. MODELUL DE DATE MULTIDIMENSIONAL
4. OPERAII REALIZATE ASUPRA MODELULUI
MULTIDIMENSIONAL
5. MODELE DE DATE MULTIDIMENSIONALE
UTILIZATE N SISTEMELE OLAP
6. LOCUL TEHNOLOGIEI OLAP N
ARHITECTURA DEPOZITULUI DE DATE
INTRODUCERE
Conceptul de On-line Analytical
Processing a aprut ncepnd cu
anii 60-70 din dorina de a modela
prin funcii analitice activitile
financiare.
INTRODUCERE
1995 - Consiliul OLAP, un consoriul al
firmelor dezvoltatoare de produse
OLAP,cu rolul de a standariza aceste
tehnologii prin stabilirea unor standarde
deschise (OLAP API). Propune urmtoarea
definiie:
On-Line Analytical Processing
este o tehnologie software ce permite
analitilor, managerilor i persoanelor cu
funcie de conducere s analizeze datele
printr-un acces rapid, consistent i
interactiv i s le vizualizeze ntr-un mod
ct mai variat.
INTRODUCERE
Tehnologia OLAP reprezint o
modalitate de prelucrare i analiz
dinamic i avansat a datelor,
oferind decidenilor posibilitatea
de a obine propria perspectiv
asupra datelor, de creare flexibil
i obinere direct a situaiilor
centralizate i sintetice, dar i cu
posibilitatea de navigare n detaliu,
cu faciliti de previzionare i
simulare a unor situaii viitoare, fiind
o soluie eficient de analiz a
datelor din depozitele de date.
1. CERINELE FUNCIONALE ALE
SISTEMELOR OLAP
Analiza dinamic a datelor;
Acces rapid la date;
Surse de date multiple;
Sincronizarea surselor de date;
Analiza istoric;
Grad de generalizare ridicat;
2. ARHITECTURA SISTEMELOR OLAP
Grafice
Data
Warehouse
Aplicatii WEB Rapoarte
Nivelul
Surselor de date
Nivelul
Interfetei cu
utilizatorul
Server OLAP
Surse externe Depozitul de date Baze de date
Nivelul
Serverului
OLAP
3. MODELUL DE DATE MULTIDIMENSIONAL
Structura modelului constituit
din obiectele modelului
precum i relaiile dintre ele;
Operatorii care acioneaz
asupra structurii;
Restriciile de integritate
formate din totalitatea de
regului i constrngeri impuse
modelului pentru asigurarea
corectitudinii datelor.
3. MODELUL DE DATE MULTIDIMENSIONAL
Dimensiunile - un atribut
structural al unui cub ce const
dintr-o list de membrii, pe care
utilizatorii i percepe ca fiind de
acelai tip (de exemplu toate
lunile, trimestrele, anii formeaz
dimensiunea Timp).
Dimensiunile repreznint un
mod foarte concis, intuitiv de
organizare i selectare a
datelor pentru explorare i
analiz.
3. MODELUL DE DATE MULTIDIMENSIONAL
Ierarhiile - membrii
dimensiunilor pot fi organizai
pe baza relaiilor de tip printe-
copil, unde un membru printe
reprezint agregarea
membrilor copil. Rezultatul este
o ierarhie i relaiile printe-
copil sunt relaii ierarhice
3. MODELUL DE DATE MULTIDIMENSIONAL
Nivelurile - reprezint poziii n
cadrul ierarhiilor. Relaiile ntre
diferite nivele sunt relaii de tipul
printe-copil.
Atribute dimensiunile conin
atribute care reprezint
calificative specifice.

3. MODELUL DE DATE MULTIDIMENSIONAL
Tabelele de fapte sunt
tabelele centrale. Acestea
conin atribute de tip msuri
(metrici) i chei externe ctre
tabelele dimensiuni. Faptele
sunt de obicei date numerice
care pot fi nsumate i analizate
pe diferite nivele.
3. MODELUL DE DATE MULTIDIMENSIONAL
Metricile (msurile) corespund
atributelor (faptelor) din
tabelele de fapte i sunt de
regul de natur numeric (de
exemplu: volumul vnzrilor,
costurile, stocurile disponibile).
3. MODELUL DE DATE MULTIDIMENSIONAL
Metadatele - date care descriu
coninutul depozitului i
furnizeaz trimiteri directe la
date. Tot la nivelul metadatelor
se definesc i diverse vederi
(views) asociate unor categorii
specifice de utilizatori.
3. MODELUL DE DATE MULTIDIMENSIONAL
Schema modelului este o
colecie de obiecte, incluznd
tabelele, viziunile, indeci i
sinonime.

3. MODELUL DE DATE MULTIDIMENSIONAL
Schema de tip Stea - este cel
mai simplu i mai frecvent
utilizat model. Obiectele sale
sunt dispuse n form de stea, n
centru aflndu-se una sau mai
multe tabele de fapte de care
sunt legate dimensiunile.
Suport dou tipuri de
interogri: consultare i jonciuni
multiple.
3. MODELUL DE DATE MULTIDIMENSIONAL
Atribute ale dimensiunii
TIMP
Dimensiunea TIMP
Atribute ale dimensiunii
PRODUS
Dimensiunea PRODUS
Atribute ale dimensiunii
LOCATIE
Dimensiunea LOCATIE
Atribute ale dimensiunii CLIENT
Dimensiunea CLIENT
ID TIMP
ID LOCATIE
ID PRODUS
ID CLIENT
Vol vnzarilor
Vol discount

Tabela de fapte
3. MODELUL DE DATE MULTIDIMENSIONAL
Schema de tip Fulg de Nea - este
o variant a modelului stea n care o
parte din tabelele dimensiune sunt
normalizate, iar datele sunt distrinuite
n tabele suplimentare. Rezult o
schem reprezentat ntr-un grafic
similar unui fulg de zpad. Diferena
ntre modelul stea i modelul fulg de
nea este c tabelele dimensiune din
acesta pot fi pstrate n forma
normalizat, ceea ce determin o
redundan redus.
3. MODELUL DE DATE MULTIDIMENSIONAL
Atribute ale
dimensiunii TIMP
Dimensiunea TIMP
Atribute ale
dimensiunii PRODUS
Dimensiunea PRODUS
Atribute ale dimensiunii
REGIUNE
Dimensiunea REGIUNE
Atribute ale dimensiunii
CLIENT
Dimensiunea CLIENT
ID TIMP
ID REGIUNE
ID PRODUS
ID CLIENT
Vol vnzarilor
Vol discount

Tabela de fapte
Atribute ale
dimensiunii
TIP_PRODUS
Dimensiunea TIP_PRODUS
Atribute ale dimensiunii
LOCATIE
Dimensiunea LOCATIE
3. MODELUL DE DATE MULTIDIMENSIONAL
Cuburi de date - spaiu cartezian
definit pe toate dimensiunile
depozitului de date. Acesta poate fi
numit cub de date, fiind un spaiu de
date logic i nu unul fizic. Seciunile
bidimensionale sunt numite tablouri.
Axele cubului sunt reprezentate de
dimensiuni, la intersecia acestora
fiind variabilele sau msurile.
Consiliul OLAP definete cubul n-
dimensional ca fiind un grup de
celule de date aranjate dup
dimensiunile datelor. O matrice
tridimensional poate fi vizualizat
ca un cub cu fiecare dimensiune
formnd o fa a cubului
3. MODELUL DE DATE MULTIDIMENSIONAL
PRODUS
TIMP
LOCATIE
3. MODELUL DE DATE MULTIDIMENSIONAL
locatie
prod
us
T1 T2 T3
furnizor F1 furnizor F2 furnizor F3
timp
4. OPERAII REALIZATE ASUPRA MODELULUI
MULTIDIMENSIONAL
Navigarea pe nivelele ierarhice (Drill
Down i Roll Up) reprezint operaii
de navigare n cadrul ierarhiilor
dimensiunilor, prin agregare pe
nivelele superioare sau detaliere pe
nivelele inferioare. Orice baz de
date multidimensional trebuie s
permit navigarea pe diferite nivele
ale ierarhiilor. Aceasta tehnic se
numeste roll up sau drill down, n
funcie de direcie, spre vrful sau
baza ierarhiei. Acestea sunt operaii
de schimbare a vederii de-a lungul
nivelelor unei ierarhii.
4. OPERAII REALIZATE ASUPRA MODELULUI
MULTIDIMENSIONAL
Rotaii reprezint operaiile cele
mai uzuale n structurile de date
multidimensionale i ofer
utilizatorului posibilitatea de a alege
perspectiva asupra datelor pe care
o va utiliza. Fiecare rotaie pune n
eviden o nou perspectiv,
aducnd n prim plan o structur
bidimensional, o faet (slice). Din
acest motiv rotaia se mai numeste i
data slicing.
4. OPERAII REALIZATE ASUPRA MODELULUI
MULTIDIMENSIONAL
Seciuni - reprezint viziuni sau
imagini (views) specifice
diverselor categorii de utilizatori,
prin operaii de secionare prin
care se obin "felii"
bidimensionale (slices). Tehnica
aceasta const n limitarea
unor atribute la anumite valori i
obinerea unui cub de date
redus (procedeu numit data
dicing)
5. MODELE DE DATE MULTIDIMENSIONALE
UTILIZATE N SISTEMELE OLAP

Dou direcii importante au
clasificat diversitatea de
modele i anume dezvoltarea
unor extensii ale modelului
relaional i utilizarea acestora
n cadrul sistemelor OLAP i a
doua direcie dezvoltarea
modelelor bazate pe cuburi n-
dimensionale.
5. MODELE DE DATE MULTIDIMENSIONALE
UTILIZATE N SISTEMELE OLAP
Printre extensiile modelului
relaional: schema tip stea, modelul
tip fulg de nea, schem galaxie,
schem constelaie.
Printre modelele bazate pe cub :
tehnica ME/R pentru proiectarea
schemei multidimensionale conine o
entitate denumit nivel al dimensiunii
(dimension level), o relaie tip 1:n
denumit fact relationship i o relaie
binar denumit relaie de
clasificare a dou niveluri ierarhice.
6. LOCUL TEHNOLOGIEI OLAP N
ARHITECTURA DEPOZITULUI DE DATE

In cartea Building the Data
Warehouse, W.H. Inmon
menioneaz: Sunt patru
niveluri n cadrul mediului
arhitectural: operaional,
atomic sau al depozitului de
date, departamental i
individual
6. LOCUL TEHNOLOGIEI OLAP N
ARHITECTURA DEPOZITULUI DE DATE

Nivelul operaional - Sistemele
operaionale sunt reprezentate de
sursele, datele care populeaz
depozitul de date. Datele
operaionale sunt supuse
tranzaciilor, volatile, stocate la nivel
de tranzacie n form normalizat
sau proprie n sistem OLTP.
6. LOCUL TEHNOLOGIEI OLAP N
ARHITECTURA DEPOZITULUI DE DATE

Nivelul depozitului de date - Acest
nivel conine date cu caracter istoric
ale nivelului tranzacional, prelucrate
i transformate ntr-un format
multidimensional mult mai potrivit
pentru suportul de decizii.

6. LOCUL TEHNOLOGIEI OLAP N
ARHITECTURA DEPOZITULUI DE DATE

Nivelul departamental, data mart
sau OLAP - Un data mart OLAP va fi
limitat la submulimea mrimilor
statistice disponibile i dimensiunilor
necesare pentru a studia problemele
specifice afacerilor.
6. LOCUL TEHNOLOGIEI OLAP N
ARHITECTURA DEPOZITULUI DE DATE

Nivelul individual - Instrumentele de
vizualizare a cererilor, precum
grafice, prezentri, rapoarte
dinamice, browserele Web, toate
aparin acestui nivel. Aplicaiile
clienilor, care conin informaii
despre bugete, prognoze,
recomandri cu privire la alocarea
resurselor i multe altele se afl n
data mart la acest nivel al
arhitecturii.
CONCLUZII
Analiza datelor din depozitele
de date fr tehnologia OLAP
este ar fi extrem de grea,
implicnd metode i modele
statistice i matematice
laborioase, funcii de analiz
dezvoltate de programatori,
interfee speciale, dezvoltate
separate de restul sistemului.

S-ar putea să vă placă și