Sunteți pe pagina 1din 20

Sisteme de inteligenta afacerii

Tehnologia OLAP
Ce este OLAP
 Daca instrumentele de interfata si structura BD suporta analiza multidimesionala, acces instantaneu si manipulare
usoara => online analytical processing
 Codd, parintele acestui termen a evidentiat diferentele OLTP-OLAP- 1993 - criterii generale pentru BD
OLAP.
 ANALIZA MULTIDIMENSIONALA
 Aplicarea de formule şi modele asupra dimensiunilor şi ierarhiilor;
 Vizualizarea datelor prin mai multe filtre sau dimensiuni in acelasi timp
 Analiza de trend pe perioade diferite de timp;
 Analiza în adancime (drill-down);
 Extragerea unui subset de date pentru vizualizare(slice);
 Rotaţii în cadrul dimensiunilor;

 Sistemele OLAP şi DW - sisteme suport de decizie orientate pe date şi sunt similare.


 DW pune accentul pe procesele ce asigură consistenţa, corectitudinea şi valabilitatea
datelor la utilizatori,
 sistemele OLAP pun accentul pe cerinţele analitice şi procesele de modelare şi calcul
necesare.
Cerinte functionale ale sistemelor OLAP
 Analiza dinamică a datelor;
 Acces rapid la date;
 Surse de date multiple;
 Sincronizarea surselor de date;
 Analiza istorică;
 Grad de generalizare ridicat;
Erik Thomsen:
Cerinţe logice:
 Structurare completă a dimensiunilor prin ierarhizare
 Realizarea eficientă a calculelor şi prelucrarilor
 Flexibilitate
 Independenţa reprezentărilor faţă de structura modelului
Cerinţe fizice:
 Acces rapid şi direct
 Suport multiutilizator
Cerinte functionale OLAP - Codd
 Caracteristici de bază Modul de prezentare a datelor
1: O viziune conceptuală 13: Flexibilitatea rapoartelor
multidimensională 14: Performanţa raportării
2: Manipularea intuitivă a datelor 15: Ajustarea automată a nivelului
3: Accesibilitate fizic
4: Surse de date variate Controlul dimensiunilor
5: Modele de analiză OLAP 16: Dimensionalitate generică
6: Arhitectura client/server 17: Dimensiuni şi niveluri de
7: Transparenţă agregare nelimitate
8: Suport multiutilizator 18: Operaţii între dimensiuni
Caracteristici speciale nerestrictive
9: Denormalizarea datelor
10: Stocarea rezultatelor generate
de instrumentul OLAP
11: Manipularea valorilor lipsă
12: Modul de tratare a valorilor
lipsă
A. Caracteristici de bază


Regula 1: O viziune conceptuală multidimensională - Viziunea conceptuală a modelelor OLAP trebuie să fie
multidimensională bazată pe viziunea sau modelul existent în organizaţie.
 Regula 2: Manipularea intuitivă a datelor -trebuie să permită operaţii intuitive şi flexibile de manipulare a
datelor, cum ar fi navigarea pe nivelurile ierarhiilor, analize pe secţiuni din date, etc.
 Regula 3: Accesibilitate - trebuie să ofere acces la o singură viziune logică a datelor din organizaţie. Sursele
de date, în modelul OLAP, trebuie să fie transparente utilizatorilor.
 Regula 4: Surse de date variate - trebuie să fie capabil să lucreze cu date stocate atat în baze de date
multidimensionale (MOLAP) cât şi în baze de date relaţionale (ROLAP) sau chiar sisteme hibride
(HOLAP).
 Regula 5: Modele de analiză OLAP - trebuie să suporte patru modele de analiză: explicativ, direct,
contemplativ şi formativ în sensul că un trebuie să permită cel puţin realizarea rapoartelor
parametrizate, analize de tip “ce se întâmplă dacă..?”, operaţii de tip drill-down/roll-up şi slice/dice.
 Regula 6: Arhitectura client/server - accesul utilizatorilor realizat prin intermediul unui client, iar prelucrarea
multidimensională să fie realizată de un server specializat
 Regula 7:Transparenţă - Accesul la sursele de date eterogene ar trebui să fie transparent pentru utilizatori,
iar analiza datelor să poată fi realizată şi prin intermediul diverselor instrumente client ca: grafice, calcul
tabelar
 Regula 8: Suport multiutilizator - trebuie să asigure acces concurent şi distribuit la sursele de date, fiind
asigurate însă integritatea şi securitatea acestora.
B.Caracteristici speciale

 Regula 9: Denormalizarea datelor - prelucrarea datelor într-un
mediu OLAP nu trebuie să afecteze sursele externe din care
provin acestea.
 Regula 10: Stocarea rezultatelor generate de sistemul OLAP - datele
trebuie stocate şi prelucrate separat de sursele relaţionale
datorită diferenţelor existente între modele şi a cerinţelor de
procesare.
 Regula 11: Manipularea valorilor lipsă – nu pot fi tratate în acelaşi
mod ca orice altă valoare
 Regula 12: Modul de tratare a valorilor lipsă - trebuie să fie tratate
individual, deoarece ele afectează calculele în diferite moduri
C. Modul de prezentare a datelor

 Regula 13: Flexibilitatea rapoartelor - modul de prezentare a
datelor supuse analizei trebuie să fie accesibil utilizatorilor
astfel încât aceştia să poată aranja cu uşurinţă datele pe
diverse dimensiuni pe axele disponibile.
 Regula 14: Performanţa raportării - dimensiunea sau modul de
organizare a datelor nu ar trebui să influenţeze performanţa
în raportare.
 Regula 15: Ajustarea automată a nivelului fizic - ar trebui să-şi
modifice automat schema fizică a bazei de date în funcţie de
tipul modelului logic şi de volumul datelor
D. Controlul dimensiunilor
 Regula 16: Dimensionalitate generică - dimensiunile proiectate

trebuie să fie echivalente structural şi operaţional, adică să


permită ierarhii multiple şi toate tipurile de operaţii
multidimensionale şi în acelaşi timp să poate fi actualizate.
 Regula 17: Dimensiuni şi niveluri de agregare nelimitate – se
recomandă utilizarea un număr maxim de 15-20 de
dimensiuni.
 Regula 18: Operaţii între dimensiuni nerestrictive - ar trebui să
permită realizarea de operaţii între diverse dimensiuni, fără
restricţii.
Regulile FASMI (1995 Nigel Pendse )
 Fast Analysis of Shared Multidimensional Information
 FASMI = un termen alternativ pentru OLAP.Termenul a fost elaborat de Pendse pentru ca a fosst de parere ca
regulile lui Codd sunt prea controversate si partinitoare. El a considerat ca lista de reguli ale lui Codd e prea
lunga si conceptul OLAP poate fi definit prin doar 5 reguli.
 FAST - cat mai multe raspunsuri utilizatorilor intr-un termen mai scurt de 5 sec

 ANALYSIS - orice logica de afaceri si analiza statistica relevanta pentru aplicatie sau utilizator,
suficient de simplu pentru utilizatorul final

 SHARED - toate cerintele de securitate pentru confiden-tialitate, dar si blocarea actualizarilor


concomitente, daca este necesar accesul multiplu la scriere

 MULTIDIMENSIONAL - viziune conceptuala multidimensionala asupra datelor, incusiv


suport complet pentru ierarhii si ierarhii multiple

 INFORMATION - reprezinta toate datele si informatiile derivate necesare oriunde se afla si in


orice masura este relevanta pentru aplicatie.
Operatori OLAP: Secţionarea (slice)
Selectarea unui membru a unei dimensiuni, crearea
unei serii de intersecţii cu alte dimensiuni al acelui
membru pentru secţiunea respectivă.

Reprezintă viziuni sau imagini (views) specifice


diverselor categorii de utilizatori, prin operaţii de
secţionare prin care se obţin "felii" bidimensionale
(slices). Tehnica aceasta constă în limitarea unor
atribute la anumite valori
Operatori OLAP: Decupare(Dice)

crearea unui subcub al cubului de date prin


selectarea unor dimensiuni si a intervalelor de
valori pentru acestea. De exemplu, vanzari
după luna, după regiune, după client. Acest
“după” ne indică cum putem realiza rotirea
(dicing) datelor.
Operatori OLAP: Pivot
 Pivotarea şi imbricarea
dimensiunilor
 Pivotarea presupune inlocuirea intre
ele a dimensiunilor in cadrul unei
vizualizari, trecerea de pe linii pe
coloane si invers
 Reprezintă operaţiile cele mai uzuale
în structurile de date
multidimensionale şi oferă
utilizatorului posibilitatea de a alege
perspectiva asupra datelor pe care o
va utiliza. Fiecare rotaţie pune în
evidenţă o nouă perspectivă,
aducând în prim plan o structură
bidimensională, o faţetă (slice).
Ierarhii si navigare
 Sistemele OLAP permit agregarea sub formă de ierarhii care realizează
agregarea detaliilor la nivele din ce în ce mai înalte.
 De exemplu, datele lunare pot fi agregate (roll-up) la nivel de trimestru sau la
nivel de an,
 Plecarea din vârful ierarhiei dimensiunilor şi detalierea (drill-down)
 Ia nastere astfel un nou proces, denumit «analiză ad-hoc», care permite :
 Răspunsul la diferitele întrebări le managerilor în doar câteva minute de navigare în
date
 Formatarea rapoartelor prin pivotarea şi imbricarea dimensiunilor
 Învăţarea rapidă a utilizării unui astfel de sistem de către orice persoană, mai ales
managerii
a. Arhitecturi OLAP - ROLAP
 Relational OnLine Analytic Processing
 tehnologia relaţionala, adaptată şi extinsă , agregările sunt
stocate în cadrul BD relaţionale sursă
 cea mai lentă soluţie, ex: DSS Server/Microstrategy
 Avantaje:
 se integrează cu tehnologia şi standardele existente;
 actualizarea sistemelor MOLAP este dificilă;
 ROLAP sunt adecvate pentru a stoca volume mari de date, prin
utilizarea procesării paralele şi a tehnologiilor de partiţionare;
 ROLAP sunt recomandate pentru aplicaţiile cu volatilitate ridicată a
datelor (antecalcul agregari)
 ROLAP atunci cand:
a. Arhitecturi OLAP - ROLAP
 ROLAP este potrivit atunci cand:
a) Volumul de date este prea mare pentru a fi duplicat.
b) Datele sursă se modifică frecvent şi este mai bine de
a citi în timp real decât din copii;
c) Se doreşte integrarea cu alte sisteme informatice
relaţionale existente;
d) Firma are o politică de neduplicare a datelor, pentru
securitate sau alte motive, chiar dacă aceasta
conduce la aplicaţii mai puţin eficiente
b. Arhitecturi OLAP - MOLAP
 Multidimensional OnLine Analytic Processing
 stocarea datelor în formă multidimensională, folosind structuri de
date vector (tehnica matricilor rare)
 atât datele sursă, cât şi agregările sunt stocate în format
multidimensional
 indexare rapida a datelor preagregate
 opţiunea cea mai rapidă pentru consultare
 necesită cel mai mult spatiu de disc
 Stocare fizica a datelor multidimensionale, precum si fenomenul de
imprastiere sunt preocupari majore
 Ex: Hyperion Essbase
 Avantaje MOLAP
c. Arhitecturi OLAP - HOLAP
 Hybrid OnLine Analytic Processing
 combinaţie a primelor două modele
 Arhitecturi HOLAP
 agregările - stocate in structură multidimensională, nivelul celulelor de bază în
formă relaţională
 cele mai recente felii de date stocate in MOLAP si restul in ROLAP
 oferă performanţele MOLAP atunci când este nevoie de preluarea
datelor din tabele
 Caracteristici HOLAP
 transparenţa locaţiei şi a accesului
 transparenţa fragmentării
 transparenţa performanţei
 un model de date comun
 alocarea optimă în sistemele de stocare
 Ex: Microsoft SQL Server OLAP Services

S-ar putea să vă placă și