Sunteți pe pagina 1din 17

Academia de Studii Economice din Bucureti

Facultatea de Finane, Asigurri, Bnci i Burse de Valori


Master: Management Financiar i Investiii

Sisteme OLAP
On Line Analytical Processing

Profesor coordonator: PROFESOR UNIV. DR. STANCIU Victoria

Masterand : NANU Alexandru Victor


An : I

Bucureti,

2016

Cuprins
Cuprins
Consideraii generale
Apariia i evoluia sistemelor OLAP
Depozite de date. Relaia cu sistemele OLAP
Caracteristici de baz ale OLAP. Regulile lui Codd
Modele de date multidimensionale pentru sisteme OLAP.
Concepte de baz
5.1 Conceptul de cub n-dimensional
5.2 Conceptul de dimensiune
5.3 Conceptul de ierarhie
5.4 Conceptul de msur
5.5 Conceptul de multicub
5.6 Conceptul de mprtiere
6. Evaluarea modelelor multidimensionale
7. Proiectarea sistemelor OLAP
7.1 Metoda lui Cabibbo i Torlone
7.2 Metoda lui Golfarelli
7.3 Metoda Erik Thomsen
Bibliografie
1.
2.
3.
4.
5.

pag.
1
2
3
5
5
6
7
7
8
8
10
10
10
12
12
13
14
17

1. Consideraii generale
Acronimul OLAP pentru On Line Analytical Processing semnific tehnologia (metoda) de
procesare online (n timp real) a unor date. Practic metoda (tehnologia) este o modalitate de interogare
complex a unei baze de date oferind rezultate/rspunsuri specifice unei anumite probleme de interes.
Astfel metoda aparine categoriei IT de Business Intelligence, alturi de metoda ETL (Extract,
Transform and Load), Relational Reporting, Data Mining etc.
n condiiile socio-economice actuale caracterizate de schimbri rapide, accesul rapid (n timp
real) al factorilor decizionali (managementul) ai unei organizaii reprezint un factor important al
asigurrii competitivitii respectivei organizaii. Mai mult informaia trebuie, n plus fa de timpul de
rspuns rapid, trebuie s fie ntr-un format convenabil (utilizabil fr transformri/prelucrri) ulterioare
i nu n ultimul rnd la un cost convenabil.
n rndul specialitilor n domeniu exist o unanimitate de opinie asupra apartenen ei sistemelor OLAP
la sistemele suport de decizie - SSD (DSS Decision Support Systems), ns dup unii specialiti1 OLAP aparin
SSD orientate pe date, n timp majoritatea 2 consider OLAP ca aparinnd SSD hibride justificat de faptul c
sunt utilizate tehnici de analiz simple (analiza multidimensional a datelor) asupra seturilor mari de date.
Fr a face o analiz detaliat a conceptului de SSD s-a considerat oportun men ionarea celor cinci
caracteristici specifice SSD-urilor evideniate de Holsapple i Whinston3:

1. conine o baz de cunotine ce descrie unele aspecte ale lumii decidentului


(de exemplu cum se realizeaz diferite activiti ale procesului decizional);
2. are abilitatea de a achiziiona i gestiona cunotine descriptive i alte tipuri
de cunotine (proceduri, reguli);
3. are abilitatea de a prezenta cunotinele ad-hoc sau sub form de rapoarte
periodice;
4. are abilitatea de a selecta un subset de cunotine pentru a fi vizualizate sau
pentru a deriva alte cunotine necesare procesului decizional;
5. poate interaciona direct cu decidentul i i permite acestuia flexibilitatea n alegerea
soluiilor i a gestiunii cunotiinelor.
Evoluiile tehnologiei informatice, din ultimii ani, au determinat o reconsiderare a definirii
criteriilor de clasificare a SSD-urilor, o sintez comparativ a acestora fiind prezentat n tabelul 1.
Tabel 1. Analiz comparativ/clasificare a SSD-urilor moderne/actuale4
Componenta
principal a SSDului

Utilizatorii:
interni/externi

Scopul:
general/specific

Arhitectura
utilizat

(1)

(2)

(3)

(4)

Echipe interne/
parteneri externi

Suport pentru
comunicare i colaborare

Web sau
client/server

Manageri, furnizori

Interogarea unui depozit


de date, folosete date
structurate

Mainframe,
client/server,
Web

(2)

(3)

(4)

Comunicaii
SSD-uri orientate pe
comunicaii
Baze de date
SSD-uri orientate pe
date
(1)
1

Power D. A brief History of Decision Support Systems, DSS Resources, http://dss.cba.uni.edu/dss/dsshistory.html, (1999).
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
3
Holsapple C.W., Whinston A. B., Decision Support Systems: A Knowledge-Based Approach, St. Paul: West Publishing,
(1996).
4
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
2

Baze de documente
SSD-uri orientate pe
documente
Baze de cunotine
SSD-uri orientate pe
cunotine
Modele
SSD-uri orientate pe
modele
Modele/ baze de date
i comunicaii
SSD-uri
interorganizaionale
/intraorganizaionale
Modele/ baze de date
i comunicaii
SSD-uri bazate pe Web
Modele/baze de date
SSD-uri specializate

Utilizatori interni dar


grupul poate fi extins

Cutarea paginilor Web


sau a documentelor
nestructurate

Client/server, Web

Utilizatori interni, clieni

Folosete reguli, relaii

Client/server,
Web, PC

Manageri, clieni

Folosete modele

PC,client/server, Web

Utilizatori
interni i externi

Suport pentru
intermediari

Client/server,
Web

Utilizatori
interni i externi

Suport pentru orice


sarcin a SSD-ului

Web

Utilizatori interni

Specializate pe anumite
domenii de activitate sau
cu un scop mai general
(generator SSD)

PC, client/server

n cadrul Sistemelor Suport de Decizie Orientate pe Date (SSDOD) pot fi definite urmtoarele
categorii principale de SSD:
sisteme informatice executive;
sisteme suport de decizie spaiale;
sisteme suport de decizie care utilizeaz depozite de date;
sisteme OLAP.
SSOD prin capacitatea lor de acces mai uor i mai ales rapid la colecii mari de date au suscitat
un interes crescut din partea managementului organizaiilor, ca utilizatori direci i cei mai vizai ai
acestor sisteme.
Sistemele OLAP opereaz cu sisteme de date multidimensionale (diferite conceptual fa de
modelul relaional) i permite efectuarea de interogri analitice complexe ad-hoc, cu vitez mare de
procesare. Datorit acestui fapt exist propuneri5 ca OLAP s fie denumit FASMI (Fast Analysis of
Shared Multidimensional Information). Rezultatul interogrii unei baze OLAP s-a dovedit a fi de pn
la 1000 de ori mai rapid6 dect lucrul cu baze de date relaionale.

2. Apariia i evoluia sistemelor OLAP


Sisteme informatice de analiz multidimensional, precursoare sistemelor OLAP, au fost
elaborate i utilizate nc din anii 70-80.
Conform unor lucrri din literatura de specialitate7 apariia i evoluia sistemelor OLAP poate fi
sintetizat succint prin evidenierea principaleleor etape cronologice notabile:
1962 descrierea primului limbaj multidimensional (Ken Iverson n cartea A programming
Language limbajul APL), adoptat i implementat de IBM. Este de meniobat c multe din
5

Crstea M., O abordare proactiva a bazelor de date: OLAP, Revista Business Intelligence / Market Watch, nr.77,
(iulie 2005).
6
Idem.
7
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].

conceptele enunate atunci sunt utilizate i astzi;


sfritul decadei 60 o serie de specialiti (John Little, Len Lodish, Glen Urban) testeaz utilizarea
calculatoarelor n aplicaii matematice i analitice (n special pentru marketingul bunurilor de consum
justificat de existena unui volum mare de date brute i posibilitatea mbunt irii procesului decizional
prin utilizarea analiticului n procesul decizional, prin mai buna nelegere a datelor);
1972 ... 1974 apariia sistemelor de gestiune a deciziilor (MDS Management Decision Systems)
ca rezultat al cercetrilor de la sfr itul decadei 60. S-a creat astfel suportul analitic de creare a

modelelor matematice de analiz (n special n marketing). Au fost create deasemenea create


biblioteci de subrutine cu funcii analitice i faciliti de stocare a matricilor pe suport magnetic
(disc). n 1972 funciile analitice i facilitile de gestiune a datelor au fost integrate ntr-un limbaj,
limbajul Express, ale crui concepte i modele sunt nc utilizate ( rmne una din principalele tehnologii
OLAP folosite);

1978-1979 apare o nou generaie de limbaj de modelare financiar prin combinarea funciilor
analitice de modelare cu tehnologia gestiunii datelor, avnd capabilitatea de a gestiona volume
mult mai mari de date (asociate conceptului de multidimensionalitate)/ Apare astfel primul
instrument OLAP pentru aplicaii financiare System W DSS, folosit ca suport financiar decizional n
activitatea bugetar, previzionare i planificare strategic ;

1984 apare primul instrument ROLAP (Relational Online Analytical Processing), denumit
Methafor, prin care au fost implementate noi concepte: calcule distribuite client/server, procesare
multidimensional a datelor relaionale etc.;
mijlocul decadei 80 apare conceptul EIS (Executive Information System) ;
1985 apariia PCC (Pilot Command Center), primul instrument OLAP tip EIS cu arhitectur
client/server. Instrumentul se bazeaz pe analiza seriilor de timp;
1990 este lansat primul instrument OLAP cu arhitectur desktop, Cognos Power Play, pentru
platforme Windows (au fost lansate i versiuni pentru arhitecturi client/server i Web);
1991/1992 a fost creat un server de baze de date multidimensionale i multiutilizator Essbase;
1993 Codd introduce termenul de OLAP i formuleaz un set de 12 reguli pentru aceste sisteme.
Evideniaz8 diferenele dintre tehnologia sistemelor multidimensionale i tehnologia sistemelor
tranzacionale;
1994 este lansat Microstrategy DSS Agent, primul instrument ROLAP fr motor multidimensional.
Procesarea este executat n limbaj SQL / pentru baze de date foarte mari;

1995 apare HOLOS 4.0, primul OLAP hibrid, care permite accesul att la baze de date
relaionale ct i la cele multidimensionale;
1995 apare consiliul OLAP cu scopul de a face sistemele OLAP mult mai atrgtoare pe pia, prin
stabilirea unor standarde deschise (OLAP API) i definirea clar a no iunilor, termenilor, procedurilor
etc.;

1995 Microsoft elaboreaz OLEDB for OLAP, un standard de acces lasursele de date
multidimensionale, un model pentru cuburi i dimensiuni, un limbaj MDX (Multidimensional
EXpressions) pentru calcul i vizualizare a cuburilor etc.;
1997 apare standardul MDIS (Metadata Interchange Specification) propusde un grup de
firme (IBM, Sybase, Informix), care ofer un mecanism standard de acces i o interfa standard
pentru a gestiona metadatele;
1998 este lansat IBM DB2 OLAP Server, o versiune a lui Essbase, care utilizeaz date stocate
n baze de date relaionale (schem stea);
1998 apare Microsoft OLAP Services (numit iniial Plato sau Decision Support Services) ce
utilizeaz o arhitectur de stocare complex (ROLAP/MOLAP/HOLAP);
2000 Microsoft redenumete Microsoft OLAP Services ca Microsoft Analysis Services;

Codd E.F., Providing OLAP (On-Line Analytical Processing) to user-analysts: An IT mandate, Technical report, E.F. Codd
and Associates, White paper, Arbor Software Corporation, (1993).

2002 Oracle lanseaz Oracle9i Release 2 OLAP care integreaz toatefacilitile OLAP
(Analytical Workspace) n baza de date relaional Oracle.

n concluzie,se poate afirma c la ora actual nu exist nici un model de date multidimensional
(conceptual i formal) acceptat n unanimitate. Un astfel de model este totui necesar pentru a servi ca o
fundamentare pentru standardizare i cercetarea viitoare.

3. Depozite de date. Relaia cu sistemele OLAP


Sistemele OLAP i depozitele de date fac parte din categoria sistemelor suport de decizie
orientate pe date (SSDOD) i sunt similare. n cazul depozitelor de date accentul se pune pe procesele
ce asigur consistena, corectitudinea i valabilitatea datelor la utilizatori, iar sistemele OLAP pun
accentul pe cerinele analitice i procesele de modelare i calcul necesare.
Depozitul de date (Data Warehouse) este un ansamblu de colecii de date de dimensiuni foarte
mari, care este ntreinut separat de bazele de date operaionale ale unei organizaii i care este
construit din date provenite din sistemele surs, prin operaii de extragere, filtrare, transformare i
stocare, n depozite speciale, n scopul sprijinirii proceselor decizionale.
Conform conceptului de Data Warehouse (iniiat de Bill Inmon) scopul unui depozit de date
este de a asigura consistena i corectitudinea datelor utilizate n organizaie, accesibile utilizatorilor
finali. Totodat valoarea unui depozit de date const n calitatea informaiilor livrate utilizatorului final
i nu n cantitatea de date stocate n depozit.
n tabelul 2 este prezentat o analiz comparativ a principalelor caracteristici ale datelor
operaionale i cele necesare pentru suport decuzional9.
Tabel 2. Analiz comparativ ntre datele operaionale i datele pentru suport decizional
Date operaionale

Date necesare pentru suport decizional

detaiate
curente
destinate operatorilor
repetitive
orientate pe aplicaie
neredundante
statice
suport pentru operaii zilnice

agregate
serii de timp
destinate managerilor
nerepetitive
orientate pe subiect
redundante
dinamice
suport strategic

4. Caracteristici de baz ale OLAP. Regulile lui Codd


Codd care a formulat conceptul OLAP (1993) a enunat i un set de 12 reguli/caracteristici ale
sistemelor. Ulterior (1995) acest set a fost completat/extins la 18.
Regula 1: O viziune conceptual multidimensional.
Regula 2: Manipularea intuitiv a datelor.
Regula 3: Accesibilitate.
Regula 4: Surse de date variate.
Regula 5: Modele de analiz OLAP trebuie s suporte patru modele de analiz: explicativ, direct,
contemplativ i formativ.
Regula 6: Arhitectura client/server.
Regula 7: Transparen trebuie s conin interfee spre diverse instrumente client (de exemplu
instrumente de tip foaie de calcul tabelar)
9

Inmon W H, Building the Data Warehouse, John Wiley&Sons, New York, (1992).

Regula 8: Suport multiutilizator. Instrumentele OLAP trebuie s asigure acces concurent,


integritatea i securitatea datelor.
Caracteristici speciale

Regula 9: Denormalizarea datelor prelucrarea datelor ntr-un mediu OLAP nu trebuie s afecteze
datele externe ce servesc ca surs.
Regula 10: Stocarea rezultatelor generate de instrumentul OLAP sistemele OLAP trebuie s
stocheze datele separat de sistemele tranzacionale.
Regula 11: Manipularea valorilor lips. Valorile lips sunt diferite de valorile zero i cele invalide.
Regula 12: Modul de tratare al valorilor lips. Valorile lips sunt ignorate de OLAP, indiferent de
sursa lor.
Modul de reprezentare a datelor

Regula 13: Flexibilitatea rapoartelor.


Regula 14: Performana raportrii nu trebuie s varieze semnificativ cu numrul de dimensiuni
sau mrimea bazei de date.
Regula 15: Ajustarea automat a nivelului fizic sistemele OLAP trebuie s fie capabile s-i modifice
automat schema fizic a bazei de date, n funcie de tipul modelului logic i de volumul datelor.
Controlul dimensiunilor

Regula 16: Dimensionalitate generic dimensiunile trebuie s fie echivalente structural i


operaional.
Regula 17: Dimensiuni i niveluri de agregare nelimitate.
Regula 18: Operaii ntre dimensiuni nerestrictive OLAP trebuie s permit calcule i manipularea
datelor indiferent de numrul de dimensiuni.

5. Modele de date multidimensionale pentru sisteme OLAP.


Concepte de baz
Societatea economic a zilelor noastre este caracterizt de o acerb competiie ntre organizaii.
Astfel managerii trebuie s ia decizii corecte, bazate pe informaii reale, fapt pentru care informaia a
devenit un factor de producie esenial. Dintre factorii care au condus la situaia actual pot fi amintii:
creterea complexitii structurii organizaiilor, a relaiilor ntre organizaii, crearea de noi procese de
afaceri, redirecionarea proceselor de afaceri existente ctre client, globalizarea pieelor, clienilor i
organizaiilor i apariia de noi tehnologii suport cum ar fi Internetul sau comerul electronic.
Justificarea utilizrii frecvente a OLAP n SSD rezid n principal n posibilitatea analizei
interactive a datelor multidimensionale, fiind apropiate de logica de gndire a specialitilor/analitilor
i n plus permind mbuntirea performanei execuiei cererilor.
Este important de precizat c indiferent de tipul de arhitectur implementat, instrumentul
OLAP prezint datele la utilizator ntr-un model de date multidimensional.
Totui pe lng multiplele avantaje ale utilizrii instrumentelor OLAP aceste au i o serie de
dezavantaje/limitri:
nu ofer un limbaj de interogare similar cu limbajul SQL;
trateaz dimensiunile i msurile asimetric;
nu exist un model conceptual unanim acceptat pentru bazele de date
multidimensionale.
Dei modelarea multidimensional este o tehnic de modelare conceptual folosit de aplicaiile
OLAP, totui ea nu este o problem specific sistemelor OLAP. Modelele de
date propuse n domeniul bazelor de date (statistice, spaiale, temporale etc.) au multe puncte comune
cu modele de date OLAP.
6

5.1 Conceptul de cub n-dimensional


Conceptul de hypercub sau cub cu mai mult de trei dimensiuni (cub ndimensional) sau
structur multidimensional este fundamental pentru
sistemele OLAP i pentru modelul
multidimensional. Instrumentele OLAP folosesc conceptul de hypercub n acelai mod n care foile de
calcul tabelar folosesc conceptul de foaie de lucru (worksheet) i bazele de date relaionale conceptul
detabel. Toate vizualizrile, rapoartele i analizele OLAP sunt fcute n termeni de hypercuburi
(cuburi n-dimensionale).
Componentele unui cub sunt dimensiunile, membrii, celulele, ierarhiile si proprietatile.
Dei denumirea neal, un cub poate avea pn la 64 de
dimensiuni cu tot cu dimensiunea msurilor. Fiecare celul a
cubului conine o valoare ce reprezint intersecia dimensiunilor,
fiind de fapt o valoare agregat. O masur poate fi orice atribut
al depozitului de date cu singura restricie ca acest atribut trebuie
s fie o dat numeric care poate fi nsumat, agregat.
Dimensiunile logice nu sunt identice cu dimensiunile fizice10.
n cadrul unui cub o dimensiune descrie o ax
individual n cub reprezentnd o perspectiv din care pot fi
vizualizate datele. Membrul reprezint o valoare anume a
dimensiunii. Fiecare celula este identificata de niste coordonate
Figura 1. O celul a unui cub11
si anume cte un membru din fiecare dimensiune.
n cadrul fiecarei dimensiuni se pot defini ierarhii, adic grupari de membri. Cnd se definete o
ierarhie se folosete noiunea de nivel. Un nivel descrie ordinea membrilor, de la nivelul care conine
cele mai multe grupari de date pna la cel mai detaliat nivel.
5.2 Conceptul de dimensiune
Conceptul de dimensiune este definit este definit n glosarul de termeni12 ca un atribut structural al
unui cub ce const dintr-o list de membrii, pe care utilizatorii i percepe ca fiind de acelai tip. O
dimensiune acioneaz ca un index pentru identificarea valorilor dintr-o matrice multidimensional..
..Dimensiunile ofer un mod foarte concis, intuitiv de organizare i selectare a datelor pentru
explorare i analiz. Dimensiunile sunt atribute de identificare a evenimentelor msurabile sau a
lucrurilor pe care le analizm. Spre deosebire de dimensiunile fizice care sunt bazate pe unghiuri i
sunt limitate la trei, dimensiunile logice nu au astfel de limite. Numrul de dimensiuni ntr-un set de
date depete cele trei dimensiuni fizice. Abilitatea instrumentului OLAP de a modela multiple
dimensiuni de informaii l face mult mai potrivit pentru a opera cu seturi complexe de date, dect
bazele de date relaionale i foile de calcul tabelar. O dimensiune conine mai muli membri. Un
membru este un nume distinct sau un identificator folosit pentru a determina poziia unui element de
dat.
Dimensiunile prezint urmtoarele caracteristici:
furnizeaz informaii descriptive despre fiecare indicator (variabil);
conin n general date statice i sunt eseniale pentru analiz. Un model multidimensional ce
ofer un numr mare de atribute dimensionale permite analize ct mai complexe i mai variate;
ntr-un cub n-dimensional o dimensiune este reprezentat printr-o ax;
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
11
Sandu D.A., Posdarie E., Tehnologia OLAP, Revista Informnatica Economic, nr. 4 (24)/(2002).
12
***, Olap Council, The OLAP glossary, OLAP and OLAP Server Definitions,
http://www.olapcouncil.org/research/glossary.htm, (1997).
10

ntr-o schem stea sunt tabelele care se dispun radial n jurul tabelei de fapte i se mai numesc
tabele de dimensiuni.
5.3 Conceptul de ierarhie
O ierarhie este un atribut al unei dimensiuni. Cele mai multe dimensiuni au o structur multinivel sau ierarhic. Criteriile dup care datele suntagregate pentru analiz i raportare trebuie s fie
aceleai cu factorii folosii n procesul decizional.
Elementele individuale sau nodurile sunt numite membri. Cei mai muli membri au conexiuni
n sus i jos, n ierarhie. Conexiunile n sus sunt de tip (m:1) i sunt numite asocieri printe.
Conexiunile n jos sunt de tip (1:m) i sunt numite asocieri copil. n general, un membru poate avea un
singur printe. Un membru ce nu are printe se numete membru rdcin (root). Membrii ce nu au
copii sunt numii frunz.
Pentru a identifica poziia unui membru ntr-o dimensiune se folosesc conceptele de nlime i
adncime n ierarhie. nlimea se stabilete de jos n sus. Adncimea n ierarhie este stabilit de sus n
jos. Exist posibilitatea ca doi membri, care au aceeai nlime, s aib adncimi diferite i invers
(structuri arborescente neechilibrate). n glosarul de termeni OLAP13 se specific c membrii
dimensiunilor pot fi organizai pe baza relaiilor de tip printe-copil, unde un membru printe
reprezint consolidarea (agregarea) membrilor copil. Rezultatul este o ierarhie i relaiile
printe/copil sunt relaii ierarhice.
Ierarhiile sunt fundamentul pentru agregarea datelor i pentru navigarea ntre nivelurile de
detaliu dintr-un cub n-dimensional. Dei nu toate dimensiunile conin ierarhii, toate aplicaiile din
lumea real implic dimensiuni ierarhice. Numrul de ierarhii distincte ntr-o structur
multidimensional este egal cu produsul dintre numrul de ierarhii din fiecare dimensiune.
Dei majoritatea datelor stocate n cuburile n-dimensionale sunt numerice, orice tip de date de
la text la grafice i chiar sunete pot fi multidimensionale. Multe instrumente OLAP ofer abilitatea de a
popula cuburile n-dimensionale cu date text. Datele numerice sunt mai potrivite pentru aplicaiile
OLAP, deoarece au o organizare multidimensional i se pot agrega.
5.4 Conceptul de msur
O msur (variabil) este un indicator de performan prin care se poate analiza performana
activitii modelate (de regul un atribut numeric al unui element din colecia de fapte). Valorile unui
indicator se modific continuu. Pentru fiecare combinaie posibil ntre dimensiuni, exist sau nu o
valoare corespunztoare a indicatorilor. Nu orice atribut numeric este un indicator. Dac valoarea
atributului numeric variaz continuu, atunci atributul este un indicator, iar dac atributul este perceput
mai mult ca o constant, atunci este un atribut dimensional. Indicatorii pot fi clasificai n:
indicatori de baz;
indicatori derivai care se obin prin combinarea indicatorilor de baz.
O alt clasificare este dat n cartea sa de Ralph Kimball 14 n cartea sa, i anume dup
posibilitatea indicatorilor de a se nsuma dup dimensiuni:
indicatori aditivi care se pot nsuma dup toate dimensiunile;
indicatori semiaditivi care se pot nsuma numai dup unele dimensiuni;
indicatori neaditivi care nu se pot nsuma dup nici o dimensiune. Variabilele neaditive pot fi
combinate cu alte variabile pentru a deveni aditive.
5.5 Conceptul de multicub
13

***, Olap Council, The OLAP glossary, OLAP and OLAP Server Definitions,
http://www.olapcouncil.org/research/glossary.htm, (1997).
14
Kimball R., The Data WarehouseToolkit. The Definitive Guide to Dimensional Modeling 2nd edition , Wiley&Sons,
(2002).

Un cub n-dimensional este de fapt un set de variabile ce utilizeaz aceleai dimensiuni de


identificare. Problem care se pune este dac pot fi adugate un numr nelimitat de dimensiuni la un cub
n-dimensional i dac pentru modelarea unei activiti complexe este suficient un singur cub ndimensional. n multe dintre aplicaiile multidimensionale se utilizeaz date din mai multe domenii de
activitate (de exemplu activitatea financiar i activitatea de marketing sau activitatea de producie i
activitatea de desfacere). n aceste cazuri, se utilizeaz mai multe cuburi n-dimensionale logice sau
structuri multicub. Problema care apare la proiectarea unei structuri multicub este legat de modul cum
se realizeaz legtura ntre cuburile n-dimensionale.
Proiectanii de instrumente OLAP au adoptat o varietate de strategii pentru a trata fenomenul de
mprtiere dar i gruparea datelor. Instrumente ca Essbase, Power Play utilizeaz structura hypercub,
o structur logic de cub simplu, dar cu un model sofisticat de compresie a datelor. Cealalt structur,
multicubul, este mai des ntlnit. n aplicaiile multicub, proiectanii descompun baza de date ntr-un
set de structuri multidimensionale, fiecare fiind compus dintr-un subset de dimensiuni ale bazei de
date.
5.6 Conceptul de mprtiere
Conceptul de mprtiere este frecvent asociat cu datele multidimensionale.Termenul de
mprtiere s-a utilizat cu semnificaia de valoare lips, valoare inaplicabil i valoare zero. Primele
dou cazuri sunt considerate date invalide (conceptul de null). Existena unui numr mare de valori
zero nu este totui un exemplu real de mprtiere. Valoarea zero este valid ca orice alt numr.
Confuzia a aprut, deoarece n aplicaiile OLAP apare un numr mare de valori zero, precum i volume
mari de date lips i invalide. Totui valorile lips i cele invalide nu sunt date valide. Ele nu pot fi
tratate n acelai mod ca orice alt valoare. De aceea, sunt necesare tehnici speciale pentru aceste
cazuri. Tratamentul impropriu al valorilor null poate cauza calcule incorecte. Acurateea calculelor este
de o importan crucial pentru analiza oricrui set de date, indiferent c este sau nu multidimensional.

6. Evaluarea modelelor multidimensionale


Un model de date poate fi definit ca un un set de concepte utilizate pentru a descrie structura
unei baze de date. Modele de date pot fi clasificate n:
modele conceptuale (high-level models) care ofer concepte ce sunt apropiate de modul n care
utilizatorii percep datele i sunt independente de implementare;
modele logice: ofer concepte ce pot fi nelese de utilizatorii finali idepind de tipul de SGBDul utilizat .
modele fizice (low-level models): ofer concepte ce descriu detalii despre cum sunt stocate fizic
datele (descrierea datelor pe suport fizic), depinznd de SGBD-ul utilizat.
n afar de cele trei modele menionate mai sus, exist un set de modele (la nivel formal) al
cror concepte nu pot fi utilizate n etapa de proiectare a bazei de date, dar ofer un cadru teoretic i
includ o algebr sau calcul. Conform cu aceast clasificare, modelele multidimensionale pot fi: modele
multidimensionale conceptuale, modele multidimensionale logice, modele multidimensionale fizice i
modele multidimensionale formale.
Tabelul 3 prezint o sintez a clasificrii modelelor multidimensionale pe cele trei niveluri:
conceptual, logic i formal. Se constat c modelele conceptuale ofer un set mai bogat de construcii
semantice, n scopul de a captura ideile utilizatorilor. Se observ, de asemenea, c cele mai recente
9

modele folosesc mai multe semantici. Aceasta poate fi interpretat ca o tendin a mbogirii semantice
a modelelor multidimensionale.
Tabel 3. Analiz comparativ a modelelor multidimensionale
Nivelul

conceptual
logic

Modele extensii ale modelului


relaional

StarER

Modele orientate pe cub

Lehner, Cabibbo, Golfarelli,


Blaschka, MAC

Kimball, Teste
Teste, Li i Wang, Gyssens

formal

Cabibbo, Agrawal,
Vassiliadis,
Guazzo

Principii generale de proiectareale sistemelor OLAP. Cerinele generale pentru selectarea


unui model de date formal, ce poate servi ca un fundament pentru sistemele de baze de date
multidimensionale sunt:
un model independent de implementare. Modelul formal trebuie s fie pur conceptual, s nu
conin vreun detaliu de implementare. Aceast cerin este important n special, pentru
sistemele ROLAP care implementeaz multidimensionalitatea prin maparea modelului
multidimensional logic la un model relaional;
separarea structurii de date de coninut. Formalismul trebuie s permit definiia separat a
structurii de date (cubul multidimensional i dimensiunile lui) i a coninutului (valorile din
celule);
limbaj de interogare declarativ. Analog cu limbajul SQL, limbajul de interogare
multidimensional (calcul logic sau algebr) trebuie s fie declarativ, pentru a permite
optimizarea cererii i independena datelor.
Pe lng aceste cerine generale, aplicaiile OLAP au o serie de cerine speciale care nu se
aplic la alte domenii de aplicaii pentru analiza multidimensional.
Aceste cerine sunt:
Dimensiuni structurate complex. Dimensiunile ofer informaii de context despre datele ce sunt
analizate. Pentru a structura o dimensiune sunt utilizate ierarhiile. Fiecare nivel ierarhic conine un set
distinct de membri. Pentru a descrie o ierarhie, este necesar a modela structura unui nivel (level
structure) i a determina corespondena ntre elementele nivelului inferior i elementele nivelului
superior. Ambele structuri ale unei dimensiuni pot fi vizualizate folosind grafice, unde
nivelurile/membrii apar ca noduri i relaiile de agregare ca arce.
Un alt mod de structurare a dimensiunilor, din punctul de vedere al utilizatorului, este utilizarea
atributelor dimensionale. Aceste atribute descriu membrii dimensiunii, dar nu definesc ierarhii.
Nivelurile ierarhiilor pot avea diferite atribute dimensionale. Ierarhiile i atributele ce structureaz
dimensiunile sunt elementele componente ale schemei conceptuale a bazei de date.
Msuri complexe. Coninutul unei celule a cubului multidimensional poate fi, deasemenea,
structurat ntr-un mod complex. Fiecare celul poate conine o serie de msuri ce formeaz o structur
tip nregistrare. Aplicaiile OLAP adesea conin un volum mare de msuri derivate (msuri ce nu sunt
atomice, n sensul c ele pot fi calculate de la alte msuri atomice sau derivate).
Tipuri de cereri. Cererile multidimensionale selecteaz hiperplane din spaiul multidimensional.
Pentru a reduce dimensionalitatea cubului rezultat pot fi formulate predicate pe nivelurile
dimensiunilor. Pentru fiecare dimensiune se poate stabili un nivel de granulaie printr-un predicat de
restricie. Acesta definete implicit operaiile de agregare necesare.
Restriciile pot fi formulate utiliznd, de asemenea, msuri n predicat. Un limbaj de interogare
trebuie s permit, de asemenea, integrarea funciilor definite de utilizator, precum i operaii de
navigare prin ierarhiile dimensiunilor.
10

7. Proiectarea sistemelor OLAP


Att organizaiile ct i mediul academic au acordat puin atenie problemelor legate de
modelarea multidimensional conceptual. Tehnicile de modelare conceptuale existente nu pot fi direct
aplicate la caracteristicile modelului de date multidimensional 15. Ca o consecin, multe proiecte
organizaionale elimin etapa de modelare conceptual i trec direct la proiectarea logic. Nu exist la
ora actual, nici un standard pentru modelarea multidimensional conceptual a datelor. Exist ns un
consens general c tehnica de modelare entitate-asociere nu este potrivit pentru proiectarea sistemelor
cu depozite de date i a sistemelor OLAP.
n opinia unora dintre specialiti16 se consider c procesul de proiectare a modelului
multidimensional conceptual depinde foarte mult de cerinele utilizatorilor i de valabilitatea i
structura datelor din sistemele operaionale. De obicei, proiectele ncep cu un prototip, care este apoi
modificat n concordan cu cerinele utilizatorilor. Procesul de proiectare a modelului
multidimensional conceptual este executat de mai multe ori (iterativ). Exist dou motive principale
pentru acest comportament dinamic:
(1) tehnologia de analiz multidimensional interactiv este nou pentru analist, ceea ce
nseamn c este imposibil pentru el s stabileasc de la nceput toate cerinele aplicaiei;
(2) procesele de afaceri pe care analistul trebuie s le modeleze, se modific frecvent. Aceste
modificri trebuie reflectate n cerinele de analiz (noi tipuri de cereri).
ntruct modelul multidimensional determin facilitile de analiz posibile, noile cerine
conduc la modificri ale schemei bazei de date.
La ora actual pot fi identificate dou abordri n proiectarea modelului multidimensional
conceptual i anume:
1. Abordarea orientat pe sursele de date ce presupune existena sistemului informatic
tranzacional i ncepe cu analiza datelor existente n baza de date;
2. Abordarea orientat pe cereri este utilizat n absena surselor de date (i a modelelor
entitate-asociere corespunztoare). Pe baza studiului i analizei activitii pentru care se
construiete sistemul OLAP, se vor identifica indicatorii de performan ai activitii
respective (variabilele cubului n-dimensional).
n cele ce urmeaz, se vor prezenta trei dintre cele mai utilizate metode de modelare
multidimensional. Dei ele utilizeaz concepte asemntoare etapele parcurse pentru proiectarea
modelului multidimensional conceptual sunt diferite.
7.1 Metoda lui Cabibbo i Torlone
Metoda17 pentru proiectarea unei model multidimensional are ca punct de pornire modelul
entitate-asociere al bazelor de date operaionale existente pentru domeniul analizat. Se consider c
modelul entitate-asociere existent este complet, adic conine toate informaiile necesare n procesarea
analitic i este normalizat.
Metoda const din parcurgerea a patru etape, dup cum urmeaz:
E1 identificarea faptelor, dimensiunilor, ierarhiilor i msurilor;
E2 restructurarea modelului entitate-asociere;
E3 derivarea unui graf dimensional;
E4 transformarea n modelul multidimensional.
15

Blaschka M., Sapia C., Hfling G., Dinter B., Finding your way through multidimensional data models, Proc of 9th
International Conference on Database and Expert Systems Applications, nr 1460 in LNCS Springer, (1998).
16
Idem.
17
Cabbibo L., Torlone R., A logical approach to multidimensional databases, Proceedings of EDBT98, Springer, (1998).

11

De obicei, primele dou etape nu sunt strict secveniale, n multe cazuri ele se execut n paralel
(n etapa de restructurare a modelului entitate-asociere, faptele i dimensiunile identificate pot fi
rafinate i modificate). Apoi celelalte etape se execut secvenial, ntruct fiecare etap cere
completarea etapei anterioare.
7.2 Metoda lui Golfarelli
Golfarelli18 propune o metodologie pentru proiectarea unui depozit de date (utilizabil pentru
proiectarea unui sistem ROLAP). Aceast metodologie pune accentul pe proiectarea modelului
multidimensional conceptual. Tabelul 4 prezint etapele acestei metodologii.
Etape
analiza sistemului
informatic existent
specificarea
cerinelor
proiectarea
conceptual
(modelul multidimensional)

Intrri

Tabel 4 Metodologia de proiectare a unui depozit de date


Ieiri
Personal implicat

documentaia
existent

schema bazei de
date operaionale

proiectant, manageri ai
sistemului informatic

schema bazei de
date operaionale

faptele

proiectant,
utilizatori finali

schema bazei de date


operaionale, faptele

modelul
multidimensional

proiectant

validarea modelului
multidimensional

modelul multidimensional
conceptual

proiectarea logic

modelul multidimensional,
modelul logic utilizat
modelul logic al
depozitului, SGBD-ul ales

proiectarea fizic

modelul
multidimensional
validat
modelul logic al
depozitului de date
modelul fizic al
depozitului

proiectant,
utilizatori finali
proiectant
proiectant

Etape preliminare de verificare importante de parcurs de ctre proiectant:


s verifice corectitudinea datelor surs sau dac lipsesc date importante pentru analiz;
s selecteze sursele de date operaionale n funcie de calitatea datelor i stabilitatea schemelor
lor;
s determine care date pot fi integrate n scopul de a obine o viziune complet.

Proiectarea modelului multidimensional conceptual presupune parcurgerea urmtorilor pai: p1


- identificarea faptelor; p2 - construirea unui arbore al atributelor; p3 - rafinarea arborelui; p4 definirea dimensiunilor; p5 - definirea msurilor; p6 - definirea ierarhiilor.
O alt etap important este de identificare a faptelor. Faptele sunt concepte importante pentru
procesul decizional i modeleaz evenimentele ce au loc n organizaie. Un fapt poate fi reprezentat n
modelul entitate-asociere fie de o entitate F sau de o asociere R de tip (m:m) ntre entitile E1,.,En.
Urmtoarea etap de proiectare este construirea unui arbore al atributelor. Astfel, se consider
un model entitate-asociere i o entitate F ce identific un fapt. Se definete arbore al atributelor
(attribute tree) un semi-arbore n care : fiecare vrf corespunde la un atribut (simplu sau compus) al
modelului entitate-asociere; rdcina corespunde la identificatorul lui F (cheia primar); pentru fiecare
vrf v, atributul corespunztor determin funcional toate
atributele ce corespund descendenilor lui v. Arborele atributelor va fi utilizat pentru a construi
schema fapt. Rdcina arborelui se eticheteaz cu numele entitii F.
Cum nu toate atributele arborelui sunt importante pentru analiz, este necesar parcurgerea
etapei de rafinare a arborelui. Rafinarea arborelui are scopul de a elimina nivelurile de detaliu
18

Golfarelli M., Rizzi S., Designing the Data Warehouse: Key Steps and crucial issues, Journal of Computer Science and
Information management, vol2, nr.3, (1999).

12

nesemnificative pentru analiz. Prin tergerea unui subarbore, atributele componente vor fi terse i nu
vor fi incluse n schema fapt. Astfel, nu se vor putea utiliza pentru agregarea datelor.
n mod firesc, urmtoarea etap este definirea dimensiunilor. Dimensiunile determin cum pot fi
agregate instanele unui fapt. Dimensiunile trebuie s fie alese din arborele de atribute (dup ce
arborele a fost rafinat). Stabilirea dimensiunilor este o etap important, ntruct determin granulaia
instanelor unui fapt. De asemenea, Timpul este o dimensiune important. Modelele entitate-asociere
pot fi clasificate n funcie de modul cum trateaz timpul n fotografii (snapshot) i temporale. Un
model fotografie descrie starea curent a domeniului aplicaiei. Un model temporal descrie evoluia n
timp a domeniului aplicaiei.
Pentru definirea msurilor se construiete un dicionar care descrie modul cum se calculeaz
aceste msuri pe baza atributelor modelului entitate-asociere surs. Un fapt poate s nu aib asociate
atribute (singura informaie ce este nregistrat este apariia faptului). n unele cazuri, agregarea nu este
necesar pentru a defini msurile, ntruct a
fost deja executat la nivelul modelului entitate-asociere.
Ultima etap este definirea ierarhiilor n dimensiuni. n fiecare ierarhie, atributele trebuie
aranjate ntr-un semi-arbore astfel c ntre fiecare nod i descendenii si exist o relaie (1:m).
n etapa de validare a modelului multidimensional, se verific dac dimensiunile i msurile au
fost corect identificate i ierarhiile bine structurate.
Proiectarea logic are ca intrri modelul multidimensional conceptual i un set de informaii
suplimentare. Este necesar s se stabileasc modelul logic utilizat (relaional sau multidimensional). De
exemplu, un model multidimensional conceptual poate fi implementat n baze de date relaionale prin
scheme stea sau fulg de zpad. n aceast etap sunt create tabelele de fapte i cele de dimensiuni pe
baza modelului multidimensional conceptual i n funcie de modelul logic adoptat.
7.3 Metoda Erik Thomsen
n lucrarea19 sa Erik ThomsEn propune o metod pentru proiectarea modelului multidimensional
conceptual ce poate fi utilizat n proiectarea i realizarea unui
sistem MOLAP sau ROLAP.
n etapa de analiz a cerinelor, se vor analiza aspectele fizice i logice ale activitii pentru care
se construiete sistemul OLAP. Se vor stabili, pe baz de interviu sau chestionar:
frecvena de utilizare a sistemului pe categorii de utilizatori;
numrul de utilizatori pe categorie i categoriile de utilizatori ai sistemului;
tipul de dialog specific pentru fiecare categorie de utilizatori;
volumul de date utilizat de fiecare categorie de utilizatori, n timpul unei sesiuni de lucru;
categoriile de informaii vizualizate de fiecare categorie de utilizatori;
tipurile de instrumente utilizate pentru a vizualiza sau analiza datele;
volumul de date de intrare;
sursele de date i problemele ce apar ca urmare a integrrii acestor surse eteroge;
tipurile de calcule ad-hoc ce se execut de regul pe server;
tipurile de calcule ce trebuie antecalculate;
tipurile de calcule executate de regul pe clien client;
frecvena de actualizare a datelor pe server;
tipurile de calculatoare, sistemele de operare i configuraiile de reea utilizate.
Proiectanul culege informaii de la toate persoanele care utilizeaz direct sau indirect sistemul. Unele
din informaiile relevante pot fi exprimate de utilizatori sub form de restricii la soluie. O soluie
19

Thomsen E., OLAP Solutions: Building Multidimensional Information Systems, John Wiley&Sons, New York, (1996).

13

poate include urmtoarele tipuri de restricii de sistem: tipul de calculator, sistemul de operare,
rezoluia monitorului, protocolul de reea, instrumentele client, numrul de utilizatori ai sistemului,
tipurile de date valide etc. Pe baza acestor informaii se va construi o diagram a surselor i a modului
de utilizare (arat ce tipuri de date intr n sistem i cine utilizeaz datele). Este un model logic al
situaiei curente.
Pentru definirea modelului multidimensional conceptual se parcurg urmtorii pai:
definirea cuburilor i a dimensiunilor;
rafinarea cuburilor n-dimensionale;
identificarea ierarhiilor;
identificarea variabilelor;
stabilirea formulelor de calcul necesare analizelor i a tipurilor de agregare;
tratarea fenomenului de mprtiere
definirea modelelor de calcul necesare analizelor.
Definirea cubului de date sau a structurii multicub va depinde, n primul rnd, de tipul i
formatul surselor de date. Aceste surse vor determina identificarea dimensiunilor cubului i a
variabilelor. n absena surselor de date, se vor identifica mai nti, pe baza studiului i analizei
activitii pentru care se construiete sistemul, variabilele sau indicatorii de performan ai activitii
respective. Apoi pentru fiecare indicator (variabil) se vor stabili factorii n funcie de care variaz
(dimensiunile cubului n-dimensional).
n urntoarea etap se realizeaz rafinarea cuburilor n-dimensionale. Structura
multidimensional, identificat n etapa anterioar se poate rafina prin adugarea sau tergerea
dimensiunilor. Pentru a elimina valorile fr semnificaie i a reduce explozia datelor derivate n cub, se
pot combina dou sau mai multe dimensiuni ntr-o singur dimensiune. De asemenea, se pot aduga
dimensiuni i anume dimensiunea Timp (dac nu exist), o dimensiune foarte important n sistemele
OLAP. Este necesar a se stabili i dimensiunile care se modific frecvent i care este rata de modificare
a fiecrei dimensiuni.
Odat terminat etapa de rafinare se poate parcurge etapa de identificare a ierarhiilor din
dimensiuni. Dimensiunile pot avea structur ierarhic. Problema care apare este de a stabili tipul de
ierarhie : simetric sau asimetric. Este necesar a se defini relaiile de tip printe-copil ntre nivelurile
unei ierarhii. De asemenea, se vor identifica dimensiunile care conin ierarhii multiple i criteriile de
grupare a membrilor.
Identificarea variabilelor pe baza studiului i analizei activitii pentru care se construiete
sistemul, se identific variabilele sau indicatorii de performan ai activitii respective. Pentru fiecare
variabil se stabilesc dimensiunile corespunztoare.
O component cheie a modelrii multidimensionale este definirea formulelor i n special a
formulelor de agregare. O astfel de formul poate fi o simpl sum a doi membrii sau complex, un
sistem de ecuaii. Pentru cele mai multe aplicaii, majoritatea formulelor de agregare sunt sume sau
medii aritmetice.
Cnd se proiecteaz i implementeaz un sistem OLAP, trebuie s se cunoasc urmtoarele
aspecte: cum sunt mprtiate datele i ce tip de mprtiere exist. Unele instrumente stabilesc automat
dac datele sunt mprtiate i care combinaii de dimensiuni sunt cele mai mprtiate.
Dac sistemul OLAP va fi folosit pentru analize complexe, n special pentru previziuni, se vor
defini modelele de realizare a acestor analize. Unele instrumente OLAP au incluse astfel de modele, n
acest caz proiectantului i revine sarcina de a alege modelul adecvat. Deasemenea, Erik Thomsen
propune i un mod de reprezentare a unui cub ndimensional, n care segmentele verticale reprezint
dimensiunile cubului ndimensional, iar pentru fiecare segment se specific nivelul de granulaie i
direcia de agregare.
La ora actual nu exist nici o metodologie unanim acceptat pentru proiectarea i
realizarea unui sistem OLAP, dar exist un consens general c proiectarea unui sistem OLAP (n
14

special a unui sistem ROLAP) este un proces complex i evolutiv. Deasemenea, se observ c
modelarea multidimensional a datelor reprezint o etap central n proiectarea unui sistem
OLAP.
Procesul de proiectare a modelului conceptual multidimensional depinde foarte mult de
cerinele utilizatorilor, de valabilitatea i structura datelor din sistemele operaionale surs. Identificarea
cerinelor este foarte mult orientat pe nelegerea domeniului problemei, pentru care modelarea va fi
fcut. Pentru identificarea cerinelor se pot folosi tehnici tradiionale cum ar fi: interviurile cu
utilizatorii finali, studiul documentelor existente i rapoartelor.
Aceste cerine constituie punctul de pornire n proiectarea modelului multidimensional
conceptual.
Tipurile de cereri reprezint cereri, ipoteze i ntrebri analitice pe care utilizatorii ncearc s le
rezolve n activitile de analiz. Aceste cereri sunt exprimate n termenii specifici activitii analizate,
n general nu sunt precis formulate i nu sunt exprimate n limbaj SQL.
Scenariile de analiz a datelor sunt un mod de a aduga substan la setul de cerine ce sunt
identificate i analizate. Sunt mai greu de obinut dect alte cerine de prelucrare i de aceea, nu sunt
ntotdeauna valabile pentru analiza cerinelor. Cerinele orientate pe informaii se refer la
principalele categorii de informaii i date ce sunt cerute de utilizatori pentru activitile de analiz i
anume:
subiectele informaionale (information subject areas) sunt informaii folosite pentru a construi
modelul de date la nivelul organizaiei. Aceste subiecte indic scopul proiectului i permite
analistului de a corela proiectul cu alte pri deja proiectate ale depozitului de date sau cu
centrele de date existente.
modelele de date valabile ca modele la nivel de organizaie, modelele entitate-asociere sau
modelele multidimensionale deja existente.
Etapa de proiectare a modelului multidimensional conceptual este structurat n trei subetape i
anume: proiectarea modelului multidimensional conceptual iniial, rafinarea modelului
multidimensional i validarea modelului multidimensional. Se consider c aceste subetape trebuie
executate indiferent c se proiecteaz un sistem ROLAP sau MOLAP. Deasemenea, n ceea ce privete
proiectarea modelului multidimensional iniial, se identific dou abordri: una orientat pe cereri i
alta orientat pe sursele de date.
Validarea modelului multidimensional presupune verificarea coerenei i completitudinii
modelului multidimensional conceptual i dac corespunde cerinelor utilizatorilor.
n etapa de proiectare logic modelul multidimensional conceptual se transform ntr-un model
logic n funcie de tipul de implementare ales.
n etapa de proiectare fizic, se stabilete dimensiunea bazei de date sau tehnicile de optimizare
utilizate (tipuri de indeci, clustere), n special pentru sistemele ROLAP.
Urmeaz etapa de construire i testare a sistemului OLAP care pune accentul pe definirea
modelelor de analiz complexe, realizarea i testarea elementelor componente ale interfeei, realizarea
prototipului i testarea lui mpreun cu utilizatorii. n aceast etap, se stabilesc ce produse software i
arhitecturi se folosesc.
n etapa de implementare este inclus ncrcarea iniial cu date a bazei de date (pentru prima
iteraie a ciclului de proiectare i realizare a sistemului OLAP). Dac exist un volum mare de noi
cerine, ncepe o nou iteraie a ciclului de proiectare.

15

Bibliografie
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]

Blaschka M., Sapia C., Hfling G., Dinter B., Finding your way through multidimensional data
models, Proc of 9th International Conference on Database and Expert Systems Applications, nr 1460
in LNCS Springer, (1998).
Cabbibo L., Torlone R., A logical approach to multidimensional databases, Proceedings of EDBT98,
Springer, (1998).
Crstea M., O abordare proactiva a bazelor de date: OLAP, Revista Business Intelligence / Market
Watch, nr.77, (iulie 2005).
Codd E.F., Providing OLAP (On-Line Analytical Processing) to user-analysts: An IT mandate,
Technical report, E.F. Codd and Associates, White paper, Arbor Software Corporation, (1993).
Golfarelli M., Rizzi S., Designing the Data Warehouse: Key Steps and crucial issues, Journal of
Computer Science and Information management, vol2, nr.3, (1999).
Holsapple C.W., Whinston A. B., Decision Support Systems: A Knowledge-Based Approach, St. Paul:
West Publishing, (1996).
Holsapple C.W., Whinston A. B., Decision Support Systems: A Knowledge-Based Approach, St. Paul:
West Publishing, (1996).
Inmon W H, Building the Data Warehouse, John Wiley&Sons, New York, (1992).
Kimball R., The Data WarehouseToolkit. The Definitive Guide to Dimensional Modeling 2nd
edition , Wiley&Sons, (2002).
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE,
http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
Power D. A brief History of Decision Support Systems, DSS Resources,
http://dss.cba.uni.edu/dss/dsshistory.html, (1999).
Sandu D.A., Posdarie E., Tehnologia OLAP, Revista Informnatica Economic, nr. 4 (24)/(2002).
Thomsen E., OLAP Solutions: Building Multidimensional Information Systems, John Wiley&Sons,
New York, (1996).

[14]

***, Olap Council, The OLAP glossary, OLAP and OLAP Server Definitions,
http://www.olapcouncil.org/research/glossary.htm, (1997).

[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]

http://www.dce.ase.ro/
http://www.arborsoft.com/
http://www.businessobjects.com/
http://www.cognos.com/
http://www.informix.com/
http://www.ibm.com
http://www.holistic.com/
http://www.kenan.com/
http://www.pilotsw.com/
http://www.olapcouncil.org
http://www.olapreport.com/
http://www.oracle.com
http://www.strategy.com/

16

S-ar putea să vă placă și