Documente Academic
Documente Profesional
Documente Cultură
Sisteme OLAP
On Line Analytical Processing
Bucureti,
2016
Cuprins
Cuprins
Consideraii generale
Apariia i evoluia sistemelor OLAP
Depozite de date. Relaia cu sistemele OLAP
Caracteristici de baz ale OLAP. Regulile lui Codd
Modele de date multidimensionale pentru sisteme OLAP.
Concepte de baz
5.1 Conceptul de cub n-dimensional
5.2 Conceptul de dimensiune
5.3 Conceptul de ierarhie
5.4 Conceptul de msur
5.5 Conceptul de multicub
5.6 Conceptul de mprtiere
6. Evaluarea modelelor multidimensionale
7. Proiectarea sistemelor OLAP
7.1 Metoda lui Cabibbo i Torlone
7.2 Metoda lui Golfarelli
7.3 Metoda Erik Thomsen
Bibliografie
1.
2.
3.
4.
5.
pag.
1
2
3
5
5
6
7
7
8
8
10
10
10
12
12
13
14
17
1. Consideraii generale
Acronimul OLAP pentru On Line Analytical Processing semnific tehnologia (metoda) de
procesare online (n timp real) a unor date. Practic metoda (tehnologia) este o modalitate de interogare
complex a unei baze de date oferind rezultate/rspunsuri specifice unei anumite probleme de interes.
Astfel metoda aparine categoriei IT de Business Intelligence, alturi de metoda ETL (Extract,
Transform and Load), Relational Reporting, Data Mining etc.
n condiiile socio-economice actuale caracterizate de schimbri rapide, accesul rapid (n timp
real) al factorilor decizionali (managementul) ai unei organizaii reprezint un factor important al
asigurrii competitivitii respectivei organizaii. Mai mult informaia trebuie, n plus fa de timpul de
rspuns rapid, trebuie s fie ntr-un format convenabil (utilizabil fr transformri/prelucrri) ulterioare
i nu n ultimul rnd la un cost convenabil.
n rndul specialitilor n domeniu exist o unanimitate de opinie asupra apartenen ei sistemelor OLAP
la sistemele suport de decizie - SSD (DSS Decision Support Systems), ns dup unii specialiti1 OLAP aparin
SSD orientate pe date, n timp majoritatea 2 consider OLAP ca aparinnd SSD hibride justificat de faptul c
sunt utilizate tehnici de analiz simple (analiza multidimensional a datelor) asupra seturilor mari de date.
Fr a face o analiz detaliat a conceptului de SSD s-a considerat oportun men ionarea celor cinci
caracteristici specifice SSD-urilor evideniate de Holsapple i Whinston3:
Utilizatorii:
interni/externi
Scopul:
general/specific
Arhitectura
utilizat
(1)
(2)
(3)
(4)
Echipe interne/
parteneri externi
Suport pentru
comunicare i colaborare
Web sau
client/server
Manageri, furnizori
Mainframe,
client/server,
Web
(2)
(3)
(4)
Comunicaii
SSD-uri orientate pe
comunicaii
Baze de date
SSD-uri orientate pe
date
(1)
1
Power D. A brief History of Decision Support Systems, DSS Resources, http://dss.cba.uni.edu/dss/dsshistory.html, (1999).
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
3
Holsapple C.W., Whinston A. B., Decision Support Systems: A Knowledge-Based Approach, St. Paul: West Publishing,
(1996).
4
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
2
Baze de documente
SSD-uri orientate pe
documente
Baze de cunotine
SSD-uri orientate pe
cunotine
Modele
SSD-uri orientate pe
modele
Modele/ baze de date
i comunicaii
SSD-uri
interorganizaionale
/intraorganizaionale
Modele/ baze de date
i comunicaii
SSD-uri bazate pe Web
Modele/baze de date
SSD-uri specializate
Client/server, Web
Client/server,
Web, PC
Manageri, clieni
Folosete modele
PC,client/server, Web
Utilizatori
interni i externi
Suport pentru
intermediari
Client/server,
Web
Utilizatori
interni i externi
Web
Utilizatori interni
Specializate pe anumite
domenii de activitate sau
cu un scop mai general
(generator SSD)
PC, client/server
n cadrul Sistemelor Suport de Decizie Orientate pe Date (SSDOD) pot fi definite urmtoarele
categorii principale de SSD:
sisteme informatice executive;
sisteme suport de decizie spaiale;
sisteme suport de decizie care utilizeaz depozite de date;
sisteme OLAP.
SSOD prin capacitatea lor de acces mai uor i mai ales rapid la colecii mari de date au suscitat
un interes crescut din partea managementului organizaiilor, ca utilizatori direci i cei mai vizai ai
acestor sisteme.
Sistemele OLAP opereaz cu sisteme de date multidimensionale (diferite conceptual fa de
modelul relaional) i permite efectuarea de interogri analitice complexe ad-hoc, cu vitez mare de
procesare. Datorit acestui fapt exist propuneri5 ca OLAP s fie denumit FASMI (Fast Analysis of
Shared Multidimensional Information). Rezultatul interogrii unei baze OLAP s-a dovedit a fi de pn
la 1000 de ori mai rapid6 dect lucrul cu baze de date relaionale.
Crstea M., O abordare proactiva a bazelor de date: OLAP, Revista Business Intelligence / Market Watch, nr.77,
(iulie 2005).
6
Idem.
7
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE, http://www.bibliotecadigitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
1978-1979 apare o nou generaie de limbaj de modelare financiar prin combinarea funciilor
analitice de modelare cu tehnologia gestiunii datelor, avnd capabilitatea de a gestiona volume
mult mai mari de date (asociate conceptului de multidimensionalitate)/ Apare astfel primul
instrument OLAP pentru aplicaii financiare System W DSS, folosit ca suport financiar decizional n
activitatea bugetar, previzionare i planificare strategic ;
1984 apare primul instrument ROLAP (Relational Online Analytical Processing), denumit
Methafor, prin care au fost implementate noi concepte: calcule distribuite client/server, procesare
multidimensional a datelor relaionale etc.;
mijlocul decadei 80 apare conceptul EIS (Executive Information System) ;
1985 apariia PCC (Pilot Command Center), primul instrument OLAP tip EIS cu arhitectur
client/server. Instrumentul se bazeaz pe analiza seriilor de timp;
1990 este lansat primul instrument OLAP cu arhitectur desktop, Cognos Power Play, pentru
platforme Windows (au fost lansate i versiuni pentru arhitecturi client/server i Web);
1991/1992 a fost creat un server de baze de date multidimensionale i multiutilizator Essbase;
1993 Codd introduce termenul de OLAP i formuleaz un set de 12 reguli pentru aceste sisteme.
Evideniaz8 diferenele dintre tehnologia sistemelor multidimensionale i tehnologia sistemelor
tranzacionale;
1994 este lansat Microstrategy DSS Agent, primul instrument ROLAP fr motor multidimensional.
Procesarea este executat n limbaj SQL / pentru baze de date foarte mari;
1995 apare HOLOS 4.0, primul OLAP hibrid, care permite accesul att la baze de date
relaionale ct i la cele multidimensionale;
1995 apare consiliul OLAP cu scopul de a face sistemele OLAP mult mai atrgtoare pe pia, prin
stabilirea unor standarde deschise (OLAP API) i definirea clar a no iunilor, termenilor, procedurilor
etc.;
1995 Microsoft elaboreaz OLEDB for OLAP, un standard de acces lasursele de date
multidimensionale, un model pentru cuburi i dimensiuni, un limbaj MDX (Multidimensional
EXpressions) pentru calcul i vizualizare a cuburilor etc.;
1997 apare standardul MDIS (Metadata Interchange Specification) propusde un grup de
firme (IBM, Sybase, Informix), care ofer un mecanism standard de acces i o interfa standard
pentru a gestiona metadatele;
1998 este lansat IBM DB2 OLAP Server, o versiune a lui Essbase, care utilizeaz date stocate
n baze de date relaionale (schem stea);
1998 apare Microsoft OLAP Services (numit iniial Plato sau Decision Support Services) ce
utilizeaz o arhitectur de stocare complex (ROLAP/MOLAP/HOLAP);
2000 Microsoft redenumete Microsoft OLAP Services ca Microsoft Analysis Services;
Codd E.F., Providing OLAP (On-Line Analytical Processing) to user-analysts: An IT mandate, Technical report, E.F. Codd
and Associates, White paper, Arbor Software Corporation, (1993).
2002 Oracle lanseaz Oracle9i Release 2 OLAP care integreaz toatefacilitile OLAP
(Analytical Workspace) n baza de date relaional Oracle.
n concluzie,se poate afirma c la ora actual nu exist nici un model de date multidimensional
(conceptual i formal) acceptat n unanimitate. Un astfel de model este totui necesar pentru a servi ca o
fundamentare pentru standardizare i cercetarea viitoare.
detaiate
curente
destinate operatorilor
repetitive
orientate pe aplicaie
neredundante
statice
suport pentru operaii zilnice
agregate
serii de timp
destinate managerilor
nerepetitive
orientate pe subiect
redundante
dinamice
suport strategic
Inmon W H, Building the Data Warehouse, John Wiley&Sons, New York, (1992).
Regula 9: Denormalizarea datelor prelucrarea datelor ntr-un mediu OLAP nu trebuie s afecteze
datele externe ce servesc ca surs.
Regula 10: Stocarea rezultatelor generate de instrumentul OLAP sistemele OLAP trebuie s
stocheze datele separat de sistemele tranzacionale.
Regula 11: Manipularea valorilor lips. Valorile lips sunt diferite de valorile zero i cele invalide.
Regula 12: Modul de tratare al valorilor lips. Valorile lips sunt ignorate de OLAP, indiferent de
sursa lor.
Modul de reprezentare a datelor
ntr-o schem stea sunt tabelele care se dispun radial n jurul tabelei de fapte i se mai numesc
tabele de dimensiuni.
5.3 Conceptul de ierarhie
O ierarhie este un atribut al unei dimensiuni. Cele mai multe dimensiuni au o structur multinivel sau ierarhic. Criteriile dup care datele suntagregate pentru analiz i raportare trebuie s fie
aceleai cu factorii folosii n procesul decizional.
Elementele individuale sau nodurile sunt numite membri. Cei mai muli membri au conexiuni
n sus i jos, n ierarhie. Conexiunile n sus sunt de tip (m:1) i sunt numite asocieri printe.
Conexiunile n jos sunt de tip (1:m) i sunt numite asocieri copil. n general, un membru poate avea un
singur printe. Un membru ce nu are printe se numete membru rdcin (root). Membrii ce nu au
copii sunt numii frunz.
Pentru a identifica poziia unui membru ntr-o dimensiune se folosesc conceptele de nlime i
adncime n ierarhie. nlimea se stabilete de jos n sus. Adncimea n ierarhie este stabilit de sus n
jos. Exist posibilitatea ca doi membri, care au aceeai nlime, s aib adncimi diferite i invers
(structuri arborescente neechilibrate). n glosarul de termeni OLAP13 se specific c membrii
dimensiunilor pot fi organizai pe baza relaiilor de tip printe-copil, unde un membru printe
reprezint consolidarea (agregarea) membrilor copil. Rezultatul este o ierarhie i relaiile
printe/copil sunt relaii ierarhice.
Ierarhiile sunt fundamentul pentru agregarea datelor i pentru navigarea ntre nivelurile de
detaliu dintr-un cub n-dimensional. Dei nu toate dimensiunile conin ierarhii, toate aplicaiile din
lumea real implic dimensiuni ierarhice. Numrul de ierarhii distincte ntr-o structur
multidimensional este egal cu produsul dintre numrul de ierarhii din fiecare dimensiune.
Dei majoritatea datelor stocate n cuburile n-dimensionale sunt numerice, orice tip de date de
la text la grafice i chiar sunete pot fi multidimensionale. Multe instrumente OLAP ofer abilitatea de a
popula cuburile n-dimensionale cu date text. Datele numerice sunt mai potrivite pentru aplicaiile
OLAP, deoarece au o organizare multidimensional i se pot agrega.
5.4 Conceptul de msur
O msur (variabil) este un indicator de performan prin care se poate analiza performana
activitii modelate (de regul un atribut numeric al unui element din colecia de fapte). Valorile unui
indicator se modific continuu. Pentru fiecare combinaie posibil ntre dimensiuni, exist sau nu o
valoare corespunztoare a indicatorilor. Nu orice atribut numeric este un indicator. Dac valoarea
atributului numeric variaz continuu, atunci atributul este un indicator, iar dac atributul este perceput
mai mult ca o constant, atunci este un atribut dimensional. Indicatorii pot fi clasificai n:
indicatori de baz;
indicatori derivai care se obin prin combinarea indicatorilor de baz.
O alt clasificare este dat n cartea sa de Ralph Kimball 14 n cartea sa, i anume dup
posibilitatea indicatorilor de a se nsuma dup dimensiuni:
indicatori aditivi care se pot nsuma dup toate dimensiunile;
indicatori semiaditivi care se pot nsuma numai dup unele dimensiuni;
indicatori neaditivi care nu se pot nsuma dup nici o dimensiune. Variabilele neaditive pot fi
combinate cu alte variabile pentru a deveni aditive.
5.5 Conceptul de multicub
13
***, Olap Council, The OLAP glossary, OLAP and OLAP Server Definitions,
http://www.olapcouncil.org/research/glossary.htm, (1997).
14
Kimball R., The Data WarehouseToolkit. The Definitive Guide to Dimensional Modeling 2nd edition , Wiley&Sons,
(2002).
modele folosesc mai multe semantici. Aceasta poate fi interpretat ca o tendin a mbogirii semantice
a modelelor multidimensionale.
Tabel 3. Analiz comparativ a modelelor multidimensionale
Nivelul
conceptual
logic
StarER
Kimball, Teste
Teste, Li i Wang, Gyssens
formal
Cabibbo, Agrawal,
Vassiliadis,
Guazzo
Blaschka M., Sapia C., Hfling G., Dinter B., Finding your way through multidimensional data models, Proc of 9th
International Conference on Database and Expert Systems Applications, nr 1460 in LNCS Springer, (1998).
16
Idem.
17
Cabbibo L., Torlone R., A logical approach to multidimensional databases, Proceedings of EDBT98, Springer, (1998).
11
De obicei, primele dou etape nu sunt strict secveniale, n multe cazuri ele se execut n paralel
(n etapa de restructurare a modelului entitate-asociere, faptele i dimensiunile identificate pot fi
rafinate i modificate). Apoi celelalte etape se execut secvenial, ntruct fiecare etap cere
completarea etapei anterioare.
7.2 Metoda lui Golfarelli
Golfarelli18 propune o metodologie pentru proiectarea unui depozit de date (utilizabil pentru
proiectarea unui sistem ROLAP). Aceast metodologie pune accentul pe proiectarea modelului
multidimensional conceptual. Tabelul 4 prezint etapele acestei metodologii.
Etape
analiza sistemului
informatic existent
specificarea
cerinelor
proiectarea
conceptual
(modelul multidimensional)
Intrri
documentaia
existent
schema bazei de
date operaionale
proiectant, manageri ai
sistemului informatic
schema bazei de
date operaionale
faptele
proiectant,
utilizatori finali
modelul
multidimensional
proiectant
validarea modelului
multidimensional
modelul multidimensional
conceptual
proiectarea logic
modelul multidimensional,
modelul logic utilizat
modelul logic al
depozitului, SGBD-ul ales
proiectarea fizic
modelul
multidimensional
validat
modelul logic al
depozitului de date
modelul fizic al
depozitului
proiectant,
utilizatori finali
proiectant
proiectant
Golfarelli M., Rizzi S., Designing the Data Warehouse: Key Steps and crucial issues, Journal of Computer Science and
Information management, vol2, nr.3, (1999).
12
nesemnificative pentru analiz. Prin tergerea unui subarbore, atributele componente vor fi terse i nu
vor fi incluse n schema fapt. Astfel, nu se vor putea utiliza pentru agregarea datelor.
n mod firesc, urmtoarea etap este definirea dimensiunilor. Dimensiunile determin cum pot fi
agregate instanele unui fapt. Dimensiunile trebuie s fie alese din arborele de atribute (dup ce
arborele a fost rafinat). Stabilirea dimensiunilor este o etap important, ntruct determin granulaia
instanelor unui fapt. De asemenea, Timpul este o dimensiune important. Modelele entitate-asociere
pot fi clasificate n funcie de modul cum trateaz timpul n fotografii (snapshot) i temporale. Un
model fotografie descrie starea curent a domeniului aplicaiei. Un model temporal descrie evoluia n
timp a domeniului aplicaiei.
Pentru definirea msurilor se construiete un dicionar care descrie modul cum se calculeaz
aceste msuri pe baza atributelor modelului entitate-asociere surs. Un fapt poate s nu aib asociate
atribute (singura informaie ce este nregistrat este apariia faptului). n unele cazuri, agregarea nu este
necesar pentru a defini msurile, ntruct a
fost deja executat la nivelul modelului entitate-asociere.
Ultima etap este definirea ierarhiilor n dimensiuni. n fiecare ierarhie, atributele trebuie
aranjate ntr-un semi-arbore astfel c ntre fiecare nod i descendenii si exist o relaie (1:m).
n etapa de validare a modelului multidimensional, se verific dac dimensiunile i msurile au
fost corect identificate i ierarhiile bine structurate.
Proiectarea logic are ca intrri modelul multidimensional conceptual i un set de informaii
suplimentare. Este necesar s se stabileasc modelul logic utilizat (relaional sau multidimensional). De
exemplu, un model multidimensional conceptual poate fi implementat n baze de date relaionale prin
scheme stea sau fulg de zpad. n aceast etap sunt create tabelele de fapte i cele de dimensiuni pe
baza modelului multidimensional conceptual i n funcie de modelul logic adoptat.
7.3 Metoda Erik Thomsen
n lucrarea19 sa Erik ThomsEn propune o metod pentru proiectarea modelului multidimensional
conceptual ce poate fi utilizat n proiectarea i realizarea unui
sistem MOLAP sau ROLAP.
n etapa de analiz a cerinelor, se vor analiza aspectele fizice i logice ale activitii pentru care
se construiete sistemul OLAP. Se vor stabili, pe baz de interviu sau chestionar:
frecvena de utilizare a sistemului pe categorii de utilizatori;
numrul de utilizatori pe categorie i categoriile de utilizatori ai sistemului;
tipul de dialog specific pentru fiecare categorie de utilizatori;
volumul de date utilizat de fiecare categorie de utilizatori, n timpul unei sesiuni de lucru;
categoriile de informaii vizualizate de fiecare categorie de utilizatori;
tipurile de instrumente utilizate pentru a vizualiza sau analiza datele;
volumul de date de intrare;
sursele de date i problemele ce apar ca urmare a integrrii acestor surse eteroge;
tipurile de calcule ad-hoc ce se execut de regul pe server;
tipurile de calcule ce trebuie antecalculate;
tipurile de calcule executate de regul pe clien client;
frecvena de actualizare a datelor pe server;
tipurile de calculatoare, sistemele de operare i configuraiile de reea utilizate.
Proiectanul culege informaii de la toate persoanele care utilizeaz direct sau indirect sistemul. Unele
din informaiile relevante pot fi exprimate de utilizatori sub form de restricii la soluie. O soluie
19
Thomsen E., OLAP Solutions: Building Multidimensional Information Systems, John Wiley&Sons, New York, (1996).
13
poate include urmtoarele tipuri de restricii de sistem: tipul de calculator, sistemul de operare,
rezoluia monitorului, protocolul de reea, instrumentele client, numrul de utilizatori ai sistemului,
tipurile de date valide etc. Pe baza acestor informaii se va construi o diagram a surselor i a modului
de utilizare (arat ce tipuri de date intr n sistem i cine utilizeaz datele). Este un model logic al
situaiei curente.
Pentru definirea modelului multidimensional conceptual se parcurg urmtorii pai:
definirea cuburilor i a dimensiunilor;
rafinarea cuburilor n-dimensionale;
identificarea ierarhiilor;
identificarea variabilelor;
stabilirea formulelor de calcul necesare analizelor i a tipurilor de agregare;
tratarea fenomenului de mprtiere
definirea modelelor de calcul necesare analizelor.
Definirea cubului de date sau a structurii multicub va depinde, n primul rnd, de tipul i
formatul surselor de date. Aceste surse vor determina identificarea dimensiunilor cubului i a
variabilelor. n absena surselor de date, se vor identifica mai nti, pe baza studiului i analizei
activitii pentru care se construiete sistemul, variabilele sau indicatorii de performan ai activitii
respective. Apoi pentru fiecare indicator (variabil) se vor stabili factorii n funcie de care variaz
(dimensiunile cubului n-dimensional).
n urntoarea etap se realizeaz rafinarea cuburilor n-dimensionale. Structura
multidimensional, identificat n etapa anterioar se poate rafina prin adugarea sau tergerea
dimensiunilor. Pentru a elimina valorile fr semnificaie i a reduce explozia datelor derivate n cub, se
pot combina dou sau mai multe dimensiuni ntr-o singur dimensiune. De asemenea, se pot aduga
dimensiuni i anume dimensiunea Timp (dac nu exist), o dimensiune foarte important n sistemele
OLAP. Este necesar a se stabili i dimensiunile care se modific frecvent i care este rata de modificare
a fiecrei dimensiuni.
Odat terminat etapa de rafinare se poate parcurge etapa de identificare a ierarhiilor din
dimensiuni. Dimensiunile pot avea structur ierarhic. Problema care apare este de a stabili tipul de
ierarhie : simetric sau asimetric. Este necesar a se defini relaiile de tip printe-copil ntre nivelurile
unei ierarhii. De asemenea, se vor identifica dimensiunile care conin ierarhii multiple i criteriile de
grupare a membrilor.
Identificarea variabilelor pe baza studiului i analizei activitii pentru care se construiete
sistemul, se identific variabilele sau indicatorii de performan ai activitii respective. Pentru fiecare
variabil se stabilesc dimensiunile corespunztoare.
O component cheie a modelrii multidimensionale este definirea formulelor i n special a
formulelor de agregare. O astfel de formul poate fi o simpl sum a doi membrii sau complex, un
sistem de ecuaii. Pentru cele mai multe aplicaii, majoritatea formulelor de agregare sunt sume sau
medii aritmetice.
Cnd se proiecteaz i implementeaz un sistem OLAP, trebuie s se cunoasc urmtoarele
aspecte: cum sunt mprtiate datele i ce tip de mprtiere exist. Unele instrumente stabilesc automat
dac datele sunt mprtiate i care combinaii de dimensiuni sunt cele mai mprtiate.
Dac sistemul OLAP va fi folosit pentru analize complexe, n special pentru previziuni, se vor
defini modelele de realizare a acestor analize. Unele instrumente OLAP au incluse astfel de modele, n
acest caz proiectantului i revine sarcina de a alege modelul adecvat. Deasemenea, Erik Thomsen
propune i un mod de reprezentare a unui cub ndimensional, n care segmentele verticale reprezint
dimensiunile cubului ndimensional, iar pentru fiecare segment se specific nivelul de granulaie i
direcia de agregare.
La ora actual nu exist nici o metodologie unanim acceptat pentru proiectarea i
realizarea unui sistem OLAP, dar exist un consens general c proiectarea unui sistem OLAP (n
14
special a unui sistem ROLAP) este un proces complex i evolutiv. Deasemenea, se observ c
modelarea multidimensional a datelor reprezint o etap central n proiectarea unui sistem
OLAP.
Procesul de proiectare a modelului conceptual multidimensional depinde foarte mult de
cerinele utilizatorilor, de valabilitatea i structura datelor din sistemele operaionale surs. Identificarea
cerinelor este foarte mult orientat pe nelegerea domeniului problemei, pentru care modelarea va fi
fcut. Pentru identificarea cerinelor se pot folosi tehnici tradiionale cum ar fi: interviurile cu
utilizatorii finali, studiul documentelor existente i rapoartelor.
Aceste cerine constituie punctul de pornire n proiectarea modelului multidimensional
conceptual.
Tipurile de cereri reprezint cereri, ipoteze i ntrebri analitice pe care utilizatorii ncearc s le
rezolve n activitile de analiz. Aceste cereri sunt exprimate n termenii specifici activitii analizate,
n general nu sunt precis formulate i nu sunt exprimate n limbaj SQL.
Scenariile de analiz a datelor sunt un mod de a aduga substan la setul de cerine ce sunt
identificate i analizate. Sunt mai greu de obinut dect alte cerine de prelucrare i de aceea, nu sunt
ntotdeauna valabile pentru analiza cerinelor. Cerinele orientate pe informaii se refer la
principalele categorii de informaii i date ce sunt cerute de utilizatori pentru activitile de analiz i
anume:
subiectele informaionale (information subject areas) sunt informaii folosite pentru a construi
modelul de date la nivelul organizaiei. Aceste subiecte indic scopul proiectului i permite
analistului de a corela proiectul cu alte pri deja proiectate ale depozitului de date sau cu
centrele de date existente.
modelele de date valabile ca modele la nivel de organizaie, modelele entitate-asociere sau
modelele multidimensionale deja existente.
Etapa de proiectare a modelului multidimensional conceptual este structurat n trei subetape i
anume: proiectarea modelului multidimensional conceptual iniial, rafinarea modelului
multidimensional i validarea modelului multidimensional. Se consider c aceste subetape trebuie
executate indiferent c se proiecteaz un sistem ROLAP sau MOLAP. Deasemenea, n ceea ce privete
proiectarea modelului multidimensional iniial, se identific dou abordri: una orientat pe cereri i
alta orientat pe sursele de date.
Validarea modelului multidimensional presupune verificarea coerenei i completitudinii
modelului multidimensional conceptual i dac corespunde cerinelor utilizatorilor.
n etapa de proiectare logic modelul multidimensional conceptual se transform ntr-un model
logic n funcie de tipul de implementare ales.
n etapa de proiectare fizic, se stabilete dimensiunea bazei de date sau tehnicile de optimizare
utilizate (tipuri de indeci, clustere), n special pentru sistemele ROLAP.
Urmeaz etapa de construire i testare a sistemului OLAP care pune accentul pe definirea
modelelor de analiz complexe, realizarea i testarea elementelor componente ale interfeei, realizarea
prototipului i testarea lui mpreun cu utilizatorii. n aceast etap, se stabilesc ce produse software i
arhitecturi se folosesc.
n etapa de implementare este inclus ncrcarea iniial cu date a bazei de date (pentru prima
iteraie a ciclului de proiectare i realizare a sistemului OLAP). Dac exist un volum mare de noi
cerine, ncepe o nou iteraie a ciclului de proiectare.
15
Bibliografie
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
Blaschka M., Sapia C., Hfling G., Dinter B., Finding your way through multidimensional data
models, Proc of 9th International Conference on Database and Expert Systems Applications, nr 1460
in LNCS Springer, (1998).
Cabbibo L., Torlone R., A logical approach to multidimensional databases, Proceedings of EDBT98,
Springer, (1998).
Crstea M., O abordare proactiva a bazelor de date: OLAP, Revista Business Intelligence / Market
Watch, nr.77, (iulie 2005).
Codd E.F., Providing OLAP (On-Line Analytical Processing) to user-analysts: An IT mandate,
Technical report, E.F. Codd and Associates, White paper, Arbor Software Corporation, (1993).
Golfarelli M., Rizzi S., Designing the Data Warehouse: Key Steps and crucial issues, Journal of
Computer Science and Information management, vol2, nr.3, (1999).
Holsapple C.W., Whinston A. B., Decision Support Systems: A Knowledge-Based Approach, St. Paul:
West Publishing, (1996).
Holsapple C.W., Whinston A. B., Decision Support Systems: A Knowledge-Based Approach, St. Paul:
West Publishing, (1996).
Inmon W H, Building the Data Warehouse, John Wiley&Sons, New York, (1992).
Kimball R., The Data WarehouseToolkit. The Definitive Guide to Dimensional Modeling 2nd
edition , Wiley&Sons, (2002).
Muntean, M., Iniiere n tehnologia OLAP - Teorie i practica, Biblioteca digital ASE,
http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=280&idb, [05/01/2016].
Power D. A brief History of Decision Support Systems, DSS Resources,
http://dss.cba.uni.edu/dss/dsshistory.html, (1999).
Sandu D.A., Posdarie E., Tehnologia OLAP, Revista Informnatica Economic, nr. 4 (24)/(2002).
Thomsen E., OLAP Solutions: Building Multidimensional Information Systems, John Wiley&Sons,
New York, (1996).
[14]
***, Olap Council, The OLAP glossary, OLAP and OLAP Server Definitions,
http://www.olapcouncil.org/research/glossary.htm, (1997).
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
http://www.dce.ase.ro/
http://www.arborsoft.com/
http://www.businessobjects.com/
http://www.cognos.com/
http://www.informix.com/
http://www.ibm.com
http://www.holistic.com/
http://www.kenan.com/
http://www.pilotsw.com/
http://www.olapcouncil.org
http://www.olapreport.com/
http://www.oracle.com
http://www.strategy.com/
16