Sunteți pe pagina 1din 30

OLAP On-Line Analytical Processing

tehnologie de agregare a datelor stocate n depozite ntr-o abordare multidimensional care asigur acces rapid la informaiile necesare decidenilor ntr-o manier consistent, interactiv i foarte flexibil. OLAP transform volumul imens de date stocate i gestionate n depozite n informaii utile procesului de decizie.
Numele tehnologiei OLAP - introdus n 1993 de ctre E. F. Codd

testul FASMI (Fast Analysis Shared Multidimensional Information)

Fast rapiditate (capacitatea de a livra informaiile n timp


util de ordinul secundelor) Analysis analiz (capacitatea de a efectua analize numerice i statistice prin aplicaii predefinite sau create ad-hoc de ctre utilizator. Shared partajat (utilizat n regim concurent de mai muli utilizatori, fapt ce impune asigurarea securitii i confidenialitii datelor ) Multidimensional Caracteristica esenial a OLAP Information Acces la orice date i informaii relevante pentru analiz, oriunde s-ar gsi i n orice volum
2

Clieni Client n

Client4 Client3 Client2 Client1


P1 P2 P3 P4 Pn

regie aproviz transport depozitare Produse Categorii de produse

Timp

Ierarhia Anotimp

Ierarhia Calendar Anul Ierarhia Sapte_zile Semestrul Sptmna

Sezonul

Trimestrul

Luna

Ziua

Data calendaristic

Ierarhii alternative ale dimensiunii TIMP Nivelele sunt numerotate de la rdcin (nivelul 0) spre frunze (nivelul maxim). Fiecare ierarhie are setul ei de nivele chiar dac anumite ramuri sunt comune.
4

all Zona Ierarhia Forma Juridica

Ierarhia Geografie

Judet

Ierarhia Clasificare

Localitate Statut

Categorie

Subctg

Client

Ierarhiile alternative ale dimensiunii CLIENT

msura activitii -aspectul cantitativ, comensurabil n uniti


clasice de msur: kg, m, buci, uniti monetare.

Exemple: - volumul vnzrilor (cantitativ/valoric), - volumul achiziiilor (cantitativ/valoric), - volumul salariilor, costul transportului, costul mrfurilor, - costul materiilor prime, - volumul taxelor i impozitelor, - volumul datoriilor, - volumul creanelor, - marja comercial brut, - profitul, etc.

fapte colecii de msuri ale activitii i dimensiunile care


identific contextul n care s-au desfurat.

Faptele se colecteaz din - tabelele de fapte din depozite - direct din nregistrrile stocate n tabelele de tranzacii ale aplicaiilor operaionale ce susin activitatea respectiv Prin intermediul dimensiunii scenarii se pot stoca n tabelele de fapte - msurile reale - msuri imaginate - valorile bugetate - valorile estimate Aceste msuri sunt introduse direct n tabelele de fapte de ctre persoanele responsabile.

Modelarea dimensional cuburi OLAP


Modelarea dimensional este o tehnic ce permite conceptualizarea i reprezentarea aspectelor cantitative, msurabile ale activitii n strns legtur cu contextul n care s-a desfurat activitatea respectiv.
Acest context este identificat prin parametrii activitii: - unde - cnd s-a desfurat activitatea respectiv - cine a iniiat-o - cine a executat-o - cine a beneficiat - ce resurse au fost consumate - ce structuri organizatorice au fost implicate - etc.
8

Modelarea dimensional ofer un model conceptual comun tuturor


rapoartelor extrase din sistemele tranzacionale - posibilitatea de agregare a rapoartelor ntr-o structur uniform, simpl i foarte flexibil, - pstrarea legturii cu sursele iniiale de date - posibilitatea de drill-down (tehnica de descompunere a datelor centralizate pe niveluri succesive pn la setul de tranzacii iniiale). Principalul element structural al datelor utilizate n procesul de analiz on-line este cubul OLAP o structur multidimensional, un hipercub, care modeleaz aspectul complex al activitii desfurat pe o lung perioad de timp prin trei concepte: msuri dimensiuni fapte
9

Modelarea datelor este un pas important n procesul de dezvoltare a unui depozit de date pentru c permite vizualizarea structurii nainte de a fi construit.

Modelul multidimensional hipercubul - este ns dificil de vizualizat n toate dimensiunile i trebuie prezentat desfurat n seciuni sau proiecii tridimensionale pentru a putea fi neles

seciunea este o felie transversal din cub, identificat prin coordonatele seciunii proiecia este o seciune care centralizeaz datele de pe toate dimensiunile suprimate
10

Selecia produce un cub cu acelai numr de dimensiuni, setul de membri pe fiecare fiind restrns prin enumerarea membrilor selectai, prin intervale sau prin condiii puse asupra msurilor. Exemple de selecii:
alfa beta p na ma a 1 2 m

alfa beta gama 1 a alfa gama 1 2 3 n 2 a 3 a

beta 1 p 2 3

beta gama 3

11

Proiecia realizeaz restrngerea dimensiunilor unui cub la un numr precizat de axe. Dimensiunile suprimate conduc la nsumarea msurilor n celulele corespunztoare membrilor din dimensiunile vizibile. Pentru exemplificare, prezentm un cub tridimensional proiectat pe cele trei plane:

mar mar mar feb ian C1 C2 C3 all feb ian C1 C2 C3 P3 P2 P1 a P3 P2 C1 C2 C3 P1 a feb ian all P3 P2 P1 a

all

12

Pentru modelare, hipercubul se prezint n forma tabelar cu coloane pentru msuri i rnduri pentru combinaiile de dimensiuni.
Dimensiuni
Cantitate Anul 1999 1999 Luna 1 1 Agent AAA AAA Client Alexa Alexa Produs Ciment Var 100 30

Msuri
Valoare 33000 5000 Cost marfa 20700 4300 Chelt transp 500 120 Alte chelt 234 57

2001

10

XXX

YETA

Vopsea

400

132000

82800

780

560

Bazele de date dedicate datelor modelate ca hipercuburi sunt bazele de date multidimensionale
13

Baze de date multidimensionale

Structura datelor - n care sunt stocate msurile activitii


preluate din tabela de fapte a depozitului de date (cantiti, valori, contoare, etc), date care sunt prezentate utilizatorului n celulele tabelelor pivot.
Cant Val Nr_linii_fct

Structura metadatelor - n care sunt stocate dimensiunile i


membrii acestora precum i structurile ierarhice ale dimensiunilor, toate informaiile care apar pe axele cuburilor i sunt prezentate utilizatorului ca nume de rnduri i coloane n tabelele pivot.
14

Operatii pe hipercub
Pentru navigaia pe o structur arborescent, sistemele de gestiune ofer operatori ierarhici. - Children - Parents - Ascendent - Descendents Pentru exploatarea datelor, sistemele de gestiune ofer operatori relaionali pe hipercuburi. Selecia, Proiecia, Reuniunea, Intersecia, Diferena, Produsul cartezian, Diviziunea, Join, Din punct de vedere fizic, datele sunt stocate ntr-un fi ier cu acces direct. Accesul la o anumit nregistrare se face pe baza adresei fizice absolute sau relative a nregistrrii obinute prin exploatarea tabelelor bitmap construite la crearea structurii de date.
15

Operaii OLAP asupra hipercubului


Proiectarea hipercubului trebuie s in seama de nivelul de detaliu necesar la analiz, nivel de detaliu denumit granularitate i care exprim numrul de membri ai unei dimensiuni. Dac granularitatea din start este prea mare (grupe de clieni sau structuri organizatorice de ageni), datele sunt prea centralizate i nu se poate face o analiz fin.
16

OLAP ajusteaz nivelul de granularitate prin exploatarea ierarhiilor dimensiunilor efectund comasri i descompuneri ale msurilor prin procedurile denumite

- roll-up - drill-down.
Aceste proceduri deplaseaz proiecia cubului n sus i n jos pe nivelele ierarhice ale fiecrei dimensiuni (zoom in; zoom out) efectund de fiecare dat centralizri ale msurilor stocate la cea mai mic granularitate dup criteriile ierarhice cerute. Operaia drill-down ofer mai multe detalii Operaia roll-up ofer date mai sintetice.

17

Un alt grup de operaii pe care OLAP le poate executa sunt secionarea (slicing) defalcarea (dicing) . Secionarea este posibilitatea de a selecta pentru vizualizare doar un membru al unei dimensiuni (un plan din cubul tridimensional). Seciunea respectiv apare ca o tabel pivot cu valorile dimensiunilor pe laturi i cu menionarea valorii alese pentru dimensiunea suprimat.
Vnzrile n anul 1999 pe clieni i produse Aracet Ciment Gips Var Vopsea Alexa Bloon Bogza Vox Yeta 350 107 270 56

240

760

850
18

Defalcarea (dicing)

nseamn

proiectarea unei

dimensiuni pe o alt dimensiune,


Vnzrile ctre clieni n anul 1999 pe produse i ageni Aracet Ciment Gips Var
Agent 1 Agent 1 Agent 1 Agent 1 Agent n Agent n Agent n

n general una din dimensiunile din prim plan se combin cu o dimensiune din adncime. Procesul se mai numete i imbricarea dimensiunilor.
Vopsea
Agent 1 Agent n Agent n
350 250

Alexa Bloon Bogza Vox Yeta

150 120 120

100

100 107 56

170

100

300

320

160

280

250

19

Dimensiunile unui cub pot fi private, ceea ce nseamn c aparin unui singur cub sau pot fi utilizate n comun de mai multe cuburi (provenind din depozite cu schema tip constelaie). Fiecare membru al unei dimensiuni poate avea anumite proprieti asociate care se stocheaz n atribute specifice ale nivelului ierarhiei. De exemplu, anumite zile din an sunt srbtori; calitatea respectiv va fi evideniat pentru zilele care o ndeplinesc. Noi membri ai dimensiunii respective pot fi adugai respectnd anumite reguli, mai ales dac este o dimensiune comun mai multor cuburi. Proiectarea structurilor depozitelor de date i cuburilor OLAP este un proces care continu pe parcursul ntregii viei a aplicaiei, dimensiunile cuburilor fiind strns legate de detaliile activitii precum clieni, produse, etc. Orice nou client sau nou produs va implica o modificare de structur.

20

Principalele caracteristici ale OLAP


Perspectiv (view) multimensional asupra datelor Capacitate de calcul intensiv Orientare n timp (time intelligence)

21

Perspectiva multidimensional asupra datelor


Capacitatea de a integra mai multe aspecte ale activitii ntreprinderii privite din diferite perspective: timp, locaie, produs, bani, persoane, etc. Fiecare dimensiune poate avea mai multe nivele: dimensiunea temporal se poate divide n ani, luni, trimestre, sezoane, etc dimensiunea geografic n emisfere, continente, ri, regiuni, orae, etc dimensiunea produs poate avea subdimensiuni de genul: categorie, clas, fel, etc.

22

Conceptul dimensiune este utilizat n sensul de aspect Dimensiunile sunt complet independente uniti de msur - toate valorile ntlnite n dimensiunea respectiv. - posibile criterii de agregare a datelor - nivelele unei dimensiuni formeaz o ierarhie (criterii de agregare) Perspectivele multidimensionale asupra datelor sunt numite hipercuburi de date, prin extinderea noiunii de cub tridimensional la cub n-dimensional sau hipercub.

mar feb ian C1 C2 C3 P3 P2 P1 a

23

Capacitatea de a efectua calcule intensive


- abilitatea de a aplica algoritmi compleci asupra datelor structurate n hipercub, - implic - posibilitatea de adresare multidimensional direct a locaiilor (cuburile unitare) - optimizarea timpului de rspuns.

Orientarea n timp (time intelligence)


abilitatea de exploatare a acestei dimensiuni universale, necesar pentru comparaii i judeci de valoare n orice analiz economic. Timpul este preluat din datele tranzaciilor. Pe baza acestor date primare se fac agregri pe luni, semestre, sezoane, ani, decenii, etc. Dimensiuni mai puin obinuite: - perioada curent, - perioada precedent, - aceeai perioad a anului trecut, etc.
24

Suprapuse peste DD, BDM utilizate de OLAP stocheaza straturi de date agregate pe diverse criterii ierarhice precum si date statistice precalculate pe fiecare nivel de agregare. ex.date de sinteza stocate in BDM OLAP: - nr de tranzactii(sau suma tranzactionata) cu clientii pe luni /orase/pe zone Un element din hipercub este o structura de date ce cuprinde cheltuieli si venituri identificate la nivelul unui produs vadut la un anumit client intr-o anumita perioada. Toate valorile posibile pentru aceste coordonate se gasesc pe laturile cubului (o structura tridimensionala asemanatoare tabelelor pivot). Sectiuni din cub se pot construi prin selectarea acelor valori de coordonate care se incadreaza in criteriul de agregare (zona geografica, profilul clientului, clasa produsului,etc.)
25

Client Zona Org.vnz Clasa clieni Perioada Produs Productor Categ. Produs

Timpul mic de rspuns, critic pentru asistarea deciziei este un factor important de succes al OLAP, realizat prin tehnici inteligente de optimizare.

26

Client
Zona Org_vanz Clasa cl Msuri Profit Marja com Costul vnzarilor

Profit

Timp
Anul Luna

Produs
Scenarii Planificat Estimat Realizat Producator Categorie

Moneda
Leu Euro Dolar

27

La acest nivel de detaliu sunt posibile toate analizele pe ierarhiile dimensiunilor cubului profitabilitatii. Se pot evidentia si alte masuri precum: marja comerciala bruta sau costul vanzarilor si se pot adauga dimensiuni suplimentare pentru alta moneda sau valori planificate, bugetate, previzionate sau estimate

28

Tehnicile utilizate de OLAP

simpla navigaie n BD selecia datelor analize complexe incluznd modele i serii temporale. posibilitatea de a construi scenarii

Domenii de utilizare ale OLAP


Instrumentele OLAP i aplicaiile construite cu aceast tehnologie i gsesc multiple domenii de utilizare n activitatea ntreprinderilor: vnzri , marketing , finane , producie. departamentele financiar i contabilitate - construirea bugetelor - analiza performanelor financiare - modelare financiar; departamentul vnzri - analize complexe ale vnzrilor - previziuni; departamentul marketing - cercetri i analize de pia, - analize ale campaniilor publicitare, - analiza clienilor i a segmentelor de pia. Activitatea de producie - planificarea operaiilor, - asigurarea i controlul calitii produselor - analiza rebuturilor - optimizarea raportului cost-performan
30

S-ar putea să vă placă și