Documente Academic
Documente Profesional
Documente Cultură
tehnologie de agregare a datelor stocate n depozite ntr-o abordare multidimensional care asigur acces rapid la informaiile necesare decidenilor ntr-o manier consistent, interactiv i foarte flexibil. OLAP transform volumul imens de date stocate i gestionate n depozite n informaii utile procesului de decizie.
Numele tehnologiei OLAP - introdus n 1993 de ctre E. F. Codd
Clieni Client n
Timp
Ierarhia Anotimp
Sezonul
Trimestrul
Luna
Ziua
Data calendaristic
Ierarhii alternative ale dimensiunii TIMP Nivelele sunt numerotate de la rdcin (nivelul 0) spre frunze (nivelul maxim). Fiecare ierarhie are setul ei de nivele chiar dac anumite ramuri sunt comune.
4
Ierarhia Geografie
Judet
Ierarhia Clasificare
Localitate Statut
Categorie
Subctg
Client
Exemple: - volumul vnzrilor (cantitativ/valoric), - volumul achiziiilor (cantitativ/valoric), - volumul salariilor, costul transportului, costul mrfurilor, - costul materiilor prime, - volumul taxelor i impozitelor, - volumul datoriilor, - volumul creanelor, - marja comercial brut, - profitul, etc.
Faptele se colecteaz din - tabelele de fapte din depozite - direct din nregistrrile stocate n tabelele de tranzacii ale aplicaiilor operaionale ce susin activitatea respectiv Prin intermediul dimensiunii scenarii se pot stoca n tabelele de fapte - msurile reale - msuri imaginate - valorile bugetate - valorile estimate Aceste msuri sunt introduse direct n tabelele de fapte de ctre persoanele responsabile.
Modelarea datelor este un pas important n procesul de dezvoltare a unui depozit de date pentru c permite vizualizarea structurii nainte de a fi construit.
Modelul multidimensional hipercubul - este ns dificil de vizualizat n toate dimensiunile i trebuie prezentat desfurat n seciuni sau proiecii tridimensionale pentru a putea fi neles
seciunea este o felie transversal din cub, identificat prin coordonatele seciunii proiecia este o seciune care centralizeaz datele de pe toate dimensiunile suprimate
10
Selecia produce un cub cu acelai numr de dimensiuni, setul de membri pe fiecare fiind restrns prin enumerarea membrilor selectai, prin intervale sau prin condiii puse asupra msurilor. Exemple de selecii:
alfa beta p na ma a 1 2 m
beta 1 p 2 3
beta gama 3
11
Proiecia realizeaz restrngerea dimensiunilor unui cub la un numr precizat de axe. Dimensiunile suprimate conduc la nsumarea msurilor n celulele corespunztoare membrilor din dimensiunile vizibile. Pentru exemplificare, prezentm un cub tridimensional proiectat pe cele trei plane:
mar mar mar feb ian C1 C2 C3 all feb ian C1 C2 C3 P3 P2 P1 a P3 P2 C1 C2 C3 P1 a feb ian all P3 P2 P1 a
all
12
Pentru modelare, hipercubul se prezint n forma tabelar cu coloane pentru msuri i rnduri pentru combinaiile de dimensiuni.
Dimensiuni
Cantitate Anul 1999 1999 Luna 1 1 Agent AAA AAA Client Alexa Alexa Produs Ciment Var 100 30
Msuri
Valoare 33000 5000 Cost marfa 20700 4300 Chelt transp 500 120 Alte chelt 234 57
2001
10
XXX
YETA
Vopsea
400
132000
82800
780
560
Bazele de date dedicate datelor modelate ca hipercuburi sunt bazele de date multidimensionale
13
Operatii pe hipercub
Pentru navigaia pe o structur arborescent, sistemele de gestiune ofer operatori ierarhici. - Children - Parents - Ascendent - Descendents Pentru exploatarea datelor, sistemele de gestiune ofer operatori relaionali pe hipercuburi. Selecia, Proiecia, Reuniunea, Intersecia, Diferena, Produsul cartezian, Diviziunea, Join, Din punct de vedere fizic, datele sunt stocate ntr-un fi ier cu acces direct. Accesul la o anumit nregistrare se face pe baza adresei fizice absolute sau relative a nregistrrii obinute prin exploatarea tabelelor bitmap construite la crearea structurii de date.
15
OLAP ajusteaz nivelul de granularitate prin exploatarea ierarhiilor dimensiunilor efectund comasri i descompuneri ale msurilor prin procedurile denumite
- roll-up - drill-down.
Aceste proceduri deplaseaz proiecia cubului n sus i n jos pe nivelele ierarhice ale fiecrei dimensiuni (zoom in; zoom out) efectund de fiecare dat centralizri ale msurilor stocate la cea mai mic granularitate dup criteriile ierarhice cerute. Operaia drill-down ofer mai multe detalii Operaia roll-up ofer date mai sintetice.
17
Un alt grup de operaii pe care OLAP le poate executa sunt secionarea (slicing) defalcarea (dicing) . Secionarea este posibilitatea de a selecta pentru vizualizare doar un membru al unei dimensiuni (un plan din cubul tridimensional). Seciunea respectiv apare ca o tabel pivot cu valorile dimensiunilor pe laturi i cu menionarea valorii alese pentru dimensiunea suprimat.
Vnzrile n anul 1999 pe clieni i produse Aracet Ciment Gips Var Vopsea Alexa Bloon Bogza Vox Yeta 350 107 270 56
240
760
850
18
Defalcarea (dicing)
nseamn
proiectarea unei
n general una din dimensiunile din prim plan se combin cu o dimensiune din adncime. Procesul se mai numete i imbricarea dimensiunilor.
Vopsea
Agent 1 Agent n Agent n
350 250
100
100 107 56
170
100
300
320
160
280
250
19
Dimensiunile unui cub pot fi private, ceea ce nseamn c aparin unui singur cub sau pot fi utilizate n comun de mai multe cuburi (provenind din depozite cu schema tip constelaie). Fiecare membru al unei dimensiuni poate avea anumite proprieti asociate care se stocheaz n atribute specifice ale nivelului ierarhiei. De exemplu, anumite zile din an sunt srbtori; calitatea respectiv va fi evideniat pentru zilele care o ndeplinesc. Noi membri ai dimensiunii respective pot fi adugai respectnd anumite reguli, mai ales dac este o dimensiune comun mai multor cuburi. Proiectarea structurilor depozitelor de date i cuburilor OLAP este un proces care continu pe parcursul ntregii viei a aplicaiei, dimensiunile cuburilor fiind strns legate de detaliile activitii precum clieni, produse, etc. Orice nou client sau nou produs va implica o modificare de structur.
20
21
22
Conceptul dimensiune este utilizat n sensul de aspect Dimensiunile sunt complet independente uniti de msur - toate valorile ntlnite n dimensiunea respectiv. - posibile criterii de agregare a datelor - nivelele unei dimensiuni formeaz o ierarhie (criterii de agregare) Perspectivele multidimensionale asupra datelor sunt numite hipercuburi de date, prin extinderea noiunii de cub tridimensional la cub n-dimensional sau hipercub.
23
Suprapuse peste DD, BDM utilizate de OLAP stocheaza straturi de date agregate pe diverse criterii ierarhice precum si date statistice precalculate pe fiecare nivel de agregare. ex.date de sinteza stocate in BDM OLAP: - nr de tranzactii(sau suma tranzactionata) cu clientii pe luni /orase/pe zone Un element din hipercub este o structura de date ce cuprinde cheltuieli si venituri identificate la nivelul unui produs vadut la un anumit client intr-o anumita perioada. Toate valorile posibile pentru aceste coordonate se gasesc pe laturile cubului (o structura tridimensionala asemanatoare tabelelor pivot). Sectiuni din cub se pot construi prin selectarea acelor valori de coordonate care se incadreaza in criteriul de agregare (zona geografica, profilul clientului, clasa produsului,etc.)
25
Client Zona Org.vnz Clasa clieni Perioada Produs Productor Categ. Produs
Timpul mic de rspuns, critic pentru asistarea deciziei este un factor important de succes al OLAP, realizat prin tehnici inteligente de optimizare.
26
Client
Zona Org_vanz Clasa cl Msuri Profit Marja com Costul vnzarilor
Profit
Timp
Anul Luna
Produs
Scenarii Planificat Estimat Realizat Producator Categorie
Moneda
Leu Euro Dolar
27
La acest nivel de detaliu sunt posibile toate analizele pe ierarhiile dimensiunilor cubului profitabilitatii. Se pot evidentia si alte masuri precum: marja comerciala bruta sau costul vanzarilor si se pot adauga dimensiuni suplimentare pentru alta moneda sau valori planificate, bugetate, previzionate sau estimate
28
simpla navigaie n BD selecia datelor analize complexe incluznd modele i serii temporale. posibilitatea de a construi scenarii