Sunteți pe pagina 1din 11

Mai mult despre DEPOZITELE DE DATE

Depozitele de date centralizeaz, consolideaz, organizeaz si stocheaz date din diverse surse eterogene, date care vor fi baza procesarilor analitice necesare proceselor de decizie.
Depozitul de date reprezinta o colectie de date orientate pe subiecte, integrate, corelate in timp care se constituie in suport informational pentru procesul decizional. Modelarea multidimensional ofer suportul necesar pentru proiectarea structurii depozitului de date.

Arhitectura generala a depozitului de date

- date rezumate (cu un grad scazut de rezumare/agregare):


aceasta portiune din depozit memoreaza toate datele ce prezinta un anumit grad de agregare; scopul datelor rezumate este acela de a accelera performantele interogarilor; diferitele agregari corespund necesitatilor profilurilor de interogare; desi exista costuri operationale crescute rezumarii datelor, acestea sunt compensate de timpul mediu de raspuns scazut la cererile de interogare lansate de catre decident.

- meta-datele: descriu datele continute de catre depozitul de date, modul in care ele au fost
obtinute, schemele de agregare utilizate, precum si modalitatea de memorare a acestora; ele joaca un rol important in alimentarea depozitului, fiind utilizate in toate etapele de incarcare a datelor; sunt consultate si actualizate pe parcursul integrului ciclu de viata al depozitului;

- date arhivate/istorice: provin din activitatile anterioare, reprezentand informatii ce pot oferi
baza de comparatie in aprecierea tendintelor, in efectuarea unor analize complexe necesare in luarea deciziilor majore. Obs. La nivel departamental, depozitul de date al organizatiei poate alimenta asa-numitele magazii de date (data mart), ce pot face ca managerii de departamente sa interogeze mai rapid, mai usor datele referitoare la domeniul lor de activitate. Depozitele de date sunt destinate managerilor, analistilor si specialistilor angrenati in luarea deciziilor strategice privind dezvoltarea si viitorul organizatiei. Pentru aceasta, ei au nevoie de instrumente performante de accesare si utilizare a datelor din depozit. Sursele de date pentru un depozit sunt diverse; construirea depozitului de date presupune parcurgerea urmatoarelor etape: extragere, transformare (asigurarea calitatii (curatire)), incarcare - procese ETL (Extract Transform Load) 3

Instrumente de accesare si utilizare:


instrumente necesare utilizatorilor care au nevoie de un acces rapid, de informatii punctuale; includ un limbaj de interogare gen SQL sau generatoare de rapoarte. intrumente specializate pentru asistarea deciziilor, care transforma informatiile in forma ceruta de decidenti (grafice, diagrame, organigrame, etc) sau ofera posibilitatea analizei tendintelor, corelatiilor si interpretarea acestora OLAP, DATA MINING. OLAP se bazeaza pe prezentarea multidimensionala a datelor si permite analiza interactiva si rapida a datelor prin operatiuni de tip roll-up, drill-down, slice, dice, etc. DATA MINING asigura transformarea datelor in cunostinte (= knowledge discovery in databases)

(dupa D. Airinei)

Arhitectura pe trei niveluri a depozitelor de date

- nivelul de jos (bottom tier) : server-ul depozitului de date - nivelul mediu (middle tier): server-ul OLAP - nivelul superior (top tier): nivelul client ce contine instrumentele pentru generarea interogarilor si a rapoartelor

Utilizatori ai depozitului de date - administratorul depozitului : efectueaza toate operatiile asociate administrarii datelor
din depozit: 1 -analiza datelor pentru asigurarea coerentei; 2 - extragerea/ transformarea/curatirea/ incarcarea periodica a datelor sursa in depozit; 3 - generarea unor profiluri de interogare pentru diferitele categorii de utilizatori ai depozitului;

- administratorul de interogari: acesta poate prelua ultima sarcina a administratorului


depozitului de date; - utilizatorii finali: interogeaza depozitul pentru luarea de decizii strategice; au la dispozitie diferite instrumente de raportare, interogare, instrumente de dezvoltare a unor aplicatii de tip DSS.

Variante de implementare ale depozitelor de date


- depozit de intreprindere (enterprise warehouse) - depozit departamental (data mart) - depozit virtual (virtual warehouse): o simulare a unui depozit de date cu ajutorul unui
set de views-uri asupra bazelor de date relationale operationale existente in organizatie; pentru eficienta procesarii interogarilor se vor materializa, in vederi, o serie de agregari ale datelor; in acest scop sunt necesare capacitati suplimentare ale server-ului de baze de date. 6

ABORDAREA MULTIDIMENSIONAL A DATELOR.


Elemente OLAP
(ON-Line Analytical Processing)

Modelarea (multi)dimensional presupune generarea unui cub OLAP (hipercub/ cub multidimensional), cu ajutorul cruia se poate modela aspectul complex al unor activiti desfurate. Activitatea modelat se va exprima cu ajutorul unor indicatori, ale cror valori vor depinde de o serie de parametrii ai activitii, denumii dimensiuni ale abordrii.

Indicator = profitul obtinut Dimensiuni = produs, client, timp

ntrebare fundamental:
Ce profit s-a obtinut din vnzarea unui produs fiecrui client in parte, intr-o anumit unitate de timp considerat ?
7

La nivelul dimensiunilor putem avea una sau mai multe ierarhii. Nivelele ierarhiilor sunt utilizate ca nivele de agregare a valorilor pentru indicatorii considerati. Implicit, agregarea se realizeaza la nivelul cel mai de jos al ierarhiilor, dar cubul OLAP permite deplasarea in sus/in jos pe dimensiunile considerate. Ex. CAT_PRODUS AN AN PRODUS LUNA

TRIMESTRU SEMESTRU
profit

Profit = SUM

(client, produs, luna)

Obs. In unele situatii este posibil ca, la nivelul cel mai scazut de rezumare/ 8 agregare al datelor sa avem o situatie identica cu cea detaliata !!

Exemplu: Analiza aprovizionarii unui lant de magazine

- indicatorul I1 - total distribuit (cantitativ, valoric) din fiecare produs, zilnic, fiecarui
magazin; - indicatorul I2 - total distribuit de catre fiecare furnizor, zilnic, fiecarui magazin; A). Dimensiunile analizei: produs, ziua, magazin, furnizor

I1 = SUM cant, val (produs, ziua, magazin) I2 = SUM cant, val (furnizor, ziua, magazin)
B). Dimensiunile analizei: se considera urmatoarele ierarhii la nivelul dimensiunilor - FURNIZOR - AN - MAGAZIN LUNA PRODUS (dimensiunea produs)

ZIUA (dimensiunea timp)

(dimensiunea magazin)

I1 = SUM

cant, val

(produs, ziua, magazin); I2 se obtine din I1


prin deplasare pe dimensiunea produs

SCHEMA DEPOZITULUI DE DATE

A.

B.

10

MODELUL MULTIDIMENSIONAL AL DATELOR


Limbajul de interogare MDX

MODELUL RELATIONAL AL DATELOR


Limbajul de interogare SQL

11