Sunteți pe pagina 1din 5

Depozite de date. Delimitare conceptuala.

Cerina de baz pentru orice sistem informatic este aceea de a asigura informarea
corect i n timp util a tuturor factorilor de decizie dintr-o companie, activitatea de realizare a
sistemelor informatice este acceptat de majoritatea specialitilor prin prisma utilizrii tehnicii
de calcul pe dou planuri: n activitatea de fundamentare a deciziilor i n asistarea activitii
curente desfurate n firm.
Primul plan se caracterizeaza prin existenta unor produse software specializate n
analiza alternativelor decizionale, urmrindu-se gsirea celei mai favorabile decizii pentru
societatea comercial, n momentul adoptrii lor.
Cel de-al doilea plan, urmrete dezvoltarea de aplicaii informatice de gestiune
economic la nivel de activitate sau grup de activiti n cadrul societii comerciale. Pentru
obinerea performanelor la nivelul proceselor de afaceri asistate, se impune ca sistemele s
controleze mediul prin primirea datelor, prelucrarea lor i returnarea rezultatelor suficient de
rapid pentru a fi n msur s influenteze funcionarea proceselor n timp real.
Prelucrarea n timp real cere introducerea imediat n sistem a datelor, a mesajelor
transmise de la terminalele surs. Un numar mare de staii, aflate la distanta i legate n sistem
prin intermediul unor echipamente de comunicaie de mare vitez pot lucra simultan: unele
actualizeaz fiiere, altele particip la interogri etc. Sistemele informatice n timp real se
bazeaz pe soluii tehnologice avansate: procesoare puternice, legatura direct ntre
calculatorul electronic i sistemul de comunicatie, terminale diferite adaptate nevoilor;
perfecionri ale echipamentelor i canalelor de comunicaie; alocarea spaiilor de memorare
i prelucrri preliminarii n retea; realizarea unor tehnici evaluate de programare asigurnd
producerea software-ului necesar etc. Acumularea unor mari cantiti de date, necesare
funcionrii activitii i lurii corecte a deciziilor nu mai este o problem din punct de vedere
tehnic. Acum se pune problema extragerii din multitudinea informaiilor existente a celor mai
relevante pentru problema dat, ntr-un timp scurt si cu un cost ct mai mic. Aa s-a nscut
ideea structurrii informatiei n depozite de date (data warehouse).
Este foarte dificil s definim n mod riguros un depozit de date, dar n sensul cel mai
larg, un depozit de date reprezint o baz de date care este ntreinut separat de bazele de
date operaionale ale organizaiei. Datele din sistemele surs sunt extrase, curite,
transformate i stocate n depozite speciale n scopul sprijinirii proceselor decizionale
1
.

1
. Turban, E., Aronson, J., Decision Support Systems and Intelligent Systems, Sixth Edition, Prentice Hall
International, Upper Saddle River, New Jersey, 2001, p. 145
Liderul n costruirea sistemelor data warehouse este W. H. Inmon, care spunea c un
depozit de date este o colecie de date orientate pe subiecte, integrate, istorice i nevolatile
destinat sprijinirii procesului de luare a deciziilor manageriale"
2
. Viziunea sa despre
depozitele de date se concentreaza asupra rolului acestora de baza informationala a deciziei
manageriale, pastrnd astfel un nivel nalt de generalitate.
De fapt, aceasta definiie pune n eviden caracteristicile majore ale depozitelor de
date:
orientare pe subiecte ;
integrare;
caracter istoric;
persistena datelor.
Aceste caracteristici fac distincia ntre data warehouse i alte depozite de date, cum
ar fi sistemele de baze de date relaionale i sistemele de prelucrare a tranzaciilor.
Orientarea pe subiecte. Sistemele operaionale tradiionale erau focalizate pe datele
cerute de compartimentele funcionale ale ntreprinderii n timp ce sistemele operaionale
moderne sunt orientate pe cerinele ntregului proces tranzacional i sprijin execuia
proceselor de la nceput pn la sfarit.
Un depozit de date este orientat pe subiecte ale activitii ntreprinderii ca de
exemplu: clieni, produse, servicii etc., sau la alte activiti din cadrul societii . Sunt
preluate din toate aplicaiile OLTP (On Line Transaction processing) referitoare la
subiectul respectiv. Pentru a fi elocvente, aceste subiecte trebuie s fie caracterizate de
instrumente din diverse surse. Scopul depozitelor de date l reprezint modelarea i analiza
datelor pentru luarea deciziilor. Astfel, depozitele de date ofer o viziune specific la un
anumit subiect, excluznd datele care nu sunt folositoare n procesul de luare a deciziiilor.
Integrarea. Inconsistenele din datele surs sunt eliminate. Integrarea datelor
provenite din surse diferite presupune transformarea, curarea, validarea i agregarea corect
a acestora pentru a asigura credibilitatea i consistena datelor.
Caracterul istoric. Datele sunt stocate pentru a furniza informaii n perspectiva
istoric (de exemplu, 5-10 ani in urma). Astfel, decidenii pot consulta valorile succesive ale
acelorai date pentru a determina evoluia n timp i a calcula anumii indicatori.
Persistena datelor. Datele dintr-un depozit sunt permanente i nu pot fi modificate.
Atunci cnd datele surs se modific, depozitul de date este actualizat, aceasta nsemnnd

2
. Inmon, W.H., Building the Data Warehouse, New York, John Wiley & Sons, 1996.

adaugare de date noi fr a modifica sau terge datele existente.

Putem defini un depozit de date i prin urmtoarele enunuri:
Depozitul de date este organizat astfel nct s faciliteze folosirea datelor n
scopuri decizionale;
Un depozit de date reprezint o stocare centralizat a datelor detaliate provenite din
toate sursele relevante din cadrul unei organizaii i permite interogarea dinamic i analiza
detaliat a tuturor informaiilor
Depozitul de date furnizeaz instrumente prin intermediul crora utilizatorii finali
pot accesa rapid datele.
Un depozit de date conine un volum foarte mare de date. Sursele din care
provin datele pot fi sursele operaionale ale organizaiei sau surse externe ;
Dupa Ralph Kimball ,,depozitul de date ofera acces la datele organizaionale;
datele coninute sunt consistente; datele pot fi separate i combinate n funcie de
fiecare dimensiune sau aspect al afacerii. Depozitul de date include, de asemenea, un set
de instrumente pentru interogare, analiz i prezentare a informaiilor; reprezint locul
n care sunt publicate datele folosite; calitatea datelor coninute n depozit reprezinta o
premis pentru reingineria afacerii"
3
.
Dup Barry Devlin [5], un depozit de date nseamn o stocare a datelor, unitar,
complet i consistent, obinut dintr-o varietate de surse, disponibil utilizatorilor finali ntr-
un mod uor perceptibil i utilizabil n contextul afacerii.
Sam Anahory [6] subliniaz finalitatea depozitelor de date preciznd c un depozit de
date include datele i procesele manageriale care fac informaiile disponibile, permind
managerilor s ia decizii corect fundamentate.
Definitia lui William Inmon este extrem de concis: un depozit de date este o colecie
de date orientate pe subiecte, integrate, istorice i nevolatile destinat sprijinirii procesului de
luare a deciziilor manageriale (A data warehouse is a subject-oriented, integrated, time-
variant and nonvolatile collection of data in support of management's decision making
process) [3].
Acest enun poate fi descompus ntr-o definiie: un depozit de date este o colecie de date destinate
fundamentrii deciziei manageriale i o caracterizare: o astfel de colectie de date este tematic, integrat,
plasat ntr-un context temporal i permanent.

8. Kimball, R., Reeves, L., Ross M., Thornthwaite, W., The Data Warehouse Lifecycle Toolkit, John
Wiley/Sons, Inc., New York, 1998.

Corey si Abbey (Oracle) definesc depozitul de date ca fiind: o colectie de informatii
strategice derivate direct din sistemele OLTP si alte surse externe. Scopul specific al
depozitului de date este de a oferi suport de decizie si nu suport pentru activitatea operativ.
Firma IBM folosete pentru depozite de date termenul Information Warehouse. .
Dup unii autori, viziunea IBM se refer mai degrab la conectivitatea global a diverselor
surse de date, fiind un fel de middleware generalizat bazat pe arhitectura proprie DRDA
Distributed Relatinal Database Architecture.
De altfel, n literatura de specialitate se folosesc simultan cei doi termeni pentru
depozite de date: Data Warehouse si Information Warehouse. Dupa Efraim Turban, scopul
unui ,,data (sau information) warehouse este de a realiza un fond de date (data repository)
care s fac accesibile datele operaionale ntr-o form acceptabil pentru asistarea deciziilor i
pentru alte aplicaii"
4
.
Scopurile fundamentale ale unui depozit de date sunt urmtoarele:
depozitul de date asigur accesul la datele organizaiei. Accesul trebuie s fie
imediat, la cerere, i s fie performant. Nu este acceptabil ca acest acces s fie realizat prin
intermediul altei persoane sau s fie prea lent. De asemenea, accesul presupune existena unor
utilitare care s fie foarte uor de folosit. Managerii vor trebui s obin diferite rapoarte
printr-o simpl apsare de buton.
datele dintr-un depozit de date trebuie s fie consistente. Consistena nseamna c
atunci cnd dou persoane solicit date despre vnzrile dintr-o anumit regiune s primeasc
aceleai date, chiar dac ele au fost cerute la momente de timp diferite. Dac datele nu au fost
complet ncrcate atunci utilizatorul va fi avertizat cu privire la acest lucru i este sftuit s
atepte pn ce vor fi complet ncrcate.
datele ntr-un depozit de date pot fi separate i combinate cerina clasic de
mprire i grupare a datelor.
depozitele de date nu reprezint doar datele ci i un set de utilitare pentru a
interoga, analiza, prezenta informaiile.
depozitele de date sunt locurile unde publicm datele folosite. Datele nu sunt doar
acumulate la un loc i pstrate, ci sunt asamblate dintr-o varietate de surse, sunt corectate de
erori, li se asigur calitatea necesar i abia apoi devin utilizabile.

9.Turban, E., Aronson, J. , Decision Support Systems and Intelligent Systems, Prentice Hall International, Upper
Saddle River, New Jersey, 2001, p. 142.
calitatea datelor din depozitele de date este un factor determinant pentru procesul
de reculegere a datelor. Se ntlneste frecvent situaia n care datele sunt de bun calitate, dar
nu sunt colectate n ntregime sau sunt opionale.
Din punct de vedere al ariei de cuprindere, se ntlnesc trei modele de depozite
de date: depozite de ntreprindere , data marts i depozite virtuale de date.
Un depozit de ntreprindere colecteaz toate informaiile despre subiecte care
privesc ntreaga organizaie
5
. El furnizeaz un volum extins de date. De regul, conine date
detaliate, dar i date agregate, iar ca ordin de mrime pornete de la civa gigabytes pn
la sute de gigabytes, terabytes sau mai mult. Un depozit de date de ntreprindere poate fi
implementat pe tradiionalele mainframes, pe superservere UNIX sau pe platforme cu
arhitecturi paralele. Acesta necesit cheltuieli mai mari pentru modelare i ani de zile pentru
proiectare i realizare.
Un data mart conine un subset al volumului de date din organizaie, specific unui
grup de utilizatori
6
. Domeniul este limitat la subiecte specifice. De exemplu, un data mart
pentru marketing limiteaza subiectele la clienti, articole, vnzri. Datele coninute n data
mart sunt de obicei agregate. Data marts sunt, n mod curent, implementate pe servere
departamentale mai ieftine care se bazeaza pe UNIX sau Windows/NT. Ciclul de
implementare a unui data mart este mai curnd msurat n sptmni dect n luni sau ani. Ca
atare, un data mart poate fi considerat un subansamblu al unui depozit de date mai uor de
construit i ntreinut i mai puin scump.
Un depozit virtual este un set de viziuni (views) asupra bazelor de date operaionale
7
.
Pentru eficiena procesrii interogrilor, numai unele din viziunile de agregare pot fi
materializate. Un depozit virtual este uor de construit, dar necesit capaciti suplimentare
pe serverele de baze de date.



5
. Ryan, J. Building and deploying an enterprise data warehouse , White Paper, 1999
6
. Inmon, B. Data mart does not equal data warehouse, DM Direct Newsletter, November, 1999
7
Holland, P. Traditional data warehouses vs virtual data warehouses , White Paper, March, 2000

S-ar putea să vă placă și