Documente Academic
Documente Profesional
Documente Cultură
DATA WAREHOUSE
0.1 - INTRODUCERE ntr-o ntreprindere, informaia este constituit dintr-o surs principal i surse externe. Sursa principal provine din sistemele informatice interne, denumite, de producie sau operaionale. Acestea sunt din ce n ce mai mult completate cu date din surse externe ntreprinderii, al cror volum reprezint, dup unele studii, cam 20% din volumul total. Creterea volumului de date externe, este consecina dezvoltrii tehnicilor i metodelor de colectare a acestor date. Astfel, la nceputul anilor 90 asistm la apariia unui nou domeniu tiinific supravegherea strategic. Jakobiak i Dou, n lucrarea lor din 1992, au definit supravegherea strategic ca fiind, observarea i analiza mediului extern organizaiei, n scopul colectrii i difuzrii, bine structurate, a informaiilor selectate i tratate, utile lurii deciziilor. Privind acelai domeniu, Lesca definete supravegherea strategic ca fiind, procesul prin care ntreprinderea se lanseaz n studierea prospectiv a mediului su, n scopul creativ, de a deschide noi oportuniti i a reduce incertitudinea. Abordnd acest concept, din punctul de vedere al sistemului informaional dintr-o ntreprindere, putem afirma c supravegherea strategic este o parte a sistemului informaional al organizaiei, dedicat informrii despre mediul extern al ntreprinderii i destinat susinerii deciziilor. Problema principal care apare, este, pe de o parte, de a seleciona informaiile (interne i externe) juste i utile i, pe de alt parte, de a le stoca corect, pentru a fi gsite uor atunci cnd este nevoie. Conceptul de Data Warehuose (depozit de date), a fost formalizat pentru prima dat n 1990. Ideea de a construii o baz de date orientat pe subiect, integrat, care s conin informaii datate, nevolatile i destinate exclusiv procesului de asistare n luarea deciziilor, a fost primit, iniial, cu o oarecare perplexitate. Dar spre fericirea multora, i dezamgirea altora, economia actual a decis altceva. ntreprinderile se confrunt cu o concuren din ce n ce mai puternic, cu clieni din ce n ce mai exigeni, ntr-un mediu organizaional din ce n ce mai complex i de obicei aflat n micare. Pentru a face fa noilor provocri economice, ntreprinderea trebuie s anticipeze i s previn. Anticiparea nu poate fi eficient dac nu se bazeaz pe informaii pertinente. Aceste informaii sunt la mna oricrei ntreprinderi care dispune de date gestionate de sistemele ei operaionale i care poate obine alte date din mediul extern. Dar, la momentul actual, datele dei sunt supraabundente, nu sunt organizate ntr-o perspectiv decizional i sunt dispersate n mai multe sisteme eterogene. Cu toate acestea, datele reprezint o min de informaii. Devine din ce n ce mai stringent necesitatea de a asambla i omogeniza aceste date, cu scopul de a permite analizarea indicatorilor pertineni n vederea facilitrii procesului de luare a deciziilor. Pentru a rspunde acestor nevoi, informatica se mbogete cu un rol nou, anume acela de a defini i integra o arhitectur care s serveasc drept fundaie pentru aplicaiile decizionale, este vorba de Data Warehouse. Deci de reinut este faptul c noul rol al informaticii este acela de a defini i integra o arhitectur care s constituie fundamentul aplicaiilor decizionale, anume arhitectura Data Warehouse. M.A.E. anul I, Master, 2010-2011 1
Nivelul surselor de date - n care se colecteaz date eterogene provenite din diverse
sisteme operaionale ale organizaiei. De regul, se utilizeaz un proces de integrare a acestor date, printr-un modul separat al depozitului de date, numit i modul surs. Nivelul transformrii datelor - n care se folosete un proces de extragere, transformare (curare) i ncrcare a datelor (ETL - Extract, Transform, Load), ce presupune printre altele i prelucrarea datelor din punct de vedere al integritii, preciziei, acurateei i al formatului. Nivelul depozitului de date - conine datele prelucrate, ncrcate n structuri multidimensionale i agregate pe diferite niveluri, pregtite pentru a fi utilizate n analiz. La acest nivel se pot proiecta mai multe subsisteme de tipul data mart. Acestea sunt proiectate pentru fiecare din compartimentele i departamentele ntreprinderii. Nivelul de prezentare i raportare a datelor - presupune extragerea datelor din depozit i utilizarea unor instrumente i tehnologii de tipul inteligenei afacerii (Business Intelligence), pentru analiza i interpretarea informaiilor. La acest nivel, se utilizeaz instrumentele de lucru de tip OLAP pentru analiz, informaiile putnd fi prezentate sub diverse forme: grafic, tabelar, integrate n portaluri etc. Figura 3.1, prezint un sistem complex de data warehouse:
Pe aceasta arhitectur, din punct de vedere funcional se regsesc trei nivele (module) distincte de realizare (Figura 3.2.).
sub form diferit, la locaii diferite. Aceste date pot proveni de la aplicaii, sau de la sisteme distribuite din cadrul ntreprinderii, cum ar fi sisteme de gestiune a comenzilor, de eliberare a facturilor, de contabilitate financiar, de gestiune a stocurilor, de salarizare, etc. Indiferent de originea lor, datele trebuie s fie colectate i aduse ntr-o form consistent pentru a putea fi folositoare. Acest proces de transformare a datelor, reprezint baza pe care se construiete un depozit de date consistent, de nalt calitate. Transformarea datelor presupune un proces de extragere, condiionare, curare, fuziune, validare i ncrcare (ETL). Modulul central al depozitului de date reprezentat de SGBD-ul i de serverul pe care ruleaz acesta i de modul n care este implementat depozitul. Din acest punct de vedere, la ora actual, exist dou tendine: - una din tendine ar fi, implementarea unui sistem distribuit, descentralizat, unde datele sunt pstrate n uniti independente (Independent Data Marts), fiecare din aceste uniti, coninnd datele relevante pentru un anumit aspect al operaiilor, iar a doua tendin ar fi, - implementarea unei surse de date unice, centralizate, la care au acces utilizatorii din toate departamentele instituiei. Modulul strategic, de afaceri - valoarea final a unui depozit de date este determinat de avantajele pe care le ofer utilizatorului n diferite procese de luare a deciziilor i analiz. Prin folosirea diferitelor modaliti de acces la informaie i a tehnologiilor de procesare disponibile, utilizatorii pot obine informaii care i vor ajuta n procesele de stabilire a strategiei firmei. La ultimul nivel al arhitecturii, datele sunt pregtite pentru interpretare i analiz cu ajutorul unor instrumente specifice, cum ar fi: instrumente de realizare a graficelor, prezentri, rapoarte dinamice, browsere Web, instrumente de vizualizare a datelor. 0.4 - TIPURI DE DEPOZITE DE DATE Arhitectura funcional a depozitelor de date prezentat mai sus, permite proiectarea i implementarea unor diverse tipuri de depozite de date, n funcie de cerinele afacerii, resursele disponibile i posibilitile de realizare. M.A.E. anul I, Master, 2010-2011 4
O alt clasificare a depozitelor de date este propus n lucrarea lui Power D.J., intitulat Decision Support Systems: Concepts and Resources, n care se identific cinci tipuri de depozite de date, n funcie de aria de cuprindere a proceselor decizionale i anume: Depozitul de date de tip organizaional sau galactic (Galactic Data Warehouse GDW), care reprezint un tip de depozit centralizat, cu o arie de cuprindere extins, avnd drept obiectiv, integrarea i prelucrarea datelor la toate nivelurile organizaiei, ncepnd cu nivelul departamentelor i terminnd cu cel al ntregii organizaii; Depozitul de date orientat pe procese de afacere (Business Process Data Warehouse BPDW), care reprezint un tip de depozit specializat, orientat pe satisfacerea cerinelor afacerii i a proceselor de afaceri; Depozitul de date departamental (Departamental Data Warehouse - DDW) reprezint un tip de depozit orientat pe departamente, avnd drept obiectiv, integrarea i prelucrarea datelor, din fiecare departament n parte; Centru de date de tip proces de afaceri (Business Process Data Mart - BPDM) reprezint un tip de depozit specializat, orientat pe satisfacerea unei anumite cerine de afaceri i a unui singur proces de afaceri; Centru de date departamental (Departamental Data Mart - DDM) reprezint un tip de M.A.E. anul I, Master, 2010-2011 5