Documente Academic
Documente Profesional
Documente Cultură
Introducere ................................................................................................................................. 3
Ce este Data Warehouse?........................................................................................................... 4
Orientată spre subiect ......................................................................................................... 4
Integrat ................................................................................................................................ 5
Nevolatile............................................................................................................................ 5
Variantă de timp ................................................................................................................. 5
Ce este depozitarea datelor (Data Warehousing)? ..................................................................... 6
Funcțiile Depozitului de date ..................................................................................................... 7
Avantajele și problemele de afaceri ale utilizării Depozitelor de Date ................................... 11
Aplicații ale depozitului de date (Valsamidis) ......................................................................... 14
Ce este Data Mart? ................................................................................................................... 19
Concluzie ................................................................................................................................. 22
Bibliografie .............................................................................................................................. 23
2
Introducere
Știm cu toții beneficiile bazelor de date, utilizarea lor în orice afacere a făcut viața
companiilor mult mai ușoară. Depozitele de date sunt un alt tip de mediu care ne oferă
beneficii. Acestea sunt concepute pentru a oferi companiei posibilitatea de a analiza datele
care au fost tranzacționate. O altă funcție a Data Warehouse-ului este de a fi un spatiu de
stocare obținute dintr-o varietate de surse diferite puse la dispoziția utilizatorilor finali în ceea
ce pot înțelege și utiliza într-un context de afaceri.
În textul de mai jos vom încerca să înțelegem conceptul de depozitare a datelor,
funcționalitatea acestuia, beneficiile și problemele care pot apărea în timpul utilizării
acestuia, arhitectura sa și modul în care poate fi aplicat. Vom analiza evoluția în utilizarea
organizațională a Data Warehousing și vom vedea și în ce domeniu poate fi implementat în
organizații. În același timp, vom afla mai multe despre aplicațiile Data Warehouse unde unul
dintre ele este Data Mart - o formă simplă a unui Data Warehouse care se concentrează pe un
singur subiect.
3
Ce este Data Warehouse?
Un Data Warehouse este un depozit central pentru toate sau părți semnificative ale
datelor pe care le colectează diferitele sisteme de afaceri ale unei întreprinderi. Un Data
Warehouse este o bază de date relațională care este proiectată pentru interogare și analiză,
mai degrabă decât pentru procesarea tranzacțiilor. De obicei, conține date istorice derivate din
datele tranzacției, dar poate include date din alte surse. Separă volumul de lucru de analiză de
volumul de lucru al tranzacției și permite unei organizații să consolideze datele din mai multe
surse.
De obicei, un Data Warehouse este găzduit pe un server mainframe de întreprindere.
Datele din diverse aplicații de procesare a tranzacțiilor online (OLTP) și din alte surse sunt
extrase și organizate selectiv în baza de date a depozitului de date pentru a fi utilizate de
aplicații analitice și interogări de utilizator.
O modalitate comună de introducere a depozitării datelor este de a se referi la
caracteristicile unui Data Warehouse, astfel sunt stabilite de William Inmon:
4
Integrat
Nevolatile
Variantă de timp
Pentru a descoperi tendințele în afaceri, analiștii au nevoie de cantități mari de date. Acest
lucru este foarte mult în contrast cu sistemele de procesare a tranzacțiilor online (OLTP),
unde cerințele de performanță cer ca datele istorice să fie mutate într-o arhivă. Concentrarea
unui Data Warehouse asupra modificării în timp este ceea ce se înțelege prin varianta de timp
a termenului.
În plus față de o bază de date relațională, un mediu de Data Warehouse include o soluție
de extracție, transport, transformare și încărcare (ETL), un motor de procesare analitică
online (OLAP), instrumente de analiză a clienților și alte aplicații care gestionează procesul
de colectare a datelor și de livrare a acestora către utilizatorii de afaceri.
Un proces ETL extrage datele, cea mai mare parte din diferite tipuri de sisteme,
transformându-l într-o structură care este mai adecvată pentru raportare și analiză și în cele
din urmă se încărcă în baza de date.
5
consideră fiecare atribut de date ca o "dimensiune" separată. Software-ul OLAP poate
localiza intersecția dimensiunilor și le poate afișa.
Aplicațiile depozitelor de date includ extragerea datelor, web mining și sisteme de suport
decizional (DSS).
Deci, făcând o scurtă concluzie, un Data Warehouse este un singur depozit, complet și
consecvent, de date obținute dintr-o varietate de surse diferite puse la dispoziția utilizatorilor
finali în ceea ce pot înțelege și utiliza într-un context de afaceri.
Depozitarea datelor combină date din mai multe surse și, de obicei, variate într-o singură
bază de date cuprinzătoare și ușor de manipulat, este un proces de transformare a datelor în
informații și de a le pune la dispoziția utilizatorilor în timp util pentru a face o diferență.
Sistemele comune de depozitare a datelor includ interogări, analizăși raportare.
Deoarece depozitarea datelor creează o bază de date în cele din urmă, numărul de surse
poate fi orice doriți să fie, cu condiția ca sistemul să poată gestiona volumul, desigur.
Rezultatul final, cu toate acestea, este date omogene, care pot fi mai ușor de manipulat.
Depozitarea datelor este utilizată în mod obișnuit de companii pentru a analiza tendințele
în timp. Cu alte cuvinte, companiile pot foarte bine să utilizeze depozitarea datelor pentru a
vizualiza operațiunile de zi cu zi, dar funcția sa principală este facilitarea planificării strategice
care rezultă din prezentările generale ale datelor pe termen lung. Din astfel de prezentări
generale, se pot face modele de afaceri, previziuni și alte rapoarte și proiecții. În mod obișnuit,
deoarece datele stocate în depozitele de date sunt destinate să furnizeze mai multe rapoarte
asemănătoare prezentării generale, datele sunt doar în citire. Dacă doriți să actualizați datele
stocate prin depozitarea datelor, va trebui să construiți o interogare nouă după ce ați terminat.
Acest lucru nu înseamnă că depozitarea datelor implică date care nu sunt niciodată actualizate.
Dimpotrivă, datele stocate în depozitele de date sunt actualizate tot timpul. Raportarea și
analiza sunt cele care au mai mult o viziune pe termen lung.
6
Depozitarea datelor nu este totul și sfârșitul pentru stocarea tuturor datelor unei companii.
Mai degrabă, depozitarea datelor este utilizată pentru a găzdui datele necesare pentru o
analiză specifică. Stocarea mai cuprinzătoare a datelor necesită capacități diferite, care sunt
mai statice și mai puțin ușor de manipulat decât cele utilizate pentru depozitarea datelor.
Depozitarea datelor este de obicei utilizată de companiile mai mari care analizează seturi
mai mari de date în scopuri de întreprindere. Companiile mai mici care doresc să analizeze un
singur subiect, de exemplu, accesează, de obicei, mărțișoare de date, care sunt mult mai
specifice și orientate în stocarea și raportarea lor. Depozitarea datelor include adesea cantități
mai mici de date grupate în „“data marts””. În acest fel, o companie mai mare ar putea avea
la dispoziție atât depozitarea datelor, cât și „data marts”, permițând utilizatorilor să aleagă
sursa și funcționalitatea în funcție de nevoile actuale.
Aceste funcții pot fi grupate în trei categorii principale: Load Services, Query Services și
Warehouse Services (Sam Anahory, 1997).
7
Figura 1 Servicii de încărcare
8
Servicii de interogare figura 2
9
Figura 3 Servicii de depozitare
10
Avantajele și problemele de afaceri ale utilizării Depozitelor de
Date
După putem observa în tabel, în fiecare industrie există o utilitate in folosirea Data
Warehousing-ului, de la companii mici la companii foarte mari, deoarece face munca mai
11
ușoară, ajută la analizarea oricărui domeniu de activitate și la luarea deciziilor corecte. Deci,
utilizarea Depozitelor de Date (Data Warehouse) ne oferă o mulțime de beneficii, iată câteva
dintre ele:
Avantaje de afaceri
» Acesta oferă utilizatorilor de afaceri o imagine "centrată pe client" a datelor eterogene ale
companiei, ajutând la integrarea datelor din vânzări, servicii, producție și distribuție și
alte sisteme de afaceri legate de clienți.
Alegerea utilizării Depozitelor de Date nu ne oferă numai beneficii, deși, pot apărea
probleme care sunt uneori dificil de depășit.
» De-a lungul vieții lor, depozitele de date pot avea costuri ridicate. Costurile de întreținere
sunt ridicate.
12
» Depozitele de date se pot învechite relativ repede. Există un cost de furnizare a
informațiilor suboptimale organizației.
» Există adesea o linie fină între depozitele de date și sistemele operaționale. Pot fi
dezvoltate funcționalități duplicate și costisitoare. Sau, funcționalitatea poate fi dezvoltată
în depozitul de date care, privind retrospectiv, ar fi trebuit dezvoltată în sistemele
operaționale și invers.
Analiza avantajelor utilizării Depozitelor de Date pentru companii, ne-a făcut să credem
că companiile inteligente le-ar folosi cu siguranță. Organizațiile încep, în general, cu o
utilizare relativ simplă a antrepozitării datelor. În timp, utilizarea mai sofisticată a
antrepozitării datelor evoluează. Se pot distinge următoarele etape generale de utilizare a
depozitului de date:
– Depozitele de date din această etapă inițială sunt dezvoltate prin simpla
copiere a datelor dintr-un sistem operațional pe un alt server unde sarcina de
procesare a raportării împotriva datelor copiate nu afectează performanța
sistemului operațional.
– Depozitele de date în această etapă sunt actualizate periodic din datele din
sistemele operaționale, iar datele din depozitul de date sunt stocate într-o
structură de date concepută pentru a facilita raportarea.
13
• Data Warehouse integrat
Noi utilizări pentru tehnologia depozitului de date sunt în continuă dezvoltare. Unele
organizații colectează, analizează și împachetează acum date de vânzare către clienți.
Depozitele de date în timp real, odată un termen fără sens, apar acum pentru a fi utilizate în
comerțul online.
Subiectele din această secțiune descriu diverse tehnologii care pot fi utilizate cu
depozitele de date:
subiect descriere
Interogări SQL Descrie utilizările interogărilor SQL într-un Data Warehouse.
OLAP și extragerea datelor Descrie tehnologiile de procesare analitică online (OLAP) și de
extragere a datelor utilizate cu depozitele de date.
Interogare în limba engleză Descrie componenta Microsoft® SQL Server™ 2000 care permite
interogarea unui Data Warehouse utilizând cuvinte și expresii în
limba engleză.
Microsoft Office 2000 Articolul descrie modul în care componentele Microsoft Office 2000
pot utiliza datele dintr-un Data Warehouse.
Acces web și raportare Descrie accesul la datele depozitului de date și la rapoartele de pe
Web.
Cuburi OLAP offline Articolul descrie utilizarea cubului deconectat pentru analiza datelor
atunci când utilizatorii nu sunt conectați la SQL Server 2000
Analysis Services.
Aplicații terțe Descrie utilizarea aplicațiilor terțe cu depozite de date.
14
Aplicații personalizate Descrie disponibilitatea interfețelor de programare a aplicațiilor
(API) care pot fi utilizate pentru a crea aplicații particularizate care
administrează sau utilizează depozite de date.
După cum s-a spus mai înainte, aplicațiile depozitelor includ Data Mining, Web Mining și
Decision Support Systems (DSS).
Data Mining este procesul care duce la descoperirea de noi modele în seturi mari de date.
Acesta utilizează metode la intersecția dintre inteligența artificială, învățarea automată,
statistici și sistemele de baze de date. Scopul general al procesului de extragere a datelor este
de a extrage cunoștințe dintr-un set de date existent și de a le transforma într-o structură ușor
de înțeles de om pentru utilizare ulterioară. Pe lângă etapa de analiză brută, aceasta implică
aspecte de gestionare a bazelor de date și a datelor, preprocesarea datelor, considerații de
model și deducție, măsurători de interes, considerații de complexitate, post-procesare a
structurilor găsite, vizualizare și actualizare online.
Informațiile colectate prin web mining sunt evaluate (uneori cu ajutorul aplicațiilor de
grafică software) prin utilizarea parametrilor tradiționali de extragere a datelor, ar fi gruparea
și clasificarea, asocierea și examinarea modelelor secvențiale.
15
Decision Support Systems (DSS) este un sistem informatic informatic care sprijină
activitățile decizionale de afaceri sau organizaționale. DSS-urile servesc nivelurilor de
management, operațiuni și planificare ale unei organizații și ajută la luarea deciziilor, care se
pot schimba rapid și nu sunt ușor de specificat în prealabil.
Figura de mai jos arată o arhitectură simplă pentru un Data Warehouse. Utilizatorii finali
accesează direct datele derivate din mai multe sisteme sursă prin depozitul de date.
16
În această figură, metadatele și datele brute ale unui sistem OLTP tradițional sunt
prezente, la fel ca un tip suplimentar de date, date rezumative. Rezumatele sunt foarte
valoroase în depozitele de date, deoarece precalculează operațiunile lungi în avans. De
exemplu, o interogare tipică Data Warehouse este de a regăsi ceva de genul vânzări august.
Un rezumat din Oracle se numește vizualizare materializată.
17
Figura 6 Arhitectura unui Data Warehouse cu o zonă de așteptare
Deși arhitectura din Figura 6 este destul de comună, poate doriți să particularizați
arhitectura depozitului pentru diferite grupuri din cadrul organizației dvs. Puteți face acest
lucru adăugând mărțișoarede date, care sunt sisteme proiectate pentru o anumită linie de
afaceri. Figura 7 ilustrează un exemplu în care achizițiile, vânzările și stocurile sunt
separate. În acest exemplu, un analist financiar poate dori să analizeze datele istorice pentru
achiziții și vânzări.
18
Figura 7 Arhitectura unui Data Warehouse cu o zonă de așteptare și „data marts”
Un data mart este o formă simplă a unui Data Warehouse care se concentrează pe un
singur subiect (sau o zonă funcțională), ar fi Vânzări, Finanțe sau Marketing. “data marts”
sunt adesea construite și controlate de un singur departament dintr-o organizație. Având în
vedere concentrarea lor pe un singur subiect, “data marts” extragă de obicei date din doar
câteva surse. Sursele ar putea fi sisteme operaționale interne, un depozit central de date sau
date externe.
Diferența dintre Data Warehouse și Data Mart este că un Data Warehouse, spre deosebire
de un magazin de date, se ocupă de mai multe domenii de subiect și este de obicei
implementat și controlat de o unitate organizațională centrală, ar fi grupul corporativ
tehnologia informației (IT). Adesea, se numește Data Warehouse central sau de întreprindere.
De obicei, un Data Warehouse asamblează date din mai multe sisteme sursă.
Nimic din aceste definiții de bază nu limitează dimensiunea unui magazin de date sau
complexitatea datelor de sprijin decizional pe care le conține. Cu toate acestea, “data marts”
sunt de obicei mai mici și mai puțin complexe decât depozitele de date; prin urmare, acestea
19
sunt de obicei mai ușor de construit și de întreținut. Figura 5 rezumă diferențele de bază
dintre un Data Warehouse și un Data Warehouse.
Analizând diferențele dintre un Data Warehouse și un Data Mart putem deduce motivele
creării unui magazin de date, acestea pot fiurmătoarele:
» Acces facil la datele necesare frecvent » Cost mai mic decât implementarea
unui depozit complet de date
» Creează vizualizare colectivă de către
un grup de utilizatori » Utilizatorii potențiali sunt mai clar
definiți decât într-un depozit complet
» Îmbunătățește timpul de răspuns al de date
utilizatorului final
20
În figura 9 și figura 10 este afișat modul în care obținem depozitul de date de formular la
“data marts”.
DATA MART
Data Warehouse
21
Concluzie
În acest proiect am ajuns să știm mai multe despre depozitele de date și beneficiile sau
problemele lor. După cum am citit deja, un Data Warehouse este depozit central pentru toate sau
părți semnificative ale datelor pe care le colectează diferitele sisteme de afaceri ale unei
întreprinderi. Depozitul de Date (Data Warehouse) este conceput pentru a ne ajuta să analizăm
datele. Analizarea datelor ne oferă posibilitatea de a lua decizii corecte în afaceri, analizarea
acestora cu ajutorul Depozitelor de Date ne economisește mult timp pentru a ajunge la concluzia
corectă și la deciziile corecte pe care trebuie să le luăm.
Ideea principală a acestei atribuiri a fost să înțelegem modul în care Depozitele de Date ne pot
ajuta în afaceri și modul în care le putem folosi. Sper că prezentarea beneficiilor și a problemelor
care apar în timpul utilizării Depozitelor de Date (Data Warehouse) , arătând utilizarea strategică
a tabelului de depozitare a datelor la fel de mult ca scrierea despre evoluția utilizării
organizaționale a Depozitelor de Date (Data Warehouse) sau a aplicațiilor sale, ajută la atingerea
acestui obiectiv principal al proiectului.
22
Bibliografie
Sam Anahory, . M. (1997). Data Warehousing in the Real World.
Valsamidis, P. S. (n.d.). Data Bases and Data Mining. Technological Educational Institute of
Kavala.
23