Sunteți pe pagina 1din 16

ÎNCĂRCAREA DATELOR ÎN

DEPOZITELE DE DATE

Coordonator:
Conf. Univ. Dr. BULIGIU ION

MASTERAND:
Cimpoeru Ioana-Violeta
DEPOZITELE DE DATE
Considerente generale

 După Ralph Kimball, un depozit de date


reprezintă „o copie a datelor, special structurate în
vederea interogărilor și analizelor”.
 Depozitele de date completează informatizarea
organizațiilor, alături de sistemele informatice
tranzacționale. Rolul depozitelor de date este de a
stoca date preluate din restul sistemelor informatice,
în vederea analizării acestora prin diverse mijloace
Obiectivele depozitelor de date

 Suportul în asistarea deciziei 


 Depozitul de date trebuie să ofere acces rapid și
facil la informații
 Consistența datelor
 Flexibilitate și adaptabilitate
 Confidențialitatea
Componentele unui depozit de date
 Sursele de date

Cel mai adesea, sursa de date o reprezintă bazele de


date ce deservesc sistemele operaționale din firmă.
Dacă anterior am considerat că depozitele de date
trebuie separate de aceste sisteme, conlucrarea între ele
reprezintă o premisă a succesului implementării unui
sistem informatic de asistare a deciziei bazat pe sinteza
și analiza datelor.
 Componența de pregătire a datelor

Componența de pregătire a datelor este acea


parte a arhitecturii depozitului de date în care au
loc procesele de extragere,
transformare și încărcare a datelor, zona de graniță
între sursele de date și depozitul de date.
 Depozitul de date propriu-zis

Reprezintă acea parte a arhitecturii depozitului de


date în care sunt stocate datele, disponibile pentru a fi
accesate de către utilizatori. Depozitul de date se
prezintă sub forma unei colecții de baze de date
multidimensionale, fiecare dintre acestea fiind dedicate
unui anume segment din activitatea firmei: vânzări,
contabilitate financiară, buget etc.
Proiectarea unui depozit de date
 În proiectarea unui depozit de date, principalul
criteriu pe care trebuie să îl avem în vedere îl
reprezintă nevoile informaționale ale beneficiarilor
depozitului de date, corelat cu necesitatea ca aceștia
să acceseze cât mai ușor datele ce le sunt necesare.
 Există trei variante de modele utilizate în proiectarea unui
depozit de date:
 modelul stea (star): presupune existența unui singur tabel de
fapte, de care sunt legate toate tabelele dimensionale ale
modelului;
 modelul fulg de nea (snowflake): presupune existența unui
singur tabel de fapte, dar nu toate tabelele dimensionale
sunt legate direct de acesta, ci dimensiunile legate prin
relații de tip părinte-copil sunt reprezentate prin tabele
dimensionale separate. Tabelele asociate dimensiunilor
părinte sunt legate numai de tabelele asociate dimensiunilor
copil, acestea din urmă fiind legate de tabelul de fapte;
 modelul constelație: se caracterizează prin existența mai
multor tabele de fapte, partajate de tabelele dimensionale
corespunzătoare.
Modelul stea al depozitului de date
Modelul fulg de nea al depozitului de date
Modelul constelație al depozitului de date
 Componentele client

Putem aprecia că aceste ultime componente sunt la


fel de importante ca și depozitul de date propriu-zis,
deoarece de folosirea corespunzătoare a acestora
depinde calitatea informațiilor ce vor fi puse la
dispoziția utilizatorilor finali.
ÎNCĂRCAREA DATELOR ÎN DEPOZITELE DE DATE

 După ce am creat tabelele în NDS și DDS, este


timpul să le populăm.
 Cu toate acestea, înainte de a le popula, trebuie să
preluăm datele din sistemul sursă.
 Este vorba despre extragerea datelor.
Introducere în ETL

 ETL înseamnă Extragere, Transformare și


Încărcare. Este procesul de preluare și transformare
a datelor din sistemul sursă și introducerea lor în
depozitul de date.
 Există câteva principii de bază de înțeles atunci
când extrageți date dintr-un sistem sursă în scopul
populării unui depozit de date. În primul rând,
volumul de date preluate este mare, probabil sute de
megabytes sau zeci de gigabytes.
Abordări ETL și Arhitectură
 Există mai multe abordări ale implementării ETL.
 O abordare tradițională este de a extrage datele din
sistemele sursă, de a le pune într-o zonă de
stadializare, apoi de a le transforma și încărca în
depozit.
 Alternativ, în loc de a pune datele dintr-o zonă de
înregistrare, uneori serverul ETL face transformarea
în memorie și apoi actualizează direct depozitul de
date.
 Zona de înscenare este o bază de date fizică sau
fișiere.
Vă mulțumesec!

S-ar putea să vă placă și