Documente Academic
Documente Profesional
Documente Cultură
SISTEMUL
INFORMAIIONAL
For de munc
Capital
Res. Financiare
SISTEMUL
DE
CODNUCERE
Personal
Echipamente
SISTEMUL
DE BAZ
Date primare
Tehnologii
Membrii unei entiti reprezint elementele dintr-o entitate. Toi membrii entitii sunt
descrii de acelai set de atribute. Ei se difereniaz ns prin valorile alocate, i desigur nu se
admit membrii identici n cadrul unei entiti (figura 2.).
6.1.2. Structura logic a unei entiti
O entitate este complet definit dac i se precizeaz numele, iar atributele sunt definite dac li
se precizeaz, numele, tipul i lungimea acestora. Precizarea acestor elemente, se numete
structura logic a entitii :
NUME
TIP
LUNGIME
Cod_produs
numeric
4
Denumire_produs
text
20
Stoc
Number
6
Pre
numeric
6
Fig. 3. Structura logic a entitii
CHEIE
da
-
Fig.4. Fiierul
Fiierul ocup un spaiu pe disc, nu neaprat continuu, marcat de o etichet de nceput de
fiier header label HDR, i de o etichet de sfrit de fiier - end of file label EOF
Totalitatea datelor coninute ntr-un fiier caracterizeaz o entitate informaional.
Orice fiier este definit prin urmtoarele elemente:
coninutul informaional;
metoda de organizare;
modul de acces;
caracteristicile suportului de memorie;
specificatorul de fiier;
proprieti, atribute proprii - read only, hidden, system,
archive, size, data crerii, data ultimei modificri, etc;
Un fiier se compune din nregistrri. O nregistrare memoreaz datele despre un membru
al entitii. La rndul ei nregistrarea se compune din cmpuri. Un cmp dintr-o nregistrare
corespunde unui atribut al entiti. n consecin vom avea cmpuri numerice, alfabetice sau
alfanumerice.
6.1.5. Metode de organizare a fiierelor clasice
Memorarea datelor ntr-un fiier pe disc are n vedere n primul rnd necesitile de acces la
nregistrrile fiierului respectiv modul de citire a nregistrrilor. Dou sunt modurile de
acces: accesul secvenial i accesul direct. Metoda de organizare are n vedere regulile de
nscriere a nregistrrilor pe disc.
Metode de organizare :
organizarea secvenial,
organizarea indexat,
organizarea relativ,
Lumea reala
Schema conceptuala a
BD
1. definire/descriere
structura datelor
Model de date
2.incarcare/valida
rea datelor
3. acces la date
5. protectia datelor
BD
4. intretinere
BD (BD Oracle)
Nucleul (SQL, PL/SQL, Java)
10
11
Pentru a se realiza fizic asocierea dintre dou tabele este necesar s avem cmpuri comune n
cele dou tabele.
Tabel:
Matricola_Stud
Tabel:
Date_Pers_Stud
Fig.10 Asociere unu-la-unu
Asocierea de tip arborescent unu-la-muli, este cel mai uzual tip de asociere dintre dou tabele
(tabela printe i tabela fiu). Cmpurile comune pe baza crora se face asocierea dintre cele
dou tabele se numesc:
12
Asociere UNU-LA-MULI
1. tabela printe conine cheia primar
2. tabelal fiu conine chei externe
Instanele bazei de date sunt valorile curente care variaz Schema i instanele ei sunt
stocate n BD i anume: schema n dicionarul BD, instanele n datele propriu-zise (figura
12).
Un SGBD ofer diferite niveluri de reprezentare (niveluri de abstractizare ) a datelor ntr-o
baz de date:
Nivelul logic (schema logic a bazei de date)
Nivelul extern (schema extern)
Nivelul intern (schema fizic)
14
MATERIALE
FURNIZORI
COD_MAT
COD_F
COMENZI
COD_MAT
COD_F
NRCDA
NRCDA
FACTURI
15
Acest proces de analiz trebuie s stabileasc i cheile primare, cheile externe i astfel s se
defineasc relaiile dintre tabele.
Optimizarea structurii bazei de date este un proces prin care se urmrete:
reducerea redundanei datelor;
eliminarea anomaliilor de actualizare.
Reducerea redundanei datelor pn la un nivel minim i controlat urmrete eliminarea
duplicrii inutile a unor cmpuri n mai multe tabele sau eliminarea cmpurilor obinute prin
calcul pe baza cmpurilor atomice. Un anumit nivel de redundan, ns, trebuie admis pentru a nu
denatura realitatea reflectat de date. De exemplu, cmpul VALOAREA_CONTRACTULUI, se
calculeaz dup relaia : VALOAREA_CONTRACTULUI=CANTITATE*PRET
Nu este recomandat eliminarea acestui cmp pe considerentul c el se obine automat prin
calcul. De exemplu, n cazul n care dup un anumit interval de timp, preurile suport o
majorare global, cum se practic foarte des, atunci automat se vor modifica i valorile
contractelor ncheiate anterior datei de majorare a preurilor, ori acest lucru nu este corect,
contractul odat perfectat nu-i poate modifica preul convenit prin negociere.
Anomaliile de actualizare se refer la anomaliile de tergere, respectiv de modificare. S
consideram de exemplu o firm care deruleaz lunar sute de comenzi de aprovizionare, pentru
un nomenclator foarte mare de produse, dar care opereaz numai cu civa furnizori. Dac n
tabela COMENZI includem nu numai codul furnizorului ci i denumirea furnizorului, contul
su bancar sau denumirea bncii cu care lucreaz, atunci va aprea urmtoarea anomalie de
actualizare n cazul schimbrii bncii i a contului bancar al furnizorului. n loc s modificm
aceste date o singur dat doar n tabela FURNIZORI, va trebui s operm modificarea n
zeci, poate sute de rnduri n tabela COMENZI (figura 15)
17
18
Componentele de baz ale unui sistem informatic de tip BI sunt (figura 15):
Instrumentele ETL
Depozitul de date
Instrumentele de raportare i interogare
Instrumentele OLAP, instrumentele de tip data mining
Tablouri de bord/dashboards
Instrumente de extragere, transformare i ncrcare - ETL (Extraction,
Transforming and Loading):
extrag date din sistemele operaionale interne i sursele externe
le transform ntr-o form corect
le ncarc n depozitul de date
Tablouri de bord
Depozitul de date
Faza de ncrcare
20
CRM
Eliminare date
incomplete, corupte,
incorecte
ERP
Alte
surse
extragere
Transformare
(reguli de
transformare)
curatare
DW
incarcare
21
Fiecare firm are propriul set de subiecte. Depozitul de date stocheaz date despre diferite
subiecte. Fiecare subiect conine date specifice. Subiectele pot avea unele date comune. Un
depozit de date pentru departamentul de Vanzri conine date despre: produse, clieni, locaie
geografic (orae, judee). Dar datele despre clieni se regsesc i la departamentele de
Marketing, Financiar i Transport.
Colecii de date integrate
Datele din surse diferite sunt transformate ntr-un format consistent. De exemplu, atributul
SEX are valori diferite n aplicaii operaionale diferite (n aplicaia A ia valorile m/f, n
aplicaia B ia valorile 0/1). Inainte de a fi ncrcate n depozitul de date, se va utiliza o regul
de transformare i anume: valoarea 1 se va mapa la valoarea m, iar valoarea 0 se va mapa la
valoarea f.
Alte situaii sunt prezentate n figura de mai jos:
22
Fapte (fact) = elementele de date care sunt analizate. Poate fi un indicator de performan
prin care se poate analiza performana/neperformana activitii modelate.
Dimensiuni (dimensions) = furnizeaz informaii descriptive despre fiecare fapt (cine? ce?
unde? cand? si cum? despre un fapt)
Indicatorii pot fi:
de baz: volumul vnzrilor, cantitatea vndut, costurile, numrul de clieni;
derivai care se obin prin combinarea indicatorilor de baz: profitul, productivitatea.
Tabela de fapte
este tabela central (n schem stea) i corespunde unei colecii de fapte din modelul
dimensional;
conine un numr foarte mare de tupluri (posibil milioane). Numrul de tupluri din
tabel reprezint de fapt produsul cartezian al dimensiunilor;
conine toi indicatorii de performan importani ;
cheia primar a tabelei este o cheie compus, format din cheile primare ale tabelelor
de dimensiuni;
este normalizat i realizeaz de fapt o legtur indirect ntre dimensiuni;
poate conine i date agregate ;
Granulaia
Granulaia unui indicator/fapt se refer la nivelul de detaliu la care este stocat n
modelul dimensional. De exemplu: Cantitatea vandut[ poate fi stocat la nivel de zi/
lun, produs /categorie de produs.
Afecteaz dimensiunea DW, nivelul de analiz, flexibilitatea DW;
Depinde de cerinele analitice ale businessului.
Dimensiunile
Furnizeaz informaii descriptive despre fiecare indicator;
Reprezint entiti din lumea real i nu procese de business. De exemplu pentru
tabela de fapte Vanzri, caracteristicile indicatorului vanzari lunare pot fi : Locaia
(unde), Timpul (cand), produsul vandut(ce);
Conin n general date statice. Atributele dimensionale nu se modific la fel de des ca
atributele din tabela de fapte;
Sunt eseniale pentru analiz. Un model dimensional ce ofer un numr mare de
atribute dimensionale permite analize ct mai complexe i mai variate;
23
ntr-o schem stea, sunt tabelele care se dispun radial n jurul tabelei de fapte i se mai
numesc tabele de dimensiuni. Aceste tabele sunt denormalizate, iar cheia lor primar
este o cheie simpl;
Sunt tabele mai mici decat tabela de fapte;
Dimensiuni comune afacerilor sunt : Locaia, Produsul, Clientul, Timpul.
Membrii unei dimensiuni
O dimensiune conine mai muli membri;
Un membru este un nume distinct sau un identificator folosit pentru a determina
poziia unui element de dat (n schema stea apare sub denumirea de atribut
dimensional). De exemplu, toate lunile, trimestrele i anii formeaz dimensiunea
Timp i toate oraele, regiunile i rile dimensiunea Locaie;
Un membru poate aparine la una sau mai multe ierarhii sau poate s nu fie inclus ntro ierarhie (membru independent). De exemplu, n dimensiunea Produs membru
culoare nu este inclus n nici o ierarhie.
Ierarhia
membrii unei dimensiuni se pot aranja n una sau mai multe ierarhii. De exemplu,
zilele se pot grupa n sptmani i ani (o ierarhie), sau n luni, trimestre i ani (alt
ierarhie) (figura 15).
fiecare ierarhie poate avea mai multe nivele ierarhice. De exemplu, ierarhia din
dimensiunea Timp include 3 nivele ierarhice: an, trimestre i luni (figura 19).
24
tabela de dimensiuni Timp prin atributul timp_id, de tabela de dimensiuni Produs prin
atributul item_id, iar de tabela de dimensiuni Locatie prin atributul locatie_id. Indicatorii
stocai n tabela de fapte sunt : cantitatea vandut i volumul vanzrilor .
27
msurile sunt stocate n celulele cubului (n exemplu prezentat msura este cantitatea
vandut). De exemplu, 65 se refer la cantitatea vandut de Sprite n luna Ianuarie n
magazinul St3.
membrii dimensiunilor. Dimensiunea Timp are ca membrii: lunile. Dimensiunea
Produs este o dimensiune ierarhic cu membrii: All, Drinks, Dairy, Milk, etc.
29
30
32
Test de autoevaluare
1. In modelul relaional :
a) fiecare atribut i ia valorile dintr-un domeniu de valori;
b) exist conceptul de tuplu;
c) ordinea tuplurilor i a atributelor are o mare importan;
d) mai multe atribute pot lua valori din acelai domeniu de valori;
Care afirmaie este eronat?
2. Actualizarea datelor dintr-o tabel presupune:
a) adugarea unui nou tuplu;
b) tergerea mai multor tupluri;
c) afiarea tuturor tuplurilor;
d) modificarea domeniului de valori pentru un atribut;
Care dintre afirmaii este eronat?
3. Bazele de date se pot clasifica n funcie de :
a) sistemul de calcul pe care se implementeaz ;
b) limbajul de programare procedural utilizat ;
c) modelul de date implementat ;
d) localizarea BD ;
e) setul de instruciuni;
Care dintre afirmaii este eronat?
4. Precizai trei concepte de baz ale modelului dimensional.
5. Precizai care sunt caracteristicile tabelei de fapte.
6. Pentru fiecare categorie de instrumente BI, identificai trei instrumente, altele
decat cele specificate n suportul de curs.
33
Rspunsuri
1. c
2. d
3. e
Bibliografie
1. P.Pocatilu, T.Surcel, A Reveiu., F. Alecu s.Birotica Profesional, Ed. ASE, 2009;.
2. Surcel, R.Maranu A Reveiu, P Pocatilu, F Alecu, R Bologa, Informatic Economic, Ed.
Tribuna Economic, 2005
3. Gh. Sabu, M. Muntean, V. Avram, M. Drdal, R. Bologa, R. Bologa, Baze de date, ed.
Matrix, 2008
34