Documente Academic
Documente Profesional
Documente Cultură
Introducere n Modelarea BD
INTRODUCERE IN TEHNOLOGIA BAZELELOR DE DATE
1. BAZE DE DATE
Bazele de date (BD) reprezint o structur logic n care o cantitate de informaii este memorat
pe un suport fizic. Altfel spus, BD reprezint totalitatea informaiilor necesare despre obiectele care
intervin n mai multe aplicaii, relaiile logice dintre acestea i tehnicile de prelucrare
corespunztoare.
O BD permite:
- stocarea eficient a datelor,
- regsirea i prelucrarea
- ntreinerea datelor.
La nivel inferior, BD sunt reprezentate prin fiiere. O BD poate fi folosit pentru a stoca
fiiere binare, documente, imagini grafice sau video, date relaionale, date multidimensionale, date
analitice, date geografice etc.
Natura datelor care sunt prelucrate n domeniul ingineriei industriale si roboticii este foarte
divers: date tehnice, date experimentale (deformaii, viteze), date de proiectare (caracteristici de
material, dimensiuni i forme constructive), date provenite din simularea unor parametri funcionali
(acceleraii, defazaje de timp), date statistice (n ingineria economic). Ele trebuie s fie nregistrate,
organizate, prelucrate, vizualizate, accesate, reactualizate. Din acest punct de vedere BD ocup o
poziie central n cadrul ingineriei asistate, constituind un liant ntre diferite tipuri de programe de
calcul sau grafice.
Orice baz de date modeleaz un sistem sau un proces din lumea real.
2. Proprietile BD
Partajarea datelor
Datele memorate ntr-o baz de date sunt destinate folosirii de ctre mai muli utilizatori,
uneori chiar simultan. Spre exemplu, o baz de date referitoare la studeni poate fi accesat att de
profesori, ct i de studeni sau personal administrativ.
Integrarea datelor
Condiia de integrare: s nu conin redundane. O dat este considerat redundant n cazul
n care un atribut are dou sau mai multe valori identice sau dac ea poate fi tears fr ca prin
aceast operaie s se produc pierdere de informaie. Prin urmare, redundana datelor nu presupune
obligatoriu existena duplicatelor.
Integritatea datelor
Integritatea presupune c baza de date reprezint o reflectare corect a realitii modelate.
Spre exemplu, n cazul unei baze de date referitoare la o firm, integritatea presupune sigurana
c se obin rspunsuri corecte la toate interogrile. De exemplu: ci salariai cu studii superioare
sunt n firm, care este valoarea medie a contractelor incheiate, sau care este produsul cel mai
vandut etc. Integritatea datelor se realizeaz prin constrngeri de integritate. De exemplu, un
produs s nu poat fi facturat dac nu este n stoc.
Securitatea datelor
Se realizeaz prin restricionarea accesului la date. De exemplu. un sistem securizat ar putea fi
acela n care personalul din departamentul financiar are acces la datele referitoarela costuri, dar nu
poate modifica datele tehnice ale unui produs.
Abstractizarea datelor
BD este un model al realitii, dar care deine numai detaliie relevante ale datelor pentru o
anumit aplicaie. Prin urmare o BD este, de fapt, o abstractizare a realitii.
Avantajele folosirii bazelor de date
Memorare bine organizat, regsirea i prelucrarea rapid a unui volum mare de date.
O BD este creat pentru a fi uor actualizat i interogat.
3. SISTEMUL DE GESTIUNE A BAZELOR DE DATE (SGBD)
Sistemul de programe care permite construirea bazelor de date, ntreinerea i accesul la o baz
de date se numete Sistem de gestiune a bazelor de date (SGBD). El conine o interfa grafic i
instrumente pentru accesul la date al utilizatorilor. De asemenea, SGBD permite organizarea,
stocarea, gestionarea, salvarea, recuperarea, mentenana, extragerea datelor dintr-o BD.
Sistemul de BD
Aplicatia 1
SGBD
BD
Aplicatia 2
Aplicatia 3
Aplicatia 4
n prezent sistemele relaionale de gestiune a bazelor de date sunt cele mai utilizate. IBM este
unul dintre liderii de pia n acest domeniu prin produsul DB2 UDB Enterprize Server Edition. Alte
SGDB relaionale sunt : Oracle, Microsoft SQL Server, MySQL, dBASE etc.
5. DB2. GENERALITI
DB2 UDB este program de baze de date relaional dezvoltat de firma IBM i se folosete
pentru aplicaii de tip comer, afaceri, integrarea informaiilor (e-Commerce, Business Intelligence i
Information Integration).
DB2 UDB are posibiliti de autoconfigurare, auto-optimizare i auto-mentenan, are
performane ridicate, include nouti din tehnologia IT i permite programatorilor integrarea cu
aplicaii de tip Web. De asemenea, are un set de utilitare pentru integrarea cu alte aplicaii i sisteme,
precum i pentru interconectarea cu alte baze de date.
Familia de produse IBM DB2 Universal Database conine urmtoarele (Fig. 2) :
DB2 Universal Database Enterprise Server - sistem de baze de date multiutilizator,
relaional, pentru configuraii complexe i baze de date de dimensiuni mari.
DB2 Universal Database Workgroup Server - este un SGDB multiutilizator, relaional
destinat aplicaiilor i datelor folosite n reele de tip LAN (local, nu prin internet). Este un server
relaional de baze de date care se poate folosi n medii departamentale sau medii de afaceri de
dimensiuni intermediare ce posed un numr suficient de mare de utilizatori interni.
DB2 Universal Database Universal Developer's Edition este un pachet redus pentru
dezvoltarea de aplicaii n scopul proiectrii, obinerii i elaborrii de prototipuri corespunztoare
oricrui client DB2. Conine toate instrumentele necesare dezvoltrii aplicaiilor de tip client/server
in mediul DB2 UDB.
DB2 Universal Database Express Edition - Acesta este un sistem de gestiune a bazelor de
date relaional destinat organizaiilor de dimensiuni mici i mijlocii.
Proiectarea unei baze de date ncepe prin analiza cerinelor, se realizeaz apoi un model al
bazei de date, dup care se face implementarea.
6.1 Analiza datelor
n aceast etap se analizeaz natura datelor i modul cum vor fi ele utilizate. Se identific
datele care trebuie memorate i procesate. Etapa de analiz este o etap obligatorie, deoarece este
costisitor i greu de modificat un model implementat.
Informaiile necesare realizrii modelului conceptual se identific folosind metode
convenionale: discuii ntre partenerii de proiect, studiul documentelor (formulare, rapoarte) etc.
6.2 Modelarea BD
Cea mai folosit reprezentare a modelului conceptual este diagrama entitate-relaie (ER Entity Relationship diagram) care faciliteaz comunicarea ntre proiectant i beneficiar.
Caracteristicile diagramelor ER reprezint faptul c:
- sunt un instrument de proiectare;
- sunt o reprezentare grafic a unui sistem de date;
- ofer un model conceptual de nivel nalt al bazelor de date;
- permit nelegerea de ctre utilizatori a datelor i a relaiilor dintre acestea;
- sunt independente de implementare.
Diagrama ER a aprut n anul 1970 fiind introdus de Peter Chen. Modul de reprezentare
folosit de IBM-Data Studio se bazeaz pe modelul dezvoltat de C. R. Bachman.
Elementele principale ale diagramei ER sunt: entitatea, atributul i relaia.
Entitatea
Entitile sunt obiecte care au o existen independent de existena oricrei alte entiti dintro baz de date. Numele entitii este un substantiv la singular. n modelul fizic entitile se reprezint
prin tabele.
O entitate poate fi un obiect (carte, stoc, factur etc.), o persoan (angajat, pacient, student),
o noiune abstract (nivel, note etc.) sau eveniment (tranzacie, nscriere, mprumut etc.) care are
semnificaie pentru BD modelat i despre care trebuie s colectm i s memorm date.
Atributul este un element specific al entitii care trebuie cunoscut i memorat. Un atribut este un
substantiv la singular. De exemplu, atributele entitii personal sunt (Fig. 3): nume, prenume, adresa,
numr de telefon, adresa de email, data naterii etc. n modelul fizic al BD atributele sunt cmpurile, sau
coloanele tabelului.
ntr-o aplicaie intereseaz evoluia n timp a unui atribut, trebuie reinut istoricul evoluiei
atributului. Aceasta se realizeaz printr-o nou entitate, n cazul nostru PRET
Fig. 10
S presupunem c modelm o baz de date pentru o bibliotec (Fig. 11). n acest caz este
important de reinut un istoric al tuturor mprumuturilor, deoarece pe baza acestora, se pot afla
domeniile de interes ale cititorilor i se poate stabili ce achiziii de carte s se fac n viitor. De
asemenea, se poate determina uzura crilor i care dintre ele trebuie nlocuite. n Fig. 11 relaia
dintre entitile CARTE i CITITOR este many-to-many: fiecare carte poate fi mprumutat de
mai
muli
cititori
i
fiecare
cititor
poate
mprumuta
mai
multe
cri:
codcarte+codcititor+data_imprumut =UNIQUE
a.
b.
Fig. 11 Rezolvarea relaiei many-tomany
O prim rezolvare este n Fig. 11,a. Condiia care trebuie pus este cod_carte+data_imp s
fie unic. Se verific dac o carte poate fi mprumutat n acelai timp de mai muli cititori. n acest
caz s-au barat cele dou relaii dinspre entitatea de intersecie. Aceasta nu este ntotdeauna o soluie
bun. Mai exist varianta: se introduce o cheie artificial n entitatea de intersecie (Fig. 11,b), n
acest caz: #codimpr.
Normalizarea datelor
Normalizarea este o tehnic de proiectare a bazelor de date prin care se elimin (sau se evit)
anumite anomalii i inconsistene ale datelor.
Anomaliile care pot s apar la o baz de date nenormalizat sunt urmtoarele:
anomalii la actualizarea datelor la o bibliotec se nregistreaz ntr-o tabel urmtoarele
date despre cri: ISBN, titlu, autor, pre, subiect, editura, adresa editurii. La un moment dat o
editur i schimb adresa. Bibliotecara va trebui s modifice adresa editurii respective, n
nregistrrile corespunztoare tuturor crilor din bibliotec aprute la respectiva editur. Dac
aceast modificare nu se face cu succes, unele dintre nregistrri rmnnd cu vechea adres, apare
din nou o inconsisten a datelor.
anomalii de inserare n exemplul anterior, nu vom putea memora adresa unei edituri,
lucru inacceptabil dac dorim s avem informaii i despre editurile ale cror cri nu le avem n
bibliotec, eventual de la care dorim s facem comenzi.
anomalii de tergere s presupunem c ntr-o tabel memorm urmtoarele informaii:
codul studentului, codul cursului, codul profesorului. La un moment dat, nici un student nu mai
dorete s participe la un anume curs. tergnd toate nregistrrile corespunztoare cursului, nu vom
mai putea ti niciodat cine preda acel curs.