Documente Academic
Documente Profesional
Documente Cultură
DEPARTAMENTUL INFORMATIC
REFERAT
CHIINU 2016
Cuprins
Introducere .................................................................................................................................................................... 3
Concluzie ..................................................................................................................................................................... 17
Bibliografie .................................................................................................................................................................. 18
2
Introducere
n ultimii ani, dezvoltarea sistemelor de baze de date reprezint unul dintre cele mai
importante aspecte n domeniul tehnologiei informaiei, avnd un impact decisiv asupra modului
de organizare i funcionare a numeroaselor instituii i servicii. Acestea sunt companiile de
comunicaie, intreprinderile de comer, serviciile bancare, serviciile de transport, asigurrile,
universitile etc. Acestea sunt dependente de funcionarea corect i nentrerupt a sistemelor de
baze de date.
Sistemele de baze de date sunt o component important a vieii de zi cu zi n societatea
modern. Zilnic, majoritatea persoanelor desfoar activiti care implic interaciunea cu o
baz de date: depunerea sau extragerea unei sume de bani din banc, rezervarea biletelor de tren
sau de avion, cutarea unei cri ntr-o bibliotec computerizat, gestiunea angajailor dintr-o
firm, cumprarea unor produse etc.
Bazele de date pot avea mrimi (numr de nregistrri) i complexiti extrem de variate,
de la cteva zeci de nregistrri (de exemplu, baza de date pentru o agend de telefon a unei
persoane)sau pot ajunge la milioane de nregistrri (de exemplu, baza de date pentru crile dintr-
o bibliotec, baza de date cu stocarea angajailor unei firme sau baza de date unde se pstreaz
informaii despre situaia studenilor etc).
Marea majoritate a sistemelor de baze de date existente n momentul de fa sunt
relaionale i exist un numr mare de astfel de sisteme comerciale care pot fi achiziionate i
folosite pentru propriile dezvoltri. Modelul relaional de baze de date a fost introdus n anul
1970 de ctre E.F.Codd.
Utilizatorii unei baze de date au posibilitatea s efectueze mai multe categorii de operaii
asupra datelor stocate aici:
Introducerea de noi date (insert)
tergerea unor date existente n baza de date(delete)
Actualizarea datelor stocate(update)
Interogarea bazei de date (query) pentru regsirea anumitor informaii, selectate dup
un criteriu ales.
3
1. Baze de date distribuite
O baz de date distribuit (BDD) este o colecie logic corelat de date partajate,
distribuite fizic pe o retea de calculatoare.Un sistem de gestiune al unei baze de date distribuite
(SGBDD) este un sistem software care permite gestionarea BDD i face distribuirea transparent
pentru utilizator.
Sistemele de date distribuite sunt menite s rezolve problema "insulelor de informaii".
Ele au aprut ca o necesitate, n special n cazul reelelor de calculatoare, pentru a sprijini
gestionarea datelor n situaia cnd acestea se regsesc fizic n diferite puncte ale reelei.
Sistemul fizic (reeaua) care constituie suportul unei baze de date distribuite poate fi
format din calculatoare personale, minicomputere, staii de lucru, etc. toate legate n reea i
numite generic site-uri.
Putem reformula definiia de la nceput spunnd ca un sistem de baze de date distribuite
const dintr-o colecie de site-uri, fiecare putnd participa la executarea tranzaciilor care
acceseaz datele de pe un site sau de pe mai multe site-uri.
Printre cerinele pe care trebuie sa le asigure un sistem de baze de date distribuite
mentionam: autonomia locala n organizarea i prelucrarea datelor, neutilizarea unei centralizari
a evidenei i a datelor, posibilitatea de lucru continuu al site-urilor independent de schimbrile
n configuraiile de lucru (adugri sau eliminari de site-uri), independena localizarii i
fragmentrii datelor (transparena fizic), posibiliti de replicare (copiere) i independena
copiilor, prelucrarea distribuit a cererilor, administrarea distribuit a tranzaciilor, independena
de hardware, de sistemul de operare, de reea i de sistemul de gestiune a bazelor de date.
Un SGBDD const dintr-o singur baz de date care este descompus n fragmente,
eventual unele fragmente sunt multiplicate, i fiecare fragment sau copie se pstreaz pe unul sau
mai multe site-uri, sub controlul unui SGBD local. Fiecare site este capabil sa proceseze
interogari utilizator n regim local, independent de restul reelei, sau este capabil sa participe la
procesarea unor date situate n alte site-uri din reea. Pentru a spune ca un SGBD este distribuit
trebuie sa existe cel putin o cerere global.
Tranzaciile ntr-o baza de date distribuit sunt clasificate n tranzacii locale i tranzacii
globale dupa site-urile pe care le solicit excutarea lor.
O configuraie pe reea reprezint o baz de date distribuit daca diversele site-uri sunt
"constiente" de existena celorlalte site-uri i dac fiecare site ofer un mediu n care se pot
executa tranzacii locale i globale.
4
1.1. Avantajele bazelor de date distribuite
Arhitectura ANSI-SPARC pe trei nivele a unei baze de date distribuite este redat grafic n
pagina urmatoare, Fig 2. Dm mai jos cteva explicaii referitoare la unele elemente prezente n
schema:
SGBD omogene reprezint situaia cnd pe toate site-urile din reea este hardware similar, sistem
de operare identic i, cel mai important, SGBD local identic.
In cazul SGBD heterogene exist mai multe situatii dup cum difer dotarea hardware,
sistemele de operare i/sau SGBD-urile utilizate local pe site-uri. Diferenele pot fi mpinse pana
la a avea structuri ale bazei de date diferite (date de modele de date diferite) dar, evident, lucrul
n acest caz este destul de greoi i este supus multor limitri.
7
Figura 2. Arhitectura complet a unui SGBDD
8
Figura 2.1. Componente ale arhitecturii unui SGBDD
1. Sistemul de gestiune a bazei de date local (SGBDL) este responsabil de controlul datelor
locale de pe fiecare site i are un catalog de sistem local propriu.
2. Componenta de comunicatie a datelor (CD) este un software ce permite ca toate site-urile
s comunice ntre ele. Componenta CD conine informaii despre site-uri i legturi.
3. Catalogul de sistem global (CSG) ca baz de date distribuit conine informaii specifice
despre natura distribuiei sistemului ca: fragmentarea, replicarea i scheme de alocare. Ele nsui
pot fi gestionate ca BDD i pot fi fragmentate i distribuite, complet replicate sau centralizate,
ca orice BD. Orice CSG complet poate fi complet replicat sau centralizat ca orice relatie. Un
CSG complet replicat care mpac cu autonomia site-ului i orice modificare a CSG trebuie
comunicata la toate site-urile. Un catalog de sistem global se mpac cu autonomia site-urilor dar
devine vulnerabil la penele site-ului central.
Proiectarea corecta unei baze de date relaionale distribuite necesit, pe lnga cerinele
cunoscute pentru sistemele centralizate, i realizarea urmatoarelor:
fragmentarea datelor informaiile pot fi partiionate n fragmente care sunt apoi stocate
pe diferite site-uri n reea
replicarea se pot realiza copii ale diferitelor relaii sau ale fragmentelor
alocarea fragmentelor i a replicilor pe diferite site-uri
9
realizarea, pe ct posibil a accesului n regim de referinte locale. Acolo unde este necesar
i unde permite aplicaia se recomand utilizarea de copii ale fragmentelor
obinerea unei fiabiliti i a unei disponibiliti deosebite ale bazei de date prin utilizarea
optim a replicrii fragmentelor
realizarea unor parametri deosebii de performan. Dac se aloc prost datele pe site-uri
se ajunge fie la suprasolicitarea unui site (loc ngust) fie la utilizarea resurselor la un nivel
inferior
optimizarea capacitaii i a costurilor de stocare. Capacitatea i costurile de stocare
trebuie puse n balana cu tendina de a avea referine locale, deoarece au efecte contrare.
optimizarea costurilor de comunicare. Aici sunt de luat n considerare mai ales costurile
interogrilor ntre site-uri. Trebuie s se aib n vedere c, dac se pot micora costurile de
regsire atunci cnd referinele sunt mai ales locale (sau cnd fiecare site are propriile copii ale
datelor) n schimb actualizrile n aceeai situatie pot crete costurile foarte mult (i riscul
obinerii inconsistenei) deoarece trebuie s fie realizate asupra datelor de la toate site-urile.
Se cunosc patru strategii de alocare a datelor ntr-o baza de date relaional distribuit:
1. centralizat
Baza de date se afl n ntregime pe un singur site din reea i este gestionat de un singur
DBMS. Spunem n acest caz c baza de date este procesat distribuit, ea de fapt nu mai este o
baza de date distribuit n adevratul sens al cuvntului. Dezavantajele sunt mai ales costurile
mari de comunicaii i o fiabilitate i o disponibilitate foarte sczute, avnd n vedere ca orice
eroare care blocheaz accesul la baza de date, practic paralizeaz ntreaga activitate n reea pe
aceast direcie.
2. fragmentat (partiionat)
Baza de date este partiionat n mai multe fragmente disjuncte care sunt stocate pe diverse site-
uri. Comentarii:
aceasta partiionare a datelor poate mbuntai frecvena referintelor locale
dac nu exist replici ale fragmentelor, costurile de stocare sunt reduse
fiabilitatea i disponibilitatea sunt sczute dar nu aa de mici ca n cazul centralizat
dac datele sunt distribuite corect, costurile de comunicare pot fi relativ sczute
3. replicat complet
Pe fiecare site se gaseste o copie completa a bazei de date. Comentarii:
eficiena referirilor locale, fiabilitatea i disponibilitatea sunt maxime
10
costurile de stocare sunt n schimb i ele foarte mari, la fel sunt i costurile de actualizare
4. replicat selectiv
Aceast strategie este o combinaie ntre partiionare, replicare i centralizare cu scopul de a
se cumula, pe cat posibil, avantajele fiecrei strategii i s se elimine dezavantajele.
Definirea replicilor i a fragmentelor, precum i alocarea acestora trebuie s se bazeze pe modul
de utilizare a datelor din baza de date. n faza de analiz, la proiectarea bazei de date trebuie s
se in cont de cele mai frecvent utilizate aplicaii deoarece nu se poate realiza o alocare care s
optimizeze toate aplicaiile simultan.
Printre criteriile care duc la decizia corect de alocare a bazei de date:
frecvena cu care se ruleaz o aplicaie
site-urile de la care se ruleaza cel mai frecvent aplicaia
modul de lucru al tranzaciilor executate de aplicaie i tipurile de acces la date
etc.
3.2. Fragmentarea
performanele pot fi destul de sczute dac sunt necesare date ce apar n diverse
fragmente
controlul integritii datelor este mai dificil dac datele i dependenele funcionale sunt
fragmentate i localizate pe diferite site-uri
1. completitudine dac relaia R este descompusa n fragmentele R1, R2, ,Rn, trebuie luate
msuri care s previna pierderea de informaii
2. reconstrucie s fie posibil n orice moment sa se refac relaia R de la care s-a pornit cu
fragmentarea. Aceast regul conserv dependentele funcionale.
11
3. disjuncie dac data di apare n fragmentul Ri atunci nu este permis s apar n nici un alt
fragment. De la aceast regul se admite doar o excepie, cazul cnd o relaie este fragmentat pe
vertical.
Tipuri de fragmentare:
pe orizontal
pe vertical
combinat
Fragmentarea pe orizontal:
Un fragment al unei relaii partiionate pe orizontal const dintr-o submultime a tuplelor relaiei
respective.
Fiecare tuplu din relatia R apare ntr-un anume fragment, o singur dat. Dac se dorete
reconstrucia relaiei, se utilizeaz reuniunea pentru a obine relaia R iniial.
R= R1R2Rn
Fragmentarea pe vertical
12
Un fragment vertical dintr-o relaie const dintr-o relaie care are ca atribute o submulime a
atributelor relaiei iniiale.
Completitudinea este asigurat prin faptul c fiecare atribut apare cel puin ntr-una din
submulimile S1 i S2.
13
Expresia corespunzatoare n algebra relaional (pentru fiecare dreptunghi din figura de mai sus)
este:
Expresia corespunztoare n algebra relaional (pentru fiecare dreptunghi din figura de mai sus)
este:
Prima regul, considerat regula de baz n sistemele distribuite, este cerina ca aspectul
distribuit trebuie s fie transparent pentru utilizator.
Cu alte cuvinte utilizatorul nu trebuie s-i dea seama ca lucreaza cu o baza de date
distribuita, deci nu trebuie sa aiba cunostinte in plus ca sa utilizeze resursele unei astfel de baze
de date.
n realitate transparenta poate fi realizata doar ntr-o anumita masura. Tipuri de transparenta:
1. transparenta distribuirii
2. transparenta tranzactiilor
3. transparenta performantelor
15
3.5. Transparena tranzaciilor
Acest tip de transparenta asigura faptul ca toate tranzactiile distribuite pastreaza integritatea si
consistenta BDD.
O tranzactie distribuita acceseaza date stocate la mai mult de o locatie n retea. Fiecare tranzactie
e divizata n sub-tranzactii, cte una pentru fiecare site accesat. Sub-tranzactiile se executa n
paralel pe site-uri si n mod concurent pe fiecare site. SGBDD are sarcini deosebite n legatura cu
gestionarea tranzactiilor distribuite dar acestea nu vor fi tratate in acest capitol.
16
Concluzie
17
date i tehnicile care captureaz semantica datelor obinute la fazele anterioare ale procesului de
proiectare, fapt care va fi neglijat n cazul activitilor disjuncte.
Bibliografie
1. http://utm.md/meridian/2012/MI_1_2012/3_Art_Cotelea.pdf
2. http://www.scrigroup.com/calculatoare/baze-de-date/BAZE-DE-DATE-DISTRIBUITE-SGBD32438.php
3. https://en.wikipedia.org/wiki/ANSI-SPARC_Architecture
4. http://www.cs.ubbcluj.ro/~vcioban/Matematica/Anul3/BD/Bd.pdf
5. http://www.scritub.com/stiinta/informatica/baze-de-date/Baze-de-date-distribuite53959.php
6. http://www.ejbi.org/en/ejbi/article/91-ro-un-sistem-distribuit-cu-baze-de-date-pentru-monitorizarea-
glaucomului.html
7. https://ro.wikipedia.org/wiki/Baz%C4%83_de_date_distribuit%C4%83
8. http://andrei.clubcisco.ro/cursuri/f/f-sym/3bd/13.%20Baze%20de%20date%20distribuite.pdf
9. http://software.ucv.ro/Cursuri/Baze_de_date_distribuite/baze_de_date_distribuite.html
10. www.cs.ubbcluj.ro/~vcioban/Matematica/Anul3/BD/Bd.pdf
18