Documente Academic
Documente Profesional
Documente Cultură
1.
1.2 Fragmentarea
n literatura de specialitate, pentru conceptul de fragmentare se folosete alternativ
i denumirea de partiionare.
Definiie: Fragmentarea reprezint procedeul de spargere a relaiilor utilizate ntrun sistem distribuit prin operaiuni relaionale de proiecie i selecie controlate, n vederea
plasrii aa-numitelor partiii (fragmente) rezultate n locul n care sunt cel mai frecvent
solicitate datele pe care le conin.
Fragmentarea reprezint o abordare a dimensiunii bazei de date, care se realizeaz
prin divizarea tabelelor de date n unul sau mai multe fragmente disjuncte, n scopul stocrii
fizice.
[Connolly et al. 2001] consider urmtoarele motive ca fiind premisele de baz n
favoarea recurgerii la fragmentare:
Uzana. n aplicaiile proiectate pentru baze de date n general, multiutilizator se
practic frecvent utilizarea tabelelor virtuale n detrimentul relaiilor ntregi. De cele mai
multe ori un operator nu are nevoie de toate informaiile, att ca i structur, ct i ca i
4
aff ( A , A )[aff ( A , A
i
j 1
) aff ( Ai , A j 1 )] 6
i 1 j 1
Crearea matricei este un proces iterativ care presupune mai nti mutarea unei
singure coloane n noua matrice, apoi plasarea celorlalte n aa manier nct s fie n acord
cu condiiile expuse anterior. Dup plasarea tuturor coloanelor, i liniile trebuie
interschimbate astfel nct s potriveasc poziia relativ a coloanelor.
Dup gsirea matricei de afinitate partiionat, pe diagonala matricei trebuie s
fixm un punct, numit punct de divizare, care mparte mulimea atributelor relaiei n dou
submulimi formate din atributele {A1, A2, Ai}, respectiv {Ai+1, An}, alctuind matricele
(ptratele) TA7 i BA8.
Dup identificarea posibilelor fragmente n funcie de afinitile atributelor i
frecvenelor aplicaiilor care le solicit este necesar efectuarea procedurii de verificare a
celor trei condiii definitorii ale fragmentrii. Singura de la care putem face rabat ntr-o
anumit msur ar fi cea de disjunctivitate a fragmentelor. Aa cum am mai menionat, n
5
F1
F3
F2
F4
F1
F5
F6
F3
F4
F5
F2
F6
1.3 Replicarea
Unul din aspectele importante ce caracterizeaz sistemele distribuite este fiabilitatea
i disponibilitatea. Aceasta nseamn c o pan n unul dintre siturile sistemului nu va paraliza
funcionarea sistemului i nici nu va afecta disponibilitatea datelor care au fost nmagazinate
n situl respectiv. Atingerea acestei performane nu se poate realiza dect cu ajutorul replicrii
fragmentelor.
Replicarea cunoscut n literatura de specialitate i ca reproducere presupune
copierea unor fragmente n mai multe locaii. ntr-o baz de date distribuit exist mai multe
nivele de replicare. Astfel, avem:
Baze de date centralizate. Sunt sistemele cu prelucrare distribuit (centralizate), n
care avem o singur baz de date stocat pe nodul central. La fel avem un singur SGBD.
Caracterul local al referinei este cel mai sczut, deoarece doar nodul central poate face
accesri sau prelucrri locale. Securitatea, fiabilitatea i disponibilitatea sunt sczute i
depind n cea mai mare msur de nodul central. Costul comunicaiei este ridicat;
Baze de date partiionate, fragmentate sau nereplicate. Sunt acele baze de date
distribuite n care toate fragmentele apar o singur dat. Implementarea se face cu cel mai
sczut cost al stocrii. O astfel de baz de date nu ofer fiabilitate i nici disponibilitate prea
ridicate, ns este mai mare dect n cazul sistemelor centralizate. Caracterul local al referinei
este la un nivel acceptabil. Costurile de comunicaie sunt mai moderate. Actualizrile i
consultrile se fac eficient;
Baze de date replicate integral. Orice sit conine cte o copie a ntregii baze de
date. Caracterul local al referinei, disponibilitatea, securitatea i fiabilitatea sunt maxime.
Probleme ntmpinm la costul ridicat al echipamentelor de stocare, comunicaia aglomerat
n cazul actualizrilor. O rezolvare parial a acestor inconveniente ar fi utilizarea
instantaneelor, adic imagini ale bazei de date care se actualizeaz periodic. Dezavantajul lor
este c nu ntotdeauna ofer o situaie actualizat, iar n momentul actualizrii se genereaz
trafic mare pe reea;
Baze de date replicate parial sau selectiv. Anumite fragmente sunt replicate, altele
nu. Sunt replicate fie acele fragmente cu utilizare frecvent, fie relaii ntregi de dimensiuni
mici care nu merit s fie fragmentate, ci mai degrab memorate pe fiecare sit. n aceast
ultim situaie intr i acele relaii sau fragmente cu actualizri sporadice. Aceast strategie
este o mbinare a celor 3 enunate anterior. ncearc s le preia avantajele i s le minimizeze
dezavantajele. De aceea aceasta se implementeaz cel mai adesea. Costurile de comunicaie
i de stocare sunt relativ reduse. Caracterul local al referinei, securitatea, fiabilitatea i
disponibilitatea sunt apropiate de maxim. [Connolly et al. 2001]
Sisteme OLTP
Pstreaz date curente
Stocheaz date detaliate
Datele sunt dinamice
Prelucrare cu grad ridicat de
repetitivitate
Nivel nalt de transfer al tranzaciilor
de
16
17
Data Warehouse
On-Line Transaction Processing
19
Data Mart
Executive Information System
Relational OLAP
23
General Packet Radio Service, un serviciu mobil de date orientat pe pachete n cadrul
sistemelor de comunicaii mobile
general definiiile?
Ce este un SGBDD?
Ce se nelege prin fragmentarea bazelor de date i de cte tipuri este aceasta?
Care sunt argumentele n favoarea fragmentrii?
Ce reguli stau la baza fragmentrii?
Descriei fragmentarea orizontal. Exemplificai.
Ce sunt predicatele minterm?
Descriei fragmentarea vertical. Exemplificai.
Descriei fragmentarea mixt. Exemplificai.
Ce este fragmentarea derivat
Cnd se utilizeaz relaiile nefragmentate?
Ce este replicarea?
Care sunt nivelele de replicare pe care le cunoatei?
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
Bibliografie
[Abiteboul96] Aniteboul S., Hull R., Vianu V., Foundations of Databases, Addison-Wesley,
1996.
[Booch94] Booch G., Object Oriented Analysis and Design, ediia 2-a, Benjamin Cummings,
1994.
[Bouguettaya 1998] Bouguettaya A., Bentallah B., Elmagarmid A., Interconnecting
Heterogeneous Information Systems, Kluwer Academic Publishers, 1998
[Codd1970]E.F.Codd, A Relation Model of Data for Large Shared Data Banks,
Comunication of ACM, 13, 6, 1970, p.377-387;
[ConnollyBeggStrachan2001] T. Connolly, C. Begg, A. Strachan, Baze de date proiectare,
implementare, gestionare, Editura Teora, 2001;
[Date04] Date C.J., An Introduction to Data Bases, vol I i II, Addison-Wesley, 2004; Baze
de date Teora, 2005 E+.
[Dollinger98] Robert Dollinger, Baze de date i gestiunea tranzaciilor, Ed. Albastr, ClujNapoca, 1998, pag.30.
[Evans 2009] Eric Evans, NOSQL 2009. May 2009. Blog post of 2009-05-12.
http://blog.sym-link.com/2009/05/12/nosql_2009.html