Sunteți pe pagina 1din 15

Cursul 4

STUDIUL
TEHNOLOGIILOR
INTEGRARE A DATELOR

INFORMATICE

DE

Conectarea aplicaiilor prin stocurile de date este relativ simpl, apelnd la:
FTP, utiliti oferite de SGBD-uri, instrumente ETL (Extract, Transform and Load),
servere de integrare. Multitudinea de instrumente suport pentru integrare la acest nivel
uureaz mult efortul de integrare.
Integrarea orientat pe date se poate realiza prin migrarea datelor dintr-un
sistem informatic n altul sau prin folosirea unor produse software, care permit accesul
la diferite surse de date fr a mai fi nevoie de extragerea, transportul, transformarea,
validarea i curarea datelor din sistemele surs i ncrcarea lor n sistemele
destinaie. Migrarea datelor se poate face ctre un sistem operaional (n general ctre o
baz de date) sau ctre un sistem suport decizie (adic ctre un depozit de date).
Principalul standard folosit pentru interschimbul de informaii este eXtensible Markup
Language (XML), iar cel mai important protocol de comunicaii bazat pe acesta i care
st la baza serviciilor Web este Simple Object Access Protocol (SOAP).

2.1.Integrarea orientat pe date


In abordarea orientat pe date pentru integrarea aplicaiilor trebuie ca schimbul de
informaii s apar ntre bazele de date (sau proprietari API, care produc informaie), ceea
ce nseamn c bazele de date trebuie vzute ca puncte principale de integrare. Soluiile
de integrare orientat pe date pot fi grupate n trei categorii:
copii multiple ale bazei de date ;
federalizarea datelor;
procesarea interfeei.

Figura 2.1 Schimb de informaie ntre dou aplicaii

Cursul 4
2.1.1. Meninerea unor copii ale datelor
Prin realizarea unor copii ale bazei de date si distribuirea lor la nivelul aplicatiilor
fiecare aplicaie poate s aib propriul stoc dedicat de date. n orice moment, o parte din
surse sunt puin desincronizate, datorit ntrzierilor inerente n propagarea schimbrilor
ntre sursele de date.
Exist 12 modele de mutare a datelor [Teal03]:
mutarea unei copii a datelor;
replicarea datelor;
replicare master-master;
replicare master-slave;
sincronizare la nivel de linie master-master;
replicare snapshot master-slave;
capturarea detaliilor tranzaciilor
replicare incremental a tranzaciilor master-slave;
implementarea sincronizrii la nivel de linie master-master utiliznd SQL
Server;
implementarea replicrii snapshot master-slave utiliznd SQL Server;
replicare master-slave n cascad.
Replicarea datelor este o variant a copierii datelor, referindu-se la simpla
mutare a datelor ntre dou sau mai multe baze de date. Aceste baze de date pot avea
proveniene diferite (Figura 2.2) i pot avea modele diferite. Cerina fundamental pe
care trebuie s o ndeplineasc o baz de date pentru a i se putea replica datele este s
ofere o infrastructur pentru schimbul de date.
Aplicaie

Aplicaie

Replicarea datelor

Baza de
date 1

Aplicaie

Replicarea datelor

Baza de
date 2

Baza de
date 3

Replicarea datelor

Figura 2.2 Replicarea unei baze de date

Replicarea bazei de date poate fi realizata in cel putin trei moduri:

Replicarea snapshot: datele de pe server sunt copiate in intregime pe un alt


server sau intr-o alta baza de date de pe acelasi server. Aceasta implica un consum

Cursul 4

mare de timp si resurse, motiv pentru care administratorii nu folosesc acest tip de
replicare pentru baze de date care se schimba frecvent. De obicei replicarea
snapshot se foloseste in doua situatii: pentru baze de date care nu sufera schimbari
frecvente sau pentru a stabili un punct de plecare in replicarea dintre mai multe
sisteme, pentru care actualizarile ulterioare sunt propagate folosind replicarea
tranzactionala sau replicarea merge.
Replicarea merge: datele din doua sau mai multe baze de date sunt combinate
intr-una sinagura. Pe fiecare din bazele de date se pot realiza schimbari
independente,putandu-se lucre fara o conexiune de retea activa. In momentul
reconectarii, agentul de replicare merge verifica schimbarile care apar in seturile
de date si modifica fiecare din bazele de date in consecinta. Daca schimbarile
necesare intra in conflict, este utilizat un algoritm prestabilit de tratare a
conflictelor pentru a determina rezultatul corect. Acest tip de replicare este folosit
frecvent de utilizatorii de laptop sau alti utilizatori care nu pot ramane in continuu
conectati la o baza de date de pe un server.
Replicarea tranzactionala: utilizatorii primesc copii initiale integrale ale bazei
de date si ulterior primesc actualizari periodice pe masura ce apar schimbari ale
datelor. Ofera un plus de flexibilitate pentru bazele de date care se schimba in
mod frecvent. Un agent de replicare monitorizeaza schimbarile care apar in baza
de data si le transmite utilizatorilor fie imediat ce apar, fie la anumite interval de
timp.

Multe baze de date, care includ soluii middleware ofer servicii pentru
replicarea datelor. Replicarea prin intermediul serviciilor este realizat prin plasarea unui
strat software ntre dou sau mai multe baze de date. Pe de o parte, datele sunt extrase
dintr-o baz de date sau din mai multe baze de date i sunt apoi plasate n bazele de date
int. Multe dintre aceste soluii ofer servicii de transformare precum i abilitatea de a
modifica schema i coninutul astfel nct acestea s aib sens pentru baza de date int.
Avantajele replicrii bazelor de date sunt simplitatea i costurile sczute.
Replicarea este uor de implementat, iar tehnologia este ieftin. Din pcate, aceste
avantaje sunt eliminate dac sunt necesare metode ataate datelor. n acest caz, trebuie
luat n considerare orientarea bazat pe servicii.
2.1.2 Federalizarea datelor
Federalizarea datelor se refer la integrarea mai multor baze de date i a
modelelor asociate ntr-o singur baz de date, cu un view unificat (Figura 2.3). Practic,
federaiile bazei de date reprezint bazele de date virtuale.
Instrumentele pentru federalizarea datelor plaseaz un nivel software
(middleware) ntre bazele de date distribuite fizic i aplicaiile care vizualizeaz datele.
Acest nivel conecteaz bazele de date folosind interfee i mapeaz bazele de date fizice
ntr-o baz de date virtual. Aplicaia folosete aceast baz de date virtual pentru a
accesa informaiile necesare. Instrumentele pentru federalizarea bazei de date gestioneaz
colectarea i distribuirea datelor, pe msur ce acestea sunt necesare, ctre bazele de date
fizice.

Cursul 4
Avantajul folosirii acestui software este c poate lega tipuri diferite de date
ntr-un model unificat care suport schimbul de informaie.

Figura 2.3 Federalizarea datelor

Aceasta este cea mai elegant soluie pentru integrarea datelor deoarece permite
accesul la orice baz de date conectat la sistem printr-o singur interfa bine definit.
Spre deosebire de replicare, federalizarea nu necesit modificri ale aplicaiilor int.
Totui, schimbri sunt necesare la nivelul aplicaiei care susine software-ul bazei de date
coninut n federaie. Acest fapt este datorat interfeelor diferite care sunt folosite pentru
a accesa un model al bazei de date diferit (baza de date virtual).
2.1.3 Integrarea datelor prin intermediul interfeelor
Soluiile de procesare a interfeei folosesc interfee bine definite ale unor aplicaii
pentru a se realiza att integrarea aplicaiilor pachet, ct i pe a celor obinuite (Figura
2.4).
Aceste interfete, pe langa faptul ca ofera in principal date, au de asemenea
abilitatea de a actiona ca furnizori de servicii ale aplicatiei, si, in multe cazuri, produc cod
XML si fac posibila interactiunea cu interfete de servicii Web.
Interesul curent n integrarea de tip Enterprise Resource Planning (ERP)
manifestat de ctre SAP, PeopleSoft - Oracle a fcut acest sector cel mai atractiv n ceea
ce privete integrarea de aplicaii. Aplicatiile furnizate de acestia ofera interfete care
lucreaza cu XML in diferite forme si moduri.

Cursul 4

Figura 2.4 Procesarea interfeei

Productorii de soluii ERP susin soluiile bazate pe procesarea interfeei prin


oferirea de adaptori pentru a se conecta la ct mai multe aplicaii obinuite sau aplicaii
pachet, externaliznd informaia din acele aplicatii prin interfetele lor deschise sau
proprietare. Aceti adaptori se conecteaz la soluiile tehnologice care includ tehnologii
middleware, dar i screen scrapere, ca puncte de integrare.
Un screen scaper este un instrument care permite PC-urilor s intercepteze
datele dintr-un mainframe (fiind adesea prezentat ca un ecran verde) i este utilizat pentru
a nelege mai bine interfaa grafic. Ecranele mai noi prezint informaia n format
HTML, pentru a putea fi accesat dintr-un browser.
O integrare eficient a mai multor tipuri de aplicaie definete avantajul principal
al utilizrii produselor de integrare a aplicaiilor. n doar cteva zile, este posibil
conectarea unei aplicaii SAP R/3 la o aplicaie Oracle, prin intermediul unei soluii de
procesare a interfeei care s gestioneze diferenele de schem, coninut i semantica
aplicaiei, prin interpretarea informaiei interschimbat ntre sisteme.
Dezavantajul folosirii produselor de integrare bazat pe procesarea interfeei este
c se acord atenie limitat logicii procesului de afaceri, ct i metodelor aparinnd
sursei sau sistemelor int. n aceste situaii, se recomand folosirea unei abordri
orientate pe servicii. Se prognozeaz c pe viitor, tehnologia de procesare a interfeei va fi
capabil s includ i metode.

2.2. Standarde utilizate la integrarea datelor


2.2.1. XML, XSLT, ebXML
De la crearea sa, eXtensible Markup Language (XML) a fost proiectat ca
standard pentru interschimbul de informaie pe Internet. Ca urmare, aplicabilitatea la
integrarea aplicaiilor este natural, deoarece XML ofer un standard robust, uor de
neles pentru schimbul de informaie. XML poate susine interschimbul de semantici ale
aplicaiilor i de informaie. Tot acest proces se realizeaz fr ca aplicaiile destinaie s
aib nevoie de informaii despre aplicaiile surs.
XML ofer un format comun de schimb de informaie, ncapsulnd att datele ct
i metadatele. Acest format permite aplicaiilor i bazelor de date s comunice fr a avea
informaii una despre cealalt. Pentru a comunica, sistemul surs reformateaz un mesaj,
o informaie sau o nregistrare ca un XML-text i mut acea informaie ntr-ul alt sistem,
care tie s citeasc XML.

Cursul 4
Valoarea XML-ului rezid din simplitatea lui. Se pot lua cantiti mari de
informaie i se pot consolida ntr-un document XML ca piese semnificative, care dau
structura i organizarea informaiei. (Figura 2.5)

Figura 2.5 XML, reprezentare text simpl a unor date de complexiti diferite

Blocul de baz al unui document XML este un elementul definit prin marcatori
(tag-uri). Un element are un tag de nceput i un tag de final. Toate elementele dintr-un
document XML sunt coninute de un element rdcin XML, care suport elemente
rdcin sau elemente n alte elemente, de unde rezult c poate susine o structur
ierarhic. Numele elementelor descriu coninutul elementului, iar structura descrie
relaiile dintre elemente. Un document XML este considerat bine format, dac poate fi
citit de un parser XML i dac formatul su se potrivete cu specificaiile XML. Se pot
defini atribute ale elementelor i descrie caracteristici ale elementelor n tagul de nceput.
Un parser XML citete documente XML i extrage datele ce urmeaz a fi accesate de alt
program. Parserul este parte component a nivelului middleware. (Figura 2.6)
Pentru ca aplicaiile ce folosesc XML s poat fi integrate, ele trebuie s
externalizeze informaia sub form de XML. Tehnologia middleware-XML gestioneaz
extragerea informaiei din sistemul surs, conversia ei n XML i plasarea informaiei n
sistemul destinaie, tot procesul fiind automat i transparent pentru utilizator. Aa cum s-a
mai specificat, XML este bazat pe text i, astfel, o informaie care n mod normal poate fi
stocat pe 512 KB, se poate mapa ntr-un fiier XML de 20 ori mai mare, acest fapt
reprezentnd unul din dezavantajele utilizrii XML.

Cursul 4

Figura 2.6 Extragerea informaiei prin parser XML

Legtura ntre XML i middleware este clar deoarece tehnologia middleware


realizeaz partea de transfer efectiv de mesaje, care ncapsuleaz XML i se asigur c
acele mesaje pot fi nelese de sistemele destinaie. Middleware-ul gestioneaz i
interfeele cu aplicaiile surs i destinaie i mut informaia.
XML nu juca pn mai recent un rol prea important n domeniul integrrii
aplicaiilor n cadrul aceleai companii. Practic, n aceste cazuri erau alese alte standarde
i metode de integrare din motive de eficien. Totui, datorit descentralizrii controlului
asupra informaiei, XML devine din ce n ce mai important. Multe companii, ca OraclePeopleSoft i SAP folosesc acum XML ca interfa nativ pentru sistemele lor. OraclePeopleSoft deja a definit un produs, Open Integration Framework, care folosete XML.
Mai mult dect att, productorii de sisteme de gestiune a bazelor de date precum Oracle,
Sybase i Informix, ofer mecanisme, care permit XML-urilor s citeasc i s scrie
direct n baza de date.
Rolul major al XML este n domeniul integrrii aplicaiilor ntre mai multe
companii. Standardele XML ofer valoare suplimentar prin includerea nivelurilor de
metadate comune, care pot exista ntre unul sau mai muli parteneri membri ai tranzaciei
i chiar prin includerea mecanismelor de transformare standard ca XSLT.
Cele mai relevante standarde XML folosite pentru integrarea aplicaiilor sunt:
RosettaNet, XEDI, BizTalk, Extensible Financial Reporting Markup Language (XFRML),
XML-Schema, XML Query i XSLT (tabelul 2.1.).
RosettaNet un cadru pentru interschimb de date i procese cu e-business.
XEDI
se refer la o specificaie, care descrie cum trebuie mapat un
EDI tradiional la un XML i invers
BizTalk
este fondat de Microsoft i definete un standard XML pentru
XML-uri bazate pe mesaje i metadate. Microsoft ofer i un
server BizTalk pentru a susine acest standard.
XFRML
este un standard definit de American Institute of Certified
Public Accountants pentru a defini standarde XML pentru
informaii financiare.
XMLeste un grup de lucru al W3C, care descrie un mecanism
Schema
pentru determinarea structurii unui document XML
XML
Este un alt grup W3C, care creeaz un set de operaii comune
Query
i sintax pentru a accesa date stocate XML

Cursul 4

Tabelul 2.1. Standarde XML pentru integrarea aplicaiilor

XSLT este un limbaj proiectat s transforme un document XML ntr-un altul,


modificnd att schema, ct i coninutul procesului. Documentele XML sunt ca nite
mesaje. Fiecare aplicaie are un set unic de semantici, iar documentele care circul ntre
aplicaii trebuie s poat fi transformate (Figura 2.7). Att structurile de date, ct i
coninutul sunt necesar s fie corecte din punct de vedere semantic pentru a fi ncrcate n
aplicaia int. Dac datele nu au formatul necesar, atunci operaia de actualizare nu va
reui.

Figura 2.7 Transformarea documentelor XML prin XSLT

n plus, XSLT poate realiza i alte tipuri de procesare de text i operaii de


transformare, care includ crearea formatelor de date standard bazate pe text ca PDF-uri
sau alte formate.
Transformarea unui document XML folosind XSLT necesit doi pai. Primul pas
const ntr-o transformare structural, unde datele sunt transformate, de la o structur de
intrare la o structur de ieire. Acest pas implic selectarea datelor, gruparea lor, sortarea
lor sau agregarea lor n funcie de necesitile transformrii. De exemplu, n cadrul unui
document XML se poate face conversia de la dolari americani la franci francezi. Aceast
transformare este bazat pe o rat de conversie valutar, fie pe o valoarea statistic fie pe
o valoare citit dintr-o baz de date aflat la distan. Al doilea pas este formatarea, n
care noua structur este adus n formatul cerut, de exemplu fisier text, PDF sau HTML.
HTML permite vizualizarea informatiei de catre utilizatori direct intr-un navigator sau
utilizarea ca intrare n orice procesor modern de text. Formatul text permite formatarea
datelor astfel incat sa fie acceptate de catre aplicatiile existente, de exemplu sub form de
valori separate prin virgul. Formatul XML permite datelor s fie furnizate direct
aplicaiilor care accept astfel de intrri. De obicei acesta va utiliza un vocabular diferit
de taguri XML fa de documentul original.
Electronic Business using eXtensible Markup Language (ebXML) este un
produs al colaborrii dintre UN/CEFACT i OASIS. Acest standard a fost construit pe
baza XML, ca i alte standarde Internet i servicii Web. Scopul su este crearea unei
infrastructuri pentru comerul electronic bazat pe informaie i procese. ebXML este
considerat un standard bun, fiind folosit de cei care automatizeaz B2B.

Cursul 4
Unicitatea ebXML-ului este dat de completitudinea acestuia, adresnd probleme
ca: procese, managementul tranzaciilor, semantici, notaii, securitate, acorduri, standarde
legate de transferul de informaie i standarde legate de structurarea informaiei.
Cu toate acestea, completitudinea ebXML-ului poate fi considerat un factor ce
limiteaz, din cauza duratei pe care o necesit pentru a se plia pe un domeniu.
Standardul ebXML a fost creat pentru a nlocui EDI sau alte standarde folosite n
comerul electronic. Acesta este un sistem bazat pe mesaje XML pentru schimbul de
informaie i poate conine un depozit pentru a permite accesul simultan la informaie.
Sistemul de mesaje suport orice tip de date, tranzacii EDI i informaie binar. Mai mult
dect att, ebXML suport acorduri de tranzacionare ntre parteneri o funcie
fundamental a subsistemelor partener EDI-ebXML poate fi folosit astfel pentru a
reprezenta acordurile de servicii de afaceri.
Ca i alte standarde (ebXML-ul nu este un produs) vine cu un set de reguli, care
permit productorilor de aplicaii i integrare de aplicaii s-si proiecteze produsele
pentru a susine acest standard.
2.2.2. SOAP, WSDL, UDDI
Simple Object Access Protocol (SOAP) definete un format XML bazat pe
mesaje, care este folosit de aplicaiile bazate pe servicii Web pentru a comunica i
interopera ntre ele pe Web (figura 2.8.). SOAP este un standard pentru codificarea
mesajelor n XML i care poate apela funcii n alte aplicaii. Este analog cu Remote
Procedure Calls (RPC) folosit de tehnologii ca DCOM sau CORBA, dar elimin o parte
din complexitatea utilizrii acestor interfee. SOAP permite aplicaiilor s apeleze funcii
din alte aplicaii, care ruleaz pe alt platform hardware, indiferent de sistemul de
operare i limbajul de programare.

Figura 2.8 SOAP ofer mecanisme de comunicare ntre client i server

Cursul 4
Web Service Description Language (WSDL) este o colecie de metadate despre
XML bazat pe servicii, folosit pentru descrierea scopului unei afaceri i a modului de
accesare electronic a serviciilor acestora. Bazat pe SOAP, WSDL specific procedurile
pentru descoperirea informaiei tehnice i funcionale despre serviciile Web pe Internet.
Un document WSDL este descris de un numr de elemente:
definiii tip, pentru elementele de date (n mod normal, utiliznd XML
Schema);
definiii de mesaje, care comprim unul sau mai multe elemente de date;
definiii ale operaiilor, care reprezint descrieri abstracte ale aciunilor care
pot fi suportate de serviciu, i care definesc tipul mesajului: de intrare sau de
ieire;
definiii PortType;
definiii de conectare, care descriu conexiunea ntre PortType i protocoale
(SOAP, HTTP, GET/POST);
definiii de servicii.
Ca urmare, se poate spune c WSDL ofer o abordare standard serviciilor Web.
De asemenea, WSDL ofer un mecanism automat de generare a proxy-urilor pentru
serviciile Web folosind un limbaj standard. Acest standard este analog IDL (Interface
Definition Languages) i se gsete att n COM ct i n CORBA. Cu alte cuvinte, este
un simplu contract ntre client i server.
WSDL definete o gramatic XML pentru descrierea serviciilor de reea ca o
colecie de puncte finale de comunicaie, care pot face transfer de informaie. Definirea
serviciilor WSDL ofer o modalitate pentru automatizarea comunicrii ntre aplicaii
(Figura 2.9).

Figura 2.9 Definirea serviciilor prin WSDL

Cursul 4
Universal Description, Discovery and Integration (UDDI) este un standard pentru
catalogarea i publicarea descrierilor WSDL asociate serviciilor Web, care sunt
disponibile pe Internet. ntr-un mod asemntor cutrii informaiei n Pagini Aurii
sistemele de comer pot cuta n registrul UDDL serviciile Web, apoi pot prelua
parametrii de interaciune i pot interaciona efectiv cu serviciile Web gsite folosind
SOAP.
Specificaiile UDDI intesc s defineasc un mecanism comun pentru publicarea
i cutarea informaiei prin servicii Web. Creatorii UDDI (IBM, Microsoft, Ariba)
ncearc s creeze un echivalent pe Internet pentru Pagini Aurii. Acum este disponibil pe
pia prima generaie de specificaii.

Figura 2.10 UDDI

2.3. Tehnologii informatice de integrare a datelor


2.3.1. Baze de date centralizate i distribuite
Baza de date este un ansamblu de colecii de date n memoria extern, cu
urmtoarele caracteristici:
este organizat, pe trei niveluri (conceptual, logic, fizic);
este structurat, conform unui model de date;
este coerent, prin restriciile de integritate i protecia datelor;
are o redundan minim i controlat, prin implementarea unui model de date
i prin aplicarea unei tehnici de proiectare;
este accesibil mai multor utilizatori n timp util. [VELI01]
Bazele de date sunt manipulate cu ajutorul sistemelor de gestiune a bazelor de
date, care constituie ansamblul de programe prin care se asigur gestionarea i
prelucrarea complex a datelor. Cel mai rspndit model de baze de date este cel
relaional, n care datele sunt memorate n tabele. Pe lng tabele, o baz de date
relaional mai poate conine: indeci, proceduri stocate, declanatori, utilizatori i
grupuri de utilizatori, tipuri de date, mecanisme de securitate i de gestiune a tranzaciilor

Cursul 4
etc. Alte modele de baze de date sunt: modelul ierarhic, modelul reea, modelul obiectualrelaional, modelul orient obiect.
O baz de date poate fi folosit pentru integrarea diverselor aplicaii. n aceasta
pot fi ncrcate date diverse provenite din diverse surse (ASCII, EXCEL, XML, FOX,
ACCESS etc.).
O baz de date distribuit este o baz de date care nu este localizat ntr-o
singur locaie fizic, ci este dispersat ntr-o reea de calculatoare interconectate, putnd
fi accesat de mai muli utilizatori concureni. Sistemul de baze de date distribuite trebuie
gestionat astfel nct distribuirea, concurena i eventualele eecuri s fie transparente,
asigurndu-se c operaiile de citire (cererile) i operaiile de scriere (actualizrile) se
execut astfel nct s nu apar nici o diferen fa de situaia unei baze de date cu un
singur utilizator [TRAI82]. Transparena din toate aceste puncte de vedere poate fi destul
de scump, iar n practic ea este realizat doar n msura n care permite obinerea unor
performane acceptabile.
Coleciile de date pot fi distribuite pe mai multe calculatoare, care se pot afla n
aceeai locaie fizic sau n locaii fizice diferite. O baz de date este distribuit sub
form de partiii/fragmente distincte, care pot fi replicate pe mai multe noduri din reea.
Pe lng fragmentare i replicare, exist i alte tehnici de proiectare a bazelor de date
distribuite, alegerea uneia dintre acestea realizndu-se n funcie de nevoile afacerii i de
sensibilitatea/confidenialitatea datelor care vor fi stocate n baza de date.
Sistemele distribuite se folosesc n mai multe domenii ale informaticii (sisteme
de baze de date, reele de calculatoare, sisteme de operare etc.). Totui, toate sistemele
distribuite, indiferent de tipul lor, au cteva caracteristici i obiective de realizare
comune. Aceste aspecte comune le prezentm n paragraful de fa.
Caracteristicile principale ale sistemelor distribuite
1. Suport pentru partajarea resurselor: aceleai resurse sunt folosite de mai muli
utilizatori. Acest lucru se realizeaz prin dou modele:
modelul client server, n care unul sau mai multe servere gestioneaz baza de
date i rezolv cererile transmise de clieni. n acest model exist dou tipuri de
procese:
o procesele client, care execut sarcini care solicit de la server resurse
partajate;
o procesele server, care activeaz resursele de un anumit tip i ntoarc
rspunsul.
modelul bazat pe obiecte, n care, ntr-o execuie de program, fiecare entitate este
vzut ca un obiect cu interfa public de acces. De asemenea, fiecare resurs
partajat este vzut ca un obiect.
2. Deschiderea: Sistemul poate fi extins, n orice moment, pe diferite ci. n acest sens,
sistemul deine: mecanisme de comunicare interprocese, interfee publice pentru
acces la resurse partajate i resurse, care sunt eterogene.
3. Concurena i paralelismul: n acelai timp, mai muli utilizatori, folosesc n mod
eficient aceleai resurse. Aspectele care trebuie implementate de sistem sunt:
simultaneitate privind mai muli utilizatori i mai multe procese, s separe activitile
de utilizatori, s asigure independena proceselor fa de resurse i de activiti.
4. Scalabilitate: Sistemul acioneaz efectiv i eficient pe diferite scale (datorit
eterogenitii resurselor).

Cursul 4
5. Toleran la accidente: Sistemul se bazeaz pe redundana hardware i pe acoperirea
software.
6. Transparena: Se refer la gradul de independen ntre componentele sistemului
(resurse, operaii, utilizatori etc.), la funcionare. n asigurarea transparenei se ine
cont de: separarea componentelor sistemului, necesitatea comunicaiei i de tehnici de
integrare i management.
Regulile lui Date
C.J. Date a ntocmit 12 reguli conform crora se poate stabili dac un SGBD este
distribuit sau nu. Ca o sintez a regulilor, se poate afirma c distribuirea datelor nu
trebuie s afecteze n nici un fel utilizatorii (SGBD-ul va asigura o transparen total a
distribuirii datelor).
R1. Autonomia local: fiecare nod are control local asupra datelor i este independent de
celelalte noduri din punct de vedere al funciilor de baz: securitate, controlul
concurenei, backup i recuperare.
R2. Independena fa serverul central: fiecare nod trebuie s acioneze independent,
fr s depind de un server central sau un alt nod.
R3. Continuitatea: activitatea ntr-un sistem distribuit se desfoar fr ntreruperi
pentru ntreineri sau reparaii.;
R4. Transparena localizrii: nici un utilizator/program are nevoie s tie unde i cum
sunt amplasate datele folosite.
R5. Independena fragmentrii: SGBDD va trebui s poat reconstrui automat, n orice
moment, o colecie de date din fragmentele sale.
R6. Independena replicrii: utilizatorii/programele nu trebuie s tie dac datele au fost
replicate i cum anume.
R7. Interogri distribuite: o interogare poate fi executat pe orice nod din reea care
conine date utile execuiei cererii. La rspunsul interogrii pot s participe mai multe
noduri, fr ca beneficiarul s fie contient de acest lucru.
R8. Tranzacii distribuite: o tranzacie poate s acceseze i s modifice date din mai
multe noduri, fr ca beneficiarul s fie contient de acest lucru.
R9. Independena fa de hardware: nodurile pe care se gsesc datele pot fi calculatoare
de diferite tipuri i puteri.
R10. Independena fa de software: nu trebuie s aib importan sistemele de operare
care exist pe noduri (eterogene).
R11. Independena fa de reea: BDD i SGBDD trebuie s poat fi implementate pe
orice platform de reea corespunztoare, iar diferitele protocoale utilizate n reea, nu
trebuie s afecteze funcionarea BDD.
R12. Independena fa de SGBD: la nivel de nod local pot rula diferite SGBD-uri.
Tehnicile prin care un SGBDD, asigur distribuirea datelor de baz sunt:
fragmentarea, replicarea, tehnica mixt, ncrcarea.

Cursul 4

Figura 2.11 Tehnici de distribuire


a) Distribuirea prin fragmentare este operaia de descompunere logic a coleciilor
globale n pri disjuncte numite fragmente, utiliznd operatori speciali.

Pentru a realiza fragmentarea SGBDD respect anumite reguli i metode.


REGULILE ce trebuie respectate la fragmentare:
completitudinea semnific faptul c ntreaga colecie global trebuie descompus
n fragmente. Rezult c orice nregistrare dintr-o colecie global trebuie s se
regseasc ntr-un fragment;
reconstrucia semnific faptul c orice colecie global trebuie s poat fi
recompus, oricnd, din fragmentele sale;
disjuncia semnific faptul c fragmentele n care se descompune o colecie
global trebuie s fie exclusive. Rezult c o nregistrare din colecia global nu
poate s se regseasc n dou sau mai multe fragmente ale sale.

METODELE ce pot fi utilizate la fragmentare:


orizontal, conform creia descompunerea coleciei globale n fragmente se face
prin extragerea unui set de nregistrri, pstrndu-se toate cmpurile coleciei
iniiale. Rezult c fiecare fragment are un numr de nregistrri mai mic dect al
coleciei globale din care provine, dar aceeai structur de date;
vertical, conform creia descompunerea coleciei globale n fragmente se face
prin extragerea unui set de cmpuri, pstrndu-se toate nregistrrile coleciei
iniiale. Rezult c fiecare fragment are o structur de date subset din cea a
coleciei globale din care provine, dar acelai numr de nregistrri;
mixt, conform creia descompunerea coleciei globale n fragmente se face prin
aplicarea succesiv a metodelor orizontal i vertical.

Cursul 4

b) Distribuirea prin replicare este operaia de stocare a unor poriuni dintr-o baz
de date, sub form de copii, pe mai multe calculatoare (noduri) dintr-o reea.
Dac un utilizator actualizeaz o copie local atunci SGBDD actualizeaz automat
toate copiile acelor date.
Pentru a putea realiza distribuirea prin replicare un SGBDD utilizeaz anumite
metode: date nereplicate, date replicate parial, date replicate total.
METODELE ce pot fi utilizate la replicare:
date nereplicate nseamn c SGBDD aloc spaiu pentru anumite date, pe o
singur copie, pe un anumit calculator din reea. Caracteristicile acestei metode
sunt: redundana este minim, concurena accesului la date este maxim, timpul
de actualizare este mic i timpul de regsire este mare;
date replicate parial nseamn c SGBDD aloc pentru o parte din date o
singur copie pe un calculator, iar pentru o alt parte din date mai multe copii pe
mai multe calculatoare din reea. Caracteristicile acestei metode sunt: redundana
crete, concurena accesului la date scade, timpul de actualizare este mediu i
timpul de regsire este mediu;
date replicate total, nseamn faptul c SGBDD aloc pentru ntreaga BD mai
multe copii pe diversele calculatoare din reea. Caracteristicile acestei metode
sunt: redundana este maxim, concurena accesului la date este minim, timpul
de actualizare este mare i timpul de regsire este mic.
c) Distribuirea mixt este operaia de aplicare succesiv a fragmentrii i replicrii
pentru aceeai colecie global de date. Aceast tehnic preia avantajele celorlalte dou,
dar este mai greu de implementat.
d) Distribuirea prin ncrcare este operaia de copiere periodic a ntregii baze de
date centralizate sau a unei poriuni din ea pe noduri locale. Este cea mai simpl tehnic
i se folosete atunci cnd datele sunt stabile sau atunci cnd nu toi utilizatorii trebuie s
aib acces la datele de ultim or.
STUDIUL TEHNOLOGIILOR INFORMATICE DE INTEGRARE A DATELOR..........1
2.1.Integrarea orientat pe date........................................................................................1
2.1.1. Meninerea unor copii ale datelor......................................................................2
2.1.2 Federalizarea datelor...........................................................................................3
2.1.3 Integrarea datelor prin intermediul interfeelor..................................................4
2.2. Standarde utilizate la integrarea datelor...................................................................5
2.2.1. XML, XSLT, ebXML........................................................................................5
2.2.2. SOAP, WSDL, UDDI........................................................................................9
2.3. Tehnologii informatice de integrare a datelor.........................................................11
2.3.1. Baze de date centralizate i distribuite.............................................................11

S-ar putea să vă placă și