Sunteți pe pagina 1din 17

GENERALITI DESPRE BAZE DE DATE

Baza de date este un ansamblu structurat de date coerente, fr


redondan inutil, astfel nct acestea pot fi prelucrate eficient de mai muli utilizatori ntr-un mod concurent. Baza de date este o colectie de date persistente, care sunt folosite de catre sistemele de aplicatii ale unei anumite "intreprinderi". Datele din baza de date "persista" deoarece, dupa ce au fost acceptate prima data de catre SGBD pentru introducerea in baza de date, ele pot fi sterse din baza de date numai printr-o cerere explicita adresata SGBD-ului. Un sistem de gestiune a bazei de date (SGBD Data Base Management System) este un produs software care asigur interaciunea cu o baz de date, permind definirea, consultarea i actualizarea datelor din baza de date. Toate cererile de acces la baza de date sunt tratate de catre SGBD. Organizarea datelor n baze de date constituie o form de centralizare a acestora. Aceasta implic existena unui administrator al bazei de date (ABD Data Base Administrator) care este o persoan sau un grup de persoane ce rspund de ansamblul activitilor (analiz, proiectare, implementare, exploatare, ntreinere etc.) legate de baza de date. Dicionarul datelor, structurat i administrat ca o baz de date (metabaz de date), contine date despre date, furnizeaz descrierea tuturor obiectelor unei baze de date, starea acestor obiecte etc.

Arhitectura bazelor de date evideniaz urmtoarele componente:


baza de date propriu-zis n care se memoreaz datele; sistemul de gestiune a bazei de date, care realizeaz gestionarea i prelucrarea complex a datelor; un dicionar al bazei de date (metabaza de date), ce conine informaii despre date, structura acestora, statistici, documentaie; mijloace hardware (comune sau specializate);

reglementri administrative destinate bunei funcionri a sistemului; personalul implicat (utilizatori finali, administratorul datelor, administratorul bazei de date, programatori, operatori). decide ce date trebuie stocate in baza de date;

Administratorul de date (DA) este un manager, nu un tehnician, care: stabileste regulile de intretinere si de tratare a acestor date dupa ce sunt stocate. Administratorul bazei de date (DBA) este responsabil cu implementarea deciziilor administratorului de date si cu controlul general al sistemului, la nivel tehnic. El este un profesionist in domeniul IT, care: creeaza baza de date reala, implementeaza elementele tehnice de control, este responsabil cu asigurarea functionarii sistemului la performante adecvate, cu monitorizarea performantelor, furnizeaza diverse servicii tehnice etc.

Cerine minimale care se impun unei baze de date:


asigurarea unei redundane minime n date; furnizarea n timp util a informaiilor solicitate (timpul de rspuns la o interogare); asigurarea unor costuri minime n prelucrarea i ntreinerea informaiei; capacitatea de a satisface, cu aceleai date, necesiti informaionale ale unui numr mare de utilizatori, posibilitatea de adaptare la cerine noi, rspunsuri la interogri neprevzute iniial (flexibilitate); exploatarea simultan a datelor de ctre mai muli utilizatori (sincronizare); asigurarea securitii datelor prin mecanisme de protecie mpotriva accesului neautorizat (confidenialitate); nglobarea unor faciliti destinate validrii datelor i recuperrii lor n cazul unor deteriorri accidentale, garantarea (atat cat este posibil) ca datele din baza de date sunt corecte (integritate);

posibilitatea de valorificare a eforturilor anterioare i anticiparea nevoilor viitoare (compatibilitate i expandabilitate); permisivitatea, prin ierarhizarea datelor dup criteriul frecvenei acceselor, a unor reorganizri (eventual dinamice) care sporesc performanele bazei.

Niveluri de abstractizare i de percepie a datelor


1. 2.

3.

4.

Nivelul fizic (intern) este descris de schema fizic a datelor (bit, octet, adres); Nivelul conceptual este descris de schema conceptual a datelor (articol, nregistrare, zon) i reprezint viziunea programatorilor de sistem asupra datelor; Nivelul logic este descris de una din schemele logice posibile ale datelor i reprezint viziunea programatorului de aplicaie asupra datelor; Nivelul virtual (extern) reprezint viziunea utilizatorului final asupra datelor.

Independena datelor
Independena fizic: posibilitatea modificrii schemei fizice a datelor fr ca aceasta s implice modificarea schemei conceptuale, a schemei logice i a programelor de aplicaie. O modificare a structurii fizice nu va afecta aplicaia i reciproc, modificri ale aplicaiei vor lsa nealterat structura fizic de date. Independena logic: posibilitatea modificrii schemei conceptuale a datelor fr ca aceasta s implice modificarea schemei logice i a programelor de aplicaie. Independen fa de strategiile de acces permite programului s precizeze data pe care dorete s o acceseze, dar nu modul cum acceseaz aceast dat. SGBD-ul va stabili drumul optim de acces la date.

Utilizatorii unei baze de date:


utilizatori finali, nespecialiti (conversaionali); utilizatori specialiti, programatori de aplicatii; administratorul bazei de date.

Limbaje pentru baze de date


limbaje pentru definirea datelor (LDD); limbaje pentru manipularea datelor (LMD); limbaje pentru controlul datelor (LCD). (a) Limbaje universale --- >precompilatoare (b) LG4 (generatoare de forme, rapoarte, grafice, aplicaii etc) -neprocedurale

Obiectivele fundamentale ale unui SGBD


Independena fizic Independena logic Prelucrarea datelor de ctre neinformaticieni Administrarea centralizat a datelor Neredundana datelor Coerena datelor (constrangeri statice, dinamice, globale, locale) Partajabilitatea datelor Securitatea i confidenialitatea datelor etc.

Structura unui SGBD (complexitate variabil)


programe de gestiune a bazei de date (PGBD); module pentru tratarea limbajului de definire a datelor; module pentru tratarea limbajului de prelucrare a datelor (interpretativ, compilativ, generare de programe); module utilitare ntreinerea, prelucrarea, exploatarea corect i uoar a bazei de date; module de control controlul programelor de aplicaie, asigurarea confidenialitii i integritii datelor, rezolvarea unor probleme de concuren etc.

SGBD poate fi considerat cea mai importanta componenta software din sistemul general, dar nu este singura. Celelalte componente cuprind programele utilitare, instrumentele pentru dezvoltarea aplicatiilor, programe de asistenta in design, editoare de rapoarte, managerul de tranzactii etc.

Module PGBD acces fizic la date ca urmare a unei comenzi!


Cum lucreaz?

gsesc descrierea datelor implicate n comand; identific datele i tipul acestora; identific informaii ce permit accesul la fiiere, volume etc.; verific dac datele sunt disponibile; extrag datele, fac conversiile, plaseaz datele n spaiul de memorie al utilizatorului; transmit informaii de control necesare execuiei comenzii, n spaiul de memorie al utilizatorului; transfer controlul programului de aplicaie. Prin urmare, din punct de vedere conceptual: utilizatorul lanseaza o cerere de acces; SGBD accepta cererea si o analizeaza; SGBD inspecteaza pe rand, schema interna corespunzatoare utilizatorului, schema conceptuala, definitia structurii de stocare si corespondentele corespunzatoare; SGBD executa operatiile necesare in baza de date stocata:

Arhitectura unui SGBD


nivelul intern (baza de date fizic structura intern de stocare a datelor fiiere care conin datele, articolele din fiiere, drumurile de acces la articole etc.), se refera la modul in care sunt stocate datele in sistem; nivelul conceptual (modelul conceptual, schema conceptual, livelul logic colectiv), este un nivel intermediar dintre celelalte doua niveluri; nivelul extern (modelul extern, subschema, vizualizarea, nivelul logic al utilizatorului), se refera la modul in care sunt vizualizate datele de catre utilizatorii individuali.

Pentru o baz de date particular exist o singur schem intern, o singur schem conceptual, dar pot exista mai multe scheme externe.

Arhitectura funcional de referin ANSI/X3/SPARC.


Axat pe dicionarul datelor i cuprinde: o parte ce permite descrierea datelor (compoziia dicionarului datelor); o parte ce permite prelucrarea datelor (interogarea i

reactualizarea bazei de date). n fiecare parte se regsesc cele trei niveluri: intern, conceptual i extern. Aceste trei niveluri nu sunt neaprat distincte pentru orice SGBD. Interfeele numerotate corespund urmtoarelor transformri: a) Limbaj de descriere a datelor conceptuale, format surs permite administratorului ntreprinderii s defineasc schema conceptual, format surs. b) Limbaj de descriere a datelor conceptuale, format obiect se obine din compilarea celui precedent i permite aranjarea schemei obiect n dicionarul datelor. c) Limbaj de descriere a datelor conceptuale, format editare permite administratorilor aplicaiilor i a bazelor s consulte schema conceptual pentru a defini reguli de coresponden. d) Limbaje de descriere a datelor externe, format surs permit administratorilor aplicaiilor s defineasc scheme externe corespunznd schemei conceptuale. Deoarece sistemele de gestiune pot suporta mai multe modele externe, pot exista mai multe limbaje de descriere a datelor externe. e) Limbaje de descriere a datelor externe, format obiect corespund formelor compilate ale celor precedente i permit aranjarea schemelor externe (obiect) n dicionarul datelor. f) Limbaj de descriere a datelor interne, format surs permite administratorului bazei de date s defineasc schema intern i regulile de coresponden cu schema conceptual. g) Limbaj de descriere a datelor interne, format obiect corespunde formei compilate a celui precedent i permite aranjarea schemei interne (obiect) n dicionarul datelor. h) Limbaje de manipulare a datelor externe, format surs permit programatorilor de aplicaii sau utilizatorilor neinformaticieni s manipuleze date externe (view). i) Limbaje de manipulare a datelor externe, format obiect corespund formelor compilate ale celor precedente. j) Limbaj de manipulare a datelor conceptuale, format obiect produs de procesorul de transformare extern/ conceptual pentru a manipula datele externe. k) Limbaj de manipulare a datelor interne, format obiect produs de procesorul de transformare conceptual/intern pentru a gestiona datele interne.

l) m) n)

Limbaj de stocare a datelor, format obiect corespunde interfeei cu sistemul de stocare a datelor. Interfaa cu memoria secundar permite efectuarea de intrri/ieiri n/din unitatea de memorie secundar. Interfaa de acces la dicionarul datelor permite diverselor procesoare de transformare s acceseze scheme obiect i reguli de coresponden.

a
administratorul bazei de date

procesor schema conceptual

administratorul aplicaiilor

f g

procesor schema intern

dicionarul datelor

procesor schema extern

n k j M A N I P U L A R E

procesor intern/ alocare

procesor conceptual/ intern

procesor extern/ conceptual

l
sistem de alocare

i
program aplicaii extern

h
programator aplicaie

h
utilizatori

memorii secundare

DESCRIERE

administrator ntreprindere

Arhitectura de referin a unui SGBD.

Procesoarele din figur au urmtoarele funcii: 1. procesorul schemei conceptuale compileaz schema conceptual i dac nu sunt erori depune schema compilat n dicionarul datelor; 2. procesorul schemei externe compileaz schemele externe i regulile de coresponden extern i dac nu sunt erori aranjeaz schema compilat i regulile de coresponden n dicionarul datelor; 3. procesorul schemei interne are rol similar pentru schema intern; 4. procesorul de transformare extern/conceptual transform manipulrile externe n manipulri conceptuale i invers, datele conceptuale n date externe; 5. procesorul de transformare conceptual/intern transform manipulrile conceptuale n manipulri interne i invers, datele interne n date conceptuale; 6. procesorul de transformare intern/stocare transform manipulrile interne n primitive ale sistemului de stocare i invers, elibereaz datele stocate ntr-un format corespunztor schemei interne. Arhitectura lui Gardarin are la baz doar dou niveluri: schema i vizualizrile. Schema corespunde integrrii schemelor interne i conceptuale, iar vizualizarea este o schem extern. SGBD gestioneaz un dicionar de date care este alimentat prin comenzi de definire a schemei i prin comenzi de definire a vizualizrilor. Aceste comenzi, precum i cererile de manipulare sunt analizate i tratate de un procesor numit analizor. Analizorul realizeaz analiza sintactic i semantic a cererii i o traduce n format intern. O cerere n format intern care face referin la o vizualizare este tradus n una sau mai multe cereri care fac referin la obiecte ce exist n baza de date (modificarea cererilor). n cadrul acestei arhitecturi exist un procesor, numit translator, care realizeaz modificarea cererilor, asigur controlul drepturilor de acces i controlul integritii n cazul reactualizrilor. Componenta cheie a sistemului de gestiune este procesorul optimizor care elaboreaz un plan de acces optim pentru a trata cererea. Acest procesor descompune cererea n operaii de acces elementare i alege o ordine de execuie optimal. De asemenea, evalueaz costul planului de acces naintea execuiei sale. Planul de acces ales i elaborat de optimizor este executat de un procesor numit

executor. La acest nivel este gestionat controlul concurenei.

Evoluia SGBD-urilor

sisteme ierarhice i reea; sisteme relaionale; sisteme avansate (orientate obiect, relaionale orientate obiect, deductive, distribuite, decizionale, multimedia, multibaze, active, statistice, warehouse etc.). Baze de date orientate obiect - mbinarea tehnicii limbajelor orientate obiect cu a bazelor de date. Probleme: Absena unei fundamentri teoretice face imposibil definirea unui SGBDOO de referin. Gestiunea obiectelor complexe este mai dificil dect accesul la relaii prin cereri SQL. Utilizatorii au investit sume uriae n sistemele relaionale i nu le pot abandona cu uurin. Trecerea la noua tehnologie orientat obiect implic investiii mari i nu pstreaz aproape nimic din vechile soluii.

Baze de date relaionale orientate obiect - simplitatea modelului relaional combinat cu puterea tehnologiei orientate obiect. Construcia unui sistem de gestiune de baze de date relaionale orientate obiect (SGBDROO) trebuie s porneasc de la cele existente: dezvoltnd un sistem relaional prin adugarea caracteristicilor OO; pornind de la un sistem OO i adugnd caracteristicile relaionale. Bazele de date deductive, utiliznd programarea logic, gestioneaz cunotine relativ la baze de date care, n general, sunt relaionale. Un SGBD deductiv posed: un LDD care permite definirea structurii predicatelor sub form de relaii i constrngeri de integritate asociate; un LMD care permite efectuarea reactualizrilor asupra datelor i formularea unor cereri; un limbaj de reguli de deducie care permite ca, plecnd cu predicatele definite anterior, s se specifice cum pot fi construite predicate derivate.

10

Baze de date distribuite administrarea i prelucrarea datelor distribuite, situate pe diferite calculatoare i exploatate de sisteme eterogene. Aceast mulime de baze de date este exploatat de utilizator ca i cum ar fi o singur baz de date (programatorul nu trebuie s cunoasc localizarea datelor). Calculatoare baze de date i maini baze de date soluia pentru a descentraliza prelucrarea datelor, n scopul evitrii saturrii memoriei i a procesoarelor calculatorului central. Descentralizarea presupune transferarea unei pri din funciile unui SGBD ctre un calculator periferic (calculator backend) adic deplasarea algoritmilor de cutare i a celor de actualizare a datelor mai aproape de memoria secundar. Acest calculator periferic permite utilizarea optim a resurselor i realizarea paralelismului n tratarea cererilor de informaii. Calculatorul periferic poate fi un calculator clasic, dar cu un software specific de SGBD (calculator baz de date) sau poate fi o main cu hardware specializat n gestiunea bazelor de date (main baz de date). Mainile baze de date sunt nzestrate cu arhitecturi paralele special adaptate pentru gestionarea unui volum mare de date. Tratarea paralel a cererilor permite reducerea timpului total de execuie a acestora. O execuie n paralel solicit, fie descompunerea unui program n module, care pot fi executate n paralel (descompunere funcional), fie descompunerea datelor n subgrupe, astfel nct toate procesoarele s execute acelai lucru, dar pe date diferite. Performanele tratrii paralele depind de modul n care sunt efectuate descompunerile. Diferite departamente ale unei organizaii mai mari pot folosi diferite sisteme de gestiune. Fiecare sistem este dezvoltat pentru a satisface nevoile propriului su departament, dar informaiile cu care lucreaz pot fi utile i altor departamente. Pentru ca organizaia s funcioneze bine, trebuie s existe o modalitate global da a vedea datele din fiecare sistem. Exist dou caracteristici ale unor astfel de sisteme care fac acceasarea datelor n acest mediu integrat greoaie, uneori chiar imposibil: 1. autonomie fiecare SGBD are o autonomie complet fiecare manager are control deplin asupra sistemului; 2. eterogenitate sistemele pot opera pe diferite platforme, cu diferite modele de date i limbajele de interogare. Una dintre soluiile folosite pentru a depi dificultile ntmpinate n respectarea autonomiei i a eterogenitii este utilizarea sistemelor multibaze de date. Un sistem multibaze de date (SMB) este alctuit din mai multe sisteme de baze de date privite integrat, n care se construiesc una sau mai

11

multe scheme globale pe baza schemelor fiecrei baze componente acces uniform i integrat la fiecare din bazele de date componente. Pentru o schem global dat, un SMB const din sistemele componente mpreun cu un sistem front-end, care suport un singur model de date i un singur limbaj de interogare. Principalele sarcini ale sistemului front-end sunt gestionarea schemei globale i procesarea cererilor globale. Avantaj major este faptul c o singur interogare poate accesa date din mai multe baze de date ntr-un mod integrat, fr s afecteze nici o aplicaie scris pe baza uneia din bazele de date componente. Pentru a rmne competitive, afacerile trebuie s reacioneze rapid i eficient la schimbri. n acest sens, ele trebuie s analizeze datele pe care le deine pentru a putea prevedea tendinele pieii. Pentru a putea analiza mari cantiti de date este nevoie de tehnologii i instrumente speciale. Data Warehouse (magazie de date) o baz de date optimizat n acest scop, iar principiul pe care l urmeaz este cunoscut sub numele de procesare analitic (OLAP On Line Analytical Processing). Aplicaiile unei Data Warehouse trebuie s ofere rspunsuri unor ntrebri de tipul: Care este venitul mediu pe ramur? Care zi din sptmn este cea mai aglomerat? Ce clieni, cu care avem relaii intense, nu au beneficiat de reduceri de preuri?. O caracteristic a bazelor de date analitice este c interogrile la care acestea trebuie s rspund sunt ad-hoc, nu sunt predefinite, iar baza de date trebuie optimizat astfel nct s fie capabil s rspund la orice fel de ntrebare care poate implica mai multe tabele. O baz de date OLAP poate fi relaional, dar datorit naturii ei orientate spre dimensiuni, au fost dezvoltate pentru gestionarea acestor baze de date construcii multidimensionale, mai potrivite pentru o raportare flexibil. Spre deosebire de bazele de date relaionale, structura unei baze de date multidimensionale nu implic tabele, linii i coloane, ci obiecte de urmtoarele tipuri: variabile, dimensiuni, niveluri, ierarhii, atribute. Descoperirea informaiilor utile din baza de date proces, numit Data Mining sau Knowledge Discovery in Databases (KDD), care proceseaz mari cantiti de date, a cror corelare nu este neaprat evident, n vederea descoperirii de tendine i tipare. Scopul acestei operaii este de a gsi rspunsuri la urmtoarele ntrebri: Ce informaii sunt necesare n procesul de construcie a sistemului? Unde se afl aceste informaii?. Dimensiunea unei cereri este un criteriu de desemnare sau localizare a datelor n baza de date.

Arhitecturi multiutilizatorpentru SGBD-uri

12

Teleprocesarea (arhitectura tradiional)


Un calculator cu o singur CPU + un numar de terminale care sunt incababile s funcioneze singure povar asupra calculatorului central care pe lng rularea programelor de aplicaii i ale SGBD, mai preia din munca terminalelor (de exemplu, formatarea datelor pentru afiare pe ecran).

Arhitectura fiier-server
Procesarea este distribuit n reea (de obicei o reea local LAN). Arhitectura cuprinde fiierele cerute de aplicaii i SGBD-ul. Aplicaiile i funciile SGBD sunt executate pe fiecare staie de lucru, solicitnd cnd este nevoie fiiere de pe server-ul de fiiere. Dezavantaje: trafic intens pe reea; necesitatea unei copii complete a SGBD-ului pe fiecare staie de lucru; acelai fiier poate fi accesat de mai multe SGBD, ceea ce implic un control complex al integritii, simultaneitii, reconstituirii.

Arhitectura client-server
Arhitectura se refer la modul n care interacioneaz componentele software pentru a forma un sistem. Exist un proces client, care necesit resurse i un proces server, care ofer resurse. In arhitectura client-server, clientul (front end) emite, prin intermediul retelei locale, o cerere SQL care este executata pe server (backend); acesta trimite ca raspuns ansamblul inregistrarilor rezultat. Intr-o astfel de interactiune: masinile sunt eterogene; protocoalele de retea pot fi distincte. n contextul bazelor de date, clientul: administreaz interfaa cu utilizatorul i logica aplicaiei; accept i verific sintaxa intrrilor utilizatorilor; proceseaz aplicaiile; genereaz cerinele pentru BD i le trimite server-ului; transmite rspunsul napoi la utilizator. n contextul bazelor de date, server-ul (este sistemul SGBD in sine): primete i proceseaz cerinele clienilor pentru BD;

13

verific autorizarea; garanteaz respectarea constrngerilor de integritate; efectueaz procesarea interogare-reactualizare i trimite clientului rspunsul; realizeaza optimizarea interogarilor; asigura controlul concurentei intre mai multi clienti care se ignora (mecanisme de blocare); intreine dictionarul datelor; ofer acces simultan la BD; asigura robustetea in cazul defectiunilor; ofer controlul reconstituirii etc.

Arhitectura tradiional client-server pe "dou etaje (straturi)" presupune: client-ul (etaj 1) - responsabil n primul rnd de prezentarea datelor ctre client; server-ul (etaj2) - responsabil n primul rnd de furnizarea serviciilor ctre client Arhitectura client-server pe trei etaje presupune trei straturi, fiecare fiind rulat, potenial, pe o platform diferit. stratul format din interfaa cu utilizatorul, care este rulat pe calculatorul utilizatorului final (clientul); stratul ce manevreaz logica aplicaiilor i logica prelucrrii datelor, care este rulat pe un server i frecvent este numit server de aplicaie (conectare la celelalte 2 straturi prin reele locale LAN sau de mare suprafa WAN). Server-ul de aplicaie poate servi mai muli clieni. stratul numit server-ul de baze de date, care se ocup cu validarea datelor i accesarea bazei de date (stocheaz date necesare etajului din mijloc).

Arhitectura se potrivete natural mediului Web. Un browser Web acionnd drept client i un server Web fiind server de aplicaie. Middleware este un strat (software) intre aplicatia postului client si server-ul de baze de date, constituit dintr-o interfata de programare a aplicatiilor (API - Application Programming Interface) si un protocol de retea. API descrie tipul de interactiune dintre o aplicatie client si un server la distanta, via un protocol de comunicatie si de formatare a datelor. Scopul

14

existentei interfetei de programare a aplicatiilor este de a oferi o interfata unica mai multor server-e de baze de date. Dezvoltarea unei aplicatii cu o baza de date relationala necesita cunoasterea a trei niveluri de instrumente, eterogene din punct de vedere conceptual: nivelul instrumentelor grafice (interfata); nivelul aplicatie, cu limbajele sale de dezvoltare; nivelul SGBD, cu SQL-ul ce permite definirea, prelucrarea si controlul bazei de date. Este convenabil ca sistemele de baze de date sa fie considerate ca fiind formate dintr-un server (sistemul SGBD insasi) si un set de clienti (aplicatiile). Frecvent, clientii si server-ul pot fi rulate pe calculatoare diferite, realizandu-se un tip simplu de procesare distribuita. In general, fiecare server poate deservi mai multi clienti, iar fiecare client poate accesa mai multe server-e. Daca sistemul ofera transparenta totala (fiecare client se poate comporta ca si cum ar comunica cu un singur server, de pe un singur calculator) atunci avem un sistem de baze de date distribuit.

Tendine viitoare
Tehnologia Web i sistemele SGBD nmagazinarea datelor OLAP i extragerea datelor

Tehnologia Web i sistemele SGBD


Internet = o colecie mondial de reele de calculatoare. Intranet = un sit Web sau un grup de situri care aparin unei organizaii, accesibil numai pentru membrii acesteia. Extranet = o reea intranet care este parial accesibil utilizatorilor externi autorizai. Reea Web (World Wide Web) = un sistem bazat pe hipermedii care pune la dispoziie un mijloc simplu, de tip indicare-clic de rsfoire a informaiilor pe Internet, folosind hiperlegturile. HTTP = protocolul utilizat pentru a transfera pagini Web prin intermediul Internetului.

15

HTML = limbajul de formatare a documentelor utilizat n proiectarea majoritii paginilor Web. Adresa URL = ir de caractere alfanumerice care reprezint adresa unei resurse pe Internet i modul n care trebuie accesat resursa. Interfaa de poart comun (CGI) = definete modul n care scripturile comunic cu server-ul Web. Este tehnica de baz de integrare a BD n reeaua Web. n mediul Web funcioneaz modelul three tier format din: un strat de interfa cu utilizatorul (client), un strat de logic a afacerii i prelucrare a datelor ( server de aplicaii), un sistem SGBD (server de baze de date) distribuit pe calculatoare diferite. Avantajele reelei Web ca platform de baze de date: avantagele SGBD; simplitate; independena de platform; interfaa grafic cu utilizatorul; acces transparent n reea; standardizare (HTML standard de facto). Arhitectura de calcul n reea a sistemului Oracle (NCA Network Computing Architecture) se axeaz n principal pe furnizarea extensibilitii pentru mediile distribuite. Arhitectura este construit pe baza tehnologiei CORBA pentru manipularea obiectelor. Este o structur three tier care se bazeaz pe utilizarea de: cartue de software care permit utilizatorilor s adauge funcionaliti individuale n aplicaii (cartuele pot fi construite n Java, C/C++, Visual Basic, SQL i pot fi conectate la oricare din cele 3 straturi); protocoale deschise i interfee standardizate care permit comunicarea ntre cartue (distribuite ntr-o reea) prin intermediul unui program magistral (ICX); clieni extensibili, server-e de aplicaie, server-e de baze de date; dezvoltarea i administrarea integrat a cartuelor.

Un cartus utilizeaza un limbaj de definire a interfetelor (IDL) pentru a putea fi identificat de alte obiecte intr-un sistem distribuit. De exemplu, PL/SQL este un astfel de cartus.

16

nmagazinarea datelor
Organele generale de decizie necesit accesul la toatele datele organizaiei, oriunde s-ar afla acestea. Pentru o analiz corespunztoare a organizaiei, afacerilor, cerinelor, tendinelor este necesar nu numai accesarea valorilor curente din BD, ci i a datelor istorice. Pentru a facilita acest tip de analiz a fost creat magazia de date ( data warehouse), care conine date: extrase din diverse surse, ntreinute de diverse uniti operative, mpreun cu istoricul i rezumatul tranzaciilor. Acest mod de nmagazinare solicit instrumente de analiz puternice: instrumente de prelucrare analitic (OLAP) i de extragere a datelor. Data warehouse = o colecie de date: orientat spre subiect (principalele subiecte ale modelului (clieni, produse, vnzri) n loc de domeniile de activitate), integrate, variabile n timp, nevolatile (datele nu sunt reactualizate, nlocuite n timp real, ci sunt adugate ca un supliment al bazei). nmagazinarea datelor se concentreaz asupra gestionrii a cinci fluxuri de informaii: fluxul intern reprezint procesele asociate extragerii si ncrcrii datelor din fiierele surs n magazia de date; fluxul ascendent reprezint procesele asociate adugrii de valoare datelor din magazie, cu ajutorul mpachetrii, distribuirii; fluxul descendent reprezint procesele asociate arhivrii, salvrii, refacerii datelor din magazie; fluxul extern reprezint procesele asociate punerii la dispoziie a datelor pentru utilizatori finali; meta-fluxul reprezint procesele asociate gestionrii meta-datelor (date despre date).

OLAP i extragerea datelor


Dezvoltrile cheie ale instrumentelor de acces pentru utilizatorii finali ai magaziilor de date: prelucrarea analitic on-line; extensiile limbajului SQL;

17

instrumente de extragere a datelor. Prelucrarea analitic on-line (OLAP) reprezint sinteza, analiza i consolidarea dinamic a unor volume mari de date multidimensionale. Server-ele de baze de date OLAP utilizeaz structuri multidimensionale pentru stocarea datelor i a relaiilor dintre date. Aceste structuri pot fi vizualizate prin cuburi de date i cuburi n cadrul cuburilor etc. Fiecare latur a cubului reprezint o dimensiune. Server-ele de baze de date OLAP multidimensionale accept operaiile analitice uzuale: consolidarea (gruparea), parcurgerea n jos (inversul consolidrii), tranarea, tierea. Extinderea limbajului SQL prin operaii puternice. De exemplu, RISQL (Red Brick Intelligent SQL), proiectat pentru analitii din domeniul afacerilor permite: ordonare dup rang (pe diferite niveluri - de exemplu, gruparea filialelor n trei categorii pe baza venitului generat n anul precedent), partajarea pieei, compararea anului curent cu cel precedent etc. Extragerea datelor i utilizarea acestora pentru luarea de decizii cruciale n domeniul afacerilor. Descoperirea unor noi corelaii, tipare, tendine, prin extragerea unor cantitati mari de date folosind strategia inteligenei artificiale. Extragerea datelor presupune capacitatea de a construi modele mai degrab previzibile, dect retrospective. Modelarea predictiv utilizeaz informaii pentru a forma un model al caracteristicilor importante ale unui fenomen. Tehnicile asociate celor 4 operaii fundamentale de extragere: modelarea predictiv (clasificarea cu ajutorul unei reele neurale sau cu ajutorul unei inducii de tip arbore i previziunea valorilor utiliznd tehnici de regresie); segmentarea bazei de date (comasarea demografic i comasarea neural care se deosebesc prin metodele uilizate pentru a calcula distana dintre nregistrri, prin intrrile de date permise); analiza legturilor (descoperirea asocierilor, descoperirea tiparelor, descoperirea secvenelor de timp similare); detectarea deviaiilor (statistici, - de exemplu, regresia liniar pentru identificarea datelor mprtiate i vizualizri utiliznd tehnici moderne de vizualizare grafic). De exemplu, detectarea fraudelor privind utilizarea crilor de credit, preteniile de despgubire ale asiguraiilor.

S-ar putea să vă placă și