Documente Academic
Documente Profesional
Documente Cultură
CURS nr. 2
BAZE DE DATE
CURS nr. 2
Pentru a face diferena dintre date i informaii, Hernandez propune urmtoarea axiom:
Datele reprezint ceea ce se nmagazineaz; informaia reprezint ceea ce se extrage.
Cu alte cuvinte, datele trebuie extrase n aa fel din baza de date nct s capete semnificaie.
Evoluia n timp a metodelor de organizare a datelor e legat de soluiile tehnice de nmagazinare a
acestora i cuprinde nivelele:
1. Nivelul I - organizarea datelor n fiiere clasice;
2. Nivelul II - organizarea mixt n fiiere;
3. Nivelul III - organizarea datelor n bazele de date clasice;
4. Nivelul IV - organizarea datelor n bazele de date relaionale;
5. Nivelul V - organizarea datelor n baze de date distribuite.
n cadrul acestei evoluii se disting etapele:
Etapa I - este perioada caracterizat de nregistrarea datelor pe benzi magnetice. Aceast etap se
apropie mult de sistemul manual de organizare a datelor (ndosariere - datele sunt
organizate, n principal, sub form de fiiere secveniale datorit suportului magnetic
(benzi)). Programatorii erau nevoii s efectueze o serie de operaii de gestiune a
datelor, datorit puternicei legturi dintre aplicaii i date.
n aceast etap se remarc urmtoarele caracteristici:
- structura logic coincide cu cea fizic i, prin urmare, programatorul trebuie s
descrie i organizarea fizic a datelor pe suport, lucru incomod, la schimbarea
suportului;
- prelucrarea se face pe loturi;
- dependena aplicaiilor fa de date (o modificare n structura datelor sau a
dispozitivului de memorare implic modificri ale programelor de aplicaie i
recompilarea lor i, ca urmare, trebuie ca datele s fie redefinite n cadrul aplicaiei
ori de cte ori apare o modificare n structura bazei de date);
- redundan mare n memorarea datelor datorit faptului c aceleai date sunt
memorate separat pentru fiecare aplicaie ce are nevoie de ele;
- legturile dintre fiiere trebuie specificate n cadrul programelor aplicaie;
- fiecare aplicaie are propriile date i este singura care le poate folosi;
- programele realizeaz numai operaii simple de intrare/ieire.
Etapa a II-a - este caracterizat de nregistrarea datelor pe discul magnetic. Datele se pot organiza
acum att n fiiere secvenial-indexate ct i n fiiere cu acces direct. Anterior
acestei etape datele erau nmagazinate n fiiere obinuite, fie n format ISAM
(Indexed Sequential Access Method) fie n format VSAM (Virtual Storage Access
Method). Datele sunt nmagazinate i extrase acum n uniti numite blocuri sau
pagini. Spre deosebire de nmagazinarea n memoria RAM, timpul necesar
extragerii unei pagini difer n funcie de localizarea acesteia pe disc.
Caracteristicile corespunztoare acestei etape sunt:
- structura logic nu mai coincide cu cea fizic, ceea ce face ca programatorul s nu
mai fie nevoit s descrie i organizarea fizic a datelor pe suport, acest lucru fiind
fcut de ctre componentele specializate ale sistemului de operare;
- prelucrarea se face online sau n timp real;
- schimbarea unitii de memorare nu implic modificarea programelor;
- se menine redundan mare deoarece, de multe ori, aceleai date sunt pstrate n
mai multe fiiere;
- datele sunt nestructurate;
- mentenana bazei de date are un cost foarte ridicat;
BAZE DE DATE
-
CURS nr. 2
Etapa a III-a - este caracterizat de apariia bazelor de date. Datele se pot organiza acum sub forma
unor fiiere integrate. Acestea permit realizarea mai multor fiiere logice pe baza
acelorai date fizice.
Caracteristici corespunztoare acestei etape sunt:
- organizarea fizic a datelor e independent de programele de aplicaii;
- se pot constitui fiiere logice n funcie de baza de date;
- se remarc un control integrat al datelor prin:
- reducerea redundanei datelor fiind posibil folosirea n comun a acelorai date
fizice de ctre mai multe aplicaii;
- accesul la date la nivel de cmp;
- eliminarea inconsistenelor;
- asigurarea controlului concurenei;
- asigurarea integritii datelor;
- gestiunea datelor;
- introducerea standardelor de disponibilitate a sistemelor;
- mbuntirea securitii datelor;
- asigurarea accesului la date dup chei multiple;
- organizarea datelor e realizat de o component software (data management);
- creterea independenei datelor, prin asigurarea transparenei detaliilor referitoare
la organizarea conceptual, structurile de stocare i strategiile de acces ale
utilizatorilor la:
- nivel logic:
- transparena organizrii conceptuale;
- transparena strategiilor logice de acces;
- nivel fizic:
- transparena organizrii nmagazinrii fizice;
- transparena cilor fizice de acces.
Etapa a IV-a - se caracterizeaz prin asigurarea independenei logice i fizice a datelor fa de
programele de aplicaie. Aceasta se realizeaz prin intermediul administratorului
de baze de date cu ajutorul descrierii datelor la un nivel logic global.
Caracteristicile specifice acestei etape sunt:
- datele sunt descrise la nivel logic global;
- existena unor fiiere inverse ce permit rspunsul rapid la ntrebri formulate de
utilizatori;
- mrirea gradului de protecie i securitate a datelor;
BAZE DE DATE
CURS nr. 2
BAZE DE DATE
CURS nr. 2
pointerii trebuie reorganizai, ceea ce presupune un mare consum de resurse i, prin urmare, astfel
de operaii trebuie efectuate numai atunci cnd sistemul nu este deloc sau este slab solicitat. Dac
inserrile se fac rar, fiierul poate fi pstrat n ordinea fizic stabilit iniial, reorganizarea
pointerilor fcndu-se la apariia oricrei noi inserri, caz n care nu mai sunt necesare cmpurile de
pointeri.
Organizarea fiierelor n grupuri
O situaie foarte bun se ntlnete atunci cnd, n bazele de date de mici dimensiuni, fiecare tabel
se afl ntr-un fiier separat, iar nregistrrile au o lungime fix, ceea ce va conduce la reducerea
dimensiunii programelor. Multe dintre sistemele de baze de date utilizate pe scar larg nu folosesc
n mod direct sistemul de operare pentru gestiunea fiierelor. n aceast situaie, bazei de date i este
alocat un singur fiier de mari dimensiuni, toate tabelele fiind pstrate n cadrul unui singur fiier. O
astfel de structur pune la un loc nregistrri din mai multe tabele, permind prelucrarea eficient a
jonciunilor. Dac nregistrrile nu pot fi plasate toate ntr-un singur bloc, cele rmase vor apare n
blocurile adiacente. Structura, cunoscut sub numele de grup, permite citirea celor mai multe dintre
nregistrri cu ajutorul unui singur bloc.
Utilizarea grupurilor este foarte util n cazul prelucrrii particulare a unui anumit tip de jonciuni,
dar poate conduce la scderea performanelor n cazul altor tipuri de interogri.
nmagazinarea metadatelor n catalog
Informaiile referitoare la obiectele bazei de date sunt pstrate n alte tabele cunoscute sub numele
de catalogul bazei de date, care conine:
- denumirile tabelelor;
- denumirile cmpurilor tabelelor;
- domeniile de valori i lungimea cmpurilor;
- denumirile u definiiile vederilor;
- constrngerile de integritate (informaii despre cheile primar i extern).
Catalogul mai conine date despre utilizatorii sistemului (numele i condiiile de acces ale
acestora), precum i (posibil) date descriptive i statistice, cum ar fi:
- numrul de nregistrri din fiecare tabel;
- metoda de stocare folosit n cazul fiecrui tabel (de exemplu, n grup).
De asemenea mai trebuie pstrate date referitoare indecii folosii n cadrul fiecrui tabel
(denumirea indexului, denumirea tabelului pe care se aplic indexul respectiv, tipul indexului,
cmpurile pe care se aplic indexul). Se poate spune c, de fapt, toate aceste date formeaz o alt
baz de date n miniatur. Baza de date poate fi folosit pentru a nmagazina date despre propria
structur, ceea ce va conduce la o structur mai complex a sistemului, permind utilizarea la
maxim a puterii bazei de date prin asigurarea accesului rapid la datele sistemului.
Modalitatea optim de reprezentare a datelor sistemului poate fi aleas de ctre proiectantul
sistemului, o posibil reprezentare fiind urmtoarea:
Schema catalogului sistemului = (nume tabel, numr de atribute).
Schema atributelor = (nume atribut, nume tabel, tip de dat, poziie, dimensiune).
Schema utilizatorului = (nume utilizator, cont de utilizator, cheia de criptare, grup).
Schema de indexare = (numele indexului, numele tabelului, tipul indexului, atributul indexului).
Schema vederii = (numele vederii, definirea vederii).