Sunteți pe pagina 1din 8

Examen BDT

Datele sunt fapte culese din viaa real pe baz de observaii i msurtori. Informaia este rezultatul interpretrii datelor de ctre un subiect i confer acestuia capacitatea de a lua decizii. Datele au un caracter obiectiv, n timp ce informaia este subiectiv. Pentru luarea unei decizii corecte, informaia trebuie s fie: 1. disponibil n timp util 2. corect 3. necontradictorie 4. neredundant 5. s aib o form adecvat necesitilor factorului de decizie
Sistemul bazat pe fiiere este o colecie de programe aplicaie, care efectueaz servicii pentru utilizatorii finali . Fiecare program i definete i gestioneaz propriile date. Limitrile sistemelor bazate pe fiiere: a. separarea i izolarea datelor b. dublarea datelor c. dependena de date d. incompatibilitatea fiierelor e. interogarea fix a programelor aplicaie

Baza de date este o colecie partajat de date elementare sau structurate, ntre care exist relaii logice, proiectat pentru a satisface nevoile informaionale ale unei organizaii.
Baza de date este un depozit de date unic, care este definit o singur dat i este utilizabil simultan de mai muli utilizatori. Caracteristica principal a aplicaiilor de baze de date const n operaiile de memorare i regsire si stergere efectuate asupra unui volum mare de date.

O baz de date este creat pentru a fi interogat. Organizarea datelor ntr-o baz de date constituie o CENTRALIZARE a acestora. Aceasta implic existena unui administrator al bazei de date. Centralizarea datelor ntr-o baz de date prezint avantajele: 1. Reducerea redundanei datelor memorate. 2. Evitarea inconsistenei datelor 3. Posibilitatea partajrii datelor 4. Posibilitatea aplicrii restriciilor de securitate 5. Posibilitatea introducerii unor proceduri de validare. Independena datelor nseamn c exist o delimitare strict ntre reprezentarea fizic a datelor i imaginea pe care o are utilizatorul asupra acestor date. Independena datelor prezint 2 aspecte: 1. independena fizic a datelor 2. independena logic a datelor Independena fizic a datelor este o msur a imunitii datelor fa de modificrile care pot s apar n structura fizic de memorare a datelor. Independena logic a datelor se refer la imunitatea sistemului propriu al fiecrui utilizator fa de modificrile n structura logic global a bazei de date. Independena logic permite adugarea de noi entiti logice i/sau modificarea relaiilor existente fr a afecta utilizatorii deja existeni.,dar nu permite stergerea lor pt ca aceasta afecteaza utilizatorii.

Obiectivele fundamentale ale unei baze de date 1. Centralizarea datelor 2. Independena ntre date i program 3. Realizarea de legturi ntre entitile de date 4. Integritatea datelor 5. Securitatea datelor.. 6. Confidenialitatea 7. Partajarea datelor SGBD este un sistem de programe care permite utilizatorului definirea, crearea i ntreinerea bazei de date precum i accesul controlat la aceasta SGBD ofer urmtoarele facilitati : - permite utilizatorilor s defineasc baza de date - permite inserarea, reactualizarea, tergerea i extragerea datelor din baza de date - ofer accesul controlat la baza de date. - ofer un anumit nivel de securitate. - ofer un mecanism de personalizare a aspectului bazei de date Se pot identifica 5 componente principale ale mediului SGBD: hardware, software, date, proceduri i persoane. Hardware Pentru a funciona, SGBD i aplicaiile au nevoie de hardware. Elementele specifice de hardware depind de cerinele organizaiei i de sistemul SGBD utilizat, i poate fi de la un PC sau un singur mainframe, pn la o ntreag reea de calculatoare. Software Componenta software cuprinde programele SGBD i programele de aplicaie, mpreun cu sistemul de operare i soft-ul de reea dac SGBD este utilizat n reea. Datele Sunt probabil cea mai important component a unui mediu SGBD. Datele acioneaz ca o punte ntre componentele main i cele umane. Baza de date conine att datele operaionale ct i meta-datele (datele despre date). Procedurile Se refer la instruciunile i regulile care guverneaz proiectarea i utilizarea bazei de date. Persoanele Se pot identifica patru tipuri distincte de persoane implicate n SGBD: Administratorii de date i de baze de date Proiectanii de baze de date Programatorii de aplicaii Utilizatorii finali.

Arhitectura bazei de date cu 3 nivele


Asigurarea independenei fizice i logice a datelor impune adoptarea unei arhitecturi organizat pe cel puin 3 nivele (arhitectura ANSI-SPARC): 1. nivelul intern (baza de date fizic) 2. nivelul conceptual 3. nivelul extern

Modul n care utilizatorii percep datele este numit nivel extern. Modul n care SGBD i sistemul de operare percep datele este numit nivel intern. Nivelul conceptual realizeaz att transpunerea ct i independena dorit dintre nivelul extern i cel intern. Nivelul intern- Reprezentarea fizic a bazei de date pe calculator. Acest nivel descrie CUM sunt stocate datele n baza de date. Nivelul intern (baza de date fizic) este o colecie de fiiere coninnd datele fizice la care se adaug diverse structuri auxiliare menite s asigure accesul operativ la date. Structurile auxiliare pot fi: directoare, indexuri, pointeri, tabele de dispersie. Nivelul intern trateaz chestiuni cum ar fi: alocarea spaiului de stocare pentru date i indexuri descrierea nregistrrilor pentru stocare (cu dimensiunile de stocare pentru date) plasarea nregistrrilor tehnici de comprimare a datelor i de codificare a acestora Nivelul conceptual este o vedere general a baz de date. Acest nivel descrie CE date sunt stocate n baz de date i RELAIILE dintre acestea. Nivelul conceptual conine structura logic a bazei de date, aa cum este ea vzut de administratorul bazei de date. Nivelul conceptual reprezint: toate entitile, atributele i relaiile dintre ele constrngeri asupra datelor informaii semnatice asupra datelor informaii privind securitatea i integritatea Nivelul extern - Reprezint vederea utilizatorului asupra baz de date. Acest nivel descrie acea parte a bazei de date care este relevant pentru fiecare utilizator. Prin modelul extern se realizeaz independena logic a datelor. Limbajele bazelor de date sunt mprite n 2 categorii: limbaje de definire a datelor ( DDL) i limbaje de manipulare a datelor (DML). DDL este utilizat pentru a specifica schema bazei de date, iar DML este utilizat pentru citirea i reactualizarea bazei de date. DDL este un limbaj descriptiv, care permite administratorului bazei de date sau utilizatorului s descrie i s denumeasc entitile cerute de aplicaie i relaiile care pot exista ntre diferitele entiti DML asigur un set de procedee ce permit operaii de baz pentru manipularea datelor din baz de date: inserarea de date noi modificri de date regsirea datelor tergerea de date Limbajele DML pot fi de dou tipuri: procedurale specific modul cum trebuie s fie obinut rezultatul unei instruciuni neprocedurale descriu numai ce rezultat trebuie obinut Model de date este o colecie integrat de concepte necesa re descrierii datelor, relaiilor dintre date i constrngerilor impuse datelor. Modelele de date se pot clasifica n trei categorii principale: 1. modele de date bazate pe obiecte 2. modele de date bazate pe nregistrri 3. modele de date fizice

n modelele de date bazate pe obiecte se utilizeaz concepte ca: entitate, atribut, relaie. O entitate este un obiect distinct (persoan, loc, lucru, concept, eveniment) care va fi reprezentat n baza de date. Un atribut este o proprietate care descrie un anumit aspect al obiectului pe care dorim s-l nregistrm. O relaie este o asociere ntre entiti Exist 3 tipuri principale de modele de date bazate pe nregistrri relaional n reea ierarhic Modelul de date relaional Se bazeaz pe conceptul de relaii matematice Datele i relaiile sunt reprezentate sub form de tabele, fiecare avnd un numr de coloane cu o denumire unic Modelul de date n reea Datele sunt reprezentate printr-o colecie de nregistrri Relaiile sunt reprezentate prin direcii Modelul de date ierarhic constituie un tip restrns de model n reea. Datele sunt reprezentate printr-o colecie de nregistrri Relaiile sunt reprezentate prin direcii Permite ca un nod s posede numai un singur pr Modelarea conceptual este procesul de construire a unui model de informaii utilizate ntr o companie, care este independent de detaliile de implementare.

Funciile unui SGBD


1. stocarea, regsirea i reactualizarea datelor 2. catalog accesibil utilizatorului 3. asigurarea tranzaciilor 4. servicii de control concurente 5. servicii de reconstituire 6. servicii de autorizare 7. suport pentru comunicarea datelor 8. servicii de integritate

Componentele software ale unui SGBD


Procesorul de interogare transform interogrile ntr-o serie de instruciuni de nivel jos, adresate administratorului bazei de date. Administratorul bazei de date realizeaz interfaa bazei de date cu programele aplicaie i interogrile lansate de utilizatori. Administratorul de fiiere manipuleaz fiierele de stocare aflate la baz i administreaz alocarea spaiului de stocare pe disc. Preprocesorul DML. Acest modul convertete instruciunile DML ncorporate ntr-un program aplicaie n apelri de funcii standard din limbajul gazd. Compilatorul DDL transform instruciunile DDL ntr-un set de tabele care conin metadatele.
Administratorul de catalog gestioneaz accesul i ntreinerea catalogului de sistem.

Pentru implementarea SGBD multiutilizator se folosesc trei tipuri de arhitecturi:


Teleprocesarea in care exist un calculator cu o singur unitate CPU i un numr de terminale toat procesarea este efectuat pe acelai calculator. Fiier-server, procesarea este distribuit n reea, aplicaiile i sistemul SGBD sunt executate pe fiecare staie de lucru, Client server, se refer la modul n care interacioneaz componentele de software pentru a forma un sistem: exist un proces client, care necesit cteva resurse, i un server, care ofer resurse.

Catalogul de sistem este un depozit de informaii care descriu datele din baza de dateadic meta-datele(datele despre date). Catalogul de sistem SGBD este una din componentele de baz ale sistemului. Volumul de date coninut i modul n care sunt utilizate informaiile variaz de la sistem la sistem. Relaie - O relaie este un tabel cu coloane i rnduri. Atribut - Un atribut este o coloan a unei relaii, cu o anumit denumire. Domeniu - Un domeniu este mulimea de valori permise pentru unul sau mai multe atribute Tuplu - Un tuplu este un rnd dintr-o relaie Grad - Gradul unei relaii reprezint numrul de atribute pe care le conine aceasta Cardinalitate - Cardinalitatea unei relaii reprezint numrul de tupluri coninute de aceasta.. Baz de date relaional - Un set de relaii normalizate Schema de relaie - O denumire a relaiei, urmat de un set de perechi de atribute i denumiri de domenii.
Cheia - Este un subset al atributelor unei relaii care satisface proprietile de: 1. identificare unic: fiecare tupl a relaiei este identificat unic de valorile atributelor care compun cheia 2. neredundan: subsetul de atribute este minimal, adic eliminarea oricrui atribut din subset duce la pierderea primei proprieti. Cheie primar - Cheia candidat care este selectat pentru a identifica n mod unic tuplurile din cadrul unei relaii.

Null-ul reprezint valoarea unui atribut care este n mod curent necunoscut sau nu este aplicabil tuplului respectiv. Un null nu este acelai lucru cu o valoare numeric egal cu 0 sau cu un text completat cu spaii; zerourile i spaiile sunt valori, pe cnd null-ul semnific absena unei valori. Integritatea entitilor - ntr-o relaie de baz, nici un atribut al unei chei primare nu poate fi null. Integritatea referenial - Dac ntr-o relaie exist o cheie strin, valoarea acesteia trebuie ori s coincid cu valoarea unei chei candidat a unui tuplu n relaia sa de baz, ori s fie n ntregime null. Relaie de baz este o relaie cu o anumit denumire, corespunztoare unei entiti din schema conceptual, ale crei tupluri sunt stocate fizic n baz de date. Vederea este rezultatul dinamic al uneia sau mai multor operaii relaionale, care acioneaz asupra relaiilor de baz pentru a realiza o alt relaie. O vedere este o relaie virtual care, n realitate nu exist n baz de date, ci este produs n momentul respectiv, la cererea unui anumit utilizator.

Procesul de normalizare este o metod formal, care identific relaiile bazndu-se pe cheile primare ale acestora i pe dependenele funcionale dintre atributele lor. Normalizarea ajut proiectanii de BD, prin prezentarea unei serii de teste care pot fi aplicate relaiilor individuale, pentru a preveni apariia anomaliilor de reactualizare. Anomaliile de reactualizare se clasific n: anomalii de inserare care pot fi de dou tipuri: anomalii privind identitatea datelor redundante: anomalii privind necesitatea introducerii de rnduri cu null pentru cheia primar anomalii de tergere: tergerea anumitor nregistrri duce la pierderea unor detalii care nu sunt stocate n alt parte: dac se terge ultimul membru al personalului de la o filial, se pierd detaliile despre filial anomalii de modificare. Dependenele funcionale sunt concepte fundamentale n procesul de normalizare. Dependena funcional descrie legturile dintre atributele unei relaii: fie A i B dou atribute ale relaiei R; atributul B este dependent funcional de A (notat AB) dac fiecrei valori a atributului A i corespunde o singur valoare a atributului B. A i B pot fi simple sau compuse. Forma nenormalizat (UNF) este un tabel care conine unul sau mai multe grupuri repetitive.
Prima form normal (1NF) este o relaie n care intersecia fiecrui rnd cu fiecare coloan conine o singur valoare i numai una, adic toate atributele relaiei iau valori unice, identifica i elimina grupurile repetitive A doua form normal (2NF): o relaie este n a doua form normal dac ndeplinete condiiile pentru prima form normal i fiecare atribut care nu este cheie primar este total dependent funcional de cheia primar.

A doua form normal (2NF) se bazeaz pe conceptul de dependen funcional total. Dependena funcional total arat c, dac A i B sunt atribute ale unei relaii R, se spune c B este total dependent funcional de A, dac B este dependent funcional de A dar nu i de orice submulime a lui A. A treia form normal (3NF): o relaie este n a treia form normal dac ndeplinete condiiile pentru prima i a doua form normal i n plus, nici un atribut (care nu este cheie primar) nu este dependent tranzitiv de cheia primar. Dependena tranzitiv: dac A, B, C sunt atribute ale relaiei R i exist dependenele A B i B C, se spune c C este dependent tranzitiv de A prin intermediul lui B (cu condiia ca A s nu fie dependent funcional de B sau C). A patra form normal (4NF): o relaie care se afl n BCNF i nu conine dependene multivalorice. Dependena multivaloric: se spune c ntre atributele A, B, C ale unei relaii exist o dependen multivaloric, dac pentru fiecare valoare a lui A exist o mulime de valori ale lui B i o mulime de valori ale lui C, dar mulimile valorilor lui B i C sunt independente unele de altele. Forma normal Boyce-Codd: o relaie se afl n BCNF dac i numai dac fiecare determinant este o cheie candidat.

Algoritmii de control ai concurenei pentru operaiile efectuate asupra BD se mpart n 2 clase: 1. algoritmi de control prin blocare 2. algoritmi de control prin marcare Se numete tranzacie orice execuie a unui program. O tranzacie poate avea dou rezultate: 1. dac este completat cu succes, se spune c tranzacia a fost efectuat iar BD ajunge ntr-o nou stare coerent; 2. dac nu este executat cu succes, ea este abandonat iar BD trebuie refcut n starea coerent dinainte. O astfel de tranzacie este rulat napoi sau abandonat. Pentru a delimita tranzaciile, n majoritatea limbajelor de manipulare a datelor sunt disponibile instruciunile BEGIN TRANSACTION, COMMIT i ROLLBACK. BEGIN TRANSACTION ncepe o nou tranzacie COMMIT salveaz orice schimbri i ncheie tranzacia curent ROLLBACK anuleaz orice schimbri fcute n timpul tranzacei curente i ncheie tranzacia Proprietile tranzaciilor 1. caracterul atomic: reprezint proprietatea tot sau nimic. O tranzacie este o unitate indivizibil, care ori este efectuat n ntregime, ori nu este efectuat de loc; 2. coerena: o tranzacie trebuie s transforme BD dintr-o stare coerent n alt stare coerent; 3. izolarea: tranzaciile sunt executate independent unele de altele. Efectele pariale ale unei tranzacii incomplete nu trebuie s fie vizibile pentru alte tranzacii;
4. durabilitatea: efectele unei tranzacii ncheiate cu succes sunt nregistrate definitiv n BD i nu trebuie pierdute din cauza unei pene ulterioare.

Anomalii de interferen - Dou tranzacii sunt susceptibile de interferen dac rezultatul execuiei lor concurente este diferit de rezultatul execuiei seriale.
Anomalii de interferen se calsifica in: Anomalia de actualizare pierdut-corespunde unui conflict de tip scriere-scriere Anomalia de citire improprie Corespunde unui conflict de tip scriere-citire Anomalia de citire irepetabil Corespunde unui conflict de tip citire-scriere Marcarea timpului este un protocol de control al concurenei, n scopul ordonrii tranzaciilor astfel nct, tranzaciile mai vechi s aib prioritate, n eventualitatea unui conflict.

Refacerea bazei de date este procesul de restaurare a bazei de date ntr-o stare corect dup apariia unei pene. Cauzele penelor: cderile sistemului (hard sau soft) pene de mediu (distrugerea mediului de depozitare a datelor) erorile soft de aplicaie dezastre naturale neglijena sabotajul Indiferent de cauz, exist dou efecte principale: 1. pierderea memoriei principale, inclusiv a bufferelor bazei de date 2. pierderea copiei de pe disc a bazei de date Tranzacia reprezint unitatea de reface de baz dintr-un sistem de baze de date.

Vom prezenta trei tehnici de refacere, cunoscute sub denumirile de reactualizare amnat, reactualizare imediat i paginarea cu umbr. a) Tehnica de refacere cu ajutorul reactualizrii amnate Prin utilizarea acestui protocol, reactualizrile nu sunt scrise n baza de date dect dup ce tranzacia a ajuns pe punctul de a fi efectuat. Dac tranzacia eueaz nainte de a ajunge n acest punct, ea nu va fi modificat baza de date i astfel nu mai sunt necesare anulri sau modificri. S-ar putea s fie nevoie doar s se reia reactualizrile tranzaciilor efectuate, deoarece este posibil ca efectul acestora s nu fi ajuns la baza de date. Pentru aceasta se folosete jurnalul de tranzacii. b) Tehnica de refacere cu ajutorul reactualizrii imediate Prin utilizarea acestui protocol, reactualizrile sunt aplicate pe baza de date imediat ce au loc, fr a atepta ca tranzacia s ajung pe punctul de a fi efectuat. Pe lng reluarea reactualizrilor efectuate, acum ar putea s fie necesar s se anuleze efectele tranzaciilor care nu au fost efectuate n momentul n care a survenit pana. Pentru aceasta se folosete jurnalul de tranzacii. Este esenial ca nregistrrile din jurnal s fie scrise nainte descrierea corespunztoare n baza de date. Aceast operaie e cunoscut sub denumirea de protocol de scriere n avans n jurnal. c) Paginarea cu umbr Este o alternativ a tehnicilor care folosesc jurnalul de tranzacii. n cadrul acestei tehnici, n timpul unei tranzacii se pstreaz dou tabele ale paginii: unul pentru pagina curent, unul pentru pagina din umbr. La nceputul tranzaciei, cele dou pagini sunt identice. Pagina din umbr nu se modific niciodat pe parcursul tranzaciei, n timp ce pagina curent reflect toate reactualizrile fcute pe baza de date de ctre tranzacia respectiv. La ncheierea tranzaciei, tabelul paginii curente devine tabelul paginii din umbr. Avantaje: eliminarea suprasarcinii datorat ntreinerii fiierului jurnal refacerea mai rapid (pentru c nu sunt necesare operaii de anulare sau reluare) Dezavantaje: fragmentarea datelor necesitatea unei colectri periodice a gunoaielor.

S-ar putea să vă placă și