Sunteți pe pagina 1din 4

CAPITOLUL 2. Modelarea conceptual SGBD Tema2.

1 Nivelurile de abstractizare a datelor

Tema2.2 Organizarea datelor(intern i extern)

2.2.2. Organizarea externa a datelor

Tema 2.3. MODELE DE DATE 2.3.1. NOIUNI GENERALE Coleciile de date se bazeaz pe conceptele asociate de: entitate, caracteristic, membru, atribut. Entitatea reprezint o component unitar ce poate fi individualizat, dup aceleai descrieri, ntr-un domeniu. La nivelul fiecrei entiti, se pot crea colecii de date cu proprieti similare.
Exemple de entiti (prin colectie se mai intelege liste de ...): - Colecia Experimente (lista de experimente) - Colecia Contracte ( lista de contracte) - Colecia Furnizori (lista de furnizori) - Colecia Filme; (lista de filme) - Colecia Muzic; (lista de muzica) Etc.

Caracteristica este un concept prin care se definesc proprieti specifice predominante, care ajut la descrierea coleciilor de date ca entiti. Entitatea este descris de lista de caracteristici. Mulimea caracteristicilor care definesc un domeniu formeaz o familie de caracteristici. Membrul reprezint un element al unei colecii de date. Atributele sunt caracteristicile (descrierile) unui membru i servete pentru caracterizarea nsuirilor comune unei categorii. Domeniul reprezint totalitatea valorilor specifice unui atribut. n tabelul 2.1. sunt prezentate cteva exemple de dependen entitate membru atribut valoare. Modelarea datelor se bazeaz pe conceptul matematic de relaie, care este o matrice cu n coloane i m rnduri iar elementele matricei sunt dispuse i ntre care exist corespondene logice. O alt definiie important este cea a tuplului care este un rnd ntr-o relaie. Spre deosebire de tuplu, atributul este o coloan a unei relaii, cu o anumit denumire. Concluzionm c fiecare entitate este identificat printr-un nume i fiecare atribut al entitii, pe care o caracterizeaz, poart un nume distinct. Relaiile sau asocierile reprezint comunicarea ntre dou sau mai multe entiti i raportul (poziia) care exist ntre aceste entiti. O valoare a unei relaii este o comunicare ntre valorile entitilor care le leag. Cu alte cuvinte relaia este un concept intim legat de apariia a dou sau mai multe entiti.Una din principalele modaliti de structurare i vizualizare a datelor (sau a pachetelor de date) este prin folosirea abstractizrii , care neglijeaz aspectele nerelevante i realizeaz concentrarea asupra proprietilor care sunt semnificative dintr- un anume punct de vedere. Criteriul de relevan n abstractizare este condus de anumite obiective specifice bazei de date ce urmeaz a fi administrate. O form elementar de abstractizare este tipizarea prin care se definete un tip pornind de la o clas de obiecte similare. Tipul permite generalizarea n alctuirea mulimilor semnificative de obiecte, care au elemente comune, iar deosebirile sunt neglijate. Aceast categorie de generalizare se numete clasificare.

Instanierea este opusul procesului de clasificare. Specializarea este opusul generalizrii. Prin aplicarea pe mai multe nivele a generalizrii se obin ierarhii de generalizare (Figura 2.5.). Agregarea este o form de abstractizare prin care un obiect este alctuit din prile sale componente (Figura 2.6.). n figura 2.6. se observ c PERSOANA constituie un tip generalizat, cruia i s-au asociat tipurile NUME, TITLU TIINIFIC, INSTITUT, VECHIME care sunt proprieti intensionale ale tipului PERSOANA. S presupunem acum c este cazul unui consoriu de cercetare cu mai multe institute de cercetare din diverse domenii tiinifice, c sunt diferite laboratoare experimentale i ne intereseaz locaia unde Traian Vlduoiu, cercettor tiinific debutant, cu o vechime de 5 ani la Laboratorul de Energii nalte, etajul 4 din Institutul Curie a fcut o descoperire important sau termenul proiectului se apropie de sfrit. Numelui Traian Vlduoiu i se va asocia ETAJ, LABORATOR, NR care constituie proprietile extensionale ale instanierii tipului PERSOANA care caracterizeaz respectivul cercettor.

Capitolul 2 Tema 4
2.4. Organizarea datelor n fiiere 2.4.1. Caracteristicile fiierelor Principala form de organizare extern a datelor este fiierul. Fiierul reprezint o colecie organizat de date, omogen din punct de vedere al coninutului i al prelucrrii, stocat pe un suport de memorie extern. Fiierul ocup un anumit spaiu pe suportul de memorie extern, spaiul alocat putnd fi sau nu continuu, fiind sarcina sistemului de operare s gestioneze alocarea fizic a acestuia pe suportul de memorie. Orice fiier este definit prin urmtoarele elemente: a) de natur extern: nume i extensie fiier; caracteristicile suportului de memorie; atribute (Read Only, Hidden, System, Archive); data crerii, a ultimei accesri i modificri; lungimea; b) de natur intern: coninutul informaional (fiier de date, fiier program, fiier de comenzi, fiier text, fiier grafic etc.); modul de organizare a coninutului (secvenial, relativ, secvenial-indexat); modul de acces la nregistrri (secvenial, direct). Datele ntr-un fiier sunt structurate n nregistrri logice. Organizarea nregistrrilor ntr-un fiier poate fi privit att ca organizare logic ct i ca organizare fizic. Din punct de vedere al organizrii externe datele coninute ntr-un fiier sunt structurate n nregistrri logice. n principiu, un fiier conine acelai tip de nregistrri logice, dispuse ntr-o anumit ordine. Mulimea nregistrrilor logice coninute ntr-un fiier reprezint o mrime finit i caracterizeaz, n mod direct, mrimea oricrui fiier. Din punct de vedere al utilizatorului, nregistrarea logic reprezin-t i unitatea de acces la datele coninute ntr-un fiier. Organizarea logi-c a nregistrrilor, ntr-un fiier, ca mod de organizare extern a datelor, este impus de natura lucrrilor i cerinele de prelucrare, n timp ce or-ganizarea fizic este o organizare intern, fiind supus rigorilor sistemu-lui de calcul avut la dispoziie. Totalitatea datelor coninute ntr-o nregistrare logic caracteri-zeaz o entitate informaional, se refer la acelai obiect, fenomen, per-soan etc., n timp ce totalitatea datelor grupate ntr-o nregistrare fizic caracterizeaz o unitate de stocare fizic pe suportul de memorie a calcu-latorului. 2.4.2 Relaia fiier memorie RAM program Cele dou moduri de organizare a datelor, indiferent c se numesc organizare logic i fizic sau organizare extern i intern, nu se pot di-socia. ntotdeauna utilizatorul opereaz cu concepte, privind organizarea datelor, la nivel logic, n vreme ce sistemul de operare stocheaz i manipu-leaz datele, pe suportul de memorie, numai la nivel de nregistrare fizic. n funcie de natura i complexitatea lucrrilor, lungimea unei n-registrri logice poate s corespund sau nu cu lungimea unei nregistrri fizice. n multe cazuri o nregistrare fizic poate s conin mai multe n-registrri logice (figura 2.9.) n timpul prelucrrii fiierelor exist un flux continuu de informa-ii ntre fiierul de date, memoria intern i programul de prelucrare. Or-dinea logic de ncrcare i prelucrare n memorie este urmtoarea: se ncarc programul n memoria intern ; se aduc pe rnd blocurile de nregistrri fizice n memoria in-tern, ntr-un spaiu de ateptare (buffer de intrare/ieire), la dispoziia programului; fiecare nregistrare fizic este descompus n nregistrri lo-gice; nregistrrile logice sunt prelucrate pe rnd de program, iar re-zultatele sunt furnizate la ieire. 2.4.3. Metode de organizare a fiierelor Stocarea datelor n fiiere i accesarea acestora se realizeaz dup anumite metode, care au n vedere, pe de o parte, specificul lucrrilor i cerinele prelucrrii, iar pe de alt parte, suportul de memorie extern uti-lizat. Dac este avut n vedere complexitatea coleciilor de date ges-tionate, metodele de organizare i de accesare a datelor n i din colecii exist dou metode de organizare a datelor: n fiiere clasice i n baze de date. Metodele cele mai uzuale n cazul fiierelor clasice sunt: organizarea secvenial, organizarea indexat, organizarea relativ, organizarea direct. Organizarea secvenial este o metod simpl fiind admis de orice suport de memorie. Ea const n stocarea nregistrrilor pe suportul de memorie n ordinea cronologic a apariiei lor. Pentru accesul la datele din fiierele organizate secvenial se utilizeaz numai modul de acces secvenial, care const n parcurgerea una cte una, la rnd, a tuturor nre-gistrrilor dinaintea celei cutate. Prelucrarea unui fiier secvenial se oprete la ntlnirea etichetei EOF. Organizarea secvenial se aplic fiierelor cu coninut informaional stabil n timp sau cu micri puine; se mai spune fiiere cu un grad mic de volatilitate. Organizarea secvenial indexat utilizeaz ca suport de memorie discul magnetic i const n stocarea nregistrrilor, ordonate ascendent dup o cheie de acces, asociat fiecrei nregistrri, n momentul crerii fiierului. Cheia de acces este unic, nu admite duplicate, i este a unui cmp al nregistrrii. Un index reprezint o pereche format din cheia de indexare si adresa fizic de pe suport: index = f(cheie, adres). La crearea fiierului, nregistrrile vor fi sortate ascendent dup valoarea cheii de acces. Organizarea relativ const n asocierea, la fiecare nregistrare, a cte unui numr de ordine de la 0 la n (numrul articolului n fiier), care va indica poziia fiecrei nregistrri n fiier, n raport cu prima nregistrare i va servi pentru accesul direct al nregistrrilor. Organizarea direct a fiierelor presupune stabilirea dinainte a adresei fizice a fiecrei nregistrri, care s serveasc att la scriere ct i la citire. Operaia de stabilire a acestei adrese fizice, deci a locului ocupat de fiecare nregistrare, se realizeaz pe baza unui algoritm care stabilete adresa fiecrei nregistrri innd seama de caracteristicile i parametrii suportului de memorie, de modul cum este mprit suportul la momentul formatrii discului. Accesul la nregistrrile dintr-un fiier se realizeaz att n funcie de modul de organizarea a nregistrrilor n fiiere ct i de suportul de memorie extern pe care este memorat fiierul. Astfel, exist acces: secvenial, direct i dinamic. Accesul secvenial presupune regsirea nregistrrilor n ordinea n care acestea au fost dispuse pe suportul tehnic. Pentru a determina o nregistrare oarecare, este necesar sa se parcurg toate nregistrrile precedente. Accesul secvenial este adecvat lucrrilor seriale care prelucreaz seturi voluminoase de date. Nu este nsa eficient pentru cutarea rapida a unei nregistrri sau a unui grup de nregistrri. Este specific suporturilor neadresabile (banda magnetic). Accesul direct se aplic suporturilor adresabile si permite identificarea direct a unei nregistrri pentru care se cunoate adresa acesteia de pe suportul magnetic. Accesul dinamic mbina modelele anterioare realiznd cutarea n dou etape: poziionarea direct pe o anumit nregistrare a fiierului; consultarea secveniala a nregistrrilor urmtoare. Organizarea secvenial a fiierelor permite doar accesul secvenial, organizrile secvenial-indexat i relativ permit accesul direct dup valoarea cheii (cheia trebuie cunoscut dinainte i precizat), accesul secvenial, care se realizeaz prin parcurgerea tuturor nregistr-rilor pn la cea cutat i accesul dinamic.

2.4.4 De la fiiere la baze de date Organizarea datelor n fiiere clasice este o metod rigid care creeaz destule neajunsuri utilizatorilor sistemelor de programe bazate pe acest tip de fiiere. mare dezavantaj este acela c modificrile n structura unui fiier oblig la modificarea tuturor programelor care utilizeaz fiierul a crui structur a fost modificat. Acest lucru se datoreaz faptului c programele scrise n limbajele algoritmice care lucreaz cu fiiere trebuie s conin clauze pentru descrierea detaliat a acestora. Este vorba despre urmtoarele elemente care sunt descrise n cadrul programului: metoda de organizare i eventual modul de acces; structura logic a nregistrrii; cheia de acces (record key), n cazul n care fiierul este indexat; Aceste elemente sunt obligatorii pentru orice program. Instruciunile de prelucrare din program trebuie s fie n concordan cu descrierea datelor, altfel apar erori n funcionarea programelor, deoarece nici un fiier nu poate fi prelucrat corect dac descrierea sa din program nu este identic cu ca a fiierului real de pe disc. n cazul n care structurii logic a unei nregistrri este modificat prin adugarea unui cmp, sau redimensionarea altuia, atunci toate programele care opereaz cu fiierul a crui structur a fost modificat trebuie actualizate. Pentru eliminarea acestor neajunsuri descrierea fiierelor nu a mai fost inclus n fiecare program ci ntr-o tabel sau ntr-un dicionar de date memorat separat, sau memorat n fiierul respectiv. Orice program care lucreaz cu fiierul i va identifica datele prin intermediul acestei tabele sau dicionar. Despre fiecare cmp se va ti precis unde este localizat n nregistrare i ce descriere are. Orice modificare n descrierea structurii logice va afecta numai tabela de descriere. Programele deja scrise nu mai trebuie actualizate, dect dac opereaz chiar cu noile cmpuri incluse n fiier. Aceast metod de organizare a datelor n bnci de date, ofer att avantajul separrii descrierii datelor de programele de aplicaie, dar i alte faciliti. n figura 2.12 este prezentat un exemplu de separare a descrierii structurii logice de datele propriu-zise prin intermediul unui dicionar de date. n aceast viziune de organizare apar trei elemente intercorelate: coleciile de date propriu-zise; tabelele cu descrierea structurii logice a coleciilor de date; relaiile, adic tabelele cu legturile dintre colecii. Toate aceste trei elemente reunite formeaz o baz de date. Baza de date se definete ca fiind ansamblul coleciilor de date mpreun cu structura acestora i relaiile dintre ele. Observaie: In Visual FoxPro termenii "baz de date" i "tabel" nu sunt sinonime. Baza de date (fiier .dbc) se refer la o baz de date relaional care este un container de informaii despre una sau mai multe tabele (fiiere .dbf) sau vederi.

Cel mai

S-ar putea să vă placă și