Sunteți pe pagina 1din 46

I.

Organizarea datelor
•Definire
•Evoluţie
•Organizarea datelor în fişiere
•Tipuri de fişiere
•Organizarea datelor in baze de
date
•Tipuri de baze de date
•Sisteme de baze de date
Definire

Organizarea datelor
- Definirea, structurarea ordonarea si
gruparea datelor in colectii de date
omogene;
- Stabilirea legăturilor între date;
- Definirea restrictiilor de integritate;
- Definirea schemei conceptuale, logice
si fizice;
- Reprezentarea datelor pe un suport
informational, etc.
Obiectivele organizarii datelor
 acces rapid la date;
 spatiu de memorie ocupat cat mai
mic;
 unicitatea datelor;
 existenta tuturor legaturilor;
 integritatea datelor;
 securitatea datelor;
 flexibilitatea datelor, etc.
Evoluţie
Evoluţie
• Fişiere cu organizarea secvenţială;
Fişiere secvenţial indexate; Fişiere cu
organizare relativă; Fişiere cu
organizare directă; Fişiere partiţionate;
• Fişiere multiindexate; Fişiere inverse;
Fişiere integrate
• BD arborescente; BD reţea; BD
relaţionale; BDOO
• BD multimedia; BD spaţiale; BD
Internet; BD mobile
• BDD
• Depozite de date; BD multidimensionale
Concepte de bază
 entitate
 membru
 atribut
 valoare
LUMEA REALĂ PLAN INFORMATIONAL

COLECŢIE DE
DATE

ENTITATE
FIŞA PRODUSULUI
FIŞA PRODUSULUI
COD........B204
COD.............
DENUMIRE.....OMO
UM.......PREŢ..........
DENUMIRE............
FIŞA PRODUSULUI
STOC LA INC Z.....
UM.......PREŢ..........
STOC LA SF ZI......
STOC LA INC Z.....
COD.......B203
STOC LA SF ZI......
DENUMIRE..ARIEL
UM.......PREŢ.....67
STOC LA INC Z...56
STOC LA SF ZI....12
VALOARE MEMBRU

ATRIBUT
Corespondenta…
 ENTITATEA PRODUSE
 MEMBRU UN PRODUS
 ATRIBUTE <CODP,DENP,UM>
 VALORI B203,ARIEL......
O ENTITATE ESTE DESCRISĂ
prin:

 NUMELE ENTITAŢII

 STRUCTURA sa LOGICA
STRUCTURA LOGICĂ
„DESCRIREA PROPRIETĂŢILOR INFORMAŢIONALE
ALE
ATRIBUTELOR UNEI ENTITĂŢI”

Entitatea PRODUSE:

Nr. Atribut Tip Lungime Cheie


1 COD_P text 4 Y
2 DEN_P text 20 -
3 UM text 4 -
4 PRET numeric integer -
Categorii de atribute
 atribute de identificare – coduri
de regăsire
 date calendaristice
 cantitativ – valorice
 atribute descriptive
 coduri ptr caracteristici tehnice
 coduri pentru sortări, grupări,
clasificări
MEMORAREA ENTITĂŢILOR PE
DISC (structura fizica)
 ENTITATE FIŞIER/ FILE

 MEMBRU INREGISTRARE/
RECORD

 ATRIBUT CÂMP/ FIELD


Relaţia ENTITATE - FIŞIER

FIŞA Structura logică


PRODUSULUI Field Name Type Size Fişier PRODUSE
den_pod char 20
Denumire________ cod_prod int 5 11000111000011101
Cod_______UM___ um char 4
pret int 4
Preţ-catalog ______ 0 0 0 0 1 1 1 1 0 0 1 1 0 0 EOF
ORGANIZAREA DATELOR
ÎN FIȘIERE CLASICE
Fisierele
 Fişierul reprezintă o  datele conţinute într-
colecţie organizată un fişier sunt
de date, omogenă structurate în
din punct de vedere înregistrări logice,
al conţinutului şi al dispuse intr-o anumita
prelucrării, stocată ordine
pe un suport de  organizarea fizică
memorie externă. este o organizare
internă, fiind supusă
rigorilor sistemului
de calcul avut la
dispoziţie.
Gruparea inregistrarilor logice in
inregistrari fizice
Fişier de date, memorie,
program de prelucrare
Caracteristici ale unui fisier
 de natură externă:
 nume şi extensie fişier;
 caracteristicile suportului de memorie;
 atribute (Read Only, Hidden, System, Archive);
 data creării, a ultimei accesări şi modificări;
 o lungimea;
 de natură internă:
 o conţinutul informaţional (fişier de date, fişier
program, fişier de comenzi, fişier text, fişier grafic
etc.);
 o modul de organizare a conţinutului (secvenţial,
relativ, secvenţial-indexat);
 o modul de acces la înregistrări (secvenţial,
direct).
MODURI DE ACCES
a) SECVENŢIAL

b) DIRECT

c) DINAMIC
a) ACCESUL SECVENŢIAL

 PRELUCRAREA ÎNREGISTRĂRILOR
- CITIREA
- SCRIEREA
SE FACE LA RÂND, una după alta

 Viteza redusa
 specific suporturilor neadresabile (banda
magnetică).
b) ACCESUL DIRECT

 PRELUCRAREA ÎNREGISTRĂRII SE
FACE INDEPENDENT DE RELAŢIA
CU
CELELALTE ÎNREGISTRĂRI DIN
FIŞIER

 Identifica direct o inregistrare pe baza


adresei fizice
ADRESĂ FIZICĂ

Home adress

CC HH RR

record
head
(track)
cylinder
c) ACCESUL DINAMIC
 Imbina modelele anterioare
 Cautarea se face in 2 etape:
 Pozitionarea directa pe o anumita
inregistrare
 Consultarea secventiala a inregistrarilor
ulterioare
Metode de organizare în fişiere
clasice

1. organizarea secvenţială,
2. organizarea indexată,
3. organizarea relativă,
4. organizarea directă.
1. Org. secvenţiala

- Stocare in ordinea cronologica

HDR Rec1 Reci Recn EOF

- Accesare prin parcurgere secventiala a


inregistrarilor
- Marcajul EOF – End Of File
2. Org. Indexata
DATE PRIMARE
12 ION 13 LIA 14 ENE

21 ELY
22 LEO
25 NIC

26 MIA
28 ANA
30 RON

0
1,14 2, 25 3,30 INDEX AREA
EOF
1
12 ION 13 LIA 14
ENE
2 21 ELY 22 LEO 25 DATA AREA
NIC
3 26 MIA 28 ANA
30RON User key 28
Organizare indexată
- Se stocheaza inregistrarile ordonate ascendent
dupa o cheie de acces unica, asociata
inregistrarii la creare
- Un index =pereche formată din cheia de indexare si
adresa fizică de pe suport: index = {
f(cheie, adresă)
ADRESĂ / CHEIE
INDEX FILE }

DATA FILE { RECORD / PRIMARY


KEY }

PERMITE ACCES SECVENŢIAL ŞI ACCES


DIRECT
3. Organizare relativa
 CONCEPTUL “RECORD NUMBER”
(0..n) = numarul articolului in fisier

 PERMITE
- ACCES SECVENŢIAL
- ACCES DIRECT
4. Organizare directa
 stabilirea dinainte a adresei fizice a
fiecărei înregistrări
 algoritm care stabileşte adresa
fiecărei înregistrări ţinând seama de
caracteristicile şi parametrii suportului
de memorie
Fişiere partiţionate

 înregistrările din fişier sunt


grupate în partiţii sub un
nume;
 în cadrul unei partiţii
înregistrările sunt organizate
secvenţial;
 se utilizează si în biblioteci de
programe.
Fişiere multiindexate

 este o extindere a indexării prin


utilizarea mai multor chei alese de
programator;
 spaţiul ocupat este mai mare;
 se utilizează pentru fişiere care
necesită regăsiri intense
multicriteriale.
Fişiere inverse
 fişierul invers se foloseşte întotdeauna
împreună cu un fişier de bază;
 fişierul de bază conţine datele propriu-
zise şi are organizare secvenţială. El
este fişierul în care se caută.
 fişierul invers este construit din cel de
bază (printr-o tehnică de inversare) şi
are organizare relativă. El este fişierul
prin intermediul căruia se caută.
 spaţiul ocupat necesar este cam de 3,5
ori mai mare faţă de cât ocupă fişierul
de bază.
Fişiere integrate (fişiere cu
legături)

 particularitatea lor este că


structura datelor este separată de
datele efective;
 structura este definită şi stocată
într-un fişier ce poartă denumirea
de dicţionar, iar datele efective
asociate structurii sunt memorate
în fişiere separate;
 între fişierele de date se pot defini
legături
II. Baze de date – noţiuni
introductive

•Ce este o Bază de date


•Elementele unei BD
•CODASYL
•Definiţii ale bazei de date
•Contribuţia lui Codd
•Evoluţia bazelor de date
•Sisteme de baze de date
Ce este o bază de date
 Bazele de date, ca mod de organizare a
datelor în memoria externă, au evoluat din
fişiere printr-un proces de integrare a lor
(fişiere şi legăturile dintre ele) şi ţinând
cont de aplicaţiile aferente.
 O bază de date=mai multe colecţii de date
intercorelate, organizate într-o manieră ce
corespunde cu nevoile şi structura
organizaţiei, împreună cu structura datelor
şi legătura dintre date.
Elementele unei BD

Noţiuni (elemente) comparative între organizarea datelor în fişiere


şi baze de date:

 Domeniul de valori= mulţimea valorilor posibile pentru o


caracteristică(ex.: culorile posibile pentru un automobil).
 Caracteristica= definirea şi descrierea unui anumit
aspect(proprietăţi) dintr-o entitate a lumii reale (ex.:marca
auto)
 Familia de caracteristici=ansamblul caracteristicilor care se
referă la aceeaşi entitate din lumea reală
 Colecţia de date(entitatea)=o familie de caracteristici asupra
căreia se aplică un predicat (care conduce la o relaţie de ordine
între caracteristici şi la obţinerea informaţiilor cu un anumit
sens) căruia i se afectează anumite legături.
CODASYL
 Conceptul de baza de date a apărut în 1964 în
cadrul primului raport CODASYL (Conference on
Data Systems Languages ) prezentat la lucrările
unei Conferinte pe probleme de limbaje de gestiune a
datelor “Development and Management of Computer –
centered date-base”.
 La aceasta conferinţă a fost lansata ideea
organizării datelor prin intermediul unui fişier de
descriere globala numit dicţionar de date care are
menirea de a asigura independenta programelor fata de
date si a datelor fata de programe.
Definiţii ale bazei de date
Baza de date=un ansamblu de colecţii de date:
• organizat, pe niveluri de organizare a datelor
(conceptual, logic, fizic);
• coerent, conform restricţiilor de integritate şi a
legăturilor dintre date, care rezultă din modelul logic
de date aferent;
• structurat, conform unui model de date pentru baze
de date (unul fundamental sau derivat);
• cu o redundanţă minimă şi controlată, care este
asigurată prin modelul de date implementat şi prin
tehnicile de proiectare ale BD;
• accesibil mai multor utilizatori în timp util, adică mai
mulţi utilizatori, concomitent, pot obţine informaţiile
dorite atunci când au nevoie de ele.
Definiţii ale bazei de date
Baza de date=o colecţie partajată de
date corelate logic (alături de o
descriere a acestor date), proiectată
pentru a satisface nevoile
informaţionale ale unei organizaţii.
[T.M. Connolly, C.E. Begg]
Definiţii ale bazei de date
BD= o colecţie de date persistente, care
sunt folosite de către sistemele de
aplicaţii ale unei anumite
întreprinderi. [C.J. Date]
Contribuţia lui CODD
• A inventat modelul relaţional pentru gestiunea bazelor
de date.
• Teoria normalizării a fost concepută iniţial de către
E.F.CODD, ulterior aducându-şi contribuţia şi alţi
cercetători. Există o formă normală care îi poartă
numele: BCNF (Boyce-Codd Normal Form).
• Teorema lui Codd: algebra relaţională şi interogările de
calcul relaţional independente de domeniu, două
binecunoscute limbaje de interogare pentru modelul
relaţional, sunt echivalente ca putere de expresivitate.
Adică, o interogare a bazei de date poate fi formulată
într-un limbaj dacă şi numai dacă poată fi exprimată în
celălalt.
• A propus un set de 13 reguli ce trebuie îndeplinite de un
SGBD pentru ca acesta să poată fi considerat relaţional.
Evoluţia bazelor de date
Generaţii de BD:
 • generaţia I = BD arborescente şi reţea
(până la sfârşitul anilor ’70);
 • generaţia a-II-a = BD relaţionale
(sfârşitul anilor ’70 şi până acum);
 • generaţia a-III-a = BD orientate obiect
(sfârşitul anilor ’80 şi până acum).
BD – Niveluri de organizare
Nivelul logic este dat de viziunea programatorului asupra
BD.
 Programatorul realizează programele de aplicaţie
pentru descrierea şi manipularea datelor
 scrise într-un SGBD;
 Programele implementează structura externă(logică)
a datelor;
 Structura externă este dedusă din structura
conceptuală;
 Structura externă reprezintă viziunea
programatorului asupra BD pentru o anumită
 Viziunea programatorului este independentă de
suportul tehnic de informaţie
 Rezultatul nivelului logic este schema externă, ca
parte din schema conceptuală
BD – Niveluri de organizare
Nivelul conceptual este dat de viziunea administratorului BD
asupra datelor.
 Administratorul realizează structura conceptuală a BD,
eventual cu instrumente oferite de SGBD;
 Structura conceptuală se obţine utilizând un anumit
model de date pentru BD şi o tehnică de proiectare
adecvată;
 Structura conceptuală este o reprezentare în interiorul
sistemului a realităţii pe care BD o transcrie;
 Viziunea administratorului asupra BD este independentă
de aplicaţiile care vor fi dezvoltate (independenţă
logică);
 Rezultatul nivelului conceptual este schema
conceptuală(schema);
 Realizarea schemei corespunde unei activităţi de
modelare pentru că este vorba de o raducere în termeni
abstracţi, entităţile lumii reale.
BD – Niveluri de organizare
Nivelul fizic este dat de viziunea inginerului de sistem asupra
datelor.
 Inginerul de sistem realizează structura internă
(fizică);
 Structura internă este dedusă din cea externă
conform unor tehnici de alocare pe suportul fizic;
 Structura internă corespunde descrierii datelor pe
suportul fizic de informaţie;
 Rezultatul la nivelul fizic este schema internă (fizică)
care se defineşte în termeni de fişiere şi înregistrări;
 Implementarea schemei interne se face cu ajutorul
sistemului de gestiune a fişierelor din SGBD şi/sau
din S.O., prin gestiunea fizică a perifericelor.
BD – Niveluri de organizare

S-ar putea să vă placă și