Sunteți pe pagina 1din 35

ORGANIZAREA INTERN A DATELOR

Informa ia, data i cuno tin a Clasificarea datelor Structuri statice i dinamice de date

7/6/2011

Informa ia, data i cuno tin a


Abordare pragmatic
Cuno tin a: informa ia caracterizat de utilitate i importan receptorul uman
 Tezaur de cuno tin e

pentru

 Proces de informare

 Redundan

7/6/2011

Abordare informa ional Data: Data mod concret de reprezentare a informa iei pentru un anumit procesor (om, calculator, algoritm, program etc.) Parametrii de definire a unei date: identificator valoare atribute

7/6/2011

Clasificarea datelor
Abordare la nivel logic Dup natur : - numerice: naturale, ntregi, reale, complexe; - alfabetice - alfanumerice - logice Dup num rul de valori n timpul execu iei programului: - variabile - constante propriu-zise (literali) - constante simbolice Dup num rul de valori memorate concomitent: - elementare (scalare) - structurate (structuri de date)
7/6/2011 4

Clasificarea structurilor de date Dup adresa fizic de memorie n timpul execu iei: - structuri statice - structuri dinamice Dup modul de referire a elementelor: - cu acces secven ial - cu acces direct Dup natura elementelor: - omogene - eterogene Dup tipul elementelor: - cu elemente date scalare - cu elemente date structurate (structur recursiv ) Dup mediul de memorare: - interne (n memoria principal ) - externe (pe medii magnetice: fi iere, baze de date)
7/6/2011 5

Abordare la nivel fizic  Reprezentarea intern a datelor numerice naturale (ntregi f r semn) Virgul fix aritmetic (1 sau 2 octe i) Codul utilizat: cod direct Plaja de valori: [0, 28-1] 7 1 0  Reprezentarea intern a datelor numerice ntregi (ntregi cu semn) Virgul fix algebric (1, 2 sau 4 octe i)

s
7 6 1 0 Codul utilizat: - pentru numere pozitive: cod direct - pentru numere negative: cod complementar Plaja de valori: [-27, 27-1]
7/6/2011 6

 Reprezentarea intern a datelor numerice reale Virgul mobil

Caracteristic (8/11 bi i)

Frac ie (23/52 bi i)

Caracteristica = exponent + 127

simpl precizie

Caracteristica = exponent + 1023 dubl precizie

Codul utilizat: cod direct


Plaja de valori: - simpl precizie: [-1038, 1038] - dubl precizie: [-10307, 10307]
7/6/2011 7

 Reprezentarea intern a datelor alfabetice i alfanumerice Codul

ASCII un caracter pe octet 256 de caractere distincte

Codurile ASCII Caracterele Coduri de control 2 Caractere speciale de pe tastatur

 Reprezentarea intern a datelor logice

adev rat - 1 reprezentat n virgul fix , pe un octet fals


7/6/2011

tau 5au Cu itd fsb rlp eet lsp re br elr a 9 6m ad cfs pn ci ia e t a 9et La cs 2p ilr e r l C a c i 5f
- 0 reprezentat n virgul fix , pe un octet
8

Structuri statice de date


Masivul: structur de date omogen , cu acces direct, ntre elementele c reia exist o rela ie ierarhic , pe mai multe niveluri

Vectorul

Matricea

Masivul tridimensional

7/6/2011

Articolul: structur de date neomogen , cu acces direct, ntre elementele c reia exist o rela ie de ordine ierarhic , pe mai multe niveluri de arborescen Factura

Nr. fact.

Data emiterii

U.m.

Cantitate

Pret

Valoare

Furnizor

an

luna

zi

Denumire

Cod fiscal

Date (cmpuri) elementare date f r descenden i Date de grup date care au descenden i Articolul  data de grup de cel mai nalt nivel Reprezentare intern : juxtapunerea datelor elementare Referire elemente: prin nume = deplasare fa
7/6/2011

de adresa de nceput
10

Structuri dinamice de date


Graf orientat Arbore ista simplu nl n uit ista dublu nlan uit Stiva (lista IFO) Coada (lista FIFO)

7/6/2011

11

BAZE DE DATE
No iuni generale

7/6/2011

12

Organizarea datelor n fi iere independente


Data 1 Data 2 Data 3 Data 4 Data 2 Data 4 FI IER 2 Data 5 Data 6 Data 1 Data 5 Data 7 Data 8 FI IER 3
PRELUCRARE 3 PRELUCRARE 2

Raport 1

FI IER 1

PRELUCRARE 1

Fi ier de leg turi

Raport 4 Raport 3 Raport 2

Raport 5

DA E
7/6/2011

FI IERE

PRELUCR RI

IE IRI
13

Dezavantaje ale organiz rii datelor n fi iere independente


Redundan a i inconsisten a datelor Dificultatea accesului Izolarea datelor Complexitatea deosebit a actualiz rilor Problemele de securitate i integritate R spuns greoi dificile la probleme ad-hoc simple y Costul ridicat y Inflexibilitatea fa de schimb rile ulterioare y Modelarea indecvat a lumii reale. y y y y y y
7/6/2011 14

Schem de principiu a unei baze de date


BAZA D DAT

Fi ier de date 1 Fi ier de date 2 Dic ionar de date

Fi ier de date n

Aplica ia 1
7/6/2011

Aplica ia 2

Aplica ia 3
15

Defini ie
O BD reprezint o colec ie de date utilizat ntr-o organiza ie, colec ie care este automatizat , partajat , definit riguros (formalizat ) i controlat la nivel central.

7/6/2011

16

Cele dou aspecte ale BD


Schema structura, aspectul constant, organizarea bazei; ansamblu de instrumente pentru descrierea datelor, rela iilor dintre acestea, restric iilor Con inut aspectul variabil, dinamic al bazei; datele propriu-zise

7/6/2011

17

Avantajele BD (1)
Un grad redus de redundan a datelor. Diminuarea inconsisten ei datelor. Facilitarea partaj rii informa iilor Suport pentru standardizare. Securitate si integritate Suport pentru rezolvarea conflictelor ce apar la actualiz rile operate n mediile multi-utilizator Structurile de date sunt mai aproape de realitate i mai u or de manipulat.
7/6/2011 18

Avantajele BD (2)
Este permis leg tura cu diverse limbaje-gazd . Abordare global a ntreprinderii Datele sunt separate de programele, iar procesul de dezvoltare a aplica iilorprogram este sensibil ameliorat, Sistemele informatice ce utilizeaz baze de date sunt mai flexibile, reflect mai bine specificul firmei, fiind adaptabile la modific rile ulterioare ale mediului economic.
7/6/2011 19

Nivele de abstractizare a datelor


Utilizator A1 Aplica ie Utilizator A2 Comenzi autonome Utilizator B1 Aplica ie Utilizator B2 Aplica ie Utilizator B3 Comenzi autonome

Schem extern A

Imagine A (nivel extern)


Interfa A dintre nivelele global i extern

Schem extern B

Imagine B (nivel extern)

Interfa B dintre nivelele global i extern

Schema conceptual (global )

Imagine global (nivel global)


Interfa dintre nivelele fizic i global

SIST M D G STIUN A BAZ I D DAT

Definirea structurii interne de stocare (Schema intern )


7/6/2011

Baza de date memorat pe disc

20

Sisteme de gestiune a bazelor de date


Un ansamblu de programe ce permit utilizatorilor s interac ioneze cu o baz de date, n vederea cre rii, actualiz rii i interog rii acesteia SGBD-ul este cel care asigur

i supervizeaz :

introducerea de informa ii n baza de date actualizarea i extragerea datelor din baz autorizarea i controlul accesului la date p strarea independen ei structura bazei - programe.

7/6/2011

21

Sistem de lucru cu o BD

7/6/2011

22

Limbaje de definire a datelor DDL - func iuni


Descrierea logic a bazei de date i subschemelor Specificarea fi ierelor de date i a leg turilor logice dintre acestea. Definirea restric iilor semantice Definirea cheilor de acces Definirea modului de indexare sau de localizare a entit ilor. Determinarea tipului unei date (de baz sau derivat )
7/6/2011 23

Limbaje de manipulare a datelor (DML)


Prin manipularea datelor se n elege efectuarea uneia dintre urm toarele opera iuni:
extragerea unor date din baz (consultare); scrierea de noi date n baz (ad ugare); tergerea datelor perimate sau eronate (uneori chiar i a celor corecte); modificarea valorii unor date.
7/6/2011 24

Administratorul bazei de date


Persoana responsabil s u. Sarcini: de sistem n ansamblul

Definirea arhitecturii bazei de date Definirea modalit ilor n care va fi structurat memoria extern i a metodelor de acces Modificarea arhitecturii i organiz rii fizice a bazei de date Autorizarea accesului la date se acord fiec rui utilizator al bazei de date Specificarea restric iilor de integritate.
7/6/2011 25

Utilizatorii bazelor de date

 Programatori de aplica ii  Utilizatori ocazionali  Utilizatori curen i  Utilizatori specializa i

7/6/2011

26

Evolu ia BD
A plica ie-program
i F i iere e e e te
Cod unic Cod reutilizabil D ate Citire/ criere din/n Fi iere Fi iere Cod unic Cod reutilizabil etoda de acces BD re ea D ate Cod unic Cod reutilizabil SG BD rela ionale etoda de acces D ate Cod unic SG BD obiectuale Cod reutilizabil etoda de acces D ate

R e ea

R ela io ale

rie tate e o iecte

B aza de date

1950-1960 1960-1970

1970-1990 1990- ...

7/6/2011

27

Modelul ierarhic

7/6/2011

28

Modelul re ea

7/6/2011

29

Modelul rela ional

7/6/2011

30

Diagram E-R

7/6/2011

31

Nivelul fizic al bazei de date


 Discul magnetic este dispozitiv de stocare extern , de larga utilizare in sisteme cu BD , suporta acces la o locatie specificata =>astfel aplicatiile cu BD lucreaza in mod transparent locatiei fizice a datelor (in memorie sau pe disc) Discurile sunt dispozitive ce ofera acces aleator la date , iar benzile permit acces secvential Datele sunt stocate/regasite in unitati numite blocuri de disc / pagini  Bloc =secventa contigua de bytes , reprezinta unitatea de scriere/citire a datelor de pe disc  Blocurile sunt aranjate in inele concentrice numite piste Timpul de regasire a unei pagini de disc variaza functie de locatia de pe disc =>  plasarea paginilor pe disc are un impact major asupra performantei SGBD!

7/6/2011

32

nivelul de jos in structura SGBD opereaza cu pagini (unitatea de date) dimensiunea unei pagini este dimensiunea unui bloc disc , paginile fiind stocate ca blocuri disc Abstractiunea pagina este potrivita pentru operatii de I/O, insa nivelurile superioare SGBD vad datele ca o colectie de INREGISTRARI Aranjarea unei colectii de inregistrari in pagina: O pagina = o colectie de sloturi, fiecare slot contine o inregistrare Inregistrarea este identificata de : ( page_id,slot_nr) = record_id Fisier: o colectie de pagini , fiecare continand o colectie de inregistrari. Permite operatii de : Inserare/stergere/modificare inregistrare Citirea unei inregistrari (specificata bazat pe record id) Scanarea tuturor inregistrarilor (posibil conform unor conditii de regasire a inregistrarilor)
7/6/2011 33

Dictionar de date
 Dictionar de date (catalog de sistem) stocheaza metadate (date despre date)  Informatii despre relatii  Nume  Nume si tip de atribute  Nume si definitii de vederi  Constrangeri de integritate  Info user, inclusiv parole  Date statistice si descriptive  Numar de tuple in fiecare relatie  Info despre organizarea fizica a fisierelor  Mod de stocare a relatiilor (secvential/hash/)  ocatia fizica a relatiilor  Informatii despre indecsi : structura, capuri chei de cautare
7/6/2011 34

Concluzii
 Paginile BD sunt organizate in fisiere - SGBD vede datele ca o colectie de inregistrari Pagina contine o colectie de sloturi ce identifica inregistrarile , structura permite mutarea inregsitrarilor, fara a afecta record_id.  Diverse organizari eficiente de pagini pentru inregistrari de lungime fixa sau variabila Nivelul fisier gestioneaza paginile din fisier si suporta abstractiunea inregistrari  Paginile cu spatiu liber- metode specifice de identificare : structuri de directoare, liste inlantuite Catalogul stocheaza informatii despre relatii, indecsi, vederi ( comune unei colectii) Indecsii regasirea eficienta a inregistrarilor in functie de valorile anumitor campuri
35

7/6/2011

S-ar putea să vă placă și