Sunteți pe pagina 1din 20

UNITATEA III

ORGANIZAREA ŞI REPREZENTAREA DATELOR ÎN PROCESUL DE


PRELUCRARE AUTOMATĂ

Rolul acestui capitol este de a descrie principalele suporturi materiale pe


care se înregistrează datele, constituite în fişiere sau baze de date, pentru a putea fi
citite de către unităţile periferice ale unui calculator şi a le introduce În procesul de
prelucrare. Ţinând seama de faptul ca unele informaţii obţinute dintr-un proces de
prelucrare pot fi reintroduse intr-un alt proces şi acestea trebuie înregistrate pe
suporturile de date.
S-au descris deci, principalele suporturi materiale de date utilizate pentru
înregistrarea datelor iniţiale şi a celor rezultate din prelucrări anterioare, modul cum
sunt organizate datele pe aceste suporturi (în fişiere sau baze de date) precum şi
posibilităţile de accesare a acestora.
În acest capitol se lămuresc o serie de noţiuni privind: memoria auxiliară,
înregistrare logică şi fizică, fişier, bază de date, formatarea logică şi fizică a
discurilor, metodele de organizare a fişierelor de date precum şi metodele de acces
la datele din fişiere.
De asemenea s-a definit noţiunea de bază de date şi s-a definit structura
acestuia prin intermediul dicţionarului de date.

3.1. Memoriile externe utilizate pentru stocarea datelor


Aşa cum s-a arătat în capitolul anterior, memoria internă a unui sistem
electronic de calcul nu permite reţinerea unor cantităţi mari de date. Aceasta se
datorează în primul rând capacităţii ei limitate, cât şi faptului că la întreruperea
alimentării cu energie electrică a calculatorului, conţinutul memoriei pentru date
(memoria RAM) se pierde. Din aceste considerente şi ţinând seamă că în domeniul
economic se prelucrează un volum mare de date a apărut necesitatea înregistrării
acestora pe nişte suporturi materiale care au o capacitate foarte mare de memorare
şi sunt mai puţin costisitoare, numite memorii externe sau auxiliare.
Deci, se poate afirma că memoriile externe sunt medii fizice capabile să
înregistreze, să păstreze şi să redea la cerere, datele în vederea prelucrării lor
automate. Ele devin operaţionale prin intermediul echipamentelor periferice ale unui
sistem electronic de calcul pe care sunt montate. Fiecărui tip de memorie externă îi
corespunde un anumit echipament periferic (unitate de hard-disc - hard-disc; unitate
de floppy-disc - floppy-disc, etc.) cu ajutorul căruia datele sunt primite pentru a fi
înregistrate, sau sunt citite pentru a fi transmise memoriei interne în vederea
prelucrării lor.
Memoriile externe se pot clasifica după următoarele criterii:
INFORMATICĂ GENERALĂ
a) modul de utilizare în procesul de înregistrare a datelor.
Potrivit acestui criteriu memoriile externe pot fi memorii nereutilizabile
care permit înregistrarea datelor o singură dată, fără a exista posibilitatea modificării
sau ştergerii lor ulterioare (hârtia de imprimantă) şi memorii reutilizabile care permit
înregistrarea datelor cu posibilitatea ştergerii şi înlocuirii lor cu altele în funcţie de
cerinţele utilizatorilor (banda magnetică, discul magnetic, discul flexibil, discul optic).
b) viteza de transfer a datelor conduce la gruparea memoriilor externe în
memorii cu viteze mici de transfer a datelor între unităţile periferice şi memoria
internă (până la 10.000 caractere pe secundă) şi memorii a căror viteză de transfer
este de peste 500.000 de caractere secundă;
c) metodele de organizare a datelor pe suportul material grupează
memoriile externe în memorii cu organizare secvenţială a datelor, memorii cu
organizare indexat-secvenţială şi memorii cu organizare relativă a datelor;
d) posibilitatea de regăsire a înregistrărilor pe suportul material conduce la
gruparea memoriilor externe în memorii cu acces secvenţial, memorii cu acces
direct şi memorii cu acces dinamic la datele înregistrate;
e) modul de lucru în raport cu sistemul electronic de calcul permite gruparea
memoriilor externe în memorii care asigură introducerea datelor în procesul
de prelucrare automată, memorii care asigură înregistrarea informaţiilor
obţinute dintr-un proces de prelucrare automată şi memorii care sunt utilizate
atât pentru introducerea de date în prelucrare cât şi pentru înregistrarea
informaţiilor obţinute din prelucrarea datelor.
Criteriile de clasificare a memoriilor externe se pot sistematiza astfel:

Tipul de Mod de lucru Mod de utilizare Viteza de Mod de organizare Mod de access la
memorie în raport cu transfer a a datelor date
externă S.E.C datelor
Intr. Ieşire l/ e Ne- Re- Mare Secv. Dir. Rel. Secv Dir. Dinam.
(D) (E) reutili- utiliza- Mică
zabile bile.
Cartela * - - * - * - * - - * - -
perforată
Banda * - - * - * - * - - * - -
perforată
Hârtie de - * - * - * - * - - * - -
imprimantă
Banda - - * - * - * * - - * - -
magnetică
Hard discul - - * - * - * * * * * * *
Discul - - * - * - * * * * * * *
flexibil
CD-ROM - - * * - - * * * * * * *
DVD-ROM - - * * - - * * * * * * *

2
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

Figura 3.1 Clasificarea memoriilor externe


Deoarece nu toate suporturile materiale redate în tabel sunt utilizate în
procesul de înregistrare stocare şi redare a datelor (datorită faptului că sunt unităţi
lente şi de capacitate redusă), în continuare vom trata numai pe acelea care sunt
utilizate ca memorii externe pe microcalculatoarele IBM şi compatibile IBM.
3.1.1. Discul magnetic. Organizare fizică şi logică
Discul magnetic este o memorie externă de mare capacitate cu posibilitatea
de a permite accesul direct la datele înregistrate. Ca suport material el poate fi
confecţionat dintr-un material rigid (aliaje de aluminiu) sau flexibil (material plastic)
acoperit cu un strat magnetic pentru a permite înregistrarea sau citirea datelor.
Pe suprafaţa discului se află un număr diferit de piste concentrice apte
pentru înregistrarea datelor. Acestea la rândul lor sunt împărţite în sectoare
(operaţie ce se realizează cu ocazia iniţializării unui disc).
Discurile magnetice pot fi utilizate sub formă de pachete sau individual.
Pachetele de discuri sunt formate din mai multe discuri paralele, montate pe
un ax central care le asigură o mişcare de rotaţie. Numărul discurilor din pachet este
diferit (minim 2, maxim 11), cu dimensiuni cuprinse între 1,3 inch şi 5,25 inch.
Într-un pachet de discuri feţele laterale nu sunt utilizate pentru înregistrare
de date, ele având rol de protecţie a datelor din pachet. Ca atare se poate spune că
într-un pachet de discuri se utilizează între 2 şi 20 de feţe. înregistrarea sau citirea
datelor se realizează cu ajutorul unor capete de înregistrare/redare al căror număr
este dependent de numărul pistelor active de pe faţa unui disc. Aceste capete
permit poziţionarea în orice moment pe o anumită înregistrare care va fi citită şi
introdusă în memoria internă pentru a se prelucra datele cuprinse în ea.
Înregistrarea datelor într-un pachet de discuri se face pe cilindrii, ci nu pe
suprafaţa de disc. Cilindrii sunt formaţi din totalitatea pistelor unui pachet de discuri
egal depărtate de axul central. Deci, într-un pachet de discuri vor exista atâţia cilindrii
câte piste active sunt pe faţa unui disc, fiecare cilindru dispunând de atâtea
piste apte de înregistrare câte feţe active are un pachet de discuri (minim 2, maxim
20). Schematic un pachet de discuri poate fi reprezentat astfel:

3
INFORMATICĂ GENERALĂ
Figura 3.2. Structura fizică a unui pachet de discuri
Datele sunt înregistrate deci pe cilindrii, în cadrul acestora pe piste iar în
cadrul pistelor pe sectoare sub formă de mici porţiuni magnetizate. Datele sunt
structurate în înregistrări (articole) logice care pot fi memorate pe suportul material în
mod individual cu spaţii inter-înregistrări sau blocate, în acest caz trebuie să se ţină
seama de structura discurilor, care cere ca un bloc de înregistrări să ocupe un număr
întreg de sectoare. Partea utilă a blocului poartă numele de pagină. Blocurile de
înregistrări sunt separate tot prin intermediul unor spaţii neînregistrate care poartă
numele de GAP-uri. Numărul înregistrărilor logice dintr-un bloc se numeşte factor de
grupare.
Din cele prezentate rezultă că pentru a identifica o anumită înregistrare
trebuie să se cunoască cilindru, pista şi chiar sectorul unde aceasta a fost memorată
(o adresă triplă formată din numărul cilindrului, al pistei şi sectorului).
Hard-discurile sau discurile fixe folosite de microcalculatoare, sunt pachete
de discuri construite după tehnologia WINCHESTER. Aceasta presupune ca
pachetul de discuri împreună cu capetele de înregistrare/redare şi cu mecanismul
de antrenare să fie încasetate, formând o componentă numită HDA (Head Disk
Assembly). Viteza de rotaţie a unui astfel de pachet de discuri este cuprinsă între
3600 şi 7200 rotaţii pe minut. Un microcalculator dispune de mai multe unităţi de
hard-disc. Capacitatea de memorare a crescut foarte mult (de la 20-40 MO la
microcalculatoare XT până la peste 40 GO - în prezent). O altă caracteristică a
acestor pachete de discuri o reprezintă viteza de transfer a datelor (cantitatea de
date scrisă sau citită pe unitatea de timp). Aceasta a evoluat foarte rapid de la 102
KO/sec (la primele microcalculatoare XT), la aproximativ 10 MO (la cele mai rapide
unităţi de discuri folosite în prezent).
Hard-discurile, în principiu, vin formatate (iniţializate) de la firma
producătoare de echipamente. Se poate vorbi de o formatare fizică şi de o formatare
logică.
Prin formatarea fizică se definesc locaţiile fizice ale pistelor şi sectoarelor
aferente hard-discului, respectiv se marchează sectoarele pe pistă, se desemnează
spaţiul dintre sectoare şi intervalul dintre piste.
Prin formatarea logică se înţeleg operaţiile de stabilire a secţiunilor unde se
pot înregistra date sau programe ale sistemului de operare. La această formatare
hard-discul este împărţit în două zone: zona sistem şi zona de date.
Zona sistem cuprinde la rândul ei trei zone:
 Zona BOOT - cuprinde un program scurt care determină începerea
încărcării sistemului de operare în componenta RAM a memoriei interne;
 Zona FAT (File Alocation Table) - ţine evidenţa spaţiului ocupat pe disc
într-o tabelă de alocare. Unitatea de evidenţă este clusterul care conţine două sau
mai multe sectoare în funcţie de tipul discului. Clusterul este cea mai mică porţiune
de disc pe care sistemul de operare MS-DOS o poate aloca pentru un fişier. Pentru
4
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

înregistrarea unui fişier pe disc, sistemul de operare alocă mai multe unităţi contigue
(adiacente). Dacă pentru memorarea unui fişier pe disc nu se găsesc destule unităţi
de alocare contigue, atunci sistemul de operare va căuta alte unităţi de alocare
libere şi va înscrie aici datele care nu au putut fi înregistrate în spaţiul alocat iniţial.
Tabela FAT păstrează evidenţa modului în care au fost distribuite şi repertorizate
fişierele pe unităţile de alocare ale discului. Adresa primei unităţi de alocare pentru
un fişier de date se află într-un fişier de tip director. În poziţia din tabela aferentă
primei unităţi de alocare se află adresa celei de-a 2-a unităţi de alocare şi aşa mai
departe, până la ultima poziţie a ultimei unităţi de alocare. Aceasta conţine un cod
de sfârşit de fişier;
 Zona ROOT.DIR (a directorului rădăcină) unde sunt cuprinse informaţii
despre fişierele care aparţin de directorul rădăcină. Aceste informaţii se referă la:
numele şi tipul fişierelor, spaţiul ocupat, data şi ora la care au fost create sau
actualizate.
Zona pentru date ocupă cel mai mare spaţiu pe un hard-disc, aici
înregistrându-se fişierele create de utilizatori. Numărul şi dimensiunea fişierelor din
această zonă nu sunt limitate decât de capacitatea ei. Sistemele de operare
instalate pe microcalculatoare lucrează cu următoarele noţiuni:
 disc fizic - dispozitivele fizice care compun hard-discul inclusiv carcasa,
componentele electronice ş.a.;
 partiţie - o porţiune a hard-discului care funcţionează ca o singură unitate;
 partiţie primară - o porţiune a hard-discului care a fost marcată de sistemul
de operare astfel încât să poată fi folosită pentru iniţializarea sistemului.
Sistemul de operare MS-DOS acceptă o singură partiţie primară, iar
sistemul WINDOWS NT între l şi 4 partiţii primare;
 partiţie extinsă - o porţiune a hard-discului de pe care nu se poate face
iniţializarea sistemului, dar care poate fi împărţită în mai multe discuri logice.
Pe un hard-disc există o partiţie extinsă care poate fi împărţită în mai multe
discuri logice;
 disc logic - o secţiune sau o porţiune a unui hard-disc care funcţionează ca
o unitate de sine stătătoare;
 set de volume - porţiuni de spaţiu nefolosit de pe hard-discuri colectate
într-o singură unitate şi formatată ca o unitate de disc. Setul de volume
permite o utilizare mai eficientă a spaţiului disponibil pe hard-discuri.
Microcalculatoarele folosesc în afară de discurile organizate în pachete
(hard-discuri - HDD) şi discuri singulare denumite discuri flexibile sau floppy-disk-uri.
Din punctul de vedere al dimensiunilor fizice, acestea s-au găsit în două variante (de
5,25 inch şi 3,5 inch). În prezent microcalculatoarele folosesc doar discuri flexibile
de 3,15 inch.
Un disc flexibil se caracterizează prin:
• numărul feţelor active - astfel, aceste discuri pot avea o singură faţă aptă
5
INFORMATICĂ GENERALĂ
pentru înregistrare (simplă faţa - single side) sau ambele feţe pot fi utilizate pentru
înregistrare de date (dubla faţa - double side). în prezent toate discurile flexibile se
utilizează pe dublă faţă;
• densitatea de înregistrare a datelor. Sunt discuri flexibile care permit
înregistrarea datelor în simplă densitate (Single Density), care permit metoda de
înregistrare magnetică a datelor, în dublă densitate (Double Density - DD)
particulele magnetice au o granulaţie mai mică şi mai fină; înaltă densitate (High
Density - HD) cu particule magnetice foarte mici şi densitate extinsă (Extended
Density - ED). Densitatea indică numărul de caractere ce poate fi înregistrat pe un
inch.
La discurile flexibile se poate vorbi de două tipuri de densitate: o densitate
lineară care reflectă cantitatea de date (exprimată în număr de caractere) ce poate fi
memorată pe o pistă, şi o densitate longitudinală care indică numărul de piste ce pot
fi înregistrate pe un disc;
• capacitatea unui floppy-disk - indică volumul maxim de date ce poate fi
memorat. Aceasta se stabileşte la formatarea discului unde se formează numărul de
piste, numărul de sectoare pe o pistă şi densitatea de înregistrare. Acest parametru
poate fi cuprins între 360 KO şi 2,88 MO (la discurile de 3,50 inch cu dublă faţă,
înaltă densitate).
Înregistrarea datelor pe aceste memorii externe se face pe piste
concentrice, iar în cadrul acestora pe sectoare pe fiecare faţă a discului sub formă
de înregistrări logice continue sau cu spaţii inter-înregistrări. Pentru aceasta pe o
faţă de disc pot exista între 80 de piste concentrice apte pentru înregistrare, iar
fiecare pistă poate conţine un număr de sectoare. Acesta se stabileşte la formatarea
discului şi poate fi cuprins între 9 - 99. Implicit, o pistă are 9 sectoare dar se pot
formata discuri şi cu un alt număr de sectoare (15, 18, 36).
Principalele caracteristici ale discurilor flexibile pot fi redate sintetic în
următorul tabel:

Capacitate
Caracteristici
720 KO 1,44 MO 2,88 MO
Dimensiune fizică 3,5 inch 3,5 inch 33 inch
Nr. de feţe active 2 2 2
Densitatea de înreg. DD HD ED
Nr. de piste active 80 80 80
Nr.sectoare / pistă 9 18 36
Nr.de octeţi/sector 512 512 512

6
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

Figura 3.3. Caracteristicile tehnice ale discurilor flexibile

Microcalculatoarele de construcţie mai recentă mai pot utiliza pentru


înregistrarea şi stocarea datelor pe lângă tipurile de discuri descrise şi discurile
optice. Acestea sunt printre cele mai performante medii fizice de stocare a datelor.
Suportul fizic de date este un disc singular cu un diametru de 12 inch unde
datele sunt înregistrate sub forma unor amprente nealterabile care apoi pot fi citite
printr-un sistem optic cu fascicul laser.
Dintre discurile optice cel mai utilizat suport este CD-ROM (Compact Disk
Read Only Memory). Acesta este un suport material cu acces direct la date, dar
care odată înregistrat nu mai poate fi şters sau actualizat. Compact discul este
format din trei straturi suprapuse din care numai cel din mijloc este purtător de date,
celelalte având rol de protecţie.
Înregistrarea datelor se face sub forma unor amprente definite irevocabil ca
nişte adâncituri sau ridicături mici încrustate pe suportul de date. Aceste amprente
sunt citite de raze laser.
Capacitatea de memorare a unui CD-ROM este de circa 650 MO, dar prin
tehnologii speciale poate fi multiplicată de maxim 10 ori.
Microcalculatoarele mai pot utiliza şi alte tipuri de discuri magnetice cum ar fi :
• Discul ZBP - o dischetă de 3,5 inch cu o capacitate de memorare a
datelor cuprinsă între 25-100 MO şi o viteză de transfer a datelor între 150 KO şi 1,5
MO/secundă;
• Discul interschimbabil (SYQUEST) - o alternativă a discurilor ZIP
produse de firma Omega. Acestea lucrează ca un pachet de discuri cu posibilitatea
de a înlocui un disc cu altul. Capacitatea acestor discuri poate fi până la 200 MO;
• Discul floptical - un suport amovibil care având dimensiunile unui disc
flexibil de 3,50 inch permite înregistrarea unui volum foarte mare de date (40-100
MO) pe 755 de piste. Fiecare pistă este împărţită în 27 de sectoare a câte 512
octeţi. Pentru înregistrarea/redarea datelor foloseşte un procedeu optic de
poziţionare a capetelor de citire/scriere,
DVD-ROM (Digital Versatile Disk) este un mediu optic de mare capacitate,
viteza şi densitate de înregistrare a datelor care tinde să înlocuiască CD-ROM-ul,
mai ales pentru microcalculatoare de mare performanta.
DVD-ROM-ul utilizează un disc de 5,25 inch, gravat mult mai fin decât CD-
ROM-ul, ceea ce îi permite o densitate de aproximativ 7,5 ori mai mare.
Viteza de rotaţie a discului nu este superioara CD-ROM-ului, dar rata de
transfer a datelor este În jur de 2 MO/sec.
Discul DVD-ROM exista şi În versiune dubla fata, având o capacitate de
stocare a datelor de 9,4 GO fata de 4,7 GO folosit pe o singura fata.

7
INFORMATICĂ GENERALĂ
3.1.2. Banda magnetică
Banda magnetică este un suport material care permite înregistrarea unui
volum foarte mare de date.
Microcalculatoarele nu folosesc în mod curent banda magnetică ca
memorie externă, utilizând-o numai pentru crearea copiilor de siguranţă (back-up),
fiind suporturi ieftine şi de mare capacitate.
Benzile magnetice se prezintă sub formă de role (bobine) sau sub formă de
casetă.
Înregistrarea datelor pe bandă poate fi organizată în înregistrări individuale sau în
blocuri de înregistrări, în ambele cazuri separate de spaţii neînregistrate numite GAP-uri.
Densitatea de înregistrare a datelor este mare (10.000 - 68.000 biţi pe un inch), la un
moment dat pe lăţime de suport reprezentându-se un singur caracter.
Inconvenientul utilizării benzii magnetice în procesul de prelucrare (de citire
şi transmitere a datelor spre prelucrare) este dat de faptul că citirea se realizează
secvenţial (în ordinea transpunerii datelor pe bandă), ceea ce într-o prelucrare
selectivă a datelor s-ar pierde timp cu citirea acelor înregistrări care nu interesează
procesul de prelucrare.
Datorită faptului că au o capacitate foarte mare de înregistrare (minim 40
MO, maxim 13 GO) şi de asemenea o densitate mare de memorare a datelor,
banda magnetică poate fi folosită cu uşurinţă pentru crearea copiilor de siguranţă,
înlocuind pentru aceasta utilizarea a numeroase discuri flexibile. Pentru a fi
prelucrate datele păstrate pe benzi magnetice sunt transpuse pe un suport direct
adresabil (hard-disc sau disc flexibil) cu ajutorul unor programe speciale.

3.2. Organizarea datelor în fişiere şi baze de date


3.2.1. Noţiunea de fişier, înregistrare logică şi înregistrare fizică
Aşa cum am arătat mai înainte, datele, înainte de a intra într-un proces de
prelucrare, sunt înregistrate şi păstrate pe suporturile materiale sub formă de fişiere
sau sub formă de baze de date. Deci, fişierul reprezintă un ansamblu organizat de
date omogene din punct de vedere al naturii şi al criteriilor de prelucrare,
înregistrate pe suporturi materiale adecvate, pentru a putea fi utilizate în procesul de
prelucrare automată.
Orice fişier de date este văzut sub două aspecte: unul logic - care constă în
definirea explicită a înregistrărilor (articolelor logice) şi altul fizic care se referă la
descrierea datelor aşa cum sunt ele înregistrate pe suportul material.
Sub aspect logic un fişier este format din înregistrări (articole) logice.
Înregistrarea logică este constituită dintr-o grupare de câmpuri de date
compatibile, ce poate fi recunoscută şi tratată ca o entitate în cadrul fişierului.
Câmpul de date este o grupare de caractere ce constituie o secvenţă bine
definită în cadrul unei înregistrări logice. După conţinutul lor, câmpurile de date pot

8
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

fi: câmpuri grupate şi câmpuri de date elementare. Câmpurile de date grupate conţin
la rândul lor alte câmpuri de date (grupate sau elementare) prin care se reprezintă în
cadrul unei înregistrări logice (câmpul "Document" este format din câmpurile
elementare "Număr" şi "Fel" şi din câmpul de grup "Data"). Spre deosebire de
acestea, câmpurile de date elementare nu mai conţin alte subdiviziuni, ele fiind
formate din caractere. După natura caracterelor prin care se exprimă câmpurile de
date elementare pot fi; alfabetice (A), alfanumerice (aN), de tip dată calendaristică
(D) şi numerice (N), într-un program aplicativ datele se descriu la nivel elementar
prin intermediul unor identificatori care să definească cât mai sugestiv numele
câmpului, natura caracterelor (A, aN, D, N) precum şi numărul de caractere din care
este format câmpul descris.
Caracterul este elementul de bază - indivizibil - al datelor dintr-un fişier, el
fiind reprezentat printr-o literă, cifră sau semn special.
Totalitatea valorilor atribuite la un moment dat tuturor câmpurilor elementare
din structura unei înregistrări logice formează o realizare. La o singură instrucţiune
de intrare sau de ieşire se citeşte sau se memorează de pe sau pe suportul material
o singură realizare. Un fişier de date este format dintr-o mulţime de realizări,
realizări care cuprind date omogene structurate după anumite criterii.
Structura unei înregistrări logice poate fi redată astfel:

ÎNREGISTRARE LOGICĂ

DOCUMENT COD COD DENUMI- U.M. CANTITATE PREŢ


NR FEL DATA GEST MAT RE MATERI- UNITAR
AL
zi luna An factu- recep-
rată ţionată
N(6) A(20) D(2) D(2) D(2) αN(3) N(4) A(15) αN(4) N(5) N(5) N(6)
0122 Factura 20 02 99 M50 1011 POPLIN M 75000 74750 85000

Aviz
1015 exped. 25 02 02 M50 1021 SATEN M 50000 50000 155000

realizare
Figura 3.4. Structura şi conţinutul unei înregistrări logice

Dimensiunea unei înregistrări logice este dată de numărul de câmpuri şi de


dimensiunea fiecărui câmp din structura acestuia. Astfel dacă adunăm numărul de
caractere al tuturor câmpurilor din structura înregistrării logice descrisă mai sus, vom
observa că aceasta are dimensiunea de 74 de caractere.
Sub aspect fizic fişierul se defineşte în funcţie de modul în care realizările
se găsesc înregistrate pe suportul material, înregistrarea datelor pe memoriile

9
INFORMATICĂ GENERALĂ
externe se poate efectua prin reprezentarea realizărilor în mod individual cu spaţiu
între realizări (formatul neblocat) sau prin gruparea mai multor realizări după care se
lasă spaţiu liber (format blocat).
Reprezentarea datelor în format neblocat presupune constituirea unei
realizări de înregistrare logică în memoria RAM (prin introducerea datelor de la
tastatură) a unui sistem electronic de calcul şi apoi scrierea acestei realizări pe
suport material (de regulă pe hard-disc). în acest mod pe suportul material fiecare
realizare este memorată în ordinea introducerii acesteia în memoria RAM, formând
înregistrări fizice, înregistrările fizice se despart prin spaţii neînregistrate numite
GAP-uri. Dimensiunea unei înregistrări fizice este egală cu dimensiunea unei
realizări de înregistrare logică.

Figura 3.5. Reprezentarea datelor în format neblocat

Reprezentarea datelor în format blocat presupune alipirea a două sau mai


multe realizări de înregistrare logică într-un bloc de înregistrări (bloc fizic de date sau
înregistrare fizică). Operaţia de blocare a realizărilor de înregistrări logice are loc în
memoria internă, iar dimensiunea zonei în care se construieşte înregistrarea fizică
este definită prin program. Numărul realizărilor de înregistrări logice dintr-un bloc
poartă numele de factor de blocare şi acesta se specifică prin program.

10
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

Figura 3.6. Reprezentarea datelor în format blocat

În acest caz, printr-o singură instrucţiune de citire se transferă de pe


suportul material în memoria internă conţinutul unui bloc fizic de date, fiind memorat
într-o componentă numită buffer de intrare. De aici fiecare realizare de înregistrare
logică este transferată în zona articol intrare şi apoi datele sunt supuse procesului
de prelucrare. Numai după ce se termină de prelucrat toate datele din realizările
cuprinse în blocul fizic de date se face apel din nou la periferic pentru a introduce un
nou bloc de date. Se poate afirma că procedeul de grupare a realizărilor de
înregistrări logice în blocuri fizice de date este mai eficient decât cel neblocat
deoarece se scurtează timpul de apel la periferic (prin reducerea numărului de cereri
de citire) şi se consumă mai eficient suportul material deoarece spaţiile
neînregistrate sunt mai rare.
În scopul identificării şi delimitării fişierelor de date acestea mai conţin, în
afara realizărilor de înregistrări logice o serie de înregistrări speciale denumite
etichete. Astfel pot exista:
 etichete de fişiere - sunt înregistrări speciale, cu dimensiunea de maxim 80
de caractere, care preced şi urmează realizările dintr-un fişier;
 etichete de volum - utilizate în situaţia unor fişiere de mare volum care se
întind pe mai multe volume de memorie externă. Ele sunt înregistrări
speciale prin care se precizează începutul şi sfârşitul unui volum de
memorie externă.
3.2.2. Metode de organizare a datelor în fişiere
La orice sistem electronic de calcul există anumite metode standard de
organizare a datelor în fişiere pentru care producătorul pune la dispoziţia
utilizatorului o componentă software care oferă facilităţi de realizare a operaţiilor de
gestiune a fişierelor.
Principalele operaţii de gestiune a fişierelor sunt:
• crearea fişierelor de date - operaţie prin care datele structurate în
realizări de înregistrări logice sunt memorate pe suportul material;

11
INFORMATICĂ GENERALĂ
• actualizarea fişierelor de date - constă dintr-o serie de operaţii ce se
efectuează asupra unui fişier de date existent pe suportul material cum ar fi:
adăugarea de noi realizări; modificarea conţinutului unor câmpuri din cadrul
realizărilor deja existente în fişier; ştergerea unor realizări de înregistrări logice care
nu mai interesează procesul de prelucrare a datelor;
• consultarea unui fişier de date - este operaţia de citire a realizărilor de
înregistrare logică în vederea introducerii datelor în memoria internă pentru a fi
prelucrate în funcţie de instrucţiunile programului aplicativ activ.
Colecţia de realizări de înregistrare logică ce formează un fişier poate fi
memorată pe suportul material respectând anumite criterii de organizare care sunt
dependente de:
 tipul suportului material (memoriei externe) utilizat cu caracteristicile
specifice de înregistrare şi consultare a datelor;
 sistemul electronic de calcul.
Organizarea realizărilor de înregistrare logică pe memoria externă are drept
scop regăsirea cât mai rapidă a fiecărei realizări în vederea citirii şi transmiterii ei
către memoria internă, cu asigurarea unor condiţii de protecţie şi securitate a
datelor.
În evoluţia tehnicilor de organizare a datelor în fişiere s-au cristalizat mai
multe metode care se pot grupa astfel :
 metode de bază: secvenţială, secvenţial-indexată şi relativă (selectivă,
directă);
 metode intermediare: secvenţial-partiţională, secvenţial-partiţională cu
înlănţuire şi nedefinită.
 metode evoluate: multi-indexată, multi-listă şi inversă.
În acest paragraf ne vom ocupa numai de metodele de bază pentru
organizarea datelor în fişiere.
3.2.2.1. Metoda secvenţială de organizare a datelor
Această metodă este admisă de orice suport material, unitatea de acces
fiind realizarea de înregistrare logică.
La crearea fişierelor de date realizările de înregistrare logică sunt memorate
pe suportul material unele după altele fără o ordine prestabilită sau într-o ordine
stabilită anterior.
Consultarea unui astfel de fişier nu se poate realiza decât în acces
secvenţial (prin citirea în ordinea înregistrării a tuturor realizărilor din fişier până ce
se va găsi acea realizare care interesează procesul de prelucrare). Această
realizare este identificată prin valoarea atribuită unui câmp din structura înregistrării
logice. Rezultă că într-o consultare selectivă a datelor dintr-un fişier organizat
secvenţial se pierde timp cu parcurgerea acelor realizări care nu interesează
procesul de prelucrare.

12
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

Metoda de organizare secvenţială se recomandă pentru acele fişiere care


au un coeficient de consultare mare şi un coeficient de actualizare mic.
3.2.2.2. Metoda de organizare indexat-secvenţială
Este accesibilă numai de memoriile externe direct adresabile (discurile
magnetice de orice tip).
Această metodă îmbunătăţeşte performanţele metodei secvenţiale prin
introducerea unui element suplimentar numit cheie de acces. Aceasta nu este
decât un câmp din cadrul structurii înregistrării logice care trebuie să ia valori unice
pentru fiecare realizare din cadrul unui fişier (cod-mat, cod-produs etc.). Cu ajutorul
acestei chei se determină locul pe care-1 ocupă o realizare în cadrul unui fişier de
date.
La crearea unui fişier cu organizare indexat-secventială se defineşte
obligatoriu, prin program o cheie primară (un câmp din cadrul înregistrării logice cu
valori unice în cadrul fişierului) şi opţional se pot defini şi alte câmpuri drept chei
secundare (maxim 255 de chei secundare). Datele din documentele primare vor fi
înregistrate sub formă de realizări pe suportul material, ţinând seama de structura
înregistrării logice şi de ordinea strict crescătoare a valorii cheii primare de indexare.
Valorile cheii primare sunt trecute într-o tabelă de indecşi. Aceasta trebuie
să cuprindă pentru fiecare realizare de înregistrare logică două rubrici: 1) - valoarea
câmpului definit drept cheie de indexare şi 2) - adresa fizică (numărul cilindrului, a
pistei şi sectorului) unde se realizează înregistrarea logică.
Tabela de indecşi este generată de către o componentă a sistemului de
operare (sistemul de gestiune a fişierelor) şi este memorată pe acelaşi volum de
disc (pe aceeaşi dischetă) cu fişierul de date creat.
La exploatarea unui fişier cu organizare indexat-secvenţială se consultă la
început tabela de indecşi pentru a determina adresa unei realizări şi apoi se citeşte
realizarea identificată, introducându-se în memoria internă. Pentru a exemplifica
această metodă de organizare se consideră necesar crearea fişierului "Produse" cu
următoarea structură a unei înregistrări logice: CODGEST-αN(4); CODPROD-N(5);
DENPROD-A(20); UM-αN(4); CANTIT-N(5); PRETUNIT-N(6).

13
INFORMATICĂ GENERALĂ

Tabela de
indecsi

Figura 3.7. Fişier cu organizare indexat-secvenţială cu o cheie primară

Cheia primară este dată de câmpul CODPROD.


Această metodă de organizare se recomandă pentru fişierele cu date
permanente care au un coeficient mic de consultare, dar au un coeficient mare de
actualizare şi pentru care realizările de înregistrare logică au valori unice pentru
anumite câmpuri (fişiere de personal, de materiale, de produse etc.).
3.2.2.3. Metoda relativă de organizare a fişierelor de date
Această metodă este admisă numai de memoriile externe direct adresabile,
unitatea de acces fiind realizarea de înregistrare logică.
Metoda relativă organizează fişierul de date într-un număr de zone de
dimensiune fixă rezervate pe suportul material, cărora li se atribuie un număr de
ordine şi în care urmează să se memoreze realizările de înregistrare logică.
Numărul de ordine al fiecărei zone (celule) reprezintă cheia relativă a
realizării şi indică poziţia fiecărei realizări faţă de prima realizare din fişier care este
memorată în zona unu. Această cheie este folosită la consultarea fişierelor de date
pentru a identifica o realizare de înregistrare logică ce poate fi citită şi transmisă
memoriei interne pentru a prelucra datele.
Într-un fişier există zone rezervate pentru toate valorile cuprinse în intervalul
specificat de utilizator sau determinat în funcţie de spaţiul alocat unui fişier.
Deoarece, la crearea unui fişier numărul de realizări este mai mic decât numărul
zonelor create, există posibilitatea ca unele zone să rămână neocupate, în aceste
zone se pot introduce noi realizări care apar ulterior creării fişierului, prin operaţia de
actualizare a acestuia, fără a mai deranja ordinea în care au fost memorate la
început realizările de înregistrare logică.

14
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

pista 0

piste ………………………

pista 2
.
.
.
.

pista 9

Figura 3.8. Fişier cu organizare relativă


3.2.3. Metode de acces la datele din fişiere
Exploatarea datelor organizate în fişiere presupune elaborarea unor
programe aplicative prin intermediul cărora datele sunt citite şi transmise memoriei
interne şi apoi supuse procesului de prelucrare automată.
Accesul la realizările existente într-un fişier de date reprezintă tehnica prin
care acestea se regăsesc pe suportul material. El este dependent de metodele de
organizare a fişierelor de date.
Principalele metode de acces la datele organizate în fişiere sunt:
 accesul secvenţial;
 accesul direct (aleator);
 accesul dinamic.
Accesul secvenţial presupune citirea realizărilor de înregistrare logică în
ordinea în care acestea au fost memorate pe suportul de date în cadrul unui fişier.
Metoda fiind admisă de orice memorie externă şi de orice metodă de organizare a
fişierelor de date, este o metodă de acces la date lentă deoarece se pierde timp cu
citirea acelor realizări care nu interesează procesul de prelucrare. Ea este eficientă
numai într-o prelucrare secvenţială a datelor (toate datele din fişier sunt supuse
procesului de prelucrare în ordinea înregistrării lor pe suportul material).
Accesul direct este tehnica prin care regăsirea şi citirea unei realizări se
face fără a mai fi necesară parcurgerea în secvenţă a celor care o preced, ci printr-o
adresare directă a fiecărei realizări sau bloc de realizări. Această metodă este
permisă numai la memoriile externe direct adresabile şi numai în situaţia în care
fişierele de date au fost organizate indexat-secvenţial sau după metoda relativă.
Accesul dinamic este admis numai la memoriile externe direct adresabile
pentru fişierele organizate după metoda relativă sau indexat-secvenţială. în acest
caz regăsirea unei anumite realizări de înregistrare logică se face direct în funcţie de

15
INFORMATICĂ GENERALĂ
adresa relativă a acesteia în cadrul fişierului sau în funcţie de valoarea cheii de
indexare, iar celelalte realizări se citesc în acces secvenţial. Această metodă se
utilizează cu performanţe superioare atunci când, din cadrul unui fişier de date este
supus procesului de prelucrare numai un grup de realizări de înregistrare logică.
3.2.4. Organizarea datelor în baze de date. Concepte utilizate
Metodele şi tehnicile de organizare a datelor în procesul de prelucrare
automată au cunoscut o evoluţie continuă determinată pe de o parte de evoluţia
sistemelor electronice de calcul, iar pe de altă parte de creşterea volumului de date
ce trebuie prelucrate cu ajutorul calculatorului.
În aceste condiţii organizarea datelor în fişiere nu mai corespunde datorită:
 caracterului separat (izolat) al datelor organizate în fişiere;
 dependenţei programelor aplicative faţă de datele din fişierul supus
prelucrării. Structura unei înregistrări logice trebuie descrisă în programul
aplicativ, iar modificarea acestei structuri duce la introducerea de corecturi
în programul pe baza căruia se prelucrează datele;
 dificultăţii reprezentării unor obiecte complexe folosind lucru cu fişiere;
 dificultatea întâmpinată în prelucrări "ad-hoc", neprevăzute de la început.
În condiţiile acoperirii nevoilor de informare, din ce în ce mai mari a
organelor manageriale, a apărut necesitatea prelucrării cât mai complexe şi
interdependente a datelor organizate în colecţii de date. Deci, a apărut necesitatea
de a stabili legături între colecţiile de date dar chiar şi în cadrul aceleiaşi colecţii de
date (între realizările acestora). Astfel, treptat conceptul de fişier a fost înlocuit cu cel
de bază de date.
Baza de date reprezintă un sistem de colecţii de date între care există o
interdependenţă logică multiplă potrivit unor relaţii prestabilite cu ocazia definirii
structurii datelor, destinat satisfacerii celor mai diverse solicitări din partea unor
grupe diferite de utilizatori.
Folosirea bazelor de date în procesul de prelucrare automată prezintă o
serie de avantaje printre care amintim :
 realizează integrarea datelor din mai multe colecţii într-un tot comun care
poate fi exploatat de toţi utilizatorii pentru toate aplicaţiile;
 face posibilă independenţa programelor aplicative faţă de datele de bază;
 permite o prelucrare rapidă a datelor fără a avea un program special;
 oferă posibilitatea unui acces concurent al utilizatorilor la baza de date;
 sporeşte securitatea datelor împotriva accesului neautorizat şi a distrugerilor
accidentale.
O bază de date conţine, pe lângă date şi descrierea propriei sale structuri.
Această descriere se face prin intermediul dicţionarului de date care face posibilă
realizarea independenţei programelor aplicative faţă de structura datelor. Fiecare
colecţie de date este descrisă în acest dicţionar conform structurii stabilite anterior

16
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

prin intermediul câmpurilor din care este formată. La nivel elementar fiecare câmp
se identifică prin:
a) Numele câmpului - un identificator cât mai sugestiv atribuit fiecărui
câmp format din maxim 10 caractere;
b) Tipul câmpului - indică natura caracterelor prin care se reprezintă un
câmp. Astfel, un câmp poate fi de tip:
 CHARACTER (C) - câmp de tip şir de caractere format din litere, cifre,
caractere speciale şi spaţiu. Lungimea maximă a câmpului este de 254
caractere;
 NUMERIC (N) - câmp numeric - format din cifrele sistemului de numeraţie
zecimal plus semnele "+" şi "-"; lungimea maxima este de 20 caractere;
 DATE (D) - câmp de tip dată calendaristică reprezentat pe 8 caractere
(format implicit LL/ZZ/AA);
 LOGICAL (L) - câmp logic reprezentat printr-un singur caracter alfabetic "T"
sau "F" (Y sau N);
 MEMO (M) - câmp de tip variabilă de memorie implicit se reprezintă prin 10
caractere.
c) Lungimea câmpului - indică numărul maxim de caractere prin care se
reprezintă un câmp. În activitatea de gestionare a bazelor de date se foloseşte
următoarea terminologie :
 relaţie - este o tabelă bidimensională formată de rânduri (linii) şi coloane.
Relaţiile abordate sunt finite chiar dacă numărul de coloane din care sunt
constituite poate fi infinit;
 tuplu - este o linie (un rând) dintr-o tabelă (o realizare);
 caracteristică - reprezintă numele unei coloane din structura tabelei;
 cheie - una sau mai multe caracteristici cu ajutorul cărora se identifică un
tuplu (o realizare ) dintr-o tabelă;
 cheie primară - cheia care permite identificarea fiecărui tuplu într-o tabelă;
 cheie secundară - cheia care permite identificarea unui grup de tupluri ce au
aceleaşi caracteristici;
 domeniu - mulţimea valorilor unei caracteristici (mulţimea datelor pe o
coloană).
Pentru a exemplifica această terminologie dăm următorul exemplu :

17
INFORMATICĂ GENERALĂ

Tabela (colectia) PERSONAL

Figura 3.9. Terminologia utilizată în lucru BD

Un sistem informatic cu bază de date este format, pe lângă baza de date


propriu-zisă şi din hardware, software şi utilizatori.
Hardware-ul presupune ca un sistem electronic de echipamente să fie
prevăzut cu unităţi de memorie externă de mare capacitate, direct adresabile care
să poată stoca baza de date şi care să poată fi cuplate la o reţea de calculatoare
sau la microcalculatoare independente.
Software-ul este un sistem de programe de gestiune şi de aplicaţie care
asigură descrierea structurii bazei de date, manipularea datelor (crearea,
actualizarea şi interogarea bazei de date), controlul şi autorizarea accesului la baza
de date, precum şi asigurarea integrităţii şi securităţii bazei de date. Acest sistem de
programe este cunoscut în literatura de specialitate sub denumirea de SGBD
(System de Gestion de Base de Donne - în franceză) sau DBMS (Data Base
management System - în engleză). Din punct de vedere al performanţelor un SGBD
se situează la nivelul unui sistem de operare şi ca atare el este format din: nucleul
sistemului (monitor, monitor de înlănţuire, supervizor), programe traducătoare
(compilatoare), programe utilitare şi programe de aplicaţii.
Utilizatorii unei baze de date care se împart în trei categorii:
a) administratorul bazei de date - responsabil cu gestionarea şi punerea în
lucru a bazei de date, precum şi buna funcţionare a SGBD-ului. Funcţia de
administrator este îndeplinită de către o persoană sau grup de persoane cu
următoarele sarcini:
 proiectarea bazei de date;
 îmbunătăţirea permanentă şi extinderea bazei de date;
 asigurarea securităţii şi integrităţii datelor,
b) programatorii de aplicaţii - persoane care realizează programele
aplicative şi efectuează unele prelucrări de date;
c) utilizatorii finali - persoane care exploatează sistemul inclusiv programele
18
CAPITOLUL III – Organizarea şi reprezentarea datelor în procesul de prelucrare automată

aplicative.
Utilizatorii au acces la datele din baze, folosind sistemul de meniuri,
comenzi lansate de la tastatură, sau programe aplicative scrise într-un limbaj de
manipulare a datelor.

LISTA CUVINTELOR CHEIE

 memorie externă  Bandă magnetică


 hard-disc  GAP
 pachet de discuri  Fişier
 pistă  Înregistrare logică
 cilindru  Înregistrare fizică
 sector  Factor de blocare
 formatare disc  Tabel de indecşi
 zona BOOT  Cheie primară
 zona FAT  Cheie secundară
 zona ROOT.DIR  Acces la date
 discuri floppy  Acces secvenţial
 simplă densitate  Acces direct
 dublă densitate  Acces dinamic
 înaltă densitate  Baza de date
 densitate extinsă  Dicţionarul de date
 CD-ROM  Relaţie
 DVD-ROM  Tuplu
 Discul ZIP  Caracteristica
 Discul interschimbabil  Domeniu
 Discul flopical

19
INFORMATICĂ GENERALĂ
ÎNTREBĂRI DE CONTROL

1. Ce sunt memoriile externe? Cum se clasifică acestea?


2. Caracterizaţi hard-disc-urile organizate În pachete.
3. Ce înţelegeţi prin formatarea unui disc? De cate feluri este acesta şi ce se
realizează la formatare?
4. Caracterizaţi discurile flexibile. Sub ce dimensiuni se găsesc şi ce capacităţi
de înmagazinare pot avea?
5. Ce alte discuri mai pot fi utilizate ca memorii auxiliare? Caracterizaţi-le.
6. În ce scop este folosită banda magnetică de către microcalculatoare?
7. Cum sunt înregistrate datele pe banda magnetică?
8. Ce înţelegeţi prin fişier? Care este structura unui fişier de date ?
9. Care sunt formatele de reprezentare a datelor? Descrieţi-le.
10. Care sunt operaţiile de gestiune a fişierelor? Caracterizaţi-le.
11. Care sunt metodele de organizare a datelor În fişiere? Caracterizaţi-le.
12. Care sunt metodele de acces la datele unui fişier? Caracterizaţi-le.
13. Ce înţelegeţi prin baza de date?
14. Ce conţine dicţionarul de date?
15. Prin ce se caracterizează un câmp din structura unei colecţii de date?
16. Care sunt componentele unui sistem informatic cu baze de date?
Caracterizaţi-le.
17. Care sunt utilizatorii unei baze de date?

Dacă aţi ştiut să răspundeţi la aceste întrebări puteţi trece mai departe. În
caz contrar, reveniţi asupra acestui capitol.

BIBLIOGRAFIE

o Gh. Popa şi colectiv – Baze de date ACCESS, Ed. CISON, Bucureşti,


2000, cap. I;
o Maria Stanescu şi colectiv – Bazele informaticii, Ed. SECOREX,
Bucureşti, 1999, cap. III;
o Victoria Stanciu şi colectiv – Informatica generala, Ed. DUAL TECH,
Bucureşti, 2001, cap. 2, paragraf 2.6 şi 2.7;
o Tamas Ilie şi colectiv – Sisteme de gestiune a bazelor de date, Ed.
CISON, Bucureşti, 2000, cap. I;
o Tamas Ilie şi colectiv – Bazele informaticii, Ed. InfoMedia, Bucureşti,
2000, cap. III.

20

S-ar putea să vă placă și