Pentru a face diferenţa dintre date şi informaţii, Hernandez propune următoarea axiomă:
Datele reprezintă ceea ce se înmagazinează; informaţia reprezintă ceea ce se extrage.
Cu alte cuvinte, datele trebuie extrase în aşa fel din baza de date încât să capete semnificaţie.
Evoluţia în timp a metodelor de organizare a datelor e legată de soluţiile tehnice de înmagazinare a acestora şi
cuprinde nivelele:
1. Nivelul I - organizarea datelor în fişiere clasice;
2. Nivelul II - organizarea mixtă în fişiere;
3. Nivelul III - organizarea datelor în bazele de date clasice;
4. Nivelul IV - organizarea datelor în bazele de date relaţionale;
5. Nivelul V - organizarea datelor în baze de date distribuite.
• dependenţa aplicaţiilor faţă de date (o modificare în structura datelor sau a dispozitivului de memorare
implică modificări ale programelor de aplicaţie şi recompilarea lor şi, ca urmare, trebuie ca datele să fie
redefinite în cadrul aplicaţiei ori de câte ori apare o modificare în structura bazei de date);
• redundanţă mare în memorarea datelor datorită faptului că aceleaşi date sunt memorate separat pentru
fiecare aplicaţie ce are nevoie de ele;
• legăturile dintre fişiere trebuie specificate în cadrul programelor aplicaţie;
• fiecare aplicaţie are propriile date şi este singura care le poate folosi;
Etapa a II-a - este caracterizată de înregistrarea datelor pe discul magnetic. Datele se pot organiza acum atât în
fişiere secvenţial-indexate cât şi în fişiere cu acces direct. Anterior acestei etape datele erau înmagazinate în
fişiere obişnuite, fie în format ISAM (Indexed Sequential Access Method) fie în format VSAM (Virtual Storage
Access Method). Datele sunt înmagazinate şi extrase acum în unităţi numite blocuri sau pagini. Spre deosebire
de înmagazinarea în memoria RAM, timpul necesar extragerii unei pagini diferă în funcţie de localizarea acesteia
pe disc.
Caracteristicile corespunzătoare acestei etape sunt:
• structura logică nu mai coincide cu cea fizică, ceea ce face ca programatorul să nu mai fie nevoit să
descrie şi organizarea fizică a datelor pe suport, acest lucru fiind făcut de către componentele specializate
ale sistemului de operare;
• prelucrarea se face online sau în timp real;
• se menţine redundanţă mare deoarece, de multe ori, aceleaşi date sunt păstrate în mai multe fişiere;
• se menţine dependenţa aplicaţiilor faţă de date, accesul la date fiind foarte dificil; datorită acestei
dependenţe, aplicaţiile noi sunt greu de proiectat;
• legăturile între fişiere trebuie programate, ceea ce presupune definirea şi deschiderea fiecărui fişier,
accesarea datelor din primul fişier, prin intermediul căii de acces ce trebuie să apară în cadrul
programului, după care se accesează cel de-al doilea fişier, ş.a.m.d.; deoarece aceste fişiere au un format
fix, modificarea structurii unui astfel de fişier reprezintă un proces extrem de lent (mai întâi se transformă
datele, apoi fişierul trebuie redefinit în cadrul fiecărei aplicaţii care îl accesează, fiind posibilă chiar
schimbarea căii de acces spre acesta în cadrul fiecărei aplicaţii).
•
Etapa a III-a - este caracterizată de apariţia bazelor de date. Datele se pot organiza acum sub forma unor fişiere
integrate. Acestea permit realizarea mai multor fişiere logice pe baza aceloraşi date fizice.
Caracteristici corespunzătoare acestei etape sunt:
• organizarea fizică a datelor e independentă de programele de aplicaţii;
● reducerea redundanţei datelor fiind posibilă folosirea în comun a aceloraşi date fizice de către mai
multe aplicaţii;
● eliminarea inconsistenţelor;
● gestiunea datelor;
● introducerea standardelor de disponibilitate a sistemelor;
Etapa a IV-a - se caracterizează prin asigurarea independenţei logice şi fizice a datelor faţă de programele
de aplicaţie. Aceasta se realizează prin intermediul administratorului de baze de date cu ajutorul descrierii
datelor la un nivel logic global.
• existenţa unor fişiere inverse ce permit răspunsul rapid la întrebări formulate de utilizatori;
• în afara independenţei fizice a datelor apare şi independenţa logică prin posibilitatea existenţei unor
modificări în structura logică fără a afecta aplicaţiile;
• creşterea controlului concurenţei, prin existenţa mai multor vederi asupra datelor oferite utilizatorilor;
• posibilitatea introducerii standardizării prin centralizarea gestiunii datelor cu ajutorul definiţiilor în cadrul
cataloagelor;
• creşterea calităţii datelor prin introducerea constrângerilor suplimentare în cadrul bazei de date;