Documente Academic
Documente Profesional
Documente Cultură
5
8. MODELE DE DATE
• 8.1.REPREZENTAREA INTERNĂ A
DATELOR
• După cum se cunoaşte, calculatorul poate
reţine doar informaţii redate într-o formă
accesibilă acestuia, având în vedere
componentele structural-funcţionale
elementare ale acestuia, definite de două
stări posibile: un condensator încărcat sau nu,
un circuit închis sau deschis, o porţiune dintr-
un suport magnetic magnetizată sau nu etc.
• De aceea, singurele informaţii accesibile sunt
sub forma 0 sau 1, asociate uneia sau alteia
dintre cele două stări posibile în care se poate
regăsi o componentă elementară.
• Pentru reprezentarea internă a numerelor redate în
sistemul de numeraţie uzual, cel zecimal, alcătuite de
regulă din şiruri lungi de cifre, se ajunge, în formatul
inteligibil de către calculator, adică în sistemul de
numeraţie binar, la succesiuni mult mai lungi de cifre
0 şi 1. De aceea, pentru gestionarea acestora,
succesiunea de cifre 0 şi 1 se împarte în grupe de
câte 8 biţi, bitul reprezentând unitatea elementară,
indivizibilă de cantitate de informaţie. Se ajunge astfel
la octeţi sau bytes, cel mai mare număr
reprezentabil la acest nivel fiind 28-1 adică 255. Acest
mod de reprezentare este specific numerelor întregi.
Dacă se lucrează cu porţiuni adresabile de memorie
de 2, 4 sau 8 bytes, valoarea maximă a numerelor
reprezentabile creşte simţitor, ajungându-se de
exemplu în cazul a 4 bytes la valoarea maximă
pozitivă de 4294967295. Dacă rezervăm o poziţie
binară şi semnului, se pot reprezenta numere întregi
în intervalul -2147483648..2147473647, adică -
231..231-1.
• Informaţiile alfanumerice, redate sub formă de
text sunt reţinute prin intermediul codificării
ASCII (American Standard Code for Information
Interchange). Fiecare caracter se reţine pe 8
biţi, ajungându-se astfel la posibilitatea de a se
reda pe un byte un caracter din cele 28-1 adică
255 caractere potenţial disponibile.
• Hărţile produse prin tehnologiile GIS sunt,
ca orice hartă de altfel, hărţi de tip analogic.
Totuşi, în mod curent ele sunt cunoscute sub
numele de hărţi digitale deoarece ele sunt
obţinute pe baza unor informaţii redate sub
formă de cifre (digit în limba engleză) existente
în bazele de date GIS.
• 8.2. MODELUL VECTORIAL
• Reprezentarea internă a hărţilor digitale se face
pornind de la faptul că legătura dintre
localizările pe teren şi pe hartă a elementelor
cartografice se realizează prin intermediul unei
proiecţii geodezice adecvate specificului
elementelor cartografice reprezentate. Deşi pe
plan teoretic numărul proiecţiilor geodezice este
foarte mare, iar principiile care stau la baza lor
sunt foarte diversificate, în tehnica GIS se
operează preponderent prin intermediul unui
sistem de coordonate, de obicei carteziene,
definite printr-un sistem de axe rectangulare x, y.
• În ţara noastră sistemul utilizat în mod
oficial în acest context îl reprezintă proiecţia
stereografică 1970. Modelul vectorial se
recomandă atunci când elementele de
reprezentat sunt identificabile pe teren sub
forma unor figuri geometrice de bază cum
sunt punctele, liniile sau suprafeţele. Ele
reprezintă componente grafice elementare
pentru formatul vectorial de reţinere a
informaţiilor.
• 8.2.1. Punctele
• Componenta punct se reprezintă pe un
amplasament discret şi defineşte un
element cartografic cu un perimetru
neglijabil şi o formă nerelevantă pentru a fi
reprezentată printr-o altă componentă
grafică elementară posibilă. Această
componentă poate reprezenta practic chiar un
punct în accepţiunea lui geometrică şi căruia nu
i se poate asocia deci o suprafaţă, respectiv o
formă.
•
– Exemple tipice pentru o astfel de
componentă sunt:
• o bornă,
• un stâlp al unei reţele de curent de înaltă
tensiune sau
• un vârf de munte.
• În anumite situaţii, prin simplificare, se pot
reprezenta ca puncte şi anumite obiecte
cartografice, cum ar fi o clădire, atunci când,
datorită scării alese, nu se poate materializa
efectiv conturul sau forma ei. În aceste condiţii
se impune însă asocierea, în baza de date, a
informaţiilor descriptive sau a atributelor de
caracterizare a obiectului respectiv.
Fiecare punct este redat în mod unic
printr-o pereche de valori x, y.
O categorie specială de puncte o
reprezintă nodurile care definesc o
linie.
• 8.2.2. Liniile
• Componenta linie este redată printr-un set
ordonat de puncte care, atunci când sunt
conectate în succesiunea specificată,
alcătuiesc o formă liniară asociată unui obiect
cartografic de lăţime neglijabilă, astfel încât
acesta nu poate să deţină atributul referitor la
suprafaţă.
• Uneori, această componentă nu are realmente
suprafaţă, în cazul curbelor de nivel de
exemplu.
• În alte situaţii, cum ar fi cazul reprezentării
drumurilor redate tot sub formă de linii,
acestora li se poate conferi drept atribut
lăţimea, de unde se poate deduce suprafaţa
ocupată de acestea. În mod uzual, într-un
context GIS, această componentă este
cunoscută sub numele de arc sau polilinie.
• În cazul liniilor, punctele pot fi puncte
de început sau de sfârşit ale unei linii, sau
puncte de frângere a liniei, mulţimea
acestora definind forma fiecărei linii.
Fiecare astfel de punct este şi el definit
printr-o pereche de coordonate x, y.
Numărul minim de perechi de coordonate
ce pot defini o linie este de două, în cazul
unei drepte.
• Linia este delimitată de două puncte.
Dacă aceste două puncte au roluri
distincte, şi anume punct de început sau
nod_de_la şi punct de sfârşit sau nod_la,
linia are direcţie şi devine deci, sub aspect
matematic, un vector. De aici provine şi
termenul de reprezentare în format
vectorial.
• Uneori liniile pot fi subdivizate, reprezentând de
exemplu porţiuni ale unui drum cu o
suprastructură distinctă (asfaltat, pietruit, de
pământ) sau de calitate diferită (drum de
calitate, drum deteriorat etc.).
• Unele linii pot fi netede, cum ar fi de exemplu
curbele de nivel sau serpentinele și pot fi
descrise prin utilizarea unor funcţii matematice
de tip cerc, parabolă sau polinom. În acest caz,
datele GIS trebuie să exprime şi parametrii
ecuaţiilor ce definesc linia respectivă, cum ar fi
raza cercului sau coeficienţii unei ecuaţii de
forma: f(x) = a0 + a1x + a2x2
• Curbele netede obţinute prin ajustare
matematică, pornind de la un set de puncte se
numesc curbe spline şi sunt de mare utilitate în
interpolări sau reprezentarea curbelor de nivel. Odată
cu coordonatele fiecărui punct se specifică şi lista
punctelor conectate pentru formarea liniei şi ordinea
de conectare. În acest fel devine posibilă desenarea
efectivă a liniilor.
• 8.2.3. Suprafeţele
• Componenta suprafaţă este o
figură geometrică închisă, definită de o
linie ce include o zonă omogenă dintr-
un anumit punct de vedere, cum ar fi o
proprietate imobiliară, o parcelă, o
tarla cultivată cu o anumită cultură
agricolă, teritoriul unei comune, un
bazin hidrografic etc. Suprafaţa mai
poartă şi numele de poligon.
• Linia ce defineşte suprafaţa are acelaşi
punct de început şi de sfârşit, astfel încât
poligonul creat să fie închis.
• Componenta suprafaţă este componenta
elementară cea mai complexă, ea putând
să conţină la rândul ei şi alte suprafeţe.
Astfel, o suprafaţă poate avea o linie de
contur exterioară şi una sau mai multe
suprafeţe interioare, fiecare cu linia ei de
delimitare.
• 8.2.4. Codificarea datelor digitale
• În cazul realizării hărţilor pe cale
tradiţională, detaliile cu diverse semnificaţii sunt
redate prin intermediul unei legende, care
exprimă de fapt o modalitate de codificare a
informaţiilor, prin utilizarea de culori, linii de
diverse grosimi şi tipuri, simboluri grafice etc. În
acest fel, prin amplasamentul diverselor
obiecte, definit de coordonate, şi prin
simbolurile codificate prin legendă devine
posibilă identificarea oricărui obiect reprezentat
pe hartă. În mod similar se procedează la
codificări şi în cazul hărţilor digitale.
• Fiecare şir de cifre asociate unui obiect
conţine o serie de coduri ce permit definirea
amplasamentului şi a naturii obiectului
respectiv. Aceste coduri, numite coduri
tematice, sunt reprezentate ca o succesiune
de cifre cu o anumită structură. Fiecare
secvenţă a succesiunii de cifre are o anumită
semnificaţie. Astfel, pentru natura folosinţei unei
suprafeţe se pot utiliza coduri de forma redată
în tabelul 2 pentru caracterizarea grupului de
obiecte şi în tabelul 3 pentru caracterizarea
tipului de obiecte. Evident, aceste coduri pot fi
detaliate şi particularizate pentru cele mai
diverse situaţii.
• Practic, vizualizarea sau tipărirea hărţilor digitale se
bazează pe succesiuni de coduri de forma:
• -441581005523785387753523788387755-
441581005523791387757523794387766
• -4_4154_1005_523785_387753_523788_387755
• -4_4154_1005_523791_387757_523794_387766
• Semnificaţia acestor grupe este următoarea:
L2 A N2
L3
8
7
C
N6
N5
5 B L6
L4
4
L5
3
L1
N7,
L7
2
Y N4 D
1
N3
0 1 2 3 4 5 6 7 8
9 10 11
• Relaţiile topologice pot fi descrise prin
trei tabele distincte, şi anume:
– tabela topologiei poligoanelor, care conţine
arcele ce alcătuiesc fiecare poligon, fiecare
arc purtând un număr unic de identificare;
– tabela topologiei nodurilor, care redă arcele
care se întâlnesc în fiecare nod şi
– tabela topologiei arcelor ce conţine nodurile
ce definesc extremităţile fiecărui arc şi
poligoanele din dreapta şi stânga fiecărui arc,
în funcţie de modul de definire al nodului iniţial
şi al nodului final asociat fiecărui arc.
Crearea corectă a topologiei presupune:
• toate arcele care trebuie să se conecteze sunt efectiv
conectate,
• toate poligoanele sunt închise,
• toate supraînchiderile (porţiuni de arc care separă două
poligoane ce depăşesc limita poligonului) sunt eliminate.
In unele situaţii eliminarea erorilor se face manual,
prin digitizare, dar există uneori şi posibilitatea
automatizării acţiunii de eliminare a erorilor constatate cu
prilejul construirii topologiei.
Crearea topologiei se face în condiţii de înaltă
precizie, nefiind admise nici erori de ordinul miimilor de
milimetru. Deoarece coordonatele se reţin, după cum se
ştie, în virgulă mobilă, este puţin probabil ca două
puncte să se suprapună exact. Pentru a asigura
suprapunerea automată a unor puncte foarte apropiate
se face apel la aşa-numita toleranţă fuzzy sau toleranţă
de alăturare (snap tolerance).
• Prin crearea topologiei se
realizează în sinteză următoarele acţiuni:
– se identifică arcele care se leagă unul de altul
pentru a forma componente mai complexe, ca
liniile alcătuite din mai multe arce sau poligoanele;
– punctelor izolate li se conferă calitatea de noduri;
– se generează noduri la extremităţile arcelor;
– se generează noduri la toate intersecţiile de arce;
– se reunesc nodurile a căror distanţă este mai mică
decât toleranţa specificată;
– arcele foarte scurte sunt înlăturate.
• Atunci când apar îndoieli în legătură cu
oportunitatea alipirii a două noduri
apropiate, corectarea hărţii se poate face
manual de către operator.
• Este foarte important ca după operarea
modificărilor necesare, să se
recontruiască întotdeauna topologia,
pentru a redefini relaţiile spaţiale dintre
obiecte în noile condiţii.
8.2.7. Compresia datelor vectoriale
– Crearea şi exploatarea modelelor digitale reclamă
utilizarea unui volum foarte mare de memorie, astfel încât
această resursă se poate dovedi a fi un factor limitativ în
utilizarea calculatorului. De aceea, un aspect important în
utilizarea memoriei îl reprezintă compresia datelor reţinute.
– O tehnică eficientă de compresie constă în eliminarea
punctelor redundante, fără semnificaţie în redarea
geometriei obiectelor cartografice.
– De exemplu, în cazul unei linii drepte au semnificaţie
practică doar nodurile de început şi de sfârşit ale liniei,
eventualele puncte suplimentare de pe traseul liniei putând
fi eliminate fără a afecta geometria liniei.
– În cazul curbelor însă, compresia reprezintă un compromis
între menţinerea în condiţii satisfăcătoare a geometriei
liniei în condiţiile renunţării la unele puncte iniţiale de pe
traseul ei, numite vârfuri (vertex).
Algoritmul cel mai simplu pentru
eliminarea unor vârfuri de pe traseul unei
curbe este algoritmul Douglas-Peucker
(1972). El se bazează pe analiza gradului de
apropiere a unui vârf de un arc al curbei
supuse prelucrării.
Algoritmul se parcurge etapizat, pornind
de la curba iniţială, pe care se generează o
primă aproximare a curbei sub forma unei linii
ce uneşte nodurile de la extremităţile curbei.
După definirea unei toleranţe acceptabile
t, vârfurile curbei se analizează sub aspectul
distanţei faţă de linia definită iniţial.
Dacă toate distanţele de la vârfuri la linia ce
reprezintă prima aproximaţie sunt mai mici decât
toleranţa t, aproximaţia se consideră acceptabilă și
se reţine linia nou definită, eliminându-se toate
vârfurile.
Dacă există însă distanţe ce depăşesc
toleranţa t, aproximarea iniţială nu este
satisfăcătoare. În acest caz se identifică cel mai
îndepărtat vârf faţă de dreaptă, punctul respectiv se
consideră vârf al aproximaţiei următoare şi linia
iniţială se subdivide în două segmente definite de
vârful acceptat.
Aceşti paşi se repetă succesiv, realizându-se
noi subdivizări ale segmentelor obţinute pe parcurs
şi obţinându-se noi vârfuri, până când toate vârfurile
au distanţe faţă de segmentele create ce se
încadrează în toleranţa acceptată.
• O altă modalitate de abordare a problemei
constă în deplasarea grafică a unui coridor cu
lăţimea impusă de toleranţa acceptată de-a
lungul liniei şi eliminarea vârfurilor care nu
depăşesc lăţimea coridorului.
• În cazul curbelor de nivel ce conţin de obicei
un număr mare de puncte, reducerea spaţiului
de memorare necesar se poate face și prin
utilizarea unor funcţii matematice uzuale de tip
polinom sau prin utilizarea funcţiilor spline.
Pentru curbe foarte neregulate se pot chiar
utiliza chiar mai multe funcţii polinomiale.
O altă cale de acţiune pentru reducerea
volumului datelor memorate constă în eliminarea
caracterelor care se repetă de la o înregistrare la
alta în baza de date.
Un exemplu tipic îl reprezintă eliminarea
primelor cifre ale valorii coordonatelor, care se
repetă de la un punct la altul. Caracterul sau grupul
de caractere care se repetă se memorează doar o
singură dată. Evident, această modalitate de
compresie nu afectează în niciun fel geometria liniei.
8.2.8. Reţinerea în memorie a datelor
vectoriale
După cum se cunoaşte, volumul de date
asociat unei hărţi digitale este foarte mare.
De aceea se pune problema organizării
judicioase a modului de reţinere a acestor
date în memoria calculatorului.
În acest scop se impune definirea unui format
ce detaliază modul de organizare a datelor în
câmpuri.
Acestea conţin grupuri de cifre sau cuvinte
care sunt considerate unităţi distincte, cu o
semnificaţie individuală bine precizată.
Prin formatarea datelor se precizează:
• numărul de câmpuri,
• lăţimea fiecărui câmp (numărul maxim de
caractere admis),
• spaţiul dintre câmpuri,
• tipul valorilor reţinute etc.
Distingem câmpuri numerice de diverse tipuri şi
moduri de reprezentare precum şi câmpuri
alfanumerice, sub formă de text.
• Pentru a se asigura portabilitatea datelor, adică
posibilitatea transferului facil al datelor redate la
scări şi în sisteme de coordonate diferite, se
impune o standardizare riguroasă a acestora,
prin uniformizarea formatelor şi acceptarea
sistemului oficial de coordonate.
• Astfel, memorarea datelor aferente hărţilor
digitale se face prin organizarea lor ca baze de
date. Devine în aceste condiţii posibilă
accesarea, actualizarea şi întreţinerea comodă a
bazelor de date prin utilizarea unor programe
specializate, denumite ”sisteme de gestiune a
bazelor de date” (SGBD).
• Există numeroase modalităţi de organizare a bazelor
de date şi este de mare importanţă ca aplicaţiile GIS
să apeleze la date structurate în cel mai convenabil
tip de bază de date.
• Pentru a conferi o mai bună manevrabilitate datelor
topografice, acestea sunt asociate diverselor straturi
tematice astfel încât să se evite suprapunerea
poligoanelor peste arce şi puncte în cadrul aceluiaşi
strat.
• Un strat este omogen sub aspectul naturii
componentelor cartografice şi al semnificaţiei
acestora. De exemplu, putem crea straturi distincte
de arce, reprezentând drumurile naţionale, cele
judeţene, cele comunale, reţeaua hidrografică,
reţeaua de culmi etc.
8.3. MODELUL RASTER
• 8.3.1. Aspecte introductive
Modelul specific unei structuri raster se
caracterizează prin subdivizarea unui spaţiu
geografic într-o reţea de celule, dimensiunile acestora
definind rezoluţia spaţială a datelor, care depinde de
mărimea celui mai mic obiect de reprezentat.
În principiu, mărimea celulei se recomandă a fi mai
mică decât jumătatea mărimii celui mai mic obiect
reprezentat. Modelul raster poate fi considerat ca
model matematic deoarece el este redat de un
ansamblu regulat de celule de formă pătrată sau
dreptunghiulară. De aceea, modelele raster mai sunt
cunoscute sub numele de modele reţea (grid).
Rezoluţia geometrică a modelului este
definită de mărimea celulelor. Mărimile uzuale
sunt de:
• 10x10m,
• 100x100m,
• 1x1km,
• 10x10km,
• dar în unele aplicaţii se pot folosi şi celule de
5x5m sau chiar mai mici.
1 2 2 2 2 2 4 4 4 4
1 1 2 2 2 2 4 4 4 4
1 1 2 2 2 2 3 3 3 4
1 1 1 2 2 2 3 3 3 4
1 1 1 2 2 2 3 3 3 4
1 1 1 1 2 2 3 3 3 4
1 1 1 1 1 2 3 3 3 4
1 1 1 1 1 2 3 3 3 4
1 1 1 1 1 1 3 3 3 4
a
• Pentru conversia reciprocă a datelor de tip
raster şi de tip vector se pot utiliza şi relaţii
simple de calcul implementate ca module în
programele de conversie automată.
• Vectorizarea reprezintă un proces de
complexitate mai ridicată şi, în funcţie de
programele utilizate, poate să conducă la
rezultate diferite, mai ales în cazul
reprezentării liniilor. Pe plan conceptual, acest
proces are la bază principii utilizate şi în cazul
scanării, iar modelul obţinut trebuie de multe
ori supus unor postprocesări pentru crearea
topologiei şi atribuirea de identificatori
componentelor cartografice rezultate.
LA VREMURI…
MAI BUNE