Sunteți pe pagina 1din 73

ROMÂNIA

MINISTERUL APĂRĂRII NAŢIONALE


Academia Tehnică Militară
mr. ing. ALEXEI Adrian-Mihai
REZUMAT TEZĂ DE DOCTORAT
TEMA: CONTRIBUŢII PRIVIND CULEGEREA SEMIAUTOMATĂ A
DATELOR CARTOGRAFICE DIGITALE
CONDUCĂTOR ŞTIINŢIFIC:
gl. bg. (r) prof. univ. dr. ing. NIŢU Constantin
- BUCUREŞTI 2005 -
© Academia Tehnică Militară (ATM)
CUPRINS
3
CUPRINS
CUPRINS..............................................................................................................................
....3
1.
INTRODUCERE .................................................................................................................
..5
2. STADIUL ACTUAL PRIVIND EVOLUŢIA
SIG................................................................6
2.1 Evoluţia Sistemelor Informaţionale Geografice.......................................................................
6
2.2 Evoluţia metodelor de culegere a datelor cartografice............................................................
7
3. METODE DE CULEGERE A
DATELOR...........................................................................9
3.1 Tipuri de date
cartografice ........................................................................................................ 9
3.2 Structuri de date în SIG ...........................................................................................................
10
3.2.1 Structuri de date de nivel inferior........................................................................................................ 10
3.2.2 Structuri de date de nivel înalt ............................................................................................................ 11
3.3 Surse de date.............................................................................................................................
12
3.4 Evaluarea preciziei metodelor de digitizare ...........................................................................
13
4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER-
VECTOR .................15
4.1 Algoritmi de vectorizare...........................................................................................................
15
4.1.1 Algoritmi de vectorizare într-un singur pas ........................................................................................ 15
4.1.2 Algoritmi de vectorizare în doi paşi.................................................................................................... 16
4.2 Prelucrări post - vectorizare ....................................................................................................
16
4.3 Algoritm propus pentru vectorizare .......................................................................................
16
4.3.1 Vectorizarea elementelor liniare prin algoritmul propus .................................................................... 17
4.3.2 Vectorizarea elementelor areale prin algoritmul propus ..................................................................... 20
4.4 Analiza performanţelor algoritmilor de vectorizare .............................................................
21
5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR
REPREZENTATE PRIN SEMNE CONVENŢIONALE
PUNCTUALE.............................23
5.1 Segmentarea imaginii ...............................................................................................................
23
5.2 Generarea descriptorilor formei pentru interpretarea automată ........................................
24
5.3 Recunoaşterea semnelor convenţionale punctuale.................................................................
28
5.3.1 Recunoaşterea automată a semnelor convenţionale punctuale pe baza semnăturii formei ................. 28
5.3.2 Recunoaşterea automată a semnelor convenţionale punctuale pe baza descriptorilor Fourier............ 30
5.4 Algoritm propus pentru identificarea semnelor convenţionale punctuale ..........................
32
6. SURSE DE ERORI ÎN
SIG ................................................................................................34
6.1 Precizia hărţilor ........................................................................................................................
34
6.1.1 Eroarea de poziţionare ........................................................................................................................ 34
6.1.2 Eroarea atributelor (datelor tematice) ................................................................................................. 35
6.1.3 Eroarea conceptuală ............................................................................................................................ 35
6.1.4 Eroarea de consistenţă........................................................................................................................ 35
6.2 Surse de erori ............................................................................................................................
36
6.3 Verificarea preciziei datelor spaţiale.......................................................................................
37
6.3.1 Testarea preciziei de poziţie................................................................................................................ 38
6.3.2 Testarea preciziei atributelor............................................................................................................... 44
CUPRINS
4
6.4 Propagarea şi cumularea erorilor în SIG ...............................................................................
46
6.4.1 Propagarea erorilor.............................................................................................................................47
6.4.2 Cumularea erorilor ..............................................................................................................................47
7. STUDII ŞI CERCETĂRI
EXPERIMENTALE................................................................. 48
7.1 Testarea scanerului CONTEX Chameleon TX ........................................................................
49
7.2 Rectificarea imaginii scanate....................................................................................................
50
7.3 Culegerea datelor cartografice cu ajutorul algoritmilor propuşi .........................................
54
7.3.1 Vectorizarea originalului de editare cu relieful ...................................................................................55
7.3.2 Vectorizarea originalului de editare cu hidrografia.............................................................................57
7.3.3 Recunoaşterea semnelor convenţionale prin algoritmul propus..........................................................58
7.4 Editarea / Corectarea datelor culese .......................................................................................
59
7.5 Generarea bazei de date geografice.........................................................................................
60
7.5.1 Proiectarea bazei de date .....................................................................................................................60
7.5.2 Popularea cu atribute a bazei de date geografice.................................................................................61
7.5.3 Propunere de structură de date ............................................................................................................61
7.6 Determinarea preciziei bazei de date ......................................................................................
63
7.7 Software de gestiune a bazelor de date geografice .................................................................
64
8. CONCLUZII
FINALE........................................................................................................ 67
GLOSAR DE
TERMENI........................................................................................................ 73
BIBLIOGRAFIE
SELECTIVĂ.............................................................................................. 75
CAPITOLUL 1. INTRODUCERE
5
1. INTRODUCERE
Sistemele Informaţionale Geografice, prescurtat SIG, sunt văzute de mulţi
ca un caz special de sisteme informatice generale. Informaţia este derivată
din
interpretarea datelor care sunt reprezentări simbolice ale caracteristicilor.
Valorile informaţiilor depind de mai multe elemente, incluzând
temporalitatea,
contextul în care sunt aplicate precum şi costul de colectare, stocare,
prelucrare
şi prezentare. Din costul total de realizare a unui sistem informaţional
geografic,
culegerea datelor reprezintă aproximativ 70 %.
Dispunând de mijloace moderne de calcul, nu se mai pune problema
realizării de documente cartografice analogice, ci aceea de culegere a datelor
în
vederea realizării unor baze de date geografice complexe, cu ajutorul cărora

se redea pe terminale documente text şi grafice, cu soluţii ale problemelor pe
care utilizatorul trebuie să le rezolve.
Datele folosite într-un sistem informaţional geografic pot proveni dintr-o
mare varietate de surse, atât analogice cât şi digitale: cataloage şi tabele de
coordonate, hărţi tipărite sau originale de editare, măsurători în teren,
înregistrări
fotogrammetrice şi de teledetecţie, baze de date cartografice existente etc.
Sursa
primară pentru încărcarea bazei de date a unui SIG o constituie hărţile
topografice existente. Prin urmare, principalul pas în generarea datelor unui
SIG
este procesul de conversie analog-digital.
Lucrarea de faţă abordează mai multe aspecte teoretice şi practice privind
dezvoltarea unor metode şi algoritmi pentru culegerea
automată/semiautomată a
datelor cartografice şi pentru validarea acestora. Pentru rezolvarea acestor
probleme, cercetările autorului au fost orientate pe următoarele direcţii:
- elaborarea unor metode şi algoritmi pentru vectorizarea automată;
- elaborarea unor algoritmi pentru culegerea automată a datelor
reprezentate prin semne convenţionale punctuale;
- elaborarea unor metode pentru testarea preciziei unei baze de date
geografice.
CAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUŢIA SIG
6
2. STADIUL ACTUAL PRIVIND EVOLUŢIA SIG
Ceea ce reprezintă astăzi domeniul SIG are o istorie destul de recentă, ale
cărei începuturi pot fi localizate în jurul anului 1960, odată cu aplicarea
tehnicii
de calcul în realizarea unor hărţi simple. Aceste hărţi puteau fi stocate şi
modificate în calculator şi vizualizate, fie prin afişare pe ecran, fie prin
imprimare pe hârtie.
Conceptul de SIG apare pentru prima dată pe continentul nord-american
(Canada şi Statele Unite), în urmă cu mai bine de 40 de ani. Primul SIG este
cel
dezvoltat de canadieni în anul 1963, în cadrul unei operaţiuni de inventariere
a
resurselor naturale. Realizat la o scară foarte mică şi cunoscând o continuă
perfecţionare de-a lungul anilor, Canada Geographic Information System
(CGIS) se află şi astăzi în funcţiune.
Dezvoltarea sa a adus numeroase contribuţii conceptuale şi tehnice la
evoluţia
generală a sistemelor informaţionale geografice:
- utilizarea scanării materialelor cartografice analogice;
- vectorizarea imaginilor scanate;
- structurarea datelor geografice pe straturi tematice;
- conceptul de tabel de atribute.
Principala problemă pe care încearcă să o rezolve un SIG constă în
realizarea automată a analizelor geografice, utilizând în acest scop
calculatorul
electronic. Un SIG poate furniza răspunsuri la întrebările referitoare la:
- localizare (ce se găseşte la ... ?);
- condiţionare (unde se poate găsi ... ?);
- evoluţie (ce s-a schimbat de la ... ?);
- simulare (ce s-ar întâmpla dacă ... ?).
Pe harta analogică, analizele menţionate mai sus nu pot fi făcute decât de
către om, pe baza unei imagini personale a spaţiului geografic.
Corectitudinea
deciziilor rezultate în urma unei analize geografice depinde atât de calitatea
hărţii disponibile, cât şi de cunoştinţele şi experienţa acumulate, în domeniul
specific studiului efectuat de către persoana care face acea analiză.
2.1 Evoluţia Sistemelor Informaţionale Geografice
Dezvoltarea SIG după 1990 s-a bazat pe trei elemente principale –
dezvoltarea tehnologiei, nevoile utilizatorilor şi ideile creative de dezvoltare
de
noi instrumente de analiză. Respectând evoluţia istorică, o clasificare a
sistemelor informaţionale geografice poate fi:
- a) pachete SIG de "generaţia întâi":
􀂃 1. fără sisteme de fişiere atribut;
􀂃 2. cu sisteme de fişiere "flat";
CAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUŢIA SIG
7
- b) pachete SIG de "generaţia a doua":
􀂃 1. sisteme duale;
􀂃 2. sisteme integrate;
- c) pachete SIG de "generaţia a treia":
􀂃 1. sisteme SGBDR extinse;
􀂃 2. sisteme orientate obiect.
Figura 2-1. Evoluţia Sistemelor Informaţionale Geografice.
În urma unui studiu efectuat în anul 2001 de Daratech Inc. (firmă din
SUA renumită în domeniul studiului de piaţă al produselor IT inginereşti)
reiese
că produsele ESRI şi Intergraph sunt cele mai populare sisteme
informaţionale
geografice la ora actuală.
2.2 Evoluţia metodelor de culegere a datelor cartografice
Calitatea cea mai importantă a unui sistem informaţional geografic este
aceea că poate combina şi analiza diferite tipuri de date obţinute dintr-o
multitudine de surse. Principalele surse de obţinere a datelor geografice sunt:
măsurători geodezice, scanarea şi vectorizarea hărţilor, fotograme aeriene,
înregistrări de teledetecţie, cataloage de coordonate, importul de date de la
alte
programe sau sisteme, alte surse.
Măsurătorile topografice se execută din cele mai vechi timpuri şi au
reprezentat principala sursă de date pentru realizarea hărţilor. În anul 1669 s-
a
CAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUŢIA SIG
8
executat prima triangulaţie pentru realizarea hărţii coastelor Franţei, la
ordinul
regelui Ludovic al XIV-lea.
În anul 1985 a devenit operaţional sistemul GPS. Acest sistem a devenit şi
mai popular după deschiderea care a avut loc în anul 2000, când toţi
utilizatorii
au avut acces la măsurători de precizie, prin eliminarea disponibilităţii
selective
(SA).
O dată cu apariţia primelor sisteme informaţionale geografice comerciale
la începutul anilor ’80, s-au dezvoltat şi au luat amploare noi metode de
culegere
a datelor: digitizarea vectorială a hărţilor şi, odată cu dezvoltarea hardware-
lui,
digitizarea raster. Programele de conversie raster-vector au evoluat foarte
mult
în ultimul timp, o dată cu dezvoltarea inteligenţei artificiale, dar, cu toate
acestea, încă nu s-a putut realiza un sistem complet automat de culegere a
datelor de pe hărţile scanate.
Fotogrammetria oferă metode de culegere a datelor geografice. A apărut
înainte de anul 1900, dar s-a dezvoltat foarte mult prin anii ’60, odată cu
dezvoltarea platformelor aeriene, a camerelor fotogrammetrice şi a
aparatelor de
fotoredresare şi stereorestituţie.
Teledetecţia reprezintă un ansamblu de tehnici care au fost dezvoltate
pentru cercetarea de la distanţă a pământului, şi exploatează faptul că toate
obiectele şi fenomenele pot fi analizate dacă se folosesc senzorii
corespunzători
care înregistrează radiaţia electromagnetică reflectată sau emisă.
Teledetecţia s-a
dezvoltat foarte mult, odată cu disponibilitatea primelor imagini comerciale
la
începutul anilor ’80.
Figura 2-2. Evoluţia metodelor de culegere a datelor geografice.
CAPITOLUL 3. METODE DE CULEGERE A DATELOR
9
3. METODE DE CULEGERE A DATELOR
Doi factori principali influenţează eficienţa unui SIG, cantitatea datelor
stocate în baza de date şi calitatea acestora. Luând ca unitate costul
hardwareului,
atunci costul dezvoltării programelor este 10, iar cel al culegerii datelor,
100 [Guptill, 1988]. Aşadar, o problemă foarte importantă o reprezintă
crearea
bazelor de date geografice digitale, care constituie baza oricărui SIG.
3.1 Tipuri de date cartografice
Datele cartografice reprezintă totalitatea informaţiilor ce descriu semantic,
sintactic şi pragmatic geoimaginea cartografică (dar şi obiectele şi
fenomenele
geosferei) [Niţu, 1992].
Baza de date a unui sistem informaţional geografic este de fapt o harta
digitală, adică o colecţie de date geografice organizate într-o formă care să
facă
posibilă prelucrarea lor de către calculatorul electronic. O entitate geografică
este definită de următoarele elemente [Goodchild, 1991]:
- poziţia (unde se află ?), exprimată prin coordonate.
- atributele (ce este.?), exprimate prin valori numerice,
alfanumerice sau logice (categorie de sol, denumire, înălţime, etc.).
- relaţiile sunt exprimate prin date numerice [Niţu, 1995]. Relaţiile
dintre elementele geosferei sunt naturale, economice, sociale etc. După
numărul
elementelor participante relaţiile pot fi binare, unul la mai mulţi, mai mulţi la
unul şi mai mulţi la mai mulţi. Alte tipuri de relaţii sunt cele geometrice,
topologice, ierarhice etc.
- timpul (când a fost observată entitatea ?) este o componentă
importantă a datei geografice, având în vedere dinamica specifică spaţiului
în
care trăim.
Există două modele principale sub care sunt stocate datele geografice în
baza de date a unui SIG: vectorial şi raster.
În modelul vectorial (figura 3-1), se consideră că orice entitate geografică
poate fi reprezentată ca punct, linie (arc) sau poligon (suprafaţă). Entităţile
geometrice enumerate au ataşate mai multe atribute definite de utilizator,
reprezentând caracteristici ale fenomenelor sau obiectelor reprezentate.
În modelul raster (figura 3-2) este suprapusă o reţea regulată pe spaţiul
datelor continue şi este determinată o medie a celei de a 3-a dimensiuni
(densitatea optică, reflectanţa spectrală, cota, temperatura etc.) pentru
suprafaţa
fiecărei celule (pixel). Această valoare se atribuie centrului celulei şi se
consideră constantă pe întreaga sa suprafaţă.
CAPITOLUL 3. METODE DE CULEGERE A DATELOR
10
Figura 3-1. Reprezentarea vectorială a unei imagini.
Figura 3-2. Reprezentarea raster a unei imagini.
3.2 Structuri de date în SIG
Natura datelor spaţiale determină o mulţime de modele teoretice, fiecare
dintre ele putând fi mai mult sau mai puţin adecvat descrierii unei clase de
fenomene. De pildă, sunt abordate mai multe căi pentru modelarea variaţiilor
în
altitudine a suprafeţei topografice. Ele diferă din punct de vedere al
eficientei, în
funcţie de gradul de accidentare al terenului. Odată ce a fost ales un model
teoretic, este necesară găsirea unei metode eficiente de reprezentare
numerică.
3.2.1 Structuri de date de nivel inferior
Structurile de date de nivel inferior reprezintă implementarea conceptelor
geometrice şi urmăresc eficienţa, atât la stocarea informaţiilor cât şi la
regăsire.
Aceste structuri stau la baza realizării unor structuri complexe de nivel înalt.
Proiectarea eficienta a unei structuri de date presupune separarea structurii
abstracte de implementarea fizică. Structura abstractă a datelor se defineşte
ca o
mulţime compusă din elementele care trebuie stocate, operaţiile care trebuie
aplicate asupra lor, precum şi posibilele condiţionări.
CAPITOLUL 3. METODE DE CULEGERE A DATELOR
11
a) Secvenţiale. Această structură de date este suficientă scopurilor grafice,
dar se dovedeşte insuficientă pentru cea mai mare parte a operaţiilor
nongeometrice
şi pentru toate operaţiile geometrice complexe. Aplicaţii în
cartografie: digitizarea vectorială a elementelor hărţii, schimbul datelor
cartografice între sisteme în format standardizat.
b) Secvenţial indexate: legarea articolelor este explicită prin specificarea
adresei elementului următor.
c) Liste dublu înlănţuite: fiecare articol conţine pe lângă informaţia utilă şi
adresa articolului precedent şi a articolului următor. Acest tip de liste
permite
parcurgerea facilă în ambele sensuri, regăsirea elementelor după anumite
criterii
făcându-se uşor.
d) Liste circular înlănţuite: ultimul articol din listă conţine adresa primului
articol. Acest tip de structură poate fi folosit pentru stocarea elementelor
poligonale.
e) Structura raster grosier: domeniul de definiţie al bazei de date se împarte
în submulţimi (ferestre). Aceasta are avantajul accesului uşor la elementele
dintr-o submulţime. Se creează liste corespunzătoare subdomeniilor definite.
În
lista fiecărui subdomeniu se trec adresele elementelor (fenomenelor) care
trec
prin subdomeniul respectiv.
f) Structura topologică: spaţiul hărţii este egal cu spaţiul topologic. Între
elementele unui graf planar topologic (noduri, arce, poligoane) se pot stabili
relaţiile de frontieră şi cofrontieră. Structura evidenţiază proprietăţile
grafurilor
topologice [Niţu, 2002].
3.2.2 Structuri de date de nivel înalt
În literatura de specialitate, structura de date de nivel înalt mai este
întâlnită sub denumirea de modelul datelor spaţiale. Organizarea datelor
spaţiale
are ca scop optimizarea şi eficientizarea operaţiilor geometrice şi este
dependentă de experienţa observatorului.
Modelul datelor spaţiale formalizează conceptul uman de percepere a
spaţiului, deoarece calculatoarele sunt sisteme formale care utilizează
simboluri
în concordanţă cu nişte reguli stricte.
a) Structura TIN se bazează pe elemente triunghiulare, cu vârfurile în
punctele culese, caracteristicile terenului putând fi incluse cu uşurinţă. În
consecinţă, structurile TIN pot reflecta în mod adecvat densitatea variabilă a
punctelor. Relaţiile topologice trebuie calculate sau înregistrate în mod
explicit.
b) Structuri relaţionale. Conceptele acestei metode de gestiune a datelor au
fost stabilite iniţial de Codd, ca mijloc de descriere a datelor doar pe baza
structurii lor “naturale” şi de asigurare a independenţei programelor de
gestiune.
CAPITOLUL 3. METODE DE CULEGERE A DATELOR
12
În comparaţie cu metodele anterioare, sistemele relaţionale se caracterizează
prin simplitate, datele fiind reprezentate în tabele.
c) Structuri de date orientate pe obiecte. Un obiect poate fi definit că o
entitate care are o stare reprezentată de valorile variabilelor locale (variabile
instanţă) şi un set de operaţii sau metode (metode instanţă) care operează
asupra
obiectului [Somerville, 1989]. Obiectele individuale aparţin unei clase, care
defineşte un tip de obiect. Clasele pot avea variabile care descriu
caracteristici
ale clasei respective, privită că întreg. Fiecare clasă are o superclasă din care
poate moşteni atât variabile instanţă cât şi metode instanţă.
3.3 Surse de date
Datele folosite într-un sistem informaţional geografic provin dintr-o mare
varietate de surse, atât analogice cât şi digitale, dintre care se amintesc:
- cataloage şi tabele de coordonate;
- fişiere, liste de date rezultate din prelucrări;
- baze de date cartografice existente;
- hărţi topografice şi speciale tipărite sau originale de editare ale
acestora;
- jurnale şi carnete electronice de teren;
- înregistrări fotogrammetrice şi de teledetecţie analogice şi
digitale;
- determinări cu receptoare GPS.
Principalele metode de obţinere a datelor cartografice sunt:
a) Introducerea de la tastatură cu un editor de texte sau cu un program
aplicativ. Este o metodă greoaie, care necesită un volum mare de muncă.
b) Importul de date de la alte programe şi sisteme. Este necesar ca
informaţiile
să fie stocate în formate standardizate şi există necesitatea unor programe de
conversie dintr-un format în altul. Sistemele de poziţionare globală (GPS)
sunt o
sursa importantă de date.
c) Digitizarea vectorială a fotogramelor sau ortofotogramelor la un aparat
fotogrammetric. Permite obţinerea unui volum mare de date într-un timp
scurt
cu costuri minime.
d) Digitizarea vectorială a hărţilor existente. Foloseşte ca suport hărţile
tipărite
sau originalele acestor hărţi cu elemente separate pe culori. Această metodă
foloseşte digitizoare vectoriale interfaţate cu procesoare. Practic se
“redesenează” harta dată.
e) Digitizarea raster a fotogramelor sau ortofotogramelor. Foloseşte ca
suport
înregistrările digitale de teledetecţie sau date fotogrammetrice raster obţinute
prin scanarea fotogramelor. Necesită un nou hardware şi programe complexe
de
conversie raster - vector.
CAPITOLUL 3. METODE DE CULEGERE A DATELOR
13
f) Digitizarea raster a hărţilor existente. Este metoda cea mai utilizată
pentru
culegerea datelor cartografice. Suportul îl reprezintă imaginea scanată a
originalului hărţii. Pentru obţinerea datelor prin această metodă este necesar
un
nou hardware (scanner cartografic, calculatoare puternice), sisteme de
gestiune a
datelor, programe de conversie raster - vector.
Metodele de culegere a datelor se clasifică, după Fritsch, în:
- metode primare (culegerea datelor se face direct în teren);
- metode secundare (culegerea din surse analogice şi digitale
existente).
Metodele primare de achiziţie sunt de obicei mai precise şi mai actuale
decât metodele secundare, dar sunt mai scumpe din punct de vedere
economic.
Metodele primare de culegere a datelor de poziţie sunt:
- măsurători cu aparate clasice (teodolit, staţie totală);
- determinări cu receptoare GPS;
- exploatare fotogrammetrică;
- exploatarea înregistrărilor de teledetecţie.
Metodele secundare de culegere a datelor de poziţie sunt:
- digitizarea materialelor cartografice;
- importul unor baze de date digitale deja existente.
Evoluţia sistemelor hardware şi software destinate culegerii de date a fost
deosebit de spectaculoasă în anii '80. Deşi nu s-a ajuns la un sistem integrat,
în
întregime automatizat, avantajele folosirii datelor oferite de fotogrammetria
digitală şi de teledetecţie nu pot fi neglijate. Totuşi sursa primară pentru
încărcarea bazei de date a unui SIG o constituie hărţile topografice existente.
Prin urmare, principalul pas în generarea datelor unui SIG este procesul de
conversie analog-digital [Alexei, 2004c].
Culegerea datelor cartografice digitale se face cel mai simplu folosind ca
sursă hărţile tipărite sau originalele acestor hărţi cu elemente separate pe
culori.
Cele mai simple originale sunt cele ce conţin elementele de relief şi de sol.
Curbele de nivel nu se intersectează între ele şi, ca atare, digitizarea acestora
nu
pune probleme deosebite. Nici caracteristicile asociate fiecărei curbe de
nivel nu
sunt numeroase, principala caracteristică fiind altitudinea sau cota. Pe toate
originalele separate pe culori se pot distinge elemente cartografice
punctuale,
liniare, areale şi inscripţii [Niţu, 1996].
3.4 Evaluarea preciziei metodelor de digitizare
În acest studiu s-a făcut o comparaţie din punct de vedere al eficienţei şi al
preciziei, între metoda de digitizare raster-vector manuală şi cea automată.
S-au
comparat şi rezultatele digitizării automate obţinute cu modulul ArcScan din
ArcMap şi cu programul R2V Conversion Toolkit produs de Algolab.
CAPITOLUL 3. METODE DE CULEGERE A DATELOR
14
Ca date de intrare s-a folosit originalul de editare cu relieful pentru o hartă
topografică cu scara 1: 50.000. Acest original a fost scanat la rezoluţia de
400
dpi în două culori, rezultând un fişier TIF cu dimensiunea de 8.124 Mb.
În etapa de preprocesare s-a corectat geometric imaginea rezultată în urma
scanării, folosind modulul Georeferencing din ArcMap. Rectificarea
imaginii s-a
făcut folosind o transformare afină pe 4 puncte. În cazul imaginilor
cartografice
nu este necesară aplicarea tuturor transformărilor radiometrice din cazul
fotogramei, deoarece imaginea cartografică conţine puţine culori (de obicei
4
sau 8 culori).
Pentru digitizarea raster-vector automată s-a folosit modulul ArcScan din
ArcMap. S-a considerat rezultatul digitizării automate cu acest program
drept
referinţă pentru comparaţia făcută.
Un alt program ce permite digitizarea raster-vector automată este R2V
Conversion Toolkit. Acest program este simplu de folosit şi dedicat
vectorizării.
Permite importul imaginilor raster georeferenţiate în formate consacrate.
Pentru determinarea preciziei digitizării s-a calculat factorul de deformare
DF (vezi subcapitolul 6.3.1, Testarea preciziei de poziţie) pentru digitizarea
raster-vector manuală, şi pentru cea automată realizată cu programul R2V
Conversion Toolkit. S-a considerat ca referinţă rezultatul digitizării automate
efectuate cu ArcMap.
Rezultatele studiului sunt prezentate în tabelul următor.
Tabelul 3-1. Comparaţie între metodele de digitizare.
Metoda de digitizare Timpul necesar
digitizării
Factorul de
deformare DF
Digitizare manuală 12 ore 1.6245
Digitizare automată cu R2V 38 secunde 2.5542
Digitizare automată cu ArcMap 24 secunde -
Ţinând seama de rezultatele obţinute mai sus, se poate concluziona că cea
mai eficientă metodă de digitizare este cea automată realizată cu ArcMap.
Metoda raster-vector manuală, chiar dacă este mai precisă decât metoda
automată efectuată cu R2V, este mare consumatoare de timp şi deci eficienţa
acesteia este foarte mică, ambele încadrându-se în toleranţe.
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
15
4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ
RASTER-VECTOR
Automatizarea interpretării unei hărţi în scopul identificării elementelor
geografice şi a relaţiilor lor este o misiune dificilă ce merge dincolo de
transformarea imaginilor raster cartografice într-o reprezentare vectorială.
Munca de interpretare a hărţilor, cum ar fi detectarea morfologiei terenului,
selectarea elementelor naturale şi artificiale din mediul înconjurător şi
recunoaşterea formelor, necesită procese de abstractizare şi cunoaştere
profundă
a domeniului.
4.1 Algoritmi de vectorizare
Conversia raster – vector constă în analiza unei imagini raster în vederea
transformării acesteia dintr-o reprezentare matricială de pixeli într-o
reprezentare vectorială. Vectorizarea nu trebuie privită ca un întreg,
deoarece
aceasta presupune mai multe etape, atât premergătoare vectorizării, cât şi
post
vectorizare.
Una din problemele principale ale vectorizării este aceea dacă metodele să
aibă sau nu la bază un algoritm de scheletizare. Se poate considera conversia
raster – vector ca o aplicaţie tipică pentru scheletizare. Totuşi, trebuie ţinut
cont
de faptul că deşi o imagine scheletizată este menită să reprezinte fidel forma
binară analizată, aceasta nu asigură întotdeauna cea mai bună precizie pentru
extremităţile liniilor şi pentru intersecţii. Ţinând seama de aceste consideraţii
sau
dezvoltat două clase de algoritmi de vectorizare:
- algoritmi într-un singur pas – algoritmi ce se aplică direct imaginii
primare;
- algoritmi în doi paşi – algoritmi ce au ca etapă preliminară
scheletizarea.
4.1.1 Algoritmi de vectorizare într-un singur pas
Algoritmii de vectorizare într-un singur pas au ca date de intrare imaginea
raster binară neprelucrată, iar ca rezultat imaginea vectorială. Aceşti
algoritmi
sunt mai complecşi, deoarece trebuie să păstreze caracteristicile topologice
(păstrarea intersecţiei, incluziunii etc.), dar nu depind de precizia unei
prelucrări
preliminare (scheletizarea).
Dintre algoritmii de vectorizare într-un singur pas sunt prezentaţi în
lucrare algoritmul de vectorizare “Pixeli rari” – SPV şi algoritmul de
vectorizare
a regiunilor închise.
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
16
4.1.2 Algoritmi de vectorizare în doi paşi
Algoritmii de vectorizare în doi paşi au ca date de intrare o imagine binară
scheletizată (grosimea oricărei linii din imagine este de un pixel). Etapa
premergătoare vectorizării, scheletizarea, conduce la o imagine care nu
pierde
din precizia de poziţionare a elementelor.
Pentru algoritmii de scheletizare există două metode de bază: subţierea
iterativă a imaginii originale până când nu se mai poate îndepărta nici un
pixel
fără să se modifice proprietăţile topologice şi morfologice ale formei, şi
subţierea prin calculul unor distanţe în două treceri succesive.
În timp ce metodele de scheletizare sunt independente de orice informaţie
a priori despre natura desenului, deseori este necesar să se adauge cunoştinţe
contextuale într-un anumit stadiu al procesului.
În lucrare sunt prezentaţi în amănunt doi algoritmi de vectorizare prin
vecinătăţi.
4.2 Prelucrări post - vectorizare
În urma procesului de vectorizare rezultă o serie de vectori cu
coordonatele punctelor ce descriu cât mai fidel imaginea raster binară.
Aceşti
vectori, pentru a putea fi folosiţi ca date de intrare pentru un SIG, trebuie să
suporte două tipuri de prelucrări - cele necesare pentru eliminarea unor erori
de
vectorizare şi prelucrări necesare ajustării formei vectorilor. Prelucrările din
prima categorie nu se pot automatiza în totalitate, operatorul intervenind în
luarea deciziilor cu privire la eliminarea zgomotului, completarea unor
goluri de
vectorizare etc. În a doua categorie de prelucrări se înscriu:
- aproximarea conturului – presupune eliminarea surplusului de
puncte rezultat în urma procesului de vectorizare (de exemplu, un
segment de dreaptă trebuie memorat doar prin punctele de capăt);
- constrângeri impuse conturului (de exemplu, colţurile unei case, în
general, formează unghiuri drepte).
4.3 Algoritm propus pentru vectorizare
Algoritmul propus face parte din categoria algoritmilor într-un singur pas,
dar se poate aplica cu succes şi imaginilor scheletizate, şi poate fi folosit
pentru
vectorizare automată sau interactivă [Alexei, 1997a]. În vectorizarea
interactivă
este nevoie de intervenţia operatorului pentru rezolvarea ambiguităţilor care
apar. În vectorizarea automată, algoritmul parcurge întreaga imagine
analizând
fiecare element liniar sau areal.
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
17
Acest algoritm poate fi folosit pentru conversia raster-vector a
elementelor liniare sau areale din cadrul unei hărţi. Foloseşte ca suport un
fişier
raster binar rezultat în urma scanării originalelor hărţii cu elemente separate
pe
culori. Rezultatele cele mai bune se obţin pentru originalele de editare pentru
hidrografie, vegetaţie şi relief.
4.3.1 Vectorizarea elementelor liniare prin algoritmul propus
Prima etapă presupune determinarea unui capăt al elementului liniar ce
urmează a fi digitizat. Determinarea unui punct de capăt se poate face
automat,
prin parcurgerea imaginii de sus în jos şi de la stânga la dreapta, până se
identifică un pixel de culoare neagră, sau interactiv, prin determinarea
aproximativă a coordonatelor punctului de început cu ajutorul unui locator.
Pentru găsirea unui punct de start, se parcurge imaginea cu un pas
p = 2⋅r , unde r este raza de analiză în jurul punctului curent, până se găseşte
un
grup de pixeli cu valoarea 1 şi se alege centrul de greutate al acestora (figura
4-1).
Figura 4-1. Analiza unei imagini ne scheletizate.
Etapa a II-a constă în urmărirea elementului liniar pe baza metodei
cercului. Această metodă presupune analiza pixelilor aflaţi pe cercul 0 0 C(x ,y
,r),
unde 0 0 x , y sunt coordonatele punctului curent. Raza cercului de analiză se
consideră constantă şi se alege în funcţie de rezoluţia de scanare a
materialului
cartografic şi de densitatea de informaţii de pe acesta. O rază de analiză
mare
determină creşterea vitezei de analiză, dar poate conduce la pierderea unor
informaţii. O valoare mică a razei permite analiza tuturor informaţiilor, dar
duce
la creşterea timpului de analiză. Raza de analiză pentru elemente liniare nu
poate
lua o valoare mai mică decât cea mai groasă linie din imaginea raster.
După o explorare completă în jurul punctului curent 0 0 (x ,y ), pot exista
mai multe situaţii:
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
18
- Se găseşte doar un singur pixel setat pe 1 - în acest caz s-a găsit un nou
punct
al elementului liniar, de coordonate (x, y) . În continuare, punctul curent
devine
(x,y), 0 0 (x =x,y =y) şi se continuă aplicarea metodei cercului (figura 4-2 a).
- Se găsesc doi sau mai mulţi pixeli setaţi pe 1 - în acest caz s-a determinat o
intersecţie de elemente liniare. În această situaţie, explorarea traseului liniar
poate continua pe o direcţie dinainte stabilită sau se poate opri şi programul
cere
utilizatorului să indice direcţia pe care urmează să o exploreze (figura 4-2 b).
Coordonatele punctului de intersecţie se memorează într-o listă, pentru a
putea
reveni în acest punct.
- Nu se găseşte nici un pixel setat pe 1 - în acest caz s-a găsit punctul de
sfârşit
al elementului liniar, şi se încheie analiza (figura 4-2 c).
Figura 4-2. Cazuri de analiză.
În procesul de analiză pot apărea mai multe tipuri de ambiguităţi. Aceste
probleme se pot rezolva prin modificarea razei de analiză. Se pot întâlni
următoarele cazuri:
- Dacă în urma analizei în jurul punctului curent nu se mai găseşte nici un
pixel
setat pe unu, atunci, în mod eronat, algoritmul consideră punctul curent ca
punct
de capăt. Pentru a găsi poziţia exactă a punctului de capăt, raza de analiză se
micşorează iterativ, până când se găseşte un nou pixel setat pe 1, pixel ce
reprezintă poziţia exactă a punctului de capăt. În figura 4-3, în punctul
curent,
raza de analiză s-a micşorat de la valoarea r la valoarea 0 r pentru a găsi
poziţia
exactă.
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
19
Figura 4-3. Determinarea exactă a punctului de capăt.
- Dacă din punctul curent s-au găsit doi sau mai mulţi pixeli setaţi pe unu, în
mod normal punctul curent se consideră nod (intersecţia mai multor drepte).
Pentru determinarea exactă a poziţiei punctului de intersecţie se micşorează
raza
de analiză până la o valoare 0 r când se găseşte un singur pixel setat pe unu
(figura 4-4). Acest pixel dă poziţia exactă a punctului de intersecţie.
Figura 4-4. Determinarea exactă a punctului de intersecţie a mai multor drepte.
- Pentru determinarea exactă a poziţiei punctului de start, pentru metoda
interactivă, se micşorează raza de analiză, iterativ, până la o valoare 0 r când
nu
se mai găseşte nici un pixel setat pe unu (figura 4-5). Atunci, pixelul găsit la
iteraţia precedentă determină poziţia exactă a punctului de start.
Figura 4-5. Determinarea exactă a punctului de start.
- În cazul în care din punctul curent se găsesc doi sau mai mulţi pixeli setaţi
pe
unu, atunci trebuie verificat fiecare dintre aceştia dacă aparţine aceluiaşi
element
liniar. Acest lucru se poate face prin analiza pixelilor de-a lungul
segmentului de
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
20
dreaptă determinat de punctul curent şi punctul nou determinat. Dacă se
găsesc
pixeli setaţi pe zero, atunci punctul analizat nu aparţine aceluiaşi element
liniar
şi, pentru a evita ambiguitatea, se micşorează raza până la o valoare 0 r când
se
găsesc doar pixeli ce aparţin aceluiaşi element liniar (figura 4-6).
Figura 4-6. Elemente liniare foarte apropiate.
Algoritmul propus are capacitatea de a trece peste întreruperile din
elementele liniare dacă acestea sunt mai mici decât distanţa dintre cele mai
apropiate elemente. În caz contrar, pot apărea ambiguităţi care duc la
intervenţia
operatorului (figura 4-7). Această capacitate de a trece peste întreruperi este
utilă
pentru vectorizarea liniilor întrerupte.
Figura 4-7. Trecerea peste golurile din elementele liniare.
4.3.2 Vectorizarea elementelor areale prin algoritmul propus
Prima etapă presupune determinarea unui pixel de pe conturul arealului ce
urmează a fi digitizat. Un pixel de pe contur are proprietatea că nu toţi
pixelii
vecini sunt setaţi pe 1.
Etapa a II-a constă în urmărirea conturului elementului areal. Aceasta se
desfăşoară la fel ca în cazul vectorizării elementelor liniare (situaţia 1), cu
deosebirea că explorarea în jurul pixelului curent se face până când se
găseşte
pixelul situat pe contur (figura 4-8). Urmărirea elementului areal se termină
când
se ajunge în punctul iniţial sau când se iese din cadrul hărţii.
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
21
Figura 4-8. Urmărirea conturului.
Algoritmul propus este uşor de implementat şi oferă viteză de execuţie
bună. Un avantaj este faptul că nu necesită scheletizarea prealabilă a
imaginii ce
urmează a fi digitizată.
În cazul imaginilor nescheletizate, în urma procesului de explorare, se
găsesc grupuri de pixeli vecini de aceeaşi culoare. Pentru a determina
coordonatele axului elementului liniar se determină centrul de greutate al
acestui
grup de pixeli. Procesul de vectorizare decurge ca în cazul imaginilor
scheletizate doar că se va lua în calcul centrul de greutate al grupului de
pixeli
descoperit [Alexei, 2004b].
4.4 Analiza performanţelor algoritmilor de vectorizare
În acest studiu s-a făcut o comparaţie între performanţele următorilor
algoritmi de vectorizare: “Pixeli rari” – SPV; algoritmul de vectorizare prin
8
vecinătăţi; algoritmul de vectorizare prin metoda cercului. Pentru aceasta s-
au
determinat indicii de performanţă propuşi de Liu Wenyin şi Dov Dori. Ca
date
de intrare s-a folosit o imagine raster care reprezintă o porţiune din
originalul de
editare cu relieful pentru o foaie de hartă topografică la scara 1: 50.000.
Pentru a putea determina indicatorii de performanţă ai algoritmilor de
vectorizare s-a transformat imaginea raster într-un grid, fiecărui pixel al
imaginii
corespunzându-i o celulă a gridului. Această transformare ajută la
determinarea
pixelilor găsiţi de algoritmi printr-o interogare spaţială.
Tabelul 4-1. Valori caracteristice pentru algoritmii de vectorizare analizaţi.
Algoritm Pixeli
identificaţi
Pixeli fals
identificaţi
Pixeli
neidentificaţi
Pixeli negri
în imaginea
originală
ArcInfo 23321 80 20138 43459
SPV 1437 13 1636 3073
Prin vecinătăţi 16676 4 26783 43459
Metoda cercului 21788 158 21671 43459
CAPITOLUL 4. CONTRIBUŢII PRIVIND CONVERSIA AUTOMATĂ RASTER - VECTOR
22
După cum se observă în tabelul 4-1, numărul de pixeli negri din imaginea
originală este diferit, deoarece s-a analizat un număr diferit de elemente
liniare.
Tabelul 4-2. Indicatorii de performanţă ai algoritmilor de vectorizare analizaţi.
Algoritm
Rata de detecţie a
pixelilor
p D
Rata de detecţie
falsă a pixelilor
p F
Coeficientul de
detecţie raster
PRI
ArcInfo 0.536 0.0034 0.7663
SPV 0.468 0.0090 0.7295
Prin vecinătăţi 0.384 0.0002 0.6919
Metoda cercului 0.501 0.0072 0.7469
Conform rezultatelor din tabel, algoritmul de vectorizare prin vecinătăţi
are rata de detecţie falsă a pixelilor cea mai mică, deoarece imaginea
originală a
suferit în prealabil o transformare morfologică de erodare, grosimea fiecărui
element liniar fiind de un pixel.
Cu algoritmul propus s-au obţinut rezultate bune şi acesta poate fi folosit
cu succes pentru vectorizarea interactivă sau automată a curbelor de nivel şi
a
hidrografiei. Rata de detecţie falsă a pixelilor poate fi îmbunătăţită prin
micşorarea razei de analiză, aceasta ducând la îndesirea punctelor detectate.
Pentru a putea determina aceşti indici de performanţă ai algoritmilor de
vectorizare s-a realizat un program ce are ca date de intrare gridul
corespunzător
imaginii raster ce urmează a fi vectorizată şi imaginea vectorială rezultată
după
aplicarea fiecărui algoritm.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
23
5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A
DATELOR REPREZENTATE PRIN SEMNE
CONVENŢIONALE PUNCTUALE
Recunoaşterea formelor are ca obiect descrierea şi clasificarea
măsurătorilor preluate din procese fizice sau mentale. Pentru a putea descrie
matematic o formă dată, principalul aspect îl constituie acela de a extrage un
set
de entităţi care caracterizează forma şi care, prin măsurători
corespunzătoare, se
transformă într-un set de valori necesare pentru plasarea entităţii
necunoscute
într-una din cele M clase predefinite (M ≥ 2).
Scopul final al aplicaţiilor de analiză de imagine este extragerea unor
caracteristici importante din imagine, care ajută calculatorul să înţeleagă, să
descrie sau să interpreteze o scenă.
În ultimul timp s-au dezvoltat mai multe metode pentru recunoaşterea
elementelor grafice, dar nici una dintre acestea nu poate fi considerată
perfectă.
Aceste metode pot fi clasificate în:
- metode într-un singur pas – obiectele grafice sunt recunoscute
direct pe imaginea raster;
- metode în doi paşi – mai întâi se converteşte imaginea raster într-o
imagine vectorială primară iar apoi, cu ajutorul unor algoritmi ce
lucrează pe imaginea vectorială, se face recunoaşterea obiectelor
grafice.
În prezent, ambele clase de algoritmi s-au dezvoltat foarte mult.
5.1 Segmentarea imaginii
Scopul segmentării imaginii este de a împărţi o scenă în mai multe zone,
conform unor criterii [Creangă, 1994]. Folosind metodele segmentării
imaginilor, pot fi extrase din scene complexe diverse obiecte de interes care
pot
fi apoi analizate.
Contrastul imaginii joacă un rol important în segmentare. Una dintre cele
mai comune abordări pentru detectarea unor regiuni cu contrast puternic este
detectarea muchiei, adică identificarea unor seturi de puncte care corespund
celor mai pronunţate variaţii ale nivelurilor de gri. O muchie reprezintă
limita
dintre două suprafeţe cu valori ale nivelului de gri diferite.
Segmentarea este o problemă deosebit de dificilă şi succesul (sau
insuccesul) oricărui algoritm depinde foarte mult de calitatea imaginii
originale.
Prin urmare, se obişnuieşte ca segmentarea să se execute iterativ, rezultatele

fie analizate şi îmbunătăţite prin supervizare de către experţi umani.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
24
5.2 Generarea descriptorilor formei pentru interpretarea automată
Conţinutul cartografic este descris prin intermediul unui set de
caracteristici. Aceste caracteristici pot fi distinse pe baza numărului de
argumente pe care le pot lua. Un atribut este o caracteristică ce descrie
proprietatea unui obiect spaţial şi poate fi reprezentat printr-o funcţie unară.
O
relaţie este o caracteristică ce se menţine între două sau mai multe obiecte şi
poate fi reprezentată printr-o funcţie.
Parametrii de formă compun un fel de fişă de identitate a formei
respective, pe baza căreia această formă poate fi recunoscută în mod unic
[Vertan, 1999]. În mod ideal, aceşti parametri trebuie să fie invarianţi la
translaţie, rotaţie şi scalare. Tehnicile de recunoaştere a formelor sau de
clasificare sunt precedate întotdeauna de o etapă de extragere a parametrilor
de
formă (sau a caracteristicilor formei).
Forma unui element liniar O este un atribut geometric şi poate avea
valorile liniar sau curbiliniu. Elementul liniar O, exprimat prin n perechi de
coordonate ( , ) i i x y , este caracterizat de unghiurile de incidenţă i w (figura 5-
1):
1
1
ii
i
ii
w arctgx x
yy
+
+

=

(5.1)
i i1 i dw w w + = − (5.2)

Atributul formă, asociat elementului liniar O, poate lua valoarea


curbiliniu dacă este îndeplinită condiţia
max( )i c dw >τ (5.3)
unde c τ - pragul dat.
Figura 5-1. Reprezentarea unghiurilor de incidenţă.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
25
Distanţa dintre două elemente liniare paralele O şi O’ reprezentate de n,
respectiv m perechi de coordonate, face parte din categoria caracteristicilor
geometrice. Algoritmul calculează mai întâi minh d ca distanţă minimă dintre
al hlea
punct al lui O şi orice punct al lui O’ (figura 5-2). Atunci, distanţa dintre O
şi
O’ se calculează cu relaţia:
min
1
'
h
n
h
OO
d
d
n
==
Σ
(5.4)
Figura 5-2. Calcularea distanţei minime între două elemente liniare paralele.
Semnătura formei este o funcţie scalară de o variabilă, asociată unei forme
plane şi reprezintă distanţa de la centrul de greutate al formei la fiecare punct
de
pe contur. Această distanţă d(θ) poate fi exprimată în funcţie de unghiul la
centru θ , dintre punctul curent de pe contur şi axa orizontală de referinţă,
sau în
funcţie de abscisa curbilinie ρ . Semnătura formei este o reprezentare
reversibilă
– cunoscând semnătura se poate reconstrui obiectul.
Semnăturile sunt caracteristici invariante la translaţie, deoarece se
calculează faţă de centrul de greutate. Invarianţa la factorul de scară se poate
obţine prin determinarea mediei coeficientului de scară dintre distanţa ( ) r d
θ,
corespunzătoare formei de referinţă, şi distanţa ( ) a d θ , corespunzătoare
formei
de analizat. Invarianţa la rotaţie se obţine efectuând o permutare ciclică a
semnăturii.
Figura 5-3. Formă convexă.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
26
0
20
40
60
80
100
120
140
160
180
200
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300 310 320 330 340 350

Figura 5-4. Semnătura formei funcţie de unghiul la centru.


Descriptorii Fourier caracterizează conturul unei forme. Cunoscând
conturul, acesta se poate scrie sub formă complexă (figura 5-5)
u(n)=x(n)+i⋅y(n) (5.5)
unde: x(n) , y(n) reprezintă coordonatele punctului curent;
n – poziţia pixelului de pe contur (n= 0,N−1 unde N reprezintă numărul
total de pixeli ce descriu conturul).
Considerând că funcţia u(n) , ce descrie conturul, este o funcţie continuă
şi periodică, atunci se poate calcula transformata Fourier discretă 1D
12
0

()1()
N i nk
N
n

Ukune
N
−π−⋅
=

= ⋅Σ ⋅ (5.6)
unde U(k) reprezintă setul descriptorilor Fourier.
Descriptorii Fourier sunt caracteristici de formă regenerative [Gavriloaia,
2002]. Numărul descriptorilor necesari pentru reconstrucţia formei iniţiale
depinde de complexitatea acesteia şi de precizia dorită. Funcţia u(n) care
descrie
conturul este
12
0

()()
N i nk
N
k

unUke
−π⋅
=

=Σ ⋅ (5.7)
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
27
Descriptorii Fourier se determină apriori, pentru semnele convenţionale
punctuale, ştiind forma teoretică a acestora.
Figura 5-5. Reprezentarea în spaţiul complex a unui contur.
Cunoscând formula lui Euler şi ţinând seama de relaţia (5.5), atunci relaţia
(5.6) devine:
()
()
1
0
1
0

Re ( ) 1 ( ) cos2 ( ) sin 2
Im ( ) 1 ( ) cos2 ( ) sin 2
N
n
N
n

U k x n nk y n nk
NNN
U k y n nk x n nk
NNN
ππ
ππ

=

=

⎧⎡⎤⎪=⋅⎢⋅+⋅⎥⎪⎣⎦

⎪ = ⋅ ⎡ ⋅ − ⋅ ⎤ ⎩⎪ ⎢⎣ ⎥⎦
Σ
Σ
(5.8)
unde Re(U(k)) reprezintă partea reală iar Im(U(k)) partea imaginară a
numărului complex U(k) .
Anumite transformări geometrice elementare ale unui contur se reflectă în
transformări simple ale descriptorilor Fourier corespondenţi. O sinteză a
acestor
proprietăţi este prezentată în tabelul următor:
Tabelul 5-1. Proprietăţile descriptorilor Fourier.
Transformare Conturul
transformat Descriptorii Fourier
Identitate u'(n) =u(n) U'(k) =U(k)
Translaţie ( ) ( ) 0 u' n = u n + u
U'(0) =U(0) +c
U'(k) =U(k) pentru k ≠ 0
Scalare u'(n) =α ⋅u(n) U'(k) =α ⋅U(k)
Modificarea punctului
iniţial 0 u'(n) =u(n−n ) 0 2
'( ) ( )
in k
NU kUke

=⋅
Rotaţie u'(n) =u(n) ⋅ei⋅φ U'(k) =U(k) ⋅ei⋅φ
0 0

CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN


SEMNE
CONVENŢIONALE PUNCTUALE
28
Aceste proprietăţi ale descriptorilor Fourier pot fi folosite pentru
recunoaşterea formelor unor obiecte cunoscute, indiferent de mărimea şi
orientarea lor.
5.3 Recunoaşterea semnelor convenţionale punctuale
Înzestrarea în avans a unui SIG cu toate cunoştinţele necesare pentru
diferitele domenii de aplicare este imposibilă. Soluţia pentru această
problemă o
reprezintă lărgirea unui SIG cu facilităţi de învăţare. Astfel, un utilizator, de
fiecare dată când doreşte să interogheze o bază de date geografică în legătură
cu
unele obiecte sau fenomene care nu sunt modelate în mod explicit, să poată

instruiască sistemul. Instruirea se bazează pe un set de exemple şi
contraexemple.
În general sunt două clase de metode pentru recunoaşterea formelor,
metode nesupervizate şi metode supervizate. În metodele nesupervizate nu
există seturi de date de antrenament şi nu se cunoaşte exact numărul de
clase. În
clasificarea supervizată, este necesar un set de date pentru antrenament. Pe
baza
acestor date de antrenament, se găseşte o funcţie de clasificare. Odată
determinată această funcţie, se va folosi la clasificarea unor elemente ce nu
au
făcut parte din setul iniţial de antrenament.
5.3.1 Recunoaşterea automată a semnelor convenţionale punctuale pe
baza
semnăturii formei
Pentru recunoaşterea automată a semnelor convenţionale punctuale de pe
originalele de editare separate pe culori, pe baza semnăturii formei, este
necesar
să se realizeze în prealabil o bază de date ce conţine semnătura pentru
fiecare
semn convenţional punctual. Această metodă de recunoaştere face parte din
categoria metodelor supervizate. Etapele necesare identificării unei forme
sunt:
- segmentarea imaginii;
- determinarea conturului formei;
- calculul semnăturii formei analizate;
- compararea semnăturii calculate cu semnăturile din baza de date;
- determinarea coeficientului de corelaţie cu relaţia (5.9);
- forma analizată este similară celei din baza de date dacă se găseşte
un coeficient de corelaţie maxim cât mai apropiat de 1.
Coeficientul de corelaţie este
1
22
11
( )( )
(,)
()()
n
i
rnn
ii
xxyy
CXY
xxyy
=
==

−⋅−
=
−⋅−
Σ
ΣΣ
(5.9)
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
29
unde: - x - semnătura formei de analizat (vector);
- x - valoarea medie a vectorului x ;
- y - semnătura formei din baza de date;
- y - valoarea medie a vectorului y .
Figura 5-6. Forme de analizat.
Semnătura pentru fiecare formă din figura 5-6 s-a determinat, automat pe
cale analitică, cu ajutorul unui program propriu realizat în limbajul Delphi 7.
Linia poligonală ce defineşte conturul s-a intersectat analitic, succesiv, cu o
dreaptă. Am considerat pasul unghiului de orientare de 5􀁄 . O valoare a
pasului
prea mică, surprinde toate detaliile formei, dar generează o semnătură
influenţată într-o măsură mai mare de zgomot, pe când o valoare mai mare
determină o semnătură mai puţin influenţată de zgomot, dar nu surprinde
toate
detaliile formei. Valoarea optimă a pasului unghiului de orientare,
determinată
empiric, este cuprinsă între valorile de 1􀁄 şi 5􀁄 .
Figura 5-7. Identificarea unei forme rotite şi micşorată.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
30
În figura 5-7 este prezentat cazul general de identificare a unei forme cu
orientare şi scară diferită de ale formei de referinţă. Pentru a putea identifica
forma de analizat, se determină coeficienţii de corelaţie pentru translaţii
succesive ale formei de analizat de-a lungul axei θ . Poziţia pe axa θ în care
se
obţine un coeficient de corelaţie maxim, mai mare decât un prag prestabilit,

orientarea formei de analizat faţă de cea de referinţă.
5.3.2 Recunoaşterea automată a semnelor convenţionale punctuale pe
baza
descriptorilor Fourier
Această metodă de recunoaştere de forme face parte din categoria
metodelor supervizate, fiind necesară cunoaşterea apriori a seturilor de
descriptori Fourier pentru semnele convenţionale punctuale ce urmează a fi
identificate pe originalele de editare separate pe culori.
Dacă se consideră seturile de descriptori Fourier U1(k) şi U2(k)
corespunzătoare contururilor diferite u1(n) respectiv u2(n), atunci forma
acestor
contururi este similară dacă
0
000
1212
000,,,000
( , , , ) min ( ) ( ) 0
N
i
unn
d u n u n u n n e φu
αφ
αφα


=
⎧⎫
= ⎨ − ⋅ − ⋅ − ⎬→
⎩⎭
Σ (5.10)
Un exemplu practic este cel prezentat în figura 5-8, în care se face o
recunoaştere pe baza descriptorilor Fourier a semnului convenţional
punctual
“Locuri de aterizare”.
Figura 5-8. Analiza unui semn convenţional punctual pe baza descriptorilor Fourier.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
31
În figura 5-8, semnul convenţional punctual de referinţă este reprezentat
prin culoarea roşie şi pe baza descriptorilor săi Fourier se determină
translaţia,
scara, rotaţia şi punctul de referinţă pentru celelalte simboluri.
Fie referinţă f şi analizat f transformatele Fourier ale simbolului punctual de
referinţă, respectiv a celui de analizat. Pentru determinarea translaţiei se
folosesc
formulele
Re( ) Re( )
Im( ) Im( )
x analizat referinţă
y analizat referinţă
dff
dff
= − ⎧⎨
⎩=−
(5.11)
unde Re( f ) reprezintă partea reală a numărului complex f , iar Im( f ) partea
imaginară.
Aplicând formula (5.11) pentru o imagine doar translatată, vectorii x d şi
y d au primul element translaţia pe axa X, respectiv translaţia pe axa Y, iar
restul
elementelor 0.
Pentru determinarea scării între imaginea de referinţă şi imaginea de
analizat se folosesc formulele (5.12). Vectorii x scara şi y scara au toate
elementele egale cu scara pe axa X, respectiv cu scara pe axa Y
Re( )
Re( )
Im( )
Im( )
analizat
x
referinţă
analizat
y
referinţă
scara f
f
scara f
f
⎧ = ⎪⎪⎨⎪
=
⎪⎩
(5.12)
Pentru determinarea unghiului de rotaţie dintre imaginea de referinţă şi
imaginea de analizat, se foloseşte formula
22
Re( )Re( ) Im( )Im( )
arccos
Re( ) Im( )
analizat referinţă analizat referinţă
referinţă referinţă
ffff
ff
φ
⋅+⋅
=
+
(5.13)
Fiecare element al vectorului φ , cu excepţia primului element, conţine
unghiul de rotaţie exprimat în radiani.
Indicele punctului de start pentru forma de analizat se determină cu
formula
0
()
i2

n lungime
i
φ
φ
π
=⋅
⋅⋅
(5.14)
unde i
φ este elementul i al vectorului φ dat de relaţia (5.13).
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
32
01
001
110
01
000
101
5.4 Algoritm propus pentru identificarea semnelor convenţionale
punctuale
Acest algoritm este o metodă simplă de recunoaştere a formei semnelor
convenţionale punctuale cu orientare normală, bazat pe corelaţia dintre
imaginea
teoretică a semnului convenţional şi imaginea practică rezultată în urma
scanării.
Fie f(x,y) imaginea teoretică a semnului convenţional punctual şi g(x,y)
imaginea obţinută în urma procesului de scanare. Teoretic, ar trebui să aibă
loc
relaţia
f AND g = f (5.15)
Tabelul de adevăr al funcţiei logice AND este
Relaţia (5.15) are loc doar în cazul ideal, însă din cauza erorilor de
scanare şi a calităţii materialului cartografic, aceasta devine:
f AND g = f ‘ (5.16)
unde f’ ≠ f .
Pentru a determina dacă imaginile f şi g sunt în corelaţie, se aplică
următorul algoritm:
1) Se determină deosebirile dintre imaginea teoretică a semnului
convenţional
punctual şi imaginea sa rezultată în urma procesului de scanare printr-o
operaţie
logică XOR (sau exclusiv)
f XOR g = h (5.17)
unde h reprezintă imaginea cu deosebirile între f şi g.
Tabelul de adevăr al funcţiei logice XOR este
2) Ţinând seama de relaţia (5.17), se determină numărul de pixeli în plus
(pP),
respectiv cei lipsă (pM), aplicând relaţiile
1
2
h AND g h
h AND f h
= ⎧⎨
⎩=
(5.18)
unde : - h1 reprezintă imaginea cu pixelii în plus;
- h2 reprezintă imaginea cu pixelii lipsă.
CAPITOLUL 5. CONTRIBUŢII PRIVIND CULEGEREA AUTOMATĂ A DATELOR REPREZENTATE PRIN
SEMNE
CONVENŢIONALE PUNCTUALE
33
Dacă numărul pixelilor pP din imaginea h1, respectiv pM din imaginea h2
este mai mic decât o valoare de prag ε, atunci imaginea g este imaginea
influenţată de zgomot a semnului convenţional punctual a cărei reprezentare
raster este imaginea f. Pragul ε se alege experimental, în funcţie de rezoluţia
la
care a fost scanată imaginea şi de mărimea zgomotului, astfel încât să nu
existe
ambiguităţi.
Figura 5-9. Semne convenţionale punctuale.
Imaginea din figura 5-9 a fost analizată cu algoritmul propus, toate
semnele convenţionale fiind recunoscute. Programul RecSCP care
implementează acest algoritm determină codul, respectiv punctul legat al
fiecărui semn convenţional punctual identificat.
După identificarea semnului convenţional punctual programul scrie în
baza de date cartografică coordonatele punctului legat corespunzător
simbolului
şi codul acestuia. Se poate determina şi orientarea diferitelor semne
convenţionale punctuale prin construcţia unor imagini ideale ale acestora,
pentru
diferite unghiuri de rotaţie.
Algoritmul de recunoaştere automată a formei semnelor convenţionale
punctuale este uşor de implementat, iar viteza de analiză pentru o clasă de
obiecte este independentă de gradul de încărcare al imaginii [Alexei, 2004d].
Pentru a mări viteza, se poate adopta soluţia de a se indica cu ajutorul unui
locator coordonatele aproximative ale elementului, iar algoritmul găseşte
coordonatele precise şi codul asociat.
Este necesar să se realizeze o bază de date care conţine reprezentarea
matricială a semnelor convenţionale punctuale, codul fiecărui semn şi
descrierea
acestuia. În baza de date sunt memoraţi şi parametrii de recunoaştere pP,
respectiv pM, determinaţi experimental pentru fiecare semn convenţional
punctual în parte.
Baza de date cu simboluri permite adăugarea unor noi semne
convenţionale punctuale, precum şi actualizarea celor existente. De
asemenea,
este utilă stocarea formei simbolurilor pentru diferite rezoluţii şi unghiuri de
rotaţie (unde este cazul) pentru a mări viteza de analiză.
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
34
6. SURSE DE ERORI ÎN SIG
Harta este un model bidimensional, la scară, a unei părţi din suprafaţa
pământului. Hărţile reprezintă mijloace eficiente de prezentare (în general cu
ajutorul unor simboluri) a unei cantităţi mari de informaţii despre obiecte,
fenomene şi despre relaţiile dintre acestea.
6.1 Precizia hărţilor
Precizia hărţilor a fost analizată şi definită în mod diferit. Precizia se
referă la corectitudinea relativă a poziţiei obiectelor pe o hartă faţă de poziţia
lor
reală pe suprafaţa pământului. Precizia absolută se referă la nivelul de
exactitate
a poziţiei obiectului.
Precizia absolută este dată de eroarea estimată pentru un singur punct,
relativ la un sistem de referinţă spaţial (Krasovski, WGS84 etc.).
Precizia relativă este dată de eroarea estimată pentru o distanţă între două
puncte, sau precizia unui punct în comparaţie cu alt punct. Dacă erorile a
două
puncte nu sunt corelate, eroarea relativă este eroarea medie pătratică a
erorilor
absolute ale punctelor.
Precizia unei hărţi digitale nu depinde de scara de afişare. Ea depinde de
precizia datelor originale utilizate, de algoritmii de prelucrare şi de rezoluţia
la
care este tipărită sau afişată harta. În cazul digitizării unei hărţi analogice,
rezultatul digitizării nu poate fi mai precis decât sursele originale [Alexei,
2004a].
În alcătuirea hărţilor digitale intervin patru tipuri de erori:
- eroarea de poziţie;
- eroarea atributelor (datelor tematice);
- eroarea conceptuală;
- eroarea de consistenţă.
6.1.1 Eroarea de poziţionare
Eroarea de poziţionare reprezintă deplasarea unui obiect pe hartă faţă de
poziţia sa reală din teren. În instrucţiunile de realizare a hărţilor topografice
se
specifică o precizie planimetrică a detaliilor de 0,4 mm la scara hărţii cu un
nivel
de încredere (1−α )=95% (probabilitatea de 0,95). Această precizie pentru
harta 1:25.000 reprezintă 10 m în teren.
Pentru estimarea preciziei, se foloseşte eroarea medie pătratică - relaţia
(6.1). Precizia se raportează ca o valoare în metri, cu un nivel de încredere
de
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
35
95%, ceea ce înseamnă că 95% din elementele bazei de date au o poziţie ce
respectă precizia raportată.
( )2
1
n
ic
i
VV
n
σ=

=
Σ
(6.1)
unde: Vi - valorile măsurate;
Vc - valorile adevărate a lui i V ;
n - numărul de măsurători.
6.1.2 Eroarea atributelor (datelor tematice)
În timp ce poziţia elementelor nu se modifică în timp, atributele se pot
schimba frecvent. Precizia atributelor se analizează în diferite moduri în
funcţie
de natura datelor:
- pentru valori continue ale atributelor, precizia este exprimată ca
eroare de măsurare (evaluarea preciziei se face prin metode
asemănătoare determinării preciziei de poziţionare);
- pentru valori discrete ale atributelor, precizia este exprimată ca
eroare de clasificare. Evaluarea preciziei de clasificare este
influenţată de numărul de clase definite în baza de date.
6.1.3 Eroarea conceptuală
Eroarea conceptuală se referă la erorile de omitere a informaţiilor din baza
de date şi este definită de gradul de generalizare şi abstractizare (omiterea
selectivă). Cea mai generalizată bază de date poate fi considerată completă
dacă
conţine toate obiectele descrise în specificaţii. Precizia conceptuală dă o
informaţie utilizatorului despre volumul disponibil de date spaţiale,
temporale şi
tematice.
Eroarea conceptuală este influenţată de scară, generalizarea elementelor
bazei de date şi regulile de selecţie a elementelor şi fenomenelor care sunt
stocate în baza de date.
6.1.4 Eroarea de consistenţă
Eroarea de consistenţă se referă la contradicţiile aparente dintr-o bază de
date geografică. Precizia de consistenţă reprezintă o măsură a validităţii
interne a
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
36
bazei de date. Se pot distinge mai multe tipuri de consistenţă a bazei de date:
- consistenţa spaţială se referă la respectarea regulilor topologice
(de exemplu graniţa comună a două poligoane trebuie să
coincidă);
- consistenţa temporală reprezintă faptul că, într-un punct, la un
moment dat, nu poate exista decât un singur eveniment;
- consistenţa tematică (a atributelor) se referă la lipsa contradicţiilor
din datele tematice (stocând date despre numărul de locuitori,
suprafaţa localităţilor şi densitatea populaţiei, pot apărea erori
datorită redundanţei informaţiilor; redundanţa atributelor este o
cale pentru asigurarea consistenţei bazei de date);
- consistenţa logică se referă atât la aspecte topologice, cât şi la
validitatea domeniului de definiţie al datelor stocate în bazele de
date.
6.2 Surse de erori
Spre deosebire de geodezie, cartografie şi fotogrammetrie, până în ultimii
ani s-a acordat o importanţă mai mică preciziei datelor SIG. Se ştie că datele
conţin erori sistematice şi erori aleatoare, dar nu s-a accentuat asupra felului
cum procedurile şi soluţiile SIG ţin seama de aceste erori. O bună tratare a
acestei probleme permite alegerea celor mai bune surse de date, alegerea
celor
mai corecte metode de culegere a datelor şi alegerea celor mai corecte
proceduri
de prelucrare şi de realizare a produselor finale. În SIG sunt combinate mai
multe tipuri de date din mai multe surse.
În funcţie de sursele erorilor, acestea se clasifică astfel:
1. erori datorate surselor de date:
- erori datorate aparatelor de culegere a datelor;
- erori datorate materialelor cartografice:
􀂃 vechimea datelor;
􀂃 imprimarea (tipărirea);
􀂃 deformarea materialului cartografic;
􀂃 scara hărţii;
􀂃 tipul proiecţiei;
􀂃 generalizarea şi clasificarea cartografică;
- erori datorate schimbărilor fizico-geografice ale mediului;
- erori datorate definirii graniţelor;
2. erori datorate introducerii datelor:
- erori datorate digitizării;
- erori datorate scanării;
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
37
- erori datorate operatorului;
3. erori datorate metodelor şi algoritmilor de prelucrare:
- erori numerice;
- erori date de densitatea datelor;
- erori datorate combinării datelor;
- erori datorate interpretării cartografice;
- erori datorate conversiilor;
- erori de prelucrare propriu-zisă (generarea topologiei,
georeferenţiere etc.).
6.3 Verificarea preciziei datelor spaţiale
Toate sursele de date şi metodele de introducere a datelor spaţiale prezintă
erori. Tipul, mărimea şi implicaţiile acestor erori inerente într-o bază de date
a
unui sistem informaţional determină precizia datelor spaţiale. Este imposibil

se elimine complet erorile datelor spaţiale, dar utilizatorii SIG pot reduce şi
administra în mod eficient erorile, îmbunătăţind astfel precizia datelor.
Identificarea şi evaluarea erorilor nu sunt singurii factori care determină
precizia datelor. Precizia datelor include toate procesele implicate în crearea,
dezvoltarea, utilizarea şi actualizarea bazei de date spaţiale.
Verificarea preciziei datelor spaţiale este esenţială pentru schimbul şi
integrarea datelor. Datele geografice şi non-geografice trebuie verificate în
scopul asigurării preciziei impuse bazei de date a SIG. Măsurătorile calităţii
datelor verifică precizia de poziţie, a atributelor, conceptuală şi cea de
consistenţă.
Testarea calităţii datelor se poate face prin metode manuale sau automate.
Metodele de verificare manuală includ imprimări de control, măsurători în
teren şi teste statistice. Imprimarea de control presupune trasarea datelor
geografice la aceeaşi scară ca materialul cartografic sursă. După imprimarea
hărţii digitale, aceasta se suprapune peste harta sursă şi se verifică atât
poziţia
elementelor, cât şi inscripţiile şi simbolistica caracteristicilor. Deşi această
metodă este rapidă şi puţin costisitoare, este de preferat verificarea prin
măsurători în teren.
Metodele de verificare automată caută incompatibilităţile logice şi valorile
atributelor care nu respectă domeniul de definiţie. Incompatibilităţile logice
se
determină prin verificarea topologiei (de exemplu, un strat de poligoane
trebuie
să conţină doar poligoane închise). Pentru verificarea atributelor este necesar

se cunoască modul de clasificare a acestora. Este greu de obţinut un consens
din
partea comunităţii SIG pentru dezvoltarea de standarde care să clasifice
datele
spaţiale. Acest fapt depinde de necesităţile utilizatorului.
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
38
Metodele automate se pot executa de către majoritatea pachetelor de
programe SIG (ArcInfo, MapInfo, AutoCAD Map etc.). Aceste metode sunt
rapide, dar rezultatele sunt mai puţin exacte decât în cazul metodelor
manuale.
Precizia datelor trebuie păstrată în toate stadiile realizării unei baze de
date SIG, mai ales în timpul culegerii şi actualizării. Orice tip de prelucrare
asupra datelor afectează precizia acestora.
6.3.1 Testarea preciziei de poziţie
Precizia de poziţie se testează prin compararea coordonatelor unor puncte
de control din baza de date cu coordonatele aceloraşi puncte extrase din
surse
independente, de înaltă precizie, cum ar fi:
- hărţi la scări mai mari;
- măsurători în teren cu ajutorul receptoarelor GPS;
- înregistrări satelitare şi fotogrammetrice.
Minim 20 de puncte de control trebuie testate, distribuţia acestora
acoperind zona de interes. Testarea a 20 de puncte cu un nivel de încredere
de
95% înseamnă că doar un singur punct dintre acestea poate să aibă precizia
mai
slabă decât specificaţiile impuse. Punctele de control trebuie să fie mai dense
în
vecinătatea elementelor importante [Serediuc, 1997].
a) Precizia planimetrică.
Eroarea medie pătratică pe cele două axe se determină cu relaţiile
2
,,
1
()
n
date i control i
i
x
xx
n
σ=

=
Σ
(6.2)
2
,,
1
()
n
date i control i
i
y
yy
n
σ=

=
Σ
(6.3)
unde: - xdate,i , ydate,i - coordonatele punctelor de control din baza de date;
-xcontrol,i , ycontrol,i - coordonatele punctelor de control din surse
independente de precizie mare;
- n - numărul de puncte de control.
Eroarea planimetrică a unui punct Pi este definită de relaţia
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
39
( )2( )2
xdate,i−xcontrol,i +ydate,i −ycontrol,i (6.4)
Eroarea medie pătratică în plan este dată de formula

(( ) ( ) )
,,,,
2 2

122
n
date i control i date i control i
i
rxy
xxyy
n
σ =σ σ
−+−
==+
Σ
(6.5)
Dacă x y σ =σ atunci relaţia (6.5) devine
σr= 2⋅σx2= 2⋅σy2=1.4142⋅σx=1.4142⋅σy (6.6)
Relaţiile (6.2)÷(6.6) sunt valabile dacă se consideră că au fost eliminate
erorile sistematice. Dacă erorile au o distribuţie normală şi componentele
acestora pe cele două axe de coordonate sunt independente, atunci se poate
folosi valoarea 2.4477 pentru calculul preciziei planimetrice cu un coeficient
de
încredere de 95% [Greenwalt, 1968]
Pr 2.4477 2.4477 2.4477
1.4142
r
eciziar x y σ
σσ

=⋅=⋅=
Preciziar=1.7308⋅σr (6.7)
Dacă σ x ≠σ y şi dacă raportul min max σ σ are valori între 0.6 şi 1 (unde
min σ este valoarea minimă dintre σ x şi σ y , şi max σ valoarea maximă) atunci
eroarea planimetrică cu un coeficient de încredere de 39.35% poate fi
( )
aproximată cu 0.5⋅ σ x +σ y [Greenwalt, 1968]. Dacă eroarea respectă
distribuţia normală şi componentele sale pe cele două axe sunt independente,
atunci precizia planimetrică se calculează cu formula
(
Pr eciziar􀀑 2.4477⋅0.5⋅ σx+σ y (6.8) )
b) Precizia altimetrică.
Eroarea medie pătratică pe axa z se determină cu relaţia
( )2
,,
1
n
date i control i
i
z
zz
n
σ=

=
Σ
(6.9)
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
40
unde: - zdate,i - coordonata z a punctelor de control din baza de date;
- zcontrol,i - coordonata z punctelor de control din surse independente cu
precizie mare;
- n - numărul de puncte de control.
Relaţia (6.9) este valabilă dacă se consideră că au fost eliminate erorile
sistematice. Dacă eroarea altimetrică respectă distribuţia normală, factorul
1.9600 este folosit pentru calculul preciziei pe verticală cu coeficientul de
încredere de 95% [Greenwalt, 1968]:
Pr eciziaz=1.9600⋅σz (6.10)
Coeficientul de încredere de 90% a fost folosit în vechiul Standard de
precizie pentru hărţi din SUA, actual se foloseşte coeficientul de 95%.
Coeficientul de încredere de 50% este utilizat în unele aplicaţii militare. La
noi
în ţară se foloseşte standardul de precizie cu coeficientul de încredere de
95%.
Indicatori de precizie pentru elemente liniare
Precizia geometrică a unui element liniar poate fi descompusă în două
componente:
- precizia de poziţie a punctelor (în general se face o analiză a
preciziei pentru punctele de capăt ale elementului liniar);
- fidelitatea formei (aceasta se analizează în raport cu elementul
liniar corespondent obţinut din surse cu precizie ridicată).
Factorul fuzzy (FF). Se construieşte un cerc de rază r în nodul de capăt al
elementului de verificat şi cercul de rază r corespondent în nodul de capăt al
elementului de referinţă (vezi figura 6-1). Factorul fuzzy se determină cu
formula
2
comună FF S
πr
=

(6.11)
unde:
22
22
24
s
comună s

S r R r R ⎛θ ⋅ ⎞
= ⋅⎜⎜ − ⋅ − ⎟⎟
⎝⎠
(6.12)
arccos
22
sR

r
θ
=

(6.13)
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
41
Figura 6-1. Determinarea factorului FF.
Ţinând seama de relaţiile (6.12) şi (6.13) relaţia (6.11) devine
2
2
2
1arccos 2
24
FF Rs Rs r Rs
πrπr

=⋅−⋅−
⋅⋅
(6.14)
unde: s R - distanţa dintre nodurile de capăt corespondente;
r – raza cercului de analiză (se poate considera precizia hărţii).
Figura 6-2. Determinarea suprafeţei comune.
Factorul FF poate lua valori între 0 şi 1 (0 – cazul cel mai defavorabil, 1 –
punctele coincid).
Factorul de deformare (DF). Acest factor dă o informaţie despre gradul
de fidelitate al formei elementului liniar verificat. Se consideră elementele
B0Bn
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
42
şi A0An de lungime 1. Fie i B un punct al elementului B0Bn şi corespondentul
său Ai aparţinând elementului de referinţă A0An , astfel încât
00
00
ii
nn
AA BB
AA BB
= unde i∈(0,n) (6.15)
Ai−1Ai AiAi+1 = respectiv Bi−1Bi BiBi+1 = (6.16)
Figura 6-3. Factorul de deformare.
Factorul de deformare se calculează cu formula
22
00
11
nn
ii
xy
DF
nn
==
⎛Δ⎞⎛Δ⎞⎜⎟⎜⎟
= ⎜ ⎟ +⎜ ⎟
⎜+⎟⎜+⎟⎜⎟⎜⎟
⎝⎠⎝⎠
ΣΣ
(6.17)
Dacă cele două elemente liniare se suprapun, atunci factorul de deformare
este zero.
Factorul de generalizare (GF) dă o informaţie globală despre forma
elementului liniar. Factorul de generalizare se calculează cu formula:
( ' ')
()
GF lungime A B
lungime AB
= (6.18)
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
43
Figura 6-4. Factorul de generalizare.
Factorul de deplasare (BF). Acest factor dă o informaţie despre forma
elementului liniar. Se calculează suma deplasărilor spre dreapta şi suma
deplasărilor spre stânga (figura 6-5).
Figura 6-5. Factorul de deplasare.
Dacă ΣdSi = 0 şi 0 dDi Σ = nu există deplasare.
Dacă 0 dSi Σ = şi 0 dDi Σ ≠ există deplasare în dreapta.
Dacă 0 dSi Σ ≠ şi 0 dDi Σ = există deplasare în stânga.
Dacă 0 dSi Σ ≠ şi 0 dDi Σ ≠ atunci i
i
S
D
d
BF
d

Σ (6.19)
Măsurarea preciziei de poziţionare pentru un element liniar (metoda
buffer-ului). Metoda face o comparaţie automată a elementului de interes cu
elementul corespondent din surse de precizie înaltă, estimând procentul din
lungimea totală a segmentului care respectă precizia impusă. Această
metodă are
următoarele avantaje:
- are la bază metode statistice;
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
44
- este invariantă la mărimea erorilor;
- nu necesită găsirea unor vertexuri corespondente între cele două
elemente.
În figura 6-6 este prezentat un exemplu de analiză pentru o porţiune dintrun
drum. Se construieşte un buffer de dimensiune x (precizia impusă) în jurul
elementului liniar de referinţă şi se determină lungimea elementului de testat
ce
se află în buffer printr-o simplă operaţie de intersecţie.
Figura 6-6. Verificarea preciziei de poziţionare prin metoda buffer-ului.
Fie AA’ elementul liniar de analizat şi BB’ elementul liniar de referinţă,
atunci corectitudinea elementului AA’ este dată de formula (6.20).
QBB' - buffer-ul elementului liniar BB’
( ') 100 ( ' ')%
( ')
Corectitudinea AA lungimea AA QBB
lungimea AA

= ⋅ (6.20)
6.3.2 Testarea preciziei atributelor
O măsură a preciziei de clasificare este coeficientul Kappa (K) a lui
Cohen [Niţu, 2002]. Pentru o zonă dată, se construieşte o matrice n x n
elemente,
unde n reprezintă numărul de clase ale SIG. Pentru completarea matricei se
parcurg următorii paşi:
- se alege un număr de detalii la întâmplare;
- se determină clasa din care fac parte conform bazei de date SIG;
- se determină clasa prin verificare la teren;
- se completează matricea R.
Ideal, toate elementele din baza de date fiind clasificate corect, se va
completa doar diagonala principală a matricei.
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
45
O eroare de omitere apare atunci când un detaliu din teren este înregistrat
în baza de date incorect. Numărul de elemente aparţinând clasei X
înregistrate
incorect se determină, folosind matricea R, prin însumarea elementelor
coloanei
corespunzătoare clasei X, mai puţin elementul de pe diagonala principală.
O eroare de înregistrare în plus apare atunci când un element înregistrat în
baza de date a SIG nu are corespondent la teren. Numărul de elemente
înregistrate în plus pentru clasa Y se determină prin însumarea elementelor
de pe
linia corespunzătoare clasei Y, mai puţin elementul de pe diagonala
principală.
Coeficientul Kappa se determină cu formula
()
()
dq
K
Nq

=

(6.21)
unde: - d reprezintă suma elementelor de pe diagonala principală;
- N reprezintă suma tuturor elementelor matricei;
- q reprezintă valoarea scontată pentru fiecare element al diagonalei
principale şi se calculează cu formula (6.22).
i,j j,i
jj
i
rr
q
N
⎛⎞⎛⎞
⎜ ⎟⋅⎜ ⎟
=⎝ ⎠ ⎝ ⎠
ΣΣ
(6.22)
unde r este un element al matricei R.
Fie matricea R din tabelul 6-1 corespunzătoare claselor din figura 6-7.
Tabelul 6-1. Matricea R corespunzătoare claselor analizate.
Pădure Localităţi Lacuri Total Eroarea de
utilizare
Pădure 6 2 1 9 6/9=67%
Localităţi 0 7 0 7 7/7=100%
Lacuri 0 2 3 5 3/5=60%
Total 6 11 4 21
Eroarea de
producere 6/6=100% 7/11=64% 3/4=75%
Precizia globală (pG) se calculează prin raportul dintre suma elementelor
clasificate corect (valorile elementelor diagonalei principale) şi numărul
total de
elemente (suma tuturor elementelor matricei)
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
46
,
,
6 7 3 0.76
21
ii
i
G
ji
ji
r
p
r
++
===
Σ
ΣΣ (6.23)
unde: rj,i - element al matricei R.
Figura 6-7. Clasificarea elementelor.
Precizia de utilizare ( ) u p reprezintă probabilitatea ca un element clasificat
într-o categorie din baza de date a SIG să aibă corespondent la teren.
Această
precizie se calculează prin raportul dintre valoarea elementului din diagonala
principală a matricei R şi suma elementelor din coloana corespunzătoare
,
,
i
ii
u
ij
j
r
p
r
=
Σ (6.24)
Precizia de producere ( pp ) reprezintă raportul dintre numărul de
elemente dintr-o clasă clasificate corect şi numărul total de elemente din
clasa
respectivă
,
,
i
ii
p
ji
j
r
p
r
=
Σ (6.25)
Este de aşteptat ca precizia atributelor să varieze în cadrul unei hărţi în
format digital, de aceea este util să se determine o variaţie spaţială a
probabilităţii de clasificare, nu doar o statistică sumară.
6.4 Propagarea şi cumularea erorilor în SIG
De obicei, un sistem informaţional geografic conţine mai multe seturi de
date care sunt combinate, comparate şi analizate. Este puţin probabil ca
informaţiile conţinute în fiecare strat să aibă aceeaşi precizie.
CAPITOLUL 6. SURSE DE ERORI ÎN SIG
47
Fie f modelul matematic de combinare a două seturi de date a şi b.
Eroarea Δf a funcţiei f este afectată de erorile setului a, respectiv b.
Considerând
că cele două seturi de date sunt independente şi afectate doar de erori
aleatoare,
eroarea funcţiei f se calculează cu formula
22
22
fab
ff
ab
σσσ
⎛∂ ⎞ ⎛∂ ⎞ = ⎜ ⎟ ⋅ +⎜ ⎟ ⋅ ⎝∂ ⎠ ⎝∂ ⎠
(6.26)
unde: ∂f - eroarea standard a funcţiei f;
σa,σb - deviaţiile standard ale seturilor de date a şi b.
Dacă se consideră f =a+b sau f =a−b, atunci relaţia (6.26) devine
22
σ f = σa+σb (6.27)
De aici rezultă că precizia datelor combinate este mai mică decât precizia
fiecărui set în parte.
6.4.1 Propagarea erorilor
Propagarea apare atunci când o eroare duce la altă eroare. De exemplu,
dacă un strat cu puncte de control conţine un punct eronat (a fost cules de pe
o
hartă la scară mică) şi acest strat este folosit la georeferenţierea altuia, atunci
cel
de-al doilea strat propagă eroarea din primul. O singură eroare poate
conduce la
alte erori şi se poate răspândi până va afecta întreaga bază de date a SIG
6.4.2 Cumularea erorilor
Cumularea înseamnă că erorile şi imprecizia informaţiilor distorsionează
soluţia dată de un sistem informatic geografic când informaţiile sunt
combinate
selectiv în straturi noi. Efectul cumulării erorilor poate fi foarte greu de
prevăzut, acesta putând fi aditiv sau multiplicativ şi depinde de modul de
combinare a informaţiilor. Din acest motiv este necesar să se determine
influenţa
cumulării pentru diferite soluţii date de SIG. De asemenea, este foarte
important
să se determine efectul asupra datelor de poziţie, cât şi asupra atributelor.
Un număr foarte mare de factori poate cauza erori. O parte dintre aceste
surse de erori poate avea un efect cumulativ:
Toate aceste erori prezentate pot avea un efect cumulativ şi pot contribui
într-un mod negativ la rezultatul unei analize SIG.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
48
7. STUDII ŞI CERCETĂRI EXPERIMENTALE
Pentru a demonstra posibilitatea culegerii automate şi semiautomate a
datelor cartografice, precum şi pentru a arăta beneficiile utilizării metodelor
propuse, am realizat mai multe programe şi le-am aplicat pentru foaia de
hartă
L-35-87-B la scara 1: 50.000. Culegerea datelor cartografice prin metodele
propuse s-a făcut atât pentru foaia de hartă, cât şi pentru originalele de
editare
separate pe culori ale acesteia. Foaia de hartă aleasă pentru studiul de caz
cuprinde o zonă muntoasă din judeţul Braşov. Relieful din această zonă este
destul de accidentat, cotele variind între 540 m şi 1920 m.
Procesul tehnologic de culegere a datelor cartografice este prezentat în
figura 7-1.
Figura 7-1. Procesul tehnologic de culegere a datelor cartografice.
În cazul în care nu se dispune de originalele de editare separate pe culori,
după scanarea hărţii apar etape suplimentare necesare separării pe culori şi
preprocesării. De calitatea separării pe culori a hărţii scanate depinde
calitatea
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
49
vectorizării automate şi implicit volumul de muncă necesar editării şi
corectării
datelor culese. În cazul în care nu se poate face o separare corectă pe culori,
este
de preferat să se folosească o metodă manuală de culegere a datelor.
7.1 Testarea scanerului CONTEX Chameleon TX
Se cunoaşte faptul că nici scanerele cele mai performante nu sunt scutite
de erori. Pentru a obţine o imagine raster cât mai puţin afectată de erori
geometrice şi radiometrice sunt necesare metode de testare şi calibrare a
scanerului [Alexei, 1997b].
Pentru determinarea preciziei de scanare s-a folosit o grilă pe film de
dimensiune 18 cm x 15 cm, cu pasul de un centimetru. Coordonatele
nodurilor
grilei au fost măsurate la STECOMETRU cu o precizie de 0.001 mm. Grila
a
fost scanată cu rezoluţia optică maximă de 800 dpi, în două culori, rezultând
un
fişier BMP de 7.573 Mb.
Comparând dimensiunea grilei înainte de scanare cu dimensiunea grilei
după scanare se obţine deformarea introdusă de scanner.
Cumulând erorile pe cele două axe se obţine valoarea absolută a
deformării datorate scanării. Se observă din figura 7-2 că sunt zone mici
unde
deformarea depăşeşte valoarea de 0.1 mm. Deformarea medie este 0.053 mm
la
scara hărţii (figura 7-3). Această deformare medie, pentru harta la scara 1:
50.000, reprezintă 2.65 m şi este mult mai mică decât eroarea grafică.
Figura 7-2. Eroarea totală rezultată în urma scanării.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
50
Figura 7-3. Estimatorii statistici ai deformării totale rezultate în urma scanării.
7.2 Rectificarea imaginii scanate
Rectificarea este procesul de transformare a datelor dintr-un sistem reţea
în alt sistem reţea utilizând o transformare polinomială de grad n. Deoarece
pixelii din noua reţea pot să nu se alinieze cu pixelii din reţeaua originală,
aceştia trebuie să fie reeşantionaţi.
Rectificarea este necesară în cazurile în care reţeaua de pixeli a imaginii
trebuie modificată astfel încât să se adapteze la un sistem de proiecţie
cartografică sau la o imagine de referinţă. Rectificarea se face în următoarele
cazuri:
- comparaţiile pixel cu pixel în aplicaţii de detectare a
modificărilor;
- dezvoltarea bazelor de date SIG;
- crearea unor fotohărţi;
- suprapunerea unor date vectoriale peste date raster;
- compararea imaginilor aflate iniţial la scări diferite;
- realizarea unor analize ce necesită locaţii geografice exacte;
- determinări de distanţe, arii etc. pe hărţi raster.
În timpul rectificării se poate pierde ceva din integritatea spectrală a
datelor. O imagine nerectificată este mai corectă din punct de vedere
spectral,
comparativ cu o imagine rectificată.
Georeferenţierea se referă la procesul de atribuire a coordonatelor
sistemului geodezic terestru datelor imagine. Datele imagine pot fi deja pe
planul dorit, nefiind însă raportate la sistemul de coordonate adecvat.
Georeferenţierea, prin ea însăşi, presupune schimbarea doar a informaţiilor
privind coordonatele cartografice în fişierul de imagine. Reţeaua de pixeli nu
se
modifică.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
51
Reeşantionarea este procesul de extrapolare a valorilor datelor pentru
pixelii dintr-o reţea nou obţinută în urma procesului de rectificare, de la
valorile
pixelilor sursă. Cele mai folosite metode de reeşantionare sunt:
- metoda celui mai apropiat vecin - utilizează valoarea pixelului cel
mai apropiat pentru a atribui valoarea de ieşire a pixelului;
- interpolarea biliniară - se foloseşte o fereastră 2 x 2 pixeli pentru
a calcula valoarea de ieşire a pixelului (se foloseşte o funcţie
biliniară);
- înfăşurata cubică - utilizează valorile a 16 pixeli dintr-o fereastră
4 x 4 pentru a calcula valoarea de ieşire a pixelului cu o funcţie
cubică.
Am realizat programul software MapGEO (figura 7-4) pentru rectificarea
hărţilor scanate. Programul a fost scris în limbajul Delphi 7.0 şi permite
rectificarea imaginilor în format BMP cu 256 culori.
Figura 7-4. Interfaţa programului MapGEO.
Pentru rectificarea imaginilor scanate, programul MapGEO pune la
dispoziţie transformările conformă, afină şi biliniară. În cazul în care
numărul de
puncte de control este mai mare decât numărul de puncte necesar pentru
determinarea coeficienţilor transformării, se calculează eroarea medie
pătratică
în fiecare punct. Coordonatele punctelor de control se pot introduce atât de
la
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
52
tastatură, cât şi prin identificare şi punctare pe alte hărţi raster sau vector ce
sunt
importate de program.
Grila scanată, folosită pentru testarea scanerului CONTEX Chameleon TX,
s-a rectificat pentru a determina deformările introduse de acest proces.
Deformarea totală după rectificare este prezentată în figura 7-5. Se
observă că sunt puţine locuri unde deformarea depăşeşte 0.1 mm.
Figura 7-5. Deformarea totală după rectificare.
Deformarea maximă obţinută după scanarea şi rectificarea grilei este de
0.136 mm, media deformărilor fiind de 0.046 mm. De asemenea se observă

numărul punctelor în care deformarea depăşeşte 0.1 mm este foarte mic.
Figura 7-6. Estimatorii statistici ai deformării totale după rectificare.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
53
În urma procesului de rectificare, sunt zone în imagine unde deformarea a
crescut (figura 7-7). Se observă că deformarea s-a micşorat în marginile
imaginii, în apropierea punctelor de control, mărindu-se spre centru.
Figura 7-7. Evoluţia deformărilor după rectificare.
În figura 7-8 sunt prezentate deformările după scanare respectiv după
rectificare. Se observă că, după procesul de rectificare, nu mai apar
deformări
mai mari de 0.15 mm.
Figura 7-8. Deformările după scanare respectiv după rectificare.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
54
În tabelul 7-1 sunt prezentaţi indicatorii statistici ai deformărilor rezultate
în urma procesului de scanare, respectiv rectificare. Se observă că eroarea
maximă după rectificare este mai mică decât eroarea rezultată din scanare
(0.136
mm comparativ cu 0.180 mm). De asemenea, valoarea medie a erorii s-a
micşorat la 0.046 mm, comparativ cu 0.053 mm după scanare.
Tabelul 7-1. Indicatorii statistici ai deformărilor după scanare respectiv după rectificare.
Deformări după scanare
[mm]
Deformări după rectificare
Indicator statistic [mm]
x y Totală x y Totală
Valoare maximă 0,1304 0,1247 0,1805 0,1093 0,1133 0,1361
Valoare medie 0,0265 0,0202 0,0536 0,0002 0,0000 0,0467
Deviaţia standard 0,0446 0,0258 0,0299 0,0458 0,0283 0,0267
7.3 Culegerea datelor cartografice cu ajutorul algoritmilor propuşi
Pentru vectorizarea automată prin metoda cercului am realizat programul
Vect scris în Delphi 7.0 cu ajutorul bibliotecii grafice MapObjects dezvoltată
de
ESRI. Această bibliotecă include funcţii performante de vizualizare şi
gestiune a
datelor vector şi raster. Programul foloseşte ca date de intrare un fişier raster
georeferenţiat în format BMP cu 256 culori. Rezultatul vectorizării este
salvat
într-un fişier în format ESRI Shape. Interfaţa programului de vectorizare este
prezentată în figura 7-9.
Figura 7-9. Interfaţa programului de vectorizare.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
55
Programul pune la dispoziţie o fereastră de opţiuni în care se pot alege
raza de analiză şi modul de tratare a întreruperilor dintr-un element liniar.
7.3.1 Vectorizarea originalului de editare cu relieful
Originalul de editare cu relieful conţine elemente liniare, simboluri
punctuale, inscripţii (valorile curbelor de nivel, înălţimile movilelor etc.) şi
rasterul de umplere a detaliilor ce reprezintă drumurile şi localităţile. Din
această
cauză apar erori de vectorizare. Pentru a evita aceste probleme se poate
curăţa
imaginea raster de surplusul de informaţie înaintea procesului de vectorizare
sau
se poate adopta soluţia editării şi corectării post - vectorizare.
Figura 7-10. Vectorizarea prin două metode a originalului de editare cu relieful.
În figura 7-10 este prezentată o comparaţie între rezultatul vectorizării
prin metoda cercului, şi, cu ajutorul programului ArcInfo, a unei porţiuni din
originalul de editare cu relieful. Se observă că rezultatele sunt comparabile.
În cazul atingerii a două curbe de nivel apar erori de vectorizare, mai ales
la digitizarea hărţii tipărite (figura 7-11).
Deoarece culoarea de umplere pentru elementele areale şi liniare
reprezentate prin 2 sau 3 linii echidistante este aceeaşi cu cea a curbelor de
nivel, aflându-se toate în acelaşi original de editare, apar erori de tipul celor
din
figura 7-12.
Cotele curbelor de nivel determină erori de vectorizare de tipul celor din
figura 7-13. Acest tip de erori poate fi evitat printr-o editare preliminară a
imaginii raster.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
56
Figura 7-11. Eroarea de vectorizare în cazul atingerii a două curbe de nivel.
Figura 7-12. Eroarea de vectorizare datorită culorii de umplere a localităţilor.
Figura 7-13. Eroarea de vectorizare a curbelor de nivel datorită inscripţiilor.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
57
Erorile de digitizare prezentate mai sus, rezultate în urma procesului de
vectorizare automată a originalului de editare cu reprezentarea reliefului,
sunt
eliminate în etapa de editare – corectare. O parte din aceste erori se poate
elimina automat, de exemplu, la generarea topologiei, segmentele mai mici
decât un prag stabilit fiind eliminate automat.
7.3.2 Vectorizarea originalului de editare cu hidrografia
Originalul de editare cu hidrografia conţine elemente poligonale (lacuri,
râuri şi canale ce se pot reprezenta la scara hărţii), elemente liniare (râuri şi
canale ce se reprezintă atât prin linii continue cât şi întrerupte), elemente
punctuale (izvoare, gheizere, puţuri, fântâni şi rezervoare) şi inscripţii
(lăţimea şi
adâncimea apei, valori ale curbelor batimetrice etc.).
Figura 7-14. Exemplu de vectorizare a originalului de editare cu hidrografia.
Imaginea scanată a originalului de editare cu hidrografia conţine doar
două culori (alb şi negru) şi are dimensiunea 6969 pixeli x 6630 pixeli
(aproximativ 46.2 Mb).
În figura 7-15 este prezentată o porţiune din originalul de editare cu
hidrografia vectorizată automat prin metoda cercului şi cu ajutorul
programului
ArcInfo.
Figura 7-15. Exemplu de vectorizare a unor râuri temporare.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
58
Se observă din figura de mai sus că datorită reprezentării prin linie
întreruptă a râurilor temporare apar erori de vectorizare. Programul de
vectorizare identifică fiecare segment al liniei întrerupte în loc să identifice
un
singur element liniar cu un cod corespunzător râurilor temporare. Această
problemă se poate rezolva prin găsirea unei valori optime pentru parametrul
de
trecere peste întreruperi.
7.3.3 Recunoaşterea semnelor convenţionale prin algoritmul propus
Algoritmul propus pentru recunoaşterea semnelor convenţionale
punctuale a fost implementat în programul RecSCP 2.0 dezvoltat în limbajul
Delphi 7.0. Programul recunoaşte automat semnele convenţionale dintr-o
imagine în format BMP pe 8 biţi folosind o bază de date creată în MS
Access.
Fiecare semn convenţional are asociaţi parametrii pM (pixeli lipsă) şi pP
(pixeli în plus) determinaţi experimental. Programul permite folosirea
parametrilor determinaţi experimental sau alegerea de către utilizator a altor
parametri.
Rezultatul recunoaşterii automate a semnelor convenţionale este stocat
într-un fişier de tip Esri SHP. Fiecărui element identificat i se asociază un
cod
unic.
Toate elementele punctuale identificate sunt memorate într-un singur
fişier de tip SHP, diferenţierea între acestea făcându-se pe baza codului unic.
Identificarea unui semn convenţional punctual este urmată de apariţia
ecoului
grafic (figura 7-16).
Figura 7-16. Identificarea semnelor convenţionale punctuale.
Programul RecSCP foloseşte două clase principale: TSCP_ras, pentru
gestionarea semnelor convenţionale punctuale stocate în baza de date,
respectiv
TrecSCP, pentru gestionarea procesului de analiză a imaginii.
Analizând originalul de editare cu planimetria, pot apărea două tipuri de
erori datorită zgomotului din imagine şi rezoluţiei neadecvate de scanare -
elemente neidentificate (figura 7-17) şi elemente fals identificate (figura 7-
18).
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
59
Figura 7-17. Element neidentificat.
Figura 7-18. Element fals identificat.
În cazul în care numărul acestor tipuri de erori de recunoaştere este prea
mare, procesul de analiză se poate relua prin alegerea altor parametri pM şi
pP.
Analiza se poate face iterativ, pentru găsirea parametrilor optimi, până când
numărul de erori de recunoaştere este minim.
7.4 Editarea / Corectarea datelor culese
Erorile rezultate în urma procesului de culegere automată a datelor pot fi
eliminate manual sau automat cu ajutorul unui program specializat (de
exemplu
ArcInfo). În general, metoda automată poate elimina erori referitoare la
elemente liniare sau poligonale.
O editare preliminară a imaginii raster, pentru ştergerea inscripţiilor, cu un
program de tipul Paint din Windows, poate conduce la eliminarea acestui tip
de
erori de vectorizare. În urma analizei făcute, vectorizarea automată precedată
de
o editare raster duce la rezultate mai bune decât în cazul vectorizării
automate
urmate de o editare vectorială (tabelul 7-2).
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
60
Tabelul 7-2. Comparaţie între metodele de corectare a erorilor.
Metoda 1 Metoda 2
Editare
raster
Vectorizare
automată
Vectorizare
automată
Editare
vectorială
Timp (minute) 21 0,16 0,20 38
Total (minute) 21,16 38,20
Pentru eliminarea automată a erorilor datorate inscripţiilor din originalul
de editare cu hidrografia se poate aplica comanda CLEAN din ArcInfo,
alegând
valoarea de 140 m (2.8 m la scara hărţii 1: 50.000) pentru parametrul
Dangle
length (toate elementele liniare cu lungimea mai mică decât acest parametru
sunt
eliminate).
7.5 Generarea bazei de date geografice
Pentru baza de date geografice, corespunzătoare foii de hartă L-35-87-B,
s-a folosit modelul georelaţional în care atributele sunt asociate unor puncte,
linii şi areale. În cadrul acestei abordări, entităţile spaţiale sunt legate cu
atributele asociate prin intermediul unui identificator unic. Seturile de
atribute
sunt stocate în tabele de atribute diferite, iar informaţiile relevante pentru un
obiect spaţial sunt acumulate prin relaţionarea a două sau mai multe tabele
de
informaţii.
7.5.1 Proiectarea bazei de date
Proiectarea fizică priveşte localizarea diferitelor părţi ale bazei de date în
sistemul de fişiere al calculatorului şi este total diferită de proiectarea logică
ce
reprezintă opinia utilizatorului asupra relaţiilor dintre mulţimile de date
memorate în baza de date.
S-au creat următoarele straturi, fiecare dintre acestea fiind stocat în fişiere
separate:
- localităţi (elemente poligonale);
- drumuri (elemente liniare);
- hidrografie (elemente liniare);
- curbe de nivel (elemente liniare);
- biserici (elemente punctuale);
- mine scoase din exploatare (elemente punctuale).
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
61
7.5.2 Popularea cu atribute a bazei de date geografice
Culegerea atributelor se poate realiza în modurile manual sau automat.
Metoda manuală presupune software de gestiune a bazelor de date ce
permite
introducerea atributelor corespunzătoare entităţilor spaţiale. Pentru metoda
automată, folosind programul RecSCP prezentat în paragraful 7.3.3,
culegerea
automată a atributelor corespunde cu identificarea şi clasificarea semnelor
convenţionale punctuale.
Atributele pentru straturile Localităţi, Hidrografie, Drumuri şi Curbe de
nivel au fost culese prin metoda manuală, utilizând programul ArcMap de la
ESRI. Semnele convenţionale punctuale Biserici, Construcţii în formă de
turn şi
Mine scoase din exploatare au fost identificate automat folosind programul
RecSCP. Atributul principal al acestor straturi este codul unic, găsit automat
de
program.
7.5.3 Propunere de structură de date
Este foarte important pentru o bază de date geografică foarte mare, ca
structura logică a acesteia să permită regăsirea şi accesul rapid la o anumită
dată
sau grup de date. Structura de date propusă se bazează pe structura
relaţională a
bazelor de date de tip Microsoft Access şi pe modelul datelor SHP. Tabela
principală a acestei structuri este Tabel puncte în care sunt stocate toate
punctele, atât pentru elementele punctuale cât şi pentru cele liniare sau
poligonale (figura 7-19). În această tabelă, un punct, chiar dacă aparţine mai
multor entităţi, se găseşte doar o singură dată, eliminând astfel redundanţa în
datele spaţiale.
O altă parte importantă a structurii o reprezintă tabela Raster grosier.
Această tabelă permite crearea unei indexări spaţiale a elementelor din baza
de
date geografică. Fiecare celulă din structura de raster grosier, conţine 3 liste
în
care sunt stocate codurile elementelor punctuale, liniare respectiv poligonale
ce
se află în celula respectivă. Astfel se pot regăsi foarte rapid elementele dintr-
o
anumită zonă geografică.
Pentru a adăuga un element liniar sau poligonal în baza de date, se
introduc în “Tabel puncte” doar punctele noi, pentru cele existente găsindu-
se
doar codul acestora, eliminându-se astfel redundanţa. Se determină automat
celula de raster-grosier prin care trece elementul nou, generându-se lista de
elemente pentru fiecare celulă.
Pentru fiecare element nou introdus trebuie să se genereze relaţiile
topologice. Dacă elementul nou introdus se intersectează cu alte elemente,
atunci se generează automat punctele de intersecţie şi se adăugă în tabela
“Tabel
puncte”. Codul acestor puncte se inserează în tabela de puncte a fiecărui
element.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
62
Figura 7-19. Structură de date propusă.
Pentru eliminarea unui element din structură trebuie verificat dacă
punctele care alcătuiesc elementul mai aparţin şi altor elemente. Din tabela
“Tabel puncte” se elimină doar punctele ce aparţin elementului care este
eliminat. După eliminare trebuie să se reconstruiască topologia.
Utilizatorul are acces direct la fiecare element din baza de date. Structura
permite regăsirea fiecărui element după cod. De exemplu, pentru regăsirea
unui
element liniar, se identifică codul acestuia în tabela “Elemente liniare”, se
extrage adresa din tabela “Tabel linii” unde se află lista de coduri a punctelor
elementului, se poziţionează direct pe element în tabela “Tabel linii” şi se
extrag
codurile punctelor, apoi se extrag coordonatele după cod din tabela “Tabel
puncte”.
Pentru regăsirea tuturor elementelor dintr-o celulă a structurii rastergrosier
se analizează listele de elemente ale celulei de interes şi se extrag în
acces direct din structură pe baza codului unic de identificare. Dacă un
element
liniar sau poligonal se află în mai multe celule ale structurii raster-grosier,
atunci
codul de identificare al elementului este stocat în lista de elemente
corespunzătoare fiecărei celule. Structura raster-grosier se poate organiza
după
împărţirea pe foi de hartă 1: 50.000.
Avantajele acestei structuri sunt:
- acces direct la fiecare element;
- protecţia datelor;
- indexare spaţială;
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
63
- spaţiul mic ocupat;
- simplitate în procesul de editare;
- eliminarea redundanţei.
Dezavantajele generate de această structură sunt:
- necesitatea scrierii de programe noi pentru gestionarea bazei de
date;
- operaţii complicate pentru introducerea sau eliminarea unui
element în baza de date;
Pentru o bază de date completă a unui SIG, lucrurile se complică în
funcţie de volumul bazei de date şi de interogările proiectate.
7.6 Determinarea preciziei bazei de date
Erorile datelor geografice dintr-un sistem informaţional geografic nu pot
fi total eliminate şi de aceea apare ca necesară introducerea unei dimensiuni
suplimentare a obiectelor spaţiale, care să caracterizeze atât precizia
poziţionării
cât şi precizia atributelor.
Pentru determinarea indicatorilor de precizie corespunzători datelor culese
de pe harta la scara de bază 1: 50.000, s-a considerat ca referinţă harta
vectorială
din aceeaşi zonă, la scara 1: 25.000. Calculele au fost efectuate cu pachetul
de
programe ArcInfo.
1. Pentru determinarea factorului de deformare s-a transformat mai întâi
stratul cu drumurile de verificat într-un strat de puncte, folosind comanda
ARCPOINT.
Această comandă a generat stratul <strat puncte> cu puncte
corespunzătoare fiecărui vertex al fiecărei linii din stratul de intrare <strat
linii>.
Pentru determinarea distanţei de la fiecare punct la cel mai apropiat
element liniar din stratul de referinţă s-a folosit comanda NEAR.
Factorul de deformare mediu este de 13.77 m iar deviaţia standard de 9.28
m. Pentru un nivel de încredere de 95% (eliminând cele mai defavorabile 45
de
puncte), factorul de deformare mediu devine 12.59 iar deviaţia standard
7.86.
Aceste valori se încadrează în toleranţele din instrucţiuni (20 m la teren,
corespunzător valorii de 0.4 mm la scara hărţii).
2. Pentru determinarea factorului de generalizare s-a folosit comanda
BUILD pentru generarea topologiei, care determină automat şi lungimea
elementelor liniare (tabelul 7-3).
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
64
Tabelul 7-3. Factorul de generalizare.
Nr.
Element
Lungime element
1:25.000
Lungime element
1:50.000 GF
1 1989.46 1974.2 0.99
2 621.82 607.78 0.98
3 3402.89 3313.26 0.97
4 6002.3 5930.04 0.99
5 2241.81 2182.21 0.97
6 189.81 185.51 0.98
7 4388.99 4331.71 0.99
GF mediu 0.98
Se observă că factorul de generalizare are o valoare apropiată de 1 ceea ce
înseamnă că baza de date verificată este foarte puţin generalizată în
comparaţie
cu materialul de referinţă, harta 1: 25.000, ceea ce este în cele mai multe
cazuri
normal pentru curbele de nivel la scările date.
3. Pentru măsurarea preciziei de poziţionare prin metoda buffer-ului s-a
construit o zonă tampon cu raza de 10 m în jurul elementului de referinţă,
folosind comanda BUFFER.
S-a intersectat elementul liniar de verificat cu buffer-ul creat folosind
comanda CLIP.
Stratul rezultat <strat ieşire> conţine doar porţiunile elementului liniar de
verificat care se află în interiorul buffer-ului. Ţinând seama de relaţia (6.23),
corectitudinea elementului testat este
100 ( ' ')% 100 2669.1134% 78.87%
( ') 3384.0412
Corectitudinea lungimea AA QBB
lungimea AA

=⋅=⋅=
Indicatorii de precizie determinaţi intră în metadate şi trebuie să
însoţească baza de date geografică. Orice tip de prelucrare asupra bazei de
date
afectează precizia acesteia.
7.7 Software de gestiune a bazelor de date geografice
Pentru gestiunea datelor culese prin metodele propuse, am dezvoltat
programul Map în limbajul Delphi 7.0. Pentru afişarea 2D, programul
foloseşte
biblioteca MapObjects de la ESRI, iar pentru afişarea 3D, biblioteca
OpenGL.
Programul este structurat pe patru module: analiza terenului, calcule
topografice,
creare/editare straturi şi vizualizare 3D.
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
65
Bara de meniuri conţine 8 opţiuni, fiecare dintre acestea cu sub-meniuri
prin intermediul cărora se apelează funcţiile aplicaţiei (figura 7-20). La
lansarea
aplicaţiei, opţiunile Analiză teren, Editare strat şi Vizualizare 3D sunt
inactive.
Condiţia de activare a acestor opţiuni este încărcarea cu date geografice,
pentru
opţiunile Analiză teren şi Vizualizare 3D fiind necesară şi încărcarea
modelului
numeric al terenului.
Figura 7-20. Meniul programului Map.
Aplicaţia oferă o serie de instrumente specifice SIG pentru:
- controlul straturilor;
- clasificarea elementelor în funcţie de un atribut (figura 7-21);
- transformări de coordonate între sistemele de coordonate utilizate
în România (geografice, Gauss-Kruger, UTM, Stereo 70);
- determinarea profilului altimetric al terenului între doua puncte;
- determinarea zonei de vizibilitate dintr-un punct;
- vizualizarea 2D şi 3D a zonei de interes (vezi anexa 3.8);
- căutarea diferitelor elemente ale hărţii;
- actualizarea bazelor de date geografice.
Figura 7-21. Clasificarea elementelor în funcţie de un atribut.
Pentru trasarea profilelor, aplicaţia afişează o fereastră în care se pot
introduce de la tastatură coordonatele capetelor profilului (figura 7-22).
Fereastra mai pune la dispoziţia utilizatorului un buton de selecţie pentru
fiecare
CAPITOLUL 7. STUDII ŞI CERCETĂRI EXPERIMENTALE
66
capăt al profilului, care oferă posibilitatea selectării acestora de pe hartă.
După
introducerea capetelor, se determină profilul altimetric între cele două
puncte pe
baza unui model numeric al terenului, aflat în baza de date a programului.
Acesta este afişat în fereastra destinată trasării profilelor, având posibilitatea
de
a fi mărit, micşorat sau parcurs prin deplasarea imaginii. Apelarea funcţiei
de
test vizibilitate se face prin apăsarea butonului Vizibilitate şi furnizează
informaţii referitoare la zona unde este obturată vizibilitatea şi pune la
dispoziţie
unelte pentru determinarea înălţimii piramidelor pentru obţinerea vizibilităţii
între punctele alese.
Figura 7-22. Determinarea profilului terenului.
Se poate determina câmpul de vizibilitate dintr-un punct de staţie, pe o
anumită rază. Coordonatele punctului de staţie se pot introduce de la
tastatură
sau prin punctare direct pe harta de pe ecran. Raza pe care se poate face
analiza
se introduce de la tastatură sau prin măsurare direct pe hartă. Rezultatul
analizei
poate fi suprapus pe spaţiul hărţii.
Figura 7-23. Analiza vizibilităţii dintr-un punct dat.
CAPITOLUL 8. CONCLUZII FINALE
67
8. CONCLUZII FINALE
Lucrarea de faţă conţine principalele rezultate obţinute de autor în
cercetările făcute asupra metodelor şi tehnologiilor de culegere a datelor
cartografice în general şi asupra algoritmilor de vectorizare în special, între
anii
1997-2005, în Academia Tehnică Militară, Direcţia Topografică Militară şi
Agenţia de Cercetare pentru Tehnică şi Tehnologii Militare.
Cercetarea unor aspecte şi posibilităţi noi în culegerea automată /
semiautomată a datelor cartografice digitale, elaborarea unor tehnologii şi
algoritmi pentru aplicarea acestora în ţara noastră în vederea automatizării
obţinerii unor baze de date geografice, au scos în evidenţă importante
concluzii
teoretice şi practice.
Calitatea unui sistem informaţional geografic este influenţată în mare
măsură de cantitatea şi calitatea datelor geografice stocate în baza sa de date,
a
căror culegere costă 70-80% din preţul sistemului. În capitolul 3 au fost
scoase
în evidenţă avantajele şi dezavantajele datelor vectoriale şi raster, pentru a
justifica soluţiile alese pentru proiectarea tehnologiilor şi programelor.
În urma studiului efectuat rezultă că suprapunerea hărţilor în format
raster, realizate la momente diferite de timp se face printr-o simplă operaţie
logică aplicată pixelilor corespondenţi, rezultând schimbările survenite în
timp.
Unul din dezavantajele datelor raster este spaţiul mare de stocare a
informaţiei.
Acest dezavantaj poate fi ameliorat prin aplicarea unor algoritmi de
comprimare
aşa cum s-a procedat în lucrare.
De asemenea s-a constat că principalul avantaj al datelor vectoriale îl
reprezintă faptul că permit analize spaţiale complicate (de exemplu, drumul
optim într-un graf) precum şi ataşarea de informaţii suplimentare fiecărui
element al hărţii. Unul din dezavantajele acestui tip de date este modul
complicat şi mare consumator de timp al obţinerii lor.
În subcapitolul 3.2 sunt prezentate structurile de date cele mai folosite în
realizarea unui SIG. Structura datelor spaţiale formalizează conceptul uman
de
percepere a spaţiului în concordanţă cu nişte reguli stricte. În general,
complexitatea unei structuri depinde în mod obligatoriu de numărul de
accese
ulterioare la elemente sau grupuri de elemente. Prin urmare, un factor îl
constituie şi timpul de acces la date.
Rezultatul analizei efectuate a condus la alegerea structurii de date
orientate pe obiecte, structură care răspunde cel mai bine nevoilor
utilizatorilor
de SIG. Acest tip de structură de date este folosită de majoritatea pachetelor
de
programe SIG şi este în continuă dezvoltare.
În subcapitolul 7.5.3 este prezentată o propunere de structură de date care
micşorează spaţiul ocupat prin eliminarea redundanţei (punctul de intersecţie
a
două elemente liniare este stocat o singură dată) şi permite actualizări facile
ale
CAPITOLUL 8. CONCLUZII FINALE
68
elementelor hărţii. De asemenea, timpul necesar analizelor spaţiale scade
datorită folosirii structurii raster grosier.
Sursele de date cartografice sunt prezentate în subcapitolul 3.4. Cele mai
utilizate metode de culegere a datelor cartografice digitale sunt digitizarea
hărţilor tipărite şi a originalelor separate pe culori şi, în plină expansiune
datorită
scăderii costurilor, exploatarea înregistrărilor de teledetecţie.
Digitizarea hărţilor tipărite sau a originalelor acestor hărţi, cu elemente
separate pe culori, reprezintă sursa principală şi cea mai comodă de obţinere
a
datelor cartografice digitale. În urma studiilor efectuate, consider că,
digitizarea
vectoriala interactivă şi digitizarea raster-vector semiautomată sunt metodele
cele mai indicate pentru digitizare. Aceste două metode prezintă fiecare
avantaje
şi dezavantaje: digitizarea vectorială este, în general, mai lentă, dar permite
o
mai mare independenţă de calitatea suportului cartografic (pete, îndoituri,
degradări etc.) pe când digitizarea raster-vector semiautomată are ca
avantaje
eliminarea subiectivităţii operatorului la preluarea datelor şi timpul de lucru
mai
scurt, dar depinde de calitatea suportului cartografic şi de gradul de încărcare
al
hărţii.
Digitizarea înregistrărilor fotogrammetrice şi exploatarea înregistrărilor de
teledetecţie poate fi folosită uşor în scopul actualizării bazei de date.
Tehnologia
de digitizare este mai complicată, necesitând o preprocesare a înregistrărilor
şi
personal calificat. Aceste înregistrări sunt extrem de eficiente în cazul unor
proiecte mari sau a realizării unor hărţi tematice.
Consider sistemul FLI-MAP, realizat de firma Fugro, prezentat în
subcapitolul 3.6, ca un sistem de viitor, care poate asigura nevoia de date
cartografice într-un timp foarte scurt şi cu o precizie foarte bună (10 cm). De
asemenea, sistemul cartografic descris în lucrare este principalul sistem de
culegere a datelor cartografice având ca suport hărţile analogice deja
existente.
Consider oportună comasarea modulelor de digitizare şi de introducere a
atributelor pentru sporirea eficienţei şi mărirea responsabilităţii operatorilor,
aşa
cum am demonstrat prin programele şi tehnologiile propuse.
În urma studiului din subcapitolul 3.7, se poate concluziona că metodele
de digitizare testate se încadrează în toleranţele de precizie impuse,
diferenţierea
dintre aceste metode făcându-se în funcţie de eficienţă. Metoda de digitizare
automată, chiar dacă este dependentă de calitatea materialului cartografic,
este
cea mai rapidă. Metoda de digitizare manuală devine eficientă faţă de
digitizarea
automată în cazul culegerii datelor de pe un material cartografic foarte
degradat,
de către un operator experimentat.
În subcapitolul 4.5 s-a făcut o analiză a performanţelor algoritmilor de
vectorizare folosind indicii de performanţă dezvoltaţi de Liu Wenyin şi Dov
Dori. Cu algoritmul propus prin metoda cercului s-au obţinut rezultate foarte
bune, situându-se aproape de rezultatele obţinute de programul ArcInfo.
Algoritmul propus poate fi folosit cu rezultate foarte bune pentru
vectorizarea
interactivă sau automată a curbelor de nivel şi a hidrografiei. Rata de
detecţie
CAPITOLUL 8. CONCLUZII FINALE
69
falsă a pixelilor poate fi îmbunătăţită prin micşorarea razei de analiză,
aceasta
ducând la îndesirea punctelor detectate. Algoritmul de vectorizare prin
metoda
cercului, contribuţie de bază a autorului, prezintă un avantaj major, poate
trece
peste întreruperi. Astfel, un element liniar reprezentat printr-o linie
întreruptă
poate fi identificat ca un element liniar unitar.
Capitolul 5 prezintă algoritmi pentru recunoaşterea semnelor
convenţionale punctuale. Atât algoritmul de recunoaştere pe baza semnăturii
formei, cât şi cel pe baza descriptorilor Fourier se pot folosi pentru
identificarea
semnelor convenţionale punctuale dintr-o imagine vectorială. Algoritmul
propus
poate identifica semnele convenţionale punctuale dintr-o imagine raster.
Această
caracteristică este un avantaj, deoarece calitatea clasificării nu este
dependentă
de calitatea vectorizării.
Algoritmul de recunoaştere pe baza descriptorilor Fourier prezintă
rezultate deosebite aşa cum reiese şi din anexa 2.3. Se poate determina
automat
atât scara, deplasarea, unghiul de rotaţie, cât şi punctul de start al simbolului.
Algoritmul propus de recunoaştere a semnelor convenţionale este
dependent de rezoluţia de scanare şi de orientarea semnului convenţional.
Pentru
a rezolva această problemă se propun două soluţii:
- în fiecare punct de analiză se verifică semnul convenţional
punctual căutat iterativ pentru orientări şi scări succesive, cu un
anumit pas;
- se stochează în baza de date modele de semne convenţionale
punctuale pentru diferite scări şi orientări.
Varianta a 2-a prezintă avantajul că, odată completată baza de date, se
poate folosi pentru orice hartă scanată şi astfel se micşorează timpul de
analiză.
Prima variantă are avantajul că nu necesită o bază de date pentru simboluri
completată pentru toate orientările şi scările, dar necesită un timp mai mare
de
analiză.
Algoritmul de recunoaştere automată a formei semnelor convenţionale
punctuale este uşor de implementat, iar viteza de analiză pentru o clasă de
obiecte este bună (aproximativ un minut pentru un original de editare scanat
la
rezoluţia de 300 dpi) şi independentă de gradul de încărcare al imaginii.
Pentru a
mări viteza, se poate adopta soluţia de a se indica cu ajutorul unui locator
coordonatele aproximative ale elementului, iar algoritmul găseşte
coordonatele
precise şi codul asociat.
La calitatea produsului cartografic digital contribuie calitatea tuturor
procedurilor de control şi deprinderilor operatorilor. Calitatea datelor de
intrare
asigură reuşita unei bune implementări a sistemului informaţional geografic.
În
asigurarea acestei calităţi, precizia de vectorizare şi recunoaştere a semnelor
convenţionale punctuale este vitală. În ţările avansate în domeniu, s-au
adoptat
standarde precise de calitate a datelor cartografice digitale. Între acestea,
standardele Ordonance Survey sunt cunoscute a fi cele mai drastice la nivel
internaţional.
CAPITOLUL 8. CONCLUZII FINALE
70
În capitolul 6 sunt prezentate metode şi indicatori pentru determinarea
preciziei unei baze de date geografice obţinută prin metode automate de
vectorizare şi recunoaştere a semnelor convenţionale punctuale. Dintre
acestea
este de remarcat metoda de determinare a preciziei de poziţionare prin
metoda
buffer-ului, metodă ce se poate aplica automat. Folosind pachetul de
programe
ArcInfo, se poate genera automat un buffer în jurul elementelor de precizie
ridicată folosite ca referinţă, şi tot automat se poate determina ce elemente
de
analizat se află în aceste zone tampon.
În capitolul 7 sunt prezentate etapele necesare culegerii datelor
cartografice prin metodele şi algoritmii propuşi. O etapă importantă, care
adesea
este omisă, este testarea scanerului. Prin metoda propusă se poate determina
precizia oricărui tip de scanner folosit la scanarea materialelor cartografice,
obţinând o informaţie despre forma deformărilor pe suprafaţa scanată. În
urma
analizei efectuate, scanerul CONTEX Chameleon TX poate fi folosit în
scopuri
cartografice, deformarea medie fiind de 0.053 mm. În urma procesului de
rectificare deformarea medie s-a micşorat, ajungând la valoarea de 0.046
mm.
Pentru vectorizarea automată a hidrografiei şi a curbelor de nivel s-a
aplicat algoritmul propus prin metoda cercului, raza de analiză având
valoarea 5.
Pentru originalul de editare cu reprezentarea reliefului, vectorizarea s-a
realizat
în aproximativ 3 minute, rezultând un fişier de tip SHP de 11 Mb. Pentru a
micşora timpul de vectorizare se poate mări raza de analiză. O altă soluţie
este
rescrierea procedurii de analiză în limbajul ASSEMBLER, aşa cum a făcut şi
autorul pentru unele proceduri.
În urma analizei făcute în subcapitolul 7.4 rezultă că este mai avantajos să
se facă o editare raster pre-vectorizare, decât o editare vectorială
postvectorizare.
Fără o editare raster înaintea procesului de vectorizare automată pot
apărea erori a căror corectare este dificilă şi mare consumatoare de timp.
În general, eliminarea erorilor de vectorizare cât şi a celor de clasificare
(rezultate în urma procesului de recunoaştere automată) se face manual.
Această
etapă este foarte importantă, de calitatea editării depinzând calitatea bazei de
date geografice. Un rol important în procesul de editare îl are experienţa
operatorului. O mică parte din erorile de vectorizare se pot elimina automat
(în
general erori topologice), pachete de programe de genul ArcInfo punând la
dispoziţie uneltele necesare. Completarea cu noi proceduri sau instrumente
se
impune aşa cum s-a demonstrat şi în lucrare, folosind macrolimbajele puse
la
dispoziţie de ESRI.
În subcapitolul 7.6 s-a determinat precizia bazei de date rezultate în urma
procesului de vectorizare. În urma analizei făcute, factorul de generalizare
calculat este de 0.98, valoare foarte apropiată de 1, ceea ce înseamnă că baza
de
date este foarte puţin generalizată în raport cu harta de referinţă 1: 25.000.
Precizia de poziţionare determinată prin metoda buffer-ului este de 78.87 %,
ceea ce înseamnă că aproximativ 80 % din elementele hărţii au o eroare de
poziţionare mai mică de 10 m faţă de harta de referinţă la scara 1: 25.000.
Aceşti
CAPITOLUL 8. CONCLUZII FINALE
71
indicatorii de preciziei determinaţi, împreună cu metadatele, trebuie să
însoţească baza de date geografică.
Programele realizate, Vect – pentru vectorizarea automată, RecSCP –
pentru recunoaşterea semnelor convenţionale punctuale, GeoRef – pentru
rectificarea hărţilor scanate şi Map – pentru afişarea, gestiunea şi analiza
bazelor
de date geografice, reprezintă contribuţii la culegerea automată / semi-
automată
a datelor cartografice digitale, dar şi la analiza oricărei baze de date realizate
prin alte metode, inclusiv verificarea unor date importate de la alte sisteme.
Aceste programe au implementat în limbajul Delphi 7.0 algoritmii şi
metodele
propuse în prezenta lucrare, ele putând fi îmbunătăţite şi dezvoltate.
Din analiza şi concluziile prezentate asupra culegerii automate/
semiautomate a datelor cartografice digitale, autorul consideră că a adus
următoarele contribuţii:
- tratarea unitară în limba română a principalelor probleme
referitoare la culegerea datelor cartografice şi testarea preciziei
unei baze de date geografice;
- elaborarea unui proces tehnologic privind culegerea
automată/semiautomată a datelor cartografice digitale având ca
suport hărţile topografice;
- elaborarea unui algoritm propriu de vectorizare automată prin
metoda cercului;
- elaborarea unui algoritm propriu de recunoaştere automată a
semnelor convenţionale punctuale de pe hărţile topografice;
- dezvoltarea unui algoritm de recunoaştere a semnelor
convenţionale punctuale de pe hărţile topografice pe baza
descriptorilor Fourier;
- elaborarea unei metode pentru testarea preciziei unui scanner;
- dezvoltarea unor metode pentru testarea preciziei unei baze de
date geografice;
- elaborarea unei structuri de date ce reduce redundanţa;
- realizarea unor programe software pentru rectificarea imaginilor
scanate, vectorizarea automată, recunoaşterea semnelor
convenţionale punctuale de pe hărţile topografice şi gestiunea
unor baze de date geografice.
CAPITOLUL 8. CONCLUZII FINALE
72
GLOSAR DE TERMENI
73
GLOSAR DE TERMENI
inscripţie
Text descriptiv folosit pentru etichetarea elementelor. Inscripţia nu este
folosită pentru analiză.
atribut
Informaţie descriptivă asociată unui detaliu geografic.
O coloană sau un câmp dintr-un tabel al bazei de date.
Buffer (zonă tampon)
O zonă de o anumită distanţă în jurul unui element al hărţii.
element/detaliu cartografic
O reprezentare a unui obiect din lumea reală ce poate fi stocată într-un
strat al unei hărţi în format vectorial.
eroare conceptuală
Omiterea informaţiilor dintr-o bază de date.
eroare de poziţie
Deplasare a unui obiect pe hartă faţă de poziţia sa reală din teren.
GIS - Geographic Information System
Sistem Informaţional Geografic (SIG) – colecţie organizată de hardware,
software, date geografice şi non-geografice, tehnologii şi personal,
destinată culegerii, stocării, actualizării, prelucrării, analizei şi afişării
tuturor formelor de informaţii referite geografic.
GPS - Global Positioning System
Sistem de poziţionare pe globul terestru, compus din segmentul spaţial
(constelaţie de sateliţi), segmentul de control şi segmentul utilizatorilor
(receptoare GPS), folosit pentru determinarea poziţiei.
grid (reţea rectangulară)
Model de date folosit de ArcInfo, care stochează date sub forma unei
matrice de celule cu aceeaşi suprafaţă.
model vectorial
Reprezentare a lumii folosind puncte, linii şi poligoane. Modelul vectorial
este folosit de obicei pentru stocarea unor elemente discrete cum ar fi
GLOSAR DE TERMENI
74
clădiri, drumuri, parcele etc. De regulă reprezintă succesiuni de perechi de
coordonate.
relaţionare
Operaţie care stabileşte o conexiune temporară între înregistrări
corespondente din două tabele diferite, între detalii cartografice etc.
scanare
Procesul de conversie din formatul analog în formatul digital raster
folosind un dispozitiv numit scanner.
semn convenţional
Un simbol cu ajutorul căruia se indică pe hartă poziţia în teren şi tipul
diferitelor obiecte şi fenomene (redând şi caracteristicile cantitative şi
calitative).
SGBD – Sistem de Gestiune a Bazelor de Date
Set de programe de calculator pentru gestionarea informaţiilor dintr-o
bază de date. SGBD suportă structuri de date în formate standard şi oferă
unelte pentru introducerea, verificarea, stocarea, interogarea şi extragerea
datelor.
SIG - Sistem Informaţional Geografic
Vezi GIS.
strat vectorial
Set de fişiere care stochează date vectoriale. De obicei un strat reprezintă
o singură temă (drumuri, râuri etc.).
TIN - Triangulated Irregular Network
Reţea neregulată de triunghiuri oarecare folosită pentru modelarea
numerică a terenului, nodurile fiind punctele caracteristice ale reliefului.
topologie
Ramură a matematicilor care descrie relaţiile spaţiale între elemente
conectate sau adiacente, de regulă noduri, arce şi feţe.
vertex
Punct de frântură al unui element liniar sau poligonal.
BIBLIOGRAFIE
75
BIBLIOGRAFIE SELECTIVĂ
1. Alexei, A., (1997a) – Algoritmi pentru conversia raster - vector, Revista
ATM, Editura Academiei Tehnice Militare, Bucureşti, mai 1997, p. 59-
62.
2. Alexei, A., (1997b) – Verificarea caracteristicilor de precizie ale unui
scaner, A XXVII – a sesiune de comunicări ştiinţifice cu participare
internaţională a ATM, Bucureşti, 13-14 noiembrie 1997, pag. 117-124.
3. Alexei, A., Crângaşu, L., (1999) – Integrarea bazelor de date raster cu
bazele de date vectoriale, A 31 sesiune de comunicări ştiinţifice a
ACTTM, Bucureşti 1999, pag. 229.
4. Alexei, A., Tomoiagă, T., (2000) – Sisteme Informaţionale Geografice
instrumente în luarea deciziilor, Revista ACTTM nr. 2-3/2000, pag. 36.
5. Alexei, A., Tomoiagă, T., (2003) – Digital Terrain Modeling, The 34-th
International Scientific Symposium Of METRA, Vol. II, Bucureşti, mai
29-30.2003, pag. 119.
6. Alexei, A., (2004a) – Spatial Data Quality, The 35-th International
Scientific Symposium Of METRA, Vol. II, Bucureşti, mai 27-28.2004,
pag. 500.
7. Alexei, A., (2004b) – Contribuţii privind vectorizarea elementelor liniare
de pe hărţile topografice, A IX-a sesiune de comunicări ştiinţifice cu
participare internaţională, Academia Forţelor Terestre “Nicolae
Bălcescu”, Vol. II, Sibiu, 25-26 Noiembrie 2004, pag. 124.
8. Alexei, A., (2004c) – Metode de culegere a datelor cartografice, Buletin
Ştiinţific al Sesiunii Naţionale de Comunicări Ştiinţifice, 26-27 Noiembrie
2004, Braşov, Academia Forţelor Aeriene “Henri Coandă”, Anul V,
Numărul 1 (15), p. 1.
9. Alexei, A., (2004d) – Contribuţii privind culegerea de pe hărţile
topografice a elementelor reprezentate prin semne convenţionale
punctuale, Buletin Ştiinţific al Sesiunii Naţionale de Comunicări
Ştiinţifice, 26-27 Noiembrie 2004, Braşov, Academia Forţelor Aeriene
“Henri Coandă”, Anul V, Numărul 1 (15), p. 9.
10. Cîmpeanu, V., (1995) - Întocmirea şi redactarea hărţilor, A.M.G.,
Bucureşti.
11. Connealy, T., (1994) - A complete and innovative raster to vector
conversion algorithm, Proceedings of EGIS '92. Munich: EGIS
Foundation, 1994.
12. Cowen, D. J., (1988) - GIS versus CAD versus DBMS: what are the
differences- Photogrammetric Engineering and Remote Sensing 54: 1551.
13. Creangă, I., (1994) – Metode în procesarea digitală a imaginilor, Lecţie,
Editura Academiei Tehnice Militare, Bucureşti.
BIBLIOGRAFIE
76
14. Dimitriu, G., (2001) – Sisteme Informaţionale Geografice, Editura
Albastră, Cluj-Napoca.
15. Douglas, D. H., Peucker, T. K., (1973) - Algorithms for the reduction
of
the number of points required to represent a digitized line or its caricature.
The Canadian Cartographer 10: 112-22.
16. Fisher, P. F., (1991) - Spatial data sources and data problems. In:
Maguire D J, Goodchild M F, Rhind D W (eds.) Geographical
Information Systems: principles and applications. Longman, London, pp.
175-89, Vol I.
17. Gavriloaia, G., (2002) – Prelucrarea de nivel mediu a imaginilor
digitale,
Editura Academiei Tehnice Militare, Bucureşti.
18. Ghiţău, D., (2003) – Prelucrarea măsurătorilor geodezice, Editura
Fundaţiei Universitare “Dunărea de Jos”, Galaţi.
19. Greenwalt, C., Shultz, M., (1968) – Principles of error theory and
cartographic applications, St. Louis.
20. Healey, R. G., (1991) - Database management systems. In: Maguire D J,
Goodchild M F, Rhind D W (eds.) Geographical Information Systems:
principles and applications. Longman, London, pp. 251-67, Vol 1.
21. Ioniţă, A., (1996) - Sistemele de informaţie geografică in contextul
evoluţiei tehnologiei informaţiei, RRIA 3/1996, pp. 47-57;
22. Kenneth, E.F., Donald, J.H., (1995) - Error, Accuracy, and Precision,
The Geographer's Craft Project, Department of Geography, University of
Texas at Austin.
23. Liu, W., Dov, D., (1997) - A Protocol for Performance Evaluation of
Line Detection Algorithms, Machine Vision and Applications, Springer-
Verlag GmbH Volume 9, Numbers 5-6, March 1997, p240 – 250.
24. Lungu, I., et al., (1992) - Baze de date relaţionale. Utilizarea limbajului
SQL * PLUS, Editura ALL, Bucureşti.
25. Niţu, C., (1992) - Tendinţe de dezvoltare în cartografia automata –
Revista de Geodezie, Cartografie şi Cadastru, nr. 1, 1992, p 27.
26. Nitu, C., (1995) - Curs de Proiectare asistată de calculator a hărţilor,
A.T.M., Bucureşti.
27. Niţu, C., (1997) - Culegerea datelor cartografice prin digitizare, Revista
ATM, Editura Academiei Tehnice Militare, Bucureşti, mai 1997.
28. Niţu, C., et al., (2002) – Sisteme Informaţionale Geografice şi
Cartografie Computerizată, Editura Universităţii din Bucureşti.
29. Niţu, C., (2004) – Sisteme Informaţionale Geografice, Editura CREDIS,
Universitatea din Bucureşti.
30. Răducanu, D., Toderaş, T., (2002) – Baze de date cartografice. Creare
şi
actualizare, Academia Tehnică Militară, Bucureşti.
31. Răducanu, N., (1993) - Curs de Fotogrammetrie, A.T.M. , Bucureşti.
32. Răducanu, N., (1994) - Curs de Aparate fotogrammetrice,
A.T.M.,Bucureşti.
BIBLIOGRAFIE
77
33. Răducanu, N., (1995) - Curs de Teledetecţie, A.T.M. , Bucureşti.
34. Răducanu, N., Răducanu, D., (2004) – Fotogrammetria – 3D, A.T.M. ,
Bucureşti.
35. Rotaru, M., et. al., (1989) – Evoluţia concepţiei geodezice militare în
România, Secţia Asigurare Tehnico-Economică a Presei şi Publicaţiilor
Ministerului Apărării Naţionale, Bucureşti.
36. Săvulescu, C., et al., (2000) - Fundamente GIS, Editura HGA,
Bucureşti.
37. Serediuc, C., (1997) – Teoria erorilor de măsurare, Editura Editura
Academiei Tehnice Militare, Bucureşti.
38. Somerville, I., (1989) - Software Engineering, 3rd edn. Addison-
Wesley,
Reading Massachusetts, 653pp.
39. Turdeanu, L., (1997) – Fotogrammetrie analitică, Editura Academiei
Române, Bucureşti, 346p.
40. Ubeda, T., Egenhofer, M., (1997) – Topological error in GIS, Fifth
International Symposium on Large Spatial Database, Berlin.
41. Vasile, F., (2002) – Sisteme de poziţionare globală NAVSTAR-GPS,
Editura Academiei Tehnice Militare.
42. Vertan, C., (1999) - Prelucrarea şi analiza imaginilor, Editura Printech,
Bucureşti.
43. Vizitiu, C., (2002) – Reţele neuronale utilizate în recunoaşterea formelor
vizuale, Editura Academiei Tehnice Militare, Bucureşti.
44. Vlaicu, A., (1997) – Prelucrarea digitală a imaginilor, Editura Albastră,
Cluj-Napoca.

S-ar putea să vă placă și