Sunteți pe pagina 1din 27

Erori şi incertitudini privind

acurateţea datelor
geospaţiale

Florin Iosub, TeamNet Solutions International, Cluj Napoca,


Aprilie 2013
Sumar
1. Terminologie și definiții

1. Posibile surse de erori în GIS

2. Tipuri de erori

3. Propagarea și cumularea erorilor

4. Cuantificarea erorilor
1. Terminologie și definiții

• Forme variate
Eroare, incertitudine, acuratețe, precizie, calitatea datelor

Eroare

 Diferența dintre realitate și reprezentarea realității (presupunând ca


realitatea este foarte clar definită)

 Diferența dintre o valoare măsurată și cea calculată

 O măsură a inacurateții valorilor


Incertitudine

 Lipsa detaliilor erorilor unui set de date/valori


 Constatarea existenței erorii (este cert faptul că reprezentarea
realității poate diferi de realitatea însăși)
 În concepția GIS, termenul “incertitudine” cuprinde noțiuni ca
acuratețe, precizie, eroare, etc. [Imbroane, 2012]

Acuratețe

 Gradul de apropiere a măsurătorilor unei mărimi față de o


măsurătoare considerată adevărată [Wikipedia]
 Exprimată cantitativ prin eroare
 În GIS exprimată prin acuratețe pozițională și acuratețe în atribut
[Imbroane, 2012]
 Precizia

 Din punct de vedere matematic este redată de numărul de


cifre relevante în procesul de măsurare, procesare
 Din punct de vedere al topografilor este o măsură a
variabilității pozițiilor prin măsurători repetate

Reference
value

Probability Accuracy
density

© Wikipedia

Precision Value

Legătura dintre acuratețe și precizie


Precizie mică
Precizie mică
Acuratețe mare
Acuratețe mică

Precizie mare Precizie mare


Acuratețe mică Acuratețe mare
• Calitatea datelor

 “Totalitatea caracteristicilor unui produs ce conduc la


satisfacerea unei anumite necesități precizate” [International
Standards Organization – ISO]

 Este direct influențată de eroare, incertitudine, acuratețe,


precizie, completitudine, consistență, etc.
2. Posibile surse de erori în GIS

• Erori cauzate de datele primare de intrare


 Erori provenite din înregistrarea datelor de intrare
 Senzorii sateliților
 Aparatele foto aeriene
 Instrumentele de masurare și înregistrare (stații totale, teodolite, GPS-uri, etc)
 Erorile conținute de hărțile realizate folosind tehnici tradiționale (ridicări topo, scanare,
etc.)
 Erori cauzate de procesul de introducere a datelor
 Erori de georeferențiere
 Erori de digitizare
 Vechimea datelor
 Acoperirea areală
 Densitatea observațiilor
 Introducerea/actualizarea informațiilor alfanumerice asociate informației grafice
• Erori cauzate de activitățile de manipulare și procesare a
datelor

 Erori provenite din activități de manipulare a datelor


 Generalizarea datelor (rotunjire, agregare, ajustare, interpolare)
 Conversia datelor (din raster în vector și invers)
 Combinarea datelor culese la diferite scări
 Erori topologice

 Erori provenite din activiăți de procesare a datelor


 Precizia procesării datelor (numărul de cifre semnificative)
 Modul de stocare a datelor
 Erori rezultate din prelucrarea imaginilor satelitare/aeriene (clasificari, analize, etc.)

 Erori provenite din afișarea datelor


 Inacuratețea echipamentului (plotter, imprimantă)
 Inacuratețea suportului
• Erori de metodă

 Definirea incorectă a claselor de obiecte

 Erori provenite de la algoritmii de calcul


Erori de digitizare

Deplasări regulate

original

digitizat

Erori ascunse
Erori datorate vechimii datelor

Imagine aeriană. Anul 2010

© ANCPI

Imagine aeriană. Anul 2005

© ANCPI
Erori datorate generalizării datelor

Imagine generalizată

Imagine inițială
Erori provenite din generalizare în funcție de scară
Scara 1:50.000
Scara 1:30.000

© ANCPI © ANCPI

Scara 1:10.000

Scara 1:1.000

© ANCPI

© ANCPI
Erori provenite din conversia datelor

Conversie

Vector Raster Suprapunere Vector - Raster

Conversie

Raster Vector Suprapunere Vector - Raster


3. Tipuri de erori
• Din punct de vedere matematic

 Erori de rotunjire
 Erori inevitabile
 Depind de memoria calculatoarelor
 Numerele se aproximează cu o valoare
 Se controleaza prin soft

 Erori de trunchiere (rotunjire prin tăiere)


 Se produc atunci când se fixează un număr de zecimale, iar ce trece peste acest număr
nu mai este luat în considerare
• Din punct de vedere al măsurătorilor

 Erori aleatoare (independente)


 Pot proveni ca urmare a diversității proceselor și a fenomenelor precum și a
interacțiunilor experimentului cu alte procese și fenomene ce se desfășoară simultan
 Se abordează folosind legea normală (gaussiană)
 Erorile în măsurarea distanțelor fac parte din această categorie

 Erori sistematice
 Pot fi cauzate de caracteristicile constructive ale aparatelor, a etalonării incorecte sau a
uzurii aparatului
 Pot fi erori produse de metoda de măsurare sau produse de factori externi
(temperatură, presiune, umiditate, radiații, etc.)
 Se abordează folosind autocorelația
• Din punct de vedere al controlului

 Erori controlate
 Erori de georeferențiere făcute de utilizator

 Erori necontrolate
 Erori de georeferențiere făcute de un producător de hărți ce nu comunică gradul
de acuratețe
 Operația a fost făcută într-un anumit soft iar rezultatul a fost exportat
 Necunoașterea parametrilor/algoritmilor folosiți în anumite procese
 Etc.
4. Propagarea și cumularea erorilor
• Realitate: datele spațiale stocate în baze de date GIS sunt foare rar sau
chiar niciodată lipsite de erori

• Cauze ale erorilor: generalizarea, digitizarea, georeferențierea, măsurători


în teren, clasificare, interpolare, etc.

• Consecințe: erorile se vor propaga și cumula prin intermediul operațiunilor


GIS

• Întrebare: ținând cont de erorile de intrare în cadrul operațiilor GIS, care va


fi dimensiunea acestor erori în produsele finale
• Propagarea erorilor

 Propagare simplă
 Se propagă dintr-o structură în alta
 O singură erore conduce la altele
 Apare în produsul final

• Cumularea erorilor

 Propagare în cascadă
 Apare de la mai multe date eronate și de la mai multe transformări
și combinări
 Aditivă sau multiplicativă
 Greu de prezis și detectat
• Analiza propagării și a cumulării erorilor

 Definirea unui model statistic al erorilor


 Stabilirea unei funcții de distribuire a probabilității
 Corelația spațială (variograme, semivariograme)
 Corelația temporală (pentru variabile dinamice)

 Identificarea modelului de erori


 Erori de măsurătoare cauzate de instrumente
 Exemplificarea de erori folosind teorii statistice (eroarea standard medie,
interval de confidenta, etc.,)
 Verificarea cu date din teren (RMSE, etc.,)
 Interpolarea erorilor folosind metode geostatistice (kriging)
 Clasificare erorilor folosind statistici multivariate
 Experiență
5. Cuantificarea erorilor
• Metoda Monte Carlo

 Generare aleatoare a valorilor unei variabile probabilistice

 Acuratețea metodei este invers proporțională cu rădăcina pătrată a


numărului de simulări (N) [Heuvelink și Burrough 1993]

 Acuratețea crește ușor o dată cu creșterea lui N

 În GIS, N=[10,20] nu este suficient pentru obținerea unor rezultate cu o


acuratețe ridicată [Goodchild, 1992].

 Necesită timp îndelungat de procesare


• Metoda Latin Hypercube Sampling

 Folosită de USGS pentru cuantificarea erorilor pentru datele raster

 Monte Carlo modificat (stratificat)

 Reduce numărul de simulări Monte Carlo pentru obținerea unei acurateți


rezonabile

 Asigură o distribuție uniformă a funcției păstrând trendul de


probabilitate [McKay, 1979]
• Matricea confuziilor

 Specifică determinării acurateții datelor atribut (alfanumerice) asociate


entităților vectoriale
 Ideal atunci cand în afara diagonalei avem doar valoarea 0

Exemplu de matrice a confuziilor (adaptare după Longley et. al., 2001)


Concluzii
• Există numeroase tipuri și surse de erori ce trebuie luate în
calcul

• Datele geografice sunt în mod deosebit predispuse spre erori


ca urmare a variabilității spațio-temporale ridicate

• Erorile și incertitudinile cu privire la date trebuie comunicate


utilizatorilor finali

• Existența unui numar redus de instrumente GIS pentru


gestionarea erorilor și a incertitudinilor în GIS
Bibliografie
• Gurdak, J.J. et. al., (2009), Estimating Prediction Uncertainty from
Geographical Information System Raster Processing: A User’s Manual for
the Raster Error Propagation Tool (REPTool)

• Imbroane, A.M. (2012), Sisteme Informatice Geografice, Volumul I –


Structuri de date, Editura Universitară Clujeană.

• Longley P.A., et. al., (2005), Geographic Information System and Science,
John Wiley & Sons, Chichester, England.

• Nițu, C., et. al., (2002), Sisteme Informaționale Geografice și Cartografie


computerizată, Editura Universității din București.

• http://sig.trei.ro/GIS_Errors.htm
VĂ MULȚUMESC PENTRU
ATENȚIE!

S-ar putea să vă placă și