Sunteți pe pagina 1din 27

Erori i incertitudini

privind acurateea
datelor geospaiale

Florin Iosub, TeamNet Solutions International, Cluj Napoca,


Aprilie 2013

Sumar
1. Terminologie i definiii
1. Posibile surse de erori n GIS
2. Tipuri de erori
3. Propagarea i cumularea erorilor
4. Cuantificarea erorilor

1. Terminologie i definiii
Forme variate
Eroare, incertitudine, acuratee, precizie,
calitatea datelor
Eroare
Diferena dintre realitate i reprezentarea realitii

(presupunnd ca realitatea este foarte clar definit)


Diferena dintre o valoare msurat i cea calculat
O msur a inacurateii valorilor

Incertitudine
Lipsa detaliilor erorilor unui set de date/valori
Constatarea existenei erorii (este cert faptul c

reprezentarea realitii poate diferi de realitatea nsi)


n concepia GIS, termenul incertitudine cuprinde
noiuni ca acuratee, precizie, eroare, etc. [Imbroane,
2012]

Acuratee
Gradul de apropiere a msurtorilor unei mrimi fa de

o msurtoare considerat adevrat [Wikipedia]


Exprimat cantitativ prin eroare
n GIS exprimat prin acuratee poziional i acuratee
n atribut [Imbroane, 2012]

Precizia
Din punct de vedere matematic este redat de numrul de
cifre relevante n procesul de msurare, procesare
Din punct de vedere al topografilor este o msur a
variabilitii poziiilor prin msurtori repetate

Reference
value
Probability
density

Accuracy

Wikipedia

Precision

Legtura dintre acuratee i precizie

Value

Precizie mic
Acuratee mic

Precizie mare
Acuratee mic

Precizie mic
Acuratee mare

Precizie mare
Acuratee mare

Calitatea datelor
Totalitatea caracteristicilor unui produs ce conduc la
satisfacerea unei anumite necesiti precizate [International
Standards Organization ISO]
Este direct influenat de eroare, incertitudine, acurate e,
precizie, completitudine, consisten, etc.

2. Posibile surse de erori n GIS


Erori cauzate de datele primare de intrare
Erori provenite din nregistrarea datelor de intrare
Senzorii sateliilor
Aparatele foto aeriene
Instrumentele de masurare i nregistrare (staii totale, teodolite, GPS-

uri, etc)
Erorile coninute de hrile realizate folosind tehnici tradiionale
(ridicri topo, scanare, etc.)

Erori cauzate de procesul de introducere a datelor


Erori de georefereniere
Erori de digitizare
Vechimea datelor
Acoperirea areal
Densitatea observaiilor
Introducerea/actualizarea informaiilor alfanumerice asociate

informaiei grafice

Erori cauzate de activitile de manipulare i

procesare a datelor
Erori provenite din activiti de manipulare a datelor
Generalizarea datelor (rotunjire, agregare, ajustare, interpolare)
Conversia datelor (din raster n vector i invers)
Combinarea datelor culese la diferite scri
Erori topologice

Erori provenite din activii de procesare a datelor


Precizia procesrii datelor (numrul de cifre semnificative)
Modul de stocare a datelor
Erori rezultate din prelucrarea imaginilor satelitare/aeriene (clasificari,

analize, etc.)

Erori provenite din afiarea datelor


Inacurateea echipamentului (plotter, imprimant)
Inacurateea suportului

Erori de metod
Definirea incorect a claselor de obiecte
Erori provenite de la algoritmii de calcul

Erori de digitizare

Deplasri regulate
original
digitizat

Erori ascunse

Erori datorate vechimii datelor

Imagine aerian. Anul 2010

ANCPI

Imagine aerian. Anul 2005


ANCPI

Erori datorate generalizrii datelor

Imagine generalizat

Imagine iniial

Erori provenite din generalizare n funcie de scar


Scara 1:50.000

ANCPI

Scara 1:30.000

ANCPI

Scara 1:10.000
Scara 1:1.000

ANCPI
ANCPI

Erori provenite din conversia datelor


Conversie

Vector

Raster

Suprapunere Vector - Ra

Vector

Suprapunere Vector - Ra

Conversie

Raster

3. Tipuri de erori
Din punct de vedere matematic
Erori de rotunjire
Erori inevitabile
Depind de memoria calculatoarelor
Numerele se aproximeaz cu o valoare
Se controleaza prin soft

Erori de trunchiere (rotunjire prin tiere)


Se produc atunci cnd se fixeaz un numr de zecimale, iar ce trece

peste acest numr nu mai este luat n considerare

Din punct de vedere al msurtorilor


Erori aleatoare (independente)
Pot proveni ca urmare a diversitii proceselor i a fenomenelor precum

i a interaciunilor experimentului cu alte procese i fenomene ce se


desfoar simultan
Se abordeaz folosind legea normal (gaussian)
Erorile n msurarea distanelor fac parte din aceast categorie

Erori sistematice
Pot fi cauzate de caracteristicile constructive ale aparatelor, a

etalonrii incorecte sau a uzurii aparatului


Pot fi erori produse de metoda de msurare sau produse de factori
externi (temperatur, presiune, umiditate, radiaii, etc.)
Se abordeaz folosind autocorelaia

Din punct de vedere al controlului


Erori controlate
Erori de georefereniere fcute de utilizator

Erori necontrolate
Erori de georefereniere fcute de un productor de hri ce nu comunic gradul

de acuratee
Operaia a fost fcut ntr-un anumit soft iar rezultatul a fost exportat
Necunoaterea parametrilor/algoritmilor folosii n anumite procese
Etc.

4. Propagarea i cumularea erorilor


Realitate: datele spaiale stocate n baze de date GIS sunt

foare rar sau chiar niciodat lipsite de erori


Cauze ale erorilor: generalizarea, digitizarea,

georeferenierea, msurtori n teren, clasificare, interpolare,


etc.
Consecine: erorile se vor propaga i cumula prin

intermediul operaiunilor GIS


ntrebare: innd cont de erorile de intrare n cadrul

operaiilor GIS, care va fi dimensiunea acestor erori n


produsele finale

Propagarea erorilor
Propagare simpl
Se propag dintr-o structur n alta
O singur erore conduce la altele
Apare n produsul final

Cumularea erorilor
Propagare n cascad
Apare de la mai multe date eronate i de la mai multe transformri

i combinri
Aditiv sau multiplicativ
Greu de prezis i detectat

Analiza propagrii i a cumulrii erorilor


Definirea unui model statistic al erorilor
Stabilirea unei funcii de distribuire a probabilitii
Corelaia spaial (variograme, semivariograme)
Corelaia temporal (pentru variabile dinamice)

Identificarea modelului de erori


Erori de msurtoare cauzate de instrumente
Exemplificarea de erori folosind teorii statistice (eroarea standard medie,

interval de confidenta, etc.,)


Verificarea cu date din teren (RMSE, etc.,)
Interpolarea erorilor folosind metode geostatistice (kriging)
Clasificare erorilor folosind statistici multivariate
Experien

5. Cuantificarea erorilor
Metoda Monte Carlo
Generare aleatoare a valorilor unei variabile probabilistice
Acurateea metodei este invers proporional cu rdcina

ptrat a numrului de simulri (N) [Heuvelink i Burrough


1993]
Acurateea crete uor o dat cu creterea lui N
n GIS, N=[10,20] nu este suficient pentru obinerea unor

rezultate cu o acuratee ridicat [Goodchild, 1992].


Necesit timp ndelungat de procesare

Metoda Latin Hypercube Sampling


Folosit de USGS pentru cuantificarea erorilor pentru

datele raster
Monte Carlo modificat (stratificat)
Reduce numrul de simulri Monte Carlo pentru obinerea

unei acuratei rezonabile


Asigur o distribuie uniform a funciei pstrnd trendul

de probabilitate [McKay, 1979]

Matricea confuziilor
Specific determinrii acurateii datelor atribut

(alfanumerice) asociate entitilor vectoriale


Ideal atunci cand n afara diagonalei avem doar valoarea 0

Exemplu de matrice a confuziilor (adaptare dup Longley et. al., 2001)

Concluzii
Exist numeroase tipuri i surse de erori ce trebuie

luate n calcul
Datele geografice sunt n mod deosebit predispuse

spre erori ca urmare a variabilitii spaio-temporale


ridicate
Erorile i incertitudinile cu privire la date trebuie

comunicate utilizatorilor finali


Existena unui numar redus de instrumente GIS pentru

gestionarea erorilor i a incertitudinilor n GIS

Bibliografie
Gurdak, J.J. et. al., (2009), Estimating Prediction Uncertainty

from Geographical Information System Raster Processing: A


Users Manual for the Raster Error Propagation Tool (REPTool)
Imbroane, A.M. (2012), Sisteme Informatice Geografice,

Volumul I Structuri de date, Editura Universitar Clujean.


Longley P.A., et. al., (2005), Geographic Information System

and Science, John Wiley & Sons, Chichester, England.


Niu, C., et. al., (2002), Sisteme Informaionale Geografice i

Cartografie computerizat, Editura Universitii din Bucureti.


http://sig.trei.ro/GIS_Errors.htm

V MULUMESC
PENTRU ATENIE!

S-ar putea să vă placă și