Documente Academic
Documente Profesional
Documente Cultură
INTRODUCCIN
En Teledeteccin, el anlisis de la calidad de los trabajos de clasificacin se suele acometer mediante el uso
de la matriz de confusin, las cuales presentan una
visin general de las asignaciones correctas (en la
diagonal) e incorrectas (errores de omisin y comisin, en los valores fuera de la diagonal) (Pinilla,
1995). No obstante, el uso directo de la matriz de
confusin tiene algunos inconvenientes, de los cuales,
los ms destacados pueden ser:
q La matriz es un conjunto de valores, por lo que
resulta ms cmodo el uso de ndices, como el porcentaje de acuerdo "Pa" o el ndice de acuerdo "Kappa",
que dan una visin global de todo el proceso.
q
Extraer m muestras aleatorias a partir de la muestra original, siendo m elevado (m > 200). Cada muestra
tambin debe ser de tamao n.
q
(1)
Fn (a) =
Entonces, el parmetro
Fn = n
(2)
est prximo a F
donde
(a1 ,..., a n )
(3)
de Fn.
Debido
*
la
*
(a1 ,..., a n )
construccin
de
Fn,
el
vector
(ai1 ,..., a in )
ECM ( Fn ) = ...
in
(h(a
i1
,..., a in ) n
n
i1
(4)
b1 = h(a1i ,..., a ni ) n
*
(5)
M ( Fn ) =
EC
b
i =1
(6)
xi , j1 xi , j2
Z=
B) Convertir la matriz de confusin en una lista donde
el nmero de elementos es igual a n. Cada celda de la
matriz introduce en la lista tantos elementos como el
valor de la celda. Cada elemento debe tener asociado
un indicador de la fila y columna a la que pertenece en
la matriz de confusin (ver ejemplo en Tabla 2 donde
cada elemento de la lista es de la forma fila-columna).
i2, j1 + i2, j2
Ec.7
siendo:
Z
el estadstico para contrastar la hiptesis.
xi , j el valor original de la celda (i,j) en la matriz 1.
1
la matriz 1.
i2, j la desviacin tpica estimada para la celda (i,j) en
2
la matriz 2.
EJEMPLO DE APLICACIN
1-1 1-1 1-1 1-1 1-2 1-3 1-3 2-1 2-2 2-2 2-2 2-2 2-2 3-1 3-1 3-2 3-3 3-3 3-3
10
18
0
80
326
10
805
70
150
18
51
99
210
70
127
30
555
80
296
813
71
148
16
49
100
209
70
118
30
555
80
813
74
144
45
110
215
103
106
20
554
trabajos puede realizarse utilizando este ndice y planteando un contraste de hiptesis para verificar si el
comportamiento global de las tres matrices es similar,
a los Casos A y B, una variacin de valores sensiblemente mayor que la observada en la comparacin
anterior. Conviene advertir que, en este caso, la apreciacin anterior se puede realizar cmodamente dado
que las tres matrices que se presentan (Tabla 3) tienen
en sus celdillas valores en un mismo orden de magnitud, en caso contrario, la normalizacin de las matrices
podra ser una tcnica til de comparacin celda a
celda.
Caso A
Caso B
Caso C
Contraste de hiptesis:
Ho: Pa (Caso X ) = Pa (Caso Y)
H1: Pa (Caso X) Pa (Caso Y)
Caso B
No
--No
Caso C
No
No
---
0,0146
0,6386
0,0002
0,0376
0,1755
0,1147
0,0188
0,0006
0,0008
0,9778
0,0001
0,0199
0,0007
0,0001
0,0001
0,0002
0,0221
0,3548
0,0001
0,0341
0,5885
0,0094
0,1195
0,0001
0,0001
0,7927
0,0582
0,0200
0,1486
0,1626
0,0002
0,0129
0,0010
0,6745
0,0002
0,0002
0,0505
0,0000
0,5942
0,0002
0,0002
0,3548
0,1504
0,1593
0,0002
0,0140
0,0010
0,6749
0,0002
0,0001
0,0464
0,0000
0,5959
0,0001
0,0002
0,3572
0,1652
0,1365
0,0003
0,0555
0,0009
0,6414
0,0002
0,0002
0,0699
0,0001
0,5858
0,0002
0,0003
0,3435
0,1507
0,1620
0,0000
0,0143
0,0000
0,6730
0,0000
0,0000
0,0509
0,0000
0,5942
0,0000
0,0012
0,3537
0,0148
0,6430
0,0002
0,0409
0,1733
0,1072
0,0205
0,0004
0,0006
0,9707
0,0001
0,0277
0,0005
0,0001
0,0001
0,0002
0,0286
0,3488
0,0001
0,0413
0,5808
0,0067
0,1234
0,0001
0,0002
0,7876
0,0597
0,0223
0,0165
0,6348
0,0004
0,0265
0,1802
0,1030
0,0387
0,0003
0,0080
0,9272
0,0321
0,0321
0,0003
0,0001
0,0253
0,0003
0,0621
0,2896
0,0002
0,0567
0,5659
0,0084
0,1302
0,0097
0,0002
0,7859
0,0439
0,0217
0,0139
0,6402
0,0000
0,0371
0,1737
0,1135
0,0217
0,0000
0,0000
0,9709
0,0000
0,0291
0,0000
0,0000
0,0000
0,0000
0,0292
0,3544
0,0000
0,0411
0,5752
0,0096
0,1199
0,0000
0,0000
0,7869
0,0575
0,0261
0,0004
0,0026
0,0000
0,0025
0,0020
0,0011
0,0021
0,8256
0,0258
0,0000
0,0005
0,0093
0,1128
0,0261
0,0144
0,6439
0,0001
0,0370
0,1770
0,1086
0,0190
0,0019
0,0006
0,0001
0,0009
0,0007
0,0018
0,0033
0,0005
0,0027
0,0002
0,0029
0,0026
0,0012
0,0021
0,7913
0,0199
0,0000
0,0100
0,0001
0,1519
0,0267
0,0174
0,6369
0,0003
0,0301
0,1743
0,1025
0,0383
0,0024
0,0006
0,0000
0,0018
0,0002
0,0015
0,0022
0,0009
0,0022
0,0003
0,0027
0,0023
0,0019
0,0043
0,0000
0,0000
0,0028
0,0000
0,0028
0,0000
0,0000
0,0000
0,0000
0,0027
0,0151
0,0000
0,0022
0,0148
0,0007
0,0015
0,0000
0,0000
0,0026
0,0006
0,0036
0,0015
0,0016
0,0000
0,0025
0,0000
0,0024
0,0000
0,0000
0,0030
0,0000
0,0141
0,0000
0,0010
0,0155
0,1536
0,1559
0,0009
0,0159
0,0000
0,6736
0,0000
0,0002
0,0536
0,0001
0,5866
0,0013
0,0015
0,3567
0,0019
0,0016
0,0004
0,0020
0,0001
0,0022
0,0000
0,0007
0,0038
0,0007
0,0195
0,0018
0,0011
0,0200
0,1665
0,1349
0,0000
0,0601
0,0000
0,6385
0,0000
0,0009
0,0651
0,0011
0,5693
0,0018
0,0062
0,3556
0,0019
0,0029
0,0000
0,0042
0,0000
0,0025
0,0000
0,0016
0,0037
0,0024
0,0175
0,0020
0,0020
0,0182
0,0000
0,0006
0,0473
0,3325
0,0000
0,0445
0,5751
0,0061
0,1196
0,0029
0,0006
0,7889
0,0587
0,0232
0,0000
0,0008
0,0052
0,0195
0,0000
0,0022
0,0190
0,0006
0,0019
0,0010
0,0011
0,0024
0,0010
0,0034
0,0157
0,0003
0,0680
0,3003
0,0000
0,0541
0,5616
0,0081
0,1334
0,0081
0,0000
0,7873
0,0466
0,0166
0,0037
0,0005
0,0092
0,0191
0,0000
0,0035
0,0170
0,0010
0,0023
0,0015
0,0000
0,0024
0,0017
0,0045
Gris oscuro: supone que no existe un comportamiento similar desde un punto de vista estadstico.
Tabla 11.- Valor del estadstico para las diferencias entre los Casos A y B
0,0784
0,7809
0,3333
--
3,7963
1,1980
0,2857
1,4084
0,9871
1,0000
0,7500
0,1239
2,6958
0,5577
0,0000
0,5000
3,7589
3,0892
2,9000
2,2500
0,1429
0,5556
0,0261
4,4667
0,8880
0,5455
0,4998
0,3158
1,0847
1,0060
1,4142
--
0,5652
0,0000
0,7222
0,4160
3,0100
0,7500
1,0928
1,0290
0,1843
0,2018
0,6862
0,9091
--
0,0042
0,5856
--
0,1186
Tabla 12.- Valor del estadstico para las diferencias entre los Casos A y C
11,7304
3,5537
0,3333
4,2432
1,2288
6,5269
0,5625
8,9626
0,9689
3,9583
0.6000
4,9164
8,1821
2,9811
--
1,0000
4,8400
4,0467
5,4000
--
0,4583
5,5556
1,9023
4,0133
2,2220
--
9,3704
1,1080
16,1276
0,1969
1,9105
--
0,1130
--
0,9000
19,8861
5,0104
0,5000
3,1447
6,0462
9,9551
2,2361
1,0443
3,4689
0,4400
0,6034
1,6485
--
0,0795
Tabla 13.- Valor del estadstico para las diferencias entre los Casos B y C
11,2053
2,9139
0,0000
4,2432
1,7150
4,8009
0,4008
6,9532
2,0099
3,5976
0,3180
4,6258
6,3404
2,1683
0,0000
0,5547
2,3997
1,9588
2,8844
2,2500
0,4000
4,7206
1,7414
0,3436
1,1797
0,5455
9,5015
0,6603
12,6372
0,7778
3,3761
--
0,4714
0,0000
0,1858
16,6875
2,7145
0,1768
2,3222
6,1349
10,5400
2,0591
0,1513
4,0331
0,4400
0,5295
1,1702
--
0,0407
CONCLUSIONES
En esta trabajo se ha presentado una metodologa de
aplicacin de las tcnicas de bootstrapping para la
mejora en los anlisis basados en celdas de la matriz
de confusin. Junto a la metodologa anterior se ha
desarrollado un caso numrico para ejemplizar, de una
forma muy simple, los resultados y aportacin que se
obtienen con el mtodo propuesto.
Las matrices de valores medios, desviaciones derivadas del boostrap y los resultados de los contrastes de
hiptesis no han de considerarse como los elementos
nicos en un anlisis en el que se comparen dos matrices de confusin, ms bien deben entenderse como
elementos cuantitativos que permiten entender y apoyar otras hiptesis ms generales sobre la realizacin
del trabajo y del comportamientos de clases particulares.
Desde un punto de vista operativo, la simulacin que
supone el bootstrap no suele estar incorporada en
ningn programa de teledeteccin ni de anlisis estadstico (p.e. SPSS, StatGraphics, etc.) pero su programacin es bastante inmediata.
BIBLIOGRAFA
Ariza, F.J. 2002. Calidad en Produccin Cartogrfica.
Ed Ra-Ma, Madrid.
Ariza, F.J.; Garca, J.L.; Atkinson, A. 2002. Ctem:
Control de Calidad Temtica.
Congalton, R.; Green, K. 1998. Assesing the accuracy
of remotely sensed data: Principles and Practices.
Lewis Publishers.