Algoritmo de Maxima Verisimilitud

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
FACULTAD DE CIENCIAS HUMANAS

ESCUELA DE CIENCIAS GEOGRÁFICAS
CARRERA DE CIENCIAS GEOGRÁFICAS Y MEDIO AMBIENTE
Nombre: Max Torres
Algoritmo de Clasificación de máxima verosimilitud

¿Qué es?
La herramienta tiene en cuenta las varianzas y covarianzas de las firmas de clases cuando
asigna cada celda a una de las clases representadas en el archivo de firma. Si se asume que la
distribución de una muestra de clases es normal, una clase puede estar caracterizada por el
vector del valor medio y la matriz de covarianza. Dadas estas dos características para cada
valor de celda, se calcula la probabilidad estadística para cada clase a fin de determinar la
pertenencia de las celdas a la clase. Cuando se especifica de forma predeterminada la
opción ponderación de la probabilidad a priori igual, cada celda se asigna a la clase a la que
tiene mayor probabilidad de pertenecer.
Si la probabilidad de ocurrencia de algunas clases es mayor (o menor) que el promedio, se

debe usar la opción archivo a priori con un archivo de probabilidades a priori de entrada. Los
pesos de las clases con probabilidades especiales se especifican en el archivo a priori. En este
caso, un archivo a priori ayuda a asignar las celdas que se superponen estadísticamente entre
dos clases. Estas celdas se asignan con mayor exactitud a la clase adecuada, dando como
resultado una mejor clasificación. Este enfoque de ponderación para la clasificación se conoce
como el clasificador bayesiano.
¿Cómo se aplica?
El algoritmo que utiliza la herramienta Clasificación de máxima verosimilitud se basa en dos
principios:
Las celdas en cada muestra de clases del espacio multidimensional que se distribuyen
normalmente
El teorema de Bayes de toma de decisiones
Al elegir la opción Muestra a priori, las probabilidades a priori asignadas a todas las muestras
de clases en el archivo de firma de entrada son proporcionales a la cantidad de celdas
capturadas en cada firma. Por consiguiente, las clases que tienen menos celdas que el
promedio en la muestra reciben pesos menores que el promedio, y las que tienen más celdas
reciben pesos mayores que el promedio. Como resultado, las clases respectivas tienen más o
menos celdas asignadas.
Cuando se realiza una clasificación de máxima verosimilitud, también se puede producir un

ráster de confianza de salida opcional. Este ráster muestra los niveles de confianza de la
clasificación. La cantidad de niveles de confianza es 14, que se relaciona directamente con la
cantidad de valores de fracción de rechazo válidos. El primer nivel de confianza, codificado en
el ráster de confianza como 1, comprende celdas con la menor distancia hasta cualquier vector
de valor medio almacenado en el archivo de firma de entrada; por lo tanto, la clasificación de
estas celdas tiene una mayor certeza. Las celdas que constituyen el segundo nivel de confianza
(valor de celda 2 en el ráster de confianza) se clasificarán sólo si la fracción de rechazo es 0,99
o menor. El nivel de confianza más bajo tiene un valor de 14 en el ráster de confianza y
muestra las celdas que posiblemente estén mal clasificadas. Las celdas de este nivel no se
clasificarán cuando la fracción de rechazo sea 0,005 o mayor. Si no hay celdas clasificadas en
un nivel de confianza determinado, ese nivel de confianza no estará presente en el ráster de
confianza de salida.
Ejemplo
En el ejemplo siguiente se muestra cómo se utiliza la herramienta Clasificación de máxima

verosimilitud para realizar una clasificación supervisada de un ráster multibanda en cinco
clases de uso del suelo.
El ráster multibanda de entrada para la clasificación es una imagen de satélite de Landsat TM

de cuatro bandas sin procesar del área norte de Cincinnati, Ohio.
A partir de la imagen, se definieron cinco clases de uso del suelo en una entidad para producir
las muestras de formación: Comercial/Industrial, Residencial, Tierras de cultivo, Bosque y
Pastos. Se utilizó la herramienta Crear firmas para calcular las estadísticas para las clases a fin
de producir un archivo de firmas.
Utilizando el ráster multibanda de entrada y el archivo de firmas, se utiliza la

herramienta Clasificación de máxima verosimilitud para clasificar las celdas ráster en las cinco
clases.
 Configuraciones que se utilizan en el cuadro de diálogo de la herramienta Clasificación

de máxima verosimilitud:
Bandas de ráster de entrada: northerncincy.tif
Archivo de firmas de entrada: signature.gsg
Ráster multibanda de salida: landuse
Fracción de rechazo: 0,0
Ponderación de la probabilidad a priori: EQUAL
Archivo de probabilidades a priori de entrada:
Ráster de confianza de salida: confidence_ras
Articulo
3.1. Análisis de las características del algoritmo.
La operación global y la operación local de MLC deben distinguirse para hacer la
implementación del algoritmo más eficaz.
Eficiente, especialmente cuando está en paralelización. La operación global aumentará el costo

de tiempo de la comunicación, conduciendo a menor eficiencia de paralelización . El algoritmo
MLC, que consta de dos pasos principales, se analiza de la siguiente manera:
(1) Paso de entrenamiento. Calcula parámetros relevantes y determina la función

discriminante para cada categoría.
A lo largo de toda la clasificación, este procedimiento se considera una operación global y debe
ejecutarse solo una vez.
(2) Paso de clasificación. Se ejecuta sobre la base de una función discriminante. Este
procedimiento puede ser ejecutado. Simultáneamente, lo que significa que es capaz de tratar
con numerosas imágenes en paralelo.
Implementación en el entorno autónomo El algoritmo MLC se implementa como un todo.

Primero, se calculan los parámetros de clasificación relevantes y la función discriminante se
determina a través de la utilización de la biblioteca de muestras. En segundo lugar, los
resultados obtenidos anteriormente se utilizan para realizar la clasificación de probabilidad y
generar la imagen final clasificada. El procedimiento de algoritmo, junto con la biblioteca de
muestra, se implementa en la computadora que se designará como el nodo maestro en el
entorno de cuadrícula. Dado que los resultados de clasificación que obtenemos en dos
entornos de ejecución diferentes son los mismos, el logro del MLC jugará un papel en la
verificación de la mejora de la eficiencia aquí. En general, los algoritmos de procesamiento de
imágenes de detección remota pueden ser paralelos en dos formas de datos paralelos y
algoritmos paralelos. Los datos paralelos dependen de la división de datos y la asignación de
tareas informáticas, mientras que el algoritmo paralelo necesita modificar adecuadamente la
estructura, los pasos o el orden del algoritmo. Aquí, los datos paralelos y los algoritmos
paralelos se combinan en el entorno de cuadrícula para paralelizar el algoritmo MLC [17,18].
Además, se implementan algoritmos de corte de imágenes y mosaicos de imágenes para
admitir la paralelización. Las operaciones y los despliegues específicos se presentan a
continuación (Fig. 3). (1) Desplegar funciones y datos. La imagen no clasificada, el archivo XML
de la biblioteca de muestra, las funciones de corte de imagen, el mosaico de imágenes y el
cálculo de parámetros se implementan en el nodo maestro, mientras que la función de realizar
la clasificación se implementa en los nodos secundarios. (2) Compute los parámetros de MLC y
divida la imagen sin clasificar en bloques. Sobre la base de la función de cálculo de parámetros
y la amplia biblioteca, se adquiere el archivo de texto de parámetros. De acuerdo con el
número de nodos secundarios en el entorno de la cuadrícula, la función de corte de imagen se
ejecuta para obtener el número correspondiente de bloques de la imagen sin clasificar en el
mismo tamaño. (3) Transmitir datos por primera vez. Ordenado, cada bloque de la imagen no
clasificada se transmite desde el nodo maestro a uno de los nodos secundarios con el archivo
de texto de parámetros. (4) Realizar la clasificación. El bloque de imagen en cada nodo
secundario se clasifica según el archivo de texto de parámetros y la función de realizar la
clasificación, y así se genera una nueva imagen clasificada. (5) Transmitir datos por segunda
vez. Las imágenes clasificadas se transmiten sucesivamente de cada nodo secundario al nodo
maestro. (6) Mosaico las imágenes clasificadas. Las imágenes clasificadas en el nodo maestro
se unen para obtener el resultado final.
Resultados experimentales y análisis.

Globus Toolkit 3.0 se utiliza como la plataforma experimental para establecer un entorno de
computación grid, en el que siete nodos
se implementan, incluido un nodo maestro y seis nodos secundarios. Mientras tanto, la red
estándar de intercambio de Ethernet de 1000 MB
Se utiliza para lograr interacciones entre nodos. Cada nodo está configurado con un
procesador de 3,00 GHz, 2 GB de memoria,
Sistema operativo RedHat9.0 y interfaz de programación paralela MPICHI-G2 [26,27].
La imagen detectada utilizada en los datos de este estudio es la imagen Landsat-4 TM que se
capturó en septiembre de 2006. Contiene seis Bandas espectrales (banda 1 banda 5, banda 7)
con resolución espacial de 30 m. El volumen de datos es 94.4 MB (3442 filas × 4782 columnas).
ENVI 4.5 se utiliza para seleccionar muestras de capacitación para cada clase en forma de ROI
(regiones de interés). Despues estan ellos exportados como archivos Shape de ESRI y abiertos
en ArcGIS 9.2 para obtener las áreas y las coordenadas del centro que se registran en el XML
archivo uno por uno. Y así se aporta la biblioteca de muestra.
Análisis de eficiencia
El MLC se logra tanto en el entorno independiente como en el entorno de red con la ayuda de
una muestra de capacitación
Biblioteca para realizar su automatización. En el primero solo participa el nodo maestro,

mientras que, en el segundo, junto con seis hijos nodos.
En el número de nodos secundarios, especialmente cuando el número es menor que cuatro.

Por lo tanto, se demuestra que la eficiencia de la verificación se mejora mucho en el entorno
de la red en comparación con la del entorno autónomo. Sin embargo, la tasa de disminución
en el costo de tiempo tiende a ser gradual cuando aumenta el número de nodos hijos.
Bibliografía
ArcGis Desktop (2019). Clasificación de máxima verosimilitud. Recuperado de:

https://pro.arcgis.com/es/pro-app/tool-reference/spatial-analyst/maximum-likelihood-
classification.htm
Sun, J., Yang, J., Zhang, C., Yun, W., & Qu, J. (2013). Automatic remotely sensed image
classification in a grid environment based on the maximum likelihood method. Mathematical
and Computer Modelling, 58(3-4), 573-581.

Algoritmo de Maxima Verisimilitud

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Algoritmo de Maxima Verisimilitud

Încărcat de

Drepturi de autor:

Formate disponibile

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR

FACULTAD DE CIENCIAS HUMANAS

Algoritmo de Clasificación de máxima verosimilitud

Si la probabilidad de ocurrencia de algunas clases es mayor (o menor) que el promedio, se

El teorema de Bayes de toma de decisiones

Cuando se realiza una clasificación de máxima verosimilitud, también se puede producir un

En el ejemplo siguiente se muestra cómo se utiliza la herramienta Clasificación de máxima

El ráster multibanda de entrada para la clasificación es una imagen de satélite de Landsat TM

Utilizando el ráster multibanda de entrada y el archivo de firmas, se utiliza la

 Configuraciones que se utilizan en el cuadro de diálogo de la herramienta Clasificación

Archivo de firmas de entrada: signature.gsg

Ráster multibanda de salida: landuse

Fracción de rechazo: 0,0

Ponderación de la probabilidad a priori: EQUAL

Archivo de probabilidades a priori de entrada:

Ráster de confianza de salida: confidence_ras

Eficiente, especialmente cuando está en paralelización. La operación global aumentará el costo

(1) Paso de entrenamiento. Calcula parámetros relevantes y determina la función

Implementación en el entorno autónomo El algoritmo MLC se implementa como un todo.

Resultados experimentales y análisis.

Sistema operativo RedHat9.0 y interfaz de programación paralela MPICHI-G2 [26,27].

Biblioteca para realizar su automatización. En el primero solo participa el nodo maestro,

En el número de nodos secundarios, especialmente cuando el número es menor que cuatro.

ArcGis Desktop (2019). Clasificación de máxima verosimilitud. Recuperado de:

S-ar putea să vă placă și