Clasificacion de Leucocitos Utilizando Vision Por Computadora

UNIVERSIDAD AUTÓNOMA DE TLAXCALA
Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a

DIVISIÓN DE ESTUDIOS DE POSGRADO
Clasificación de Leucocitos utilizando Visión por Computadora
Tesis
Que para obtener el grado de:
Maestro en Ciencias en Ingenierı́a en Computación
Presenta:
Marı́a del Rocı́o Ochoa Montiel
Asesor:
M. en C. Ricardo Solano Monje
Apizaco,Tlax. Abril del 2006

c
Propiedad literaria °2006 por Marı́a del Rocı́o Ochoa Montiel.
U.A.T. Todos los Derechos Reservados.

Dedicatoria
A mi familia.
IV
Índice general
Índice general V
Índice de figuras IX
Índice de tablas XVII
Prefacio XIX
Motivación personal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
Organización de la Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
Resumen XXIII
1. Introducción 1
2. Antecedentes 5
2.1. ¿Cómo identificar leucocitos empleando visión por computadora? . . . . . . 5
2.2. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3.2. Objetivos Especı́ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4. Método de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5. Hardware y software utilizado . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.5.1. Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.5.2. Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
VI ÍNDICE GENERAL
3. Fundamentos 11
3.1. Conceptos biológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.1.1. Composición de la sangre humana . . . . . . . . . . . . . . . . . . . 12
3.1.2. Recuento Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2. Conceptos Estadı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1. Métricas de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.2. Análisis de Componentes Principales –PCA– . . . . . . . . . . . . . 25
3.3. Análisis de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3.1. Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3.2. Filtrado espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.5. Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5.2. Tipos de Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . 40
3.5.3. Entrenamiento por Retropropagación . . . . . . . . . . . . . . . . . 44
3.6. Técnicas de Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4. Estado del Arte 53
4.1. Segmentación de una imagen celular para diagnóstico patológico . . . . . . 53
4.2. Automatización del Recuento Diferencial de la sangre . . . . . . . . . . . . 56
4.3. Mejorado automático de detección de piel en imágenes de color . . . . . . . 57
4.4. Identificación automática de objetos aéreos usando Redes Neuronales . . . . 58
4.5. Análisis de imagen y aprendizaje supervisado en la diferenciación automáti-
ca de células blancas de imágenes microscópicas . . . . . . . . . . . . . . . . 60
4.6. Localización y rastreo de rostros humanos con Redes Neuronales . . . . . . 62
4.7. Localización de rostros humanos en Tiempo Real . . . . . . . . . . . . . . . 65
5. Clasificación de leucocitos 69
5.1. Método para el reconocimiento de células sanguı́neas Segmentadas y No
Segmentadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
ÍNDICE GENERAL VII
5.2. Etapas en la solución del problema . . . . . . . . . . . . . . . . . . . . . . . 70
5.3. Método de clasificación de leucocitos . . . . . . . . . . . . . . . . . . . . . . 71
5.3.1. Adquisición y Preprocesamiento de la imagen . . . . . . . . . . . . . 72
5.3.2. Segmentación en color . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.3.3. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . 81
5.3.4. Entrenamiento de la red . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.3.5. Reconocimiento de observaciones originales . . . . . . . . . . . . . . 94
6. Pruebas y análisis de resultados 95
6.1. Pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.1.1. Adquisición y preprocesamiento de la imagen . . . . . . . . . . . . . 95
6.1.2. Segmentación de la imagen . . . . . . . . . . . . . . . . . . . . . . . 98
6.1.3. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . 105
6.1.4. Entrenamiento de la Red Neuronal . . . . . . . . . . . . . . . . . . . 109
6.2. Análisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7. Conclusiones 117
7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.2. Trabajo a Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Referencias 121
A. Espacios de color 127
A.1. Espacio RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
A.2. Espacio TSL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
A.3. Espacio HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
A.4. Los espacios XYZ, Luv, Lab . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
A.5. Los espacios de color YIQ, YUV, YCbCr y YCC . . . . . . . . . . . . . . . 131
A.6. El espacio CMY(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
B. Galerı́a de imágenes 133

VIII ÍNDICE GENERAL
C. Listado de módulos que componen el método de clasificación 141
Índice alfabético 143

Índice de figuras
1.1. Contadores hematológicos. . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1. Proceso de reconocimiento de células sanguı́neas. . . . . . . . . . . 7
2.2. Hardware utilizado en el sistema de visión. . . . . . . . . . . . . . . . 9
3.1. Componentes de una célula básica. . . . . . . . . . . . . . . . . . . . . 12
3.2. Componentes de la sangre humana. . . . . . . . . . . . . . . . . . . . . 13
3.3. Porcentajes normales en un Recuento Diferencial. . . . . . . . . . . 14
3.4. Tipos de leucocitos y sus caracterı́sticas. . . . . . . . . . . . . . . . . 16
3.5. Preparación de frotis sanguı́neo. . . . . . . . . . . . . . . . . . . . . . 16
3.6. Observación y conteo de leucocitos. . . . . . . . . . . . . . . . . . . . 17
3.7. Tecnologı́a VCS. a) Preparación de la muestra. b) Volumen. b) Conduc-
tividad. d) Dispersión. e) Pruebas simultáneas. . . . . . . . . . . . . . . . . 19
3.8. Contadores Hematológicos. . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.9. Gráfica representativa de una Distribución Gaussiana . . . . . . . . 24
3.10. Proyección sobre el plano definido por las variables X1 y X2 . . . . 24
3.11. Modelo de un sistema de visión. . . . . . . . . . . . . . . . . . . . . . . 27
3.12. Procedimiento para implementar el Filtro de la mediana. . . . . . . 31
3.13. Diseño de un sistema de reconocimiento de patrones. . . . . . . . . 32
3.14. Caracterı́sticas morfológicas de una región. . . . . . . . . . . . . . . . 33
3.15. Momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
X ÍNDICE DE FIGURAS
3.16. Dos curvas de contornos sencillos y sus correspondientes firmas de
distancia-ángulo. En (a) r(θ) es constante. En (b) r(θ) = A sec(θ). . . . . 36
3.17. Regiones con número de Euler -2 y 0, respectivamente. . . . . . . . 36
3.18. Convex Hull. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.19. De la neurona biológica a la neurona artificial. . . . . . . . . . . . . . 38
3.20. Proceso básico de una red neuronal. . . . . . . . . . . . . . . . . . . . 39
3.21. Esquema básico de una neurona artificial que contiene una sóla
entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.22. Funciones de transferencia de uso común. . . . . . . . . . . . . . . . . 41
3.23. Clasificación de las redes neuronales. . . . . . . . . . . . . . . . . . . . 41
3.24. Modelo de red neuronal multicapa alineada hacia adelante (pro-
gresiva). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.1. Proceso de segmentación de imágenes celulares para diagnóstico
patológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2. Imagen de un leucocito tı́pico. La imagen segmentada se presenta en
pseudocolor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3. Calidad de la segmentación. a). Imágenes originales, arriba una célula de
linfoma de Mantle y las dos de abajo son especı́menes de leucemia linfocı́tica
crónica. b). Contornos. c). Células segmentadas. . . . . . . . . . . . . . . . . 55
4.4. Segmentación de núcleos de varias categorı́as de células. El borde
del núcleo está marcado con blanco. . . . . . . . . . . . . . . . . . . . . . . 55
4.5. Esquema de segmentación. a). Generación de subimágenes conteniendo
células solas. b). Segmentación de núcleos y citoplasmas. . . . . . . . . . . . 56
4.6. Secuencia de procesamiento. a. Imagen original. b. Imagen saturada. c.
Salida K-medias. d. Salida final. . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.7. Esquema de la detección automática de piel en imágenes de color. 58
4.8. Secuencia de procesamiento. Imagen original y resultados obtenidos des-
pués de aplicar la segmentación. . . . . . . . . . . . . . . . . . . . . . . . . 58

ÍNDICE DE FIGURAS XI
4.9. Componentes del sistema de clasificación de objetos aéreos. Adqui-
sición de caracterı́sticas y entrenamiento de la red neuronal. . . . . . . . . . 59
4.10. Aviones utilizados en el estudio. . . . . . . . . . . . . . . . . . . . . . . 59
4.11. Sistema de clasificación de células blancas sanguı́neas. . . . . . . . . 60
4.12. Ejemplos de imágenes completas utilizadas en la investigación. De
izquierda a derecha: basófilo, eosinófilo, linfocito, neutrófilos. . . . . . . . . 61
4.13. Eosinófilo. Resultados de la detección de bordes Canny. . . . . . . . . . . 61
4.14. Ejemplos de cı́rculos ajustados manualmente. Resultados del algorit-
mo de detección de cı́rculos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.15. Estructura del sistema de localización y rastreo de rostros humanos. 63
4.16. Localización de un rostro. a). Imagen original b). Imágenes en secuencia
c). Diferencia de las dos imágenes d). Conjunto de pixeles con caracterı́sticas
de movimiento e). Aplicación del clasificador general de color de rostros
–GFCC– f). Conjunto de pixeles con caracterı́sticas de color de piel g).
Objetos con caracterı́sticas de movimiento y color de piel h). Objetos más
grandes i). Rostro localizado. . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.17. Creación del clasificador de color de rostros. a). Primero se escoge un
área de interés en la imagen b). Se crea un modelo de distribución de color
para el área seleccionada c). Se umbraliza como pixeles de piel aquellos que
posean valores que se encuentren dentro de la media promedio. . . . . . . . 64
4.18. Localización de un rostro utilizando el modelo de color de piel. . . 65
4.19. Ejemplo de localización de un rostro usando una combinación de
color, geometrı́a, e información de movimiento. . . . . . . . . . . . . 67
5.1. Organización general. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2. Proceso de adquisición de la imagen. . . . . . . . . . . . . . . . . . . . 72
5.3. Procedimiento de instalación de la cámara. Izq.- Montaje de Acceso-
rios. Der.- Cámara ajustada al microscopio. . . . . . . . . . . . . . . . . . . 74
5.4. Tipos de Leucocitos. Segmentados: neutrófilo y eosinófilo, No Segmenta-
dos: linfocito y monocito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

XII ÍNDICE DE FIGURAS
5.5. Célula segmentada neutrófila. . . . . . . . . . . . . . . . . . . . . . . . 75
5.6. Desarrollo del proceso de segmentación. . . . . . . . . . . . . . . . . . 76
5.7. Histogramas de los canales RGB de un recorte de núcleo de una
célula segmentada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.8. Diferencias entre d1 y d2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.9. Resultados de Filtro inicial aplicado a una célula segmentada. . . . 78
5.10. Umbralización con el Modelo de Mahalanobis. a)Imagen original.
b)Imagen después de aplicar filtro inicial. c)Imagen después de aplicar mo-
delo de Mahalanobis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.11. Extracción de caracterı́sticas. . . . . . . . . . . . . . . . . . . . . . . . 82
5.12. Almacenamiento de las caracterı́sticas estructurales. . . . . . . . . . 83
5.13. Método para el cálculo de las caracterı́sticas radiales. . . . . . . . . 87
5.14. Almacenamiento de las caracterı́sticas radiales obtenidas aleato-
riamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.15. Izquierda. Perı́metro de un núcleo. Centro. Puntos escogidos para formar
V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0
en el escalamiento lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.16. A la izquierda: Región nuclear de una célula segmentada. A la derecha:
Perı́metro de la región de la izquierda. . . . . . . . . . . . . . . . . . . . . . 89
5.17. Perı́metro de la región de interés. Arriba. Representación del perı́me-
tro en el dominio del tiempo. Abajo. Representación del perı́metro en el
dominio de la frecuencia, considerando solo la parte de magnitud después
de aplicar la FFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.18. Almacenamiento de las caracterı́sticas obtenidas después de apli-
car FFT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.1. Recolección de muestras sanguı́neas. Izquierda. Elección del paciente.
Centro. Extracción de la sangre. Derecha. Preparación y tinción del frotis. . 96

ÍNDICE DE FIGURAS XIII
6.2. Adquisición de las observaciones. Izquierda: Gota de aceite sobre el
frotis. Centro: Colocación del frotis sobre la base del microscopio. Derecha:
Campo visto a través de la cámara. . . . . . . . . . . . . . . . . . . . . . . . 97
6.3. Campos vistos al microscopio con diferentes aumentos. Izquierda:
Utilizando el objetivo de 40X. Derecha: Utilizando el objetivo de 100X. . . 97
6.4. Tipos de glóbulos blancos. Arriba.- Segmentados: Neutrófilo, Eosinófilo,
Basófilo. Abajo.- No Segmentados: Linfocito y monocito. . . . . . . . . . . . 98
6.5. Glóbulos blancos digitalizados. . . . . . . . . . . . . . . . . . . . . . . 98
6.6. Recorte de núcleo de una célula de la clase Segmentada. . . . . . . 99
6.7. Histogramas de los canales RGB de 4 tipos de recortes de núcleos.
La primera fila de histogramas corresponde a una célula Segmentada Eo-
sinófila. La segunda fila de histogramas pertenece a una célula Segmentada
Neutrófila. La tercera fila de histogramas es de una célula No Segmentada
linfocı́tica. La cuarta fila es de una célula No Segmentada Monocı́tica . . . . 100
6.8. Resultados del filtro inicial. a).- Célula Segmentada Eosinófila. b).-
Célula Segmentada Neutrófila. c).- Célula No Segmentada linfocı́tica.
d).- Célula No Segmentada Monocı́tica . . . . . . . . . . . . . . . . . . . 101
6.9. Resultados del filtro inicial aplicado a imágenes muy claras. a).-
Célula No Segmentada Monocı́tica. b).- Célula Segmentada Neutrófila.
c) y d) Células Segmentadas eosinófila. . . . . . . . . . . . . . . . . . . . 101
6.10. Resultados del filtro inicial aplicado a imágenes obscuras. La célula
que esta en la parte superior izquierda es un neutrófilo y las demás son
eosinófilos, ambas pertenecientes a la clase segmentados. . . . . . . . . . . 102
6.11. Resultados del filtro inicial aplicado a imágenes de células semi-
destruidas. En este caso la claridad no se considera. . . . . . . . . . . . . . 102
6.12. Resultados del filtro inicial aplicado a imágenes de células con el
núcleo muy dividido. En este caso la claridad no se considera. . . . . . . 103
6.13. Conversión del espacio de color RGB a TSL. . . . . . . . . . . . . . . 103
6.14. Unión de los vectores T y S de los n Recortes de núcleos. . . . . . 103

XIV ÍNDICE DE FIGURAS
6.15. Correlación entre las variables Tono y Saturación correspondientes
a los vectores T y S, respectivamente. Los valores de T son normalizados.105
6.16. Resultados de la segmentación del núcleo de un monocito. . . . . . 105
6.17. Matriz de caracterı́sticas estructurales. Las columnas denotadas con
Si representan a las caracterı́sticas de células Segmentadas mientras que
las que se denotan con Ni indican a las caracterı́sticas de células No Seg-
mentadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.18. Matriz de caracterı́sticas estructurales con análisis de varianza. . . 108
6.19. Matriz de caracterı́sticas radiales utilizando escalamiento con trans-
formación lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.20. Tipos de entrenamiento y funciones de transferencia. . . . . . . . . 110
6.21. Distribución de las observaciones para la experimentación. . . . . . 110
6.22. Distribución de las observaciones por clase. . . . . . . . . . . . . . . . 111
6.23. Resultados de las configuraciones utilizando diferentes observacio-
nes de células Segmentadas y No Segmentadas. . . . . . . . . . . . . 112
6.24. Comportamiento de entrenamiento utilizando diferentes observa-
ciones de células Segmentadas y No Segmentadas con caracterı́sti-
cas estructurales y radiales. . . . . . . . . . . . . . . . . . . . . . . . . . 113
A.1. Diagrama esquemático de los 3 ejes del sistema de color Mun-
sell.Tomado de Hall, E.L. Computer Image Processing and Recognition.
Academic Press, New York. 1979 . . . . . . . . . . . . . . . . . . . . . . . . 129
B.1. Leucocitos segmentados: Eosinófilos. (Continúa) . . . . . . . . . . . . 134
B.2. Leucocitos segmentados: Eosinófilos. (Continuación) . . . . . . . . . . 135
B.3. Leucocitos segmentados: Neutrófilos. (Continúa) . . . . . . . . . . . . 136
B.4. Leucocitos segmentados: Neutrófilos. (Continuación) . . . . . . . . . . 137
B.5. Leucocitos no segmentados: Linfocitos. (Continúa) . . . . . . . . . . . 138
B.6. Leucocitos no segmentados: Linfocitos. (Continuación) . . . . . . . . . 139
B.7. Leucocitos no segmentados: Monocitos. . . . . . . . . . . . . . . . . . 139

ÍNDICE DE FIGURAS XV
B.8. Casos especiales. En b1 y b2 se observan células basófilas pertenecientes
a la clase segmentados, es un tipo de célula que por su rareza fue excluı́da
de las pruebas hechas en la investigación. DOSe66-n contiene abajo un
neutrófilo pequeño, arriba un eosinófilo con el núcleo parcialmente destruido
y distribuido en el citoplasma. DOSe103-mono muestra arriba a la izquier-
da un eosinófilo y abajo a la derecha un monocito. En DOSl40mono3 se
observa arriba a la derecha un monocito y abajo a la izquierda un linfocito.
DOSn28linfo10 arriba a la derecha presenta un neutrófilo grande y abajo
a la izquierda un linfocito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

Índice de tablas
3.1. Caracterı́sticas que permiten describir la forma de una región. . . 35
4.1. Principales trabajos relacionados . . . . . . . . . . . . . . . . . . . . . 66
5.1. Caracterı́sticas estructurales. . . . . . . . . . . . . . . . . . . . . . . . 83
5.2. Caracterı́sticas estructurales iniciales para el análisis de varianza. 84
5.3. Resultados del análisis de varianza para 17 caracterı́sticas estruc-
turales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4. Caracterı́sticas estructurales obtenidas con el análisis de varianza. 86
C.1. Principales funciones programadas . . . . . . . . . . . . . . . . . . . . 142

Prefacio
Motivación personal
La fuerza motivadora para la realización de este trabajo de tesis ha sido el interés por
aplicar técnicas de visión por computadora en el área del análisis clı́nico, encaminado a
encontrar un método que permita a la computadora realizar el proceso de visión como lo
harı́a el ser humano en la identificación de células sanguı́neas.
Ası́, el objetivo principal es proponer una técnica que permita identificar leucocitos y
clasificarlos biológicamente en segmentados y no segmentados.
La técnica propuesta no pretende competir con las máquinas disponibles en el mercado
que son capaces de realizar tareas similares empleando mecanismos no visuales. Tampoco
es una meta de este trabajo obtener un sistema listo para ser utilizado en el área clı́nica
y reemplazar a los métodos ya existentes, debido a que el análisis visual consume más
tiempo que los métodos fı́sico-quı́micos. Además la automatización completa requiere de
un sistema que permita la manipulación del microscopio para la adquisición de la imagen,
lo cual resulta difı́cil aún para un experto del área clı́nica.
Organización de la Tesis
Este trabajo de tesis se ha dividido en 7 capı́tulos que progresivamente llevarán al lec-
tor a tener una idea clara del proceso de Clasificación de Células Sanguı́neas empleando
técnicas de Visión por computadora.
En el primer Capı́tulo, se encontrará un resumen sobre la situación actual en el área

XX
de los análisis clı́nicos respecto al proceso de identificación y clasificación de células san-
guı́neas, en especial de leucocitos o glóbulos blancos. Además se presenta un bosquejo
general acerca de la problemática abordada en este trabajo y su método de solución.
En el Capı́tulo 2 se presenta la definición del problema, ası́ como las propuestas de
solución, objetivos y material utilizado en el transcurso de la investigación.
El Capı́tulo 3 es dedicado a la explicación de los antecedentes teóricos, necesarios pa-
ra el entendimiento de las secciones posteriores; incluyendo tópicos como definiciones de
elementos biológicos y hematológicos, técnicas de preparación de las muestras biológicas
y métodos de clasificación de las mismas, conceptos estadı́sticos, teorı́a de procesamiento
de imágenes, extracción de caracterı́sticas, redes neuronales y técnicas de validación de
resultados.
En el Capı́tulo 4 se comentan algunos trabajos relacionados con el problema aborda-
do en esta tesis, considerando principalmente aquellos que se relacionan con técnicas de
segmentación en color.
En el Capı́tulo 5 se describe el diseño y la implementación del proceso de identificación
y clasificación de leucocitos Segmentados y No segmentados.
En el Capı́tulo 6 se muestran las pruebas realizadas y se comentan los resultados obte-
nidos.
En el Capı́tulo 7 estan las conclusiones y sugerencias para trabajos futuros.
Esperando sea útil para futuros trabajos de investigación, se anexa la base de datos
utilizada en formato digital, además de los códigos fuente correspondientes a las funciones
implementadas incluyendo algunos experimentos adicionales que no se reportan en este
trabajo, ası́ como el código latex que produjo este documento.
Marı́a del Rocı́o Ochoa Montiel1
Asesor: M. en C. Ricardo Solano Monje2 .
Apizaco, Tlax. Abril 2006.
1
Email: rocio730@prodigy.net.mx
2
Email: rsolanomonje@hotmail.com
Agradecimientos
A todas las personas que de manera incondicional, brindaron parte de su valioso tiempo
para conocer y hacer posible la realización de este trabajo.
Para empezar quiero agradecer a mi tı́a Genobeba Montiel Corona, quien me ha apo-
yado mucho al hacerse cargo del cuidado de mis hijos y las labores domésticas para que
yo pudiera dedicar el tiempo necesario para hacer posible la realización de este trabajo de
tesis.
Doy gracias a mi asesor por su apoyo y guı́a en las actividades involucradas en la rea-
lización de este trabajo y por sus consejos para que esta tesis fuera posible.
También deseo agradecer al M. en C. José Alberto Chávez Aragón3 por las sugerencias
que permitieron mejorar este trabajo de tesis.
Agradezco al Dr. Francisco J. Albores Velasco4 por su apoyo persistente y desinteresado
en la resolución de mis problemas matemáticos.
Quiero agradecer especialmente al M. en C. Orión Fausto Reyes Galaviz5 por la revisión
desinteresada de mi trabajo de tesis y por su disposición constante en las revisiones del
código correspondiente al uso de Redes Neuronales.
Al Dr. Isaı́as López Morales6 , al Dr. Manuel Hernández Gutiérrez7 y al M. en C.
3
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: achavez@ingenieria.uatx.mx
4
Email: jalbores@ingenieria.uatx.mx
5
Email: orionfrg@ingenieria.uatx.mx
6
Catedrático del área de Matemáticas Aplicadas en la Facultad de Ciencias Básicas.
Email: ilm@ingenieria.uatx.mx
7
XXII
José Erasmo Pérez Vázquez8 por su apoyo en la resolución de mis dudas relacionadas con
el código Latex producido de esta tesis.
No menos importante es agradecer a Laboratorios Biodiagnostics por prestar sus ins-
talaciones y equipo clı́nico para la obtención de las muestras biológicas y especialmente
reconocer el trabajo realizado por el Q.F.B. Gonzálo Romero Tirso en las tareas de reco-
lección y preparación de los frotis sanguı́neos ası́ como su valioso apoyo en la identificación
de las células que se utilizaron en este trabajo de tesis.
Finalmente, al M. en C. Antonio Durante Murillo9 agradezco las facilidades brindadas
durante el proceso administrativo y que han permitido que este trabajo concluya exitosa-
mente.
A todos mis colegas que me han hecho crı́ticas y sugerencias, mil gracias.
8
Catedrático del área de Matemáticas Aplicadas en la Facultad de Ciencias Básicas.
Email: erasmo@ingenieria.uatx.mx
9
Director de la Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a.
Resumen
El propósito de este trabajo de tesis es utilizar visión por computadora para identificar
y clasificar células sanguı́neas. Estas células estan contenidas en un conjunto de imáge-
nes adquiridas a través de un sistema de visión. El método propuesto esta basado en un
algoritmo de segmentación que fue utilizado originalmente para la segmentación de piel.
Adicionalmente, se utilizó una red neuronal para la tarea de clasificación.
El algoritmo de segmentación adaptado permite crear un modelo de color, y haciendo
uso de este modelo se realiza el proceso de segmentación. Esto permite extraer las carac-
terı́sticas de la región de interés. Hay 3 tipos de caracterı́sticas extraı́das: estructurales,
estructurales con análisis de varianza y radiales.
El proceso de identificación esta constituido por un sistema de aprendizaje – la red
neuronal –, la cual es entrenada con las caracterı́sticas mencionadas anteriormente. Los
resultados se basan en el uso de una red neuronal de retropropagación, utilizando ya sea
caracterı́sticas estructurales, estructurales con análisis de varianza o radiales para la etapa
de entrenamiento.
El primer conjunto de datos de entrenamiento consistió de 13 atributos de la región de
interés. El ı́ndice de reconocimiento obtenido con éste conjunto fue de 84.54 %.
El segundo conjunto de datos de entrenamiento fue formado por 8 caracterı́sticas ob-
tenidas después de realizar un análisis de varianza a un subconjunto de 17 caracterı́sticas
estructurales. En este caso se obtiene un ı́ndice de reconocimiento del 85.82 %.
El tercer conjunto de datos de entrenamiento consiste de 111 caracterı́sticas radiales,
que corresponden a las distancias del centro de masa de la región de interés a su perı́metro.
Antes de usar este conjunto de datos para el entrenamiento de la red neuronal, se aplicó la
XXIV
FFT(Transformada Rápida de Fourier –por sus siglas en inglés–) para eliminar variacio-
nes en las caracterı́sticas extraı́das relacionadas con la rotación o escala, incrementando el
desempeño de la fase de clasificación hasta en un 99.54 %.
En todos los casos, las caracterı́sticas se preprocesaron con PCA. El desempeño de la
fase de entrenamiento –el desempeño de la red neuronal–, se evaluó utilizando la técnica
de validación cruzada en 10 particiones.

Abstract
The purpose of this work is to use computer vision in order to identify and clasify blood
cells. These cells are extracted from a set of images which were adquired through a vision
system. The proposed method is based on segmentation algorithm, that was previously
used for skin segmentation. Additionally, a neural network was used for the classification
task.
The adapted segmentation algorithm allows to create a color model and making used
of this model the segmentation process is performed. This allows to extract the characte-
ristics of the region that concerns us. There are three types of extracted characteristics:
structurals, structurals with variance analysis and radials. The identification process is ac-
complished by means of a learning system -the neural network- which is trained with the
characteristics of the previous phase. The results are based on the use of a back-propagation
neural network, using the structural, structurals with variance analysis or radial characte-
ristics for the training phase.
The first set of training data consists of 13 attributes of the segmented region of inter-
est. The positive index obtained from this set was of 84.54 %.
The second training data was made of 8 characteristics obtained from a variance analy-
sis of a subset of 17 structurals characteristics. In this case the recognition rate obtained
was 85.82 %.
The third training data set consisted of 111 radial characteristics which were corres-
ponded to the distances taken from the center of mass of the region of interest to its
perimeter. Before using this data set for training the neural network. The FFT (Fourier
Fast Transform) was applied in order to eliminate to variations in the extracted features
XXVI
such as rotation or scaling changes. As a result, the classification performance increased up
to 99.54 %. In every case the characteristics were propocessed with PCA. The performance
of the training phase –the neural network performance– were evaluated using the Ten Fold
Cross Validation approach.

Capı́tulo 1
Introducción
En instituciones de salud pública y privada se realizan exámenes de laboratorio rela-
cionados con el análisis de sangre, uno de ellos es el Recuento Diferencial que consiste en
la identificación, clasificación y conteo de glóbulos blancos. El objetivo principal de esta
prueba es contribuir en conjunto con los resultados de otras pruebas de laboratorio, a
proporcionar al médico datos que ayuden a dar un diagnóstico en un paciente, además de
formar parte de los análisis preoperatorios requeridos en intervenciones quirúrgicas. Los
resultados de un Recuento Diferencial también son útiles en diagnósticos de leucemias,
parasitosis, cuadros infecciosos y anemia, entre otros [Oppenheim, 1998].
De esta manera una gran cantidad de células sanguı́neas de la serie blanca1 son clasifi-
cadas en laboratorios clı́nicos utilizando microscopios , lo que resulta en una tarea subjetiva
y detallada [Ushizima et al., 2004]. Un técnico clı́nico capacitado toma de 10 a 15 minutos
para evaluar y contar 100 células para cada laminilla2 , un tiempo considerable y susceptible
para que ocurra un error en el análisis.
Debido a la importancia que este tipo de análisis tiene, sus aplicaciones y el volu-
men de muestras que es necesario revisar diariamente, algunas instituciones de salud uti-
lizan máquinas capaces de realizar un cierto número y tipo de análisis clı́nicos incluyendo
el Recuento Diferencial, disminuyendo en parte el riesgo para el humano al tener me-
nos contacto directo con muestras posiblemente infectadas. En la Figura 1.1, tomada de
1
glóbulos blancos o leucocitos
2
muestra de frotis sanguı́neo teñido para recuento diferencial
2 1 INTRODUCCIÓN
Figura 1.1: Contadores hematológicos.
[Beckman Coulter, 2006] se muestran dos tipos de máquinas empleadas en análisis clı́nicos.
Sin embargo, la desventaja de realizar los análisis empleando máquinas de este tipo
es que su mantenimiento es costoso, además de que son productos caros que no propor-
cionan resultados completos y certeros en el examen llamado Recuento Diferencial debido
posiblemente a que los mecanismos que emplean para hacer esta diferenciación se basan
en métodos fı́sicos y quı́micos, no en un análisis visual; hecho que ha ocasionado que aún
se siga utilizando el método manual descrito en la sección 3.1.2.
En busca de un método que permita realizar esta identificación empleando visión por
computadora, surge este trabajo de tesis, el cual una vez terminado no pretende de ninguna
manera sustituir a los métodos tradicionales para la realización del Recuento Diferencial,
ya sea hecho por un experto o por una máquina sino encontrar una alternativa para el
análisis visual de especı́menes biológicos y en un futuro servir como marco de referencia
para el desarrollo de una aplicación que sirva de apoyo a los estudiantes del área clı́nica en
algunas instituciones educativas del nivel medio superior o superior.
Por otra parte, la imagen completa de un leucocito es insuficiente para diferenciarlos
de entre sus propios subtipos. Su clasificación se realiza en principio considerando carac-
terı́sticas de la forma del núcleo de la célula.
El presente trabajo aborda por un lado el problema de reconocimiento de patrones
en el análisis de imágenes de sangre humana, y por otro el cómo la información de color
presente en su núcleo puede hacer posible la extracción de caracterı́sticas que permitan
la diferenciación de leucocitos en 2 subclases: leucocitos segmentados y leucocitos no
segmentados.
Como parte de la solución propuesta se trabaja con un grupo de 354 muestras obteni-
das con una cámara digital adaptada al ocular de un microscopio óptico. Posteriormente se
3
utiliza un modelo propuesto por [Tomaz et al., 2003] para la segmentación de piel humana
que se adaptó para la segmentación de núcleos celulares . Una vez obtenida la región de
interés se extraen caracterı́sticas que permiten clasificar a los leucocitos en dos clases: célu-
las segmentadas y células no segmentadas. El método usado para la clasificación es
una red neuronal de retropropagación que recibe como entrada un vector de caracterı́sticas
de cada núcleo extraı́do durante la segmentación.
Finalmente se concluye que para el espacio de color utilizado, la detección eficiente
–segmentación adecuada– depende de la capacidad del modelo de color para estimar la
distribución de color del núcleo celular y, lo más importante la discriminabilidad entre
distribuciones de núcleo y no núcleo.
Por otra parte, se comprobó que las caracterı́sticas radiales son buenos descriptores de
las formas nucleares de los leucocitos.
El aporte que se puede apreciar en este trabajo, es que el uso de un espacio de color
adaptado para núcleos celulares y la aplicación de métodos estadı́sticos, son útiles en la
segmentación en color de núcleos en leucocitos, permitiendo extraer caracterı́sticas que
permiten definir la forma del núcleo de la célula.
De esta manera, los resultados demuestran que es factible el uso de la técnica pro-
puesta en el presente trabajo para el análisis de muestras biológicas, en las cuales es de
suma importancia la detección de anormalidades morfológicas y colorimétricas, además de
constituir una alternativa para el análisis e identificación de cualquier tipo de objeto con
técnicas de visión por computadora.

Capı́tulo 2
Antecedentes
Este capı́tulo refiere el problema de la segmentación de células blancas y su clasificación.
Se describe la hipótesis, los objetivos y el método de solución propuesta. Finalmente se hace
mención del hardware y software utilizado durante el desarrollo de esta tesis.
2.1. ¿Cómo identificar leucocitos empleando visión por compu-
tadora?
La respuesta a esta pregunta constituye la problemática principal de este trabajo de
tesis. La razón principal de intentar dar respuesta a esta pregunta es, por un lado en-
contrar un método que se asemeje al proceso realizado por un ser humano al tratar de
identificar células blancas, y por otro proponer una alternativa para la identificación de
este tipo de muestras que esté apoyada en técnicas de visión por computadora. El método
de clasificación propuesto consiste en determinar si una célula blanca es Segmentada o
No segmentada1 considerando su color y morfologı́a nuclear. Se toman caracterı́sticas de
color y forma debido a que un experto humano identifica y clasifica a los glóbulos blancos
vistos en un frotis, detectando estas caracterı́sticas en primera instancia.
Como se comenta en la Introducción de esta tesis, actualmente la mayorı́a de los la-

1
los términos segmentada y no segmentada corresponden a una clasificación en la cual se considera la
morfologı́a nuclear para determinar ambas clases. El tipo segmentado corresponde a un núcleo fragmenta-
do(dividido) y el no segmentado a un núcleo semicircular, sin divisiones.
6 2 ANTECEDENTES
boratorios clı́nicos en México, realizan el análisis llamado Recuento Diferencial empleando
un método manual realizado por un experto.
2.2. Hipótesis
El tema principal de este trabajo esta directamente relacionado con técnicas de visión
por computadora. Y como variable principal en el proceso de identificación se utiliza el
color para la segmentación y la morfologı́a nuclear para la clasificación, pues una buena
caracterización del núcleo es suficiente para ubicar a los glóbulos blancos en dos grupos:
segmentados y no segmentados. De esta manera, la hipótesis se enuncia de la siguiente
manera:
Es posible clasificar a los glóbulos blancos en segmentados y no segmentados uti-
lizando técnicas de visión por computadora, especı́ficamente mediante la segmentación en
color de los núcleos celulares, y el uso de caracterı́sticas que describen la forma dicho
núcleo: caracterı́sticas estructurales, caracterı́sticas estructurales con análisis de varianza
o caracterı́sticas radiales.
2.3. Objetivos
2.3.1. Objetivo General
Desarrollar un método que permita clasificar glóbulos blancos de sangre humana, en
segmentados y no segmentados a partir de imágenes digitalizadas obtenidas de una
cámara adaptada a un microscopio óptico.
2.3.2. Objetivos Especı́ficos
Revisar el procedimiento manual actualmente utilizado para modelar la solución.
Analizar visualmente las células blancas para elegir las caracterı́sticas utilizadas en
su clasificación.
Sustentar los resultados dentro de varias alternativas factibles.

2.4 Método de solución 7
Figura 2.1: Proceso de reconocimiento de células sanguı́neas.
En capı́tulos posteriores se describirán los procedimientos detallados para la demostración
de la hipótesis formulada y el logro de los objetivos propuestos.
2.4. Método de solución
En la Figura 2.1 se muestra el modelo que compone el proceso de reconocimiento de
células sanguı́neas. Como se observa, se comienza por adquirir las muestras biológicas que
se utilizan durante el proceso de investigación.
El siguiente paso es digitalizar las imágenes de leucocitos para iniciar el proceso de
análisis de la imagen, que consiste en segmentar a la región de interés. En este caso, la
región de interés corresponde al núcleo de la célula, dado que la forma que lo caracteriza
es lo que hace la diferencia entre las dos clases de leucocitos que se deben reconocer. Estas
clases son:
1. Leucocitos segmentados: Poseen un núcleo de forma irregular, presentan de 2 a 3
lóbulos. En ocasiones el núcleo no se distingue bien debido a los gránulos2 presentes
en el citoplasma como en el caso de los basófilos.
2. Leucocitos no segmentados: Poseen un núcleo de forma redondeada, ovoide y
compacta. En la mayorı́a de los casos no hay protuberancias3 .

2
partı́culas pequeñas que se encuentran suspendidas en el citoplasma de la célula.
3
extensiones de la célula ocasionadas por el rompimiento de la membrana que la rodea.
8 2 ANTECEDENTES
En el proceso de análisis de la imagen se propone un modelo de color que permita realizar
una segmentación automática de los núcleos celulares, para delimitarlos de la mejor manera
posible y extraer caracterı́sticas que mejor describan su forma.
Al concluı́r la etapa de análisis de la imagen se extraen caracterı́sticas de la región de
interés. Las caracterı́sticas que describen a la región se agrupan en 3 clases:
1. Descriptores estructurales
2. Descriptores estructurales con análisis de varianza
3. Descriptores de Fourier
Los descriptores estructurales considerados en este trabajo corresponden a atributos de la
región que son medibles y que además, proporcionan información útil sobre la composición
de la región [Pajares and de la Cruz, 2002]. Algunas de ellas son el área, el perı́metro, el
centro de masa, el número de huecos, la longitud de eje mayor y menor respectivamente.
Los descriptores estructurales con análisis de varianza están formados por un conjunto
de caracterı́sticas estructurales que resultan de hacer un análisis de varianzas, en el cual se
eligen aquellas caracterı́sticas cuya varianza entre ambas clases de células sea significativa.
Los descriptores de Fourier son representaciones gráficas de la forma de la región, que
se calculan utilizando la técnica de [Abdallah et al., 1995].
Como resultado de la extracción de caracterı́sticas se obtiene un vector de caracterı́sticas
estructurales, un vector de caracterı́sticas estructurales con análisis de varianza y un vector
de caracterı́sticas radiales (descriptores de Fourier) para cada imagen. Con cada conjunto
de caracterı́sticas se entrena una red neuronal de retroprogapación, que es el clasificador
elegido para evaluar a las caracterı́sticas seleccionadas, dado que en el trabajo reportado
por [Katz, 2000], se observa un buen desempeño cuando se trabaja con datos similares a
los que integran a los vectores de caracterı́sticas utilizados en esta tesis.

2.5 Hardware y software utilizado 9
Figura 2.2: Hardware utilizado en el sistema de visión.
2.5. Hardware y software utilizado
Los elementos que fueron utilizados en el desarrollo de este trabajo se mencionan a
continuación.
2.5.1. Hardware
El hardware utilizado para el sistema de visión se muestra en la Figura 2.2. Las imágenes
fueron tomadas de [Mot, 2004].
La implementación fue realizada en una computadora con un procesador INTEL Centrino
1.5Ghz y 512MB.
2.5.2. Software
El software utilizado en este trabajo consiste en:
Sistema operativo: Windows XP Home Edition versión 2002 Service Pack 2.
Software de la cámara: Motic Images 2000 versión 1.2 [Mot, 2004].

10 2 ANTECEDENTES
Software de programación: Matlab 6.0.0.88.

Capı́tulo 3
Fundamentos
En este capı́tulo se describen los conceptos básicos, necesarios para la plena compren-
sión del resto del trabajo de tesis. Se definen conceptos relacionados con citologı́a, hema-
tologı́a, procesamiento de imágenes, estadı́stica, redes neuronales, y técnicas de validación
de resultados.
3.1. Conceptos biológicos
Para tener una descripción más amplia respecto a los elementos biológicos que consti-
tuyen el objeto de estudio en este trabajo de tesis, se describe la anatomı́a y fisiologı́a de
la célula.
Una célula es la unidad anatómica y fisiológica que compone a un ser vivo y está for-
mada fundamentalmente por una membrana, un citoplasma y un núcleo. La membrana es
la parte que cubre a la célula y que visualmente representa su silueta marcando los lı́mites
entre ella y su entorno. El citoplasma es la parte que se encuentra después de la mem-
brana en el cual estan suspendidos los órganos internos de la célula, su consistencia puede
ser lı́quida o viscosa. Dentro del citoplasma se encuentra el núcleo, que regularmente esta
situado en la parte central de la célula y es el encargado de controlar la actividad celular.
En la Figura 3.1, tomada de [Sánchez, 2006] se muestra un ejemplo señalando algunas de
sus partes.
12 3 FUNDAMENTOS
Figura 3.1: Componentes de una célula básica.
En ocasiones la célula es incolora, dificultando su análisis visual a través de un micros-
copio. Al conocerse su composición quı́mica es posible determinar qué tipo de colorantes
usar (ácidos o básicos) para teñirlas y poder visualizarlas distinguiendo mejor sus partes.
Debido a que en el núcleo se encuentra la información genética de la célula y como conse-
cuencia los ácidos nucléicos ADN1 y RDN2 [Wikipedia Foundation, 2006], su composición
generalmente es ácida, en cambio el citoplasma tiende a ser quı́micamente más básico3 . Ası́,
los núcleos de los leucocitos generalmente se tiñen de morado en respuesta a los colorantes
utilizados para teñirlos.
3.1.1. Composición de la sangre humana
La sangre humana es un compuesto formado por 2 elementos fundamentales, el plasma
y el paquete globular. El plasma es la parte lı́quida de la sangre, mientras que el paquete
globular lo forman un conjunto de células que se encuentran suspendidas en él, como los
glóbulos rojos (eritrocitos), glóbulos blancos (leucocitos) y las trombocitos (plaquetas).
Cada uno de ellos tiene su función particular [Woodliff and Herrmann, 1993].
El color de la sangre esta determinado por la hemoglobina presente en los eritroci-

1
ácido desoxirribonucléico, constituye el materal genético de los organismos.
2
ácido ribonucléico, sirve como una plantilla para la traducción de genes.
3
se refiere a que posee un PH alcalino.
3.1 Conceptos biológicos 13
Figura 3.2: Componentes de la sangre humana.
tos, cuya función principal es transportar el oxı́geno a todo el cuerpo. Las plaquetas se
encargan de los procesos de coagulación, en tanto que los leucocitos constituyen el me-
canismo de defensa desempeñándose como anticuerpos4 . En la Figura 3.2 se muestra un
esquema de la clasificación completa de las células que se encuentran en la sangre humana
[Cormack, 1997].
Leucocitos
Etimológicamente los leucocitos deben su nombre a las palabras leuco (blanco) y ci-
to (célula). En personas saludables, el número de leucocitos varı́a entre 5000 y 10, 000,
en condiciones patológicas pueden estar aumentados (leucocitosis) o disminuidos (leucope-
nia). En la Figura 3.3 se muestran los subtipos de leucocitos y los porcentajes normalmente
encontrados en un Recuento Diferencial según [Oppenheim, 1998].
Los neutrófilos, monocitos y eosinófilos poseen propiedades fagocitarias5 que consti-
tuyen un mecanismo de defensa antibacteriana y una contribución para la eliminación de
desechos. Los linfocitos son productores de anticuerpos, mientras que los basófilos poseen
4
son un tipo de proteı́nas producidas por el sistema inmune en respuesta a la presencia de sustancias
extrañas potencialmente dañinas que pueda ser una amenaza para el organismo: como quı́micos, partı́culas
de virus, esporas (cuerpos microscópicos unicelulares o pluricelulares que por división propia dan nacimiento
a nuevos organismos en vegetales criptógamos, hongos y algunas especies protozoarias.) o toxinas (proteı́nas
o lipopolisacáridos que causan daños concretos a un huésped) de las bacterias [Webner, 2006].
5
propiedad de una célula para atraer partı́culas y destruirlas o digerirlas.
14 3 FUNDAMENTOS
Figura 3.3: Porcentajes normales en un Recuento Diferencial.

gránulos de heparina e histamina6 .
En las infecciones, cuadros tóxicos y hemorragias se produce una respuesta leucocitaria
en la sangre, de acuerdo con la intensidad del estı́mulo y la capacidad de reacción del
individuo. Las primeras células que aumentan en número ante un cuadro infeccioso son los
neutrófilos, mientras los monocitos y linfocitos aumentan en etapas posteriores. En ejerci-
cios muy forzados o embarazo puede haber una moderada leucocitosis7 fisiológica, no rela-
cionada con procesos patológicos. En la Figura 3.4, tomada de [Freggiaro and Espejo, 2006]
se muestran imágenes de los tipos de leucocitos más comunes.
3.1.2. Recuento Diferencial
Método manual
El Recuento Diferencial consiste en examinar la morfologı́a de glóbulos blancos, ası́ como
su tamaño y número [Oppenheim, 1998]. El método para la preparación de la muestra em-
pleada para hacer un Recuento Diferencial es el siguiente:
Preparación del frotis sanguı́neo. Se coloca una gota de sangre fresca sobre un por-
taobjetos y se extiende con ayuda de otro portaobjetos para formar una capa delgada
que se deja secar, como se observa en la Figura 3.5.
Tinción. Se realiza con colorantes ácidos (eosina-rojo) y básicos (azul de metileno). Los
Leucocitos (glóbulos blancos) se tiñen de color azul, pues reaccionan quı́micamente
con el azul de metileno tomando dicha coloración. Los Eritrocitos (glóbulos rojos)
se tiñen de color rojo, ya que reaccionan quı́micamente con la eosina pintándose de
rojo. Los glóbulos blancos con gránulos que toman ambos colorantes se denominan
neutrófilos. Las células con gránulos que toman color azul se llaman basófilos. Los
leucocitos que poseen gránulos que se tiñen con eosina (rojo) se denominan eosinófi-
los. Una vez teñidos los leucocitos, se identifican por sus caracterı́sticas y grado de
desarrollo.
6
mediadores quı́micos que modulan los procesos de la inflamación.
7
aumento en el número de leucocitos.
16 3 FUNDAMENTOS
Tipo de célula Imagen de un Atlas de Características

Hematología(aumento:400 veces)
1. Neutrófilo en banda
2. Neutrófilo segmentado
NEUTRÓFILO 3. Eritrocito
4. Neutrófilo en segmentación
De acuerdo a la forma de su núcleo se les
puede clasificar en neutrófilos en banda o
cayados y en neutrófilos segmentados.
Presentan núcleos divididos en 3 a 5 lóbulos.
Núcleo en forma de anteojo y gránulos

gruesos en el citoplasma.
EOSINÓFILO
Posee un núcleo en forma de lóbulos difícil

de distinguir a causa de los gránulos gruesos
y obscuros del citoplasma.
BASÓFILO
Núcleo redondo y grande.

El borde del citoplasma celular es
ligeramente azulado y bien definido.
LINFOCITO
Células fagocíticas con gran capacidad

bactericida.
Por la fagocitosis aumentan de tamaño.
MONOCITO
Figura 3.4: Tipos de leucocitos y sus caracterı́sticas.
Figura 3.5: Preparación de frotis sanguı́neo.

Figura 3.6: Observación y conteo de leucocitos.
Reporte. Se cuentan en una muestra vista al microscopio óptico alrededor de 100 células
para expresar los resultados a manera de porcentaje. En el lado izquierdo de la figura
3.6 se muestra un aparato similar a una máquina de escribir que utiliza el quı́mico
para realizar el conteo mientras observa al microscopio.
Los colorantes utilizados en el método de tinción descrito anteriormente se utilizan en la
mayorı́a de los laboratorios clı́nicos en México y son los que se utilizaron en este trabajo
de tesis. De acuerdo a las imágenes consultadas en diversas fuentes se puede notar que
la coloración que adquieren los leucocitos es muy similiar al ser teñidos para Recuento
Diferencial, lo cual significa que es posible utilizar distintos colorantes para la tinción de
los frotis sin afectar de forma considerable la coloración que comúnmente adquieren para
ser diferenciados.
Método automático
No existe un método único para contar células, lo cual implica que hay en el mercado
varios modelos de contadores hematológicos y cada uno de ellos realiza su función de una
forma especı́fica; sin embargo, los parámetros que miden y los resultados de sus medicio-
nes son muy similares. Como ejemplo para este estudio, se han escogido los contadores
Beckman Coulter8 por su sencillez y uso extendido; sin querer decir con ello que sean los
mejores o los únicos modelos existente para este propósito9 .
Un contador hematológico debe contar, como mı́nimo, la serie blanca (glóbulos blancos)
y la serie roja (glóbulos rojos). Es decir, el total de leucocitos y el total de eritrocitos, sin
8
empresa lı́der en el comercio de equipo de laboratorio y contadores hematológicos.
9
En los laboratorios de SESA en Tlaxcala se utilizan el sistema K-1000 [Ses, 1999].
18 3 FUNDAMENTOS
hacer distinción entre las poblaciones de células que componen a cada una de las series.
A esto se le llama CBC –Complete Blood Count–. Aparte de esta cuenta, un contador
hematológico también debe proporcionarnos la cuenta de toda la serie blanca; es decir,
diferenciación entre los componentes de la población blanca. Esto es lo que se llama el
White Blood Differential (Modo Diff, Recuento Diferencial).
La tecnologı́a VCS (Volumen, Conductividad y dispersión) es el mecanismo por el cual
los analizadores de hematologı́a COULTER realizan la diferenciación de leucocitos en 5
tipos: Neutrófilos, Linfocitos, Monocitos, Eosinófilos y Basófilos [Galénica, 2005].
Principios del método:
La muestra de sangre es mezclada con el reactivo Erythrolyse (contenido en el reactivo
Scatter Pack), lo cual produce una rápida lisis10 de los eritrocitos y reduce los restos
celulares sin alterar los leucocitos. Posterior a esta reacción se agrega el reactivo StabiLyse,
el cual actúa como preservante11 de los leucocitos a fin de que resistan en su estado casi
nativo las mediciones subsecuentes –Volumen, Conductividad y Dispersión–.
Una vez tratada la muestra es dirigida a una celda de flujo en la cual por el diseño
hidrodinámico, los leucocitos se alinean y pasan formados uno a uno y en donde se realizan
las siguientes mediciones:
El volumen celular se obtiene mediante la impedancia de baja frecuencia que pre-
senta al paso de la corriente continua.
La conductividad al aplicar radiofrecuencia12 , que da información sobre la densidad
celular.
La dispersión al hacer incidir sobre la célula una luz láser, lo que proporciona
información sobre estructura y forma de la célula.
De esta manera son realizadas las 3 determinaciones de manera simultánea. Las lecturas de
estas 3 señales análogas son enviadas al analizador para su amplificación y proceso, luego el
10
rompimiento o destrucción de las células.
11
sustancia que actúa como conservador o protector de los leucocitos.
12
porción del espectro electromagnético que se obtiene al aplicar corriente alterna a una antena
[Wikipedia Foundation, 2006].
3.2 Conceptos Estadı́sticos 19
Figura 3.7: Tecnologı́a VCS. a) Preparación de la muestra. b) Volumen. b) Conducti-

vidad. d) Dispersión. e) Pruebas simultáneas.
sistema genera 3 gráficos. DF1: Volumen vs. Dispersión, DF2: Volumen vs. Conductividad
y DF3: Volumen vs. Conductividad, en ésta última se extraen las señales de Neutrófilos
y Eosinófilos. En la Figura 3.7 tomada de [Galénica, 2005], se muestra el procedimiento
antes descrito.
El sistema caracteriza cada célula que pasa hasta completar un conteo de 8,132 células
o partı́culas que sobrepasen un cierto volumen o bien hasta que transcurran 20 segundos,
cualquiera de las 2 situaciones que ocurra primero [Beckman Coulter, 2006].
En la Figura 3.8 se muestran algunos modelos de contadores hematológicos comerciales
[Beckman Coulter, 2006].
3.2. Conceptos Estadı́sticos
Uno de los principales objetivos del análisis de imágenes por computadora consiste en
dotar a la máquina de la capacidad de reconocimiento similar a la de los seres humanos;
para esto es necesario definir un patrón, es decir, una descripción estructural o cuantitativa
20 3 FUNDAMENTOS
Figura 3.8: Contadores Hematológicos.
de un objeto o de alguna otra entidad de interés en una imagen. Las representaciones de
patrones utilizadas con más frecuencia son vectores para descripciones cuantitativas, y
cadenas o árboles para descripciones estructurales [Hair et al., 2001].
Dado que el método de solución a la problemática planteada en esta investigación
se relaciona con el análisis estadı́stico de la información objeto de este estudio, resulta
imperativo definir algunos conceptos básicos.
Definición 1 (Individuos o elementos) Personas u objetos que contienen cierta infor-
mación que se desea estudiar [Hair et al., 2001].
Definición 2 (Población) Conjunto de individuos o elementos que cumplen ciertas pro-
piedades comunes [Hair et al., 2001].
Definición 3 (Muestra) Subconjunto representativo de una población [Hair et al., 2001].
Definición 4 (Caracterı́stica) Propiedad, rasgo o cualidad de los elementos de la po-
blación. Las caracterı́sticas pueden ser cualitativas y cuantitativas [Hair et al., 2001].
Definición 5 (Varianza) Mide cuánto varı́a una variable X respecto a un valor esperado.
Si µ ≡ E[X], la varianza se define como:
var(X) = E[(X − µ)2 ] = E[X 2 ] − µ2 (3.1)
La varianza se denota por σ 2 [Alpaydm, 2004].

Definición 6 (Desviación estandar) Se denota por σ. La desviación estandar tiene la
misma unidad que X [Alpaydm, 2004]. Se define como:
p
σ= var(X) (3.2)
Definición 7 (Covarianza) Indica la relación entre dos variables aleatorias. Si la ocu-
rrencia de X hace más probable la ocurrencia de Y , la covarianza es positiva; es negativa
si las ocurrencias de X hacen menos probable las ocurrencias de Y y es 0 si no hay depen-
dencia [Alpaydm, 2004].
cov(X, Y ) = E[(X − µX )(Y − µY )] = E[XY ] − µX µY (3.3)
Algunas de sus propiedades son:
cov(X, Y ) = cov(Y, X) (3.4)
cov(X, X) = var(X) (3.5)
Definición 8 (Media o valor esperado) Es el valor promedio de X en un amplio núme-
ro de experimentos. Se denota por E[X] o µ [Alpaydm, 2004].
Considerando una observación s, un vector caracterı́stico x y una clase wi , se definen los
siguientes conceptos:
Función de masa de probabilidad discreta, FMP: P (wi )
X
P (wi ) = 1 (3.6)
i
Función de densidad de probabilidad continua, FDP: p(x)
Z
p(x)dx = 1 (3.7)
22 3 FUNDAMENTOS
Valor esperado: E(x)

Z
E(x) = xp(x)dx (3.8)
Entre las funciones de densidad de probabilidad –FDP–, la función de densidad normal
o gaussiana es la más utilizada debido a las propiedades que presenta y es útil en situaciones,
en las cuales un conjunto de patrones de una determinada clase toman valores en un rango
contı́nuo y alrededor de un patrón promedio, es decir, considera que los patrones de clases
diferentes tienen ciertos valores, pero los valores de una clase son lo más parecidos posible.
Algunas propiedades de la Distribución Normal son:
Parámetros que especifican la distribución. La función de densidad normal queda
completamente especificada por pocos parámetros. En el caso unidimensional: la
media y la varianza. En el caso multidimensional, el vector medio y la matriz de
covarianza.
Incorrelación e independencia. Dado un conjunto de patrones que siguen una distri-
bución normal, si las variables asociadas están incorrelacionadas, entonces son inde-
pendientes.
Justificación fı́sica. La suposición de normalidad es una aproximación razonable para la
mayor parte de los datos tomados de la Naturaleza. Lo cual es cierto, en particular,
para variables aleatorias que son suma de otras variables y el teorema central del
lı́mite13 puede aplicarse [Cortijo, 2001].
Cuando se analiza la distribución de más de una variable, se denomina distribución normal
multidimensional, y se expresa como:
1 −1 X
(x−µ)t Σ−1 (x−µ)
p(x) = d P 1 e 2 ∼ N (µ, ) (3.9)
(2π) |
2 | 2
donde,
13
el teorema dice que cuando se tiene un grupo numeroso de variables independientes y todas ellas siguen
el mismo modelo de distribución (cualquiera que éste sea), la suma de todas ellas se distribuye según una
distribución normal [Garcı́a and Sierra, 2001].
d =, número de dimensiones.
x = {x1 , ..., xd }, vector de entrada.
µ = E(x) = {µ1 , ..., µd }, vector de medias.

P P
= E((x − µ)(x − µ)t ), matriz de covarianza con elementos σij ,inverso −1 , y determi-
P
nante | |
σij = σji = E((xi − µi )(xj − µj )) = E(xi xj ) − µi µj
Algunas propiedades de las distribuciones gaussianas multidimensionales son:
Si las dimensiones ith y jth son estadı́sticamente o linealmente independientes, en-
tonces
E(xi xj ) = E(xi )E(xj ) y σij = 0 (3.10)
Si todas las dimensiones son estadı́sticamente o linealmente independientes, entonces

P
σij = 0, ∀i 6= j, y la matriz de covarianza posee elementos diferentes de cero en la
diagonal.
P
Si la densidad subyacente es gaussiana y es una matriz diagonal, entonces las
dimensiones son estadı́sticamente independientes, y
d
Y
p(x) = p(xi ) , p(xi ) ∼ N (µi , σii ) y σii = σi2 (3.11)
i=1
3.2.1. Métricas de similitud
Distancia de Mahalanobis
Si un conjunto de patrones siguen una distribución normal, tienden a representarse
formando un único agrupamiento de manera que el centro de este agrupamiento está de-
terminado por el vector medio, y la forma por la matriz de covarianza. En la Figura 3.9 se
muestra la función de densidad de probabilidad para una clase cuyos patrones siguen una
distribución normal.
De la ecuación 3.9 se deduce que los puntos para los cuales el valor de la densi-
dad de probabilidad constante están situados en hiperelipsoides cuya forma cuadrática

24 3 FUNDAMENTOS
Figura 3.9: Gráfica representativa de una Distribución Gaussiana
Figura 3.10: Proyección sobre el plano definido por las variables X1 y X2
P−1
(x − µ)T (x − µ) es constante. El valor de esta expresión es la Distancia de Maha-
lanobis de x a µ.
En el caso bidimensional, estas elipses pueden verse claramente en la Figura 3.10, donde
los contornos de igual densidad de probabilidad son hiperelipsoides con una distancia de
Mahalanobis a µ constante [Cortijo, 2001]. Las direcciones de los ejes principales de estos
P
hiperelipsoides están determinadas por los autovectores14 de y sus longitudes por los
autovalores15 correspondientes.
La utilidad de la Distancia de Mahalanobis como medida de similitud radica en que
es una forma de determinar la similitud entre dos variables aleatorias multidimensionales,
se diferencia con la distancia euclı́dea en que considera la correlación entre las variables
14
también llamados eigenvectores, son vectores no nulos que al ser transformados por un operador dan
lugar a un múltiplo escalar de sı́ mismos λ, con lo que no cambian su dirección [Wikipedia Foundation, 2006].
15
también llamados eigenvalores, son los escalares λ obtenidos por un eigenvector
[Wikipedia Foundation, 2006].
aleatorias. Algunas propiedades importantes que cumple la distancia de Mahalanobis para
ser una distancia son [Hair et al., 2001]:
Semipositividad. La distancia entre dos puntos de las mismas coordenadas es cero,
y si tienen coordenadas distintas es positiva, pero nunca negativa.
Simetricidad. La distancia entre los puntos a y b es la misma que entre los puntos
b y a.
Desigualdad triangular. d(a, b) ≤ d(a, c)∀a, b, c²X
3.2.2. Análisis de Componentes Principales –PCA–
También conocido en algunas áreas como transformada discreta de Karhunen-Loéve o
transformada de Hotelling. Es un método no supervisado que no utiliza la información de
salida, cuyo criterio más importante es la varianza [Alpaydm, 2004].
Esta técnica estadı́stica transforma linealmente un conjunto de variables en un con-
junto sustancialmente pequeño de variables no correlacionadas, que representan la mayor
cantidad de información del conjunto de datos original, es decir reduce la dimensión de un
conjunto de n variables a un conjunto m variables, que estan áltamente correlacionadas.
Un conjunto mucho más pequeño de variables no correlacionadas es mucho más fácil
de entender o procesar en análisis posteriores –por ejemplo con métricas– que el conjunto
grande –original– de variables correlacionadas [Solano, 2002].
PCA se fundamenta en el hallazgo de factores –componentes principales– que sucesi-
vamente demuestren la mayor parte de la varianza total. La técnica consisten en:
1. Detectar vectores no correlacionados, llamados componentes principales.
2. Ordenar los componentes principales considerando primero a aquellos con desviación
más alta, dejando al final los que poseen las desviaciones más bajas.
3. Eliminar a los componentes principales que contribuyen menos en la variación en el
conjunto de datos.
26 3 FUNDAMENTOS
De esta manera, el primer factor o componente es el que contiene una mayor parte de la
varianza, el segundo es el que tiene la mayor parte de la varianza restante y ası́ sucesiva-
mente.
Reducir el conjunto de datos facilita el proceso del clasificador, ahorra tiempo de pro-
cesamiento y reduce la demanda en los recursos de cómputo [Reyes, 2005].
De acuerdo al trabajo realizado por Alejandro Guzmán en [Guzmán, 2002], el uso de
PCA como método para segmentar imágenes tiene algunas ventajas como las siguientes:
Una mejor representación del espacio de representación de color, simplificando la
clasificación.
Una posible reducción de dimensiones fı́sicas del espacio de representación de color
(3D, 2D ó 1D).
Sintetizar información útil sobre la imagen y crear nuevos parámetros para el análisis
de la imagen.
Respecto a otras técnicas, PCA es más simple de implementar.
Considerando las ventajas de ésta técnica es posible la implementación de una segmentación
semi-automática debido a su transformación lineal, ya que manipula la información sin
distorsionarla [Guzmán, 2002].
3.3. Análisis de imágenes
Las funciones necesarias en un sistema de visión son [Awcock and R., 1996]:
Una escena bajo condiciones controladas.
Captura de una imagen.
Análisis de la imagen.
Reconocimiento de ciertos objetos dentro de ella.

3.3 Análisis de imágenes 27
Figura 3.11: Modelo de un sistema de visión.
En la Figura 3.11, tomada de [Awcock and R., 1996] se muestra un modelo genérico de los
elementos que componen un sistema de visión.
La adquisición de la imagen se refiere al proceso de trasladar los estı́mulos luminosos
recibidos por fotosensores de una cámara para su almacenamiento digital dentro de la
memoria de una computadora.
La etapa de preprocesamiento dentro del análisis de imágenes involucra al conjunto
de técnicas que permiten adquirir una imagen y manipularla para la obtención de mejores
resultados en las etapas posteriores. Dentro de las técnicas utilizadas en el preprocesamiento
se encuentra la eliminación de ruido, que consiste en aplicar un filtro que quita elementos no
deseados en la imagen. El filtro se construye analizando las propiedades de cada elemento
que forma a la región de interés en la imagen [Awcock and R., 1996].
En la parte del análisis de imágenes se trabaja con los datos obtenidos en la etapa
de preprocesamiento, es decir con imágenes que no tienen ruido o lo tienen en pequeñas
cantidades. De esta manera comienza el análisis aplicando técnicas de segmentación que
varı́an de acuerdo al objetivo del problema, en ocasiones interesa identificar texturas y en
otras, formas, color o combinaciones de éstas. Por lo tanto, antes de elegir una técnica para
segmentar, es necesario identificar las caracterı́sticas de los elementos que interesan en la
imagen.
28 3 FUNDAMENTOS
3.3.1. Segmentación
La segmentación consiste en dividir una imagen en regiones o partes que la constituyen,
y se basa en tres propiedades [de la Escalera, 2001]:
Similitud. Cada uno de los pixeles de un elemento tiene valores parecidos para alguna
propiedad.
Discontinuidad. Los objetos destacan del entorno y tienen por lo tanto bordes definidos.
Conectividad. Los pixeles pertenecientes al mismo objeto son contiguos (estan agrupa-
dos).
Las técnicas que se utilizan para lograr la segmentación se basan en la búsqueda de partes
uniformes en la imagen, o bien de partes en las que se produce algún cambio. Ası́, una vez
detectados los puntos que presentan éstas discontinuidades o bordes se debe encontrar un
camino entre el pixel P1 y el pixel Pn , lo que permite definir un camino como una secuencia
de puntos P2 , P3 , ..., Pn − 1, donde el pixel Pi+1 es vecino del pixel Pi . Una región es un
camino entre cualquier pareja de sus puntos, y todos los pixeles del camino pertenecen
a la región. De esta manera, como producto de la segmentación se tiene un conjunto de
regiones:
Ri Son las regiones que no tocan los bordes de la imagen.
R Es el conjunto unión de todas las regiones Ri .
Rc Es el conjunto complemento de R.
Esto permite definir:
Fondo. Puntos que pertenecen a Rc y son contiguos a los bordes de la imagen
Agujeros. Puntos que pertenecen a Rc y no son contiguos a los bordes de la imagen.
Al segmentar generalmente se obtienen los datos de pixel en bruto que forman parte de
una región o de su contorno y el siguiente paso es decidir si los datos de interés pertenecen
3.3 Análisis de imágenes 29
al contorno, a la región o a ambos. No obstante, el éxito en el uso de cualquier técni-
ca empleada en la etapa de segmentación de imágenes de muestras biológicas siempre se
verá afectada por factores como la calidad en la preparación de dicha muestra, de la cual
se tomará la imagen a analizar.
Otro factor importante a considerar en la segmentación, es el conjunto de condiciones
requeridas para la adquisición de la imagen, incluyendo cambios en la iluminación y niveles
de acercamiento para la captura de la imagen, entre otros.
En las imágenes a color, un pixel está constituı́do a partir de la combinación de al
menos 3 componentes (RGB). Existen diferentes formas de representación espacial para
un mismo color [Guzmán, 2002].
Realizar un estudio como el que se describe en [Guzmán, 1997] permite elegir el espacio
de color más apropiado para llevar a cabo la segmentación basada en color.
Existen muchas técnicas de segmentación [Pal and Pal, 1993] y respecto a la segmen-
tación en color se pueden distinguir dos grandes grupos:
Aquellas que trabajan directamente sobre el espacio imagen. Este conjunto de técnicas
se puede dividir en dos grandes sub-grupos que engloban la mayor parte de técnicas
utilizadas hasta antes del desarrollo de las herramientas propias a la inteligencia
artificial; la segmentación por crecimiento de regiones y la detección de contornos. La
primera utiliza un criterio de homogeneidad como parámetro para eliminar la región.
Mientras que la segmentación por detección de contornos busca fuertes variaciones
de algún parámetro dentro de la imagen utilizando operadores diferenciales16 . En
[Flores, 2001] se muestra un ejemplo de segmentación por regiones.
Aquellas que trabajan sobre el espacio de representación de color. Se fundamentan en
la teorı́a de análisis de datos para hacer la clasificación. Entre las técnicas útiles para
hacer éste análisis se encuentra el análisis de componentes principales –PCA–. En la
sección 3.2.2 se describieron algunas ventajas de esta técnica para la segmentación.
16
operadores relacionados con el cálculo de derivadas e integrales.
30 3 FUNDAMENTOS
3.3.2. Filtrado espacial
El filtrado espacial, también llamado suavización consiste en el uso de máscaras espa-
ciales para el procesamiento de las imágenes, y las máscaras se denominan filtros espaciales.
Los filtros suavizantes se utilizan para hacer que la imagen aparezca algo borrosa y para
reducir el ruido favoreciendo la eliminación de pequeños detalles de una imagen antes de
la extracción de un objeto (grande) y/o permitiendo el relleno de pequeños espacios entre
lı́neas o curvas [González and Woods, 1996]. A continuación se describe el filtro de la me-
diana, dado que se hace uso de éste durante la última etapa de la segmentación descrita
en la sección 6.1.2.
Filtro de la mediana
Consiste en reemplazar el nivel de gris por la mediana de los niveles de gris en un entorno
de este pixel. Es un método efectivo cuando la caracterı́stica que se desea preservar es la
agudeza de los bordes.
La mediana m de un conjunto de valores es tal que la mitad de los valores del conjunto
quedan por debajo de m y la otra mitad por encima. Por ejemplo, para realizar el filtrado
por la mediana en el entorno de un pixel, primero se deben extraer los valores del pixel y
de su entorno, determinar la mediana y asignar éste valor al pixel. En la Figura 3.12 se
muestra este procedimiento. Los tres pasos mostrados en dicha figura se repiten mientras
se realiza un recorrido por toda la imagen.
La función del filtrado es introducir puntos con intensidades distintas que sean más
parecidos a sus vecinos, eliminando los estrechos picos de intensidad que aparecen aislados
en el área cubierta por la máscara de filtrado.
3.4. Extracción de caracterı́sticas
El objetivo principal de un extractor de caracterı́sticas es describir un objeto para su
reconocimiento por medidas cuyos valores son muy similares para objetos de la misma
3.4 Extracción de caracterı́sticas 31
Figura 3.12: Procedimiento para implementar el Filtro de la mediana.
clase, y muy diferentes para objetos de diferentes clases. Existen caracterı́sticas que son
invariantes a transformaciones irrelevantes de la entrada, por ejemplo caracterı́sticas que
describen propiedades como figura, color y textura son invariantes a rotación, traslación y
escala [Duda, 2001].
Un gran número de transformaciones complejas surgen en torno al reconocimiento de
patrones y la mayorı́a son de dominio especı́fico. En algunos casos, variaciones en la ilumi-
nación o efectos indeseados de sombras se deben tomar en cuenta como en la segmentación,
donde la tarea de extraer caracterı́sticas constituye un problema y es dependiente del do-
minio, que es la clasificación propia que requiere del conocimiento de dicho dominio.
Sin embargo, algunas técnicas de clasificación de patrones tales como agrupamiento y
aprendizaje no supervisado, métodos estocásticos17 , redes neuronales multicapa, funciones
discriminantes lineales y técnicas no paramétricas, también se pueden utilizar en el diseño
de un extractor de caracterı́sticas y en la selección de las mismas.
El diseño de un sistema de reconocimiento de patrones requiere generalmente la re-
petición de un conjunto de actividades como la colección de datos, la selección de carac-
terı́sticas, la selección del modelo, el entrenamiento del clasificador18 y la evaluación. En
la Figura 3.13, tomada de [Duda, 2001] se muestra el ciclo de éste diseño, en principio
se colectan los datos para entrenar y probar el sistema. Las caracterı́sticas de los datos
17
relativos a la teorı́a estadı́stica de los procesos cuya evolución en el tiempo es aleatoria.
18
Un clasificador es una función que mapea una instancia no etiquetada a una etiqueta utilizando estruc-
turas de datos internas [Kohavi, 1995].
32 3 FUNDAMENTOS
Figura 3.13: Diseño de un sistema de reconocimiento de patrones.
afectan a la elección de caracterı́sticas discriminantes apropiadas y la elección de modelos
para las categorı́as distintas. El proceso de entrenamiento utiliza algunos o todos los datos
para determinar los parámetros del sistema, finalmente los resultados de la evaluación se
pueden repetir varias veces en el proceso para obtener resultados satisfactorios.
El proceso de extracción de caracterı́sticas para identificar un objeto en una escena
consiste en obtener información que permita describirlo.
Las caracterı́sticas de una imagen generalmente estan formadas por vectores que con-
tienen información especı́fica de dicha imagen. Estas caracterı́sticas pueden estar repre-
sentadas por lı́mites –propiedades externas– o por información alusiva a su representación
estructural –propiedades internas–.
En la mayorı́a de los casos, las caracterı́sticas más importantes estan relacionadas con
la forma de las regiones de interés en la imagen, y para describirla son útiles las propiedades
geométricas y los momentos [de la Escalera, 2001]. Las propiedades geométricas se relacio-
Figura 3.14: Caracterı́sticas morfológicas de una región.
nan con medidas de la región de interés, mientras que los momentos permiten obtener pro-
piedades de un objeto en términos de su área, posición y orientación [Awcock and R., 1996],
tales como la excentricidad, orientación y centro de masa.
Las caracterı́sticas morfológicas deben ser invariantes a traslación, rotación y escala.
En la Figura 3.14 se muestran algunas caracterı́sticas útiles para describir la forma de una
región.
Para describir un momento se considera la imagen de la Figura 3.15, donde la parte
izquierda representa un segmento de borde y la derecha muestra el segmento representado
como una función 1-D g(r) de una variable arbitraria r. Tratando la amplitud de g como
una variable aleatoria v y formando un histograma de amplitud p(vi ), i = 1, 2, ..., k, siendo
k el número de incrementos de amplitud discretos. Entonces el momento n-ésimo de v
respecto de su media es [González and Woods, 1996]:
k
X
µn (v) = (vi − m)n p(vi ) (3.1)
i=1
donde,
34 3 FUNDAMENTOS
Figura 3.15: Momentos.
k
X
m= vi p(vi ) (3.2)
i=1
La cantidad m es el valor medio de v y µ2 su varianza19 . Generalmente sólo se requieren
los primeros momentos para diferenciar formas claramente distintas.
Otra alternativa consiste en normalizar g(r) para que el área bajo ella sea la unidad y
tratarla como un histograma. En este caso, r es la variable aleatoria y los momentos son,
L
X
µn (v) = (ri − m)n g(ri ) (3.3)
i=1
donde,
L
X
m= ri g(ri ) (3.4)
i=1
En esta notación, L es el número de puntos en el borde y µn (r) está relacionado directa-
mente con la forma de g(r). Por ejemplo, el segundo momento µ2 (r) mide la dispersión de
los puntos de la curva con relación al valor medio de r, y el tercer momento µ3 (r) mide su
simetrı́a con relación a la media.
En la tabla 3.1 se describen algunas caracterı́sticas útiles para la descripción de la for-
ma de la región. El centro de masa en un tratamiento de sistemas de masas puntuales es
19
El subı́ndice 2 de µ, indica que se trata del segundo momento.
PROPIEDAD DESCRIPCIÓN
Área Número de pixeles que contiene la imagen
Longitud (en pixeles) del eje menor de la elipse que tiene los
Longitud de eje menor
mismos segundos momentos que la región
Longitud (en pixeles) del eje mayor de la elipse que tiene los
Longitud de eje mayor
mismos segundos momentos que la región
Caja circunscrita
Rectángulo más pequeño que puede contener la región
(Bounding Box )
Polı́gono convexo más pequeño que puede conte-
Envoltura convexa
ner la región. En la Figura 3.18, modificada de
(Convex Hull )
[Goodrich and Tamassia, 2003] se presenta un ejemplo.
Número de componentes conexas de la región menos número
Número de Euler de huecos en dicha región. En la Figura 3.17 se muestra un
ejemplo.
Diámetro del cı́rculo con la misma área que la región.
Diámetro equivalente p
D = 4Area/π
Proporción de pixeles en el convex hull que también estan
Solidez en la región.
S = Área/Área de Convex Hull
Proporción de los pixeles en el bounding box que también
Rectangularidad (extent) están en la región.
R = Área/Área de Bounding Box
Gráfica que representa la distancia del centro de masa de la
Signatura (firma) región a los puntos de su borde. En la Figura 3.16, tomada
de González, De Fu y Lee [1987] se observa un ejemplo.
Perı́metro Longitud (en pixeles) del contorno de una región.
Cuadratura del bounding box.
Elongación o razón de aspecto
S = base Bounding Box/altura de Bounding Box
Excentricidad de la elipse que tiene los mismos segundos
Excentricidad momentos que la región, es la relación entre el foco de la
elipse y su longitud de eje mayor.
Ángulo (en grados) entre el eje X y el eje mayor de la elipse
Orientación
que tiene los mismos segundos momentos que la región
Centro de masa (centroide,
Es el punto geométrico donde la resultante de las fuerzas
centro de gravedad)
gravitatorias ejercidas por todos los cuerpos del sistema se
anula. Se obtiene con
P P
x̄ = i xi /A, ȳ = i yi /A
donde, A es el área de la región
[Pajares and de la Cruz, 2002].
Tabla 3.1: Caracterı́sticas que permiten describir la forma de una región.

36 3 FUNDAMENTOS
Figura 3.16: Dos curvas de contornos sencillos y sus correspondientes firmas

de distancia-ángulo. En (a) r(θ) es constante. En (b) r(θ) = A sec(θ).
Figura 3.17: Regiones con número de Euler -2 y 0, respectivamente.
el punto donde se supone concentrada toda la masa del sistema. El centroide, el centro
de gravedad y el centro de masa pueden, bajo ciertas circunstancias, coincidir entre sı́.
En estos casos se suele utilizar los términos de manera intercambiable, aunque designan
conceptos diferentes.
El centroide es un concepto puramente geométrico mientras que los otros dos términos
(centro de gravedad y centro de masa) se relacionan con las propiedades fı́sicas de un cuer-
po. Para que el centroide coincida con el centro de masa, el objeto debe tener densidad
uniforme, o la distribución de materia a través del objeto debe tener ciertas propiedades,
tales como simetrı́a. Para que un centroide coincida con el centro de gravedad, el centroide
debe coincidir con el centro de masa y el objeto debe estar bajo la influencia de un campo
gravitatorio uniforme [Wikipedia Foundation, 2006].

3.5 Redes Neuronales 37
Figura 3.18: Convex Hull.
3.5. Redes Neuronales
A continuación se definirán algunos conceptos utilizados a lo largo de esta sección.
Definición 9 (Dato) Es un vector formado por valores que representan caracterı́sticas o
atributos de un objeto cualquiera.
Definición 10 (Clase) Conjunto de datos que poseen atributos o caracterı́sticas simila-
res.
Definición 11 (Patrón) Descripción estructural o cuantitativa de un objeto o de alguna
otra entidad de interés en una imagen.
Definición 12 (Conjunto de entrenamiento –Patrón de entrenamiento–) Patrones
usados por un clasificador (de pertenencia conocida o no a una clase) para estimar paráme-
tros de aprendizaje.
Definición 13 (Conjunto de validación –Patrón de prueba–) Patrones usados por
un clasificador (de pertenencia conocida a una clase) para probar el entrenamiento reali-
zado por un clasificador.
Definición 14 (Entrenamiento –Aprendizaje–) Proceso de usar un conjunto de en-
trenamiento para obtener funciones de decisión.

38 3 FUNDAMENTOS
Figura 3.19: De la neurona biológica a la neurona artificial.
Definición 15 (Época) Un paso completo sobre todos los patrones en el entrenamiento.
[Alpaydm, 2004].
3.5.1. Introducción
Una red neuronal artificial proporciona un método robusto para aproximar funciones
que utilicen valores reales, discretos y funciones valuadas en un vector. El aprendizaje con
redes neuronales artificiales es aplicable a problemas tales como procesamiento de imágenes
y sonido, control y optimización, predicción, entre otros [Acosta et al., ].
El modelo de una neurona artificial es una imitación del proceso fisiológico de una
neurona biológica. En la figura 3.19 [Acosta et al., ] se muestra un esquema comparativo
de las neuronas biológicas y las artificiales.
De la observación detallada de este proceso biológico se observan los siguientes análogos
con el sistema artificial:
1. Las entradas Xi .
2. Los pesos Wi .
3. θ, la función de umbral que la neurona debe sobrepasar para activarse.
Una neurona artificial es un elemento de cálculo no lineal y elemental que se organiza
como red [González and Woods, 1996]. Las señales de entrada a una neurona artificial
X1 , X2 , ..., Xn son variables continuas en lugar de pulsos discretos, como se presenta en una
neurona biológica. Cada señal de entrada pasa a través de una ganancia o peso, llamado peso
sináptico (fortaleza) de la conexión cuya función es análoga a la de la función sináptica de la

Figura 3.20: Proceso básico de una red neuronal.
neurona biológica. Los pesos pueden ser positivos –excitatorios–, o negativos –inhibitorios–,
el nodo sumatorio acumula todas las señales de entradas multiplicadas por los pesos y las
pasa a la salida a través de una función de transferencia –función umbral–. La entrada
neta a cada unidad puede escribirse de la siguiente manera.
n
X −
→−→
netai = Wi Xi = X Y (3.1)
i=1
La secuencia de este proceso se muestra en la figura 3.20 [Acosta et al., ]. Una vez que se
ha calculado la activación del nodo, el valor de salida equivale a:
xi = fi (netai ) (3.2)
Donde fi representa la función de activación para esa unidad, que corresponde a la
función escogida para transformar la entrada netai en el valor de salida xi , y que depende
de las caracterı́sticas especı́ficas de la red.
Dentro de una red neuronal, las neuronas se encuentran agrupadas por capas, donde
una capa es una colección de neuronas que de acuerdo a su ubicación recibe los siguientes
nombres:
Capa de entrada: Recibe las señales de la entrada de la red.
Capas ocultas: Son capas que no tienen contacto con el medio exterior, sus elementos
pueden tener diferentes conexiones y son éstas las que determinan las diferentes
40 3 FUNDAMENTOS
Figura 3.21: Esquema básico de una neurona artificial que contiene una sóla
entrada.
topologı́as de la red.
Capa de salida: Recibe la información de la capa oculta y transmite la respuesta al
medio externo.
En la figura 3.21 se muestra una neurona de una entrada [Acosta et al., ].
De esta manera, la topologı́a de una red se define por su organización o arquitectura
interna, constituı́da por capas. Cada capa puede tener diferente número de neuronas, e
incluso distinta función de transferencia. Una función de transferencia es una función lineal
o no lineal de la salida neta de la red que determina la salida total de la red neuronal.
En la Figura 3.22, tomada de [Acosta et al., ] se muestran las funciones de transferencia
utilizadas frecuentemente con redes neuronales.
3.5.2. Tipos de Redes Neuronales
En general las redes neuronales se pueden clasificar de diversas maneras, según su
topologı́a, forma de aprendizaje (supervisado o no supervisado), tipos de funciones de acti-
vación, valores de entrada (binarios o continuos). En la figura 3.23 se muestra un esquema
de esta clasificación [Acosta et al., ]. Sin embargo, de acuerdo al trabajo de [Flores, 2001]
resulta válido considerar que la red ART2 también puede recibir entradas continuas.
Las Redes neuronales multicapa alimentadas hacia adelante se utilizan con frecuen-
cia para los problemas de reconocimiento de patrones multiclase, con independencia de
que las clases sean o no separables, y utilizando arquitecturas que constan de niveles de
Figura 3.22: Funciones de transferencia de uso común.
Figura 3.23: Clasificación de las redes neuronales.

42 3 FUNDAMENTOS
perceptrones20 . En la Figura 3.24 tomada de [González and Woods, 1996], se muestra la
arquitectura de este modelo de red neuronal. La imagen ampliada muestra la estructura
básica de cada neurona de la red. El desplazamiento θ se trata como si fuese otro peso.
El número de neuronas de la primera capa A, es NA , genaralmente NA = n, donde n es
la dimensión de los patrones vectoriales que se dan como entrada. El número de neuronas
en la capa de salida Q se representa por NQ y es igual a M , es decir el número de clases que
la red es capaz de reconocer. La red reconoce a un patrón vectorial x como perteneciente a
una clase wm si la m-ésima salida de la red está activada, mientras que las restantes salidas
estan desactivadas.
Para desarrollar la regla de entrenamiento por retropropagación es preciso que se pueda
calcular la diferencial de las funciones por todos los caminos de la red, ası́ que la siguiente
función sigmoide de activación es diferenciable:
1
hj (Ij ) = (3.3)
1 + exp[−(Ij + θj )/θ0 ]
donde Ij , j = 1, 2, ..., Nj representan la entrada del elemento de activación de cada nodo de
la capa J de la red, θj es un desplazamiento, y θ0 controla la forma de la función sigmoide.
Esta arquitectura consta de numerosas capas de neuronas esructuralmente idénticas y
dispuestas de modo que la salida de cada neurona de una determinada capa alimenta las
entradas de todas las neuronas de la siguiente capa. La entrada de un nodo de cualquier
capa es la suma ponderada de las salidas de la capa anterior. Suponiendo que la capa K es
la que precede a la capa J, la entrada del elemento de activación de cada nodo de la capa
J, representada por Ij es:

Nk
X
Ij = wjk Ok (3.4)
k=1
para j = 1, 2, ..., Nj , donde Nj es el número de nodos de la capa J, NK es el número de
nodos de la capa K y wjk son los pesos que modifican las salidas Ok de los nodos de la
20
un perceptrón es una máquina de aprendizaje que al entrenarse utilizando conjuntos de entrenamiento
linealmente separables, éstos convergen a una solución en un número finito de iteraciones. Sus soluciones
toman la forma de coeficientes de hiperplanos capaces de separar correctamente las clases representadas
por los patrones del conjunto de entrenamiento [González and Woods, 1996].
Figura 3.24: Modelo de red neuronal multicapa alineada hacia adelante (pro-
gresiva).
44 3 FUNDAMENTOS
capa K antes de alimentar los nodos de la capa J. Las salidas de la capa K son:
Ok = hk (Ik ) (3.5)
para k = 1, 2, ..., Nk . En la ecuación 3.4 se tiene que Ij , para j = 1, 2, ..., Nj representa la
entrada del elemento de activación del j-ésimo nodo de la capa J, con lo que I1 representa la
entrada del elemento de activación del primer (el más alto) nodo de la capa J, I2 representa
la entrada del elemento de activación del segundo nodo de la capa J, y ası́ sucesivamente.
Cada nodo de la capa J tiene Nk entradas y cada una se puede ponderar de forma distinta,
las Nk entradas del primer nodo de la capa J estan ponderadas por los coeficientes w1k , k =
1, 2, ..., Nk , y ası́ sucesivamente. Se requieren en total NJ xNk coeficientes para especificar
la ponderación de los pesos de las salidas de la capa K cuando alimentan a la capa J.
También se requieren NJ coeficientes de desplazamiento θj para especificar completamente
los nodos de la capa J.
Cuando se sustituye la 3.4 en 3.3 se obtiene la función de activación:
1
hj (Ij ) = PNk (3.6)
1 + exp[−( k=1 wjk Ok + θj )]/θ0
El principal problema del entrenamiento de una red multicapa consiste en ajustar los pesos
de las capas ocultas, ya que la salida deseada es desconodida.
3.5.3. Entrenamiento por Retropropagación
En el entrenamiento por retropropagación después de haber aplicado un patrón a la
red como estı́mulo, éste se propaga desde la primera capa a través de las capas superiores
de la red, hasta generar una salida. La señal de salida se compara con la salida deseada y
se calcula una señal de error para cada una de las salidas.
Las salidas de error se propagan hacia atrás, partiendo de la capa de salida, hacia
todas las neuronas de la capa oculta que contribuyen directamente a la salida, pero las
neuronas de la capa oculta sólo reciben una fracción de la señal total del error, basándose
aproximadamente en la contribución relativa que haya aportado cada neurona a la salida

original. Este proceso se repite capa por capa, hasta que todas las neuronas de la red hayan
recibido una señal de error que describa su contribución relativa al error total. Basándose
en la señal de error percibida, se actualizan los pesos de conexión de cada neurona, para
hacer que la red converja hacia un estado que permita clasificar correctamente todos los
patrones de entrenamiento. De esta manera, a medida que se entrena la red, las neuronas de
las capas intermedias se organizan a sı́ mismas de modo que aprenden a reconocer distintas
caracterı́sticas del espacio total de entrada.
De acuerdo a la Figura 3.24, en la primera fase del método de retropropagación se
introduce un vector de entrenamiento y se permite la propagación del mismo por la red,
para calcular la salida Oj de cada nodo. Las salidas Oq de los nodos de la capa de salida
se comparan con las salidas deseadas rq con lo que se obtienen los términos de error δq .
La segunda fase consiste en volver hacia atrás por la red, pasando a cada nodo la
señal de error apropiada y realizando las correspondientes modificaciones de los pesos.
Este proceso se aplica también a los pesos correctores θj . Más adelante se describe con
detalle, el entrenamiento por retropropagación [González and Woods, 1996].
Situados en la capa de salida, el error medio cuadrático entre las respuestas deseadas rq y
las reales Oq de los nodos de la capa de salida Q, es:
NQ
1X
EQ = (rq − Qq )2 (3.7)
2
q=1
donde,NQ es el número de nodos de la capa de salida Q, y el 1/2 se usa por conveniencia
en la notación para el uso posterior de derivadas.
Para permitir el ajuste de los pesos de cada una de las capas de modo que minimice el
valor de una función de error cuya forma sea la mostrada en la ecuación 3.7, se comienza
ajustando los pesos de forma proporcional a la derivada parcial del error con respecto a
los pesos.
∂EQ
∆wqp = −α (3.8)
∂wqp
donde la capa P precede a la capa Q y α es un factor de correción positivo.
El error EQ es una función de las salidas Oq , que a su vez dependen de las entradas Iq
46 3 FUNDAMENTOS
de acuerdo a la imagen ampliada que se encuentra en la parte superior de la Figura 3.24.
Utilizando la regla de la cadena21 se evalúa la derivada parcial de EQ :
∂EQ ∂EQ ∂Iq

= (3.9)
∂wqp ∂Iq ∂wqp
De la ecuación 3.4:
Np
∂Iq ∂ X
= wqp Op = Op (3.10)
∂wqp ∂wpq
p=1
Sustituyendo las ecuaciones 3.9 y 3.10 en la ecuación 3.8, se obtiene
∂EQ
∆wqp = −α Op ∆wqp = −αδq Op (3.11)
∂Iq
donde,
∂EQ
δq = − (3.12)
∂Iq
Para poder calcular ∂EQ /∂Iq se utiliza la regla de la cadena y se puede expresar como la
variación de EQ con respecto a Oq , multiplicada por la variación de Oq con respecto a Iq .
Es decir,
∂EQ ∂EQ ∂Oq
δq = − =− (3.13)
∂Iq ∂Oq ∂Iq
De la ecuación 3.7:
∂EQ
= −(rq − Oq ) (3.14)
∂Oq
y de la ecuación 3.5:
∂Oq ∂
= hq (Iq ) = h0q (Iq ) (3.15)
∂Iq ∂Iq
Sustituyendo las ecuaciones 3.14 y 3.15 en 3.13, se obtiene
∂q = (rq − Oq )h0q (Iq ) (3.16)
que es proporcional a la magnitud del error (rq − Oq ). Sustituyendo las ecuaciones 3.12,
21 dy
La regla de la cadena dice que Si y = f (u), u = g(x), y las derivadas du y du
dx
existen ambas, entonces
dy dy du
la función compuesta definida por y = f (g(x)) tiene una derivada dada por dx = du dx
[Swokowski, 1989].
3.14 en la ecuación 3.11 se obtiene:
∆wqp = α(rq − Oq )h0q (Iq )Op = αδq Op (3.17)
Cuando se introduce cualquier patrón de entrenamiento en la entrada de la red es posible
saber cuál es la salida de cada nodo rq . Ası́ se puede saber cómo se deben ajustar los
pesos que modifican los enlaces entre la última y penúltima capa de la red. De esta manera
concluye la primera fase del método de retropropagación.
Para analizar la segunda fase se comienza a analizar lo que sucede en la capa P . Al
realizar el procedimiento antes visto, se tiene:
∆wpj = α(rp − Op )h0p (Ip )Oj = αδp Oj (3.18)
donde el error es:
δp = (rp − Op )h0p (Ip ) (3.19)
En las ecuaciones anteriores 3.18 y 3.19 sólo se desconoce rp , el cual carece de importan-
cia en una capa interna, dado que no se sabe cuál serı́a la respuesta de un nodo interno
respecto a la pertenencia del patrón a una clase. Sólo se puede especificar la respuesta en
las salidas de la red, donde se realiza la clasificación definitiva del patrón. Por lo tanto,
se debe encontrar una forma de definir δp en términos de cantidades conocidas o que se
puedan observar en la red.
Considerando la ecuación 3.13, se observa que es posible escribir el término correspon-
diente al error de la capa P como:
∂EP ∂EP ∂Op

δp = − =− (3.20)
∂Ip ∂Op ∂Ip
∂Op
De acuerdo a la ecuación 3.15 el término ∂Ip es:
∂Op ∂
= hp (Ip ) = h0p (Ip ) (3.21)
∂Ip ∂hp
48 3 FUNDAMENTOS
que resulta conocido cuando se ha especificado hp , ya que es posible observar Ip . El término

∂EP
rq proviene de la derivada ∂Op , ası́ que se debe encontrar una expresión que no contenga
rp . Utilizando la regla de la cadena, se puede escribir la derivada como:
NQ NQ NP NQ NQ
∂EP X ∂EP ∂Iq X ∂EP ∂ X X ∂EP X
=− = (− ) Wqp OP = (− )wqp = δq wqp
∂Op ∂Iq ∂Op ∂Iq ∂Op ∂Iq
q=1 q=1 p=1 q=1 q=1
(3.22)
donde, la última expresión se obtiene de 3.12. Al sustituir las ecuaciones 3.21 y 3.22 en la
ecuación 3.20 se obtiene la expresión requerida δp :
NQ
X
δp = h0p (Ip ) δq wqp (3.23)
q=1
Con esta expresión, se puede calcular el factor δp , ya que todos sus términos se conocen.
Las ecuaciones 3.18 y 3.23 establecen la regla de entrenamiento para la capa P . Después
de calcular el término del error y los pesos de la capa P , se pueden usar estos resultados
para calcular el error y los pesos de la capa inmediatamente anterior a la capa P , es decir
se propaga hacia atrás el error de la red a partir del error de la capa de salida.
De esta forma al generalizar el procedimiento anterior se tiene que, para cualquier par
de capas K y J, siendo la capa K la que precede a la capa J, se deben calcular los pesos
wi,j que modifican los pesos entre ambas capas, utilizando
∆wi,j = αδj Ok (3.24)
Si la capa J es la capa de salida, δj es:
δj = (rj − Oj )h0j (Ij ) (3.25)
Si la capa J es una capa interna y P es la siguiente capa (por la derecha), entonces δj esta
dado por
NP
X
δj = h0j (Ij ) δp wjp (3.26)
p=1
para j = 1, 2, ..., Nj .
Al utilizar la función de activación de la ecuación 3.6 con θ0 = 1, se obtiene
h0j (Ij ) = Oj (1 − Oj ) (3.27)
en este caso las ecuaciones 3.25 y 3.26 se expresan de la siguiente forma para la capa de
salida:
δj = (rj − Oj )Oj (1 − Oj ) (3.28)
y para las capas internas:

NP
X
δj = Oj (1 − Oj ) δP wjp (3.29)
p=1
En ambas ecuaciones j = 1, 2, ..., Nj .
Un método para minimizar la función de error medio es el Gradiente Escalado Con-
jugado que puede entrenar cualquier red neuronal cuyos pesos, entradas y funciones de
transferencia posean funciones que puedan ser derivadas. La Retropropagación es usada
para calcular derivadas de desempeño con respecto a los pesos y bias22 de las funciones. El
Gradiente Escalado Conjugado se basa en direcciones conjugadas y no realiza búsquedas
en lı́nea en cada iteración [MathWorks, 2000], el procedimiento detallado de éste método
se puede encontrar en [Mitchell, 1997]. Las condiciones de paro para este tipo de entrena-
miento son:
El número máximo de épocas (repeticiones) sea alcanzado.
La máxima cantidad de tiempo ha sido excedida.
El desempeño ha sido minimizado a la meta.
El gradiente de desempeño cae por debajo del mı́nimo..
El desempeño de la validación ha superado el número máximo de fallas de validación
desde la última vez que ocurrió el último fallo (Cuando se usa validación).
22
Es un sesgo del error, dado por δbθ (d) = E[d(X) − θ], donde d(X) es un estimador de θ, y θ es un
parámetro a evaluar [Alpaydm, 2004]. Según [Kohavi, 1995] el bias de un método para estimar un parámetro
θ está definido como el valor esperado menos el valor estimado.
50 3 FUNDAMENTOS
Es importante recalcar que no existe una técnica para determinar el número de capas
ocultas, ni el número de neuronas que debe contener cada una de ellas para un problema
especı́fico, esta elección es determinada por la experiencia del diseñador quien debe cum-
plir con las limitaciones computacionales. Además durante el proceso de entrenamiento, la
red Retropropagación tiende a desarrollar relaciones internas entre neuronas con el fin de
organizar los datos de entrenamiento en clases [González and Woods, 1996].
3.6. Técnicas de Validación
Existen diversos métodos para medir la precisión en los resultados obtenidos por un
clasificador. Uno de estos es la técnica de Ten Fold Cross Validation –TFCV–. Esta técnica
se realiza siguiendo 4 etapas:
1. Dividir el conjunto de datos en 10 partes iguales.
2. Tomar 9 partes para entrenar y una para probar.
3. Rotar los datos de tal manera que las partes elegidas para entrenar y para probar no
sean siempre las mismas.
4. Calcular la taza de error global, que es igual al promedio de las tazas de error obte-
nidas en cada partición.
Una vez concluı́das las 4 etapas de TFCV, se tiene un valor muy aproximado al ı́ndice de
reconocimiento real de la técnica usada para la clasificación [Moore, 2001].
Por otra parte, los estudios realizados por [Kohavi, 1995] indican que la técnica Ten-
fold stratified cross validation es buena para la selección de un modelo clasificador.
Si se desea hacer más eficiente el entrenamiento de una red neuronal es posible aplicar
algunas técnicas de pre y post procesamiento a los datos de entrada de la red. Algunas
técnicas útiles son:
La normalización que se realiza al dividir todos los datos de entrada entre el valor
del dato mayor.

3.6 Técnicas de Validación 51
Normalizar la media y la desviación estandar de los datos de entrenamiento, es decir
hacer que estos tengan una media=0 y desviación estándar=1.
El uso de Análisis de componentes principales.

Capı́tulo 4
Estado del Arte
Como se ha comentado en capı́tulos anteriores, el objetivo principal de este trabajo
de tesis es clasificar a leucocitos en segmentados y no segmentados utilizando como crite-
rio principal la forma de su núcleo, ası́ que en búsqueda de un método de segmentación
que permita separar al núcleo lo mejor posible para lograr una buena extracción de ca-
racterı́sticas, se han encontrado algunos trabajos relacionados con esta problemática. A
continuación se comentan algunos de ellos.
4.1. Segmentación de una imagen celular para diagnóstico
patológico
Este trabajo fue desarrollado por Dorin Comaniciu y Peter Meer [Comaniciu, 2001], en
el que se presenta un algoritmo de segmentación celular que detecta clusters en el espacio
de color Luv1 y delinea sus bordes al utilizar el procedimiento de movimiento del promedio
del gradiente ascendente2 . La segmentación se deriva al mapear los vectores de color de
la imagen y ubicarlas en un espacio especı́fico. En la Figura 4.1 se muestra un bosquejo
general de la problemática abordada en este trabajo.
Las muestras utilizadas son leucocitos digitalizados, cuyos colores son caracterizados
1
Modelo de color propuesto por la CIE que se deriva del espacio XYZ.
2
Para más información sobre este método consultar: D. Comaniciu, P. Meer, Distribution free descom-
position of multivariate data, Pattern analysis and applications, Vol.2 No. 1, pp. 22-30, 1999.
54 4 ESTADO DEL ARTE
Figura 4.1: Proceso de segmentación de imágenes celulares para diagnóstico

patológico.
Figura 4.2: Imagen de un leucocito tı́pico. La imagen segmentada se presenta en

pseudocolor.
por pocos elementos, clusters no gaussianos cuyas figuras son aisladas a partir de la imagen
que esta siendo procesada. Métodos no paramétricos tales como el análisis basado en la
moda, son particularmente convenientes para la segmentación de este tipo de datos debido
a que no definen las formas de los clusters. Algunos resultados de la segmentación producida
en este trabajo se muestran en las Figuras 4.2, 4.3 y 4.4, tomadas de [Comaniciu, 2001].
En el trabajo de Dorin Comaniciu y Peter Meer, el uso de métodos probabilı́sticos
para realizar la segmentación se tomó como elemento importante en el proceso de elección
de una técnica que permitiera conseguir buenos resultados en la segmentación efectuada
en este trabajo de tesis. Además de la posibilidad de trabajar con un espacio de color
distinto al RGB, que permitiera anular los efectos indeseados causados por los cambios de
iluminación durante la digitalización de las muestras.

4.1 Segmentación de una imagen celular para diagnóstico patológico 55
Figura 4.3: Calidad de la segmentación. a). Imágenes originales, arriba una célula
de linfoma de Mantle y las dos de abajo son especı́menes de leucemia linfocı́tica crónica.
b). Contornos. c). Células segmentadas.
Figura 4.4: Segmentación de núcleos de varias categorı́as de células. El borde

del núcleo está marcado con blanco.
Figura 4.5: Esquema de segmentación. a). Generación de subimágenes conteniendo

células solas. b). Segmentación de núcleos y citoplasmas.
4.2. Automatización del Recuento Diferencial de la sangre
Neelam Sinha y A. G. Ramakrishnan [Sinha, 2002] utilizan una técnica para la automa-
tización del Recuento Diferencial de la sangre. La técnica recibe como entrada imágenes en
color de glóbulos blancos obtenidos de sangre periférica y determina el número de células
pertenecientes a cada clase. Este proceso incluye la segmentación, extracción de carac-
terı́sticas y clasificación. La Figura 4.5 se muestra el esquema de segmentación propuesto
[Sinha, 2002].
La segmentación se realiza en dos pasos sobre el equivalente HSV de la imagen, utili-
zando una agrupación K-Means seguida por el algoritmo EM3 . Las caracterı́sticas extraı́das
del citoplasma y núcleo segmentado, son elegidas por su aspecto visual, color y textura.
Se probaron varios clasificadores con diferentes combinaciones de caracterı́sticas. Para
entrenar a los clasificadores, se utilizó una base de datos de 50 ejemplares, 10 de cada clase.
Los datos de prueba, disjuntos del conjunto de entrenamiento, consisten de 34 elementos.
Se obtiene una clasificación del 97 % al utilizar redes neuronales. En la Figura 4.6, tomada
de [Sinha, 2002] se muestra la secuencia de procesamiento de un ejemplar.
Neelam Sinha y A. G. Ramakrishnan al utilizar métodos estadı́sticos para la segmen-
tación y hacer uso del espacio de color HSV proporcionan más evidencias acerca de que
3
–expectation-maximization –, este algoritmo primero calcula las probabilidades bayesianas posteriores
de los datos y obtiene los estimadores de parámetros actuales (paso E), y luego actualiza dichos parámetros
utilizando la media generalizada con teoremas ergódicos (paso M). Estos pasos se realizan alternadamente
hasta converger [Hen and Hwang, 2002].
4.3 Mejorado automático de detección de piel en imágenes de color 57
Figura 4.6: Secuencia de procesamiento. a. Imagen original. b. Imagen saturada. c.

Salida K-medias. d. Salida final.
la segmentación de células sanguı́neas es buena cuando se hace un estudio probabilı́stico
de la distribución del color sobre un espacio de color que maneja de forma separada la
información de la croma y la de iluminación.
Adicionalmente se comenta que el conjunto de entrenamiento se forma con igual núme-
ro de elementos de cada clase, lo que también se consideró en este trabajo de tesis al elegir
la cantidad de elementos que constituyen el conjunto de entrenamiento.
4.3. Mejorado automático de detección de piel en imágenes
de color
En este trabajo Filipe Tomaz, Tiago Candeias y Hamid Shahbazkia [Tomaz et al., 2003]
muestran una técnica de detección automática de piel. Las imágenes obtenidas se escalan
y se utiliza el espacio de color TSL debido a que los efectos ocasionados por el brillo y
los cambios de iluminación se reducen, de ésta manera la distribución de color de la piel
se puede representar con un modelo Gaussiano. También se hace uso de un filtro inicial
obtenido experimentalmente para eliminar pixeles que por sus caracterı́sticas en el modelo
RGB, no pueden pertenecer a la piel.
Como medida de similitud, se utiliza la Distancia de Mahalanobis para obtener un um-

Figura 4.7: Esquema de la detección automática de piel en imágenes de color.
Figura 4.8: Secuencia de procesamiento. Imagen original y resultados obtenidos

después de aplicar la segmentación.
bral que permite segmentar a los elementos piel, de los no piel. De esta manera, analizando
y agrupando los elementos resultantes de este discriminador, se obtienen buenos resulta-
dos y se eliminan las áreas pequeñas que no son piel y que estan presentes en una escena
comúnmente compleja. En el estudio se incluyen personas asiáticas, caucásicas, africanas
o descendientes de éstas. El método no es restricto a orientación, tamaño o agrupación de
los elementos de interés. En la Figura 4.7 se muestra el esquema básico de segmentación
propuesto en este trabajo, mientras que los resultados al aplicar dicha técnica se muestran
en la Figura 4.8, tomada de [Tomaz et al., 2003] en la cual se observa un fondo complejo
con diferentes colores de rostros de piel.
Los pasos utilizados en la segmentación efectuada por Filipe Tomaz, Tiago Candeias
y Hamid Shahbazkia constituyeron una buena alternativa para utilizar esta técnica en el
presente trabajo de tesis. Además de confirmar, la utilidad de los métodos estadı́sticos para
el análisis del color en imágenes digitales.
4.4. Identificación automática de objetos aéreos usando Re-
des Neuronales
Mahmoud A. Abdallah, Tayib I.Samu y William A. Grissom [Abdallah et al., 1995] en
este trabajo describen el desarrollo de un sistema automático de identificación de objetos

4.4 Identificación automática de objetos aéreos usando Redes Neuronales 59
Figura 4.9: Componentes del sistema de clasificación de objetos aéreos. Adqui-

sición de caracterı́sticas y entrenamiento de la red neuronal.
Figura 4.10: Aviones utilizados en el estudio.
aéreos. En la Figura 4.9 se señalan las fases que componen a este sistema de clasificación.
Las caracterı́sticas extraı́das son representaciones gráficas de las siluetas de los 5 tipos
de objetos a clasificar, que son obtenidas con técnicas de procesamiento de imágenes y algu-
nas propiedades de la transformada de Fouriers (FFT), las 5 formas de objetos que se identi-
fican se muestran en la Figura 4.10, las imágenes fueron tomadas de [Abdallah et al., 1995].
La FFT elimina variaciones en las caracterı́sticas extraı́das tales como rotación o escala. El
entrenamiento de la red utilizada para clasificar utiliza el paradigma de Cuantización del
Vector de Aprendizaje. La clasificación de los objetos es buena no importando su rotación,
escala o traslación, obteniendo un ı́ndice de reconocimiento del 95 %.
El método utilizado por Mahmoud A. Abdallah, Tayib I.Samu y William A. Grissom
para extraer caracterı́sticas de la forma de objetos distintos, se consideró en este trabajo
de tesis puesto que los objetos que se deben reconocer se encuentran en diferentes tamaños
y posiciones. Con estas consideraciones, se extrajeron las caracterı́sticas que mejor descri-
ben a la formas nucleares de los leucocitos, que son objeto de estudio en este trabajo de
investigación.
Por otra parte también se comenta en [Abdallah et al., 1995], que el uso de las redes
neuronales resulta útil cuando se trabaja con caracterı́sticas similares a las extraı́das en el
trabajo antes descrito.

Figura 4.11: Sistema de clasificación de células blancas sanguı́neas.
4.5. Análisis de imagen y aprendizaje supervisado en la di-
ferenciación automática de células blancas de imágenes
microscópicas
En este trabajo R. J. Katz [Katz, 2000] desarrolla un método de múltiples pasos (seg-
mentación, extracción de caracterı́sticas, uso de un clasificador) para diferenciar automáti-
camente imágenes de células blancas. En la Figura 4.11 se muestran los pasos que componen
el desarrollo de este sistema.
Primero se obtiene una imagen que contiene un núcleo celular que destaca en la es-
cena, la Figura 4.12 tomada de [Katz, 2000] muestra algunos ejemplares utilizados en su
estudio. La segmentación de la imagen en regiones de célula y no célula utiliza la detección
de bordes Canny (ver Figura 4.13 [Katz, 2000]) seguida por un algoritmo de identificación
de un cı́rculo, en la Figura 4.14 se encuentran algunos ejemplos con resultados que mues-
tran los cı́rculos obtenidos por Katz. El procedimiento para la detección de cı́rculos no es
completamente automático debido a que con el algoritmo no se obtienen buenos resultados
y la selección de la célula se realiza manualmente.

4.5 Análisis de imagen y aprendizaje supervisado en la diferenciación automática de células
blancas de imágenes microscópicas 61
Figura 4.12: Ejemplos de imágenes completas utilizadas en la investigación. De

izquierda a derecha: basófilo, eosinófilo, linfocito, neutrófilos.
Figura 4.13: Eosinófilo. Resultados de la detección de bordes Canny.
La extracción de las caracterı́sticas considera criterios como el color de la célula, ta-
maño e información morfológica nuclear. Con estos criterios se obtienen 25 caracterı́sticas
correspondientes a 206 imágenes de diferentes tipos, considerando diferente cantidad de
cada clase de célula.
Finalmente se evalúa a un conjunto de clasificadores4 con la herramienta WEKA5 uti-
lizando como referencia al clasificador ZeroR para compararlo con otros clasificadores. La
mejor clasificación se obtiene con una red neuronal entrenada con el algoritmo de retro-
propagación alcanzando un ı́ndice de error del 1.95 %.
El desempeño de los clasificadores generalmente es mejor en las clases que contienen
mayor número de instancias.
El estudio realizado por Katz concluye que la red neuronal de retropropagación resulta
ser la mejor elección como método para clasificar células sanguı́neas, y esto fue lo que con-
firmó el uso de redes neuronales en ésta tesis, además se descartó la posibilidad de formar
un conjunto de entrenamiento con diferente número de instancias para cada clase, pues
como lo dice Katz en su estudio, ésto provoca un mayor ı́ndice de reconocimiento sobre la
clase predominante.
4
OneR, ID3, C4.5, J4.8, IBk k vecinos más cercanos, Bayes simple y redes neuronales [Katz, 2000].
5
Ambiente para análisis de conocimiento que trabaja en plataforma Java y permite entrenar a un grupo
de clasificadores con un conjunto de datos comunes introducidos en un archivo [Katz, 2000].
Figura 4.14: Ejemplos de cı́rculos ajustados manualmente. Resultados del algo-

ritmo de detección de cı́rculos.
4.6. Localización y rastreo de rostros humanos con Redes
Neuronales
H. Martin Hunke [Hunke, 1994] propone un localizador de rostros conexionista que uti-
liza el algoritmo de entrenamiento de retropropagación capaz de manipular la orientación
de la cámara y el tamaño de la imagen para almacenar el rostro de alguna persona locali-
zada cada vez que aparece ésta en una secuencia de imágenes. El sistema opera en tiempo
real y se puede adaptar rápidamente a diferentes condiciones de iluminación, diferentes
cámaras y rostros haciéndolo robusto respecto a variaciones ambientales. En la Figura 4.15
se muestra la organización del sistema [Hunke, 1994].
Como se puede observar se recibe como entrada una imagen, de la cual se obtienen
caracterı́sticas de color y movimiento que por un lado se combinan para darse como en-
trada a una red neuronal, y por otro se toman como un objeto que se da como entrada a
una cámara virtual que continúa con el proceso de rastreo. Los resultados del sistema se
observan en la Figura 4.16 [Hunke, 1994].
La técnica de segmentación utilizada consiste en hacer un mapeo del espacio RGB al

4.6 Localización y rastreo de rostros humanos con Redes Neuronales 63
Figura 4.15: Estructura del sistema de localización y rastreo de rostros huma-

nos.
espacio RG considerando que el color caracterı́stico de la piel contiene escasa o nula infor-
mación de B. En la Figura 4.17 tomada de [Hunke, 1994], se describe el procedimiento.
El ı́ndice de reconocimiento obtenido por la red es de 95.2 % cuando se entrena con
una combinación de caracterı́sticas de color y de movimiento, mientras que al entrenar con
solo caracterı́sticas de movimiento el ı́ndice de reconocimiento es de un 68 %.
La aportación que se toma del trabajo de H. Martin Hunke se relaciona con la posi-
bilidad de eliminar información de algún canal cuando se trabaja en un espacio de color
especı́fico. El análisis de color realizado por Hunke durante la segmentación es motivado
por el hecho de que la información del canal que no se considera en el análisis, no es im-
portante.
Por otro lado, el uso de la red neuronal de retropropagación utilizada en el trabajo de
Hunke confirma que ésta técnica de clasificación da buenos resultados.

Figura 4.16: Localización de un rostro. a). Imagen original b). Imágenes en secuencia
c). Diferencia de las dos imágenes d). Conjunto de pixeles con caracterı́sticas de movi-
miento e). Aplicación del clasificador general de color de rostros –GFCC– f). Conjunto de
pixeles con caracterı́sticas de color de piel g). Objetos con caracterı́sticas de movimiento
y color de piel h). Objetos más grandes i). Rostro localizado.
Figura 4.17: Creación del clasificador de color de rostros. a). Primero se escoge
un área de interés en la imagen b). Se crea un modelo de distribución de color para el
área seleccionada c). Se umbraliza como pixeles de piel aquellos que posean valores que se
encuentren dentro de la media promedio.
4.7 Localización de rostros humanos en Tiempo Real 65
Figura 4.18: Localización de un rostro utilizando el modelo de color de piel.
4.7. Localización de rostros humanos en Tiempo Real
El trabajo de Jie Yang y Alex Waibel [Yang and Waibel, 1995] incluye un modelo es-
tocástico6 para caracterizar los colores de la piel en rostros humanos, similar al utilizado por
[Hunke, 1994]. Los resultados de la segmentación realizada por [Yang and Waibel, 1995] se
muestran en la Figura 4.18. La información que proporciona el modelo es suficiente para
detectar un rostro humano en varias poses y vistas. Además puede ser adaptado en tiempo
real para diferentes personas y condiciones de iluminación mientras la persona se mueve.
Para la detección de los rostros se utilizan tres tipos de modelos, uno para modelar el
color de la piel, otro para estimar el movimiento de la imagen y predecir la búsqueda en la
ventana, y un tercer modelo para la cámara, que se ocupa de predecir y compensar los mo-
vimientos de ésta. El control de la cámara utiliza un modelo basado en control predictivo
con un servidor basado en socket. La Figura 4.19 presenta un ejemplo del funcionamiento
completo del sistema propuesto por [Yang and Waibel, 1995].
El uso de métodos probabilı́sticos como apoyo para la segmentación similar al utilizado
por Hunke y la posibilidad de combinar caracterı́sticas para lograr una mejor clasificación
o toma de decisiones se tomó del trabajo de Jie Yang y Alex Waibel, pues finalmente se
demuestra que al tener una descripción más completa de los objetos o situaciones que son
motivo de estudio, es posible obtener buenos ı́ndices de clasificación o reconocimiento.
En la tabla 4.1 se resumen las ideas principales que se consideraron y dieron forma a
este trabajo de tesis.
Por otro lado, es importante referir algunos trabajos que también fueron útiles en el
6
Que esta determinado por el azar. Las leyes de causa-efecto no explican cómo actúa el sistema de
manera determinista, sino en función de probabilidades [Wikipedia Foundation, 2006].
AUTOR NOMBRE DATOS CLASES TÉCNICA
Segmentación de
Dorin Imágenes de linfomas malignos,
imagen celular movimiento de la
Comaniciu y células leucemia linfocı́tica
para diagnóstico media
Peter Meer sanguı́neas crónica
patológico
linfocitos,
bayes, redes
Neelam Sinha y Automatización de Imágenes de monocitos,
neuronales.
A. G. recuento diferencial células neutrófilos,
Reconocimiento:
Ramakrishnan de la sangre sanguı́neas básofilos,
97 %
eosinófilos
piel humana de
Filipe Tomaz, Detección Imágenes de
raza asiática, distancia de
Tiago Candeias automática de piel escenas que
causásica, africana Mahalanobis y
y Hamid en imágenes en contienen piel
o descendiente de filtro de mediana
Shahbazkia color humana
éstas
Mahmoud A. Identificación Imágenes de FFT, red

Abdallah, Tayib automática de escenas que Tipo de objeto neuronal tipo
I. Samu y objetos aéreos contienen algún aéreo de un total LVQ.
William A. usando redes tipo de objeto de 5 Reconocimiento:
Grissom neuronales aéreo 95 %
Análisis de imagen
y aprendizaje Filtro de canny,
supervisado en la Tipo célula: bayes, zero, ID3,
Imágenes de
diferenciación neutrófilo, basófilo, C4.5, redes
R. J. Katz células blancas
automática de eosinófilo, linfocito, neuronales.
de la sangre
células blancas de monocito Reconocimiento:
imágenes 95.2 %
microscópicas
Localización y
Imágenes de Redes neuronales.
H. Martin rastreo de rostros
contienen piel piel humana Reconocimiento:
Hunke humanos con redes
humana 95.2 %
neuronales
Localización de Imágenes que

Jie Yang y Alex Modelo
rostros humanos en contienen piel piel humana
Waibel estocástico
tiempo real humana
Segmentación en
color con modelo
Clasificación de leucocitos
de Mahalanobis y
Marı́a del Rocı́o leucocitos Imágenes de segmentados,
red neuronal de
Ochoa Montiel utilizando visión frotis sanguı́neo leucocitos no
retropropagación.
por computadora segmentados
Reconocimiento:
99.54 %
Tabla 4.1: Principales trabajos relacionados

4.7 Localización de rostros humanos en Tiempo Real 67
Figura 4.19: Ejemplo de localización de un rostro usando una combinación de

color, geometrı́a, e información de movimiento.
desarrollo de este trabajo de tesis. Entre ellos se encuentra la investigación de J. C. Terri-
llon [Terrillon et al., 1998], quien utiliza un modelo de color de piel basado en la métrica de
Mahalanobis y realiza un análisis de forma basado en momentos invariantes para detectar
automáticamente rostros humanos en imágenes de escenas naturales bidimensionales. Para
distinguir los rostros de otros distractores se utiliza una red neuronal multicapa entrenada
con el algoritmo de retropropagación, la cual recibe como vector entrada a los momentos
invariantes que se obtienen de la región segmentada como piel. Sus resultados demuestran
la eficiencia de la combinación de la segmentación en color y los momentos invariantes usa-
dos en la detección de rostros que se encuentran en diferentes poses y rodeados de fondos
complejos.
J. C. Terrillon y Shigeru Akamatsu en [Terrillon and Akamatsu, 2000], presentan un
análisis de diferentes espacios de crominancia para la segmentación en color de rostros
humanos en escenas complejas, donde se concluye que el espacio de crominancia TSL es el
espacio que modela mejor el color de la piel humana.
Un método propuesto por [Pérez and Hague, 2002] para un sistema de razonamiento
basado en lógica difusa es capaz de elegir dinámicamente el mejor umbral para binarizar
una imagen en niveles de gris. Los resultados se prueban sobre un amplio conjunto de se-
cuencias en tiempo real de imágenes de un campo de coliflores, donde uno de los objetivos
es apoyar a un experto en la toma de decisiones, tales como el rocı́o de fertilizante, agua o

pesticida. Además el sistema responde satisfactoriamente ante cambios en la iluminación.
En el trabajo de Daniela Mayumi y colaboradores [Ushizima et al., 2004] se presenta
un análisis de textura para el reconocimiento de leucocitos, donde la información textural
se utiliza para el cálculo de probabilidades que se utilizan como métrica para caracterizar
la organización espacial de los niveles de gris. Los resultados experimentales muestran que
los parámetros de textura son patrones especı́ficos de leucocitos, útiles en la diferenciación
de leucocitos normales y leucocitos de leucemia linfocı́tica crónica, evidenciando aspectos
de interés para el hematólogo tales como la cromatina7 nuclear y citoplásmica.
Guzmán de León [Guzmán, 2002], en un análisis de imágenes colposcópicas busca de-
tectar imágenes elementales de una manera automática o semiautomática, de tal forma
que no sea necesario que el ginecólogo colposcopista trace a mano esas regiones. El detec-
tar esas imágenes elementales permite eliminar subjetividades como localización, tamaño,
distancia, color y forma. Además resulta útil encontrar un parámetro que permita recono-
cer una patologı́a dada. El análisis de imágenes se hace con una técnica de segmentación
que trabaja sobre el espacio de representación de color, utilizando PCA para hacer una
transformación lineal que permite modelar un espacio de color exclusivo para imágenes
colsposcópicas.
Finalmente Ivón Arroyo y Agustı́n Schapira [Schapira and Arroyo, 1994] en su conta-
dor de células utilizan una técnica que permite realizar la identificación y conteo célular de
2 maneras. La primera consiste en seleccionar los objetos de interés a partir de los umbrales
de color mı́nimo y máximo que se desean en las células. La segunda forma de realizar la
identificación y conteo, se relaciona con las medidas reales que se requieren para aislar a
las células que cumplan con los parámetros dados por el usuario, las medidas se dan en
milı́metros que posteriormente se convierten a una longitud en pixeles. En este caso, el
sistema también permite seleccionar con el mouse una célula de interés para buscar a otras
células que cumplan con dichas caracterı́sticas de tamaño y color. El análisis de la imagen
se realiza con diversas operaciones con matrices.
7
Sustancia compleja constituida por ácidos nucleicos y proteı́nas, que se encuentra en el núcleo de las
células y se tiñe por los colorantes básicos de anilina.
Capı́tulo 5
Clasificación de leucocitos
Dentro de la primera sección de este capı́tulo se plantea la problemática de esta tesis,
mientras que en la segunda sección se describen los módulos que componen la metodologı́a
de solución. Los detalles de la implementación de cada módulo que constituye al método
de solución propuesto se mencionan en la sección 5.3.
5.1. Método para el reconocimiento de células sanguı́neas
Segmentadas y No Segmentadas
Las funciones involucradas en la solución a la problemática planteada en esta tesis se
basan en aplicar un procedimiento a una imagen que contiene una célula de interés, el cual
consiste en:
Extraer la región de interés, es decir la región que constituye al núcleo celular dado
que su forma determina la clase a la que pertenece la célula.
Obtener caracterı́sticas de la región etiquetada como núcleo.
Entrenar a una red neuronal con las caracterı́sticas adquiridas previamente.
La implementación de la solución propuesta en esta tesis se realizó en Matlab debido
a las caracterı́sticas de uso fácil, buen desempeño en el cálculo de operaciones matemáti-

70 5 CLASIFICACIÓN DE LEUCOCITOS
cas, manejo de funciones para el procesamiento de imágenes y entrenamiento de redes
neuronales.
5.2. Etapas en la solución del problema
La solución al problema planteado en esta tesis se compone de 5 etapas principales:
Adquisición y preprocesamiento de la imagen.
Segmentación en color.
Extracción de caracterı́sticas.
Entrenamiento de la red.
Reconocimiento de observaciones originales.
En la Figura 5.1 se muestra la organización general del método propuesto para clasificar
leucocitos. Los bloques a) y b) que aparecen con lı́neas punteadas representan dos casos
que se realizan en distintas ocasiones. Esto significa que se consideran tres métodos para
la clasificación de leucocitos y en cada uno sólo cambia el módulo de selección de carac-
terı́sticas.
En el módulo de adquisición y preprocesamiento de la imagen se obtiene una imagen
digitalizada de un campo visto en un microscopio óptico en el que se encuentra al menos
una célula de interés. En la sección 5.3.1 se presenta una descripción completa de esta
etapa. En el módulo de segmentación se utiliza el modelo propuesto por Filipe Tomaz en
[Tomaz et al., 2003], que se ha adecuado para obtener la región de interés. El procedimien-
to detallado se muestra en la sección 6.1.2.
El módulo de extracción de caracterı́sticas consta de tres procedimientos disjuntos, que
permiten obtener 3 conjuntos de caracterı́sticas, uno por cada procedimiento. En la sección
5.3.3 de este capı́tulo se muestra una descripción completa de dichos métodos.
En el módulo de Entrenamento de la red neuronal, se entrena a una red neuronal con
el algoritmo de retropropagación con los vectores de caracterı́sticas que se obtienen con

5.3 Método de clasificación de leucocitos 71
Figura 5.1: Organización general.
el método descrito en la sección 5.3.3. En la sección 5.3.4 se describe con más detalle el
proceso de éste entrenamiento.
En el módulo de Reconocimiento de las imágenes originales, se prueba a las redes
neuronales entrenadas, validando los resultados de cada entrenamiento con la técnica de
Validación cruzada en 10 particiones. En la sección 5.3.5 de este capı́tulo se discuten los
pormenores de este módulo.
5.3. Método de clasificación de leucocitos
Como se ha visto en secciones anteriores, las acciones que se realizan en cada etapa
pueden ser probadas de manera independiente.
Considerando las descripciones de los bloques que componen la solución del problema,
se describe cada etapa de este proceso en las secciones siguientes.

Figura 5.2: Proceso de adquisición de la imagen.
5.3.1. Adquisición y Preprocesamiento de la imagen
La preparación y tinción de las observaciones biológicas utilizadas en este trabajo de
tesis se realizó por un experto clı́nico empleando el método Tinción de Giemsa y Azul de
metileno descrito en la sección 3.1.2, el cual permite diferenciar a los componentes celulares
por el tinte que adquieren con dichos colorantes. En la Figura 5.2 se muestra un bosquejo
general de las actividades involucradas en el proceso de adquisición y digitalización de la
imagen.
El microscopio óptico que se utilizó para las observaciones tiene 3 objetivos que poseen
diferentes grados de aumento 10x, 40x y 100x, estos números corresponden a la escala en la
que se observan los objetos a través del ocular. Para distinguir adecuadamente las imágenes
digitalizadas se utilizó el objetivo de 100X, colocando una gota de aceite de inmersión1

1
La función del aceite de inmersión es restringir el movimiento de la muestra, además de evitar el
rozamiento entre el cubre objetos y el objetivo, generalmente se utiliza cuando se observa con el objetivo
100x. Otra función del aceite de inmersión es evitar que la luz se desvı́e; lo que se pretende es que la luz
entre el portaobjetos que contiene el frotis sanguı́neo y la lente del objetivo.
La cámara utilizada para digitalizar las imágenes es una Moticam 350 diseñada espe-
cialmente para microscopios ópticos, algunas de sus caracterı́sticas son:
Resolución: 659 ∗ 494 pixeles
Rango de color: 24 bits ó 16.7 millones de colores
Sistema operativo: Windows 98/2000/M e
Formato de datos soportado: BMP, JPG, MIG
El procedimiento para adaptar la cámara al microscopio consiste en desmontar el lente
más exterior del ocular del microscopio y colocar la cámara ensamblada con los accesorios
adecuados en lugar de éste, sujetándola con tornillos de presión. En la Figura 5.3 se mues-
tra este procedimiento.
Para enfocar la imagen se mueven manualmente las perillas de los micrómetros del
microscopio hasta tener una visión clara de la imagen en el monitor. No obstante, existen
variaciones en la iluminación que no se logran controlar.
Al observar las muestras biológicas, se logra distinguir claramente el núcleo que se ca-
racteriza por tener un color morado en contraste con colores claros del citoplasma, y aún
más claros en el exterior de la célula. Esto facilita el uso de un método de segmentación
basado en color. Para evitar el excesivo costo de procesamiento computacional, cada ob-
servación se escala a un tamaño de 64X64 pixeles. En la Figura 5.4 se muestran algunos
ejemplares representativos de cada tipo de glóbulos blancos.
5.3.2. Segmentación en color
Los núcleos celulares constituyen los elementos más importantes en las observaciones
realizadas debido a su color que los diferencı́a del resto de los elemenos en la escena.
Además, la forma que presenta cada núcleo determina la clase a la que pertenece la célula.
En la Figura 5.5 se señala el núcleo de una célula perteneciente a la clase Segmentadas.

llegue concentrada hacia la muestra.
Figura 5.3: Procedimiento de instalación de la cámara. Izq.- Montaje de Accesorios.

Der.- Cámara ajustada al microscopio.
Figura 5.4: Tipos de Leucocitos. Segmentados: neutrófilo y eosinófilo, No Segmenta-

dos: linfocito y monocito
Figura 5.5: Célula segmentada neutrófila.
La segmentación realizada utiliza un algoritmo propuesto por [Tomaz et al., 2003], que
se adecuó en esta tesis para separar núcleos celulares. En cada observación el núcleo puede
estar ubicado en diferentes posiciones y tener un color caracterı́stico en diferentes tonali-
dades. Al utilizar una técnica de segmentación basada en pixel, el tamaño y la orientación
de cada núcleo son irrelevantes. La Figura 5.6 presenta el procedimiento utilizado en el
proceso de segmentación de la imagen.
En la mayorı́a de las observaciones, la imagen presenta un fondo complejo y el área
que ocupa el núcleo es más pequeña que el resto de la escena. Se aplica un filtro inicial
que elimina gran parte de los pixeles que no pertenecen al núcleo. Este filtro inicial se
diseñó utilizando la información obtenida al observar los histogramas de los canales R, G,
y B de una imagen que corresponde a un recorte de núcleo de una observación. Al repetir
este procedimiento con las n observaciones, se obtienen histogramas similares. En la Figura
5.7 se muestra un ejemplo.
Como se puede ver, los valores para cada pixel que corresponden al canal G son pe-
queños. En los casos en los que la imagen es muy clara o muy obscura debido a los cambios
de iluminación producidos en el momento de su captura, se presenta un desplazamiento
pequeño a la derecha o a la izquierda, sin embargo esto no afecta significativamente los
experimentos subsecuentes.
Considerando una muestra M de tamaño n, cada observación que compone a esta mues-
tra consiste en un arreglo tridimensional X(i,j,k) correspondiente a la estructura de una
imagen, donde i = 1, 2, ..., 64, j = 1, 2, ..., 64, k = 1, 2, 3.
A partir de la información almacenada en X, para cada canal k se forma un histograma

Figura 5.6: Desarrollo del proceso de segmentación.
HISTOGRAMAS DE CANALES RGB DE UN RECORTE DE NÚCLEO

150
Canal R
100
Pixeles
50
0
0 50 100 150 200 250 300
3000
Canal G
2000
1000
0 Pixeles
0 50 100 150 200 250 300
300
Canal B
200
100
Pixeles
0
0 50 100 150 200 250 300
Figura 5.7: Histogramas de los canales RGB de un recorte de núcleo de una

célula segmentada.
Figura 5.8: Diferencias entre d1 y d2 .
Hk , donde la longitud de Hk es 256 y la i-ésima posición de H contiene la ocurrencia de los
valores desde 0 para la posición Hk1 hasta 255 para la posición Hk256 . Con la información
que se tiene en Hk , se obtienen las siguientes diferencias:
d1 = Hki+1 − Hki y d2 = Hki+2 − Hki+1 (5.1)
Gráficamente, esto se puede ver en la Figura 5.8.
Para cada valor de d1 y d2 , se evalúan las siguientes condiciones, donde i = 1 . . . 256 :
V mini = i
} Si d1 < d2 ( existe un pico mı́nimo)
V maxi = 0
V mini = 0
} Si d1 > d2 ( existe un pico máximo) (5.2)
V maxi = i
V mini = 0
} Si d1 = d2 ( pues no existen picos mı́nimos ni máximos)
V maxi = 0
V mini y V maxi son vectores que contienen los ı́ndices del histograma Hk , en los cuales
existe un pico mı́nimo o máximo, respectivamente.
De esta manera son definidos umbralinf = min(V max) y umbralsup = max(V min). Se
calcula finalmente umbralinf y umbralsup de las n observaciones para obtener los umbrales
a). Célula segmentada original b). Célula segmentada después de aplicar el filtro inicial
Figura 5.9: Resultados de Filtro inicial aplicado a una célula segmentada.
utilizados en el filtro inicial:
//RGB son valores que estan en el rango de 0 a 255

k=1 |B >= umbralk=3 |G <= umbralk=2 )
Si (R >= umbralinf inf sup
ES NUCLEO
En la Figura 5.9 se muestra una observación correspondiente a una célula de la clase
Segmentada antes y después de aplicar el filtro inicial.
Modelo de color para núcleos de leucocitos. Para modelar el esquema utilizado en
la segunda parte de la segmentación, las imágenes de recortes de núcleos son transformadas
al espacio de crominancia TSL, debido a que en este espacio la información del color se
encuentra en dos canales, T y S reduciendo la cantidad de información con la que se
trabaja, además como se menciona en [Terrillon et al., 2000], es recomendable trabajar en
el espacio TSL aún cuando las condiciones de iluminación varı́an, siendo efectivo cuando
se utiliza un modelo Gaussiano.
Utilizando las siguientes transformaciones, se obtiene la representación equivalente de
cada pixel en el espacio TSL, el canal L(iluminación) no se utiliza, por lo que no se muestra
la ecuación equivalente.
 0
 tan−1 ( gr 0 )
s 
 + 0.5, g 0 6= 0

 π
9
S= y T = (5.3)
5(r + g 0 2 )
02




 0, g0 = 0
donde
0 R 0 G
r = − 1/3 y g = − 1/3 (5.4)
R+G+B R+G+B
Para representar el color del núcleo, se define una matriz de covarianza CT S , que indica
la relación de los valores para los canales T y S de la imagen. Para construir la matriz de
covarianza CT S , se considera a T y S como la unión de los componentes T y S de cada
observación, es decir
l
Ti,j → Tkl y l
Si,j → Skl (5.5)
donde,
k = 642 (l − 1) + 64(i − 1) + j
l = 1...354
(5.6)
i = 1...64
j = 1...64
También se obtiene un vector de medias Vm utilizando los canales T y S de las n
observaciones.
· ¸T
Vm = Mt Ms (5.7)
Mt y Ms son escalares que se representan el promedio de los elementos de T y S, res-
pectivamente. La matriz de covarianza queda definida como
 
 σ2 T σT S 
CT S =   (5.8)
σT S σ 2 S
donde,
Pl
σ2T = i=1 (Ti − Mt )2
Pl
σ2S = i=1 (Si − Ms )2 (5.9)
Pl
σT S = i=1 (Ti − Mt )(Si − Ms )
La distancia |λ2i,j | del pixel(i,j) al vector Vm se define utilizando como métrica la dis-
tancia de Mahallanobis como sigue.
|λ2i,j | = [Xi,j − Vm ]T CT−1

S [Xi,j − Vm ]
(5.10)
donde, Xi,j = pixeli,j de la imagen obtenida después de haber aplicado el filtro inicial.
Las barras verticales en |λ2i,j | indican que se trata de un valor positivo, pues como se
mencionó en la sección 3.2.1, una distancia siempre es positiva.
Umbralización. Antes de hacer una umbralización binaria con |λ2i,j |, ésta se normaliza
utilizando la ecuación utilizada por Tomaz [Tomaz et al., 2003].
λ2i,j
disM = 1 − (5.11)
cons
donde, cons = 9.
El valor de cons es obtenido experimentalmente. Después de esta normalización, se
umbraliza la región que se obtuvo al aplicar el filtro inicial, considerando como parte del
núcleo a los pixeles cuyo valor es mayor a 0.7. Los resultados de esta primera umbralización
se pueden ver en la Figura 5.10, en la que aún pueden distinguirse algunos pixeles que no
forman parte del núcleo.
Finalmente, para eliminar los pixeles aislados que aparecen en la imagen, se aplica un
filtro de mediana con una ventana de 9x9 pixeles.

Figura 5.10: Umbralización con el Modelo de Mahalanobis. a)Imagen original.

b)Imagen después de aplicar filtro inicial. c)Imagen después de aplicar modelo de Maha-
lanobis.
5.3.3. Extracción de caracterı́sticas
En el capı́tulo anterior se mencionó que la problemática abordada en esta tesis consiste
en clasificar una célula sanguı́nea en Segmentada o No Segmentada considerando su
morfologı́a nuclear. Como parte de la solución dada, se comienza por digitalizar un campo
visto a través de una cámara adaptada a un microscopio óptico y posteriormente separar
el núcleo de la imagen observada. El proceso detallado de ésta etapa se ha descrito en la
sección anterior.
Una vez concluı́da la segmentación del núcleo, el siguiente paso consiste en la extración
de caracterı́sticas para clasificar a la imagen. Por lo tanto, es preciso recordar lo visto en
el capı́tulo 3, donde se señala que las Redes neuronales reciben como entrada vectores de
caracterı́sticas que describen los ejemplos de entrenamiento y son una herramienta útil en
la clasificación de patrones. En este trabajo de tesis se utilizan las redes neuronales como
la técnica para clasificar a las regiones etiquetadas como núcleo, y catalogarlas dentro de la
clase Segmentados o No Segmentados tomando en cuenta caracterı́sticas que permitan
describir su forma. En esta sección se muestra el procedimiento para obtener los vectores
de caracterı́sticas que se dan como entrada a la red neuronal. La Figura 5.11 muestra
un esquema general que indica el procedimiento utilizado en el módulo de extraccón de
caracterı́sticas.
Extracción de caracterı́sticas estructurales
El proceso de extracción de caracterı́sticas estructurales recibe como entrada la imagen
segmentada que se obtuvo en la etapa anterior, en la cual puede existir más de una región
Figura 5.11: Extracción de caracterı́sticas.
y para cada región de éstas se obtienen 12 atributos, ası́ se tienen 13 caracterı́sticas de
cada imagen.
Con el número de regiones y el área de cada región es posible tener una aproximación
de la clase a la que puede pertenecer la célula, pues una imagen que contenga más de
una región de tamaño similiar es muy probable que corresponda a una célula de la clase
Segmentada, debido a que su núcleo se encuentra fragmentado, a diferencia de las células
de la clase No Segmentada, cuyo núcleo es casi redondo y no está dividido. Sin embargo,
esta aproximación no es suficiente para ubicar a todas las células en la clase a la que
pertenecen, pues gran parte de las imágenes están formadas por sólo una región.
Las caracterı́sticas que se enlistan en la tabla 5.1 se calculan para las n observaciones.
Todas son escalares para no elevar el costo computacional involucrado en su procesamiento.
La descripción de algunas de ellas se encuentra en la sección 3.4, por lo que en esta tabla
sólo se describen aquellas que fueron deducidas a partir de las caracterı́sticas estructurales
definidas en la tabla 3.1 de dicha sección.
Para cada observación se obtiene un vector de caracterı́sticas. En la Figura 5.12 se
muestra la tabla de caracterı́sticas correspondiente a algunos datos obtenidos para la clase
Segmentados.
Extracción de caracterı́sticas estructurales con análisis de varianza
Las caracterı́sticas estructurales con análisis de varianza son caracterı́sticas elegidas
después de realizar un análisis para ambas clases de células, de la varianza de un conjunto

NÚMERO CARACTERÍSTICA
1 Número de regiones que contiene la imagen
2 Excentricidad
3 Solidez
4 Rectangularidad (Extent)
5 Longitud de Eje mayor
6 Longitud de Eje menor
7 Número de Euler
8 Orientación
9 Diámetro equivalente
10 Área del bounding box
Relación de ejes. Calculado como
11
Longitud de eje mayor/Longitud de eje menor
Diferencia de áreas. Calculado como
12
Área del Convex Hull − Área de la región
Varianza de los radios. Es la varianza de las distancias
13 euclidianas del centro de masa de la región a cada punto
que forma su perı́metro.
Tabla 5.1: Caracterı́sticas estructurales.
Figura 5.12: Almacenamiento de las caracterı́sticas estructurales.

1 Área de la región
Elongación (razón de aspecto). Es la cuadratura del B. box.
2
Calculado como Longitud de la base/Longitud de la altura
5 Relación de Ejes
6 Excentricidad
7 Orientación
8 Área del bounding box
Área vacı́a. Calculada como
9
Area del B.Box − Area de la región
10 Área del Convex Hull
11 Número de Euler
13 Solidez
14 Rectangularidad
15 Diferencia de Áreas
16 Número de regiones
17 Varianza de los radios
Tabla 5.2: Caracterı́sticas estructurales iniciales para el análisis de varianza.
de caracterı́sticas estructurales.
Las caracterı́sticas elegidas para el análisis de varianza se presentan en la tabla 5.2,
en la cual sólo se definen las caracterı́sticas que no han sido consideradas en tablas de
caracterı́sticas ya mostradas.
Las caracterı́sticas mostradas en la tabla se calculan para todas las observaciones de
cada clase y se almacenan dichos valores en un vector, de tal manera que para cada carac-
terı́stica se obtienen 2 vectores (uno para cada clase). Posteriormente se calcula la varianza
de cada vector caracterı́stico para ambas clases, con estos valores se obtiene una diferencia
(como valor absoluto).
En la tabla 5.3 se presentan los resultados obtenidos al aplicar el procedimiento an-
tes descrito. Como se puede observar, para cada caracterı́stica se muestran 3 columnas:
la primera respresenta la varianza obtenida para las células de la clase Segmentadas, la
segunda contiene la información referente a la varianza para la clase No segmentadas.
En la tercera columna se muestra la diferencia (como valor absoluto) de los valores

CARACTERÍSTICA V arianzaSeg V arianzaN oSeg Diferencia de varianzas

1. Área de la región 1.5391 2.2133 0.6742
2. Elongación 0 0 0
3. Longitud de Eje mayor 0.0017 0.0011 0.0060
4. Longitud de Eje menor 0.009 0.009 0.0003
5. Relación de Ejes 0 0 0
6. Excentricidad 0 0 0
7. Orientación 0.0264 0.0284 0.0198
8. Área del bounding box 1.6162 2.2583 0.6421
9. Área vacı́a 0.0061 0.0061 0
10. Área del Convex Hull 2.4198 2.3072 1.1266
11. Número de Euler 0 0 0
12. Diámetro equivalente 0.008 0.0009 0.0014
13. Solidez 0 0 0
14. Rectangularidad 0 0 0
15. Diferencia de Áreas 0.2299 0.1029 0.1269
16. Número de regiones 0 0 0.0001
17. Varianza de los radios 0.0010 0.0010 0
Tabla 5.3: Resultados del análisis de varianza para 17 caracterı́sticas estructu-

rales.
encontrados en la primera y segunda columna, para cada una de las 17 caracterı́sticas
consideradas.
De acuerdo a los resultados observados en la tercera columna, tenemos que el criterio
para la selección de las caracterı́sticas fue descartar a aquellos renglones cuya diferencia
entre ambas clases (tercera columna) sea mayor a 0.0001, considerando una precisión de
4 dı́gitos en la parte decimal debido a que los valores obtenidos para estas diferencias son
por naturaleza muy pequeños.
La condición propuesta para la selección de caracterı́sticas es:
Si |V arianzaSeg − V arianzaN oSeg | > 0.0001, entonces
se elige la caracterı́stica
en caso contrario
se descarta la caracterı́stica
Los resultados obtenidos con este método se observan en la tabla 5.4.

1 Área de la región
4 Orientación
5 Área del Bounding box
6 Área del Convex Hull
8 Diferencia de áreas
Tabla 5.4: Caracterı́sticas estructurales obtenidas con el análisis de varianza.
Extracción de caracterı́sticas radiales
Las caracterı́sticas radiales deben su nombre a que se derivan de la medida del centro de
masa de la región de interés a su perı́metro, lo cual se interpreta como un radio geométrico.
A continuación se definen 2 conceptos básicos para describir el procedimiento utilizado para
obtener las caracterı́sticas radiales.
Distancia radial, DR.- Distancia euclidiana del centro de masa a algún punto que forma
el perı́metro de la región.
Vector de caracterı́sticas radiales, V .- Vector que contiene las distancias radiales DR
de una región.
De acuerdo a las definiciones anteriores, para cada observación se obtiene un vector de
caracterı́sticas radiales de longitud variable, dado que dicha longitud depende de la cantidad
de puntos que forma el perı́metro de la región. En caso de recibir como entrada una imagen
que contenga más de una región, se considera sólo la región que tiene la mayor área, para
extraer sus caracterı́sticas radiales.
Sin embargo, la red neuronal recibe como entrada una matriz de caracterı́sticas que
deberá formarse a partir de los vectores de caracterı́sticas radiales, y con vectores de
diferente tamaño no es posible construir dicha matriz.
Para solucionar este problema, se propone un método para escalar los vectores sin
producir alteraciones significativas en la información que contienen, pues esta información
es un descriptor de la forma de la región.

Figura 5.13: Método para el cálculo de las caracterı́sticas radiales.
El escalamiento propuesto consiste en elegir el tamaño al cual se reducirán los vectores
de caracterı́sticas de las n observaciones, para lo cual se busca entre los n vectores de
caracterı́sticas aquel que tenga la menor longitud Lmin , este valor es usado para escalar
todos los vectores cuya longitud es mayor a Lmin . A continuación se presentan dos métodos
para realizar este escalamiento.
La Figura 5.13 muestra el método utilizado para la extracción de las caracterı́sticos
radiales. En los párrafos siguientes se describen con detalle las técnicas de escalamiento
utilizadas para ajustar los vectores de caracterı́sticas radiales a un mismo tamaño.
Escalamiento Aleatorio
En este caso para cada observación se toman aleatoriamente Lmin elementos de su
correspondiente vector V de caracterı́sticas radiales conservando el orden, para formar un
segundo vector V 0 . Dado que cada vector V 0 es de la misma longitud, se construye la tabla
Figura 5.14: Almacenamiento de las caracterı́sticas radiales obtenidas aleato-

riamente.
de caracterı́sticas al colococar a los vectores V10 , V20 , V30 , ...Vn0 como renglones de dicha tabla.
Esto se muestra en la Figura 5.14
Al realizar una selección aleatoria de los elementos de V resulta un muestreo no ho-
mogéneo, pues cada vez se eligen diferentes puntos para formar el vector de caracterı́sticas
radiales.
Escalamiento con Transformación Lineal
Para obtener una selección homogenea de los elementos que forman el vector de carac-
terı́sticas radiales, se realiza un escalamiento utilizando la siguiente transformación lineal:
k Vj k
Vi0 = b ∗ ic (5.12)
Lmin
donde,
i = 1..Lmin
j = 1..n
Vi0 = vector de caracterı́sticas resultante de longitud Lmin
Finalmente se construye una tabla de caracterı́sticas similar a la que se muestra en la

Figura 5.15: Izquierda. Perı́metro de un núcleo. Centro. Puntos escogidos para for-
mar V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0 en el
escalamiento lineal.
Figura 5.16: A la izquierda: Región nuclear de una célula segmentada. A la derecha:

Perı́metro de la región de la izquierda.
Figura 5.14, en la que cada reglón está constituı́do por los vectores V10 , V20 , V30 , ...Vn0 . En la
Figura 5.15 se muestra el perı́metro de una región y las imágenes obtenidas al realizar un
escalamiento aleatorio y un escalamiento lineal.
Propiedades de la Transformada Rápida de Fourier
En la Figura 5.16 se muestra la región nuclear de una observación y su perı́metro. Para
obtener componentes de frecuencia significativos, la función se transforma del dominio del
tiempo al dominio de la frecuencia usando la transformada rápida de Fourier. La Figura
5.17 en la parte superior representa el perı́metro mostrado en 5.16 en el dominio del tiem-
po, mientras que en la parte inferior se muestra la magnitud de dicho perı́metro después
de aplicar la FFT.
Uno de los principales objetivos en la selección de caracterı́sticas para el entrenamiento
de la red neuronal es evitar variaciones de rotación, traslación y escalamiento de las imáge-
nes. Se utilizan 2 propiedades de la transformada de Fourier para neutralizar los efectos
de rotación y escala. Estas propiedades son: multiplicación por una constante y el cambio
del tiempo al dominio de la frecuencia.
En el dominio del tiempo, rotar una función significa desplazarla; mientras que el es-
Figura 5.17: Perı́metro de la región de interés. Arriba. Representación del perı́me-

tro en el dominio del tiempo. Abajo. Representación del perı́metro en el dominio de la
frecuencia, considerando solo la parte de magnitud después de aplicar la FFT
calamiento la multiplica por una constante, que es el factor de escalamiento.
Dada una función de tiempo f (t), la Transformada Rápida de Fourier esta dada por:
z[f (t)] = F (jω) (5.13)
F (jω) =| F (jω) | ejφ (5.14)
donde, | F (jω) | es la amplitud. Además si f (t) es multiplicada por una constante A,
se tiene:
z[Af (t)] = AF (jω) (5.15)
AF (jω) = A | F (jω) | ejφ (5.16)
La constante A es el factor escala que afecta la función f (t), siempre que una imagen es
capturada bajo diferentes escalas. Para nulificar el efecto de la constante A en la magnitud,
el efecto de A en la función f (t) se elimina. Esto se logra al normalizar la función f (t). La

normalización consiste en dividir Vi0 por el máximo de los elementos de Vi0 .
La propiedad de desplazamiento en el dominio de la frecuencia elimina los efectos de
rotación. Sin embargo si alguna imagen es rotada en el dominio del tiempo, resulta en un
cambio de la función f (t) por un tiempo t0 . La función f (t) se convierte en f (t−t0 ) cuando
la rotación ocurre. La FFT está dada por:
z[f (t − t0 )] =| F (jω) | ejφ .e−jφt0 (5.17)
z[f (t − t0 )] =| F (jω) | ej(φ−ωt0 ) (5.18)
Sólo el componente de fase de la transformada es afectado por la rotación, por lo tanto
la amplitud, que no se ve afectada por el movimiento resulta útil.
El centro de masa se utilizó como el punto de referencia en el cálculo de distancias
radiales para eliminar variaciones causadas por los efectos traslación.
Utilizando estas propiedades de la Transformada de Fourier, se crean los vectores de
caracterı́sticas considerando que f (t) = Vi0 . Como resultado de esta transformación se
obtiene un conjunto de números complejos y se extrae la amplitud o módulo de cada uno
de ellos para formar un nuevo vector de caracterı́sticas Di . Con este nuevo conjunto de
vectores se construye la tabla de caracterı́sticas que se muestra en la Figura 5.18.
5.3.4. Entrenamiento de la red
El entrenamiento se realiza con una red neuronal de retropropagación, la cual requiere
de un problema supervisado, ası́ la red aprende a clasificar vectores de entrada en clases
definidas por el usuario. En este caso las clases son Segmentados y No Segmentados.
El tipo de aprendizaje por retropropagación debe su nombre a que los pesos de las neu-
ronas se corrigen primero en la capa de salida, después en la segunda capa oculta si es
que existe, y al final en la primera capa oculta, es decir en la primera capa que recibe la
información directamente de la entrada. La arquitectura de la red neuronal es tal, que la
capa más interna tiene menos neuronas que las capas externas ya que por experimentación
Figura 5.18: Almacenamiento de las caracterı́sticas obtenidas después de apli-

car FFT.
al aumentar el número de neuronas en las capas ocultas, los resultados no mejoran.
El entrenamiento se realiza de manera independiente con cada conjunto de caracterı́sti-
cas mostrado en las tablas de las Figuras 5.12 y 5.18. En cada caso la red neuronal tiene
m neuronas de entrada, donde m corresponde al número de caracterı́sticas o columnas de
las tablas mostradas en las figuras correspondientes. Los vectores de clases son paráme-
tros adicionales que se introducen a la función de entrenamiento. La red neuronal tiene 2
neuronas de salida que corresponden a las clases que la red es capaz de reconocer. Para
explicar la manera en que la red neuronal recibe los datos, suponga que la matriz E es la
entrada, y el vector C contiene las etiquetas de las clases a reconocer.
 
e1,1 e1,2 ..... e1,n
 
 
 e2,1 e2,2 ..... e2,n 
  · ¸
 
E=
 . . ..... . C =
 1 2 . . 2 (5.19)
 
 
 . . ..... . 
 
em,1 em,2 ..... em,n
donde, n corresponde al número de observaciones. Cada columna en la matriz de entra-
da E representa las caracterı́sticas extraı́das (en forma de vector) para una observación de
cierta clase, y la correspondiente fila en el vector C representa la clase a la que pertenece.
Los vectores de caracterı́sticas de clase se colocan de manera alternada en la matriz
Mce y se considera igual número de observaciones para ambas clases. Como son dos clases
que la red neuronal reconoce, el vector de clases CM contiene los números 1 y 2 de manera
alternada representando a cada clase. La matriz de entrada que se muestra a continuación
corresponde al conjunto de caracterı́sticas estructurales de la Figura 5.12.
 
1 1 1 . . . . . 1
 
 
 0.853 0.789 0.481 . . . . . 0.899 
 
 
 0.863 0.786 0.762 . . . . . 0.867 
 
 
 
 0.594 0.777 0.526 . . . . . 0.877 
 
 
 48.63 47.89 40.44 . . . . . 45.78 
 
 
 25.32 51.56 35.47 . . . . . 49.81 
 
 
 
Mce = 1 1 1 . . . . . 1  (5.20)
 
 
 24.69 45.89 105.8 . . . . . 48.99 
 
 
 
 33.53 56.78 33.14 . . . . . 51.78 
 
 
 1.363 1.567 0.928 . . . . . 1.678 
 
 
 1.921 1.987 1.141 . . . . . 1.874 
 
 
 
 140 134 269 . . . . . 123 
 
24.25 10.23 30.55 . . . . . 12.78
· ¸
CM = 1 2 . . 2 (5.21)
Cabe decir que el 10 % de las n observaciones se utilizan para probar la red y con el
resto se entrena. Cada vez que se prueban los datos se eligen aleatoriamente para tomar
una muestra diferente cada vez. Los datos de prueba y de entrenamiento se organizan en
matrices como se indica en la ecuación 5.19, de esta forma quedan definidas una matriz de
prueba P y una matriz de entrenamiento Mce .
El entrenamiento se detiene cuando cualquiera de las siguientes condiciones ocurre:

El número máximo de épocas (repeticiones) sea alcanzado.
La máxima cantidad de tiempo ha sido excedida.
El desempeño ha sido minimizado a la meta.
Como parte de la experimentación se preprocesan las matrices de caracterı́sticas con PCA
reduciendo el número de caracterı́sticas de entrada, mejorando el ı́ndice de reconocimiento.
Después de aplicar PCA a las matrices de entrenamiento que se forman a partir de las
tablas de caracterı́sticas obtenidas, se reduce el número de caracterı́sticas y se entrena la
red. Al terminar en entrenamiento la red neuronal se prueba con la matriz de prueba P y
finalmente se comparan las etiquetas separadas de la matriz de prueba (vector CM ) con la
salida obtenida de la red neuronal. Los resultados se contabilizan utilizando una matriz de
confusión2 y se obtiene la precisión del clasificador utilizado.
5.3.5. Reconocimiento de observaciones originales
La evaluación del desempeño de la red neuronal, respecto a precisión, desempeño y
fiabilidad se realiza con la técnica de Ten Fold Cross Validation –Validación cruzada en
10 particiones–. El método consiste en tomar de las n observaciones el 90 % para entrenar
y el 10 % para probar. Este procedimiento se repite 10 veces y en cada vez se rotan los
datos para analizar diferentes conjuntos en cada caso. Como resultado de cada prueba se
obtienen un ı́ndice de reconocimiento Ri , al promediar los valores de estos Ri se obtiene
un RT que representa un ı́ndice de precisión en los resultados obtenidos.
2
Una matriz de confusion indica en su posicion (i, j) el numero de muestras de la clase j asignadas
por el clasificador a la clase i. Esta estructura permite averiguar los pares declases entre los que son mas
frecuentes los errores del clasificador.
Capı́tulo 6
Pruebas y análisis de resultados
En este capı́tulo se muestran los resultados que se obtienen al utilizar la metodologı́a
propuesta en la sección 2.4. Considerando una medida de similitud para el desarrollo del
modelo de segmentación y al menos tres técnicas que permiten la extracción de carac-
terı́sticas utilizadas como descriptores de forma, en principio se describen los resultados
obtenidos durante la etapa de adquisición de la imagen y posteriormente en la etapa de
segmentación.
Después se comenta el proceso de extracción de caracterı́sticas, que se divide en tres
partes. Mostrándose que las caracterı́sticas estructurales, no son los atributos que descri-
ben de la mejor manera a la forma de la región nuclear.
Finalmente se realiza un análisis comparativo sobre los resultados obtenidos con cada
conjunto de caracterı́sticas y se muestran los resultados obtenidos en la evaluación del
desempeño de la red neuronal.
6.1. Pruebas
6.1.1. Adquisición y preprocesamiento de la imagen
En principio se recolectan los frotis sanguı́neos que son analizados por un experto clı́ni-
co para obtener las observaciones utilizadas en esta tesis. El primer paso para obtener
estos frotis consiste en la recolección de muestras de sangre de diferentes pacientes, ca-

96 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
Figura 6.1: Recolección de muestras sanguı́neas. Izquierda. Elección del paciente.

Centro. Extracción de la sangre. Derecha. Preparación y tinción del frotis.
talogados como normales. Se toman en cuenta este tipo de pacientes con la finalidad de
disminuir la posibilidad de encontrar células anormales (anatómica y morfológicamente)
que generalmente se presentan en patologı́as como la leucemia o la anemia, además de que
la clasificación realizada en este trabajo se realiza de acuerdo a las caracterı́sticas presentes
en células normales.
Las muestras biológicas (frotis sanguı́neos teñidos para Recuento Diferencial) fueron
proporcionadas por instituciones como los Laboratorios BioDiagnostics, el Banco de san-
gre de Tlaxcala, el Hospital General de Apizaco y el Laboratorio de Citologı́a del Instituto
Mexicano del Seguro Social de Tlaxcala. En la Figura 6.1 se presentan las acciones in-
volucradas en la recolección y preparación de las muestras de sangre y que van desde la
elección del paciente, hasta la toma de la muestra y la preparación del frotis realizada por
un experto clı́nico. El procedimiento detallado para tinción de dicho frotis se comenta en
la sección 3.1.2.
A pesar de que la cantidad de frotis recolectados con esta técnica fue de más de 100,
se utilizaron 85 para la adquisición de las imágenes dado que por cada muestra se hace un
recorrido obteniendo diferentes imágenes, de tal manera que por cada frotis se digitalizan
entre 3 y 5 imágenes. La digitalización de las imágenes se realizó en las instalaciones de los
Laboratorios BioDiagnostics1 con el apoyo de un experto clı́nico 2 para el reconocimiento
de la célula.
Para digitalizar las imágenes primero se montó la cámara al microscopio, como se ob-
serva en la Figura 5.3. Para enfocar un campo en el microscopio se colocó una gota de
aceite de inmersión sobre el frotis sanguı́neo, que después es colocado sobre la base del
1
Laboratorio clı́nico particular ubicado en la Cd. de Apizaco, Tlax.
2
Q.F.B. Gonzalo Romero Tirso.
6.1 Pruebas 97
Figura 6.2: Adquisición de las observaciones. Izquierda: Gota de aceite sobre el

frotis. Centro: Colocación del frotis sobre la base del microscopio. Derecha: Campo visto
a través de la cámara.
Figura 6.3: Campos vistos al microscopio con diferentes aumentos. Izquierda:

Utilizando el objetivo de 40X. Derecha: Utilizando el objetivo de 100X.
portaobjetos acercándolo de tal manera que exista contacto fı́sico con el objetivo 100X del
microscopio. Esta secuencia de pasos se observa en la Figura 6.2.
Para la adquisición de las imágenes se trabajó con el objetivo 100X dado que se distin-
guen mejor las caracterı́sticas de la célula, en la Figura 6.3 se puede apreciar la diferencia
al enfocar un campo visto con el objetivo 40X y otro al cambiar al objetivo 100X.
Los tipos de células observadas pertenecen a 2 clases principales: Segmentados y No
Segmentados. Cada clase tiene subtipos, sin embargo la forma de su núcleo es represen-
tativa de cada una. Las células que pertenecen a la clase Segmentados se caracterizan
por tener un núcleo deforme, mientras que las células de la clase No Segmentados pre-
sentan un núcleo de forma redondeada. En la Figura 6.4, se muestran los subtipos básicos
de células Segmentadas y No Segmentadas.
En cada campo observado a través de la cámara se visualiza al menos una célula de
interés como se aprecia en la parte derecha de la Figura 6.3; de este campo se recorta
manualmente el área que encierra a la célula de interés, con lo cual se obtienen imágenes
como las que aparecen en la Figura 6.4, de este modo se adquieren 354 observaciones que
pertenecen a los tipos señalados en la Figura 6.5.
Es importante hacer notar que el tipo de célula llamado basófilo no se incluye en las
Figura 6.4: Tipos de glóbulos blancos. Arriba.- Segmentados: Neutrófilo, Eosinófilo,

Basófilo. Abajo.- No Segmentados: Linfocito y monocito.
Figura 6.5: Glóbulos blancos digitalizados.
observaciones porque es un tipo poco común y difı́cil de identificar, además de los pocos
basófilos que fueron identificados por el experto clı́nico la mayorı́a presentaron deforma-
ciones o estaban parcialmente destruı́dos; sin embargo se puede observar uno de ellos en
la parte superior derecha de la Figura 6.4. Por otra parte, debido a que en el modelo
utilizado en la etapa de segmentación se utilizan recortes de núcleo celular, de cada ob-
servación se recorta manualmente parte del núcleo correspondiente adquiriendo con esto
354 observaciones de recortes de núcleos celulares, en la Figura 6.6 se muestra un ejemplo.
Las observaciones de celulas completas y de recortes de núcleo se escalan a un tamaño de
64x64 pixeles para su procesamiento posterior.
6.1.2. Segmentación de la imagen
Utilizando las 354 observaciones de células completas y recortes de núcleos de la célula
encontrada en dicha observación se construye un modelo basado en color para segmentar
el núcleo de la imagen. Debido a que los tonos morados que presentan los núcleos permiten
diferenciar claramente a cada uno, se adecuó el modelo propuesto por [Tomaz et al., 2003]
6.1 Pruebas 99
Figura 6.6: Recorte de núcleo de una célula de la clase Segmentada.
diseñado originalmente para segmentar piel, que se describió en la sección 4.3.
Para ahorrar recursos computacionales y facilitar el proceso de segmentación se di-
señó un filtro inicial obtenido experimentalmente al observar las caracterı́sticas de color
en el espacio de color RGB pertenecientes los recortes de núcleo. Los histogramas de los
canales R, G y B correspondientes a los recortes de núcleo de algunas observaciones se
muestran en la Figura 6.7, donde se aprecia que la cantidad de color verde es pequeña en
relación al rojo y al azul. Debido a que los histogramas obtenidos para cada canal presen-
tan una curva caracterı́stica, se utilizan 5.1 y 5.2 para determinar los puntos donde dicha
curva comienza y termina de crecer. Con los umbrales obtenidos de esta manera umbralinf
y umbralsup se eliminan la mayor parte de los pixeles que no pertenecen al núcleo. Los
resultados obtenidos después de hacer esta umbralización se observan en la Figura 6.8.
El filtro inicial aplicado a las imágenes más claras produce resultados como los que se
muestran en la Figura 6.9, mientras que al aplicarse a imágenes obscuras se obtienen los
resultados mostrados en la Figura 6.10, donde como se puede observar la segmentación no
es buena, pues el núcleo se encuentra parcial o totalmente oculto.
También se hicieron pruebas a imágenes de células semi-destruı́das, no importando lo
claro u obscuro que éstas sean. Los resultados de éstas pruebas se muestran en la Figura
6.11. Un pequeño subconjunto de la clase segmentados presenta un núcleo muy dividi-
do, cuando se aplica sobre este tipo el filtro se obtienen los resultados que aparecen en la
Figura 6.12.
Después de observar los efectos de la aplicación de este primer filtro, a continuación se
muestran los resultados conseguidos durante el diseño y uso del segundo filtro, que como
Canal R Canal G Canal B

300 3000 200
Pixeles
200 2000
100
100 1000
0 0 0
0 100 200 0 100 200 0 100 200
100 200
2000
Pixeles
50 1000 100
0 0 0
0 100 200 0 100 200 0 100 200
200
300 3000
Pixeles
200 2000
100
100 1000
0 0 0
0 100 200 0 100 200 0 100 200
3000
300 200
Pixeles
200 2000
1000 100
100
0 0 0
0 100 200 0 100 200 0 100 200
Figura 6.7: Histogramas de los canales RGB de 4 tipos de recortes de núcleos.

La primera fila de histogramas corresponde a una célula Segmentada Eosinófila. La se-
gunda fila de histogramas pertenece a una célula Segmentada Neutrófila. La tercera fila
de histogramas es de una célula No Segmentada linfocı́tica. La cuarta fila es de una célula
No Segmentada Monocı́tica
se dijo en la sección 6.1.2, es creado a partir del análisis de color de recortes pertenecientes
a los 354 núcleos celulares. También es importante mencionar que para analizar las pro-
piedades de color en éstos recortes se requiere una conversión previa del espacio de color
RGB al espacio TSL, y posterior a ésta transformación se utiliza sólo la información de los
canales T y S, de tal forma que en realidad se trata de un mapeo de R3 (RGB) a R2 (TS).
El cambio entre espacios de color, se realiza de acuerdo a las transformaciones corres-
pondientes a la ecuación 5.3, y los resultados se muestran gráficamente en la Figura 6.13.
Después de esta transformación se separan los canales T y S de cada imagen y se
almacena la información de cada canal en un vector T y S, respectivamente.
Posteriormente se construye un vector V T y V S al unir los vectores T y S de los n
recortes de núcleos. Esto se observa en la Figura 6.14.
Para modelar el color de los recortes de núcleo utilizando la información de VT y VS,
se define la matriz de covarianza Cs a partir de 5.8 y se obtiene el vector de medias Vm
utilizando 5.7.
6.1 Pruebas 101
Figura 6.8: Resultados del filtro inicial. a).- Célula Segmentada Eosinófila. b).-
Célula Segmentada Neutrófila. c).- Célula No Segmentada linfocı́tica. d).- Célula No
Segmentada Monocı́tica
Figura 6.9: Resultados del filtro inicial aplicado a imágenes muy claras. a).-
Célula No Segmentada Monocı́tica. b).- Célula Segmentada Neutrófila. c) y d) Células
Segmentadas eosinófila.
Figura 6.10: Resultados del filtro inicial aplicado a imágenes obscuras. La célula
que esta en la parte superior izquierda es un neutrófilo y las demás son eosinófilos, ambas
pertenecientes a la clase segmentados.
Figura 6.11: Resultados del filtro inicial aplicado a imágenes de células semi-
destruidas. En este caso la claridad no se considera.
6.1 Pruebas 103
Figura 6.12: Resultados del filtro inicial aplicado a imágenes de células con el
núcleo muy dividido. En este caso la claridad no se considera.
Figura 6.13: Conversión del espacio de color RGB a TSL.
Figura 6.14: Unión de los vectores T y S de los n Recortes de núcleos.

A continuación se muestran los vectores VT y VS correspondientes a los recortes de
núcleos de las 354 obervaciones.
· ¸
VT = 0.3371 0.3371 0.3371 0.3375 0.3382 0.3382 0.3430 0.3477 ... 0.3481
· ¸
VS = 3.6535 3.6535 3.6535 3.6522 3.5163 3.5163 3.5452 3.5731 ... 3.5750
La matriz de covarianza Cs y el vector de medias Vm que se obtienen con los vectores
anteriores son:  
 0.0001 −0.0214 
Cs =   (6.1)
−0.0214 5.8557
· ¸T
Vm = 0.0922 22.8193 (6.2)
Para medir la similitud entre 2 pixeles,uno que pertenece a la imagen que recibe el filtro
y otro que forma parte de un recorte de núcleo y definir un umbral que clasifique al primero
de ellos como núcleo se utiliza la métrica de la Distancia de Mahalanobis |λ2i,j | definida por
la ecuación 5.10. Esta métrica es útil debido a que toma en cuenta la correlación entre las
variables multidimensionales que se consideran en este trabajo, el Tono y la Saturación. En
la Figura 6.15 se muestra la correlación que existe entre los vectores Tono T y Saturación
S.
De ésta manera |λ2i,j | esta definida como una matriz que contiene las medidas de
similitud de cada pixel pixel(i,j) de la imagen a filtrar al vector de medias Vm . Para definir el
umbral primero se normaliza el valor de |λ2i,j | utilizando 5.11. Después de esta normalización
se define el umbral para decidir si el pixel(i,j) forma parte del núcleo, es decir,
Si |λ2i,j | > 0.7 entonces pixel(i,j) = N U CLEO (6.3)
El valor de 0.7 se obtuvo por experimentación considerando que una distancia de 1.0
representa un pixel que no pertenece al núcleo.
Para eliminar los pixeles que aun permanecen de forma aislada en la imagen, se aplica
6.1 Pruebas 105
Figura 6.15: Correlación entre las variables Tono y Saturación correspondien-

tes a los vectores T y S, respectivamente. Los valores de T son normalizados.
Imagen Original Filtro inicial F. de Mahalanobis F. de la mediana
20 20 20 20
40 40 40 40
60 60 60 60
20 40 60 20 40 60 20 40 60 20 40 60
Figura 6.16: Resultados de la segmentación del núcleo de un monocito.
un filtro de mediana utilizando una ventana de 9x9 pixeles. El tamaño de la ventana se
eligió después de probar con otros tamaños y observar que este tamaño elimina la mayor
cantidad de pixeles aislados sin afectar significativamente la forma de la región filtrada.
En la figura 6.16 se muestran los resultados de la etapa de segmentación para un tipo de
célula no segmentada.
6.1.3. Extracción de caracterı́sticas
Como se ha mencionado en capı́tulos anteriores, la extracción de caracterı́sticas es muy
importante en el proceso de identificación de los objetos de interés, en este trabajo los
objetos de interés son los núcleos célulares.

El análisis que se realizó a la imagen en la sección 6.1.2, permitió extraer la región que
corresponde al núcleo de la célula sin afectar significativamente su forma.
La extracción de caracterı́sticas se realiza tomando como entrada la imagen obteni-
da en la sección anterior, sin embargo en algunos casos aun después de aplicar los filtros
señalados se obtienen imágenes que contienen más de una región etiquetada como núcleo.
En estos casos, la región que se considera para extraer las caracterı́sticas es la que presenta
una mayor área.
La cantidad de observaciones que se utilizaron para construir las matrices de carac-
terı́sticas estructurales, estructurales con análisis de varianza y radiales fue de 220; 110
para cada tipo de célula, esto es debido a que se cuenta con 232 ejemplares de la clase
Segmentados, casi el doble que para las células del tipo No segmentados cuyo número
es de 122.
Como se menciona en [Katz, 2000], para evitar un sobreentrenamiento de la red hacia
una clase especı́fica se considera igual número de ejemplares.
Los resultados contemplan 3 tipos de experimentos fundamentales. En cada caso se
trata del uso de un conjunto distinto de caracterı́sticas para describir la forma de la región
nuclear. El primer experimento esta enfocado al uso de las caracterı́sticas estructurales, el
segundo utiliza caracterı́sticas estructurales con análisis de varianza y el tercero se realiza
con las caracterı́sticas radiales, siendo éstas últimas mucho más en número que las estruc-
turales.
En el primer experimento se considera el conjunto de 13 caracterı́sticas estructurales
que se muestran en la Figura 5.12, entre las que se encuentran: número de regiones, eccen-
tricidad, solidez, extremos de la imagen, longitud del eje mayor, longitud del eje menor,
número de Euler, orientación, diámetro equivalente, área del bounding box, relación de ejes,
diferencia de áreas y varianza de los radios.
Con estos atributos, la matriz de caracterı́sticas que se obtiene es la que se muestra
en la Figura 6.17, donde el acomodo de las caracterı́sticas para cada clase se realiza de
manera intercalada denotándose como S a la clase Segmentados y como N a la clase
No Segmentados. Esta es la matriz de caracterı́sticas estructurales utilizada en el primer

6.1 Pruebas 107
Figura 6.17: Matriz de caracterı́sticas estructurales. Las columnas denotadas con

Si representan a las caracterı́sticas de células Segmentadas mientras que las que se
denotan con Ni indican a las caracterı́sticas de células No Segmentadas.
experimento.
Como prueba adicional, se obtiene un nuevo conjunto reducido de caracterı́sticas es-
tructurales al aplicar la técnica de PCA descrita en la sección 3.2.2. Después de reducir
la matriz de caracterı́sticas estructurales mostrada en la Figura 6.17, disminuyen a 8 los
atributos3 con los que se construye una nueva matriz de caracterı́sticas estructurales.
El segundo experimento esta encaminado hacia el uso de lo que en este trabajo se han
denominado caracterı́sticas estructurales con análisis de varianza, obtenidas en la sección
5.3.3. Este conjunto de 8 caracterı́sticas se muestran en la tabla 5.4 e incluye las siguien-
tes: área de la región, longitud de eje mayor, longitud de eje menor, orientación, área de
Bounding Box, área del Convex Hull, diámetro equivalente y diferencia de áreas. Con éstas
caracterı́sticas y de forma similar a como se hizo en el primer experimento, se construye la
matriz de caracterı́sticas estructurales con análisis de varianza (ver Figura 6.18).
En este caso también se aplicó PCA al conjunto de 8 caracterı́sticas estructurales con
análisis de varianza, obteniendo un nuevo conjunto de sólo 4 atributos (componentes prin-
cipales).
3
en realidad se trata de 8 componentes principales, ya que PCA al reducir no permite conocer cuáles
fueron las caracterı́sticas seleccionadas.
Figura 6.18: Matriz de caracterı́sticas estructurales con análisis de varianza.
El tercer experimento utiliza 2 conjuntos distintos de 111 caracterı́sticas radiales, dado
que para construir la matriz de caracterı́sticas es necesario tener igual número de atributos
para las 354 observaciones. El problema en el caso de las caracterı́sticas radiales, es que
existen un número distinto de caracterı́sticas para cada observación, por lo cual se utilizan
dos formas de escalar el número de atributos a el valor mı́nimo de caracterı́sticas encon-
trado en las 354 observaciones, que es de 111.
De ésta manera, al utilizar las 2 formas de escalamiento descritas en la sección 5.3.3:
escalamiento aleatorio y escalamiento con transformación lineal, se obtienen 2 conjuntos
de caracterı́sticas radiales.
Utilizando el procedimiento descrito en el primer experimento para la construcción de
la matriz se caracterı́sticas, se obtienen las matrices de caracterı́sticas radiales, una para
cada tipo de escalamiento. En la Figura 6.19 se observa la estructura de la matriz de ca-
racterı́sticas radiales, en la cual se utiliza un escalamiento con trasformación lineal.
Del mismo modo que en experimentos anteriores, se aplica PCA a las matrices de
caracterı́sticas radiales para construir nuevas matrices de caracterı́sticas reducidas. Esta
prueba permite evaluar también a cada conjunto de caracterı́sticas radiales, generadas con
distintas formas de escalamiento.
Es de esperarse que las caracterı́sticas estructurales describan de una mejor manera
la forma de las región nuclear. Sin embargo este no es el caso, como se comenta en las
secciones siguientes.
6.1 Pruebas 109
Figura 6.19: Matriz de caracterı́sticas radiales utilizando escalamiento con

transformación lineal.
6.1.4. Entrenamiento de la Red Neuronal
Para entrenar a la red neuronal con los subconjuntos de caracterı́sticas obtenidos en la
sección anterior se probaron distintas funciones para entrenamiento y funciones de trans-
ferencia, las cuales se muestran en la Figura 6.20, obteniendo un mejor desempeño con
el gradiente escalado conjugado y la función de transferencia logsig. El conjunto de carac-
terı́sticas utilizadas para esta prueba, corresponde a las caracterı́sticas estructurales con
análisis de varianza. En la tabla 5.4 se enlistan dichas caracterı́sticas .
De las 354 observaciones que se obtuvieron, se utiliza igual número de cada clase para
la experimentación, en este caso 110 de cada tipo, dejando el resto para pruebas adicio-
nales. Cabe hacer notar que las pruebas suplementarias se realizan con diferente número
de muestras para cada clase, ya que no se cuenta con igual número de muestras para cada
tipo de leucocito, además de que se trata de ejemplares no utilizados durante la fase de
entrenamiento. Las muestras utilizadas para pruebas adicionales son 134, de las cuales 122
son de la clase Segmentados y 22 de la clase No segmentados.
De las 110 observaciones obtenidas para cada clase, la red neuronal se entrena con 9/10,
Figura 6.20: Tipos de entrenamiento y funciones de transferencia.
Figura 6.21: Distribución de las observaciones para la experimentación.
es decir con 99 observaciones de cada tipo. En la Figura 6.21 se muestra la distribución del
número de observaciones que se utilizan en cada caso. Como se puede observar, se cuenta
232 observaciones para la clase de células Segmentadas, casi el doble que de células No
segmentadas. Esto se debe a que para la clase No segmentadas, se consideran dos sub-
tipos de leucocitos y uno de ellos, por naturaleza representa sólo un 5 % aproximadamente
del total de las células que forman la sangre (ver Figura 3.3, sección 3.1.1). La Figura 6.22
indica la cantidad de cada subtipo de leucocito utilizada para cada clase de célula.
En todos los experimentos los datos fueron desordenados aleatoriamente respecto de
las columnas, de tal forma que tanto los datos de entrenamiento como los de prueba no
6.1 Pruebas 111
Figura 6.22: Distribución de las observaciones por clase.
posean caracterı́sticas particulares que pudieran influir en los resultados. Además, para
validar el desempeño de la red se utilizó la técnica de Ten Fold Cross Validation –TFCV–,
tomando 10 % de las 110 observaciones de cada clase para prueba y el 90 % restante para
entrenamiento.
De esta manera, en el primer experimento con 13 caracterı́sticas estructurales la ma-
triz de caracterı́sticas es de 13x99, mientras que para las pruebas se utiliza una matriz de
13x11, es decir 99 datos para entrenamiento y 11 para prueba. Cuando se aplica reducción
con PCA se obtienen 8 componentes principales, con los cuales se entrena a la red.
Las pruebas adicionales realizadas como parte de este primer experimento se realizan
con 122 datos de la clase Segmentados y 12 datos de la clase No segmentados arrojando
un ı́ndice de reconocimiento de 81.34 % cuando se aplica PCA antes de entrenar a la red
neuronal y 76.11 % cuando no se aplica. Nótese que estos datos son totalmente distintos a
los utilizados durante el entrenamiento.
El segundo experimento hace uso de 8 caracterı́sticas estructurales con análisis de va-
rianza, de tal manera que la matriz de caracterı́sticas de entrada es de 8x99, y la de prueba
de 8x11.
De igual forma que en el primer experimento, se prueba también con otro conjunto
de caracterı́sticas que se obtienen al reducir con PCA; en este caso la reducción genera
4 componentes principales. Sin embargo, en este caso los resultados no mejoran como se
puede ver en la Figura 6.23.
Por otro lado, las pruebas realizadas con los 134 ejemplares separados en un principio
Figura 6.23: Resultados de las configuraciones utilizando diferentes observa-

ciones de células Segmentadas y No Segmentadas.
arrojan un 79.85 % cuando no se aplica PCA y un 67.16 % cuando se utiliza reducción.
En el tercer experimento se utilizan las caracterı́sticas radiales considerando una ma-
triz de caracterı́sticas de 111x99, dejando para prueba una matriz de 111x11 datos. En un
primer caso, se entrena con las caracterı́sticas que se obtuvieron al hacer un escalamiento
aleatorio, mientras que en otro caso se entrena con las caracterı́sticas generadas al realizar
un escalamiento con transformación lineal.
Las pruebas adicionales realizadas como parte de este tercer experimento para los 2
grupos de caracterı́sticas: las extraı́das con escalamiento aleatorio y las extraı́das con esca-
lamiento lineal, se realizan igualmente con 122 datos de la clase Segmentados y 12 datos
de la clase No segmentados arrojando un ı́ndice de reconocimiento de 100.00 % cuando
se aplica PCA antes de entrenar a la red neuronal y 100.00 % cuando no se aplica para
ambos grupos de caracterı́sticas.
Los resultados que se obtienen después de los entrenamientos realizados en los 3 expe-
rimentos se muestran en la Figura 6.23.
Como se puede observar, los mejores ı́ndices de reconocimiento se obtienen cuando
se utilizan como descriptores de forma a las caracterı́sticas radiales aplicando PCA antes
de entrenar la red. La gráfica del comportamiento en el entrenamiento se puede ver en la
Figura 6.24.
Es importante decir que los resultados mostrados en la Figura 6.24 corresponden al
promedio de 10 pruebas realizadas con la técnica TFCV para cada caso, además que la
6.2 Análisis de resultados 113
ENTRENAMIENTO CON CARACTERISTICAS ESTRUCTURALES

10
10
sin PCA
con PCA
5
10
ERROR
0
10
−5
10
−10
10−1
0
1100 10
2
10
4
EPOCAS
Figura 6.24: Comportamiento de entrenamiento utilizando diferentes observa-

ciones de células Segmentadas y No Segmentadas con caracterı́sticas estruc-
turales y radiales.
selección de las 110 observaciones utilizadas en los experimentos respectivos es aleatoria
para cada una de las 10 veces que se realizó la técnica de TFCV.
6.2. Análisis de resultados
Retomando el diagrama mostrado en la Figura 5.1, se pueden realizar algunos comen-
tarios para cada fase del método usado para la identificación y clasificación de leucocitos.
Los resultados obtenidos en la fase de adquisición de las muestras son satisfactorios,
dado que la calidad de las imágenes es buena para el análisis propuesto, pues en todas ellas
es posible diferenciar claramente al núcleo del resto de la escena.
La técnica de segmentación utilizada es buena. Permitió extraer los núcleos celulares sin
afectar su forma significativamente. Al utilizar la distancia de Mahalanobis como medida
de similitud, se logró calcular la diferencia del color del núcleo de un leucocito, respecto
al color promedio de los núcleos de un conjunto de 354 leucocitos utilizados en la fase de
experimentación. Por otro lado, con el uso de ésta métrica es posible considerar la correla-
ción que existe en los canales T y S, que se utilizaron para modelar el color caracterı́stico
del núcleo de los leucocitos.
Después de hacer un análisis visual de las imágenes se observó que la aplicación del filtro
inicial se puede omitir, dado que al aplicar el filtro creado con el modelo de Mahalanobis
los resultados son buenos.
Como consecuencia de una buena segmentación se extrajeron caracterı́sticas que per-
miten clasificar adecuadamente a la célula como leucocito Segmentado o leucocito No
segmentado.
Respecto a la extracción y selección de caracterı́sticas, al observar los resultados obteni-
dos con los descriptores de Fourier haciendo un análisis visual de la simetrı́a en las gráficas
de los vectores caracterı́sticos, se hace notar la posibilidad de trabajar con la mitad de
los datos que constituyen los descriptores de Fourier sin afectar los resultados de forma
significativa. Por este motivo los resultados obtenidos al aplicar PCA fueron muy similares
a los obtenidos cuando no se aplicó.
Los tipos de escalamiento utilizados para el ajuste del tamaño de los vectores que
almacenan los descriptores de Fourier resultaron igualmente útiles; por una parte el esca-
lamiento lineal permite elegir de manera más equivativa los pixeles que forman el nuevo
vector reducido, mientras que con el escalamiento aleatorio se eligen de manera distribuida
a dichos pixeles.
En la extracción de caracterı́sticas estructurales resulta interesante observar que el
análisis de caracterı́sticas con análisis de varianza arroja buenos resultados, permitiendo
trabajar con un conjunto más pequeño de datos y además saber cuáles son las caracterı́sti-
cas más apropiadas para describir la forma del núcleo, lo cual no es posible cuando se usa
PCA como método de reducción.
La técnica de análisis de varianzas propuesta en este trabajo de tesis constituye una
nueva técnica de selección de caracterı́sticas, viable de probarse con un conjunto de datos
distinto al usado en este trabajo para comprobar la factibilidad de su uso, como método
de selección de caracterı́sticas.
Un detalle observado en las caracterı́sticas estructurales con análisis de varianza, es el
hecho de que al reducir con PCA y obtener sólo 4 componentes principales, disminuye el
ı́ndice de reconocimiento. En cambio en las caracterı́sticas estructurales y radiales ocurre
lo contrario, debido posiblemente a que 4 atributos son insuficientes para describir la forma
6.2 Análisis de resultados 115
de la región.
Al considerar en la fase de pruebas, a un conjunto de muestras totalmente ajeno al uti-
lizado en la fase de entrenamiento, se obtienen buenos resultados. Este hecho confirma la
veracidad en los experimentos realizados y garantiza una clasificación adecuada con nuevos
conjuntos de muestras.
Finalmente, podemos decir que el método utilizado en esta investigación es muy útil
en el análisis de especı́menes biológicos, ya que es posible hacer distinciones precisas en el
análisis de color, lo que es de gran importancia en el estudio de ciertas patologı́as.

Capı́tulo 7
Conclusiones
7.1. Conclusiones generales
El objetivo principal en este trabajo de tesis fue clasificar a dos tipos de células de
sangre humana empleando técnicas de visión por computadora. Al revisar la metodologı́a
utilizada, es posible observar que no es sencillo emular la capacidad de visión que el hu-
mano posee y mucho menos igualarla.
Por otro lado, se puede notar que los componentes de un sistema de visión varı́an de
acuerdo a la aplicación. Durante la fase de adquisición de la imagen existieron condiciones
que no se lograron controlar como las condiciones de preparación de la muestra, el área de
trabajo, la iluminación ambiental y la iluminación de la fuente.
Considerando estos inconvenientes se optó por el uso de técnicas que atenuaran los
efectos de dichas variaciones, de esta manera en la fase de segmentación se crea un modelo
de color utilizando el espacio de color TSL propuesto por [Tomaz et al., 2003], obteniendo
buenos resultados.
Además, la segmentación es casi directa, sin ser estrictamente necesario eliminar pri-
mero los elementos del fondo en la imagen. Esto es una importante contribución para el
análisis visual de leucocitos, ya que se puede aplicar el algoritmo de segmentación propues-
to en este trabajo de tesis sin necesidad de recalcular la matriz de covarianza y la distancia
de Mahalanobis, que se requiere para la umbralización de pixeles que pertenecen o no al

118 7 CONCLUSIONES
núcleo de la célula, reduciendo el tiempo de cálculo en análisis posteriores.
Como el objetivo principal fue clasificar a las células de acuerdo a su morfologı́a nuclear,
se optó por considerar caracterı́sticas que describieran lo mejor posible, la forma de dicha
región. Se pensó en principio, que al considerar como descriptores a un conjunto reducido
de caracterı́sticas estructurales se tendrı́a una buena descripción de la forma y como conse-
cuencia un buen ı́ndice de reconocimiento; sin embargo al probar con otro conjunto mayor
de caracterı́sticas que se deduce a partir del centroide y el perı́metro de la región, se logra
tener una descripción más completa de la forma de la región al usar algunas propiedades
de la FFT, alcanzando un ı́ndice de reconocimiento del 99 %.
También vale la pena mencionar que los ı́ndices de reconocimiento en el caso de las
caracterı́sticas estructurales y radiales, mejoraron al aplicar la técnica de PCA antes de
entrenar a la red neuronal. En este caso lo que se observa es que el número de épocas se re-
dujo notablemente cuando se preprocesan los datos con PCA, lo cual es de esperarse sobre
todo cuando se utilizan las caracterı́sticas radiales, dado que para obtenerlas se aplicó la
FFT y al observar la representación gráfica de dichas caracterı́sticas es notable la simetrı́a
que hay en dicha gráfica, lo cual permite suponer que es posible tomar sólo la mitad de los
datos que se observan en dicha gráfica y considerar a este conjunto como caracterı́sticas
radiales.
Finalmente se comprobó una vez más que la red neuronal de retroprogación utilizada
por [Katz, 2000] es una buena alternativa para la clasificación de células.
7.2. Trabajo a Futuro
Existe mucho trabajo que hacer con el tipo de observaciones que se manejan en este
trabajo y con la metodologı́a utilizada. A continuación se mencionan algunas propuestas:
1. Sustituir la forma empı́rica utilizada en el diseño del filtro inicial usado en la segmen-
tación, por un análisis de regiones empleando técnicas de agrupación como K-means.
2. Dado que cada célula identificada tiene más subtipos, al utilizar técnicas de segmenta-
ción basada en textura y color para aislar el citoplasma y extraer sus caracaterı́sticas,
7.2 Trabajo a Futuro 119
se puede tener una descripción más completa de la célula y esto puede ampliar el
número de clases a reconocer.
3. Agregar un módulo que permita además de identificar, contar las células visualizadas
en la escena.
4. Analizar nuevos parámetros encontrados (valores y vectores caracterı́sticos de la re-
gión segmentada) para determinar si representan un patrón especı́fico que permita
reconocer una clase.
5. La superposición temporal de regiones segmentadas de la misma clase con técnicas
de empalmamiento, puede ser útil en el análisis para determinar el tipo de la célula.
6. Implementar una segmentación semi-automática al definir un espacio de color exclusi-
vo para las imágenes de frotis sanguı́neo utilizando la técnica descrita en [Guzmán, 2002].
7. Analizar el comportamiento de la lógica difusa en el proceso de segmentación para
lograr una mejor descripción de la región de interés, pues de acuerdo a [Carron, 1995]
reporta buenos resultados.
8. Desarrollar una interfaz gráfica en la que se integran los módulos que componen este
trabajo de tesis.
9. Promover la aplicación GUI para fines educativos que trabajarı́a en tiempo real.
10. Utilizar la metodologı́a aplicada en este trabajo, como marco de referencia para el
desarrollo de aplicaciones similares que persigan la identificación de otro tipo de
objetos de interés en el área clı́nica u otras áreas.

Referencias
[Ses, 1999] (1999). Guı́a de operación y mantenimiento básico Sistema K-1000. CIBA
CORNING DIAGNOSTICS -MEXICO-, Departamento de Servicio Técnico, Zona Cen-
tro. México.
[Mot, 2004] (2004). Manual de operación de Moticam 350. Micro-optic industrial group
CO; LTD., U.S.A.
[Abdallah et al., 1995] Abdallah, M. A., Samu, T. I., and Grissom, W. A. (1995). Auto-
matic target identification using neural networks.
[Acosta et al., ] Acosta, B. M., Zuluaga, M. C. A., and Salazar, I. H. Tutorial de redes
neuronales. http://ohm.utp.edu.co/neuronales.
[Alpaydm, 2004] Alpaydm, E. (2004). Introduction to Machine Learning.
[Awcock and R., 1996] Awcock, G. J. and R., T. (1996). Applied Image Processing.
[Beckman Coulter, 2006] Beckman Coulter, I. (2006). Contadores hematológicos beckman
coulter. http://www.beckmancoulter.com.
[Bourgin, 1994] Bourgin, D. (1994). http://www.neuro.sfc.keio.ac.jp.
[Carron, 1995] Carron, T. (1995). Segmentation dı́mages coleur dans la base Treinte-
Luminance-Saturation:approche numérique et symbolique.
[Comaniciu, 2001] Comaniciu, D. (2001). Cell image segmentation for diagnostic patho-
logy. www.caip.rutgers.edu/riul/research/papers/ps/cells.ps.gz.
122 REFERENCIAS
[Cormack, 1997] Cormack, D. H. (1997). Histologı́a de HAM. México D.F.
[Cortijo, 2001] Cortijo, B. F. J. (2001). Bioestadı́stica: Métodos y Aplicaciones.
[de la Escalera, 2001] de la Escalera, H. A. (2001). Visión por computador. Fundamentos
y Métodos.
[Duda, 2001] Duda, O. R. (2001). Pattern Classification.
[Flores, 2001] Flores, P. L. (2001). Recuperación de imágenes combinando redes neuronales
y wavelets. Tesis INAOE.
[Freggiaro and Espejo, 2006] Freggiaro, L. E. and Espejo, R. (2006).
http://www.forobioquimico.com.ar.
[Galénica, 2005] Galénica (2005). http://www.galenica.cl/tecnologia_vcs.html.
[Garcı́a and Sierra, 2001] Garcı́a, L. D. and Sierra, J. L. C. (2001). Bioestadı́stica.
http://nutriserver.com/cursos.
[González and Woods, 1996] González, R. C. and Woods, R. E. (1996). Tratamiento Di-
gital de imágenes.
[Goodrich and Tamassia, 2003] Goodrich, M. T. and Tamassia, R. (2003). Data etructures
and algorithms in Java.
[Guzmán, 1997] Guzmán, D. L. A. (1997). Etude déspaces couleur pour la segmentation
et láide álánalyse. Thése Doctorale.
[Guzmán, 2002] Guzmán, D. L. A. (2002). Procesamiento digital de imágenes colposcópi-
cas.
[Hair et al., 2001] Hair, J. F., Rolph, A. E. J., and Tatham, R. L. (2001). Análisis multi-
variante.
[Hen and Hwang, 2002] Hen, H. Y. and Hwang, J.-N. (2002). Handbook of neural network
signal processing.
REFERENCIAS 123
[Hunke, 1994] Hunke, M. H. (1994). Locating and tracking of human faces with neural
networks.
[Katz, 2000] Katz, A. R. J. (2000). Image analysis and supervised learning in the automated
differentiation of white blood cells from microscopic images. Master’s thesis.
[Kohavi, 1995] Kohavi, R. (1995). A study of cross validation and bootstrap for accuracy
estimation and model selection.
[MathWorks, 2000] MathWorks, T. I. (2000). Matlab 6.0.0.88.
[Mitchell, 1997] Mitchell, T. M. (1997). Machine Learning.
[Moore, 2001] Moore, A. W. (2001). Cross validation for detecting and preventing overfit-
ting. http://www-2.cs.cmu.edu/~awm/tutorials/overfit.html.
[Oppenheim, 1998] Oppenheim (1998). Manual para técnicos de laboratorio. México D.F.
[Pajares and de la Cruz, 2002] Pajares, G. and de la Cruz, J. M. (2002). Vision por compu-
tador. Imágenes digitales y aplicaciones.
[Pal and Pal, 1993] Pal, N. R. and Pal, S. K. (1993). A review on Image Segmentation
Techniques, volume Vol. 26 No. 9.
[Pratt, 1978] Pratt, W. K. (1978). Digital Image Processing.
[Pérez and Hague, 2002] Pérez, L. G. and Hague, J. M. T. (2002). Dynamic threshold se-
lection for image segmentation of natural structures based upon a performance criterion.
[Reyes, 2005] Reyes, G. O. F. (2005). Clasificación de llantos de bebés para identificación
de hipoacusia y asfixia por medio de un sistema hı́brido (genético-neuronal). Tesis ITA.
[Sánchez, 2006] Sánchez, J. (2006). Revista creces. portal de tecnologı́a, ciencias y biologı́a.
http://www.tcb.cl.
[Schapira and Arroyo, 1994] Schapira, A. and Arroyo, I. (1994). Cells++. un contador de
células. http://www.ubp.edu.ar/investigacion/revista7/art6.html.
124 REFERENCIAS
[Sinha, 2002] Sinha, N. (2002). Blood cell segmentation using em algorithm.
[Solano, 2002] Solano, M. R. (2002). Modelado y reconocimiento de objetos usando apa-
riencia y multieigenespacios particionados. Tesis INAOE.
[Swokowski, 1989] Swokowski, E. W. (1989). Cálculo con geometrı́a analı́tica.
[Terrillon and Akamatsu, 2000] Terrillon, J. and Akamatsu, S. (2000). Comparative per-
formance of different chrominance spaces for color segmentation and detection of human
faces in complex scene images.
[Terrillon et al., 1998] Terrillon, J., David, M., and Akamatsu, S. (1998). Automatic detec-
tion of human faces in natural scene images by use of a skin color model and of invariant
moments.
[Terrillon et al., 2000] Terrillon, J., Shirazi, M., Fukamachi, H., and Akamatsu, S. (2000).
Comparative performance of different skin chrominance models and chrominance spaces
for the automatic detection of human faces in color images.
[Tomaz et al., 2003] Tomaz, F., Candeias, T., and Shahbazkia, H. (2003). Improved auto-
matic skin detection in color images.
[Urdiales, 2002] Urdiales, C. (2002). http://campusvirtual.uma.es/TRcolor.PDF.
[Ushizima et al., 2004] Ushizima, D., Da-Fontoura, L., Rizzatti, E., and Zago, M.-A.
(2004). A texture approach to leukocyte recognition.
[Webner, 2006] Webner, D. (2006). Enciclopedia médica en español.
http://www.nlm.nih.gov.
[Wikipedia Foundation, 2006] Wikipedia Foundation, I. (2006). Wikipedia enciclopedia
libre. http://es.wikipedia.org.
[Woodliff and Herrmann, 1993] Woodliff, H. J. and Herrmann, R. (1993). Hematologı́a
Clı́nica. México D.F.

REFERENCIAS 125
[Yang and Waibel, 1995] Yang, J. and Waibel, A. (1995). Tracking human faces in real
time.
Apéndice A
Espacios de color
El uso de color como descriptor para la segmentación de una imagen resulta importante
en la extracción de caracterı́sticas. A continuación se definen algunos términos empleados
en el análisis del color.
Brillo.- sensación que indica si un área es más o menos iluminada.
Tono.- sensación que indica si un área parece similar al rojo, amarillo, verde o azul, o a
una porción de dos de ellos.
Coloración.- sensación por la que un área tiene mayor o menor tono.
Luminosidad.- brillo de una zona respecto a otra blanca en la imagen.
Croma.- Coloridad de un área respecto al brillo de un blanco de referencia.
Saturación.- relación entre la coloración y el brillo.
Los parámetros psı́quicos en la percepción del color son la luminosidad, el tono, y la
saturación. Un espacio de color es un método por el que se puede especificar, crear o
visualizar cualquier color. A continuación se describen algunos espacios de color que son
importantes para la colorimetrı́a [Urdiales, 2002].

128 A ESPACIOS DE COLOR
A.1. Espacio RGB
Este espacio de color se basa en la combinación de tres señales de luminancia cromática:
el rojo, el verde y el azul (Red, Green, Blue). La manera de obtener un color especı́fico(X)
consiste en determinar qué cantidad de cada uno de ellos (R, G, B) se necesita para obte-
nerlo.
X =R+G+B (1.1)
Cuando una cámara capta una imagen en color, para cada pixel en color se tienen en
realidad tres, uno por cada componente (RGB), es decir, la longitud de onda de cada color
básico. El inconveniente de este modelo es que en sus tres valores mezcla la información
del color (tono y saturación) y la intensidad.
A.2. Espacio TSL
Los componentes fundamentales de este espacio de color son el Tinte, la Saturación y la
Luminosidad. El tinte se puede relacionar con la longitud de onda como parámetro, la lu-
minosidad habla de la energı́a del color y la saturación habla de la pureza del color, es decir
qué tan mezclado con el color blanco se encuentra dicho color. Este sistema fue propuesto
por Munsell [Pratt, 1978], como un modelo de la percepción humana del color y también
es conocido como sistema bi-cónico debido a su construcción espacial [Guzmán, 2002]. En
la Figura A.1 se muestra la organización del espacio de color propuesto por Munsell.
A.3. Espacio HSI
En este espacio caracteriza el color en términos de tono o tinte (Hue), saturación o
cromatismo (Saturation) y brillo (Intensity). Ası́, de dos fuentes de luz con el mismo
espectro, aquella que tenga mayor intensidad aparecerá más brillante. Aunque, dos objetos
de igual intensidad no siempre tienen el mismo brillo. La saturación describe la blancura
de un color. Las transformaciones matemáticas que permiten el cambio del espacio RGB
A.3 Espacio HSI 129
Figura A.1: Diagrama esquemático de los 3 ejes del sistema de color Mun-
sell.Tomado de Hall, E.L. Computer Image Processing and Recognition. Academic Press,
New York. 1979
a HSI son las siguientes:

R+G+B
I= (1.1)
3
√
3(G − B)
H = arctan( ) (1.2)
(R − G) + (R − B)
min(R, G, B)
S =1− (1.3)
3
Las variaciones de este espacio de color son:
HSL (Hue Saturation Lightness)
HSV (Hue Saturation Value)
HCI (Hue Croma/Colourfulness Lightness)
HVC (Hue Value Croma)
TSD (Hue Saturation Durkness)
Las desventajas de este modelo son:
1. La no linealidad de las transformaciones realizadas, lo cual implica un elevado costo
computacional.
2. La singularidad existente en el entorno del eje definido por R=G=B (Saturación=0),
que provoca que los valores obtenidos por el tono sean inestables.
A.4. Los espacios XYZ, Luv, Lab
El espacio de color XYZ evita los coeficientes negativos obtenidos en los modelos an-
teriores para algunas coloraciones de determinada longitud de onda; que es causa de una
fuente de error importante en los cálculos colorimétricos. En el modelo XYZ, la compo-
nente Y representa la luminosidad y XZ la coloración. Este espacio es independiente del
dispositivo utilizado y generalmente se trabaja con valores normalizados entre cero y uno.
Este espacio constituye el llamado Diagrama Internacional XY, CIE o carta cromática xy.
Y una vez obtenidas las coordenadas XYZ se pueden construir diferentes espacios CIES,
A.5 Los espacios de color YIQ, YUV, YCbCr y YCC 131
como Luv y Lab en los que la información se descompone en tono, cromatismo e intensidad
del color.
Espacio Luv Este modelo se definió en 1976, con la finalidad de obtener más uniformidad
y precisión en la representación del color. Posee 3 componentes: L, u and v. El componente
L define la luminancia, mientras que u y v definen la crominancia. CIE Luv es muy utilizado
en cálculo de colores pequeños o diferencias de color, especialmente con colores aditivos. En
[Bourgin, 1994] se pueden encontrar las ecuaciones para la transformación a este espacio
de color a partir del espacio XYZ.
A.5. Los espacios de color YIQ, YUV, YCbCr y YCC
En estos espacios se trabaja con la luminancia (luminosidad) y la crominancia (color).
Estan muy relacionados con los sistemas de color para la televisión.
A.6. El espacio CMY(K)
Está formado por Cı́an, Magenta, Amarillo y Negro. Se utiliza en la impresión y fo-
tografı́as, por lo que depende del dispositivo (impresora). Para obtener los equivalentes
respectivos, se resta de las componentes el color blanco en el caso de CMY, o el negro para
CMYK.
Apéndice B
Galerı́a de imágenes
En este apartado se ha colocado la base de datos recopilada y utilizada en este trabajo
de investigación, esperando sea útil para trabajos futuros.
Como se menciona en capı́tulos anteriores, las muestras biológicas se prepararon con
sangre de pacientes normales, es decir, se excluyeron especı́menes que presentan patologı́as
que pudieran ocasionar la presencia de formas anormales de células y de sus órganos inter-
nos, como en el caso de la leucemia.
También es posible apreciar los efectos provocados por los cambios de iluminación que
fueron imposibles de controlar en el momento de la digitalización de las muestras. Esto
debido, a los ajustes que son necesarios para enfocar a la imagen y obtener una mejor
apreciación de su composición interna.

134 B GALERÍA DE IMÁGENES
Figura B.1: Leucocitos segmentados: Eosinófilos. (Continúa)

135
Figura B.2: Leucocitos segmentados: Eosinófilos. (Continuación)

Figura B.3: Leucocitos segmentados: Neutrófilos. (Continúa)

137
Figura B.4: Leucocitos segmentados: Neutrófilos. (Continuación)

Figura B.5: Leucocitos no segmentados: Linfocitos. (Continúa)

139
Figura B.6: Leucocitos no segmentados: Linfocitos. (Continuación)
Figura B.7: Leucocitos no segmentados: Monocitos.

Figura B.8: Casos especiales. En b1 y b2 se observan células basófilas pertenecientes

a la clase segmentados, es un tipo de célula que por su rareza fue excluı́da de las pruebas
hechas en la investigación. DOSe66-n contiene abajo un neutrófilo pequeño, arriba un
eosinófilo con el núcleo parcialmente destruido y distribuido en el citoplasma. DOSe103-
mono muestra arriba a la izquierda un eosinófilo y abajo a la derecha un monocito. En
DOSl40mono3 se observa arriba a la derecha un monocito y abajo a la izquierda un
linfocito. DOSn28linfo10 arriba a la derecha presenta un neutrófilo grande y abajo a la
izquierda un linfocito.
Apéndice C
Listado de módulos que componen

el método de clasificación
A continuación se describe el nombre y la descripción de los principales funciones
programadas en este trabajo de investigación.
En la tabla C.1 se enlistan los nombres de las principales funciones implementadas,
mientras que en el disco anexo al final de esta tesis, se encuentran los códigos adicionales
para algunas variantes de funciones contenidas en la tabla, como la función escalarIMG
que presenta dos funciones relacionadas llamadas escalarNUCLEOS y escalarCUT.

142 C LISTADO DE MÓDULOS QUE COMPONEN EL MÉTODO DE CLASIFICACIÓN
NOMBRE DESCRIPCIÓN
escalarIMG su función es escalar una imagen a un tamaño de 64x64 pixeles.
getfeatures obtiene caracterı́sticas de la región de interés
disMaha devuelve imagen filtrada con modelo de Mahalanobis
RGBtoTSL convierte imagen del espacio RGB al espacio TSL
unirfeatures construye los vectores de caracterı́sticas estructurales
filtroinicial aplica filtro inicial a la imagen recibida como entrada
getpromRGBmodif2006 determina lı́mites de crecimiento de histogramas en RGB
obtiene el número de puntos que forman el perı́metro de una
getNrad
región
muestrearRADIS realiza el escalamiento caracterı́sticas radiales
predatosNET2crossViguales entrena red neuronal con caracterı́sticas estructurales
entrena red neuronal con caracterı́sticas estructurales con
predatosNET2crossIguVAR2
análisis de varianza
FFTradis4mues entrena red neuronal con caracterı́sticas estructurales
Tabla C.1: Principales funciones programadas

Índice alfabético
Análisis, 6, 8, 12, 20, 25, 60, 68, 82, 95, 109, Microscopio, 2, 6, 12, 70, 72, 73, 81, 96
113 Modelo, 117
Muestras, 5, 73, 94, 109, 113, 133

Célula, 2
anatomı́a, 11 Núcleo, 75
fisiologı́a, 11
Patrón, 19, 22, 37, 42, 44
Citologı́a, 11
PCA, 25, 26, 29, 68, 94, 107, 108, 111, 112,
Citoplasma, 11, 12
114, 118
Color, 98, 127
Procesamiento
Distancia, 35, 68, 80, 104, 117 computacional, 73
euclı́dea, 24 imágenes, 11, 38, 59, 70
Mahalanobis, 23, 24, 57, 104, 113

Recuento Diferencial, 1, 13, 15
radial, 86, 91
Redes
Estadı́stica, 11, 25, 31 neuronales, 11
Región, 27, 28, 69, 80

Filtro, 27, 80, 99, 104, 105, 113, 118
inicial, 75, 99 Segmentación, 6, 27–30, 54, 58, 60, 62, 68,
mediana, 30 73, 75, 81, 98, 113, 118
Fourier, 8, 59, 89, 91, 114 automática, 8
semi-automática, 26
Hematologı́a, 11
Técnicas, 26, 31, 59
Leucocitos, 5, 13, 69
agrupación, 118
Membrana, 7, 11 clasificación, 31
144 ÍNDICE ALFABÉTICO
empalmamiento, 119
escalamiento, 87
segmentación, 27, 29, 118
validación, 11, 50
visión, 3, 5, 6, 117
Varianza, 20, 22, 25

Clasificacion de Leucocitos Utilizando Vision Por Computadora

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Clasificacion de Leucocitos Utilizando Vision Por Computadora

Încărcat de

Drepturi de autor:

Formate disponibile

UNIVERSIDAD AUTÓNOMA DE TLAXCALA

Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a

Clasificación de Leucocitos utilizando Visión por Computadora

Que para obtener el grado de:

Maestro en Ciencias en Ingenierı́a en Computación

Marı́a del Rocı́o Ochoa Montiel

M. en C. Ricardo Solano Monje

Apizaco,Tlax. Abril del 2006

U.A.T. Todos los Derechos Reservados.

Índice de tablas XVII

Motivación personal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix

Organización de la Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix

2.1. ¿Cómo identificar leucocitos empleando visión por computadora? . . . . . . 5

2.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.2. Objetivos Especı́ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.4. Método de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.5. Hardware y software utilizado . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.1. Conceptos biológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1.1. Composición de la sangre humana . . . . . . . . . . . . . . . . . . . 12

3.1.2. Recuento Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.2. Conceptos Estadı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.2.1. Métricas de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2.2. Análisis de Componentes Principales –PCA– . . . . . . . . . . . . . 25

3.3. Análisis de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.2. Filtrado espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.4. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.5. Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.5.2. Tipos de Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . 40

3.5.3. Entrenamiento por Retropropagación . . . . . . . . . . . . . . . . . 44

3.6. Técnicas de Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4. Estado del Arte 53

4.1. Segmentación de una imagen celular para diagnóstico patológico . . . . . . 53

4.2. Automatización del Recuento Diferencial de la sangre . . . . . . . . . . . . 56

4.3. Mejorado automático de detección de piel en imágenes de color . . . . . . . 57

4.4. Identificación automática de objetos aéreos usando Redes Neuronales . . . . 58

4.5. Análisis de imagen y aprendizaje supervisado en la diferenciación automáti-

ca de células blancas de imágenes microscópicas . . . . . . . . . . . . . . . . 60

4.6. Localización y rastreo de rostros humanos con Redes Neuronales . . . . . . 62

4.7. Localización de rostros humanos en Tiempo Real . . . . . . . . . . . . . . . 65

5.1. Método para el reconocimiento de células sanguı́neas Segmentadas y No

5.2. Etapas en la solución del problema . . . . . . . . . . . . . . . . . . . . . . . 70

5.3. Método de clasificación de leucocitos . . . . . . . . . . . . . . . . . . . . . . 71

5.3.1. Adquisición y Preprocesamiento de la imagen . . . . . . . . . . . . . 72

5.3.2. Segmentación en color . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.3.3. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . 81

5.3.4. Entrenamiento de la red . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.3.5. Reconocimiento de observaciones originales . . . . . . . . . . . . . . 94

6. Pruebas y análisis de resultados 95

6.1.1. Adquisición y preprocesamiento de la imagen . . . . . . . . . . . . . 95

6.1.2. Segmentación de la imagen . . . . . . . . . . . . . . . . . . . . . . . 98

6.1.3. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . 105

6.1.4. Entrenamiento de la Red Neuronal . . . . . . . . . . . . . . . . . . . 109

6.2. Análisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

7.2. Trabajo a Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

A. Espacios de color 127

A.1. Espacio RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.2. Espacio TSL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.3. Espacio HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.4. Los espacios XYZ, Luv, Lab . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

A.5. Los espacios de color YIQ, YUV, YCbCr y YCC . . . . . . . . . . . . . . . 131

A.6. El espacio CMY(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

B. Galerı́a de imágenes 133