Documente Academic
Documente Profesional
Documente Cultură
Tesis
Presenta:
Asesor:
A mi familia.
IV
Índice general
Índice general V
Índice de figuras IX
Prefacio XIX
Resumen XXIII
1. Introducción 1
2. Antecedentes 5
2.2. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.5.1. Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.5.2. Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
VI ÍNDICE GENERAL
3. Fundamentos 11
3.3.1. Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5. Clasificación de leucocitos 69
Segmentadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
ÍNDICE GENERAL VII
6.1. Pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7. Conclusiones 117
Referencias 121
3.15. Momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
X ÍNDICE DE FIGURAS
3.21. Esquema básico de una neurona artificial que contiene una sóla
entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
gresiva). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
patológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
pseudocolor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
mo de detección de cı́rculos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
c). Diferencia de las dos imágenes d). Conjunto de pixeles con caracterı́sticas
para el área seleccionada c). Se umbraliza como pixeles de piel aquellos que
célula segmentada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
delo de Mahalanobis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
riamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
en el escalamiento lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
de aplicar la FFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
car FFT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
frotis. Centro: Colocación del frotis sobre la base del microscopio. Derecha:
6.8. Resultados del filtro inicial. a).- Célula Segmentada Eosinófila. b).-
6.9. Resultados del filtro inicial aplicado a imágenes muy claras. a).-
mentadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
turales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Motivación personal
La fuerza motivadora para la realización de este trabajo de tesis ha sido el interés por
aplicar técnicas de visión por computadora en el área del análisis clı́nico, encaminado a
Ası́, el objetivo principal es proponer una técnica que permita identificar leucocitos y
que son capaces de realizar tareas similares empleando mecanismos no visuales. Tampoco
es una meta de este trabajo obtener un sistema listo para ser utilizado en el área clı́nica
y reemplazar a los métodos ya existentes, debido a que el análisis visual consume más
Organización de la Tesis
tor a tener una idea clara del proceso de Clasificación de Células Sanguı́neas empleando
resultados.
segmentación en color.
nidos.
Esperando sea útil para futuros trabajos de investigación, se anexa la base de datos
utilizada en formato digital, además de los códigos fuente correspondientes a las funciones
1
Email: rocio730@prodigy.net.mx
2
Email: rsolanomonje@hotmail.com
Agradecimientos
A todas las personas que de manera incondicional, brindaron parte de su valioso tiempo
Para empezar quiero agradecer a mi tı́a Genobeba Montiel Corona, quien me ha apo-
yado mucho al hacerse cargo del cuidado de mis hijos y las labores domésticas para que
yo pudiera dedicar el tiempo necesario para hacer posible la realización de este trabajo de
tesis.
Doy gracias a mi asesor por su apoyo y guı́a en las actividades involucradas en la rea-
lización de este trabajo y por sus consejos para que esta tesis fuera posible.
También deseo agradecer al M. en C. José Alberto Chávez Aragón3 por las sugerencias
3
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: achavez@ingenieria.uatx.mx
4
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: jalbores@ingenieria.uatx.mx
5
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: orionfrg@ingenieria.uatx.mx
6
Catedrático del área de Matemáticas Aplicadas en la Facultad de Ciencias Básicas.
Email: ilm@ingenieria.uatx.mx
7
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
XXII
José Erasmo Pérez Vázquez8 por su apoyo en la resolución de mis dudas relacionadas con
reconocer el trabajo realizado por el Q.F.B. Gonzálo Romero Tirso en las tareas de reco-
lección y preparación de los frotis sanguı́neos ası́ como su valioso apoyo en la identificación
durante el proceso administrativo y que han permitido que este trabajo concluya exitosa-
mente.
A todos mis colegas que me han hecho crı́ticas y sugerencias, mil gracias.
8
Catedrático del área de Matemáticas Aplicadas en la Facultad de Ciencias Básicas.
Email: erasmo@ingenieria.uatx.mx
9
Director de la Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a.
Resumen
El propósito de este trabajo de tesis es utilizar visión por computadora para identificar
uso de este modelo se realiza el proceso de segmentación. Esto permite extraer las carac-
de entrenamiento.
que corresponden a las distancias del centro de masa de la región de interés a su perı́metro.
Antes de usar este conjunto de datos para el entrenamiento de la red neuronal, se aplicó la
XXIV
FFT(Transformada Rápida de Fourier –por sus siglas en inglés–) para eliminar variacio-
The purpose of this work is to use computer vision in order to identify and clasify blood
cells. These cells are extracted from a set of images which were adquired through a vision
system. The proposed method is based on segmentation algorithm, that was previously
used for skin segmentation. Additionally, a neural network was used for the classification
task.
The adapted segmentation algorithm allows to create a color model and making used
of this model the segmentation process is performed. This allows to extract the characte-
ristics of the region that concerns us. There are three types of extracted characteristics:
structurals, structurals with variance analysis and radials. The identification process is ac-
complished by means of a learning system -the neural network- which is trained with the
characteristics of the previous phase. The results are based on the use of a back-propagation
neural network, using the structural, structurals with variance analysis or radial characte-
The first set of training data consists of 13 attributes of the segmented region of inter-
est. The positive index obtained from this set was of 84.54 %.
The second training data was made of 8 characteristics obtained from a variance analy-
sis of a subset of 17 structurals characteristics. In this case the recognition rate obtained
was 85.82 %.
The third training data set consisted of 111 radial characteristics which were corres-
ponded to the distances taken from the center of mass of the region of interest to its
perimeter. Before using this data set for training the neural network. The FFT (Fourier
Fast Transform) was applied in order to eliminate to variations in the extracted features
XXVI
to 99.54 %. In every case the characteristics were propocessed with PCA. The performance
of the training phase –the neural network performance– were evaluated using the Ten Fold
Introducción
cionados con el análisis de sangre, uno de ellos es el Recuento Diferencial que consiste en
De esta manera una gran cantidad de células sanguı́neas de la serie blanca1 son clasifi-
cadas en laboratorios clı́nicos utilizando microscopios , lo que resulta en una tarea subjetiva
para evaluar y contar 100 células para cada laminilla2 , un tiempo considerable y susceptible
Debido a la importancia que este tipo de análisis tiene, sus aplicaciones y el volu-
men de muestras que es necesario revisar diariamente, algunas instituciones de salud uti-
lizan máquinas capaces de realizar un cierto número y tipo de análisis clı́nicos incluyendo
nos contacto directo con muestras posiblemente infectadas. En la Figura 1.1, tomada de
1
glóbulos blancos o leucocitos
2
muestra de frotis sanguı́neo teñido para recuento diferencial
2 1 INTRODUCCIÓN
[Beckman Coulter, 2006] se muestran dos tipos de máquinas empleadas en análisis clı́nicos.
Sin embargo, la desventaja de realizar los análisis empleando máquinas de este tipo
es que su mantenimiento es costoso, además de que son productos caros que no propor-
posiblemente a que los mecanismos que emplean para hacer esta diferenciación se basan
en métodos fı́sicos y quı́micos, no en un análisis visual; hecho que ha ocasionado que aún
En busca de un método que permita realizar esta identificación empleando visión por
computadora, surge este trabajo de tesis, el cual una vez terminado no pretende de ninguna
manera sustituir a los métodos tradicionales para la realización del Recuento Diferencial,
ya sea hecho por un experto o por una máquina sino encontrar una alternativa para el
para el desarrollo de una aplicación que sirva de apoyo a los estudiantes del área clı́nica en
segmentados.
Como parte de la solución propuesta se trabaja con un grupo de 354 muestras obteni-
das con una cámara digital adaptada al ocular de un microscopio óptico. Posteriormente se
3
utiliza un modelo propuesto por [Tomaz et al., 2003] para la segmentación de piel humana
que se adaptó para la segmentación de núcleos celulares . Una vez obtenida la región de
interés se extraen caracterı́sticas que permiten clasificar a los leucocitos en dos clases: célu-
una red neuronal de retropropagación que recibe como entrada un vector de caracterı́sticas
Por otra parte, se comprobó que las caracterı́sticas radiales son buenos descriptores de
El aporte que se puede apreciar en este trabajo, es que el uso de un espacio de color
De esta manera, los resultados demuestran que es factible el uso de la técnica pro-
constituir una alternativa para el análisis e identificación de cualquier tipo de objeto con
Antecedentes
tadora?
tesis. La razón principal de intentar dar respuesta a esta pregunta es, por un lado en-
contrar un método que se asemeje al proceso realizado por un ser humano al tratar de
identificar células blancas, y por otro proponer una alternativa para la identificación de
este tipo de muestras que esté apoyada en técnicas de visión por computadora. El método
color y forma debido a que un experto humano identifica y clasifica a los glóbulos blancos
2.2. Hipótesis
El tema principal de este trabajo esta directamente relacionado con técnicas de visión
color para la segmentación y la morfologı́a nuclear para la clasificación, pues una buena
caracterización del núcleo es suficiente para ubicar a los glóbulos blancos en dos grupos:
manera:
color de los núcleos celulares, y el uso de caracterı́sticas que describen la forma dicho
o caracterı́sticas radiales.
2.3. Objetivos
Analizar visualmente las células blancas para elegir las caracterı́sticas utilizadas en
su clasificación.
células sanguı́neas. Como se observa, se comienza por adquirir las muestras biológicas que
región de interés corresponde al núcleo de la célula, dado que la forma que lo caracteriza
es lo que hace la diferencia entre las dos clases de leucocitos que se deben reconocer. Estas
clases son:
una segmentación automática de los núcleos celulares, para delimitarlos de la mejor manera
1. Descriptores estructurales
3. Descriptores de Fourier
región que son medibles y que además, proporcionan información útil sobre la composición
de la región [Pajares and de la Cruz, 2002]. Algunas de ellas son el área, el perı́metro, el
Los descriptores estructurales con análisis de varianza están formados por un conjunto
eligen aquellas caracterı́sticas cuya varianza entre ambas clases de células sea significativa.
de caracterı́sticas radiales (descriptores de Fourier) para cada imagen. Con cada conjunto
elegido para evaluar a las caracterı́sticas seleccionadas, dado que en el trabajo reportado
por [Katz, 2000], se observa un buen desempeño cuando se trabaja con datos similares a
continuación.
2.5.1. Hardware
El hardware utilizado para el sistema de visión se muestra en la Figura 2.2. Las imágenes
1.5Ghz y 512MB.
2.5.2. Software
Fundamentos
En este capı́tulo se describen los conceptos básicos, necesarios para la plena compren-
sión del resto del trabajo de tesis. Se definen conceptos relacionados con citologı́a, hema-
de resultados.
Para tener una descripción más amplia respecto a los elementos biológicos que consti-
la célula.
Una célula es la unidad anatómica y fisiológica que compone a un ser vivo y está for-
la parte que cubre a la célula y que visualmente representa su silueta marcando los lı́mites
brana en el cual estan suspendidos los órganos internos de la célula, su consistencia puede
ser lı́quida o viscosa. Dentro del citoplasma se encuentra el núcleo, que regularmente esta
sus partes.
12 3 FUNDAMENTOS
usar (ácidos o básicos) para teñirlas y poder visualizarlas distinguiendo mejor sus partes.
cuencia los ácidos nucléicos ADN1 y RDN2 [Wikipedia Foundation, 2006], su composición
generalmente es ácida, en cambio el citoplasma tiende a ser quı́micamente más básico3 . Ası́,
los núcleos de los leucocitos generalmente se tiñen de morado en respuesta a los colorantes
globular lo forman un conjunto de células que se encuentran suspendidas en él, como los
Cada uno de ellos tiene su función particular [Woodliff and Herrmann, 1993].
tos, cuya función principal es transportar el oxı́geno a todo el cuerpo. Las plaquetas se
encargan de los procesos de coagulación, en tanto que los leucocitos constituyen el me-
[Cormack, 1997].
Leucocitos
Etimológicamente los leucocitos deben su nombre a las palabras leuco (blanco) y ci-
to (célula). En personas saludables, el número de leucocitos varı́a entre 5000 y 10, 000,
nia). En la Figura 3.3 se muestran los subtipos de leucocitos y los porcentajes normalmente
desechos. Los linfocitos son productores de anticuerpos, mientras que los basófilos poseen
4
son un tipo de proteı́nas producidas por el sistema inmune en respuesta a la presencia de sustancias
extrañas potencialmente dañinas que pueda ser una amenaza para el organismo: como quı́micos, partı́culas
de virus, esporas (cuerpos microscópicos unicelulares o pluricelulares que por división propia dan nacimiento
a nuevos organismos en vegetales criptógamos, hongos y algunas especies protozoarias.) o toxinas (proteı́nas
o lipopolisacáridos que causan daños concretos a un huésped) de las bacterias [Webner, 2006].
5
propiedad de una célula para atraer partı́culas y destruirlas o digerirlas.
14 3 FUNDAMENTOS
individuo. Las primeras células que aumentan en número ante un cuadro infeccioso son los
cios muy forzados o embarazo puede haber una moderada leucocitosis7 fisiológica, no rela-
cionada con procesos patológicos. En la Figura 3.4, tomada de [Freggiaro and Espejo, 2006]
Método manual
Preparación del frotis sanguı́neo. Se coloca una gota de sangre fresca sobre un por-
taobjetos y se extiende con ayuda de otro portaobjetos para formar una capa delgada
Tinción. Se realiza con colorantes ácidos (eosina-rojo) y básicos (azul de metileno). Los
con el azul de metileno tomando dicha coloración. Los Eritrocitos (glóbulos rojos)
rojo. Los glóbulos blancos con gránulos que toman ambos colorantes se denominan
neutrófilos. Las células con gránulos que toman color azul se llaman basófilos. Los
leucocitos que poseen gránulos que se tiñen con eosina (rojo) se denominan eosinófi-
los. Una vez teñidos los leucocitos, se identifican por sus caracterı́sticas y grado de
desarrollo.
6
mediadores quı́micos que modulan los procesos de la inflamación.
7
aumento en el número de leucocitos.
16 3 FUNDAMENTOS
1. Neutrófilo en banda
2. Neutrófilo segmentado
NEUTRÓFILO 3. Eritrocito
4. Neutrófilo en segmentación
De acuerdo a la forma de su núcleo se les
puede clasificar en neutrófilos en banda o
cayados y en neutrófilos segmentados.
Presentan núcleos divididos en 3 a 5 lóbulos.
EOSINÓFILO
Reporte. Se cuentan en una muestra vista al microscopio óptico alrededor de 100 células
3.6 se muestra un aparato similar a una máquina de escribir que utiliza el quı́mico
mayorı́a de los laboratorios clı́nicos en México y son los que se utilizaron en este trabajo
de tesis. De acuerdo a las imágenes consultadas en diversas fuentes se puede notar que
la coloración que adquieren los leucocitos es muy similiar al ser teñidos para Recuento
Diferencial, lo cual significa que es posible utilizar distintos colorantes para la tinción de
los frotis sin afectar de forma considerable la coloración que comúnmente adquieren para
ser diferenciados.
Método automático
No existe un método único para contar células, lo cual implica que hay en el mercado
varios modelos de contadores hematológicos y cada uno de ellos realiza su función de una
forma especı́fica; sin embargo, los parámetros que miden y los resultados de sus medicio-
nes son muy similares. Como ejemplo para este estudio, se han escogido los contadores
Beckman Coulter8 por su sencillez y uso extendido; sin querer decir con ello que sean los
Un contador hematológico debe contar, como mı́nimo, la serie blanca (glóbulos blancos)
y la serie roja (glóbulos rojos). Es decir, el total de leucocitos y el total de eritrocitos, sin
8
empresa lı́der en el comercio de equipo de laboratorio y contadores hematológicos.
9
En los laboratorios de SESA en Tlaxcala se utilizan el sistema K-1000 [Ses, 1999].
18 3 FUNDAMENTOS
hacer distinción entre las poblaciones de células que componen a cada una de las series.
A esto se le llama CBC –Complete Blood Count–. Aparte de esta cuenta, un contador
Scatter Pack), lo cual produce una rápida lisis10 de los eritrocitos y reduce los restos
celulares sin alterar los leucocitos. Posterior a esta reacción se agrega el reactivo StabiLyse,
el cual actúa como preservante11 de los leucocitos a fin de que resistan en su estado casi
Una vez tratada la muestra es dirigida a una celda de flujo en la cual por el diseño
hidrodinámico, los leucocitos se alinean y pasan formados uno a uno y en donde se realizan
celular.
La dispersión al hacer incidir sobre la célula una luz láser, lo que proporciona
De esta manera son realizadas las 3 determinaciones de manera simultánea. Las lecturas de
estas 3 señales análogas son enviadas al analizador para su amplificación y proceso, luego el
10
rompimiento o destrucción de las células.
11
sustancia que actúa como conservador o protector de los leucocitos.
12
porción del espectro electromagnético que se obtiene al aplicar corriente alterna a una antena
[Wikipedia Foundation, 2006].
3.2 Conceptos Estadı́sticos 19
sistema genera 3 gráficos. DF1: Volumen vs. Dispersión, DF2: Volumen vs. Conductividad
y DF3: Volumen vs. Conductividad, en ésta última se extraen las señales de Neutrófilos
antes descrito.
El sistema caracteriza cada célula que pasa hasta completar un conteo de 8,132 células
o partı́culas que sobrepasen un cierto volumen o bien hasta que transcurran 20 segundos,
Uno de los principales objetivos del análisis de imágenes por computadora consiste en
para esto es necesario definir un patrón, es decir, una descripción estructural o cuantitativa
20 3 FUNDAMENTOS
patrones utilizadas con más frecuencia son vectores para descripciones cuantitativas, y
blación. Las caracterı́sticas pueden ser cualitativas y cuantitativas [Hair et al., 2001].
Definición 5 (Varianza) Mide cuánto varı́a una variable X respecto a un valor esperado.
p
σ= var(X) (3.2)
siguientes conceptos:
X
P (wi ) = 1 (3.6)
i
Z
p(x)dx = 1 (3.7)
22 3 FUNDAMENTOS
o gaussiana es la más utilizada debido a las propiedades que presenta y es útil en situaciones,
en las cuales un conjunto de patrones de una determinada clase toman valores en un rango
contı́nuo y alrededor de un patrón promedio, es decir, considera que los patrones de clases
diferentes tienen ciertos valores, pero los valores de una clase son lo más parecidos posible.
covarianza.
bución normal, si las variables asociadas están incorrelacionadas, entonces son inde-
pendientes.
para variables aleatorias que son suma de otras variables y el teorema central del
1 −1 X
(x−µ)t Σ−1 (x−µ)
p(x) = d P 1 e 2 ∼ N (µ, ) (3.9)
(2π) |
2 | 2
donde,
13
el teorema dice que cuando se tiene un grupo numeroso de variables independientes y todas ellas siguen
el mismo modelo de distribución (cualquiera que éste sea), la suma de todas ellas se distribuye según una
distribución normal [Garcı́a and Sierra, 2001].
3.2 Conceptos Estadı́sticos 23
d =, número de dimensiones.
tonces
diagonal.
P
Si la densidad subyacente es gaussiana y es una matriz diagonal, entonces las
d
Y
p(x) = p(xi ) , p(xi ) ∼ N (µi , σii ) y σii = σi2 (3.11)
i=1
Distancia de Mahalanobis
formando un único agrupamiento de manera que el centro de este agrupamiento está de-
terminado por el vector medio, y la forma por la matriz de covarianza. En la Figura 3.9 se
muestra la función de densidad de probabilidad para una clase cuyos patrones siguen una
distribución normal.
De la ecuación 3.9 se deduce que los puntos para los cuales el valor de la densi-
P−1
(x − µ)T (x − µ) es constante. El valor de esta expresión es la Distancia de Maha-
lanobis de x a µ.
En el caso bidimensional, estas elipses pueden verse claramente en la Figura 3.10, donde
los contornos de igual densidad de probabilidad son hiperelipsoides con una distancia de
Mahalanobis a µ constante [Cortijo, 2001]. Las direcciones de los ejes principales de estos
P
hiperelipsoides están determinadas por los autovectores14 de y sus longitudes por los
autovalores15 correspondientes.
se diferencia con la distancia euclı́dea en que considera la correlación entre las variables
14
también llamados eigenvectores, son vectores no nulos que al ser transformados por un operador dan
lugar a un múltiplo escalar de sı́ mismos λ, con lo que no cambian su dirección [Wikipedia Foundation, 2006].
15
también llamados eigenvalores, son los escalares λ obtenidos por un eigenvector
[Wikipedia Foundation, 2006].
3.2 Conceptos Estadı́sticos 25
Simetricidad. La distancia entre los puntos a y b es la misma que entre los puntos
b y a.
de entender o procesar en análisis posteriores –por ejemplo con métricas– que el conjunto
más alta, dejando al final los que poseen las desviaciones más bajas.
conjunto de datos.
26 3 FUNDAMENTOS
De esta manera, el primer factor o componente es el que contiene una mayor parte de la
varianza, el segundo es el que tiene la mayor parte de la varianza restante y ası́ sucesiva-
mente.
Reducir el conjunto de datos facilita el proceso del clasificador, ahorra tiempo de pro-
PCA como método para segmentar imágenes tiene algunas ventajas como las siguientes:
clasificación.
(3D, 2D ó 1D).
Sintetizar información útil sobre la imagen y crear nuevos parámetros para el análisis
de la imagen.
Las funciones necesarias en un sistema de visión son [Awcock and R., 1996]:
Análisis de la imagen.
En la Figura 3.11, tomada de [Awcock and R., 1996] se muestra un modelo genérico de los
de técnicas que permiten adquirir una imagen y manipularla para la obtención de mejores
se encuentra la eliminación de ruido, que consiste en aplicar un filtro que quita elementos no
En la parte del análisis de imágenes se trabaja con los datos obtenidos en la etapa
otras, formas, color o combinaciones de éstas. Por lo tanto, antes de elegir una técnica para
imagen.
28 3 FUNDAMENTOS
3.3.1. Segmentación
Similitud. Cada uno de los pixeles de un elemento tiene valores parecidos para alguna
propiedad.
Discontinuidad. Los objetos destacan del entorno y tienen por lo tanto bordes definidos.
Conectividad. Los pixeles pertenecientes al mismo objeto son contiguos (estan agrupa-
dos).
Las técnicas que se utilizan para lograr la segmentación se basan en la búsqueda de partes
uniformes en la imagen, o bien de partes en las que se produce algún cambio. Ası́, una vez
detectados los puntos que presentan éstas discontinuidades o bordes se debe encontrar un
camino entre el pixel P1 y el pixel Pn , lo que permite definir un camino como una secuencia
de puntos P2 , P3 , ..., Pn − 1, donde el pixel Pi+1 es vecino del pixel Pi . Una región es un
camino entre cualquier pareja de sus puntos, y todos los pixeles del camino pertenecen
regiones:
Rc Es el conjunto complemento de R.
Al segmentar generalmente se obtienen los datos de pixel en bruto que forman parte de
una región o de su contorno y el siguiente paso es decidir si los datos de interés pertenecen
3.3 Análisis de imágenes 29
verá afectada por factores como la calidad en la preparación de dicha muestra, de la cual
Realizar un estudio como el que se describe en [Guzmán, 1997] permite elegir el espacio
Existen muchas técnicas de segmentación [Pal and Pal, 1993] y respecto a la segmen-
Aquellas que trabajan directamente sobre el espacio imagen. Este conjunto de técnicas
se puede dividir en dos grandes sub-grupos que engloban la mayor parte de técnicas
la teorı́a de análisis de datos para hacer la clasificación. Entre las técnicas útiles para
16
operadores relacionados con el cálculo de derivadas e integrales.
30 3 FUNDAMENTOS
ciales para el procesamiento de las imágenes, y las máscaras se denominan filtros espaciales.
Los filtros suavizantes se utilizan para hacer que la imagen aparezca algo borrosa y para
lı́neas o curvas [González and Woods, 1996]. A continuación se describe el filtro de la me-
diana, dado que se hace uso de éste durante la última etapa de la segmentación descrita
en la sección 6.1.2.
Filtro de la mediana
Consiste en reemplazar el nivel de gris por la mediana de los niveles de gris en un entorno
La mediana m de un conjunto de valores es tal que la mitad de los valores del conjunto
quedan por debajo de m y la otra mitad por encima. Por ejemplo, para realizar el filtrado
por la mediana en el entorno de un pixel, primero se deben extraer los valores del pixel y
muestra este procedimiento. Los tres pasos mostrados en dicha figura se repiten mientras
La función del filtrado es introducir puntos con intensidades distintas que sean más
parecidos a sus vecinos, eliminando los estrechos picos de intensidad que aparecen aislados
reconocimiento por medidas cuyos valores son muy similares para objetos de la misma
3.4 Extracción de caracterı́sticas 31
clase, y muy diferentes para objetos de diferentes clases. Existen caracterı́sticas que son
describen propiedades como figura, color y textura son invariantes a rotación, traslación y
minio, que es la clasificación propia que requiere del conocimiento de dicho dominio.
la Figura 3.13, tomada de [Duda, 2001] se muestra el ciclo de éste diseño, en principio
se colectan los datos para entrenar y probar el sistema. Las caracterı́sticas de los datos
17
relativos a la teorı́a estadı́stica de los procesos cuya evolución en el tiempo es aleatoria.
18
Un clasificador es una función que mapea una instancia no etiquetada a una etiqueta utilizando estruc-
turas de datos internas [Kohavi, 1995].
32 3 FUNDAMENTOS
para las categorı́as distintas. El proceso de entrenamiento utiliza algunos o todos los datos
para determinar los parámetros del sistema, finalmente los resultados de la evaluación se
Las caracterı́sticas de una imagen generalmente estan formadas por vectores que con-
tienen información especı́fica de dicha imagen. Estas caracterı́sticas pueden estar repre-
En la mayorı́a de los casos, las caracterı́sticas más importantes estan relacionadas con
la forma de las regiones de interés en la imagen, y para describirla son útiles las propiedades
geométricas y los momentos [de la Escalera, 2001]. Las propiedades geométricas se relacio-
3.4 Extracción de caracterı́sticas 33
nan con medidas de la región de interés, mientras que los momentos permiten obtener pro-
piedades de un objeto en términos de su área, posición y orientación [Awcock and R., 1996],
En la Figura 3.14 se muestran algunas caracterı́sticas útiles para describir la forma de una
región.
como una función 1-D g(r) de una variable arbitraria r. Tratando la amplitud de g como
k
X
µn (v) = (vi − m)n p(vi ) (3.1)
i=1
donde,
34 3 FUNDAMENTOS
k
X
m= vi p(vi ) (3.2)
i=1
Otra alternativa consiste en normalizar g(r) para que el área bajo ella sea la unidad y
tratarla como un histograma. En este caso, r es la variable aleatoria y los momentos son,
L
X
µn (v) = (ri − m)n g(ri ) (3.3)
i=1
donde,
L
X
m= ri g(ri ) (3.4)
i=1
mente con la forma de g(r). Por ejemplo, el segundo momento µ2 (r) mide la dispersión de
los puntos de la curva con relación al valor medio de r, y el tercer momento µ3 (r) mide su
19
El subı́ndice 2 de µ, indica que se trata del segundo momento.
3.4 Extracción de caracterı́sticas 35
PROPIEDAD DESCRIPCIÓN
Área Número de pixeles que contiene la imagen
Longitud (en pixeles) del eje menor de la elipse que tiene los
Longitud de eje menor
mismos segundos momentos que la región
Longitud (en pixeles) del eje mayor de la elipse que tiene los
Longitud de eje mayor
mismos segundos momentos que la región
Caja circunscrita
Rectángulo más pequeño que puede contener la región
(Bounding Box )
Polı́gono convexo más pequeño que puede conte-
Envoltura convexa
ner la región. En la Figura 3.18, modificada de
(Convex Hull )
[Goodrich and Tamassia, 2003] se presenta un ejemplo.
Número de componentes conexas de la región menos número
Número de Euler de huecos en dicha región. En la Figura 3.17 se muestra un
ejemplo.
Diámetro del cı́rculo con la misma área que la región.
Diámetro equivalente p
D = 4Area/π
Proporción de pixeles en el convex hull que también estan
Solidez en la región.
S = Área/Área de Convex Hull
Proporción de los pixeles en el bounding box que también
Rectangularidad (extent) están en la región.
R = Área/Área de Bounding Box
Gráfica que representa la distancia del centro de masa de la
Signatura (firma) región a los puntos de su borde. En la Figura 3.16, tomada
de González, De Fu y Lee [1987] se observa un ejemplo.
Perı́metro Longitud (en pixeles) del contorno de una región.
Cuadratura del bounding box.
Elongación o razón de aspecto
S = base Bounding Box/altura de Bounding Box
Excentricidad de la elipse que tiene los mismos segundos
Excentricidad momentos que la región, es la relación entre el foco de la
elipse y su longitud de eje mayor.
Ángulo (en grados) entre el eje X y el eje mayor de la elipse
Orientación
que tiene los mismos segundos momentos que la región
Centro de masa (centroide,
Es el punto geométrico donde la resultante de las fuerzas
centro de gravedad)
gravitatorias ejercidas por todos los cuerpos del sistema se
anula. Se obtiene con
P P
x̄ = i xi /A, ȳ = i yi /A
donde, A es el área de la región
[Pajares and de la Cruz, 2002].
el punto donde se supone concentrada toda la masa del sistema. El centroide, el centro
de gravedad y el centro de masa pueden, bajo ciertas circunstancias, coincidir entre sı́.
En estos casos se suele utilizar los términos de manera intercambiable, aunque designan
conceptos diferentes.
El centroide es un concepto puramente geométrico mientras que los otros dos términos
(centro de gravedad y centro de masa) se relacionan con las propiedades fı́sicas de un cuer-
po. Para que el centroide coincida con el centro de masa, el objeto debe tener densidad
uniforme, o la distribución de materia a través del objeto debe tener ciertas propiedades,
tales como simetrı́a. Para que un centroide coincida con el centro de gravedad, el centroide
debe coincidir con el centro de masa y el objeto debe estar bajo la influencia de un campo
res.
usados por un clasificador (de pertenencia conocida o no a una clase) para estimar paráme-
tros de aprendizaje.
un clasificador (de pertenencia conocida a una clase) para probar el entrenamiento reali-
[Alpaydm, 2004].
3.5.1. Introducción
Una red neuronal artificial proporciona un método robusto para aproximar funciones
que utilicen valores reales, discretos y funciones valuadas en un vector. El aprendizaje con
El modelo de una neurona artificial es una imitación del proceso fisiológico de una
1. Las entradas Xi .
2. Los pesos Wi .
como red [González and Woods, 1996]. Las señales de entrada a una neurona artificial
X1 , X2 , ..., Xn son variables continuas en lugar de pulsos discretos, como se presenta en una
neurona biológica. Cada señal de entrada pasa a través de una ganancia o peso, llamado peso
neurona biológica. Los pesos pueden ser positivos –excitatorios–, o negativos –inhibitorios–,
el nodo sumatorio acumula todas las señales de entradas multiplicadas por los pesos y las
n
X −
→−→
netai = Wi Xi = X Y (3.1)
i=1
La secuencia de este proceso se muestra en la figura 3.20 [Acosta et al., ]. Una vez que se
xi = fi (netai ) (3.2)
función escogida para transformar la entrada netai en el valor de salida xi , y que depende
Dentro de una red neuronal, las neuronas se encuentran agrupadas por capas, donde
una capa es una colección de neuronas que de acuerdo a su ubicación recibe los siguientes
nombres:
Capas ocultas: Son capas que no tienen contacto con el medio exterior, sus elementos
pueden tener diferentes conexiones y son éstas las que determinan las diferentes
40 3 FUNDAMENTOS
Figura 3.21: Esquema básico de una neurona artificial que contiene una sóla
entrada.
topologı́as de la red.
medio externo.
interna, constituı́da por capas. Cada capa puede tener diferente número de neuronas, e
incluso distinta función de transferencia. Una función de transferencia es una función lineal
o no lineal de la salida neta de la red que determina la salida total de la red neuronal.
de esta clasificación [Acosta et al., ]. Sin embargo, de acuerdo al trabajo de [Flores, 2001]
resulta válido considerar que la red ART2 también puede recibir entradas continuas.
Las Redes neuronales multicapa alimentadas hacia adelante se utilizan con frecuen-
que las clases sean o no separables, y utilizando arquitecturas que constan de niveles de
3.5 Redes Neuronales 41
básica de cada neurona de la red. El desplazamiento θ se trata como si fuese otro peso.
la dimensión de los patrones vectoriales que se dan como entrada. El número de neuronas
una clase wm si la m-ésima salida de la red está activada, mientras que las restantes salidas
estan desactivadas.
calcular la diferencial de las funciones por todos los caminos de la red, ası́ que la siguiente
1
hj (Ij ) = (3.3)
1 + exp[−(Ij + θj )/θ0 ]
dispuestas de modo que la salida de cada neurona de una determinada capa alimenta las
capa es la suma ponderada de las salidas de la capa anterior. Suponiendo que la capa K es
la que precede a la capa J, la entrada del elemento de activación de cada nodo de la capa
nodos de la capa K y wjk son los pesos que modifican las salidas Ok de los nodos de la
20
un perceptrón es una máquina de aprendizaje que al entrenarse utilizando conjuntos de entrenamiento
linealmente separables, éstos convergen a una solución en un número finito de iteraciones. Sus soluciones
toman la forma de coeficientes de hiperplanos capaces de separar correctamente las clases representadas
por los patrones del conjunto de entrenamiento [González and Woods, 1996].
3.5 Redes Neuronales 43
Figura 3.24: Modelo de red neuronal multicapa alineada hacia adelante (pro-
gresiva).
44 3 FUNDAMENTOS
capa K antes de alimentar los nodos de la capa J. Las salidas de la capa K son:
Ok = hk (Ik ) (3.5)
entrada del elemento de activación del j-ésimo nodo de la capa J, con lo que I1 representa la
entrada del elemento de activación del primer (el más alto) nodo de la capa J, I2 representa
la entrada del elemento de activación del segundo nodo de la capa J, y ası́ sucesivamente.
Cada nodo de la capa J tiene Nk entradas y cada una se puede ponderar de forma distinta,
las Nk entradas del primer nodo de la capa J estan ponderadas por los coeficientes w1k , k =
1
hj (Ij ) = PNk (3.6)
1 + exp[−( k=1 wjk Ok + θj )]/θ0
El principal problema del entrenamiento de una red multicapa consiste en ajustar los pesos
red como estı́mulo, éste se propaga desde la primera capa a través de las capas superiores
de la red, hasta generar una salida. La señal de salida se compara con la salida deseada y
Las salidas de error se propagan hacia atrás, partiendo de la capa de salida, hacia
todas las neuronas de la capa oculta que contribuyen directamente a la salida, pero las
neuronas de la capa oculta sólo reciben una fracción de la señal total del error, basándose
original. Este proceso se repite capa por capa, hasta que todas las neuronas de la red hayan
recibido una señal de error que describa su contribución relativa al error total. Basándose
en la señal de error percibida, se actualizan los pesos de conexión de cada neurona, para
hacer que la red converja hacia un estado que permita clasificar correctamente todos los
patrones de entrenamiento. De esta manera, a medida que se entrena la red, las neuronas de
las capas intermedias se organizan a sı́ mismas de modo que aprenden a reconocer distintas
para calcular la salida Oj de cada nodo. Las salidas Oq de los nodos de la capa de salida
se comparan con las salidas deseadas rq con lo que se obtienen los términos de error δq .
La segunda fase consiste en volver hacia atrás por la red, pasando a cada nodo la
Este proceso se aplica también a los pesos correctores θj . Más adelante se describe con
Situados en la capa de salida, el error medio cuadrático entre las respuestas deseadas rq y
NQ
1X
EQ = (rq − Qq )2 (3.7)
2
q=1
Para permitir el ajuste de los pesos de cada una de las capas de modo que minimice el
valor de una función de error cuya forma sea la mostrada en la ecuación 3.7, se comienza
ajustando los pesos de forma proporcional a la derivada parcial del error con respecto a
los pesos.
∂EQ
∆wqp = −α (3.8)
∂wqp
El error EQ es una función de las salidas Oq , que a su vez dependen de las entradas Iq
46 3 FUNDAMENTOS
De la ecuación 3.4:
Np
∂Iq ∂ X
= wqp Op = Op (3.10)
∂wqp ∂wpq
p=1
∂EQ
∆wqp = −α Op ∆wqp = −αδq Op (3.11)
∂Iq
donde,
∂EQ
δq = − (3.12)
∂Iq
Para poder calcular ∂EQ /∂Iq se utiliza la regla de la cadena y se puede expresar como la
Es decir,
∂EQ ∂EQ ∂Oq
δq = − =− (3.13)
∂Iq ∂Oq ∂Iq
De la ecuación 3.7:
∂EQ
= −(rq − Oq ) (3.14)
∂Oq
y de la ecuación 3.5:
∂Oq ∂
= hq (Iq ) = h0q (Iq ) (3.15)
∂Iq ∂Iq
que es proporcional a la magnitud del error (rq − Oq ). Sustituyendo las ecuaciones 3.12,
21 dy
La regla de la cadena dice que Si y = f (u), u = g(x), y las derivadas du y du
dx
existen ambas, entonces
dy dy du
la función compuesta definida por y = f (g(x)) tiene una derivada dada por dx = du dx
[Swokowski, 1989].
3.5 Redes Neuronales 47
saber cuál es la salida de cada nodo rq . Ası́ se puede saber cómo se deben ajustar los
pesos que modifican los enlaces entre la última y penúltima capa de la red. De esta manera
En las ecuaciones anteriores 3.18 y 3.19 sólo se desconoce rp , el cual carece de importan-
cia en una capa interna, dado que no se sabe cuál serı́a la respuesta de un nodo interno
respecto a la pertenencia del patrón a una clase. Sólo se puede especificar la respuesta en
las salidas de la red, donde se realiza la clasificación definitiva del patrón. Por lo tanto,
∂Op
De acuerdo a la ecuación 3.15 el término ∂Ip es:
∂Op ∂
= hp (Ip ) = h0p (Ip ) (3.21)
∂Ip ∂hp
48 3 FUNDAMENTOS
NQ NQ NP NQ NQ
∂EP X ∂EP ∂Iq X ∂EP ∂ X X ∂EP X
=− = (− ) Wqp OP = (− )wqp = δq wqp
∂Op ∂Iq ∂Op ∂Iq ∂Op ∂Iq
q=1 q=1 p=1 q=1 q=1
(3.22)
donde, la última expresión se obtiene de 3.12. Al sustituir las ecuaciones 3.21 y 3.22 en la
NQ
X
δp = h0p (Ip ) δq wqp (3.23)
q=1
Con esta expresión, se puede calcular el factor δp , ya que todos sus términos se conocen.
Las ecuaciones 3.18 y 3.23 establecen la regla de entrenamiento para la capa P . Después
de calcular el término del error y los pesos de la capa P , se pueden usar estos resultados
para calcular el error y los pesos de la capa inmediatamente anterior a la capa P , es decir
se propaga hacia atrás el error de la red a partir del error de la capa de salida.
De esta forma al generalizar el procedimiento anterior se tiene que, para cualquier par
de capas K y J, siendo la capa K la que precede a la capa J, se deben calcular los pesos
Si la capa J es una capa interna y P es la siguiente capa (por la derecha), entonces δj esta
dado por
NP
X
δj = h0j (Ij ) δp wjp (3.26)
p=1
3.5 Redes Neuronales 49
para j = 1, 2, ..., Nj .
en este caso las ecuaciones 3.25 y 3.26 se expresan de la siguiente forma para la capa de
salida:
jugado que puede entrenar cualquier red neuronal cuyos pesos, entradas y funciones de
para calcular derivadas de desempeño con respecto a los pesos y bias22 de las funciones. El
se puede encontrar en [Mitchell, 1997]. Las condiciones de paro para este tipo de entrena-
miento son:
desde la última vez que ocurrió el último fallo (Cuando se usa validación).
22
Es un sesgo del error, dado por δbθ (d) = E[d(X) − θ], donde d(X) es un estimador de θ, y θ es un
parámetro a evaluar [Alpaydm, 2004]. Según [Kohavi, 1995] el bias de un método para estimar un parámetro
θ está definido como el valor esperado menos el valor estimado.
50 3 FUNDAMENTOS
Es importante recalcar que no existe una técnica para determinar el número de capas
ocultas, ni el número de neuronas que debe contener cada una de ellas para un problema
especı́fico, esta elección es determinada por la experiencia del diseñador quien debe cum-
red Retropropagación tiende a desarrollar relaciones internas entre neuronas con el fin de
Existen diversos métodos para medir la precisión en los resultados obtenidos por un
clasificador. Uno de estos es la técnica de Ten Fold Cross Validation –TFCV–. Esta técnica
3. Rotar los datos de tal manera que las partes elegidas para entrenar y para probar no
4. Calcular la taza de error global, que es igual al promedio de las tazas de error obte-
Una vez concluı́das las 4 etapas de TFCV, se tiene un valor muy aproximado al ı́ndice de
Por otra parte, los estudios realizados por [Kohavi, 1995] indican que la técnica Ten-
Si se desea hacer más eficiente el entrenamiento de una red neuronal es posible aplicar
algunas técnicas de pre y post procesamiento a los datos de entrada de la red. Algunas
La normalización que se realiza al dividir todos los datos de entrada entre el valor
que permita separar al núcleo lo mejor posible para lograr una buena extracción de ca-
patológico
Este trabajo fue desarrollado por Dorin Comaniciu y Peter Meer [Comaniciu, 2001], en
de color Luv1 y delinea sus bordes al utilizar el procedimiento de movimiento del promedio
Las muestras utilizadas son leucocitos digitalizados, cuyos colores son caracterizados
1
Modelo de color propuesto por la CIE que se deriva del espacio XYZ.
2
Para más información sobre este método consultar: D. Comaniciu, P. Meer, Distribution free descom-
position of multivariate data, Pattern analysis and applications, Vol.2 No. 1, pp. 22-30, 1999.
54 4 ESTADO DEL ARTE
por pocos elementos, clusters no gaussianos cuyas figuras son aisladas a partir de la imagen
que esta siendo procesada. Métodos no paramétricos tales como el análisis basado en la
moda, son particularmente convenientes para la segmentación de este tipo de datos debido
a que no definen las formas de los clusters. Algunos resultados de la segmentación producida
en este trabajo se muestran en las Figuras 4.2, 4.3 y 4.4, tomadas de [Comaniciu, 2001].
distinto al RGB, que permitiera anular los efectos indeseados causados por los cambios de
Figura 4.3: Calidad de la segmentación. a). Imágenes originales, arriba una célula
de linfoma de Mantle y las dos de abajo son especı́menes de leucemia linfocı́tica crónica.
b). Contornos. c). Células segmentadas.
Neelam Sinha y A. G. Ramakrishnan [Sinha, 2002] utilizan una técnica para la automa-
tización del Recuento Diferencial de la sangre. La técnica recibe como entrada imágenes en
[Sinha, 2002].
zando una agrupación K-Means seguida por el algoritmo EM3 . Las caracterı́sticas extraı́das
del citoplasma y núcleo segmentado, son elegidas por su aspecto visual, color y textura.
entrenar a los clasificadores, se utilizó una base de datos de 50 ejemplares, 10 de cada clase.
Se obtiene una clasificación del 97 % al utilizar redes neuronales. En la Figura 4.6, tomada
tación y hacer uso del espacio de color HSV proporcionan más evidencias acerca de que
3
–expectation-maximization –, este algoritmo primero calcula las probabilidades bayesianas posteriores
de los datos y obtiene los estimadores de parámetros actuales (paso E), y luego actualiza dichos parámetros
utilizando la media generalizada con teoremas ergódicos (paso M). Estos pasos se realizan alternadamente
hasta converger [Hen and Hwang, 2002].
4.3 Mejorado automático de detección de piel en imágenes de color 57
de la distribución del color sobre un espacio de color que maneja de forma separada la
ro de elementos de cada clase, lo que también se consideró en este trabajo de tesis al elegir
de color
En este trabajo Filipe Tomaz, Tiago Candeias y Hamid Shahbazkia [Tomaz et al., 2003]
muestran una técnica de detección automática de piel. Las imágenes obtenidas se escalan
y se utiliza el espacio de color TSL debido a que los efectos ocasionados por el brillo y
se puede representar con un modelo Gaussiano. También se hace uso de un filtro inicial
obtenido experimentalmente para eliminar pixeles que por sus caracterı́sticas en el modelo
bral que permite segmentar a los elementos piel, de los no piel. De esta manera, analizando
dos y se eliminan las áreas pequeñas que no son piel y que estan presentes en una escena
propuesto en este trabajo, mientras que los resultados al aplicar dicha técnica se muestran
en la Figura 4.8, tomada de [Tomaz et al., 2003] en la cual se observa un fondo complejo
Los pasos utilizados en la segmentación efectuada por Filipe Tomaz, Tiago Candeias
y Hamid Shahbazkia constituyeron una buena alternativa para utilizar esta técnica en el
presente trabajo de tesis. Además de confirmar, la utilidad de los métodos estadı́sticos para
des Neuronales
aéreos. En la Figura 4.9 se señalan las fases que componen a este sistema de clasificación.
Las caracterı́sticas extraı́das son representaciones gráficas de las siluetas de los 5 tipos
de objetos a clasificar, que son obtenidas con técnicas de procesamiento de imágenes y algu-
nas propiedades de la transformada de Fouriers (FFT), las 5 formas de objetos que se identi-
fican se muestran en la Figura 4.10, las imágenes fueron tomadas de [Abdallah et al., 1995].
La FFT elimina variaciones en las caracterı́sticas extraı́das tales como rotación o escala. El
de tesis puesto que los objetos que se deben reconocer se encuentran en diferentes tamaños
y posiciones. Con estas consideraciones, se extrajeron las caracterı́sticas que mejor descri-
ben a la formas nucleares de los leucocitos, que son objeto de estudio en este trabajo de
investigación.
Por otra parte también se comenta en [Abdallah et al., 1995], que el uso de las redes
neuronales resulta útil cuando se trabaja con caracterı́sticas similares a las extraı́das en el
microscópicas
En este trabajo R. J. Katz [Katz, 2000] desarrolla un método de múltiples pasos (seg-
camente imágenes de células blancas. En la Figura 4.11 se muestran los pasos que componen
Primero se obtiene una imagen que contiene un núcleo celular que destaca en la es-
cena, la Figura 4.12 tomada de [Katz, 2000] muestra algunos ejemplares utilizados en su
de bordes Canny (ver Figura 4.13 [Katz, 2000]) seguida por un algoritmo de identificación
de un cı́rculo, en la Figura 4.14 se encuentran algunos ejemplos con resultados que mues-
tran los cı́rculos obtenidos por Katz. El procedimiento para la detección de cı́rculos no es
lizando como referencia al clasificador ZeroR para compararlo con otros clasificadores. La
mejor clasificación se obtiene con una red neuronal entrenada con el algoritmo de retro-
El estudio realizado por Katz concluye que la red neuronal de retropropagación resulta
ser la mejor elección como método para clasificar células sanguı́neas, y esto fue lo que con-
firmó el uso de redes neuronales en ésta tesis, además se descartó la posibilidad de formar
un conjunto de entrenamiento con diferente número de instancias para cada clase, pues
como lo dice Katz en su estudio, ésto provoca un mayor ı́ndice de reconocimiento sobre la
clase predominante.
4
OneR, ID3, C4.5, J4.8, IBk k vecinos más cercanos, Bayes simple y redes neuronales [Katz, 2000].
5
Ambiente para análisis de conocimiento que trabaja en plataforma Java y permite entrenar a un grupo
de clasificadores con un conjunto de datos comunes introducidos en un archivo [Katz, 2000].
62 4 ESTADO DEL ARTE
Neuronales
H. Martin Hunke [Hunke, 1994] propone un localizador de rostros conexionista que uti-
zada cada vez que aparece ésta en una secuencia de imágenes. El sistema opera en tiempo
Como se puede observar se recibe como entrada una imagen, de la cual se obtienen
caracterı́sticas de color y movimiento que por un lado se combinan para darse como en-
trada a una red neuronal, y por otro se toman como un objeto que se da como entrada a
una cámara virtual que continúa con el proceso de rastreo. Los resultados del sistema se
espacio RG considerando que el color caracterı́stico de la piel contiene escasa o nula infor-
La aportación que se toma del trabajo de H. Martin Hunke se relaciona con la posi-
por el hecho de que la información del canal que no se considera en el análisis, no es im-
portante.
Figura 4.16: Localización de un rostro. a). Imagen original b). Imágenes en secuencia
c). Diferencia de las dos imágenes d). Conjunto de pixeles con caracterı́sticas de movi-
miento e). Aplicación del clasificador general de color de rostros –GFCC– f). Conjunto de
pixeles con caracterı́sticas de color de piel g). Objetos con caracterı́sticas de movimiento
y color de piel h). Objetos más grandes i). Rostro localizado.
Figura 4.17: Creación del clasificador de color de rostros. a). Primero se escoge
un área de interés en la imagen b). Se crea un modelo de distribución de color para el
área seleccionada c). Se umbraliza como pixeles de piel aquellos que posean valores que se
encuentren dentro de la media promedio.
4.7 Localización de rostros humanos en Tiempo Real 65
El trabajo de Jie Yang y Alex Waibel [Yang and Waibel, 1995] incluye un modelo es-
tocástico6 para caracterizar los colores de la piel en rostros humanos, similar al utilizado por
[Hunke, 1994]. Los resultados de la segmentación realizada por [Yang and Waibel, 1995] se
detectar un rostro humano en varias poses y vistas. Además puede ser adaptado en tiempo
Para la detección de los rostros se utilizan tres tipos de modelos, uno para modelar el
ventana, y un tercer modelo para la cámara, que se ocupa de predecir y compensar los mo-
con un servidor basado en socket. La Figura 4.19 presenta un ejemplo del funcionamiento
por Hunke y la posibilidad de combinar caracterı́sticas para lograr una mejor clasificación
o toma de decisiones se tomó del trabajo de Jie Yang y Alex Waibel, pues finalmente se
demuestra que al tener una descripción más completa de los objetos o situaciones que son
En la tabla 4.1 se resumen las ideas principales que se consideraron y dieron forma a
Por otro lado, es importante referir algunos trabajos que también fueron útiles en el
6
Que esta determinado por el azar. Las leyes de causa-efecto no explican cómo actúa el sistema de
manera determinista, sino en función de probabilidades [Wikipedia Foundation, 2006].
66 4 ESTADO DEL ARTE
Segmentación de
Dorin Imágenes de linfomas malignos,
imagen celular movimiento de la
Comaniciu y células leucemia linfocı́tica
para diagnóstico media
Peter Meer sanguı́neas crónica
patológico
linfocitos,
bayes, redes
Neelam Sinha y Automatización de Imágenes de monocitos,
neuronales.
A. G. recuento diferencial células neutrófilos,
Reconocimiento:
Ramakrishnan de la sangre sanguı́neas básofilos,
97 %
eosinófilos
piel humana de
Filipe Tomaz, Detección Imágenes de
raza asiática, distancia de
Tiago Candeias automática de piel escenas que
causásica, africana Mahalanobis y
y Hamid en imágenes en contienen piel
o descendiente de filtro de mediana
Shahbazkia color humana
éstas
Análisis de imagen
y aprendizaje Filtro de canny,
supervisado en la Tipo célula: bayes, zero, ID3,
Imágenes de
diferenciación neutrófilo, basófilo, C4.5, redes
R. J. Katz células blancas
automática de eosinófilo, linfocito, neuronales.
de la sangre
células blancas de monocito Reconocimiento:
imágenes 95.2 %
microscópicas
Localización y
Imágenes de Redes neuronales.
H. Martin rastreo de rostros
contienen piel piel humana Reconocimiento:
Hunke humanos con redes
humana 95.2 %
neuronales
Segmentación en
color con modelo
Clasificación de leucocitos
de Mahalanobis y
Marı́a del Rocı́o leucocitos Imágenes de segmentados,
red neuronal de
Ochoa Montiel utilizando visión frotis sanguı́neo leucocitos no
retropropagación.
por computadora segmentados
Reconocimiento:
99.54 %
llon [Terrillon et al., 1998], quien utiliza un modelo de color de piel basado en la métrica de
distinguir los rostros de otros distractores se utiliza una red neuronal multicapa entrenada
con el algoritmo de retropropagación, la cual recibe como vector entrada a los momentos
invariantes que se obtienen de la región segmentada como piel. Sus resultados demuestran
complejos.
Un método propuesto por [Pérez and Hague, 2002] para un sistema de razonamiento
basado en lógica difusa es capaz de elegir dinámicamente el mejor umbral para binarizar
una imagen en niveles de gris. Los resultados se prueban sobre un amplio conjunto de se-
cuencias en tiempo real de imágenes de un campo de coliflores, donde uno de los objetivos
se utiliza para el cálculo de probabilidades que se utilizan como métrica para caracterizar
la organización espacial de los niveles de gris. Los resultados experimentales muestran que
que no sea necesario que el ginecólogo colposcopista trace a mano esas regiones. El detec-
tar esas imágenes elementales permite eliminar subjetividades como localización, tamaño,
distancia, color y forma. Además resulta útil encontrar un parámetro que permita recono-
cer una patologı́a dada. El análisis de imágenes se hace con una técnica de segmentación
que trabaja sobre el espacio de representación de color, utilizando PCA para hacer una
transformación lineal que permite modelar un espacio de color exclusivo para imágenes
colsposcópicas.
Finalmente Ivón Arroyo y Agustı́n Schapira [Schapira and Arroyo, 1994] en su conta-
dor de células utilizan una técnica que permite realizar la identificación y conteo célular de
2 maneras. La primera consiste en seleccionar los objetos de interés a partir de los umbrales
de color mı́nimo y máximo que se desean en las células. La segunda forma de realizar la
identificación y conteo, se relaciona con las medidas reales que se requieren para aislar a
las células que cumplan con los parámetros dados por el usuario, las medidas se dan en
sistema también permite seleccionar con el mouse una célula de interés para buscar a otras
células que cumplan con dichas caracterı́sticas de tamaño y color. El análisis de la imagen
7
Sustancia compleja constituida por ácidos nucleicos y proteı́nas, que se encuentra en el núcleo de las
células y se tiñe por los colorantes básicos de anilina.
Capı́tulo 5
Clasificación de leucocitos
mientras que en la segunda sección se describen los módulos que componen la metodologı́a
Segmentadas y No Segmentadas
basan en aplicar un procedimiento a una imagen que contiene una célula de interés, el cual
consiste en:
Extraer la región de interés, es decir la región que constituye al núcleo celular dado
neuronales.
Segmentación en color.
Extracción de caracterı́sticas.
Entrenamiento de la red.
En la Figura 5.1 se muestra la organización general del método propuesto para clasificar
leucocitos. Los bloques a) y b) que aparecen con lı́neas punteadas representan dos casos
que se realizan en distintas ocasiones. Esto significa que se consideran tres métodos para
terı́sticas.
una célula de interés. En la sección 5.3.1 se presenta una descripción completa de esta
[Tomaz et al., 2003], que se ha adecuado para obtener la región de interés. El procedimien-
el método descrito en la sección 5.3.3. En la sección 5.3.4 se describe con más detalle el
Como se ha visto en secciones anteriores, las acciones que se realizan en cada etapa
Considerando las descripciones de los bloques que componen la solución del problema,
tesis se realizó por un experto clı́nico empleando el método Tinción de Giemsa y Azul de
metileno descrito en la sección 3.1.2, el cual permite diferenciar a los componentes celulares
por el tinte que adquieren con dichos colorantes. En la Figura 5.2 se muestra un bosquejo
imagen.
El microscopio óptico que se utilizó para las observaciones tiene 3 objetivos que poseen
diferentes grados de aumento 10x, 40x y 100x, estos números corresponden a la escala en la
que se observan los objetos a través del ocular. Para distinguir adecuadamente las imágenes
La cámara utilizada para digitalizar las imágenes es una Moticam 350 diseñada espe-
más exterior del ocular del microscopio y colocar la cámara ensamblada con los accesorios
adecuados en lugar de éste, sujetándola con tornillos de presión. En la Figura 5.3 se mues-
Para enfocar la imagen se mueven manualmente las perillas de los micrómetros del
microscopio hasta tener una visión clara de la imagen en el monitor. No obstante, existen
Al observar las muestras biológicas, se logra distinguir claramente el núcleo que se ca-
racteriza por tener un color morado en contraste con colores claros del citoplasma, y aún
basado en color. Para evitar el excesivo costo de procesamiento computacional, cada ob-
Los núcleos celulares constituyen los elementos más importantes en las observaciones
realizadas debido a su color que los diferencı́a del resto de los elemenos en la escena.
Además, la forma que presenta cada núcleo determina la clase a la que pertenece la célula.
La segmentación realizada utiliza un algoritmo propuesto por [Tomaz et al., 2003], que
se adecuó en esta tesis para separar núcleos celulares. En cada observación el núcleo puede
que ocupa el núcleo es más pequeña que el resto de la escena. Se aplica un filtro inicial
que elimina gran parte de los pixeles que no pertenecen al núcleo. Este filtro inicial se
Como se puede ver, los valores para cada pixel que corresponden al canal G son pe-
queños. En los casos en los que la imagen es muy clara o muy obscura debido a los cambios
experimentos subsecuentes.
Considerando una muestra M de tamaño n, cada observación que compone a esta mues-
100
Pixeles
50
0
0 50 100 150 200 250 300
3000
Canal G
2000
1000
0 Pixeles
0 50 100 150 200 250 300
300
Canal B
200
100
Pixeles
0
0 50 100 150 200 250 300
valores desde 0 para la posición Hk1 hasta 255 para la posición Hk256 . Con la información
V mini = i
} Si d1 < d2 ( existe un pico mı́nimo)
V maxi = 0
V mini = 0
} Si d1 > d2 ( existe un pico máximo) (5.2)
V maxi = i
V mini = 0
} Si d1 = d2 ( pues no existen picos mı́nimos ni máximos)
V maxi = 0
V mini y V maxi son vectores que contienen los ı́ndices del histograma Hk , en los cuales
De esta manera son definidos umbralinf = min(V max) y umbralsup = max(V min). Se
calcula finalmente umbralinf y umbralsup de las n observaciones para obtener los umbrales
78 5 CLASIFICACIÓN DE LEUCOCITOS
a). Célula segmentada original b). Célula segmentada después de aplicar el filtro inicial
ES NUCLEO
al espacio de crominancia TSL, debido a que en este espacio la información del color se
el espacio TSL aún cuando las condiciones de iluminación varı́an, siendo efectivo cuando
cada pixel en el espacio TSL, el canal L(iluminación) no se utiliza, por lo que no se muestra
la ecuación equivalente.
0
tan−1 ( gr 0 )
s
+ 0.5, g 0 6= 0
π
9
S= y T = (5.3)
5(r + g 0 2 )
02
0, g0 = 0
5.3 Método de clasificación de leucocitos 79
donde
0 R 0 G
r = − 1/3 y g = − 1/3 (5.4)
R+G+B R+G+B
Para representar el color del núcleo, se define una matriz de covarianza CT S , que indica
la relación de los valores para los canales T y S de la imagen. Para construir la matriz de
observación, es decir
l
Ti,j → Tkl y l
Si,j → Skl (5.5)
donde,
k = 642 (l − 1) + 64(i − 1) + j
l = 1...354
(5.6)
i = 1...64
j = 1...64
observaciones.
· ¸T
Vm = Mt Ms (5.7)
σ2 T σT S
CT S = (5.8)
σT S σ 2 S
80 5 CLASIFICACIÓN DE LEUCOCITOS
donde,
Pl
σ2T = i=1 (Ti − Mt )2
Pl
σ2S = i=1 (Si − Ms )2 (5.9)
Pl
σT S = i=1 (Ti − Mt )(Si − Ms )
La distancia |λ2i,j | del pixel(i,j) al vector Vm se define utilizando como métrica la dis-
donde, Xi,j = pixeli,j de la imagen obtenida después de haber aplicado el filtro inicial.
Las barras verticales en |λ2i,j | indican que se trata de un valor positivo, pues como se
Umbralización. Antes de hacer una umbralización binaria con |λ2i,j |, ésta se normaliza
λ2i,j
disM = 1 − (5.11)
cons
donde, cons = 9.
umbraliza la región que se obtuvo al aplicar el filtro inicial, considerando como parte del
núcleo a los pixeles cuyo valor es mayor a 0.7. Los resultados de esta primera umbralización
se pueden ver en la Figura 5.10, en la que aún pueden distinguirse algunos pixeles que no
Finalmente, para eliminar los pixeles aislados que aparecen en la imagen, se aplica un
morfologı́a nuclear. Como parte de la solución dada, se comienza por digitalizar un campo
sección anterior.
Una vez concluı́da la segmentación del núcleo, el siguiente paso consiste en la extración
el capı́tulo 3, donde se señala que las Redes neuronales reciben como entrada vectores de
caracterı́sticas que describen los ejemplos de entrenamiento y son una herramienta útil en
la clasificación de patrones. En este trabajo de tesis se utilizan las redes neuronales como
la técnica para clasificar a las regiones etiquetadas como núcleo, y catalogarlas dentro de la
describir su forma. En esta sección se muestra el procedimiento para obtener los vectores
de caracterı́sticas que se dan como entrada a la red neuronal. La Figura 5.11 muestra
caracterı́sticas.
segmentada que se obtuvo en la etapa anterior, en la cual puede existir más de una región
82 5 CLASIFICACIÓN DE LEUCOCITOS
cada imagen.
Con el número de regiones y el área de cada región es posible tener una aproximación
de la clase a la que puede pertenecer la célula, pues una imagen que contenga más de
una región de tamaño similiar es muy probable que corresponda a una célula de la clase
de la clase No Segmentada, cuyo núcleo es casi redondo y no está dividido. Sin embargo,
esta aproximación no es suficiente para ubicar a todas las células en la clase a la que
pertenecen, pues gran parte de las imágenes están formadas por sólo una región.
Las caracterı́sticas que se enlistan en la tabla 5.1 se calculan para las n observaciones.
La descripción de algunas de ellas se encuentra en la sección 3.4, por lo que en esta tabla
sólo se describen aquellas que fueron deducidas a partir de las caracterı́sticas estructurales
Segmentados.
NÚMERO CARACTERÍSTICA
1 Número de regiones que contiene la imagen
2 Excentricidad
3 Solidez
4 Rectangularidad (Extent)
5 Longitud de Eje mayor
6 Longitud de Eje menor
7 Número de Euler
8 Orientación
9 Diámetro equivalente
10 Área del bounding box
Relación de ejes. Calculado como
11
Longitud de eje mayor/Longitud de eje menor
Diferencia de áreas. Calculado como
12
Área del Convex Hull − Área de la región
Varianza de los radios. Es la varianza de las distancias
13 euclidianas del centro de masa de la región a cada punto
que forma su perı́metro.
NÚMERO CARACTERÍSTICA
1 Área de la región
Elongación (razón de aspecto). Es la cuadratura del B. box.
2
Calculado como Longitud de la base/Longitud de la altura
3 Longitud de Eje mayor
4 Longitud de Eje menor
5 Relación de Ejes
6 Excentricidad
7 Orientación
8 Área del bounding box
Área vacı́a. Calculada como
9
Area del B.Box − Area de la región
10 Área del Convex Hull
11 Número de Euler
12 Diámetro equivalente
13 Solidez
14 Rectangularidad
15 Diferencia de Áreas
16 Número de regiones
17 Varianza de los radios
de caracterı́sticas estructurales.
en la cual sólo se definen las caracterı́sticas que no han sido consideradas en tablas de
caracterı́sticas ya mostradas.
cada clase y se almacenan dichos valores en un vector, de tal manera que para cada carac-
terı́stica se obtienen 2 vectores (uno para cada clase). Posteriormente se calcula la varianza
de cada vector caracterı́stico para ambas clases, con estos valores se obtiene una diferencia
tes descrito. Como se puede observar, para cada caracterı́stica se muestran 3 columnas:
consideradas.
para la selección de las caracterı́sticas fue descartar a aquellos renglones cuya diferencia
entre ambas clases (tercera columna) sea mayor a 0.0001, considerando una precisión de
4 dı́gitos en la parte decimal debido a que los valores obtenidos para estas diferencias son
se elige la caracterı́stica
en caso contrario
se descarta la caracterı́stica
NÚMERO CARACTERÍSTICA
1 Área de la región
2 Longitud de Eje mayor
3 Longitud de Eje menor
4 Orientación
5 Área del Bounding box
6 Área del Convex Hull
7 Diámetro equivalente
8 Diferencia de áreas
Las caracterı́sticas radiales deben su nombre a que se derivan de la medida del centro de
Distancia radial, DR.- Distancia euclidiana del centro de masa a algún punto que forma
el perı́metro de la región.
de una región.
caracterı́sticas radiales de longitud variable, dado que dicha longitud depende de la cantidad
de puntos que forma el perı́metro de la región. En caso de recibir como entrada una imagen
que contenga más de una región, se considera sólo la región que tiene la mayor área, para
Sin embargo, la red neuronal recibe como entrada una matriz de caracterı́sticas que
Para solucionar este problema, se propone un método para escalar los vectores sin
caracterı́sticas aquel que tenga la menor longitud Lmin , este valor es usado para escalar
todos los vectores cuya longitud es mayor a Lmin . A continuación se presentan dos métodos
radiales. En los párrafos siguientes se describen con detalle las técnicas de escalamiento
Escalamiento Aleatorio
segundo vector V 0 . Dado que cada vector V 0 es de la misma longitud, se construye la tabla
88 5 CLASIFICACIÓN DE LEUCOCITOS
de caracterı́sticas al colococar a los vectores V10 , V20 , V30 , ...Vn0 como renglones de dicha tabla.
mogéneo, pues cada vez se eligen diferentes puntos para formar el vector de caracterı́sticas
radiales.
Para obtener una selección homogenea de los elementos que forman el vector de carac-
k Vj k
Vi0 = b ∗ ic (5.12)
Lmin
donde,
i = 1..Lmin
j = 1..n
Figura 5.15: Izquierda. Perı́metro de un núcleo. Centro. Puntos escogidos para for-
mar V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0 en el
escalamiento lineal.
Figura 5.14, en la que cada reglón está constituı́do por los vectores V10 , V20 , V30 , ...Vn0 . En la
Figura 5.15 se muestra el perı́metro de una región y las imágenes obtenidas al realizar un
5.17 en la parte superior representa el perı́metro mostrado en 5.16 en el dominio del tiem-
po, mientras que en la parte inferior se muestra la magnitud de dicho perı́metro después
de aplicar la FFT.
de rotación y escala. Estas propiedades son: multiplicación por una constante y el cambio
En el dominio del tiempo, rotar una función significa desplazarla; mientras que el es-
90 5 CLASIFICACIÓN DE LEUCOCITOS
Dada una función de tiempo f (t), la Transformada Rápida de Fourier esta dada por:
se tiene:
La constante A es el factor escala que afecta la función f (t), siempre que una imagen es
rotación. Sin embargo si alguna imagen es rotada en el dominio del tiempo, resulta en un
cambio de la función f (t) por un tiempo t0 . La función f (t) se convierte en f (t−t0 ) cuando
de ellos para formar un nuevo vector de caracterı́sticas Di . Con este nuevo conjunto de
definidas por el usuario. En este caso las clases son Segmentados y No Segmentados.
El tipo de aprendizaje por retropropagación debe su nombre a que los pesos de las neu-
que existe, y al final en la primera capa oculta, es decir en la primera capa que recibe la
capa más interna tiene menos neuronas que las capas externas ya que por experimentación
92 5 CLASIFICACIÓN DE LEUCOCITOS
cas mostrado en las tablas de las Figuras 5.12 y 5.18. En cada caso la red neuronal tiene
las tablas mostradas en las figuras correspondientes. Los vectores de clases son paráme-
neuronas de salida que corresponden a las clases que la red es capaz de reconocer. Para
explicar la manera en que la red neuronal recibe los datos, suponga que la matriz E es la
e1,1 e1,2 ..... e1,n
e2,1 e2,2 ..... e2,n
· ¸
E=
. . ..... . C =
1 2 . . 2 (5.19)
. . ..... .
em,1 em,2 ..... em,n
da E representa las caracterı́sticas extraı́das (en forma de vector) para una observación de
5.3 Método de clasificación de leucocitos 93
Mce y se considera igual número de observaciones para ambas clases. Como son dos clases
que la red neuronal reconoce, el vector de clases CM contiene los números 1 y 2 de manera
1 1 1 . . . . . 1
0.853 0.789 0.481 . . . . . 0.899
0.863 0.786 0.762 . . . . . 0.867
0.594 0.777 0.526 . . . . . 0.877
48.63 47.89 40.44 . . . . . 45.78
25.32 51.56 35.47 . . . . . 49.81
Mce = 1 1 1 . . . . . 1 (5.20)
24.69 45.89 105.8 . . . . . 48.99
33.53 56.78 33.14 . . . . . 51.78
1.363 1.567 0.928 . . . . . 1.678
1.921 1.987 1.141 . . . . . 1.874
140 134 269 . . . . . 123
24.25 10.23 30.55 . . . . . 12.78
· ¸
CM = 1 2 . . 2 (5.21)
Cabe decir que el 10 % de las n observaciones se utilizan para probar la red y con el
resto se entrena. Cada vez que se prueban los datos se eligen aleatoriamente para tomar
una muestra diferente cada vez. Los datos de prueba y de entrenamiento se organizan en
matrices como se indica en la ecuación 5.19, de esta forma quedan definidas una matriz de
Después de aplicar PCA a las matrices de entrenamiento que se forman a partir de las
salida obtenida de la red neuronal. Los resultados se contabilizan utilizando una matriz de
fiabilidad se realiza con la técnica de Ten Fold Cross Validation –Validación cruzada en
y el 10 % para probar. Este procedimiento se repite 10 veces y en cada vez se rotan los
datos para analizar diferentes conjuntos en cada caso. Como resultado de cada prueba se
2
Una matriz de confusion indica en su posicion (i, j) el numero de muestras de la clase j asignadas
por el clasificador a la clase i. Esta estructura permite averiguar los pares declases entre los que son mas
frecuentes los errores del clasificador.
Capı́tulo 6
propuesta en la sección 2.4. Considerando una medida de similitud para el desarrollo del
segmentación.
partes. Mostrándose que las caracterı́sticas estructurales, no son los atributos que descri-
Finalmente se realiza un análisis comparativo sobre los resultados obtenidos con cada
6.1. Pruebas
En principio se recolectan los frotis sanguı́neos que son analizados por un experto clı́ni-
co para obtener las observaciones utilizadas en esta tesis. El primer paso para obtener
talogados como normales. Se toman en cuenta este tipo de pacientes con la finalidad de
en células normales.
Las muestras biológicas (frotis sanguı́neos teñidos para Recuento Diferencial) fueron
Mexicano del Seguro Social de Tlaxcala. En la Figura 6.1 se presentan las acciones in-
elección del paciente, hasta la toma de la muestra y la preparación del frotis realizada por
la sección 3.1.2.
A pesar de que la cantidad de frotis recolectados con esta técnica fue de más de 100,
se utilizaron 85 para la adquisición de las imágenes dado que por cada muestra se hace un
recorrido obteniendo diferentes imágenes, de tal manera que por cada frotis se digitalizan
de la célula.
Para digitalizar las imágenes primero se montó la cámara al microscopio, como se ob-
serva en la Figura 5.3. Para enfocar un campo en el microscopio se colocó una gota de
aceite de inmersión sobre el frotis sanguı́neo, que después es colocado sobre la base del
1
Laboratorio clı́nico particular ubicado en la Cd. de Apizaco, Tlax.
2
Q.F.B. Gonzalo Romero Tirso.
6.1 Pruebas 97
portaobjetos acercándolo de tal manera que exista contacto fı́sico con el objetivo 100X del
Para la adquisición de las imágenes se trabajó con el objetivo 100X dado que se distin-
guen mejor las caracterı́sticas de la célula, en la Figura 6.3 se puede apreciar la diferencia
al enfocar un campo visto con el objetivo 40X y otro al cambiar al objetivo 100X.
Segmentados. Cada clase tiene subtipos, sin embargo la forma de su núcleo es represen-
tativa de cada una. Las células que pertenecen a la clase Segmentados se caracterizan
por tener un núcleo deforme, mientras que las células de la clase No Segmentados pre-
sentan un núcleo de forma redondeada. En la Figura 6.4, se muestran los subtipos básicos
interés como se aprecia en la parte derecha de la Figura 6.3; de este campo se recorta
manualmente el área que encierra a la célula de interés, con lo cual se obtienen imágenes
como las que aparecen en la Figura 6.4, de este modo se adquieren 354 observaciones que
Es importante hacer notar que el tipo de célula llamado basófilo no se incluye en las
98 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
observaciones porque es un tipo poco común y difı́cil de identificar, además de los pocos
basófilos que fueron identificados por el experto clı́nico la mayorı́a presentaron deforma-
ciones o estaban parcialmente destruı́dos; sin embargo se puede observar uno de ellos en
la parte superior derecha de la Figura 6.4. Por otra parte, debido a que en el modelo
servación se recorta manualmente parte del núcleo correspondiente adquiriendo con esto
el núcleo de la imagen. Debido a que los tonos morados que presentan los núcleos permiten
diferenciar claramente a cada uno, se adecuó el modelo propuesto por [Tomaz et al., 2003]
6.1 Pruebas 99
en el espacio de color RGB pertenecientes los recortes de núcleo. Los histogramas de los
muestran en la Figura 6.7, donde se aprecia que la cantidad de color verde es pequeña en
relación al rojo y al azul. Debido a que los histogramas obtenidos para cada canal presen-
tan una curva caracterı́stica, se utilizan 5.1 y 5.2 para determinar los puntos donde dicha
curva comienza y termina de crecer. Con los umbrales obtenidos de esta manera umbralinf
y umbralsup se eliminan la mayor parte de los pixeles que no pertenecen al núcleo. Los
El filtro inicial aplicado a las imágenes más claras produce resultados como los que se
muestran en la Figura 6.9, mientras que al aplicarse a imágenes obscuras se obtienen los
claro u obscuro que éstas sean. Los resultados de éstas pruebas se muestran en la Figura
do, cuando se aplica sobre este tipo el filtro se obtienen los resultados que aparecen en la
Figura 6.12.
muestran los resultados conseguidos durante el diseño y uso del segundo filtro, que como
100 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
Pixeles
200 2000
100
100 1000
0 0 0
0 100 200 0 100 200 0 100 200
100 200
2000
Pixeles
50 1000 100
0 0 0
0 100 200 0 100 200 0 100 200
200
300 3000
Pixeles
200 2000
100
100 1000
0 0 0
0 100 200 0 100 200 0 100 200
3000
300 200
Pixeles
200 2000
1000 100
100
0 0 0
0 100 200 0 100 200 0 100 200
se dijo en la sección 6.1.2, es creado a partir del análisis de color de recortes pertenecientes
a los 354 núcleos celulares. También es importante mencionar que para analizar las pro-
piedades de color en éstos recortes se requiere una conversión previa del espacio de color
RGB al espacio TSL, y posterior a ésta transformación se utiliza sólo la información de los
utilizando 5.7.
6.1 Pruebas 101
Figura 6.8: Resultados del filtro inicial. a).- Célula Segmentada Eosinófila. b).-
Célula Segmentada Neutrófila. c).- Célula No Segmentada linfocı́tica. d).- Célula No
Segmentada Monocı́tica
Figura 6.9: Resultados del filtro inicial aplicado a imágenes muy claras. a).-
Célula No Segmentada Monocı́tica. b).- Célula Segmentada Neutrófila. c) y d) Células
Segmentadas eosinófila.
102 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
Figura 6.10: Resultados del filtro inicial aplicado a imágenes obscuras. La célula
que esta en la parte superior izquierda es un neutrófilo y las demás son eosinófilos, ambas
pertenecientes a la clase segmentados.
Figura 6.11: Resultados del filtro inicial aplicado a imágenes de células semi-
destruidas. En este caso la claridad no se considera.
6.1 Pruebas 103
Figura 6.12: Resultados del filtro inicial aplicado a imágenes de células con el
núcleo muy dividido. En este caso la claridad no se considera.
· ¸
VT = 0.3371 0.3371 0.3371 0.3375 0.3382 0.3382 0.3430 0.3477 ... 0.3481
· ¸
VS = 3.6535 3.6535 3.6535 3.6522 3.5163 3.5163 3.5452 3.5731 ... 3.5750
anteriores son:
0.0001 −0.0214
Cs = (6.1)
−0.0214 5.8557
· ¸T
Vm = 0.0922 22.8193 (6.2)
Para medir la similitud entre 2 pixeles,uno que pertenece a la imagen que recibe el filtro
y otro que forma parte de un recorte de núcleo y definir un umbral que clasifique al primero
de ellos como núcleo se utiliza la métrica de la Distancia de Mahalanobis |λ2i,j | definida por
la ecuación 5.10. Esta métrica es útil debido a que toma en cuenta la correlación entre las
la Figura 6.15 se muestra la correlación que existe entre los vectores Tono T y Saturación
S.
De ésta manera |λ2i,j | esta definida como una matriz que contiene las medidas de
similitud de cada pixel pixel(i,j) de la imagen a filtrar al vector de medias Vm . Para definir el
umbral primero se normaliza el valor de |λ2i,j | utilizando 5.11. Después de esta normalización
se define el umbral para decidir si el pixel(i,j) forma parte del núcleo, es decir,
El valor de 0.7 se obtuvo por experimentación considerando que una distancia de 1.0
Para eliminar los pixeles que aun permanecen de forma aislada en la imagen, se aplica
6.1 Pruebas 105
20 20 20 20
40 40 40 40
60 60 60 60
20 40 60 20 40 60 20 40 60 20 40 60
eligió después de probar con otros tamaños y observar que este tamaño elimina la mayor
célula no segmentada.
El análisis que se realizó a la imagen en la sección 6.1.2, permitió extraer la región que
da en la sección anterior, sin embargo en algunos casos aun después de aplicar los filtros
señalados se obtienen imágenes que contienen más de una región etiquetada como núcleo.
En estos casos, la región que se considera para extraer las caracterı́sticas es la que presenta
terı́sticas estructurales, estructurales con análisis de varianza y radiales fue de 220; 110
para cada tipo de célula, esto es debido a que se cuenta con 232 ejemplares de la clase
Segmentados, casi el doble que para las células del tipo No segmentados cuyo número
es de 122.
trata del uso de un conjunto distinto de caracterı́sticas para describir la forma de la región
con las caracterı́sticas radiales, siendo éstas últimas mucho más en número que las estruc-
turales.
que se muestran en la Figura 5.12, entre las que se encuentran: número de regiones, eccen-
tricidad, solidez, extremos de la imagen, longitud del eje mayor, longitud del eje menor,
número de Euler, orientación, diámetro equivalente, área del bounding box, relación de ejes,
en la Figura 6.17, donde el acomodo de las caracterı́sticas para cada clase se realiza de
experimento.
atributos3 con los que se construye una nueva matriz de caracterı́sticas estructurales.
El segundo experimento esta encaminado hacia el uso de lo que en este trabajo se han
5.3.3. Este conjunto de 8 caracterı́sticas se muestran en la tabla 5.4 e incluye las siguien-
tes: área de la región, longitud de eje mayor, longitud de eje menor, orientación, área de
Bounding Box, área del Convex Hull, diámetro equivalente y diferencia de áreas. Con éstas
cipales).
3
en realidad se trata de 8 componentes principales, ya que PCA al reducir no permite conocer cuáles
fueron las caracterı́sticas seleccionadas.
108 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
que para construir la matriz de caracterı́sticas es necesario tener igual número de atributos
para las 354 observaciones. El problema en el caso de las caracterı́sticas radiales, es que
existen un número distinto de caracterı́sticas para cada observación, por lo cual se utilizan
de caracterı́sticas radiales.
Del mismo modo que en experimentos anteriores, se aplica PCA a las matrices de
prueba permite evaluar también a cada conjunto de caracterı́sticas radiales, generadas con
la forma de las región nuclear. Sin embargo este no es el caso, como se comenta en las
secciones siguientes.
6.1 Pruebas 109
ferencia, las cuales se muestran en la Figura 6.20, obteniendo un mejor desempeño con
terı́sticas utilizadas para esta prueba, corresponde a las caracterı́sticas estructurales con
De las 354 observaciones que se obtuvieron, se utiliza igual número de cada clase para
la experimentación, en este caso 110 de cada tipo, dejando el resto para pruebas adicio-
nales. Cabe hacer notar que las pruebas suplementarias se realizan con diferente número
de muestras para cada clase, ya que no se cuenta con igual número de muestras para cada
entrenamiento. Las muestras utilizadas para pruebas adicionales son 134, de las cuales 122
De las 110 observaciones obtenidas para cada clase, la red neuronal se entrena con 9/10,
110 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
es decir con 99 observaciones de cada tipo. En la Figura 6.21 se muestra la distribución del
número de observaciones que se utilizan en cada caso. Como se puede observar, se cuenta
232 observaciones para la clase de células Segmentadas, casi el doble que de células No
segmentadas. Esto se debe a que para la clase No segmentadas, se consideran dos sub-
del total de las células que forman la sangre (ver Figura 3.3, sección 3.1.1). La Figura 6.22
indica la cantidad de cada subtipo de leucocito utilizada para cada clase de célula.
las columnas, de tal forma que tanto los datos de entrenamiento como los de prueba no
6.1 Pruebas 111
posean caracterı́sticas particulares que pudieran influir en los resultados. Además, para
validar el desempeño de la red se utilizó la técnica de Ten Fold Cross Validation –TFCV–,
tomando 10 % de las 110 observaciones de cada clase para prueba y el 90 % restante para
entrenamiento.
triz de caracterı́sticas es de 13x99, mientras que para las pruebas se utiliza una matriz de
13x11, es decir 99 datos para entrenamiento y 11 para prueba. Cuando se aplica reducción
con PCA se obtienen 8 componentes principales, con los cuales se entrena a la red.
Las pruebas adicionales realizadas como parte de este primer experimento se realizan
neuronal y 76.11 % cuando no se aplica. Nótese que estos datos son totalmente distintos a
de 8x11.
De igual forma que en el primer experimento, se prueba también con otro conjunto
de caracterı́sticas que se obtienen al reducir con PCA; en este caso la reducción genera
4 componentes principales. Sin embargo, en este caso los resultados no mejoran como se
Por otro lado, las pruebas realizadas con los 134 ejemplares separados en un principio
112 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
triz de caracterı́sticas de 111x99, dejando para prueba una matriz de 111x11 datos. En un
primer caso, se entrena con las caracterı́sticas que se obtuvieron al hacer un escalamiento
aleatorio, mientras que en otro caso se entrena con las caracterı́sticas generadas al realizar
Las pruebas adicionales realizadas como parte de este tercer experimento para los 2
grupos de caracterı́sticas: las extraı́das con escalamiento aleatorio y las extraı́das con esca-
lamiento lineal, se realizan igualmente con 122 datos de la clase Segmentados y 12 datos
se aplica PCA antes de entrenar a la red neuronal y 100.00 % cuando no se aplica para
Los resultados que se obtienen después de los entrenamientos realizados en los 3 expe-
se utilizan como descriptores de forma a las caracterı́sticas radiales aplicando PCA antes
Figura 6.24.
promedio de 10 pruebas realizadas con la técnica TFCV para cada caso, además que la
6.2 Análisis de resultados 113
ERROR
0
10
−5
10
−10
10−1
0
1100 10
2
10
4
EPOCAS
tarios para cada fase del método usado para la identificación y clasificación de leucocitos.
dado que la calidad de las imágenes es buena para el análisis propuesto, pues en todas ellas
La técnica de segmentación utilizada es buena. Permitió extraer los núcleos celulares sin
de similitud, se logró calcular la diferencia del color del núcleo de un leucocito, respecto
experimentación. Por otro lado, con el uso de ésta métrica es posible considerar la correla-
ción que existe en los canales T y S, que se utilizaron para modelar el color caracterı́stico
Después de hacer un análisis visual de las imágenes se observó que la aplicación del filtro
114 6 PRUEBAS Y ANÁLISIS DE RESULTADOS
inicial se puede omitir, dado que al aplicar el filtro creado con el modelo de Mahalanobis
segmentado.
dos con los descriptores de Fourier haciendo un análisis visual de la simetrı́a en las gráficas
los datos que constituyen los descriptores de Fourier sin afectar los resultados de forma
significativa. Por este motivo los resultados obtenidos al aplicar PCA fueron muy similares
Los tipos de escalamiento utilizados para el ajuste del tamaño de los vectores que
almacenan los descriptores de Fourier resultaron igualmente útiles; por una parte el esca-
lamiento lineal permite elegir de manera más equivativa los pixeles que forman el nuevo
vector reducido, mientras que con el escalamiento aleatorio se eligen de manera distribuida
a dichos pixeles.
trabajar con un conjunto más pequeño de datos y además saber cuáles son las caracterı́sti-
cas más apropiadas para describir la forma del núcleo, lo cual no es posible cuando se usa
distinto al usado en este trabajo para comprobar la factibilidad de su uso, como método
de selección de caracterı́sticas.
hecho de que al reducir con PCA y obtener sólo 4 componentes principales, disminuye el
lo contrario, debido posiblemente a que 4 atributos son insuficientes para describir la forma
6.2 Análisis de resultados 115
de la región.
veracidad en los experimentos realizados y garantiza una clasificación adecuada con nuevos
conjuntos de muestras.
Finalmente, podemos decir que el método utilizado en esta investigación es muy útil
Conclusiones
El objetivo principal en este trabajo de tesis fue clasificar a dos tipos de células de
utilizada, es posible observar que no es sencillo emular la capacidad de visión que el hu-
Por otro lado, se puede notar que los componentes de un sistema de visión varı́an de
Considerando estos inconvenientes se optó por el uso de técnicas que atenuaran los
de color utilizando el espacio de color TSL propuesto por [Tomaz et al., 2003], obteniendo
buenos resultados.
Además, la segmentación es casi directa, sin ser estrictamente necesario eliminar pri-
mero los elementos del fondo en la imagen. Esto es una importante contribución para el
Como el objetivo principal fue clasificar a las células de acuerdo a su morfologı́a nuclear,
se optó por considerar caracterı́sticas que describieran lo mejor posible, la forma de dicha
cuencia un buen ı́ndice de reconocimiento; sin embargo al probar con otro conjunto mayor
tener una descripción más completa de la forma de la región al usar algunas propiedades
También vale la pena mencionar que los ı́ndices de reconocimiento en el caso de las
entrenar a la red neuronal. En este caso lo que se observa es que el número de épocas se re-
dujo notablemente cuando se preprocesan los datos con PCA, lo cual es de esperarse sobre
todo cuando se utilizan las caracterı́sticas radiales, dado que para obtenerlas se aplicó la
que hay en dicha gráfica, lo cual permite suponer que es posible tomar sólo la mitad de los
datos que se observan en dicha gráfica y considerar a este conjunto como caracterı́sticas
radiales.
Finalmente se comprobó una vez más que la red neuronal de retroprogación utilizada
Existe mucho trabajo que hacer con el tipo de observaciones que se manejan en este
1. Sustituir la forma empı́rica utilizada en el diseño del filtro inicial usado en la segmen-
2. Dado que cada célula identificada tiene más subtipos, al utilizar técnicas de segmenta-
ción basada en textura y color para aislar el citoplasma y extraer sus caracaterı́sticas,
7.2 Trabajo a Futuro 119
se puede tener una descripción más completa de la célula y esto puede ampliar el
3. Agregar un módulo que permita además de identificar, contar las células visualizadas
en la escena.
vo para las imágenes de frotis sanguı́neo utilizando la técnica descrita en [Guzmán, 2002].
lograr una mejor descripción de la región de interés, pues de acuerdo a [Carron, 1995]
8. Desarrollar una interfaz gráfica en la que se integran los módulos que componen este
trabajo de tesis.
9. Promover la aplicación GUI para fines educativos que trabajarı́a en tiempo real.
10. Utilizar la metodologı́a aplicada en este trabajo, como marco de referencia para el
[Ses, 1999] (1999). Guı́a de operación y mantenimiento básico Sistema K-1000. CIBA
tro. México.
[Mot, 2004] (2004). Manual de operación de Moticam 350. Micro-optic industrial group
[Abdallah et al., 1995] Abdallah, M. A., Samu, T. I., and Grissom, W. A. (1995). Auto-
[Acosta et al., ] Acosta, B. M., Zuluaga, M. C. A., and Salazar, I. H. Tutorial de redes
neuronales. http://ohm.utp.edu.co/neuronales.
[Awcock and R., 1996] Awcock, G. J. and R., T. (1996). Applied Image Processing.
coulter. http://www.beckmancoulter.com.
[Carron, 1995] Carron, T. (1995). Segmentation dı́mages coleur dans la base Treinte-
[Comaniciu, 2001] Comaniciu, D. (2001). Cell image segmentation for diagnostic patho-
logy. www.caip.rutgers.edu/riul/research/papers/ps/cells.ps.gz.
122 REFERENCIAS
y Métodos.
http://www.forobioquimico.com.ar.
http://nutriserver.com/cursos.
[González and Woods, 1996] González, R. C. and Woods, R. E. (1996). Tratamiento Di-
gital de imágenes.
[Goodrich and Tamassia, 2003] Goodrich, M. T. and Tamassia, R. (2003). Data etructures
cas.
[Hair et al., 2001] Hair, J. F., Rolph, A. E. J., and Tatham, R. L. (2001). Análisis multi-
variante.
[Hen and Hwang, 2002] Hen, H. Y. and Hwang, J.-N. (2002). Handbook of neural network
signal processing.
REFERENCIAS 123
[Hunke, 1994] Hunke, M. H. (1994). Locating and tracking of human faces with neural
networks.
[Katz, 2000] Katz, A. R. J. (2000). Image analysis and supervised learning in the automated
[Kohavi, 1995] Kohavi, R. (1995). A study of cross validation and bootstrap for accuracy
[Moore, 2001] Moore, A. W. (2001). Cross validation for detecting and preventing overfit-
ting. http://www-2.cs.cmu.edu/~awm/tutorials/overfit.html.
[Oppenheim, 1998] Oppenheim (1998). Manual para técnicos de laboratorio. México D.F.
[Pajares and de la Cruz, 2002] Pajares, G. and de la Cruz, J. M. (2002). Vision por compu-
[Pal and Pal, 1993] Pal, N. R. and Pal, S. K. (1993). A review on Image Segmentation
[Pérez and Hague, 2002] Pérez, L. G. and Hague, J. M. T. (2002). Dynamic threshold se-
lection for image segmentation of natural structures based upon a performance criterion.
[Sánchez, 2006] Sánchez, J. (2006). Revista creces. portal de tecnologı́a, ciencias y biologı́a.
http://www.tcb.cl.
[Schapira and Arroyo, 1994] Schapira, A. and Arroyo, I. (1994). Cells++. un contador de
células. http://www.ubp.edu.ar/investigacion/revista7/art6.html.
124 REFERENCIAS
[Terrillon and Akamatsu, 2000] Terrillon, J. and Akamatsu, S. (2000). Comparative per-
formance of different chrominance spaces for color segmentation and detection of human
[Terrillon et al., 1998] Terrillon, J., David, M., and Akamatsu, S. (1998). Automatic detec-
tion of human faces in natural scene images by use of a skin color model and of invariant
moments.
[Terrillon et al., 2000] Terrillon, J., Shirazi, M., Fukamachi, H., and Akamatsu, S. (2000).
[Tomaz et al., 2003] Tomaz, F., Candeias, T., and Shahbazkia, H. (2003). Improved auto-
[Ushizima et al., 2004] Ushizima, D., Da-Fontoura, L., Rizzatti, E., and Zago, M.-A.
http://www.nlm.nih.gov.
libre. http://es.wikipedia.org.
[Yang and Waibel, 1995] Yang, J. and Waibel, A. (1995). Tracking human faces in real
time.
Apéndice A
Espacios de color
El uso de color como descriptor para la segmentación de una imagen resulta importante
Tono.- sensación que indica si un área parece similar al rojo, amarillo, verde o azul, o a
visualizar cualquier color. A continuación se describen algunos espacios de color que son
el rojo, el verde y el azul (Red, Green, Blue). La manera de obtener un color especı́fico(X)
consiste en determinar qué cantidad de cada uno de ellos (R, G, B) se necesita para obte-
nerlo.
X =R+G+B (1.1)
Cuando una cámara capta una imagen en color, para cada pixel en color se tienen en
realidad tres, uno por cada componente (RGB), es decir, la longitud de onda de cada color
básico. El inconveniente de este modelo es que en sus tres valores mezcla la información
Luminosidad. El tinte se puede relacionar con la longitud de onda como parámetro, la lu-
minosidad habla de la energı́a del color y la saturación habla de la pureza del color, es decir
qué tan mezclado con el color blanco se encuentra dicho color. Este sistema fue propuesto
por Munsell [Pratt, 1978], como un modelo de la percepción humana del color y también
la Figura A.1 se muestra la organización del espacio de color propuesto por Munsell.
cromatismo (Saturation) y brillo (Intensity). Ası́, de dos fuentes de luz con el mismo
espectro, aquella que tenga mayor intensidad aparecerá más brillante. Aunque, dos objetos
de un color. Las transformaciones matemáticas que permiten el cambio del espacio RGB
A.3 Espacio HSI 129
Figura A.1: Diagrama esquemático de los 3 ejes del sistema de color Mun-
sell.Tomado de Hall, E.L. Computer Image Processing and Recognition. Academic Press,
New York. 1979
130 A ESPACIOS DE COLOR
min(R, G, B)
S =1− (1.3)
3
computacional.
que provoca que los valores obtenidos por el tono sean inestables.
El espacio de color XYZ evita los coeficientes negativos obtenidos en los modelos an-
teriores para algunas coloraciones de determinada longitud de onda; que es causa de una
dispositivo utilizado y generalmente se trabaja con valores normalizados entre cero y uno.
Este espacio constituye el llamado Diagrama Internacional XY, CIE o carta cromática xy.
Y una vez obtenidas las coordenadas XYZ se pueden construir diferentes espacios CIES,
A.5 Los espacios de color YIQ, YUV, YCbCr y YCC 131
como Luv y Lab en los que la información se descompone en tono, cromatismo e intensidad
del color.
Espacio Luv Este modelo se definió en 1976, con la finalidad de obtener más uniformidad
L define la luminancia, mientras que u y v definen la crominancia. CIE Luv es muy utilizado
[Bourgin, 1994] se pueden encontrar las ecuaciones para la transformación a este espacio
Está formado por Cı́an, Magenta, Amarillo y Negro. Se utiliza en la impresión y fo-
tografı́as, por lo que depende del dispositivo (impresora). Para obtener los equivalentes
respectivos, se resta de las componentes el color blanco en el caso de CMY, o el negro para
CMYK.
132 A ESPACIOS DE COLOR
Apéndice B
Galerı́a de imágenes
que pudieran ocasionar la presencia de formas anormales de células y de sus órganos inter-
También es posible apreciar los efectos provocados por los cambios de iluminación que
debido, a los ajustes que son necesarios para enfocar a la imagen y obtener una mejor
mientras que en el disco anexo al final de esta tesis, se encuentran los códigos adicionales
NOMBRE DESCRIPCIÓN
escalarIMG su función es escalar una imagen a un tamaño de 64x64 pixeles.
getfeatures obtiene caracterı́sticas de la región de interés
disMaha devuelve imagen filtrada con modelo de Mahalanobis
RGBtoTSL convierte imagen del espacio RGB al espacio TSL
unirfeatures construye los vectores de caracterı́sticas estructurales
filtroinicial aplica filtro inicial a la imagen recibida como entrada
getpromRGBmodif2006 determina lı́mites de crecimiento de histogramas en RGB
obtiene el número de puntos que forman el perı́metro de una
getNrad
región
muestrearRADIS realiza el escalamiento caracterı́sticas radiales
predatosNET2crossViguales entrena red neuronal con caracterı́sticas estructurales
entrena red neuronal con caracterı́sticas estructurales con
predatosNET2crossIguVAR2
análisis de varianza
FFTradis4mues entrena red neuronal con caracterı́sticas estructurales
Análisis, 6, 8, 12, 20, 25, 60, 68, 82, 95, 109, Microscopio, 2, 6, 12, 70, 72, 73, 81, 96
anatomı́a, 11 Núcleo, 75
fisiologı́a, 11
Patrón, 19, 22, 37, 42, 44
Citologı́a, 11
PCA, 25, 26, 29, 68, 94, 107, 108, 111, 112,
Citoplasma, 11, 12
114, 118
Color, 98, 127
Procesamiento
semi-automática, 26
Hematologı́a, 11
Técnicas, 26, 31, 59
Leucocitos, 5, 13, 69
agrupación, 118
Membrana, 7, 11 clasificación, 31
144 ÍNDICE ALFABÉTICO
empalmamiento, 119
escalamiento, 87
validación, 11, 50
visión, 3, 5, 6, 117