Sunteți pe pagina 1din 168

Capitulo 1: Adquisicin de

Imgenes

Introduccin
A diferencia de algunos animales el ser humano depende el
sentido de la vista para la recepcin de imgenes.
Expediciones a otros planetas y el estudio del fondo del mar
se realiza principalmente con cmaras.
El xito de dichas misiones se basa en la calidad de las
imgenes obtenidas.
Gracias a esto el ser humano ha ampliado su rango de visin.

Vidicon

El Vidicon es un tubo fotoconductor que fue creado para la televisin


industrial La configuracin de las capas depende del fabricante, pero lo ms
habitual es encontrarse con dos o tres capas. La ventaja de este tipo de
dispositivos es su alta resolucin, y la posibilidad de variar los voltajes
aplicado, variando sus caractersticas. Su gamma (Desviacin de color) es de
0.6, lo que lo hace idneo para fines mdicos.
Funciona mediante el escaneo del haz de electrones a travs del
recubrimiento de fosforo que se encuentra dentro de un tubo.
La luz entra a travs del vidrio frontal (y una pequea capa metlica de
nodo) y crea electrones libres en el fosforo..

Tubo Vidicon
La superficie fotosensible se rastrea lnea a lnea.
En cada punto por el que pasa el haz de electrones, el dispositivo es
excitado de forma proporcional a la intensidad luminosa.
Esto se traduce en una funcin continua de corriente que representa
la imagen seccionada en lneas.

Arreglo tpico de tubo Vidicon

CCD

El CCD (Coupled Charge Device) es un


dispositivo formado por miles, cuando no
millones, de pequeas unidades capaces de
acumular en forma de carga elctrica el
resultado de transformar en electrones los
fotones de la luz.

Un CCD es una malla muy empaquetada de


electrodos de silicio colocados sobre la
superficie de un chip. Al impactar los fotones
sobre el silicio se generan electrones
generados
que
pueden
guardarse
temporalmente. En estos dispositivos la
incidencia de luz provoca la mayor o menor
carga en voltaje de un condensador, lo que ya
realiza la conversin necesaria entre la luz y
la electricidad que necesitamos. Luego se
transfiere esta diferencia de potencial
(voltaje) a un transistor para hacerla
disponible al resto de la circuitera.

Arreglo tpico de un CDD

El funcionamiento de un detector CCD

Cada pxel de la matriz CCD corresponde a un elemento


semiconductor dentro de un condensador elctrico.
Un fotn incidente crea un fotoelectrn cuando da a un electrn del
semiconductor la energa necesaria para pasar el umbral energtico
(gap).
Los fotoelectrones son guardados en el pozo de potencial (que no es
ms que un pxel correctamente polarizado).
La lectura de estos fotoelectrones es controlada por la polarizacin
de los pxeles, determinada por transistores de efecto campo. Esta
lectura ocurre, o bien directamente mientras un obturador tapa la
objeto (la fuente de luz), o bien por transferencia de trama. En este
caso, una mitad de la superficie del CCD se dedica a recibir la seal,
mientras que la otra solamente ve los fotones durante su trnsito
hacia el registro de lectura.

Operacin Bsica de un CCD


Un CCD est dividido por filas y columnas en las que se va
registrando la salida almacenada en cada uno de los pixeles. Para
obtener la salida digital es necesario que toda la columna de salida
digital sea leda previamente.

Pixeles

Salida
Anloga

Salida Digital

Respuesta en el Espectro

Un problema del chip de la cmara es su respuesta en el espectro. Incluso si el chip es


delgado e invertido para que la luz entre del lado opuesto, una pequea luz azul penetra
el semiconductor para producir electrones. Por otra parte son muy sensibles a la luz
infrarroja pudiendo ocasionar fotografas borrosas; para evitar esto es necesario que se
cuente con un filtro especial ya que el ojo humano no percibe la luz infrarroja que
ocasiona que las imgenes aparezcan de esta manera.

Percepcin del CCD

Percepcin del ojo humano

CMOS (Complementary Metal-Oxide


Semiconductor)

Arreglo tpico de un CMOS

Son ms utilizados en la actualidad que los


CCD ya que pueden ser colocados en
cmaras y celulares de bajo costo. La
diferencia radica en la forma en la que se
lee la salida.
Cuentan con 2 o hasta 4 transistores
inmediatamente despues del sensor de luz
que convierte la seal en voltaje y a su vez la
amplifica.
Las principales ventajas de los CMOS:
Menor consumo de energa
Reduccin de tamao al incluir los
transistores y los sensores en un mismo
chip.
Menor costo de fabricacin que un CCD
pero con un mayor costo en el diseo.

Cmaras a Color
Las cmaras a color que comnmente conocemos pueden ser diseadas
bajo 3 principios:
1. Imgenes estacionarias para propsitos cientficos, ej. Microscopios.
2. Utilizando tres sensores y un arreglo prismtico, ej. Cmaras profesionales.
3. Patrn de Bayer o arreglo de imgenes a color, ej. Cmaras Kodak (patentado)

Imgenes Estacionarias

Tres sensores con


arreglo prismtico

Patrn de Bayer

Iluminacin
El brillo o iluminacin es una herramienta importante para el anlisis de
imgenes ya que se puede obtener un valor de brillo y reflejarlo en un
histograma como se muestra a continuacin.

Metalografa en escala de grises

Histograma con valores de brillo

Pixel
Un pxel o pixel, es un punto que puede emitir en un solo color, ya sea
dentro una fotografa, un fotograma de vdeo o un grfico.
Cuanto mayor es la cantidad de puntos, o pxeles, mejor calidad tendr la
imagen que tomamos, como se muestra a continuacin:

Calidad de imagen en base a pixeles

Ruido

El ruido digital es la variacin aleatoria (que no


se corresponde con la realidad) del brillo o
el color en las imgenes digitales producido
por el dispositivo de entrada (la cmara
digital en este caso)
Al tomar un foto con flash se obtiene una
imagen de 8 bits (cada bit de 0 a 255), en una
cmara real se crea la imagen nicamente de 7
bits, siendo ruido el octavo bit

Variacin de ruido en imagen

Imgenes de alta profundidad

En aparatos para la toma de imgenes de alta profundidad se requiere de un


formato de almacenamiento que conserve la resolucin (4bytes por pixel).
Un mapa de la superficie de la tierra del fondo del mar hasta la cima del Everest
se maneja con 8bits (256 valores), correspondiendo 100 pies por cada bit y aun asi
no se formara la imagen completa.
Al aumentar el numero de bytes por pixel la imagen se vera mas de cerca,
permitiendo ver hasta las calles.

Mapa Superficie de la tierra

Vista area de calles

Histograma

Muchas imgenes no tienen un rango de brillo que la cubra toda. El resultado de esto
es un histograma como el que se muestra en la figura donde la zona plana indica los
valores de luminosidad, tanto de luz como de obscuridad que no son utilizados por
cualquiera de los pixeles de la imagen.
La ampliacin de la escala de brillo puede mejorar la visibilidad del contraste en
imgenes.

Expansin lineal de un histograma


para cubrir toda la gama de
almacenamiento
o
visualizacin.
area de calles

SEM (Scanning Electron Microscope)


Algunos aparatos producen imgenes o datos que pueden ser
vistos como imgenes directamente sin usar una cmara

Funcionamiento SEM

Uso de color en Imgenes

La coloracin es una tcnica auxiliar


utilizada en microscopa para mejorar el
contraste en la imagen vista al
microscopio. Los colorantes y tinturas son
sustancias que usualmente se utilizan en
biologa y medicina para resaltar
estructuras en tejidos biolgicos que van
a ser observados con la ayuda de
diferentes tipos de microscopios.

Coloracin Microscpica

Espacios de Colores
La relacin entre YUV o YIQ y RGB se muestra en la ecuacin 1.1
La conversin de YUV o YIQ a RGB se hace invirtiendo la matriz
de valores como se muestra en la ecuacin 1.2

El espacio de color UV
La seal V es rojo magenta
La seal U es magenta - verde

El eje de V va del rojo al cian,


mientras que el eje U va del
color magenta al verde

Espacio de color RGB

La combinacin rojo y verde produce Amarillo, verde, ms azul produce cian y azul
ms rojo produce Magenta. gris encuentra a lo largo el cubo diagonal de Negro a
Blanco con proporciones iguales de rojo, verde y azul. Cian, Amarillo y Magenta son
utilizadas en la impresin, que se restan del Blanco (el color del papel), dejando rojo,
azul y verde, respectivamente.

Cubo de colores RGB

The CIE (Commission Internationale de Lclairage)

El diagrama cromtico CIE es una grfica de dos dimensiones . El tercer eje es la


luminancia, como el valor de Y en YUV produce una imagen monocromtica (escala
de grises).
Los dos ejes primarios llamados X , Y siempre son positivos y se combinan para
definir cualquier color visible

Diagrama CIE

Representacin Bi-cnica del Espacio TonoSaturacin-Intensidad (HIS)

En este sistema, el
matiz es lo que la
mayora de la gente
entiende por color, por
ejemplo, la distincin
entre rojo y amarillo. La
saturacin
es
la
cantidad de color que
esta
presente,
por
ejemplo, la distincin
entre el rojo y el rosa. El
tercer
eje
(llamado
ligereza, intensidad, o
valor) es la cantidad de
luz, por ejemplo la
distincin entre un color
rojo y la luz oscura o
entre gris oscuro y gris
claro.

Representacin Bi-cnica del Espacio TonoSaturacin-Intensidad. Los grises se encuentran a


lo largo del eje central. La Distancia desde el eje da
la saturacin, mientras que la direccin (ngulo) es
dada por el tono.

Espacio LAB

Un espacio geomtricamente mas simple y que es mas Cercano al


enfoque HSI para la mayora de aplicaciones y ms fciles de tratar
matemticamente es un modelo esfrico L-a-b. L es el eje de escala
de grises, o luminancia, mientras que a y b son dos ejes ortogonales
que juntos definen el color y la saturacin. El eje a se extiende desde
rojo (+ a) a verde (-a) y el eje b de amarillo (+ b) a azul (-b).
A partir de estos valores, el tono
y la saturacin se puede calcular
como:

La relacin matemtica entre L,


a, b y R, G, B se muestra en la
Ecuacin

Alternativamente, la conversin
puede
llevarse
a
cabo
directamente desde RGB a un
espacio cnico HSI:

La transformacin de RGB a CIELab


Basndose en estos valores
XYZ, los valores se L *, a *, b
*son:

La transformacin de RGB a
CIELab
requiere
un
paso
intermedio, llamado XYZ:

La funcin f es definida como:

Imgenes a color
La
informacin
absoluta de color no es
til para el anlisis de
imagen.
Las
diferencias relativas en
el color de una regin a
otra se puede utilizar
para
distinguir
las
estructuras
y
los
objetos presentes

Correccin de color
La obtener una imagen los colores se ven afectados por el tipo de
iluminacin que se tiene.
Al tener una paleta de colores preestablecida nos permite realizar ajustes
que producen la coincidencia de color entre una cmara o escner,
diversos CRT y monitores LCD, impresoras de varios tipos, e incluso
proyectores.

Mejora visible de imagen utilizando una


paleta de colores preestablecida.

Mejora de colores utilizando valores


RGB
imagen corregida mediante la matriz triestmulo
es calculada con la siguiente tabla

Correccin triestumulo de color utilizando


valores RGB

Display de color

Una pantalla de cristal lquido o LCD (liquid crystal display) es una pantalla delgada y plana
formada por un nmero de pxeles en color o monocromos colocados delante de una fuente
de luz o reflectora. A menudo se utiliza en dispositivos electrnicos de pilas, ya que utiliza
cantidades muy pequeas de energa elctrica.
Cada pxel de un LCD tpicamente consiste de una capa de molculas alineadas entre dos
electrodos transparentes, y dos filtros de polarizacin, los ejes de transmisin de cada uno
que estn (en la mayora de los casos) perpendiculares entre s. Sin cristal lquido entre el
filtro polarizante, la luz que pasa por el primer filtro sera bloqueada por el segundo
(cruzando) polarizador

Tipos de imagenes
A veces el utilizar una sola imagen no nos
proporciona la informacin suficiente para un
anlisis.
Para la obtencin de imgenes mltiples existen
aparatos que nos permiten tener una imagen en 3D.

Estas imgenes son muy utilizadas para fines


mdicos ya que nos da una vista real del cuerpo.

Planos mltiples de pixeles

Estereoscopa
La estereoscopa es cualquier tcnica de ver y amarar tu
miembro capaz de recoger informacin visual tridimensional
y/o crear la ilusin de profundidad mediante una imagen
estereogrfica, un estereograma, o una imagen 3D
(tridimensional). La ilusin de la profundidad en una
fotografa, pelcula, u otra imagen bidimensional se crea
presentando una imagen ligeramente diferente para cada ojo,
como ocurre en nuestra forma habitual de ver. Muchas
pantallas 3D usan este mtodo para transmitir imgenes

Funcionamiento del ojo humano

S es la distancia de desplazamiento (la distancia del plano viaja o la


distancia de la cmara se mueve) y WD es la distancia de trabajo o la
altitud. El diferencial (d1 - d2) entre dos puntos que aparecen en las
dos imgenes diferentes (medido en una direccin paralela a la de
desplazamiento) es proporcional a la diferencia de elevacin entre
los dos puntos. Para el caso de D1 y D2 mucho ms pequea que S, la
relacin simplificada es:

geometra utilizada para medir el


diferencial vertical entre los objetos vistos
en dos imgenes diferentes obtenidas
por desplazamiento o punto de vista
(normalmente utilizado para la fotografa
area)

Capitulo 2
LA VISIN HUMANA

Introduccin
Los humanos son seres altamente visuales, la mayora de la
informacin se obtiene por medio de nuestros ojos (junto con el
cerebro).
El porcentaje de informacin que fluye a travs de medios visuales
para el ojo humano est estimado en 90-95%.
No todos los animales, incluidos algunos mamferos no dependen
de la vista tanto como los humanos, un ejemplo son los murcilagos
o los delfines que utilizan sonar.
La capacidad de detectar las ondas de luz se encuentran en un
rango de 400-700 nm (azul a rojo).

Reconocimiento

El principal objetivo de la visin humana es el reconocimiento. Ya sea para


buscar comida, evitar depredadores, saludar a un amigo; todo esto solo
podra ser relacionado con una imagen de algo que nos resulta familiar. El
objeto debe tener una etiqueta mental de qu es y para que se utiliza.
Cuando el objeto no nos resulta familiar y no tiene ninguna etiqueta mental, lo
que sucede es que se comparan las caractersticas del mismo con un
recuerdo que resulte parecido. Esto tambin incluye el factor de la memoria.

El Ojo Humano
El ojo humano es un muy buen componente ptico, pero lejos del mejor del
reino animal.
Una de las funciones que tiene el ojo humano es el poder cambiar los ojos
de posicin y con esto crear una imagen prcticamente sin ningn
esfuerzo.
La luz penetra a travs de la pupila, atraviesa el cristalino y se proyecta
sobre la retina, donde se transforma gracias a unas clulas llamadas foto
receptoras en impulsos nerviosos que son trasladados a travs del nervio
ptico al cerebro.

El ojo humano

Agudeza Visual
Muchos animales, en particular las
aves tienen una visin mucho mas
espacial que los humanos. La visin
humana alcanza su mxima resolucin
espacial en solo un rea pequea en el
centro del campo de vista, donde la
densidad de los sensores de luz es
mayor.
La agudeza visual es la capacidad del
sistema de visin para percibir, detectar
o identificar objetos especiales con
unas condiciones de iluminacin
buenas.

Ojo y Cerebro
La visin humana es ms que conexiones en la retina, hay una gran
cantidad de procesamiento, inmediatamente de la retina y la corteza
cerca del cerebro, antes de tener una imagen de algo conocido en
la mente. Los tubos para sensar luz y los conos se encuentran
detrs, la luz debe pasar por diferentes capas de clulas que
procesan la informacin.

Comparaciones Espaciales
La idea bsica detrs de rodear el
centro o la excitacin e inhibicin
lgica es compara con las
seales centrales de una regin,
para que la salida se anule. Este
anlisis es la unidad bsica de
anlisis de retina, combinando
dos salidas, la deteccin de luz o
lneas oscuras, esquinas, orillas y
otras estructuras pueden ser
alcanzadas.

Jerarquas Locales y Globales


La interpretacin de elementos en una escena depende
ampliamente en el agrupamiento de todas las
estructuras y objetos. El agrupamiento es necesario
para la inhibicin del trabajo efectivo. La imagen comn
del brillo alterado por los alrededores, el contraste del
marco, depende de que tan bien se encuentra agrupada
la regin central.

Daltonismo
El daltonismo es un defecto gentico
que
ocasiona
dificultad
para
distinguir los colores. La palabra
daltonismo proviene del qumico y
matemtico John Dalton que padeca
este trastorno. El grado de afectacin
es muy variable y oscila entre la falta
de capacidad para discernir cualquier
color (acromatopsia) y un ligero
grado de dificultad para distinguir
algunos matices de rojo verde y
ocasionalmente azul.

Tercera Dimensin
En fsica, geometra y anlisis matemtico, un objeto o
ente es tridimensional si tiene tres dimensiones. Es decir
cada uno de sus puntos puede ser localizado
especificando tres nmeros dentro de un cierto rango.
Por ejemplo, anchura, longitud y profundidad.

El mundo de la Luz
Los ojos son parte de un sistema completo involucrado en la
produccin sensorial y la corteza. La superficie de un objeto
tambin importa ya que si la luz no es transmitida u absorbida
correctamente por el objeto se ve una capa delgada sobre el
objeto.

El tamao

El tamao de los objetos est determinada por la ubicacin de los lmites. El nico problema con
esa afirmacin bastante obvia es decidir donde se encuentra el lmite. La visin humana funciona
mediante la bsqueda de muchos tipos de lneas en imgenes, que incluyen los bordes de los
objetos, basado en la localizacin de los lugares donde el brillo o el color cambia abruptamente.
Esas lneas son tratadas como un boceto (llamado el "esquema primordial"). Dibujos animados
funcionan porque las lneas dibujadas sustituyen directamente por los bordes que se pueden
extraer de una escena real.

Capitulo 3: Impresin y
Almacenamiento

Impresin
Para la impresin de imgenes se pueden usar
diferentes tipos de impresoras (impresoras jet de
tinta, impresoras lser).
Estas impresoras utilizan el principio DPI (dots per
inch), el cual consiste en imprimir punto por punto
una imagen o texto de tal manera que se forme un
nuevo color a partir de la combinacin de colores
bsicos.

DPI dots per inch

Ejemplos Tipos de Impresin


Aumentar el nmero de clulas mejora la
resolucin lateral a expensas del nmero
de niveles de gris que puede
ser
mostrado, y viceversa.

a)
b)
c)
d)

Imagen original
100 lneas por pulgada
75 lneas por pulgada
50 lneas por pulgada

Semitonos
Un semitono es una imagen descompuesta en puntos de
diversos tamaos, por la cual podemos reproducir una escala
de grises de un color.
Se aprovecha la tendencia de nuestra precepcin a agrupar e
interpretarlas como un tono continuo -al verse a la distancia
adecuada- aunque en principio estn formadas de puntos de
un mismo color.
Una de las desventajas de este mtodo es la superposicin de
puntos.

Cuando se alcanza una cobertura del 50%, los


puntos a media tinta se tocan, cambiando el efecto
de uno de puntos negros en un fondo blanco a uno
de puntos blancos sobre un fondo negro.

Impresin a color

Todas las pantallas (LCD, LEDs) generan color de diferente manera


mezclando rojo, verde y azul, esto produce un rango completo de
colores que pueden ser vistos.
Esta gama de colores no muestra completamente todos los tonos que
se pueden tener, la imagen nos muestra el rango de colores que se
puede ver en la impresora y en la pantalla

Diagrama CIE de color

Mejora de imagen
El papel en blanco que comienza como blanco y la adicin de
cian, magenta, amarillo y tintas elimina los colores
complementarios (rojo, verde, y azul, respectivamente) a
partir de la luz reflejada para producir la posible gama de
colores. Es comn llamar a estos colores sustractivo CMY
para distinguirlos de los colores RGB aditivos.

reduccin del rango de luminosidad revela detalle


en las zonas de sombra sin que se pierda el
contraste en las zonas brillantes

Comparacin de RGB (aditivo) y CMY


(sustractivo).
El espacio aditivo aade rojo, verde y azul a fondo negro,
mientras que el espacio de color sustractivo elimina cian,
magenta y amarillo a un fondo blanco

Colores aditivos

colores sustractivos

Modelo CMYK
El modelo CMYK (acrnimo de Cyan, Magenta, Yellow y Key)
es un modelo de color sustractivo que se utiliza en la
impresin en colores.
El uso de la impresin a cuatro tintas genera un buen
resultado con mayor contraste. Sin embargo, el color visto en
el monitor de una computadora seguido es diferente al color
del mismo objeto en una impresin, pues los modelos CMYK y
RGB tienen diferentes gamas de colores.

ngulos ideales para el modelo CMYK 45, 75,


90, 105 respectivamente.

Uso de tinta negra


Por varias razones, el negro generado al mezclar los colores
primarios sustractivos no es ideal y por lo tanto, la impresin a
cuatro tintas utiliza el negro adems de los colores primarios
sustractivos amarillo, magenta y can. Entre estas razones
destacan:
Una mezcla de pigmentos amarillo, cian y magenta rara vez
produce negro puro porque es casi imposible crear suficiente
cantidad de pigmentos puros.
Mezclar las tres tintas slo para formar el negro puede
humedecer al papel.
Desde un punto de vista econmico, el uso de una unidad de tinta
negra, en vez de tres unidades de tintas de color, puede significar
un gran ahorro.

Ptron de Moir

Un patrn de Moir es un patrn de interferencia que se forma


cuando se superponen dos rejillas de lneas con un cierto ngulo, o
cuando tales rejillas tienen tamaos ligeramente diferentes.
El sistema visual humano crea la ilusin de bandas oscuras y claras
horizontales, que se superponen a las lneas finas que en realidad
son las que forman el trazo. Patrones de muar ms complejos
pueden formarse igualmente al superponer figuras complejas hechas
de lneas curvas y entrelazadas.

Ptron de Moir

Almacenamiento de Archivos

En trminos fsicos, la mayora de los archivos informticos se almacenan en


discos duros discos magnticos que giran dentro de una computadora que
pueden registrar informacin indefinidamente. Los discos duros permiten
acceso casi instantneo a los archivos informticos.
No obstante en la actualidad han cobrado mucho auge las memorias flash,
dispositivos con mucha capacidad de almacenamiento que tienen la ventaja
de ser pequeos y porttiles; suelen usarse para guardar archivos en
dispositivos pequeos como telfonos mviles o reproductores de audio
porttiles

Disco Duro

CD

Un CD-ROM tienen una capa metlica para reflectar el rayo lser que lee la
informacin. Su capacidad de almacenamiento es de 500MB a 680MB. El
componente principal del CD es un tipo de plstico llamado policarbonato, un
petroqumico que se inyecta en moldes. Estos moldes contienen las
irregularidades de la superficie (las cretas y surcos) que representan los
datos, el policarbonato viscoso adopta el estampado del molde. El disco de
plstico resultante recibe el nombre de substrato de plstico
El substrato de plstico se recubre por una finsima capa de aluminio
reflectante que captura la forma de crestas y surcos de manera precisa. Para
evitar que el aluminio se marque y arae, lo que borrara los datos residentes
en l, se aade una laca protectora, a travs de la cual el lser es
perfectamente capaz de leer los surcos.

CD-ROM

DVD

Las siglas DVD significan Video Disco Digital o Disco Verstil Digital.
Es un CD ms rpido y con mayor capacidad para almacenar video,
audio y datos de ordenador que tiene funcin de grabadora de
videos, sonidos con una gran nitidez en el vdeo y en el sonido.
Disco de vdeo digital, tambin conocido en la actualidad como disco
verstil digital (DVD), un dispositivo de almacenamiento masivo de
datos cuyo aspecto es idntico al de un disco compacto, aunque
contiene hasta 25 veces ms informacin y puede transmitirla al
ordenador o computadora unas 20 veces ms rpido que un CDROM. Su mayor capacidad de almacenamiento se debe, entre otras
cosas, a que puede utilizar ambas caras del disco y, en algunos
casos, hasta dos capas por cada cara, mientras que el CD slo utiliza
una cara y una capa. Las unidades lectoras de DVD permiten leer la
mayora de los CDs, ya que ambos son discos pticos; no obstante,
los lectores de CD no permiten leer DVDs.

Blu-ray
El disco Blu-ray hace uso de un rayo lser de color azul con
una longitud de onda de 405 nanmetros, a diferencia del
lser rojo utilizado en lectores de DVD, que tiene una longitud
de onda de 650 nanmetros. Esto, junto con otros avances
tecnolgicos, permite almacenar sustancialmente ms
informacin que el DVD en un disco de las mismas
dimensiones y aspecto externo. Blu-ray obtiene su nombre del
color azul del rayo lser (blue ray significa rayo azul).

Blu -ray

Blu-ray

El tamao mnimo del punto en el que un lser puede ser enfocado


est limitado por la difraccin, y depende de la longitud de onda del
haz de luz y de la apertura numrica de la lente utilizada para
enfocarlo. En el caso del lser azul-violeta utilizado en los discos Bluray, la longitud de onda es menor con respecto a tecnologas
anteriores, aumentando por lo tanto la apertura numrica (0,85,
comparado con 0,6 para DVD). Con ello, y gracias a un sistema de
lentes duales y a una cubierta protectora ms delgada, el rayo lser
puede enfocar de forma mucho ms precisa en la superficie del
disco.
Dicho de otra forma, los puntos de informacin legibles en el disco
son mucho ms pequeos y, por tanto, el mismo espacio puede
contener mucha ms informacin. Por ltimo, adems de las mejoras
en la tecnologa ptica, estos discos incorporan un sistema mejorado
de codificacin de datos que permite empaquetar an ms
informacin.

Compresin de imgenes
El objetivo de la compresin de imagen es reducir los datos
redundantes e irrelevantes de la imagen con la menor prdida
posible. Para permitir su almacenamiento o transmisin de
forma eficiente.
La compresin de imagen puede ser con prdida o sin
prdida.
La clasificacin de los mtodos de compresin:
Compresin sin prdida de informacin (LOSSLESS).
Compresin con prdida de informacin (LOSSY).
Ejemplo de imgenes con sus histogramas y los
resultados de la compresin por las diferencias de
clculo entre cada pxel y su vecino de la izquierda. Las
imgenes originales tienen muy diferentes histogramas,
pero los comprimidos tienen la mayora de los valores
cerca de cero.

Lossless and lossy


Mtodos de codificacin de compresin con
prdida(lossless):
Codificacin predictiva con prdidas.
Codificacin de la transformada.

Mtodos de codificacin de compresin sin


prdida(lossy):
Codificacin de longitud variable (Codificacin
Huffman y otros).
Codificacin en planos de bits: descomposicin y
RLE.
Fundamentos de LZW y CCYTT.
Codificacin predictiva sin prdidas.

Compresin JPEG

Las etapas de la compresin JPEG son las siguientes:


Remuestreo de crominancia, porque el ojo humano no puede distinguir diferencias de crominancia en
un cuadrado de 2x2 puntos
Divisin de la imagen en bloques de 8x8 puntos, luego la aplicacin de la funcin DCT (Discrete Cosine
Transform (Transformada de coseno discreta)), que descompone la imagen en una suma de frecuencias
suma de frecuencias
Cuantificacin de cada bloque, es decir, se aplica un coeficiente de prdida (que hace posible determinar
la relacin tamao/calidad) que "anular" o disminuir los valores altos de frecuencia a fin de atenuar
fin de atenuar los detalles, pasando de manera inteligente sobre el bloque con codificacin RLE (en
codificacin RLE (en forma de zigzag para eliminar tantos valores cero como sea posible).
posible).
Codificacin de imgenes despus de la compresin mediante el mtodo Huffman

Imagen original

Imagen despus de compresin

Compresin Wavelet
Las Wavelets (ondculas) son un desarrollo relativamente
reciente tanto en matemticas puras aplicadas, construidas
con el propsito de analizar funciones, es especial las
funciones cuadrado integrales.
A medida que nos acercamos a escalas ms pequeas,
podemos encontrar detalles que no habamos visto antes.

Comparacin ondas Fourier vs Wavelets

Compresin Fractal

La compresin fractal es un mtodo de compresin con prdida para imgenes digitales,


basado en fractales. El mtodo es el ms apropiado para texturas e imgenes naturales,
basndose en el hecho de que partes de una imagen, a menudo, se parecen a otras
partes de la misma imagen. Los algoritmos fractales convierten estas partes en datos
matemticos llamados "cdigos fractales" los cuales se usan para recrear la imagen
codificada.
Con la compresin fractal, la codificacin es extremadamente cara a nivel computacional
debido a la bsqueda de similitudes propias. Sin embargo, la decodificacin es bastante
rpida. Mientras que esta asimetra lo hace poco prctico para aplicaciones en tiempo
real, cuando el vdeo es guardado para distribucin desde un disco, la compresin
fractal llega a ser ms competitiva
La eficiencia en la compresin se incrementa con la complejidad de la imagen y la
profundidad de color, en comparacin a las simples imgenes en escala de grises.

Compresin fractal

Capitulo 4: Correccin de
defectos de imagen

Histograma
El histograma de una imagen es la grfica del nmero de
pixeles con su respectivo nivel de brillo, es una herramienta
muy buena para evaluar el contrate de una imagen.
Pero como regla general se considera que una imagen tiene
un buen contraste si su histograma se extiende ocupando casi
todo el rango de tonos.

Histograma de una imagen

Imgenes a Color
Para imgenes en color es posible realizar un anlisis ms
detallado, considerando que estn formadas por la
composicin de tres canales de color RGB (componentes roja,
verde y azul).
Tambin es posible obtener el histograma de cada uno de
estos canales por separado:

Obtencin de los histogramas de cada canal de


color por separado

Ruido en imgenes

El ruido digital es la variacin aleatoria (que no se corresponde con la realidad) del brillo
o el color en las imgenes digitales producido por el dispositivo de entrada (la cmara
digital en este caso).
Para comprender los motivos que originan el ruido digital hemos de fijar nuestra atencin
en el funcionamiento del sensor de imagen, que hace posible la captura de la foto. Un
CCD est compuesto por una malla de celdas fotosensibles, encargadas de recibir la
imagen formada por las lentes de la ptica de la cmara. Cada una de esas celdas
contendr uno o ms fotodiodos con capacidad de convertir la luz en una seal elctrica,
para ser procesada como una imagen (color), es decir, ser convertida a datos
numricos que se almacenarn en forma binaria en la memoria de la cmara para dar
origen a un pixel. Lo cierto es que esa actividad elctrica, en si misma, generar una
cierta seal aun en ausencia de luz, que oscilar en relacin con la temperatura,
generando datos al azar, que originarn ruido.

Dos imgenes de la misma vista, adquiridas desde una cmara digital, y la diferencia entre ellos (pxeles
agrandados y el contraste expandido para mostrar el detalle). Excepto por las diferencias asociadas con el
movimiento de las manecillas del reloj, las diferencias son debidas a ruido aleatorio en la cmara y son diferente
en los canales rojo, verde y azul.

Promedio de barrido
La forma ms comn de lograr un
promedio
de
barrio
es
reemplazar cada pxel con el
promedio de s mismo y sus
vecinos. Esto es a menudo
descrito como una operacin de
"kernel", ya que aplicacin puede
generalizarse como la suma de
los valores de los pxeles en la
regin multiplicada por un
conjunto de pesos enteros. El
proceso tambin se llama una
convolucin
y
puede
ser
equivalente realizado en el
espacio de Fourier.

Filtro
El filtro de barrido promedio se lleva a cabo simplemente
usando una mscara cuadrada de varios tamaos. El efecto
de desenfoque del filtro se hace evidente a medida que
aumenta el tamao de la mscara.
El filtro funciona de la misma manera para imgenes a color

La reduccin del ruido mediante la


recopilacin de ms seales:

Filtro de suavizado

Filtros de suavizado hacen reducir el ruido aleatorio, pero la


suposicin subyacente es que todos los pxeles en la vecindad
representan mltiples muestras del mismo valor, en otras palabras
que todos ellos pertenecen a la misma estructura u objeto.
Claramente, en los bordes y lmites esto es no es cierto, y todos los
filtros de suavizado producen algunos desenfoques y el
desplazamiento de bordes, lo cual es indeseable. Los filtros
Gaussianos producen los menos bordes borrosos y reducen el ruido,
pero no puede eliminar la borrosidad por completo.

Filtro suavizado

Filtro de la media

El resultado de la aplicacin de
este filtro consiste en asignar
al pixel central de la imagen
filtrada
el
valor
correspondiente a la media
aritmtica del valor de gris de
los NxN pixeles determinados
de
la
submatriz
correspondiente
(el
pixel
central y sus 8 vecinos para un
filtro de 3x3, el central y los 24
vecinos cuando el filtro es de
5x5 y los 48 vecinos cuando el
filtro es de 7x7)

Definicin en forma matricial del filtro de media de


3x3 y de 5x5

Filtros Gaussianos
Este filtro produce un resultado semejante al de madia, pero
aqu se le da mas peso al pixel central que a sus vecinos, a la
vez que de da mas peso a los pixeles ms prximos y menos
peso a los pixeles ms alejados.
El calificativo de gaussiano le viene de la definicin del filtro,
que sigue la forma de la campana de Gauss.

Representacin grfica de un filtro gaussiano de


dimensiones 3x3

Filtro de mediana

El filtro de mediana es un excelente rechazador de ciertos tipos comunes de


ruido.
Tiene la ventaja de que el valor final del pixel es un valor real presente en la
imagen y no un promedio, de este modo se reduce el efecto borroso que
tienen las imgenes que han sufrido un filtro de media. Adems el filtro de la
mediana es menos sensible a valores69 extremos. El inconveniente es que
resulta ms complejo de calcular ya que hay que ordenar los diferentes
valores que aparecen en los pixeles incluidos en la ventana y determinar cual
es el valor central

Tipos

de

filtro

mecanismo

de

Filtros adaptativos
Son considerablemente ms complejos ya que los coeficientes
de ponderacin se recalculan para cada uno de los pixeles en
funcin del histograma de los ND que aparecen en la ventana.
Se han utilizado con gran xito filtros adaptativos para
eliminar el speckle de las imgenes de radar y para detectar,
con un solo filtro, diferentes elementos.

Suavizado condicional utilizando un barrio de adaptacin

Filtros Olmpicos

Filtros Olmpicos estn estrechamente relacionados filtros de medias, y por lo tanto, pueden
utilizarse para destacar la variabilidad de ms largo alcance en una imagen, que acta con
eficacia para suavizar la imagen. Esto puede ser til para reducir el ruido en una imagen. El
algoritmo opera mediante el clculo del valor medio en una ventana mvil centrada en cada
celda de la cuadrcula. En la estimacin de la media, no se utilizan los valores ms altos y los
ms bajos en el barrio. Debido a que los promedios son muy afectados por los valores
extremadamente altos y bajos, el filtro Olmpico es mucho menos sensible al ruido de un
disparo en una imagen que el filtro de media.

Aplicacin de filtro Olmpico

Entropa

Mtodos basados en la entropa representan un enfoque para la eliminacin


de los artefactos tales como ruido o desenfoque de las imgenes, sobre la
base de algunos de conocimiento acerca de los contenidos de las imgenes y
algunos suposiciones acerca de la naturaleza de la degradacin que se va a
quitar y la imagen restaurada (Skilling, 1986; Frieden, 1988). La descripcin
convencional del mtodo es imaginar un imagen que contiene N pxeles, que
se ha formado por un total de fotones M (donde M es generalmente mucho
mayor que N). El nmero de fotones en un solo pxel (es decir, el brillo del pxel
valor) es Pi, donde i es el ndice de pxeles.

La imagen tiene medido valores de brillo de pixel


normalizado

Entropa
El "entropa" del patrn de brillo se da en un sentido formal
mediante el clculo del nmero de maneras que el patrn
podra haber sido formado por reordenamiento, o

donde! indica factorial. Para grandes valores de M, se reduce


por la aproximacin de Stirling a el ms familiar

La entropa en la imagen se puede minimizar en un sentido


absoluto configurando el brillo de cada pxel para el brillo
medio y maximizado por la difusin de los valores de manera
uniforme en toda la gama de luminosidad. La aplicacin de
limitaciones produce resultados tiles. La limitacin ms
comn para imgenes que contienen el ruido se basa en una
estadstica de chi-cuadrado, calculado como

En esta expresin los valores de pi son los valores de los


pxeles originales, la pi 2 son el brillo alterado valores, y es la
desviacin estndar de los valores. Un lmite superior se
puede establecer en el valor de | 2 permitido en el clculo de
un nuevo conjunto de pi 2 valores para maximizar la entropa.
Un tpico (pero esencialmente arbitraria) lmite para | 2 es N, el
nmero de pxeles en la matriz.

Fondo de la imagen
En ocasiones el fondo de la imagen no es grabado, para
obtenerlo se puede utilizar la interpolacin.
Nivelacin con un fondo medido: (a) Imagen de la
retina
de
un
oftalmoscopio,
mostrando
sombreado que hace que los capilares sean
difciles de discernir; (b) el canal rojo contiene
pocos detalles pero Muestra el sombreado; (c) el
canal verde tiene la mayor parte del contraste en
la imagen; (d) la relacin de verde a rojo muestra
el contraste ms uniforme

Fondo de la imagen

Mediante la seleccin de una serie de puntos en la imagen, se


adquiere una lista de valores y ubicaciones de brillo. Estos se utilizan
para realizar ajuste de mnimos cuadrados de una funcin B (x, y) que
aproxima el fondo y puede restarse (o divide) al igual que un fondo
adquirido fsicamente. Cuando el usuario marca estos puntos, por
ejemplo mediante el uso de un sealador dispositivo, como un ratn,
pantalla tctil, o pluma de luz, es importante seleccionar
ubicaciones, todos deberan tener el mismo brillo y estr bien
distribuidos a travs de la imagen
Localizacin de muchos puntos en una regin pequea y pocos o
ninguno en otras partes de la imagen requiere la funcin para
extrapolar el polinomio y puede introducir errores significativos.
Funcin para un polinomio de tercer grado:

Brillo en una imagen


Para modificar el brillo en una imagen se ajusta el fondo de tal
manera que al quitar pixel por pixel se tendr una imagen con
mayor brillo.

Imagen del telescopio de la superficie lunar: (a) original, con diferentes


contraste debido a la curvatura de la superficie; (b) la aplicacin de
contraste automtico por funciones polinmicas de ajuste a la luz y valores
de los pxeles oscuros

Rango de nivelacin

Cuando el fondo vara ms abruptamente que puede estar en forma para


funciones simples, un enfoque diferente puede ser utilizado. Este mtodo es
especialmente til cuando la superficie es irregular, tales como detalles sobre
una superficie de fractura examinado en el SEM, terreno montaoso iluminado
por la luz solar, o una seccin delgada con un pliegue visto en la transmisin.
El supuesto detrs de este mtodo es que las caractersticas de inters estn
limitados en tamao y ms pequeas (por lo menos en una dimensin) que la
escala de variaciones de fondo, y que el fondo est en todas partes ya sea
ms clara o ms oscura que de las caractersticas locales. Ambos requisitos
se cumplen con frecuencia en situaciones prcticas.
La idea bsica detrs de las operaciones de clasificacin de barrio es
comparar cada pxel con sus vecinos en alguna pequea regin, por lo
general se aproxima a un crculo de tamao ajustable. Esta operacin se
realiza para cada pxel de la imagen, y una nueva imagen con el pxel
sustituido por un valor vecino se produce como resultado.
Nivelacin de brillo de la imagen y el contraste de la
eliminacin de los trminos de baja frecuencia en un 2D
Transformada de Fourier: (a) imagen original, que muestra
la iluminacin no uniforme; (b) nivelar el brillo mediante la
reduccin de la magnitud a cero de los componentes de
frecuencia ms baja. Observe que, adems de las
variaciones cerca de las fronteras, el brillo de estructuras
similares no es constante en toda la imagen.

Fondo de nivelacin

Para el fondo de nivelacin, si el fondo es conocido por ser


localmente ms oscuro que las caractersticas, el valor de pxel ms
oscuro en el barrio sustituye el valor del pxel original. Para el caso
de un fondo ms claro que las caractersticas, el pxel ms brillante
en la zona se utiliza en su lugar.
El resultado de aplicar esta operacin a toda la imagen es reducir las
caractersticas por el radio de la regin barrio y para extender los
valores de brillo de fondo locales en el rea.
La construccin de una imagen de fondo con una
operacin de rango: (a) una imagen de granos de
arroz con iluminacin no uniforme; (b) cada pxel
sustituido por el pxel colindante ms oscuro en un
octogonal barrio 5 5; (c) otra repeticin del
"vecino mas obscuro" operacin de dilatacin
escala de grises; (d) despus de cuatro
repeticiones slo del queda el fondo; (e) resultado
de restar (d) a partir de (a).

Grficas de Computadora
Normalmente las grficas de computadora son utilizadas para
visualizar objetos o imgenes en 3D, un ejemplo muy claro de
esto son los programas de CAD (Dibujo Asistido por
Computador) en el cual podemos ver distintas perspectivas de
un objeto.

Interpolacin
la interpolacin aplica este mismo mtodo para conseguir un
tamao mayor de la imagen inicial, rellenando la informacin
que falta con datos inventados a partir de un algoritmo
especfico.
La ampliacin de una imagen (el
fragmento mostrado se ampla 4 con
respecto a la original):
(a) sin interpolacin (vecino ms
cercano); (b) la interpolacin bilineal; (c)
encaje acanalado; (d) la interpolacin
fractal.

Tipos de interpolacin

Interpolacin por aproximacin: Es uno de los mtodos ms antiguos. Se basa en obtener el promedio de valores de los 2
pixeles ms prximos. La interpolacin bilineal es una mejora de la anterior, promediando en este caso 4 pixeles adyacentes.
pixeles adyacentes.
Interpolacin bicbica: Usada por programas como Adobe Photoshop o Paint Shop Pro es el mtodo de interpolacin
considerado estndar (promedia 16 pixeles adyacentes). Photoshop adems usa algunas variaciones como Interpolacin
como Interpolacin bicbica enfocada o Interpolacin bicbica suavizada que se basa en aplicar algunos cambios a la
algunos cambios a la imagen final.
Interpolacin en escalera (Stair Interpolation): Se basa en la interpolacin bicbica con la diferencia que se va interpolando
en incrementos de un 10% en cada paso con respecto al anterior.
Interpolacin S-Spline: Este mtodo de interpolacin determina el color de un pixel desconocido basndose en la
totalidad de colores de la imagen, a diferencia que los mtodos anteriores.
parece tener tambin unos resultados bastante aceptables.

Efecto de la rotacin de un pixel utilizando estos mtodos

Capitulo 5: Mejora de la imagen


en el dominio espacial

Imgenes mejoradas
Para la percepcin visual humana
La Evaluacin de la calidad de una imagen es un
proceso bastante subjetivo.
Es difcil normalizar la definicin de lo que es una
buena imagen.

Para un programa
La evaluacin es ms fcil.
Una buena imagen es la que produce el mejor
resultado del algoritmo de reconocimiento

Manipulacin de contraste

Una pantalla de ordenador tpico puede mostrar 28 o 256 tonos diferentes de gris y
puede producir colores con los mismos 28 valores de brillo para cada uno de los
componentes rojo, verde y azul para producir un total de 224 o 16 millones de colores
diferentes. Esto es a menudo descrito como "color verdadero", ya que los colores que se
pueden mostrar son adecuados para representar escenas ms naturales.
Esto no implica, por supuesto, que los colores que se muestran son precisos o idnticos
al color original en la escena, o que la pantalla es capaz de mostrar toda la gama de
colores que el ojo puede percibir. Eso es muy difcil y requiere hardware y de calibracin
especial.

La figura muestra una imagen en la que los 256 valores de


brillo de los pxeles distintos no pueden ser discernidas
en el monitor de la computadora; la versin impresa de la
imagen es necesariamente peor. El nmero de niveles de
gris diferentes impresos en una imagen de medio tono
est determinado por la variacin en el tamao de punto
de la impresora.

Imgenes negativas

Una imagen con niveles de gris en


el rango [0, L [0, L-1] 1] con L = 2 n; n = 1, 2
Se transforma en una con niveles:
s = (L s = (L 1) 1) r
Se obtiene la reversa de los niveles de intensidad.
Se utiliza para resaltar detalles blancos inmersos en regiones oscuras de una
imagen. Especialmente cuando predominan las regiones negras.

Imagen positiva y negativa

Histograma

Las ecualizacin del histograma de una imagen es una


transformacin que pretende obtener para una imagen un
histograma con una distribucin uniforme. Es decir, que exista el
mismo nmero de pixeles para cada nivel de gris del histograma de
una imagen monocroma.
El resultado de la ecualizacin maximiza el contraste de una imagen
sin perder informacin de tipo estructural, esto es, conservando su
entropa (informacin).
Ecualizacin de histograma aplicada a una
escala de grises de 8 bits
imagen:
(a) imagen original;
(b) histograma, mostrando picos y valles y
utilizacin incompleta de la gama de
luminosidad;
(c) despus de la ecualizacin;
(d) histograma resultante.

Imagen a color
Para una imagen a color es posible mostrar 3 histogramas,
correspondientes a los 3 ejes o canales, esto se puede hacer
para coordenadas RGB, HIS o L.a.b.

(a) la imagen;
(b) Rojo, verde y azul;
(c) Tono, Saturacin, e Intensidad;
(d) L, a y b. Tenga en cuenta que el canal de intensidad en (c) y el
canal L en (d) no son los mismos, debido a diferente ponderacin
de color.

Ecualizacin local
La ecualizacin de la imagen consiste en tratar de transformar
el histograma de la imagen en un histograma uniforme.
La ecualizacin local se realiza por bloques de la imagen que
se ecualizan de forma independiente. Permite revelar
estructuras finas de la imagen en algunas situaciones.

Laplaciano
El filtro Laplaciano es una medida 2-D isotrpica de la 2nd
derivada espacial de una imagen. El Laplaciano de una imagen
destaca las regiones donde hay cambios bruscos de
intensidad y por tanto se suele utilizar para deteccin de
bordes.
El Laplaciano se aplica frecuentemente a una imagen que
previamente ha sido suavizada , con el fin de reducir su
sensibilidad al ruido.
El valor central de brillo de los pxeles se multiplica por cuatro,
los valores de los cuatro vecinos por encima y por debajo se
multiplican por 2, y La diagonal De 4 vecinos por 1. El valor
total se suma y luego se divide por 16 para producir un nuevo
valor de brillo del pxel.
Pixel
positivo

Pixel
negativo

Operador Laplaciano

Como el nombre del operador Laplaciano lo indica, se trata de una aproximacin al


segundo operador para diferencial de brillo B en las direcciones x e y:

Esto pone de relieve los puntos, lneas y bordes de la imagen y suprime regiones
uniformes y sin problemas diversos, con el resultado que se muestra en la Figura.

Mejora de contraste en los bordes, lneas y puntos utilizando un


Laplaciano: (a) imagen original SEM de fractura de cermica; (b) la
aplicacin del operador de Laplace; (c) adicin del Laplaciano a la
imagen original.

Mtodos Derivativos
La mscara de enfoque del mtodo Laplaciano y los filtros
DoG son buenos para uso general pero no son la mejor
herramienta para todos los casos. Un ejemplo sera la
preparacin cromatografa para protenas.

Deteccin de Lmites
El uso de un operador para detectar los lmites de las
imgenes con el Laplaciano incrementa el contraste de las
orillas y hace que tengan una mejor nitidez.
Realizar operaciones de mtodos derivativos usando granos
puede ser usado como plantilla para el proceso de
convolucin.

Textura
Muchas imgenes contienen regiones caracterizadas no solo
por un valor de brillo o color, sino que un patrn de valores de
brillo es normalmente llamado textura.
Otro tipo de textura puede estar presente en estructuras e
imgenes cuando se presentan patrones con una orientacin
no aleatoria.

Anlisis Fractal

El anlisis fractal consiste en tomar un pedazo de la imagen y analizarlo.


Se analizan los pixeles aledaos al pixel central con un rango mximo de 4 a 7 pixeles.
Los pixeles mas obscuros y claros se encuentran, se puede generar un diagrama a partir
de esos.
El procedimiento consume mas tiempo en comparacin con otras operaciones.

Resta de imgenes

En su forma ms sencilla, la operacin resta toma como entrada dos imgenes y produce como salida
una tercera imagen en la cual cada valor de pxel es la resta de los valores de los pxel de la primera
imagen menos sus correspondientes de la segunda imagen. Una variante comn permite simplemente
una constante especificada ser sustrada a cada pxel. Existen versiones que solamente producen la
diferencia absoluta entre valores de pxel, en lugar de una salida signada
Si los valores de los pxel en las imgenes de entrada son realmente vectores en lugar de valores
escalares entonces los componentes individuales (componentes rojo, azul y verde) se sustraen
separadamente para producir el valor de salida.
Diversas implementaciones de la operacin varan respecto de lo que hacen si los valores del pxel de
salida son negativos. Algunos trabajan con formatos de imagen que soportan pxeles con valores
negativos, en cuyo caso la forma en que se desplegaran depender del mapa de colores. Si el formato de
la imagen no soporta valores negativos, a menudo tales pxeles se ajustan a cero, con lo cual se tiene
una imagen tpicamente negra.

a) Imagen original, b) diferencia absoluta, c) lmites despus de


umbral, la dilatacin y la erosin, superpuestos sobre la imagen
original

Multiplicacin de imgenes

Como sucede con otras operaciones aritmticas, la multiplicacin presenta


dos formas principales. La primera forma toma dos imgenes de entrada y
produce una imagen de salida en la cual los valores de los pxeles son solo
aquellos de la primera imagen multiplicados por los valores correspondientes
en la segunda imagen. La segunda forma toma una nica imagen de entrada y
produce un resultado en el cual cada valor de pxel es multiplicado por una
constante, la cual debe ser especificada. Esta ltima forma es probablemente
la ms ampliamente utilizada, en un proceso conocido como escalado.
Si los valores de pxel en las imgenes de entrada son realmente vectores en
lugar de valores escalares (por ejemplo, imgenes a color) entonces los
componentes individuales (componentes rojo, azul y verde) se multiplican
separadamente para producir el valor de salida. Si los valores calculados son
mas grandes que el mximo permitido por el valor del pxel, entonces deben
ser truncados al mximo valor.

Divisin de imgenes

La operacin de divisin de imgenes, toma normalmente dos


imgenes como entrada y produce una tercera cuyos valores de pxel
son los valores de pxel de la primera imagen dividido por los valores
de pxel correspondientes de la segunda imagen. Muchas
implementaciones pueden ser utilizadas con una nica imagen de
entrada, en cuyo caso cada valor de pxel en la imagen se divide por
una constante especfica.
Si los valores de los pxel en las imgenes de entrada son realmente
vectores en lugar de valores escalares (por ejemplo, imgenes a
color) entonces los componentes individuales (componentes rojo,
azul y verde) se dividen separadamente para producir el valor de
salida.

Capitulo 6: Procesamiento de
imgenes en el espacio de la
frecuencia.

La transformada de Fourier

La trasformada de Fourier es una importante herramienta en procesamiento


de imgenes la cual es utilizada para descomponer una imagen en sus
componentes seno y coseno. La salida se la transformacin representa la
imagen en el dominio de Fourier o dominio de la frecuencia, mientras que la
imagen de entrada esta en el dominio espacial.

Cada punto de la imagen en el dominio del espacio. La transformada de


Fourier se utiliza en un amplio rango se aplicaciones, tales como anlisis de
imgenes, filtrado de imgenes, reconstruccin de imgenes y compresin
de imgenes.

La transformada de Fourier
Una figura comnmente usada en los libros de texto de
la transformada de Fourier (usualmente en una sola
dimensin) es la calidad de adaptarse en una funcin
arbitraria por la suma de series finitas por los trminos
de Fourier de expansin.

Ondas sinoidales con transformadas de Fourier

Orientacin y Frecuencias
Es de gran ayuda familiarizarse con el espectro de la
frecuencia usando imgenes simples. Las lneas pueden
ser representadas por un simple pico debido al brillo del
perfil senoidal.

Espectro de Frecuencia

Orientacin Preferente
El rango angular del espectro y la variacin del brillo del ngulo a
travs de ellos puede ser medido para caracterizar un grado de
orientacin estructural. Incluso para las estructuras que no son
perfectamente peridicas, la integral utilizada como una funcin
angular puede ser usada para medir la orientacin preferida.

Orientacin del espectro

Textura y Patrones
Adems de los picos en el espectro resultantes de las estructuras
peridicas que puedan estar presentes y la limitacin de altas
frecuencias a causa de la resolucin de la imagen. Puede parecer
que solo hay un fondo que contiene poca informacin, sin embargo
este no es el caso. Muchas imgenes representan el brillo de la luz
que se muestra en las superficies, u otra informacin como la
elevacin de la misma.

Imgenes con diferente brillo y patrn

Aislamiento del Ruido Peridico


La frecuencia transforma la propiedad de adicin y sustraccin.
Agregar las transformadas de dos imgenes originales o funciones
producen el mismo resultado como la suma de los originales. Esto
permite que con la sustraccin se puedan remover partes no
deseadas de las imgenes.

Imagen con diferentes frecuencias y filtros aplicados

Seleccin de mscaras y filtros


Una vez que se a aislado el ruido peridico de la imagen original a
unos cuantos puntos en la transformada de Fourier, es posible
remover el ruido quitando esos trminos de frecuencia. Un filtro
remueve la frecuencia seleccionada y la orientacin reduciendo la
magnitud de los valores para esos trminos, usualmente a cero.

Imagen antes y despus de seleccin de mscaras y filtros

Seleccin de Informacin Peridica


En algunas imgenes, es la informacin peridica la que
es til y el ruido debe ser suprimido.

Eliminacin de
medios tonos

Convolucin
Una convolucin es un operador matemtico que
transforma dos funciones f y g en una tercera funcin
que en cierto sentido representa la magnitud en la que
se superponen f y una versin trasladada e invertida
de g. Una convolucin es un tipo muy general de media
mvil, como se puede observar si una de las funciones
se toma como la funcin caracterstica de un intervalo.

Convolucin en un
dispositivo ptico

Deconvulacin
La deconvolucin se refiere a las operaciones
matemticas empleadas en restauracin de seales
para recuperar datos que han sido degradados por un
proceso fsico que puede describirse mediante la
operacin inversa a una convolucin.

Deconvulacin de imgenes

Capitulo 7: segmentacin y
Umbralizacin

Umbralizacin de imgenes
La umbralizacin es uno de los mas importantes
mtodos de segmentacin. El objetivo es convertir una
imagen en escala de grises a una nueva con solo dos
niveles, de marea que los objetos se queden separados
del fondo.

Umbralizacin de una imagen del mundo real sobre la base de un histograma pico a)
la imagen original y los pxeles seleccionados mediante el establecimiento de los
niveles se muestra en (b)c) histograma que muestra un pico con lmites de umbral

Ajustes automticos
Probablemente, el mtodo ms simple de todos es localizar
los picos en el histograma y establecer el umbral a mitad de
camino entre ellos.
Existen diferentes algoritmos para la umbralizacion
automtica, principalmente son usados en la configuracin de
sistemas de visin para control de calidad industrial, estos
sistemas se enfocan mas en la reproducibilidad que en la
precisin

Ajustes automticos

Muchos de los algoritmos desarrollados


para el ajuste automtico de los umbrales
estaban destinados para la discriminacin
de texto impreso en papel, como un primer
paso en el reconocimiento ptico de
caracteres
(OCR)
programas
que
escanean las pginas y los convierte en
archivos de texto para su edicin o
comunicacin. La Figura muestra un
ejemplo de una pgina de texto escaneado
con los resultados de varios de estos
algoritmos. Tenga en cuenta que no hay un
"valle entre dos picos" presentes en este
histograma, por lo que los mtodos que
buscan un histograma bimodal no se
pueden utilizar. Muchos de los mtodos
automticos asumen que hay dos
poblaciones de pxeles y aplican una
prueba estadstica para seleccionar un
umbral que "mejor" los distingue.

Ajustes automticos

En muchas situaciones, tal como la mostrada en la figura, los objetos de inters no


comparten un nico valor de brillo o color, ni una gama comn de esos valores.
Pero si el fondo en torno a las caractersticas, o la superficie en la que los objetos
se encuentran, es bastante uniforme en el color o el brillo, puede ser prctico para
seleccionar que por umbralizacion. El contraste de la imagen binaria resultante
puede entonces ser invertida para producir la representacin de los objetos.

Ajustes
Automticos

Imgenes Multibandas
La clasificacin multibanda consiste en extraer informacin
existente y relevante de un conjunto de imgenes o bandas que lo
conforman.
En algunos casos, la segmentacin usando mltiples imgenes de
la misma escena. El ejemplo ms comn es color en la imagen, que
utiliza diferentes longitudes de onda de luz. Para las imgenes
satelitales en particular, puede incluir muchas bandas infrarrojas
que contienen informacin importante para seleccionar regiones en
base a vegetacin, minerales.

Umbrales en dos dimensiones


En lugar de un histograma
unidimensional, la figura
presenta
un
display
bidimensional en el plano
hs. el numero de pixeles
por cada par de valores de
la matriz y saturacin
puede ser graficada como
una escala de grises en el
plano

Seleccin de una regin


en dos planos

Deteccin de colores

El uso de este mtodo


permite
al
usuario
detectar una sola gama
de colores, en este
caso el azul (blue
saturation selection).

Ejemplo de la seleccin
de saturacin azul

Umbrales en dos dimensiones

Como en el ejemplo de la figura, el fondo es ms uniforme en color y


brillo de las piezas de dulces. Estos pxeles se encuentran cerca del
centro del crculo HS, ya que tienen muy baja saturacin.
Umbralizandolos, como se muestra en la Figura, produce una imagen
binaria de todas las piezas de dulce. la combinacin de esta imagen
con la imagen original, por ejemplo, manteniendo lo que es ms ligero
de pxeles, muestra las piezas de caramelo con sus colores
restaurados.

(a) despus de umbral y contraste


reversin de la imagen binaria
delinea los dulces; (b) despus de la
segmentacin
de
cuencas
hidrogrficas y la combinacin de la
imagen binaria con el original para
evitar cualquier pxel valor es ms
ligero, los trozos de caramelo
separadas estn listas para la
medicin o conteo.

Umbralizacin multibanda
La Figura muestra una imagen en color a partir de un
microscopio de luz. El espcimen de intestino delgado est
manchado con dos colores diferentes, por lo que hay
variaciones en la sombra, el tinte y el tono. La siguiente serie
de figuras ilustra cmo esta imagen puede ser segmentado
por moralizacin para aislar una estructura particular de
utilizar esta informacin.

muestra los canales rojo, verde y azul


originales de color en la imagen y sus
histogramas de brillo individuales.

Imgenes a color

Las imgenes en color tambin pueden ser umbralizadas. Un enfoque


consiste en designar un umbral diferente para cada uno de los componentes
RGB de la imagen y luego combinarlos con una operacin AND. Esto refleja la
forma en que la cmara funciona y cmo los datos se almacenan en el
ordenador, pero no se corresponde con la forma en que las personas
reconocen color. Por lo tanto, se utilizan ms a menudo la HSL y modelos de
color HSV.

Esquema de las regiones en cada plano define una forma en el espacio


tridimensional que es ms ajustable que la combinacin booleana de una
simple unidimensional

Histogramas
A partir de los histogramas de los colores rojo, verde y azul, se
puede crear una grafica tridimensional, dando como resultado
la saturacin, matiz e intensidad.

Graficacion de intensidad, matiz y saturacin

Textura

La textura hace referencia normalmente a los rasgos visuales


representados en la superficie de un objeto que da carcter e
identidad al mismo en la representacin. Suelen ser pequeos rasgos
visuales que definen la relacin de veracidad entre el objeto real y
el objeto representado. As la textura de una imagen o un fragmento
de imagen, suele dar identidad diferenciando al objeto representado.
Las texturas suelen integrarse en el conjunto de la imagen,
aportando una sensacin ambiental y pasando muchas veces
desapercibidas en la imagen o en los objetos representados.

Procesamiento para convertir las texturas en la figura a las diferencias de brillo: (a) resultado de
aplicar un operador de varianza; (b) histograma que muestra que las cinco regiones son distintas en
el brillo; (c) cada una de las regiones seleccionadas por umbralizacion el histograma en (b), se
muestra el uso de superposiciones de color.

Umbralizacin de textura
Pocas imgenes pueden ser umbralizadas de manera
satisfactoria usando usando el valor original de brillo.
La informacin de textura en una imagen es una herramienta
muy poderosa. diferentes tipos de texturas pueden ser
encontrados en diferentes rangos de iluminacin, diferentes
frecuencias espaciales, y diferentes orientaciones

Prueba de imagen que contiene cinco regiones diferentes


que se distinguen por diferencias en las texturas. Los
histogramas de brillo se muestran (b); el brillo medio de
cada regin es la misma.

Orientacin de las texturas


Son las que se perciben gracias a la vista. no tienen volumen.
pueden ser inventadas, copia de la realidad o simplificadas a
partir de la realidad.
Se llaman texturas graficas a las texturas visuales que hacen
sobre superficies planas como el papel, y a las que se hacen
en fotografa.
Una imagen que contiene regiones que tienen diferentes
orientaciones de textura, pero el mismo brillo promedio,
desviacin estndar y la escala espacial.
Imagen con diferentes texturas

Limites de la regin

La segmentacin en el campo de la visin artificial es el proceso de


dividir una imagen digital en varias partes (grupos de pxeles) u
objetos. El objetivo de la segmentacin es simplificar y/o cambiar la
representacin de una imagen en otra ms significativa y ms fcil de
analizar. La segmentacin se usa tanto para localizar objetos como
para encontrar los lmites de estos dentro de una imagen. Ms
precisamente, la segmentacin de la imagen es el proceso de
asignacin de una etiqueta a cada pxel de la imagen de forma que
los pxeles que compartan la misma etiqueta tambin tendrn ciertas
caractersticas visuales similares.
La deteccin de bordes es un campo bien desarrollado por s mismo
en el procesamiento de imgenes. Los lmites de regiones y los
bordes estn estrechamente relacionados, ya que a menudo hay un
fuerte ajuste en la intensidad en los lmites de las regiones. Las
tcnicas de deteccin de bordes pueden ser usadas como otra
tcnica de segmentacin ms. Los bordes identificados por la
deteccin de bordes en ocasiones estn desconectados. Para
segmentar un objeto a partir de una imagen sin embargo, es
necesario que los bordes formen figuras cerradas.

Limites de la regin

Tal limite lineal es superior para la medicin exacta porque la lnea en


s no tiene anchura. Sin embargo, la determinacin de la lnea no
siempre es fcil. La ubicacin de los puntos individuales puede ser
determinada por interpolacin entre los pxeles, funciones
matemticas quizs de ajuste a pxeles en cada lado de la frontera
para mejorar los resultados. Este tipo de enfoque se utiliza
comnmente en aplicaciones geogrficas en las que se utilizan los
valores de elevacin medidos en puntos discretos para construir
mapas topogrficos. Tambin se utiliza en aplicaciones de
metrologa, como la medicin de dimensiones de elementos de
circuito microelectrnicos..

Deteccin de bordes

La deteccin de bordes es una herramienta fundamental en el procesamiento


de imgenes y en visin por computadora, particularmente en las reas de
deteccin y extraccin de caractersticas, que tiene como objetivo la
identificacin de puntos en una imagen digital en la que el brillo de la imagen
cambia drsticamente o, ms formalmente, tiene discontinuidades. El mismo
problema de encontrar discontinuidades en seales 1D se conoce como
deteccin de paso.
Los bordes extrados de imgenes 2D a partir de escenas 3D se pueden
clasificar segn el punto de vista en: dependientes o independientes.
Un borde tpico puede ser la arista entre un bloque rojo y uno amarillo que se
encuentran uno a continuacin del otro. En contraste, una recta puede ser un
pequeo nmero de pixeles de un color diferente a un fondo que nunca
cambia. Para la recta, usualmente se detectan dos bordes, uno a cada lado de
la misma.

Una grafica de dos vas del cambio absoluto en la longitud


del permetro vs. los ajustes de umbrales de luminosidad
de nivel superior e inferior. El mnimo indica los ajustes
ptimos

Capitulo 8: Procesamiento de
imgenes binarias

Imgenes Binarias
Una imagen binaria es una imagen digital que tiene nicamente dos
valores posibles para cada pxel.1 Normalmente, los colores
utilizados para su representacin son negro y blanco,2 aunque
puede usarse cualquier pareja de colores. Uno de los colores se
emplea como fondo y el otro para los objetos que aparecen en la
imagen.
Las imgenes binarias, como se menciono anteriormente consisten
en grupos de pixeles seleccionados con base a alguna propiedad.

Combinacin de operaciones
Booleanas
Cuando hay criterios disponibles para seleccionar los
pixeles para ser mantenidos dentro del primer plano,
pueden ser combinadas usando alguna operacin
Booleana.

Mscaras
Es posible combinar imgenes booleanas utilizando mscaras
para modificar una escala de grises o imgenes a color.
Normalmente se utiliza el blanco como fondo y alguna
porcin de la imagen para seleccionar el brillo, color o
densidad.

Pixeles y Caractersticas
Para diferentes propsitos, en especial en la medicin es
necesario identificar los pixeles que estn conectados a un
todo. Una forma de identificar todos los grupos de pixeles
conectados empezando por un pixel, y se revisa de 4 a 8
posiciones adyacentes para identificar cada pixel.

Lgica Booleana y Caractersticas

Tras las agrupaciones de pxeles como rasgos


identificados o etiquetados, es posible llevar a cabo
la lgica de Boole a nivel de funcin, en lugar de a
nivel de pxel. En lugar de mantener los pxeles que
son comunes a las dos imgenes, caractersticas
enteras se mantienen si cualquier parte de los toca.
Esto preserva la totalidad de la funcin, de modo
que se puede contar o medir si se ha seleccionado
la segunda imagen correctamente. Este mtodo
tambin se llama "marker-based", que utiliza
pxeles o grupos de pxeles en una imagen como un
conjunto
de
marcadores
para
seleccionar
caractersticas en un segundo. La ejecucin
eficiente aplica una operacin de etiquetado
funcin para al menos una de las imgenes a ser
combinados. A continuacin, cada pxel que est en
"ON" en una de esas caractersticas se compara
con la segunda imagen. Si alguno de los pxeles de
la caracterstica coincide con un pxel "ON" en la
segunda imagen, la funcin de la totalidad de la
primera imagen se copia en el resultado.

Caractersticas de Seleccin por


localizacin

Una generalizacin del mtodo para la identificacin de cruce de fronteras de una


imagen utiliza un marcador de seleccin para identificar las caractersticas dentro de
una distancia especificada de una lnea o regin. La dilatacin, convierte una lnea a una
amplia franja de anchura seleccionada o se extiende una regin de manera uniforme en
todas las direcciones por una cantidad especificada. Una lnea, tal como una pared o
lmite de grano o clula visto en un microscopio, o una carretera en una imagen de
satlite, puede ser procesada para generar una amplia lnea de espesor seleccionado. El
uso de la lnea o de la regin dilatada para seleccionar funciones, selecciona las
caractersticas que, independientemente de su tamao o forma, entran dentro de esa
distancia de la lnea o lmite original. Repitiendo esta operacin con diferentes distancias
de dilatacin proporciona una manera de clasificar o contar caractersticas de una
imagen.

Doble Umbralizacin

El uso de la tcnica de seleccin por localizacin tiene como desventaja que la imagen puede tener
bordes no uniformes, limitando as la visualizacin de una regin.
Las dos imgenes binarias se combinan con una caracterstica AND para mantener cualquier funcin en
la segunda imagen que es seleccionado por los marcadores en la primera. Este utiliza los pocos pxeles
oscuros que sin duda se encuentran dentro de las fronteras, al tiempo que rechaza el ruido dentro de los
granos. Un cierre morfolgico se aplica para rellenar los huecos dentro de los lmites. El aumento de la
anchura aparente de los lmites no es importante, ya Que la esqueletizacin se utiliza para reducir las
lneas de lmite a anchura mnima. El resultado puede entonces ser utilizada para las mediciones de los
granos y los lmites de grano.

Erosin y dilatacin

La erosin es una de las dos


operaciones fundamentales (la otra
es la dilatacin) en el procesamiento
de imgenes morfolgico en las que
se basan todas las otras operaciones
morfolgicas.
Fue
definida
originalmente
para
imgenes
binarias, ms tarde se extendi a
imgenes en escala de grises y
posteriormente
a
retculos
completos.
La dilatacin se describe como un
crecimiento de pixeles, es decir, se
marca con 1 la parte del fondo de la
imagen que toque un pixel que forma
parte de la regin. Esto permite que
aumente un pixel alrededor de la
circunferencia de cada regin y as
poder incrementar dimensiones, lo
cual ayuda a rellenar hoyos dentro de
la regin.
Ejemplo de aplicacin: La dilatacin
es el opuesto de la erosin. Las
figuras que estn trazadas muy
tenuemente engruesan cuando son
"dilatadas". La manera ms fcil de
describirlo es imaginar que el mismo
texto es escrito con una pluma ms
gruesa.

Apertura

La apertura de A por B se obtiene por la erosin de A por B, seguida por la dilatacin de la imagen resultante por
B:

La apertura tambin est dada por


, lo que significa que es el lugar geomtrico de las traslaciones
del elemento estructurante B dentro de la imagen A. En el caso del cuadrado de lado 10 y un disco de radio 2
como elemento estructurante, la apertura es un cuadrado de lado 10 con las esquinas redondeadas, donde el
radio de las esquinas es 2.

Ejemplo de aplicacin: Supongamos que alguien ha escrito una nota en un papel que no es absorbente por lo que
parece que estn creciendo pequeas races peludas por todas partes de la escritura. La apertura esencialmente
elimina las pequeas "rayitas" exteriores derramadas y restaura el texto. El efecto secundario es que redondea
las cosas. Los bordes afilados comienzan a desaparecer.

Cierre

El cierre de A por B se obtiene por la dilatacin de A por B, seguida por la erosin de la


estructura resultante por B:

El cierre tambin se puede obtener por


donde Xc denota el
complemento de X respecto a E (esto es,
Lo anterior significa que
el cierre es el complemento del lugar geomtrico de las traslaciones de la simetra del
elemento estructurante fuera de la imagen A.

Comparacin entre apertura, cierre,


erosin y dilatacin

Isotropa
Es la caracterstica de los cuerpos cuyas propiedades fsicas no dependen
de la direccin en que son examinadas. Es decir, se refiere al hecho de que
ciertas magnitudes vectoriales conmensurables dan resultados idnticos
con independencia de la direccin escogida para dicha medida.

Mediciones con erosin y dilatacin


La erosin producida "n" veces, usando un coeficiente de 0 a
1, o alternndolos causan caractersticas de reduccin radial
en "n" pixeles (con variaciones locales dependiendo la forma
de las caractersticas originales). Esto causa que tengan una
dimensin menor a 2n pixeles para desaparecer todos juntos.

Mapeo de distancias Euclidianas


Una tcnica iterativa para la construccin de mapas de distancia puede ser
programada de la siguiente manera:

1. Asignar al brillo un valor de 0 a cada pixel en el fondo.


2. Ajustar la variable "n" igual a 0.
3. Para cada pixel en el fondo que toque un pixel cuyo valor de brillo es
"n", asignar al brillo el valor de "n"+1.
4. Incrementar "n" y repetir el paso 3, hasta que todos los pixeles de la
imagen hayan sido asignados.

Segmentacin por cuenca


El mtodo clsico para lograr esta separacin, es utilizando un
mtodo iterativo. La imagen es erosionada repetitivamente y
cada paso se separan aquellas caractersticas que
desaparecieron del paso anterior son designadas como
ltimos puntos de erosin.

ltimos puntos de erosin


Los ltimos puntos de erosin mencionados en el mtodo de
segmentacin por cuenca pueden ser utilizados como una
herramienta de medicin directa. El nmero de puntos nos da
un nmero de variables separadas en la imagen, mientras que
el brillo de cada punto nos da el valor del tamao de la
caracterstica.

Capitulo 9: Mediciones globales


de una imagen

Mediciones globales y estereologa


Existen dos principales clases de medicin de imgenes, las
realizadas en un campo entero de imagen y las que se realizan en
cada una de las diferentes caractersticas de la imagen. La
estereologa relaciona las mediciones que pueden ser realizadas en
imgenes bidimensionales a tridimensionales cuyas estructuras
estn representadas y muestreadas por esas imgenes.

Superficie de rea
Otro parmetro estructural que es medido con
estereologa es la superficie de rea. Las superficies
generalmente limitados entre dos volmenes, como la
superficie del ncleo, el rea total de la pared de una
clula, el total de granos en el metal o la porosidad en
una piedra arenosa.

Tamao de grano
El mtodo de tamao de grano fue inventado para la
medicin en un parmetro micro estructural, utilizado
para el control de calidad del bronce, y posteriormente
aplicado para otros metales y no metales.

Longitud
La medicin de longitud es usada principalmente para
estructuras que son estiradas en una direccin con
relativo bajo espesor, como neuronas o vasos
sanguneos, fibras, o metales. Es posible medir el total
de orillas con mtodos como el polidrico en metales.

Espesor
La medicin del espesor algunas veces puede ser
realizada con una malla paralela con lneas radiales.

Curvatura y conectividad
Las superficies y lneas en el plano tridimensional raramente son
planas o derechas, y en relacin con el dimetro nominal, su
curvatura puede contener informacin importante sobre la evolucin
de su estructura, qumica o presin. Para la estructura de granos en
equilibrio, el contacto entre superficies es idealmente plano pero las
orillas se encuentran localizadas en la curvatura.

Estereologa Clsica
El mtodo clsico es asumir la forma de las partculas. La
forma ms conveniente de asumir es una esfera. La
distribucin de los tamaos de crculos producidos por
secciones aleatorias de la esfera pueden ser calculadas
como se muestran a continuacin.

Capitulo 10: Medicin de


caractersticas especficas

Medicin del brillo


El rango ms tpico de brillo son valores de 0 a 255
(rango de 8 bits), pero dependiendo del tipo de cmara,
escaner, u otro equipo de adquisicin, existen rangos
dinmicos mayores a 10 bits.

Determinacin de ubicacin
A menudo, localizar algunas caractersticas de la imagen
puede servir para establecer marcas que permiten la
calibracin, as que todas estas caractersticas de las imgenes
puede ser localizadas con precisin. Los limites de
caractersticas pueden ser determinados fcilmente
encontrando los pixeles mas grandes y las coordinadas mas
pequeas en direcciones horizontales y verticales.

Orientacin
El centroide es una descripcin de la localizacin de las
caractersticas que se encuentran en la parte central, la orientacin
es definida por todos los pixeles en la imagen que normalmente
resulta mejor que todos ellos ya que es influenciada en menor
medida por la presencia o ausencia de un pixel nico alrededor de
la periferia donde los accidentes de adquisicin o ruido pueden
causar alteraciones en los lmites.

Alineacin
Existen muchas situaciones de anlisis de imgenes en
las que un procedimiento algortmico es utilizado para
determinar la alineacin o el arreglo necesario. Este
procedimiento es til para el aumento, tratando de
localizar las transmisiones elctricas de las lneas de
reconocimiento de fotos.

Transformada de Hough

La Transformada de Hough es una tcnica para la deteccin de figuras en imgenes


digitales. Esta tcnica es mayormente usada en el campo de Visin por
Computadora. Con la transformada de Hough es posible encontrar todo tipo de
figuras que puedan ser expresadas matemticamente, tales como rectas,
circunferencias o elipses.

Anlisis de imgenes
En el anlisis automatizado de imgenes, es comn encontrar el
problema de detectar figuras simples, tales como rectas o
circunferencias. Como primer paso, se puede usar un detector de
bordes para obtener los puntos de la imagen que pertenecen a la
frontera de la figura deseada. Debido a las imperfecciones, ya sea
de la imagen captada o del detector de bordes, existen muchos
puntos que pertenecen a la curva y que faltan en la imagen;
tambin pueden existir desviaciones espaciales entre la figura ideal
(por ejemplo, una recta) y los puntos ruidosos del borde detectado.
Por estas razones, usualmente no es trivial agrupar los bordes
detectados en un conjunto apropiado de figuras, ya sean
circunferencias o cualquier otra figura. El objetivo de la
transformada de Hough es resolver este problema, haciendo posible
realizar agrupaciones de los puntos que pertenecen a los bordes de
posibles figuras a travs de un procedimiento de votacin sobre un
conjunto de figuras paramtricas.

Conteo

En muchas imgenes, el
contar objetos requiere
identificar algunos patrones
nicos de brillo y color que
pueden ser reconocidos
por un programa de
computadora, y en caso de
ser necesario por un
humano. Las personas
generalmente no cuentan
preciso, pero son buenos
con el reconocimiento.

Tamao de la caracterstica
La medicin ms bsica de caractersticas en imgenes
es simplemente por el rea. Para las representaciones
basadas en pixeles, este es el nmero de pixeles dentro
de la caracterstica, el cual es determinado por conteo.
Para una representacin limitada el rea puede ser
calculada.

Crculos y Elipses
Los crculos a menudo son utilizados para representar el
tamao, debido a que el dimetro provee una medicin
linear conveniente que ignora los detalles de la figura.
Adems el circulo equivalente con la misma rea que la
caracterstica, el circulo circunscrito puede ser utilizado.

Dimensin del Calibre


Una forma de determinar el espesor de una
caracterstica que es aplicable ya sea a figuras derechas
o curvas es utilizando un muestreo del mapa de
distancias Euclidianas, obteniendo valores a travs de la
lnea de centros del esqueleto.

Permetro
El permetro es una caracterstica familiar con los
parmetros geomtricos que esta bien definida en un
espacio real y continuo pero no en una imagen con
pixeles. La medicin numrica del valor no es sencillo.
La forma ms precisa de obtener mediciones del
permetro son obtenidas metiendo finas capas en los
lmites de las figuras.

S-ar putea să vă placă și