Sunteți pe pagina 1din 58

Dpto.

Electrnica, Automtica e Informtica Industrial 33



2 Formacin de las imgenes
Los sistemas de Visin Artificial se
encuentran con escenas visuales de
informacin en el espacio continuo y sin
embargo el desarrollo y diseo de los
equipos se sustenta en tecnologa digital.
Luego se evidencia el paso de informacin
continua en el tiempo a discreta. La
captacin de la informacin presente en el
espacio continuo, as como la forma en que
sta va a ser alterada, como consecuencia
de la transformacin a datos discretos,
requiere ser estudiada con cierta
profundidad para comprender las
limitaciones que impone el sistema de
formacin de imgenes en su conjunto.
La figura 2.2 muestra un esquema de adquisicin de escenas. El motivo es
iluminado de manera ptima, tal que aumente el contraste entre el fondo y los objetos de
inters; la luz reflejada o transmitida pasa a travs de un sistema ptico, adecuando la
escena al tamao del elemento sensor. El transductor est constituido por elementos
sensores que convierten los haces luminosos recibidos en una seal elctrica. La cmara
Figura 2.1 Captura digital: desde el espacio
continuo al discreto
Carlos Platero Apuntes de Visin Artificial
34 Dpto. Electrnica, Automtica e Informtica Industrial
de estado slido da un formato a la imagen
recibida en seal elctrica pudiendo ser de tipo
digital o analgico. sta es transmitida hasta el
computador, ya sea para su monitorizacin o
procesamiento. En el caso de utilizar seal de
vdeo analgica se requiere de la conversin a
formato digital. Sea como fuese, se habr
generado una correspondencia entre la realidad
y lo almacenado en el computador.
Se pretende abordar las capacidades de
la adquisicin y de formacin de las escenas visuales. Como se ha podido observar, las
posibilidades de estos equipos dependen de una multitud de factores. El diseo de una
aplicacin adecuada requiere del anlisis de todos estos factores que influyen en las
prestaciones, buscando, adems, las fuentes de degradacin en la adquisicin de las
imgenes. Estas ltimas pueden ser eliminadas y/o compensadas mediante la seleccin
apropiada de soporte fsico, compromisos de medidas y tcnicas de calibracin. El
exacto conocimiento de los factores que influyen en la calidad de la imagen permitir
con posterioridad la seleccin correcta de los componentes.
El desarrollo de este captulo va a tratar de cmo afecta los diferentes elementos
del sistema de formacin de imgenes a la mtrica virtual, centrndose especialmente en
el subsistema de iluminacin, en la ptica y en la seleccin de arquitecturas de cmaras
de estado slido. Los motivos son que stos representan los elementos ms crticos en la
calidad de la imagen y por ende en la mtrica. El captulo finalizar con algunas
tcnicas de calibracin de las cmaras.
2.1 Caracterizacin de imgenes digitales
La calidad de una imagen es una impresin subjetiva que va desde pobre hasta
excelente. La habilidad de la percepcin realizada por el cerebro viene afectada no slo
por el sistema de visin humano, sino tambin por otros factores como son: las
emociones, el aprendizaje y la memoria. Las relaciones entre stas son complejas,
intrincadas y no comprendidas. Los juicios personales varan ante una misma imagen y
las valoraciones pueden ser muy dispares.
Muchas expresiones han sido dadas para categorizar una imagen, cada una es
apropiada segn un particular conjunto de condiciones. Estas expresiones suelen ser
obtenidas desde las observaciones empricas, donde un grupo de imgenes son
ordenadas y posteriormente se infiere alguna ecuacin que justifique la clasificacin.
En un principio, la calidad de la imagen estaba relacionada con las lentes. Con el
avance de la tecnologa, la calidad se ha centrado en la minimizacin de la relacin
seal ruido, SNR, y en la arquitectura de las cmaras. Muchos tests han dado medidas
sobre la calidad de la imagen. La mayora de las medidas estn relacionadas con la
calidad de las pticas, la resolucin de la cmara o la relacin seal ruido del elemento
sensor. En general, las imgenes con altas prestaciones pticas y bajo ruido son
clasificadas como imgenes de gran calidad. Las prestaciones del sistema de visin
S i s t e m a d e
i l u m i n a c i n
B a t e r a d e c m a r a s
M o v i m i e n t o s d e l a b a n d a
L n e a d e i n s p e c c i n
p t i c a
E s c e n a

Figura 2.2. Elementos constituyentes
de formacin de imgenes


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 35
dependen de las cmaras, lentes, iluminacin,
filtros pticos, etc. Slo al final se puede plantear
la calidad de la imagen.
Los ms importantes factores que afectan
a la calidad geomtrica y radiomtrica de una
imagen adquirida por una cmara de estado
slidos son los siguientes:
Iluminacin
Superficie a visualizar
ptica
Cmaras
Transmisin y digitalizacin de las imgenes
Entorno
La seleccin de una apropiada iluminacin es una pieza clave en las tareas de
procesamiento de las imgenes. La uniformidad de luminosidad en la superficie, la
estabilidad temporal y su respuesta espectral, as como las propiedades pticas del
entorno deben ser consideradas. La falta de homogeneidad de intensidad luminosa en la
escena puede acarrear que cientos de pxeles aparezcan con bajo contraste. Por la
extensin y la importancia en el buen funcionamiento de los equipos de visin, se ha
dedicado un apartado para abordar el estudio de las fuentes luminosas.
El segundo aspecto se refiere a la naturaleza del producto a inspeccionar. El tipo,
el color, el tamao y la forma del detalle a analizar, obviamente influyen en las
exactitudes de las medidas. stas dependen, sobre todo, del tamao del objeto de
estudio y de su contraste.
Los aspectos referidos a las pticas, sensores, cmaras y digitalizadoras van a ser
abordados con mayor detalle y representan el ncleo del captulo. Se plantearn los
aspectos de focalizacin de la radiacin luminosa que llegue al elemento sensor y cmo
se modela, para pasar posteriormente al estudio del funcionamiento del sensor y de la
composicin de las cmaras de vdeo.
Por ltimo, respecto al entorno, hay que citar la temperatura, la humedad, las
vibraciones y las iluminaciones ambientales. Por ejemplo, el efecto de la temperatura
puede producir profundos cambios en las cmaras. Hay multitud de cmaras que
requieren ms de dos horas antes de alcanzar su estado estable. Estos cambios provocan
errores de gran magnitud. Sus causas se encuentran en las deformaciones mecnicas, en
la sensibilidad de elemento sensor con la temperatura y en las variaciones en la
frecuencia del reloj interno de la cmara.
L e n t e F i l t r o I R D i f u s o r S e n s o r
C r i s t a l p r o t e c t o r
Figura 2.3. Partes constitutivas de una
cmara
Carlos Platero Apuntes de Visin Artificial
36 Dpto. Electrnica, Automtica e Informtica Industrial
2.2 Iluminacin
La iluminacin juega un papel primordial dentro del proceso de visin. Los
sistemas de iluminacin ayudan a simplificar considerablemente el anlisis e
interpretacin de las escenas. Muchas veces, los algoritmos de procesamiento pueden
ser reducidos drsticamente con una seleccin adecuada del sistema de formacin de las
imgenes. Por el contrario, la falta de estudio sobre la adquisicin de las imgenes
provocar el aumento de la complejidad de los algoritmos y las dificultades de
generalizacin del equipo de Visin Artificial. Las imgenes recibidas por las cmaras
no pueden estar, generalmente, en un ambiente de iluminacin no estructurada, esto es,
donde las condiciones de iluminacin no hayan sido estudiadas. En estos casos, la
propia sombra de otro objeto que interfiera har peligrar el xito del montaje.
Los sistemas de Visin Artificial trabajan, normalmente, con iluminaciones
estructuradas. El espacio captado por las cmaras est aislado del resto. No hay
contaminacin lumnica, no hay sombras inesperadas, no existen objetos que
interseccionen a los escenarios que se desean capturar. La iluminacin se disea para
que sea capaz de resaltar los objetos de inters. La iluminacin depende bsicamente de
la naturaleza de las superficies a inspeccionar y del
tipo de fuente luminosa.
Normalmente, la primera reduccin
consiste en tratar los objetos como si fuesen
opacos. La radiacin transmitida no es
considerada. En Computacin Grfica se estudia la
interaccin entre la luz y las superficies y cunta
radiacin le llega al sensor. En una primera
aproximacin se estudia la interaccin entre la
fuente luminosa y los cuerpos. Sin embargo, estas
iteraciones no son suficientes para crear imgenes
sintticas crebles. As, en el movimiento de los
objetos sobre un escenario no se produciran
cambios de iluminacin o sombras. Estas
consecuencias se derivan de no tener en cuanta las
radiaciones de los cuerpos existentes en la escena.
Una de las tcnicas de renderizacin ms
empleadas se llama Ray Tracing. Consiste en
lanzar rayos de luminosidad y ver cmo interactan
con las superficies de los objetos que hay en el
escenario, tomando en cuenta la interaccin entre
todos ellos.
El problema en Visin Artificial es el
inverso de la Computacin Grfica. No se trata de
generar una imagen sinttica, sino de ubicar correctamente la iluminacin, los sensores
y los cuerpos a examinar para resaltar las caractersticas visuales de los objetos.
Figura 2. 4 a) Dibujo sin interaccin
con la luz, b) Grfico con interaccin
entre la luz y la materia
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 37
2.2.1 Modelos de superficies opacas
La manera en la que la luz es reflejada en una superficie, depende de entre
muchos factores, de las formas macroscpicas que constituyen las superficies. De esta
manera, en superficies lisas al ser iluminadas con un haz incidente, la luz reflejada sobre
ellas toma una sola direccin; en cambio, sobre superficies rugosas tienden a
difuminarse en mltiples direcciones. Para establecer con exactitud el fenmeno de la
reflexin es necesario tener un conocimiento a priori de las estructuras de las
superficies, es decir, un modelo de stas. Se pueden catalogar en dos clases de modelos
de superficie: mapas de perfiles y modelos aleatorios. Un exacto perfil puede ser
determinado con las medidas de alturas en cada punto de la superficie, por algn tipo de
dispositivo existente en el mercado. No obstante, este mtodo es caro e impracticable en
muchos casos. Por lo tanto, suele modelarse mediante funciones de densidad
estadsticas que tienden aproximarse al verdadero comportamiento de la superficie ante
un haz de luz incidente.
Una superficie puede ser modelada a
partir de una coleccin de microsuperficies
planas, tal como queda reflejado en la figura
2.5. Cada microsuperficie tiene su propia
orientacin. El ngulo de inclinacin, o, es el
parmetro que determina el grado de oblicuidad
respecto a la normal del plano medio. En el
caso de superficies isotrpicas, la probabilidad
de distribucin de o sera uniforme y las
microsuperficies estaran rotadas respecto a la
normal, n, con igual probabilidad en todas las
direcciones. Esto lleva a que puede modelarse
la superficie mediante una funcin de distribucin unidimensional. Por ejemplo, la
superficie puede responder a una funcin de densidad gausiana para el nivel de
microfacetas con N(
o
, o
2
o
). Grandes valores en la varianza, o
2
o
, indicarn la
presencia de superficies rugosas, y al contrario, valores pequeos sealarn superficies
lisas. Los modelos basados en la funcin de distribucin del ngulo de inclinacin en las
microsuperficies son muy populares, pues la difusin de la luz reflejada es explicada por
los niveles de inclinacin y no por la cartografa (altura) de la superficie. Por esta razn,
los modelos de inclinacin, aunque relativamente ambiguos, son ampliamente utilizados
en los problemas de reflexin de la luz en superficies.
La impresin visual de los humanos es bastante vaga con el concepto de
rugosidad. De manera que una superficie vista de cerca parece rugosa y algo ms
alejada, puede llevar a la conclusin de calificarla como lisa. De hecho, los humanos
hacen cambios de vistas para ayudarse en el juicio de la rugosidad de la superficie.
A diferencia de las valoraciones humanas, la teora de reflexin tiene bien
definida el concepto de rugosidad; sta debe relacionar las irregularidades de la
superficie con las direcciones que tome la luz ante un haz de luz incidente. Para
superficies cuyas irregularidades son menores que la longitud de onda de la luz, o
o
<< ,
la mayor parte del flujo incidente ser reflejada especulrmente en una sola direccin.
En caso contrario, si las irregularidades superan la longitud de onda del haz, la
n
o
M i c r o s u p e r f i c i e s
p l a n a s

Figura 2. 5. Superficie formada por
microfacetas



Carlos Platero Apuntes de Visin Artificial
38 Dpto. Electrnica, Automtica e Informtica Industrial
superficie difuminar la luz en mltiples direcciones, produciendo una radiacin difusa.
En la prctica, la radiacin reflejada es una combinacin de ambos casos.
El modelo ms utilizado en Visin Artificial se basa en las conclusiones de
Nayar. La reflexin de la luz sobre una superficie est formado por tres componentes: la
primera corresponde con la reflexin difusa explicada por el modelo lambertiano. La
segunda justifica el halo especular que se fundamenta en el modelo de Torrence-
Sparrow y la ltima se emplea en superficies lisas y hace referencia al pico especular.
H a l o d i f u s o
H a l o e s p e c u l a r
P i c o e s p e c u l a r
L u z i n c i d e n t e
M a n a n t i a l
n
S e n s o r
u
r
u
i
u
i

Figura 2. 6 Tipos de radiacin al iluminar una superficie segn el modelo de Nayar
2.2.2 Clculo de la iluminacin y la luminancia
La iluminacin sobre una superficie, tal como se
vio en el captulo anterior, viene determinada por la
intensidad del foco luminoso y por las posiciones
geomtricas entre foco y superficie. Para el caso de
intensidad isotrpica, puntual y de posicin en el eje axial
de la superficie respecto del foco, la iluminacin es igual
a:
2
r
I
dA
d I
dA
d
E
r
~

= =
e |

Cuando la iluminacin no es paraxial hay que
descomponerla en una componente horizontal y en otra
vertical a la superficie:
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 39
( )
( ) o
o
tg E E
d
I
E
H V
H
=

=
2
cos

En general, si un punto est iluminado por ms de un foco, su iluminancia total
es la suma de las iluminancias recibidas:
( )
( )

=
i
i H V
i
i
i i
H
tg E E
d
I
E
i
o
o
2
cos

Ejemplo 2.1
Una superficie est iluminada por una fuente luminosa puntual de 0.1
W/sr de intensidad constante en todas direcciones situada a 2 m de altura.
Calcular la iluminancia de superficie y la iluminacin vertical, si la inclinacin
entre la superficie y la fuente, o, es de 30.
2
2
2
2
3
/ 72 . 18
/ 4 . 9
/ 2 . 16
cos
m mW E
m mW tg E E
m mW
h
I
E
H V
H
=
= =
= =
o
o

Ejemplo 2.2
Una superficie circular de 3 m de radio est iluminada
por una bombilla de 50 cd de intensidad constante en todas
direcciones situada a 2 m de altura sobre el centro de la
plataforma. Calcular la iluminacin mxima y mnima sobre la
superficie.
La iluminacin mxima se dar en la vertical del foco:
lx
h
I
E 5 . 12
2
max
= =
La mnima se dar en la frontera:
( )
( ) ( )
lx
h
I
E 13 . 2
cos /
cos
2
min
=

=
o
o

Carlos Platero Apuntes de Visin Artificial
40 Dpto. Electrnica, Automtica e Informtica Industrial
Hasta ahora se ha hablado sobre la iluminacin radiada, pero
para medir la recibida por un observador se emplea el concepto de
luminancia o radiacin. sta se defini como la relacin entre la
intensidad radiada por una fuente, en una direccin determinada, por
la superficie aparente. Es sta la que llega al ojo o a la cmara y no la
iluminacin.
La reflexin de la luz sobre una
superficie rugosa se aproxima a un
comportamiento de reflexin en todas las
direcciones. Una superficie que refleja la luz
de esta forma se la llama lambertiana. Para
explicar el modelo de interaccin entre la luz
y la materia se definen los vectores unitarios
n

, l

, v

y r

, segn muestra la figura. La


explicacin del halo difuso se formaliza con:
( ) l n I I
in
d d d

=
Siendo
d
el coeficiente de reflexin difuso adimensional e
in
d
I es la intensidad
incidente en la superficie. En cambio para superficies lisas, la reflexin es de carcter
especular y su modelo es:
( )
k
in
s s s
I I r v =
Donde
s
el coeficiente de reflexin especular adimensional,
in
s
I es la
intensidad incidente en la superficie y k es un parmetro del modelo para disminuir el
efecto especular cuando se desva del vector r

. Normalmente se considera k=100.


Ejemplo 2.3
Se tiene un proyector situado en el techo de 0.04
m
2
de superficie que ilumina con una intensidad de 150
mW/sr en cualquier direccin. Una mesa de 0.5 m
2
de
superficie recibe dicha iluminacin y tiene un
comportamiento lambertiano de factor de reflexin de
0.8. Calcular la luminancia de la fuente y la luminancia de
la mesa para el observador de la figura.
( )
( )
sr m W
sen S
I
v n S
I
L
sr m W
sen S
I
v n S
I
L
m m m m
m
p p P p
p
= =

=
= =

=
2
2
/ 48 . 0
/ 59 . 21
|

o




Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 41
2.2.2.1 Modelo de Phong de Reflexin de la luz
Este modelo local es utilizado en Computacin Grfica para aplicaciones en
tiempo real. Considera los dos mecanismos de reflexin de la luz en superficies: difusa
y especular. En cuanto a la iluminacin, las clasificas en difusa, especular y ambiental.
Su forma de proceder es descomponer la luz en sus distintas formas de onda,
normalmente utiliza las franjas RGB y calcula la interaccin de cada parte del espectro
con la materia. Con posterioridad, al aplicar superposicin, se suma las interacciones de
cada franja y se obtiene la intensidad en cada punto del escenario.
Para facilitar el clculo computacional, no se considera la interaccin propia
entre cuerpos prximos entre s al radiar unos sobre otros. Este trmino es aproximado
por una iluminacin ambiental,
in
a a
I . La intensidad de emisin de un punto para una
determinada longitud de onda es calculada como:
( )
( )
k
in in in
a d s e a a d d s s e
I I I I I I I n l I r v I = + + + = + + +
donde I
e
es la componente de intensidad correspondiente a la emisin de luz o
fuente de iluminacin. Este clculo es realizado slo para cuerpos opacos. Es posible
extender el modelo a cuerpos translcidos, modelizando la refraccin difusa y especular
mediante la ley de Snell.
Ejemplo 2.4
Una fuente luminosa de 0.1
W/sr ilumina a una superficie. Los
factores de reflexin difusa y
especular sobre esta superficie
son 5 . 0 ,
3
1
, respectivamente.
Los ngulos de incidencia y de
colocacin de la cmara son
6
,
4
t
u
t
u = =
r i
, respecto a la
normal de la superficie. Determinar
la intensidad recibida en el sensor.
Considrese que no hay
interferencias de otras superficies y su emisin es nula. Utilizar el modelo de
Pong. Dato: k=100.
( )
( )
1
1 0 0 c o s 4 0 . 8 2
4 3
1
1 0 0 c o s 1 . 5 6 4 2 . 3 8
2 4 6
i n
d d d
k
k
i n
s s s
m W
I I n l
s r
m W m W
I I r v I
s r s r
t

t t

| |
= = =
|
\ .
| |
= = = =
|
\ .

H a l o d i f u s o
H a l o e s p e c u l a r
P i c o e s p e c u l a r
L u z i n c i d e n t e
M a n a n t i a l
n
S e n s o r
u
r
u
i
u
i
Carlos Platero Apuntes de Visin Artificial
42 Dpto. Electrnica, Automtica e Informtica Industrial
2.2.3 Tcnicas de iluminacin
Existen muchas tcnicas de iluminacin y resulta difcil de generalizar sobre los
distintos tipos de iluminacin, ya que suele depender de cada caso concreto. Sin
embargo, se pueden clasificar en cuatro grandes grupos: direccionales, difusas, a
contraluz y estructuradas. Se presentan stas y posteriormente se dar un repaso a
combinaciones de las iluminaciones principales.
2.2.3.1 Iluminacin direccional
Consiste en dar una iluminacin orientada al objeto empleando un
haz altamente direccional o colimado. Se utiliza en la localizacin y
reconocimiento de piezas, inspeccin de superficies, seguimiento de
puntos para soldadura o pegamento, etc. La forma del haz luminoso
depende de la aplicacin y del objeto a analizar. Cabe destacar los
siguientes casos: a) Punto luminoso b) Lnea de luz c) Plano de luz y d)
Corona circular
luminosa.
2.2.3.2 Iluminacin difusa.
En ella se intenta que los haces luminosos
incidan sobre el objeto desde todas las direcciones y no
slo desde la fuente luminosa. Proporciona el mnimo
contraste del objeto y elimina las sombras. Se utiliza
cuando los objetos a analizar presentan superficies
suaves.
Para crear una iluminacin difusa se utilizan
difusores de color blanco mate.
2.2.3.3 Iluminacin a contraluz.
Consiste en colocar la fuente luminosa por
detrs del objeto, de manera que la informacin
capturada por el sensor proviene del flujo luminoso
Figura 2.7
Tcnica
direccional
Figura 2. 8. Tcnica difusa
Figura 2. 9 Tcnica a contraluz
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 43
transmitido por el cuerpo. Si el objeto es opaco, ste aparecer como una sombra y las
imgenes se constituyen bsicamente en slo dos niveles de grises. Se emplea
preferentemente para la localizacin de piezas y anlisis dimensional. El principal
inconveniente es la prdida de los detalles de los cuerpos. Una preocupacin a tener en
cuenta es el posible deslumbramiento de la cmara, producido por la cantidad de
radiacin que alcanza al sensor, lo que origina un recorte en la dimensin de los objetos.
En caso de cuerpos translucidos dejar informacin sobre las propiedades
internas de la materia. ste es el fundamento de la tomografa o de la radiografa. La
imagen capturada depender de la absorcin de la materia. En este ejemplo se observa
que la fuente de iluminacin no tiene necesariamente que pertenecer al espectro visible.
2.2.3.4 Iluminacin estructurada.
Este tipo de iluminacin se sirve de la
proyeccin de puntos, franjas o rejillas sobre la
superficie de trabajo. En funcin de cmo se deforme
este patrn de luz sobre la superficie se puede detectar
las singularidades de la pieza objeto de anlisis. Este
mtodo posee dos ventajas con respecto a las
anteriores.
1. Establece un patrn de luz conocido
sobre la superficie de trabajo y las diferencias con este patrn indican la
presencia de un objeto, simplificndose as el problema de deteccin de
un objeto.
2. Analizando la forma en que el patrn de luz es distorsionado, es posible
obtener informacin de las caractersticas tridimensionales del objeto.
2.2.4 Luz polarizada
Los haces de luz no polarizada consisten en radiaciones electromagnticas con
vibraciones transversales de igual magnitud en un
nmero infinito de planos perpendiculares a la
direccin de desplazamiento. Algunos materiales
actan selectivamente absorbiendo la energa en
ciertos ngulos y transmitindola en otros. El
resultado de un polarizador es un haz de luz que, en
esencia, parece vibrar en una sola direccin
(polarizador total), o vibra en todas direcciones pero
con distinta magnitud (polarizador parcial). El
estado de polarizacin depende de la relacin
existente entre las fases y amplitudes del campo
elctrico y magntico.
Figura 2. 10. Tcnica de luz
estructurada
Figura 2. 11. Luz polarizada
Carlos Platero Apuntes de Visin Artificial
44 Dpto. Electrnica, Automtica e Informtica Industrial
La percepcin de un objeto es el resultado de la reflexin difusa y especular de
la luz incidente sobre ste. La reflexin especular es acromtica y est parcialmente
polarizada, mientras que la reflexin difusa no est polarizada y es la que al actuar
selectivamente sobre las distintas longitudes de onda dan la sensacin de color. Para
obtener imgenes de una superficie coloreada habr de emplear un filtro polarizador que
impida la reflexin especular, polarizada y acromtica, haciendo llegar al sensor slo la
reflexin difusa.
Se suele emplear dos polarizadores, uno en la iluminacin y otro en la cmara.
Generalmente se emplean 0/90 y 45/135.
2.2.5 Ejemplos de iluminaciones.
A continuacin se enumeran algunas iluminaciones utilizadas en Visin
Artificial, mezclas de las anteriores. Se hace una breve descripcin as como sus
ventajas e inconvenientes.
1. Iluminacin Frontal Direccional: Es la tcnica ms empleada. La cmara es
posicionada mirando al objeto en el mismo plano que la iluminacin. La cmara
recibe la luz reflejada del objeto. Ventajas: especialmente til para observar
superficies, fcil de implementar y con posibilidad de utilizar la fibra ptica.
Desventajas: Puede crear reflejos no deseadas.









2. Iluminacin Frontal Difusa: Usada para generar iluminacin superior (la
fuente est ms elevada que la escena) . Ventajas: Es suave, regular no
direccional, reduce el brillo en superficies metlicas, relativamente fcil de
implementar. Desventajas: Los bordes pueden quedar difuminados y el
contraste es bajo en zonas monocolor.
Figura 2. 12 Ejemplos de iluminacin frontal empleado en la inspeccin de etiquetas
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 45
3. Iluminacin de Tienda (da nublado): No direccional, totalmente difusa,
iluminacin superior que produce iluminacin como la de un da nublado.
Bueno para piezas metlicas (bujas, cojinete de bolas) y componentes
electrnicos. Ventajas: Elimina brillos y sombras. Desventajas: Debe rodear la
pieza, puede ser costoso, el tamao puede ser un
problema.

4. I luminacin Colimada Posterior: Iluminacin
posterior a travs de una lente colimada, de modo que
los rayos de luz son casi paralelos. Ventajas: Produce
bordes muy contrastados para mediciones de precisin.
Desventajas: Difcil de implementar si el material se
mezcla en la direccin del haz y puede ser demasiado brillante para cmaras sin
filtro.

5. I luminacin de Campo Oscuro: La luz
incidente se refleja lejos de la cmara y la
iluminacin es creada por reflexin especular.
Ventajas: Ilumina defectos y produce una
imagen de alto contraste en algunas
aplicaciones. Desventajas: no ilumina
superficies planas.

6. Contraluz Difusa: La luz est en el lado opuesto de la cmara y va a travs de
un material difusor, tal como papel de estraza o vidrio translucido. Ventajas:
Fcil de implementar, crea silueta del objeto, imagen de muy alto contraste y
bajo coste. Desventajas: los bordes pueden quedar difuminados, puede ser
difcil de implementar dependiendo de la posicin del material.

7. Iluminacin de Bajo ngulo: La luz
incide casi horizontal a la superficie del
objeto. Ventajas: Muestra defectos
topolgicos, Desventajas: Una sola fuente
producir una iluminacin desigual en la
superficie.

8. I luminacin Frontal Polarizada: Iluminacin frontal con un polarizador en la
luz y un polarizador cruzado en la lente. Ventajas: elimina brillos. Desventajas:
reduce significativamente la cantidad de luz a travs de la lente.

9. Contraluz Polarizado: El polarizador y el polarizador cruzado estn en lados
opuestos del objeto. Ventajas: alta iluminacin en ciertos tipos de
Carlos Platero Apuntes de Visin Artificial
46 Dpto. Electrnica, Automtica e Informtica Industrial
caractersticas o defectos en materiales translcidos y relativamente fciles de
implementar. Desventajas: los bordes pueden quedar difuminados y difcil de
implementar para algunas posiciones del material.

10. Iluminacin Estroboscpica: Una iluminacin peridica que dura
microsegundos se usa para congelar la imagen de objetos en movimiento.
Ventajas: toma imgenes sin movimiento, puede ser de rea, fibra ptica o led.
Desventajas: Ms costoso que las fuentes usuales, requiere una precisa
sincronizacin con la cmara y debe estar fuera del alcance visual de las
personas.

11. Iluminacin Estructurada: Un plano de
luz generado por una luz estructurada
mediante conversin de lente cilndrica de
punto a lnea de lser. Ventajas: muestra
informacin 3D, produce alto contraste en
la mayora de las zonas. Desventajas: el
lser por encima de 5 mW es peligroso, la
luz puede ser absorbida por algunas
superficies.

12. Iluminacin Coaxial: La iluminacin va en la
misma direccin que la luz que entra por la
cmara reflejada por los objetos, esto es, la
iluminacin y el eje de la cmara son colineales.
La fuente de luz est colimada (todos los haces
luminosos van en la misma direccin. Ventajas:
elimina sombras e iluminacin uniforme.
Desventajas: complicado de implementar y spera
iluminacin para superficies lustrosas.
2.2.6 Fuentes luminosas.
Entre los elementos comerciales que se pueden utilizar para una correcta
iluminacin son: luces incandescentes, focos halgenos, fluorescentes, lseres y leds.
Las luces incandescentes presentan un coste bajo, son fciles de usar y adems
pueden estar funcionando durante largos periodos de tiempo. stas suelen ser puntos
luminosos, no direccionales y con baja eficiencia energtica. Generalmente presentan la
posibilidad de ajustar la intensidad lumnica, aspecto importante, ya que interesa que el
rea efectiva de la lenta sea lo ms pequea posible, por lo que para estimular al sensor
se requiere mayor potencia lumnica. El principal inconveniente es el elevado calor que
desprenden, producto de su funcionamiento, y que puede limitar su aplicacin.

Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 47
Cuando las fuentes luminosas emplean
corriente alterna, la radiacin luminosa vara de
intensidad y puede provocar la variacin de una
imagen a otra. Por eso, a veces, se emplean fuentes
luminosas que puedan ser alimentadas con corriente
continua, como as sucede con las lmparas
halgenas. Estas bombillas tienen una temperatura
menor que las incandescentes (350C).
Los fluorescentes son fuentes de luz que se
caracterizan por no generar calor. Presentan formas y tamaos variables, as como de
diversos colores de luz. Son comnmente empleados en iluminacin difusa. La
alimentacin debe ser en corriente alterna y para evitar fluctuaciones en las imgenes se
emplean reactancias de altas frecuencias (de 100Hz a 25kHz).
El lser es empleado en iluminacin
estructurada. Es un fuente monocromtica que puede
presentar diferentes patrones de luz: punto, lnea,
rejillas, ... Su gran inconveniente es la necesidad de
emplear sistemas de seguridad, para evitar daos en
los operarios que trabajen cerca del estos sistemas de
iluminacin.
El uso de fibra ptica, como gua de luz, est
asociado a la transmisin de la iluminacin pero no
del calor, por lo que suele ir asociado a fuentes incandescentes. Su aplicacin est
principalmente en la iluminacin de pequeas reas y
concavidades, como por ejemplo en la endoscopia.
Las luces estroboscpicas son ideales para
analizar objetos en movimiento o piezas en una cinta
transportadora. Dan una iluminacin intensa, por lo
que la iluminacin ambiental influye poco. Existen
elementos con pulsos de 2 microsegundos. El mayor
inconveniente es el proceso de sincronizacin entre la
iluminacin y la cmara.
2.2.7 Aspectos a considerar en las fuentes de iluminacin
- Variacin de la iluminacin en pequeos periodos de tiempo: alimentacin
continua, alimentacin alterna en alta frecuencia y sincronizacin.
- Variacin de la iluminacin en largos periodos de tiempo: arranque y
autocalibracin.
- Temperatura y disposicin fsica.
- Fuentes luminosas de alta precisin.
- Suciedad.
- Carcter colimado del haz.
- Mantenimiento, coste y facilidad de recambio.
Figura 2. 13. Fluorescente tipo corona
Figura 2. 14. Luz lser
Figura 2. 15. Gua de luz (fibra
ptica)
Carlos Platero Apuntes de Visin Artificial
48 Dpto. Electrnica, Automtica e Informtica Industrial
2.3 La ptica
La ptica es el elemento del sistema de visin que permite concentrar los rayos
luminosos del entorno sobre el plano sensor. Una vez definido el sistema de
iluminacin, la eleccin de la ptica influir en la calidad de la imagen recibida y del
tamao de los objetos. En este apartado se hace un repaso de los parmetros pticos con
un modelo de lente simple. Posteriormente, se explicaran varias cuestiones prcticas
sobre las pticas comerciales empleadas en las cmaras de vdeo.
2.3.1 Cmara oscura
Desde hace mucho tiempo es conocida la experiencia de la cmara oscura.
Cardan, en 1550, emple la cmara oscura con una lente. Se trata de realizar en un
habitculo cerrado, en una de sus paredes, un pequeo orificio. La luz, tras entrar en la
cmara, se proyecta sobre la pared opuesta a la que tiene el orificio. Por cada rayo
procedente del exterior se obtiene un punto luminoso en el plano proyectivo.
Extendiendo el razonamiento a los infinitos rayos que atraviesan el agujero se obtiene
una imagen invertida y proyectiva del mundo exterior al plano sensor.

Tambin se observa que a medida de que la
separacin entre las paredes de la cmara aumente, la
imagen proyectiva se incrementa de tamao. A este
modelo de cmara oscura se la denomina pin-hole.
Sin embargo, en la cmara oscura, la energa
incidente que atraviese no
es lo suficientemente
elevada como para excitar
al plano sensor. Por lo que
se resuelve aumentando el
tamao del agujero. El efecto provocado es una degradacin
de la imagen, ya que son varios los rayos los que inciden,
pero no necesariamente del mismo objeto, producindose una
imagen borrosa. Estos inconvenientes son subsanados con el
uso de las lentes.
Figura 2. 17. Fundamento de la cmara oscura
Figura 2. 16 Tamao del objeto
proyectado
Figura 2. 18. Tipos de
lentes convergentes o
positivas
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 49
Figura 2. 19 Modelo de lente delgada
2.3.2 Lente simple
Con el objeto de aumentar la luminosidad en el interior de la cmara, sin que la
imagen se haga borrosa al aumentar el tamao del agujero, se utiliza una lente. Una
lente es una sustancia transparente y refringente, limitada por dos caras, una de las
cuales es curva y la otra puede ser plana o curva, pero con la condicin de que sus
centros de curvatura estn en el mismo eje. El efecto deseado es la convergencia o
divergencia del frente de ondas.
La figura representa una lente
convexa
1
de radio R. El centro de curvatura de
la lente se define por C. Sea un punto P
exterior, situado a una distancia Z. Los
infinitos rayos procedentes del emisor que
chocan sobre la lente producirn una direccin
especular, respecto a la normal de la superficie
de la lente. La refraccin del frente de ondas,
gracias a la curvatura constante, se concentra
en el punto P, separado a una distancia z,
respecto a la superficie. La relacin entre estas
distancias con el radio de curvatura viene
definido por la ecuacin de Gauss:
R z Z
2 1 1
= +
En la formacin de imgenes se emplean tanto lentes convergentes o positivas
como divergentes o negativas. Las lentes positivas tienen la propiedad de hacer
converger en un punto los distintos rayos divergentes que proceden de un mismo lugar
del objeto exterior. Las lentes divergentes hacen el trabajo al contrario, no focalizan la
luz, sino que las hacen divergir.
Al emplear lentes convergentes, todos los puntos del plano imagen tienen, por
tanto, la caracterstica de que todos los rayos incidentes en cada uno de dichos puntos,
provienen de un mismo punto del objeto, obtenindose una imagen ntida con una
mayor energa incidente.

1
Una superficie es convexa cuando el centro de curvatura pertenece a la figura geomtrica.
Carlos Platero Apuntes de Visin Artificial
50 Dpto. Electrnica, Automtica e Informtica Industrial


Figura 2. 20. Modelo de lente delgada
La zona sensible de la cmara deber estar situada en el plano de convergencia
de los rayos, en caso contrario, los rayos incidentes sobre el sensor provendr de
distintos objetos, obtenindose una imagen borrosa o desenfocada.
2.3.3 Distancia focal
Se observa que para un mismo
objeto exterior, a medida de que ste se
encuentre ms alejado respecto a la
cmara, el punto de convergencia de los
rayos, al otro lado de la ptica,
disminuye, ya que el grado de
convergencia de la lente permanece
constante y la radiacin incidente tiene
menor divergencia (ver figura 2.22). Al
procedimiento de ajustar la distancia
entre la lente y el plano sensor, con el
objeto de tener una imagen ntida, se le
denomina enfoque.
Dependiendo de la curvatura de
las lentes, stas poseen distintos grados
de convergencia de los rayos
provenientes del objeto y por tanto ser
distinta la distancia entre el plano de la
imagen y la lente. Con el fin de medir el
grado de convergencia de una lente se
utiliza la distancia lente-plano de
imagen. Pero debido a que esta
distancia es variable segn la distancia a
la que est enfocado el objeto, su
medicin se realiza cuando el objeto se
encuentra enfocado a una distancia infinita delante de la cmara; en cuyo caso, los rayos
Figura 2. 22. Distancia de enfoque dependiendo de la
situacin de los objetos
Figura 2. 21. Distancia focal
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 51
procedentes del mismo punto del objeto sern paralelos. La distancia focal, f, se define
como la distancia entre la lente y el plano sensor o focal cuando se encuentra enfocado
hacia el infinito. Esta definicin equivale a decir que la distancia focal es la distancia
entre la lente y el punto de convergencia de todos los rayos paralelos que inciden
perpendicularmente a ella. A este punto de convergencia se le denomina foco de la
lente. Si el objeto se halla a una distancia
finita, la separacin entre la lente y el plano
focal ser mayor que la distancia focal.
Para explicar la formacin de la
imagen se emplea el modelo de lente
delgada. De forma que todos los rayos que
pasen por el centro ptico continan en lnea
recta y los rayos que atraviesen la lente
paralelamente al eje axial de la ptica
convergen en el foco. La proyeccin de un
punto P del exterior, de coordenadas
(X,Y,Z), sobre el plano sensor, p de posicin
(x,y,z) vendr definido, segn la ecuacin de Gauss, por:
f z Z
1 1 1
= +
La lente delgada puede
ser simplificada si se emplea el
modelo pin-hole. Este modelo,
como se ha comentado, reduce la
ptica a un punto de
convergencia situado a la
distancia focal, f. Con esta
suposicin, se considera
despreciable el movimiento de
convergencia de los rayos a
travs del proceso de enfoque.
Por tanto es como si la ptica
estuviera siempre enfocada hacia
el infinito. La ventaja es la
facilidad de modelado del sistema ptico. Por triangulacin, la relacin entre la
geometra exterior y la proyectada mostrada en la figura es:
Y
Z
f
y X
Z
f
x = =
Se denomina factor de magnificacin a la relacin entre el segmento proyectado
sobre el plano imagen y el tamao exterior del segmento fsico:
(2. 1)
(2. 2)
Figura 2. 23. Modelo de lente delgada
Figura 2. 24 Modelo pin-hole
Carlos Platero Apuntes de Visin Artificial
52 Dpto. Electrnica, Automtica e Informtica Industrial
Z
f
Y
y
X
x
M = = =
En el modelo pin-hole, la distancia focal es proporcional al factor de
magnificacin, mientras en el modelo de lente fina es:
Z
M
M
f
1 +
=
En cualquier caso, la distancia focal da una medida del grado de magnificacin
entre la imagen real y la proyectada. El tamao de la imagen proyectiva depende de la
distancia focal. A mayor distancia
focal, menor ngulo visual. Una
eleccin adecuada de la distancia
focal depende de la resolucin
deseada del objeto. El grado de
resolucin espacial del sistema de
adquisicin de las imgenes vendr
determinado por el tamao del
objeto ms pequeo que pueda
distinguirse, sin llegar a
confundirlo. Se analizar ms
adelanta al introducir el teorema de
muestreo.
Ejemplo 2.5
Para la prctica de calibracin de
las cmaras se ha empleado una
cuadrcula tipo de ajedrez. Los lados
son de 27 mm y se ha puesto la rejilla a
1 metro de distancia respecto a la
cmara. Se ha empleado una cmara
de pxel cuadrado de 5.6m. Las aristas
de las caras se ven en 15 pxeles. Cul
debe ser la distancia focal de la ptica?.
Qu rea se visualiza, si la cmara
est constituida por 357x293 pxeles?.
Utilcese el modelo pin-hole.
( )
2
2
3
6 6
2
3
6
341 . 0
10 1 . 3
10 6 . 5 293 10 6 . 5 357
1 . 3 1
10 27
10 6 . 5 15
m
x
M
y x
Y X S
mm f
=

= =
=



(2. 3)
(2. 4)
Figura 2. 25 Magnificacin de la ptica
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 53

Ejemplo 2.6
Qu tipo de espejo se requiere para iluminar una pared situada a 3 m
del foco luminoso, sabiendo que la separacin entre la fuente y el espejo es de
10 cm? Cul es la proyeccin del foco de 5 mm sobre la pared?
El tipo de espejo debe de ser divergente, esto es, su curvatura es cncava y
tendr un radio de curvatura de:
cm R
R
4 . 19
2
1 . 0
1
3
1
= = +
El tamao del foco proyectado ser:
mm
M
x
X M 150 30 10 5
3
1 . 0
3
= = = ~


Ejemplo 2.7
Un pequeo objeto se encuentra a 4 cm de un espejo cncavo de radio
12cm. Calcular la posicin y aumento de la imagen ntida.
m z
z
12 . 0
06 . 0
1 1
04 . 0
1
= = + 3
04 . 0
12 . 0
= = M
Ejemplo 2.8
Un objeto es proyectado por una esfera de vidrio hueca de radio R,
10cm, a una distancia respecto de la superficie de 3R, A que distancia
respecto del centro de la esfera se obtendr la imagen ntida y cuanto ha sido
amplificada?
La imagen invertida dentro de la esfera, al pasar por la zona convexa valdr:
cm
R
z
R z R
6
5
3 2 1
3
1
= = = +
Esta imagen al ser pasada por la zona cncava ser amplificada y la imagen
ntida respecto del centro de la esfera ser:
cm d cm
R
Z
R R Z
78 . 17 78 . 7
9
7
'
2
5 7
1
'
1
= = = = +
Carlos Platero Apuntes de Visin Artificial
54 Dpto. Electrnica, Automtica e Informtica Industrial
El factor de magnificacin ser atenuante:
25
9
9 / 7
5 / 7
3
5 / 3
= ~
R
R
R
R
M
2.3.4 ngulo visual
El tamao mximo de los objetos que se proyectan dentro del rea sensible del
sensor viene determinado por el rea del sensor, por la distancias de los objetos a la
cmara y por la distancia focal, f. Con el objeto de poder comparar los ngulos visuales
de las distintas cmaras, se efecta la medida con el enfoque hacia el infinito.
Con este supuesto, se
calcula el ngulo visual cmo el
ngulo que forman dos rayos que
inciden sobre los bordes externos
de la zona sensible de la imagen,
cuando la imagen se encuentra
enfocada a una distancia infinita.
Puesto que la zona sensible es
normalmente rectangular, su
tamao no es lo mismo en todas
las direcciones, pudindose
hablar del ngulo visual
horizontal, vertical, as como del
ngulo visual segn la diagonal.
Normalmente, los sensores de
vdeo son caracterizados por su
diagonal, D, por tanto, el ngulo
visual se expresa en funcin de
este valor.
Se observa de la expresin que el ngulo visual disminuye con el aumento de la
distancia focal de la lente.
2.3.5 Diafragma
El rea efectiva de la lente va a influir
en las caractersticas de la imagen proyectada
en la zona sensor. Para poder modificar el
rea efectiva de la lente, sin tener que
cambiarla, se emplea el diafragma. El
diafragma es una superficie opaca, colocada
en la ptica, que permite el paso de los rayos
luminosos en un crculo central de la lente e
impide que los rayos que inciden sobre la
corona pasen. Los diafragmas se construyen
de manera que la abertura central de la lente
Figura 2. 26. ngulo visual de la ptica
Figura 2. 27. Colocacin del diafragma
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 55
sea variable, posibilitando de esta manera una graduacin del tamao efectivo de la
lente.
Para una lente con una distancia
focal fija, el efecto ms inmediato de la
variacin de la abertura del diafragma se
refleja en la cantidad de luz que incide
sobre el plano sensor. Esta cantidad de luz
es proporcional al rea efectiva de la lente.
Si se denomina con D el dimetro de la
abertura efectiva, la energa incidente de
los rayos ser proporcional a D
2
.
Pero la
luminosidad en el plano imagen no
depende slo de la cantidad de luz que
atraviesa la lente, sino tambin de la
distancia entre la lente y el plano sensor, la cual es inversamente proporcional al
cuadrado de su distancia focal
2
. Segn estos razonamientos, la luminosidad de una
lente, que expresa el flujo de luz en la superficie del rea sensible, es proporcional a
D
2
/f
2
. Para cuantificar la luminosidad de una imagen se emplea el nmero F de una lente
que se define como F=f/D. Por tanto, una disminucin del nmero F en un valor de 2
equivale a un aumento del doble de la potencia luminosa.
2.3.6 Profundidad de campo
Para que un objeto situado a una distancia L produzca una imagen ntida es
necesario que la lente se encuentre situada a una determinada distancia del plano sensor.
Esta distancia depende de la distancia L del objeto y de la distancia focal de la lente, f.
Cualquier objeto, situado delante o detrs del enfocado, dar lugar a que los
rayos provenientes de un punto de ste no focalicen en el plano de la zona sensible. En
el sensor quedar proyectado como una mancha, denominado crculo de confusin.
Si el dimetro del crculo de
confusin es menor que la mitad de la
resolucin del sistema de adquisicin de la
imagen, dicho sistema ve tambin como un
solo punto de imagen. Por el contrario, si
el circulo de confusin generado por un
punto fuera del foco es mayor que el valor
mencionado, dicho punto aparecer como
borroso o desenfocado. A este valor crtico

2

2
2 2
4
r
D
I
I d I
f F
t
| e = ~
Figura 2. 28. Abertura de la lente dependiendo del
nmero F
Figura 2. 29. Crculo de confusin
Carlos Platero Apuntes de Visin Artificial
56 Dpto. Electrnica, Automtica e Informtica Industrial
se le denomina circulo permisible de confusin, o.
Cuando un punto del objeto se encuentra ms cerca o ms lejos de la distancia L,
a la que se encuentra enfocado el sistema, pero a una distancia tal que el crculo de
confusin generado sea menor del permisible, dicho punto tambin se encontrar
enfocado.
Se denomina profundidad de campo a la zona del espacio dentro de la cual el
objeto forma una imagen proyectada ntida o enfocada. Este valor viene determinado
por el radio del circulo permisible de confusin, o, la distancia focal, f, y la apertura del
diafragma, F:
L F f
L F
L F f
L F
d d d
+

+


= + =
o
o
o
o
2
2
2
2
2 1

Siendo d
1
y d
2
las distancias lmites de
los puntos enfocados por detrs y por delante
respectivamente respecto al punto de foco. La
profundidad de campo, d, posee las siguientes
caractersticas:
1. A mayor nmero F da mayor
profundidad de campo.
2. A menor distancia focal da mayor
profundidad de campo
3. A mayor distancia al objeto
supone mayor profundidad de
campo.
4. Cuanto mayor sea el radio del crculo de confusin permisible, menor
resolucin del sistema y tanto mayor ser la profundidad de campo.
5. La profundidad de campo es mayor por detrs del objeto que por delante,
d
1
>d
2
.
La primera caracterstica supone que cuanto menor sea la apertura de la lente
mayor ser la profundidad de campo. La abertura de la lente hace algo ms que
controlar la cantidad de luz que penetra en la cmara. Tiene una segunda funcin muy
importante, la de controlar la profundidad de campo.
2.3.7 Aberraciones y distorsin de la imagen
El trmino aberraciones designa las imperfecciones introducidas en las
imgenes por los sistemas pticos. Hasta ahora se ha supuesto que la lente hace
converger los rayos divergentes de un punto del espacio en un nico punto del plano
sensor. Sin embargo, este hecho slo sucede cuando la luz es monocromtica y situada
en las proximidades del eje ptico. Hay dos clases de distorsiones: cromticas y
geomtricas. Las primeras estn relacionadas con el espectro frecuencial de los rayos y
las segundas aparecen si los rayos que inciden en la ptica estn alejndose del eje axial
de la lente.
(2. 5)
Figura 2. 30. Profundidad de campo
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 57
2.3.7.1 Aberracin cromtica
Se debe al diferente ndice de refraccin de un rayo luminoso segn su longitud
de onda. Existen dos tipos de aberracin cromtica: longitudinal y lateral.
Aberracin cromtica longitudinal. Este
tipo de aberracin provoca que los rayos de
distintas longitudes de onda procedentes de un
punto sobre el eje ptico de la lente se enfoquen
sobre diferentes planos de imagen.
Aberracin cromtica lateral. Ocurre
debido a que la magnificacin de la lente cambia
segn la longitud de onda del rayo, produciendo un
desplazamiento lateral de los puntos de
convergencia de los rayos de diferente longitud de
onda.
2.3.7.2 Aberracin geomtrica
Las cinco aberraciones geomtricas bsicas o aberraciones de Seidel, en honor al
investigador que las clasific, son: esfrica, coma, astigmatismo, curvatura de campo y
distorsin. Las cuatro primeras afectan a la nitidez de la imagen y la quinta a la forma
de los objetos proyectados.
Aberracin esfrica. Del haz de rayos que parten de un punto del objeto situado
sobre el eje de la lente, aquellos que
entran en la lente a una mayor altura
sobre dicho eje son refractados a
diferentes puntos sobre el eje ptico,
producindose un desplazamiento del
foco. La aberracin esfrica puede ser
subsanada mediante el diafragma;
cuanto mayor sea el valor de F, menor
ser el radio de la lente, reducindose
as esta aberracin.
Coma. Hasta ahora se ha
supuesto que los rayos son paraxiales,
pero cuando inciden con un cierto
ngulo sobre el eje, stos no son
enfocados sobre el plano de imagen,
sino que forman una imagen similar a
un cometa con una cola. La cola tiene
el aspecto de crculos que permanecen
siempre tangentes a dos rectas que
forman entre s un ngulo de 60. Esta
cola puede apuntar en la direccin al
Figura 2. 31 Aberracin cromtica
Figura 2. 32. Aberracin esfrica
Figura 2. 33. Aberracin de coma
Carlos Platero Apuntes de Visin Artificial
58 Dpto. Electrnica, Automtica e Informtica Industrial
centro de la imagen o en la opuesta, originando la coma entrante o la coma saliente. Un
objeto que contenga curvas concntricas al eje ptico sufrir un gran desenfoque a lo
largo de un borde de cada curva concntrica. Si una lente no est corregida contra la
coma, el contraste en los bordes de la imagen ser malo. La coma puede ser corregida
dando una menor apertura al diafragma.
Astigmatismo. En algunos
objetivos ocurre que resulta
imposible enfocar con nitidez
simultneamente los objetos
verticales y horizontales, incluso
estando ambos en el mismo plano.
Este defecto se comprueba
fcilmente fotografiando unas
rejillas metlicas y examinando
atentamente los bordes. Si el plano
de enfoque se desplaza hasta
encontrar las lneas perpendiculares
de forma ntida, las horizontales aparecern borrosa y viceversa. Disminuyendo la
abertura del diafragma, y por tanto aumentando la profundidad de campo, se consigue
disminuir el astigmatismo hasta un cierto punto, pero no se elimina completamente.
Curvatura de campo.
Representa la incapacidad de
una lente para enfocar un objeto
plano sobre el plano sensor.
Realmente, el plano focal de un
objetivo no es totalmente plano,
sino que forma una superficie
cncava hacia el objetivo. Como
la zona sensible est totalmente
plana, es difcil enfocar a la vez
y exactamente, el centro y los
bordes de la imagen. Los
fabricantes solucionan esta
degradacin, parcialmente,
variando el diseo de las lentes. Como el astigmatismo, la curvatura de campo puede ser
corregida disminuyendo la apertura del diafragma para aumentar la profundidad de
campo.
Distorsin. Mientras que
las aberraciones mencionadas
hasta ahora se relacionan con la
nitidez del enfoque de la imagen,
la distorsin afecta a la forma que
toma los objetos proyectos en la
imagen. Se acostumbra a expresar
la distorsin como un porcentaje
entre la altura ideal de la imagen y
Figura 2. 34. Astigmatismo
Figura 2. 35. Curvatura de campo
Figura 2. 36. Modelo de distorsin
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 59
la distancia que los puntos se desvan de su posicin en la imagen ideal. La distorsin
destruye la perfecta semejanza entre el objeto y su imagen, dando o bien un efecto de
cojn (distorsin positiva) o bien un efecto de barril (distorsin negativa).
Las lentes de amplio ngulo visual, i.e. de baja distancia focal, deforman las
lneas rectas tanto vertical como horizontalmente. Al fotografiar una cuadrcula, sta
puede deformarse de forma cncava o convexa, resultando as las llamadas distorsiones
de "cojn" y "barrilete".
En el modelo de la distorsin cabe considerar dos componentes: una radial y otra
tangencial. Cada una de ellas se modela como una serie de infinitos trminos. Sin
embargo, para la mayora de las aplicaciones de visin es suficiente con modelar slo la
distorsin radial y, de sta, vale con los dos primeros trminos de la serie. De esta
forma, la relacin entre los pxeles con y sin distorsin sera:
( )
( )
d d
u d
u d
y x r
y r k r k y
x r k r k x
2 2 2
4
2
2
1
4
2
2
1
1
1
+ =

~ + +
~ + +

Donde (x
d
,y
d
) son las coordenadas del pxel distorsionado y (x
u
,y
u
) del pxel sin
distorsin. El grado de distorsin viene dado por los valores de k
i
. En la figura de abajo
se muestra los modelos de distorsin tanto radial como tangencial, as como la
combinacin de ambos efectos, procedentes de la cmara empleada en las prcticas de
la asignatura.

Figura 2. 37. Modelo de distorsin de la ptica de la cmara de prcticas
2.3.7.3 Efecto del diafragma sobre las aberraciones
Segn se acaba de comentar, los defectos provocados por las aberraciones
pticas aumentan con el tamao efectivo de la lente, puesto que los rayos incidentes en
los extremos de la lente sufren mayores desviaciones de foco y distorsin que los rayos
centrales. Como consecuencia de esta conclusin, cuanto ms cerrado est el diafragma
y por tanto menor sea la abertura efectiva de la lente, tanto menor ser los defectos
apreciables de la lente. El efecto adverso ser una disminucin de la intensidad
luminosa que atraviesa la cmara, cuya consecuencia se traduce en una necesidad de
(2. 6)
Carlos Platero Apuntes de Visin Artificial
60 Dpto. Electrnica, Automtica e Informtica Industrial
aumentar la potencia de la fuente luminosa para conservar el nivel de excitacin
radiomtrica del pxel.
2.3.8 Funcin de punto extendido (PSF y OTF)
Por muy pequeo que sea el orificio de
una cmara real, por l siempre pasarn varios
rayos pertenecientes al haz de rayos divergentes
que se originan de la reflexin de la luz sobre
cualquier superficie. Este hecho implica que en
vez de tener un punto luminoso en el plano
sensor, se tendr un crculo proyectivo. El
efecto anterior provoca una degradacin en la
imagen. La luz incidente en cada punto del
plano sensor proviene de un conjunto de puntos
prximos del objeto y no de un solo punto.
Cuando se emite un pulso de luz, tipo
dirac, ste es procesado por el sistema ptico, formando sobre el plano sensor una
mancha difusa. La distribucin de radiacin sobre el plano sensor del pulso de luz,
cuando el nivel de radiacin es la unidad, se define como la funcin de punto extendido
(Point Spread Function, PSF). A la transformada de Fourier de la funcin de punto
extendido se la denomina funcin de transferencia ptica (OTF).
0
5
10
15
0
5
10
15
0
0.05
0.1
0.15
0.2
PSF
0
20
40
0
20
40
0
0.2
0.4
0.6
0.8
1
|OTF|

Figura 2. 39. Distribucin gaussiana de la PSF y su funcin de transferencia ptica
Figura 2. 38. Degradacin del pulso de
dirac
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 61
2.3.9 Lentes comerciales.
Para evitar las degradaciones de la lente delgada, las pticas o lentes comerciales
se componen de varias lentes simples para intentar disminuir las aberraciones. La
diferencia fundamental entre las pticas utilizadas en fotografa y las usadas en las
cmaras de vdeo es el tamao del plano de la imagen. Mientras las fotogrficas
emplean una imagen de 35 mm, las de vdeo utilizan un plano sensor segn el tamao
del sensor empleado; los ms usuales son los de 1/3 y 1/2 de pulgada, aunque existen
sensores desde 1/7 hasta 1 pulgada. El tamao del sensor se refiere a su diagonal y la
relacin entre su anchura y altura suele ser de 3/4.
2.3.10 Caractersticas de las pticas.
Enfoque. Como se ha visto anteriormente, actuando sobre el enfoque se puede
conseguir una imagen ms o menos ntida. Las pticas comerciales se pueden clasificar
por el enfoque en: pticas fijas, pticas variables y pticas motorizadas. Estas ltimas
disponen de un motor de forma que se puede enfocar automticamente o de manera
teleoperada.
Iris o diafragma. El dispositivo de apertura est formado por lminas muy
delgadas dispuestas de tal manera que en el centro se forma un crculo por el que puede
entrar la luz. Abriendo o cerrando el iris entrar ms o menos luz, haciendo que la
imagen sea ms clara o ms oscura. Como se ha visto anteriormente cerrando el iris
tambin se aumenta la profundidad de campo y se disminuyen las aberraciones de la
lente, sin embargo se tendr que iluminar ms la escena. El iris puede ser manual,
automtico (autoiris) o motorizado. Las pticas con autoiris tienen un motor, al igual
que las motorizadas, pero sta no se controla por un usuario a distancia, sino por la
propia cmara. Las cmaras de vdeo tienen una salida de control para este propsito
que se conecta con un cable a las pticas con autoiris. La cmara regular el autoiris
abrindolo o cerrndolo en funcin de la cantidad de luz que est recibiendo.
Zoom. Las pticas con zoom permiten, mediante dos conjuntos de lentes que se
pueden acercar o separar, variar la distancia focal. De esta manera se puede fijar en
detalles que a simple vista no se aprecian. El efecto de aumentar el zoom es la
disminucin del ngulo de vista. Las pticas pueden ser con o sin zoom y stas pueden
ser manuales o motorizadas.
2.3.11 Parmetros de las pticas.
A la hora de comprar una ptica en el mercado para un sistema de visin hay
que tener claro las necesidades del proyecto. El precio de la ptica puede variar entre
unos pocos euros hasta cientos de euros, en funcin de sus caractersticas y calidades.
Los principales parmetros en la eleccin de una ptica son:
Distancia focal f. La ptica comercial tiene dos puntos principales, primario y
secundario. La distancia en milmetros entre el punto principal-secundario y el sensor de
imagen es la distancia focal. En pticas de enfoque variable, se permitir un
desplazamiento del segundo punto principal para modificar el foco respecto al valor
nominal. En el caso de pticas motorizadas, se dar el rango de enfoque. Es el principal
Carlos Platero Apuntes de Visin Artificial
62 Dpto. Electrnica, Automtica e Informtica Industrial
parmetro a tener en cuenta, ya que ste va a delimitar a que distancia se encuentra la
cmara de la escena.
Nmero F. Es el ndice de cantidad de luz que pasa a travs de la lente. Cuanto
ms pequeo sea el nmero F, mayor ser la cantidad de luz. Se puede calcular su valor
como la relacin entre la distancia focal y dimetro efectivo de abertura de la lente.
Angulo de vista. Es el ngulo que se forma con las dos lneas que parten desde
el punto principal secundario a los extremos de la diagonal del sensor de imagen. A un
mayor ngulo de vista se obtendr un mayor campo de la escena en la imagen.
Rosca. La rosca es la forma con la que la ptica se sujeta a la cmara. Las ms
tpicas en pticas de vdeo son la rosca C y la rosca CS, habiendo incluso adaptadores
de uno a otro. En cmaras fotogrficas se suele emplear la rosca de bayoneta. Existen
otros tipos de rosca como la rosca K y otras que emplean algunos fabricantes
particulares como la rosca Watec.
2.4 Sensores de vdeo
Bsicamente, la cmara fotogrfica del siglo XIX se constitua
por una caja estanca en la atravesaba la luz a travs de una lente. Un
dispositivo mecnico dejaba pasar, durante un pequeo lapsus de
tiempo, la radiacin incidente sobre el interior de la caja. La escena se
proyecta sobre la zona sensible, la cual estaba formada por cristales de
halogenuros de plata, muy sensibles a la luz. La tecnologa de la
fotografa se ha modificado espectacularmente hasta hoy da, pero el
principio sigue siendo el mismo, i.e. de excitacin con fotones a un
rea sensible dentro de un habitculo cerrado.
En 1897 se invento el tubo de rayos catdicos, ofreciendo la oportunidad de
imgenes no fotogrficas, pero no fue hasta 1923 cuando se perfeccion para poder
adquirir imgenes. El sistema usaba un tubo de vaco, una pantalla sensible a la luz y un
haz de electrones para el escaneado de la seal. La llegada en 1930 de la televisin
comercial hizo que las cmaras de vdeo alcanzaran una importancia trascendental.
En 1970 se invent el primer sensor de estado slido. La imagen era formada por
la conversin de los fotones a cargas elctricas. Esta transformacin se realiza por un
elemento semiconductor llamado pxel que se dispona en forma matricial. Las cargas
elctricas eran ledas posteriormente por filas y por columnas,
transformando la seal de vdeo en informacin elctrica. Se
inicio entonces una batalla por la dominacin del mercado entre
las cmaras de estado slido y las de tubo de vaco. sta fue
ganada por las cmaras de estado slido antes sus innumerables
ventajas, como espacio, inmunidad a vibraciones, coste de
fabricacin, etc. Algo similar se libra hoy en da entre las clsicas
cmaras fotogrficas analgicas y las digitales.
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 63
2.4.1 Cmaras de estado slido
La mayora de las cmaras de estado slido estn basadas en dispositivos de
cargas acopladas o CCD (Charge Coupled Deviced), si bien existen otras tecnologas,
como son la de inyeccin de carga o CID (Charge Injection Deviced) o las cmaras de
integracin o TDI (Time Delay Integration). Otra tecnologa pujante es la CMOS. Aun
as, el funcionamiento bsico en las distintas tecnologas es similar y est fundado en el
efecto fotoelctrico. Los fotones de la luz pasan por una estructura cristalina de silicio y
son absorbidos creando pares electrn-hueco. La cantidad de pares electrn-hueco ser
proporcional a la intensidad de luz que ha incidido sobre el elemento sensor.
2.4.2 Fundamentos del fotosensor.
El elemento bsico de las clulas fotosensibles son los pxeles. stos estn
constituidos por condensadores MOS (Metal Oxido Semiconductor). Sobre un substrato
de silicio de tipo P, se monta una zona de tipo N y se deposita una pelcula de dixido
de silicio, SiO
2
, formando una
capa de aislante o dielctrico.
Encima de esta capa se sita un
electrodo conductor de polisilicio
transparente. La radiacin
incidente de la luz visible pasa a
travs del conductor transparente y
crean pares electrn-hueco en el
semiconductor. Los huecos libres
se combinan con los electrones del
substrato, mientras que la
acumulacin de los electrones
libres produce una carga elctrica
proporcional a la intensidad de la
luz y al tiempo de integracin.

2.4.3 Modelo radiomtrico del pxel
Si el sistema de adquisicin de imgenes,
lente ms cmara, se encuentra a una distancia de
R
1
, desde la superficie de observacin, el nivel
energtico de fotones incidentes dentro del sistema
ptico, de rea A
0
y durante el tiempo de
integracin, t
I
, es de:
Figura 2. 40 Estructura del pixel
Figura 2. 41 Modelo radiomtrico del
pixel
Carlos Platero Apuntes de Visin Artificial
64 Dpto. Electrnica, Automtica e Informtica Industrial
0
2
1
r a p a r en t e r
l en t e r S A I
d L S d
A
n L A t
R
| e
t
~
=

donde L
r
es la radiacin refleja en la direccin del sensor y t
A
es el coeficiente
de transmisin atmosfrica. El nmero de fotones que alcanza el sensor ser:
0
2
1
s e n s o r r S A O I
A
n L A t
R
t t =
t
O
es la transmitancia del sistema ptico. El nmero de fotones incidentes en un
pxel, es una relacin de reas que depende del factor de relleno:
sor
pixel
sor pixel
A
A
n n
sen
sen
=
usando la aproximacin de ngulo pequeo para rayos axiales:
2
2
2
1
sen
R
R
A
A
sor
s
=
e introduciendo los conceptos de magnificacin ptica, M, y la relacin del
modelo de lente delgada:
f R R
1 1 1
2 1
= +
el nmero de fotones que recibe el pxel ser:
( )
0
2
2
1
p i xel
p i xel r A O I
A A
n L t
f M
t t ~
+

asumiendo una apertura circular e introduciendo el concepto de F - nmero,
quedar:
( )
2
2
4
1
r p i xel
p i xel A O I
L A
n t
F M
t
t t =
+

Todas las variables son funcin de la longitud de onda y de la adquisicin de la
imagen. El nmero de foto-electrones generados en un detector de estado slido es:
(2. 7)
(2. 8)
(2. 9)
(2. 10)
(2. 11)
(2. 12)
(2. 13)
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 65
( ) ( )
( )
( )
( ) ( )
2
1
2
1
2 2
4
p e r p i xel
r p i xel
p e r A O I
n R n d
L A
n R t d
F M

t
t t
=
=
}
}

siendo R
r
() la sensibilidad del pxel ante esta longitud de onda. Como se
observa, la conversin de la radiacin a seal elctrica es slo funcin de la luminancia.
No discrimina el color. Para adquirir el color se necesitar que la integracin se extienda
slo en una franja del espectro determinada. Se suele emplear la teora del triestmulo,
separando la radiacin en tres zonas espectrales, las correspondientes al modelo RGB.
Por otro lado, la conversin de fotones a carga elctrica no es un proceso determinista
sino probabilstico, debido al carcter cuntico del fenmeno fotoelctrico.
Una vez obtenida la cuantificacin de la radiacin incidente hay que transmitirla.
Esta operacin depende de la arquitectura de la cmara y de la tecnologa a emplear.
Bsicamente se hace a travs de los vecinos de forma secuencial, de modo similar a
cmo se comporta un registro de
desplazamiento. El mecanismo se basa en
aplicar unas seales de reloj sobre los
electrodos de cada pxel. Al aplicar un
potencial positivo en el vecino de un pxel,
cuyo pozo de electrones libres es
proporcional a luz recibida, estos se
desplazarn a la ubicacin del vecino,
transfirindose la carga y produciendo un
registro de desplazamiento analgico. Este
tipo de transferencia se conoce como
CCD. En la figura se observa un CCD con
dos seales de desfase, V
1
y V
2
, que son
utilizadas para transferir cargas desde los
fotosensores al registro de lectura
mediante el efecto CCD.
2.4.4 Arquitectura de las cmaras
Segn la disposicin de los pxeles, las imgenes pueden ser:
Unidimensionales (cmaras lineales, asociadas a un vector de sensores)
Bidimensionales (cmaras matriciales, asociadas a una matriz de
sensores).
2.4.4.1 Cmaras lineales
Si bien es posible encontrar cmaras matriciales de hasta
5120 x 5120, stas exigen anchos de bandas muy elevados. Por
ejemplo, si se desea 25 cuadros por segundo, el volumen de
(2. 14)
P i x e l P i x e l
T 1
T 2
T 3
T 4
P u e r t a
V 1
V 2
C a r g a
Figura 2. 42. Transferencia de cargas CCD
Carlos Platero Apuntes de Visin Artificial
66 Dpto. Electrnica, Automtica e Informtica Industrial
informacin es de 640 Mpixel/s, hacindose prohibitivo para la mayora de las
aplicaciones industriales. Con el fin de evitar este exceso de informacin y si se desea
alta resolucin, la solucin hay que encontrarla en las cmaras lineales.
La tecnologa de cmaras lineales hace mucho tiempo que fue desarrollada para
aplicaciones de inspeccin de materiales fabricados en continuo, como papel, tela,
planchas metlicas, etc. Sin embargo, en la actualidad se est imponiendo en muchos
otros procesos productivos que requieren de alta resolucin y /
o alta velocidad a un precio competitivo.
Las cmaras lineales utilizan sensores lineales que
acostumbran a tener desde los 512 hasta 8192 elementos
(pxeles), obteniendo grandes valores de SNR.
El hecho de construir una imagen de alta calidad a
partir de lneas individuales requiere un alto grado de
precisin. La alineacin y los sincronismos del sistema son crticos si se quiere obtener
una imagen correcta del objeto a analizar.
Constructivamente las cmaras lineales
carecen de distancia interpixel, i.e. no existen
zonas no sensibles. Ello es debido a que el
registro de desplazamiento se encuentra a uno de
los lados de los fotosensores, y aunque ste
tambin es sensible a la luz, se cubre con una
capa protectora. Pudindose en este caso doblar
la resolucin de la cmara lineal.
2.4.4.1.1 Cmaras lineales TDI
En cualquier cmara convencional, el
mximo tiempo de exposicin est limitado a la
velocidad de la escena. Como consecuencia de
la adquisicin lnea a lnea, el tiempo de integracin es pequeo y se necesita mucha
ms iluminacin que en una cmara matricial ya que la matricial funciona con tiempo
de integracin mayores. Por tanto, aplicaciones de alta velocidad en las escenas y baja
iluminacin no pueden ser adquiridas por las cmaras lineales.
La tecnologa TDI (Time Delay Integration) utiliza el movimiento sincronizado
para capturar mltiples tomas de la misma lnea y sumarlas, obteniendo una lnea con
sensibilidad amplificada. TDI es el nombre dado al mtodo de combinar muchas lneas
individuales a la vez, con el fin de incrementar la sensibilidad de la cmara. La ventaja
de este mtodo reside en la mejora de la relacin seal - ruido.
Las cmaras ms modernas incorporan hasta 96 lneas de sensores, de forma que
pueden alcanzar hasta 96 veces ms sensibilidad que una cmara lineal convencional.
R e g i s t r o d e d e s p l a z a m i e n t o
R e g i s t r o d e d e s p l a z a m i e n t o
R e g i s t r o d e d e s p l a z a m i e n t o
b )
a )
d e t e c t o r e s
d e t e c t o r e s

Figura 2. 43. a) un nico registro de
desplazamiento b) doble registro


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 67
D i r e c c i n d e l o b j e t o
T 1
T 2
T 3
T 4
C m a r a T D I
M o v i m i e n t o s d e l a b a n d a
L n e a s d e i n s p e c c i n
E l e m e n t o s T D I

Figura 2. 44 Efecto TDI


El dispositivo se presenta fsicamente como un array de sensores en disposicin
bidimensional, con un aspecto idntico al de cualquier cmara matricial. El matiz que lo
hace diferente es la forma de capturar la imagen y la electrnica que lleva integrada para
que esto se pueda realizar. Mientras que en una cmara matricial se hace un muestreo de
la informacin del array completo, en las
cmaras TDI slo se aprovecha una nica
lnea.
Para entender el modo de operar de
una cmara TDI, se sigue la figura 2.44. En
el tiempo T1, la imagen se sita en el primer
detector y se crea una carga. Llegado el
tiempo T2, la imagen se ha desplazado al
segundo detector. Simultneamente, el reloj
del pxel ha movido la carga del primero al
segundo detector. En este punto, se crea una
imagen formada por la carga anterior
aadindose la nueva creada en el segundo
detector y as sucesivamente. La carga
(seal) se incrementa linealmente con el
nmero de lneas, tambin lo hace el ruido
pero no proporcionalmente sino con la raz
cuadrada del nmero de lneas TDI, N
TDI
. El
resultado es una mejora de la relacin seal
ruido en
TDI
N .
Con las cmaras TDI, por tanto, se
puede alcanzar ms velocidad con baja
iluminacin. Sin embargo, hay que tener en cuenta que este tipo de cmaras deben estar
perfectamente sincronizadas con la direccin del movimiento de la aplicacin y que la
velocidad de la aplicacin debe ser bastante constante.
Entre sus aplicaciones, a parte de las industriales, se encuentran las capturas de
imgenes procedentes de los satlites. Las imgenes de satlites se caracterizan por
tener una gran variabilidad de iluminacin, de ser adquiridas a velocidad constante y de
requerir alta resolucin. Por tanto, las cmaras TDI son ideales para estas tareas.
2.4.5 Cmaras matriciales
Una cmara matricial produce una imagen de un rea,
normalmente con una relacin de aspecto de 4 a 3. Esta relacin
viene de los tiempos de las cmaras Vidicon y de los formatos de
cine y televisin. Actualmente existen muchas cmaras que ya no
mantienen esta relacin y que no siguen los formatos de la
televisin analgica.

Carlos Platero Apuntes de Visin Artificial
68 Dpto. Electrnica, Automtica e Informtica Industrial
Los sensores de cmaras modernos son mayoritariamente de tipo CCD o
CMOS. Millones de pxeles se posicionan de forma muy precisa en una matriz y bien
los registros de desplazamiento transfieren las cargas de los pxeles (CCD) para formar
la seal de video o las cargas son
convertidas en potenciales y trasmitidas a
la salida de vdeo (CMOS).
Los tamaos de las cmaras
matriciales estn definidos en pulgadas.
Los formatos ms comunes actualmente
son de 1/3", ", y 2/3".
2.4.5.1 Caractersticas de las cmaras matriciales
2.4.5.1.1 Factor de relleno
El factor de relleno es el porcentaje del rea de pxel que es sensible a la luz. El
caso ideal es 100%, i.e. cuando los pxeles activos ocupan el 100% del rea del sensor.
Sin embargo, circuitos como los registros de lectura y los circuitos anti-blooming
reducen este factor, en algunas ocasiones hasta en un 20%. El efecto de esta reduccin
se traduce en una menor sensibilidad y en problemas de muestreo. Para evitar estas
desventajas, muchos sensores con bajo factor de relleno (normalmente CCD con
transferencia interlnea) utilizan microlentes que cubren cada uno de los pxeles
incrementando la efectividad del factor de relleno.
2.4.5.1.2 Transferencia de las cmaras CCD
Uno de los mayores inconvenientes de una matriz de fotosensores es la
transmisin de las seales recogidas. Dependiendo de la tecnologa de la cmara,
existen diferentes estructuras para la adquisicin y transmisin de la informacin.
Cualquier cmara, en principio, requerira un rea fotosensora que fuese capaz de captar
toda una imagen enfocada sobre ella mediante un sistema ptico. Esta matriz de
elementos fotosensores es la encargada de recoger la informacin que presenta la escena
que se desee captar. Tras un cierto tiempo (denominado tiempo de integracin), la
informacin luminosa de la escena se encuentra recogida en esta matriz de elementos.
Para extraer esta informacin de los elementos se utiliza la tcnica de registro de
desplazamiento analgico. De esta forma, la carga generada en cada elemento sensor se
desplaza hasta la salida del dispositivo en su conjunto. Existen distintas configuraciones
posibles que darn lugar a diferentes posibilidades tanto en la extraccin como en la
transmisin de la informacin adquirida. Las transferencias ms empleadas son:
transferencia de cuadro, transferencia interlinea y transferencia de cuadro interlnea.
Transferencia de cuadro (Full Frame).- Son los CCD que tienen una
arquitectura ms simple. Emplean un registro paralelo simple para exposicin de los
fotones, integracin de la carga y transporte de la carga. Se utiliza un obturador
mecnico para controlar la exposicin. El rea total del CCD est disponible para recibir
los fotones durante el tiempo de exposicin. El factor de relleno de estos tipos de CCD
es del 100%.
Figura 2. 45. Tamaos de los CCD
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 69
F o t o d i o d o s F o t o d i o d o s
R e g i s t r o d e
d e s p l a z a m i e n t o v e r t i c a l
R e g i s t r o s e r i e d e l e c t u r a
R e g i s t r o s e r i e d e l e c t u r a
M a t r i z d e a l m a c e n a m i e n t o
Segn este tipo de estructura el chip de silicio se divide en dos reas. En la mitad
superior del dispositivo aparece la seccin donde va a incidir la luminosidad de la
imagen que se desea captar en un momento determinado, mientras que en la mitad
inferior, se encuentra el rea de almacenamiento de cargas y el registro de salida. Esta
mitad inferior, evidentemente estar recubierta por una placa opaca de forma que la luz
no pueda alcanzarla y as no
contamine la informacin
recogida por el rea de la
zona superior.
Transferencia
interlnea - Los CCD que
incorporan esta tecnologa
son los ms comunes y
utilizan registros de
desplazamiento que se
encuentran entre las lneas de
los pxeles y se encargan de
almacenar y transferir los
datos de la imagen. La
principal ventaja de este tipo
de CCD es la alta velocidad
de obturacin, pero no son
tan sensibles y precisas como
otros tipos de tecnologas.
Tienen un bajo nivel de factor de relleno y un rango dinmico ms bajo.
Este tipo de transferencia consiste en un array de fotodiodos separados por
registros de transferencia vertical que son cubiertos por una capa opaca de metal.
Despus de la integracin, las cargas generadas por los fotodiodos son transferidas al
registro vertical CCD en un tiempo de 1s, minimizando los efectos de contaminacin
lumnica. La principal ventaja de esta transferencia es la rapidez, por lo que no hay
necesidad de utilizar obturadores. La desventaja es que este tipo de salida implica una
menor zona activa del sensor. El rea efectiva puede estar por debajo del 20%. Aunque
este factor puede ser ampliado mediante el uso de microlentes.
Transferencia de cuadro interlnea- Este tipo de estructuras incorpora
caractersticas tanto de la transferencia interlinea como de cuadro completo. La parte
superior de la estructura es exactamente igual a una interlineal. Las cargas se mueven
horizontalmente desde los elementos fotosensores hacia los registros de
desplazamientos verticales durante el periodo de borrado vertical. Una vez las cargas
estn en el registro de desplazamiento vertical, en lugar de ser ledas fila a fila a la
frecuencia de lnea, son enviadas a un array de almacenamiento. Este array de
almacenamiento est, al igual que el registro de desplazamiento vertical, cubierto por
una mscara de aluminio opaca a la luz. Es desde este array de almacenamiento donde
las cargas pasan fila a fila al registro de salida. La diferencia es que en esta zona de
almacenamiento los paquetes de informacin no corren ningn peligro de ser
contaminados por excesos de carga que hayan penetrado en el registro de
desplazamiento vertical, ya que en ste permanecen durante un perodo de tiempo muy
Figura 2. 46 a) Transferencia interlinea b) Transferencia interlinea
cuadro
Carlos Platero Apuntes de Visin Artificial
70 Dpto. Electrnica, Automtica e Informtica Industrial
pequeo. Adems, por tener el chip el registro de desplazamiento vertical separado de
los elementos fotosensores y cubierto por una mscara opaca a la luz, no ser necesario
el empleo de obturadores mecnicos, como ocurra en los sensores de cuadro entero.
Esta estructura ofrece las mejores prestaciones de los CCDs actuales. Sin
embargo, su estructura es compleja y requieren un rea total mayor al tener la zona de
almacenamiento separada. En concreto el rea activa es alrededor del 22% del total de
la zona sensora, lo cual ofrece una idea de la relacin entre la zona activa y la zona
sensora presentada en el proceso de captacin de imgenes.
2.4.5.1.3 Integracin de la seal de salida.
Las seales de vdeo fueron estandarizadas antes de que existiesen las cmaras
de estado slido. Los formatos de vdeo definen la frecuencia de la seal de video, el
nmero de lneas por cuadro y el nmero de cuadros por segundo. Muchas de las
cmaras de estado slido siguen estos
estndares, haciendo que la salida de la
informacin sea de tipo entrelazado,
como son las mayoras de las seales de
televisin analgica. De esta forma, en
los CCD con estructura de transferencia
de campo, los mismos elementos
fotosensores son utilizados en los
campos pares e impares. En las
estructuras de transferencia interlinea y
de transferencia de cuadro, no es as,
sino que se utilizan pxeles separados
para cada campo, con el inherente
aumento de resolucin vertical. Existen
dos posibles modos de lecturas de las cargas: Integracin de cuadro e integracin de
campo.
En el modo de integracin de cuadro cada elemento acumula cargas durante un
cuadro (dos campos) antes de transferirlas al registro de desplazamiento vertical y desde
l ser enviadas hacia la salida. Otra opcin posible consiste en combinar las cargas de
filas adyacentes del array de fotosensores. En este caso, los pxeles son ledos cada
campo, denominndose este modo integracin de campo. Como las seales adyacentes
se promedian, la resolucin vertical obtenida es menor que en el modo de Integracin de
Cuadro. Sin embargo, como la carga slo se integra durante un campo, se obtiene mayor
resolucin dinmica que con el modo de Integracin de Cuadro.
2.4.5.1.4 Cmaras progresivas
}
}
}
}
P a r
I m p a r
}
}
}
}
}
a
b
c
d
a + b
c + d
b + c
Figura 2. 47 Entrelazado a) Campo b) Cuadro
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 71
La mayor desventaja de las cmaras entrelazadas est en el desfase de los tiempos de
integracin, bien sea entre lneas o entre campos. Con el objeto de evitar parar el
movimiento de los objetos al visualizarlas (accin requerida con las cmaras
entrelazadas), aparecen las cmaras progresivas. stas escanean secuencialmente
lnea a lnea las imgenes. La primera ventaja de las cmaras progresivas es la de tomar
imgenes en un mismo instante, en contraste con los sistemas entrelazados que
adquieren la imagen en el distintos tiempo de integracin. As cualquier movimiento
vertical producido entre campos, provocar manchas en la imagen, mientras
movimientos horizontales originan cortes en las lneas verticales. An en el caso de
utilizar luces estroboscpicas para
congelar el movimiento, se tienen imgenes continuas slo en el campo que fue
activado el pulso de luz. Cuando hay movimiento, slo un campo puede ser usado para
el procesamiento de las imgenes, reduciendo en un 50% la resolucin. En la figura se
aprecia la discontinuidad de las cmaras entrelazadas y la mejora de las progresivas,
aumentando la resolucin vertical respecto a las entrelazadas.
La diferencia entre progresivas y entrelazadas est en su aspecto constructivo.
Obsrvese en la figura como las cmaras progresivas, de cuatro fases, difieren en su
diseo, permitiendo almacenar cargas en el mismo instante de tiempo.
2.4.5.1.5 CCD versus CMOS
Mientras que las cmaras CCD presentan una conversin de fotones a cargas
elctricas y stas son desplazadas segn los distintos tipos de transferencias analizados;
en las cmaras CMOS, cada pxel se transforman directamente de fotones a seal
elctrica y estos pulsos elctricos son los desplazados para ser transmitidos.
Las cmaras CCD tienen una mejor calidad de las imgenes y flexibilidad a
expensas de un mayor tamao. Sus aplicaciones son en fotografa digital, aplicaciones
industriales de altas prestaciones, aplicaciones cientficas y mdicas. Mientras las
cmaras CMOS tiene una integracin mayor, menor consumo y tamao ms reducido, a
expensas de una menor calidad de imagen y menor flexibilidad. Para grandes
volmenes con pocos requerimientos de calidad es la opcin tecnolgica. Sus

Figura 2. 48. Efecto del movimiento a)
carcter en movimiento horizontal b)
Discontinuidad de la imagen debido al
sistema entrelazado c) salida de una
cmara progresiva



1
2
3
4
1
2
3
4
f o t o d i o d o
f o t o d i o d o
C C D v e r t i c a l
C C D v e r t i c a l
V 1 V 2 V 3 V 4 V 1 V 2 V 3 V 4
T r a n s f e r e n c i a e n t r e l a z a d a T r a n s f e r e n c i a p r o g r e s i v a

Figura 2. 49. Diferencias constructivas entre
entrelazada y progresiva


Carlos Platero Apuntes de Visin Artificial
72 Dpto. Electrnica, Automtica e Informtica Industrial
aplicaciones principales son las cmaras de seguridad, webcam, cdigo de barras,
scanners, juguetes, telfonos mviles,....

Figura 2. 50 a) Tecnologa CCD b) Tecnologa CMOS
2.4.5.1.6 Cmaras en color
Aunque el proceso de adquisicin de las imgenes color resulta ser ms
complejo, este tipo de cmaras pueden proporcionar ms informacin que las cmaras
de slo luminancia. Hay dos tipos de arquitectura: 1CCD o
3CCD.
Las cmaras color de 1 CCD incorporan un sensor con un
filtro en forma de mosaico que incorpora los colores primarios
RGB. Esta mscara de color es conocido como filtro Bayer. De
hecho, el sensor slo integra la radiacin al que se le ha
superpuesto el filtro de color. La forma en que se disponen los
colores R, G y B es como se muestra en la figura. Como se
puede ver hay el doble de pxeles con filtro verde que con filtro
azul o rojo. Efecto ste necesario para hacer ms semejante la
percepcin del sensor a la visin humana que es ms sensible al
verde.
Debido al carcter del propio filtro es evidente que en los pxeles donde se sita
el filtro rojo, no tienen seal ni de verde ni de azul. Para subsanar la falta de estos
colores en estos pxeles, se construye una seal RGB a partir de los pxeles adyacentes
de cada color. Este clculo se realiza en el
interior de la cmara mediante un DSP
especfico, que permite realizar la operacin
en tiempo real y dependiendo de la cmara
permite obtener una seal analgica o digital
en RGB en cada caso.
Las cmaras de color 3CCD
incorporan un prisma y tres sensores. La luz
procedente del objeto pasa a travs de la
Figura 2. 51. 1CCD con
filtro de Bayer
Figura 2. 52 3CCD
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 73
ptica y se divide en tres direcciones al llegar al prisma. En cada una de los tres
extremos del prisma se encuentra un filtro de color (rojo, verde y azul) y un sensor que
captura la luz de cada color que viene del exterior. Internamente la cmara combina los
colores y genera una seal RGB similar a la que ve el ojo humano. La fidelidad de las
imgenes de las cmaras de 3CCD es muy superior a las de las cmaras de 1 CCD, pero
hay un par de inconvenientes inherentes al sistema. Por una parte, este tipo de cmaras
requieren ms luz debido a que el prisma hace que sea menor la cantidad de iluminacin
que incide sobre los sensores y por otra, se genera un efecto de aberracin cromtica
debida a la propia estructura del prisma. Este efecto puede ser subsanado colocando las
pticas diseadas especficamente para este tipo de cmaras.
2.4.6 Eleccin de una cmara
Muchos son los aspectos que puedan influir en la eleccin de una cmara u otra.
Sin embargo, algunas consideraciones deben de tenerse en cuenta para no arrepentirse
de la compra o para no gastarse ms dinero en el proyecto del que realmente hace falta.
Normalmente, la eleccin de la cmara va ntimamente unida a la de la ptica.
Las caractersticas tcnicas son las ms importantes y las que siempre se tendr
presente a la hora de adquirir una cmara. A continuacin se enumeran algunas de ellas.
2.4.6.1 Formato de Vdeo
Este tema ser tratado con mayor profundidad en el siguiente apartado. El
formato de la seal es importantsimo ya que tanto las cmaras como las digitalizadoras
y, a veces, los monitores deben ser del mismo formato. El formato cambia de un pas a
otro. En Europa se tiene el sistema PAL o CCIR que ser siempre al que se haga
referencia. En los pases francfonos se emplea el sistema SECAM y en el continente
Americano y en Japn el sistema NTSC. Otro tipo de cmaras que no sigue ninguno de
estos formatos son las llamadas cmaras digitales que envan la informacin al
ordenador en seales digitales codificadas segn el formato de cada fabricante, aunque
se est extendiendo los protocolos IEEE 1394, USB 2.0 o GigaEthernet. Si se adquiere
una cmara de este tipo hay que tener en cuenta las ventajes e inconvenientes de video
digital respecto al analgico (anchos de banda, mezcla de video procedente de varias
cmaras, ).
2.4.6.2 Resolucin
Una imagen en el sistema CCIR est formada por 576 filas y 768 columnas, sin
embargo, el tamao del rea sensora puede ser mayor o menor. Como norma, cuantos
ms pxeles disponga el sensor mayor ser la calidad de la imagen. Otro factor a tener
en cuenta en la resolucin, es el nmero de bits con que se digitaliza el pxel. Lo normal
en las cmaras digitales es emplear 8 bits, aunque existen cmaras de hasta 16 bits por
pxel.
Carlos Platero Apuntes de Visin Artificial
74 Dpto. Electrnica, Automtica e Informtica Industrial
2.4.6.3 Tipo de Rosca
La rosca es la forma con la que la ptica se sujeta a la cmara. Las ms tpicas en
pticas de vdeo son la rosca C y la rosca CS, habiendo incluso adaptadores de uno a
otro. En cmaras fotogrficas se suele emplear la rosca de bayoneta. Existen otros tipos
de rosca como la rosca K, y otras que emplean algunos fabricantes particulares como la
rosca Watec. Normalmente las cmaras tienen rosca C, aadiendo normalmente una
arandela que convierte de C a CS. Se debe prestar especial atencin a este hecho, en
caso contrario no se podr acoplar la ptica a la cmara.
2.4.6.4 Seales adicionales
Todas las cmaras poseen un conector, normalmente tipo BNC si es analgica,
donde se consigue la seal de vdeo, adems del de alimentacin. Esto es lo mnimo
necesario que se puede ofertar. Sin embargo, algunas cmaras ofrecen adems las
seales de sincronismo generadas en la propia cmara, que pueden ser empleadas en la
sincronizacin de dispositivos de iluminacin externos. Tambin se suele incluir una
seal de entrada para sincronizar la cmara otras cmaras si se est haciendo visin
estreo. Si se emplean varias cmaras en el sistema de visin, se puede emplear un
generador de sincronismo externo; este generador har que el tiempo de integracin de
todas las cmaras se inicie y termine exactamente en el mismo instante de tiempo.
Todas estas seales se suelen agrupar en un conector denominado EXT. Otra seal que
suelen tener algunas cmaras es la del control del autoiris que se conecta a la ptica. De
esta manera, el iris se abrir o cerrar automticamente dependiendo de la cantidad de
luz recibida en el CCD.
2.4.6.5 Controles adicionales
El fabricante normalmente ofrece varios ajustes que pueden ser modificados a
voluntad. Algunos de ellos pueden ser imprescindibles para el mximo
aprovechamiento del sistema de visin, por lo que se deber prestar especial atencin a
s la cmara que se desea adquirir ofrece uno u otro ajuste. A continuacin se enumeran
algunos de estos controles:
- Control de ganancia automtica (CAG): Hace las veces de un autoiris electrnico.
Si est activado, se aumentar o disminuir la sensibilidad del CCD en funcin de la
intensidad luminosa que se est recibiendo. Muchas aplicaciones debern tener
desactivado este control si no se quiere tener efectos impredecibles.
- Tiempo de integracin: Como ya se explic anteriormente es el tiempo en que la luz
incide sobre el CCD. Equivaldra al tiempo de obturacin en trminos fotogrficos.
Es una caracterstica interesente en una cmara que se pueda modificar el tiempo de
integracin. Si se est iluminando la escena con luz fluorescente, como la red
elctrica funciona a 50 Hz, generar unas fluctuaciones en la luminosidad, de
carcter senoidal y tambin de 50 Hz. Si la cmara tiene un tiempo de integracin
pequeo, por ejemplo de 2ms, la imagen se oscurezca y aclare lentamente, pudiendo
afectar negativamente en el sistema de visin. Si se quiere eliminar este efecto se
deber cambiar el tiempo de integracin lo ms prximo a 20 ms.
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 75
2.4.6.6 Filtros de infrarrojos, IR
Los CCD tienen una buena respuesta por encima del espectro no visible, desde
los 700nm hasta los 850nm aproximadamente. Con esta sensibilidad espectral hara que
a luz ambiente la imagen apareciera muy saturada. Para evitarlo se suele intercalar antes
del CCD un filtro de corte de infrarrojos. Este filtro debe tenerse muy en cuenta si se va
a utilizar luz estructurada con longitudes de onda de infrarrojo (IR), en este caso se
deber abrir la cmara y eliminar este filtro. Algunas pticas tambin incluyen este filtro
y en la mayora de los casos no es posible su eliminacin.
2.5 Seal de vdeo
La informacin recogida en el sensor de imagen es convertida a una seal vdeo
analgica o digital segn un formato estndar o no. La transmisin de imgenes de
vdeo ha estado impuesta por la aplicacin principal para las que fueron concebidas las
cmaras, la televisin. La seal analgica de vdeo es una seal elctrica continua que
contiene toda la informacin de la imagen, as como informacin adicional o
sincronismos para que la imagen pueda volver a ser reconstruida mediante un monitor.
Los tiempos y la estructura de la seal fueron determinadas en los primeros das en que
la televisin vio la luz. Posteriormente, se han hecho modificaciones o aadidos a la
seal de vdeo para que se pudiera transmitir color, sonido estreo e informacin
adicional (teletexto), siendo estas nuevas seales compatibles con el formato original.
El primer estndar para transmisin de televisin en niveles de grises fue
conocido como RS-170 en Estados Unidos en 1941. Posteriormente, el formato NTSC,
compatible con RS170, se defini para la transmisin de seal de vdeo en color. Se usa
actualmente en 32 pases (USA, Canad, Japn, ...). En 1950, en Europa se estableci el
estndar CCIR para la transmisin de seales de televisin en blanco y negro y PAL
para el color. Las diferencias esenciales entre los sistemas monocromos RS-170 y
CCIR son el nmero de lneas en la imagen y la transmisin de frecuencias, lo cual les
hace incompatibles en un nivel bsico.
Formato RS-170 CCIR
Fre. Cuadro (Hz) 30 25
Entrelazado 2:1 2:1
Fre. Campo (Hz) 60 50
N. lneas horizontales 525 625
N. lneas horizont. efectivas 480 576
Fre. Lnea (Hz) 15.750 15.625
Tiempo activo lnea 52,5 s 52 s
Pxeles por lnea 752 744
Relacin de aspecto 4:3 4:3
Tamao de imagen (pxeles) 360.960 428.544
En ambos modelos, el formato de vdeo usa el principio de entrelazado para
reducir la frecuencia requerida en la transmisin y corregir el efecto de parpadeo al
reconstruir la imagen. Este principio consiste en transmitir dos campos de lneas
alternas y transmitirlas secuencialmente. Un campo puede transmitirse en la mitad de
Carlos Platero Apuntes de Visin Artificial
76 Dpto. Electrnica, Automtica e Informtica Industrial
tiempo que cuadro completo, dando la impresin de continuidad, a pesar del hecho que
slo la mitad de la informacin est siendo actualizada en cada ciclo.
Aunque los sistemas no entrelazados son comunes para los monitores de
ordenadores, el entrelazar campo par e impar es una caracterstica comn a todos los
sistemas de televisin. El campo par contiene todas las lneas pares, comenzando con
media lnea y terminando con una completa. El campo impar contiene las lneas impares
comenzando con una lnea completa y terminando con la mitad de una lnea. Los dos
campos puestos juntos constituyen un cuadro completo.
La frecuencia de cuadro y de campo son las constantes fundamentales en los dos
estndares de vdeo. Como se puede ver en la tabla, el formato RS-170 tiene una
frecuencia de cuadro ms alta, pero las frecuencias de lneas de los dos estndares son
aproximadamente las mismas. En ambos casos, el nmero final de lneas efectivas se ve
reducido por el tiempo de borrado de campo, el cual se usa en los monitores de TV para
que el pincel electrnico vuelva al principio. Adems, en el borrado de campo se envan
seales para sincronizar los osciladores de barrido vertical y horizontal, as como
informacin adicional (teletexto).
Un esquema completo de la
seal de TV de un cuadro completo
puede ser estudiado en la figura. En
ella se incluyen las seales de
sincronismos empleadas para
especificar el comienzo de un
campo (sincronismo vertical o
Vsync) y el comienzo de una lnea
(sincronismo horizontal o Hsync).
Si las seales de sincronismo estn
combinadas con la seal de vdeo,
la resultante es denominada seal
de vdeo compuesto (composite video). Una seal que contenga Vsync y Hsync se
denomina seal de sincronismo compuesto (composite sync). En CCIR habr 625
pulsos de sincronismo horizontal por cuadro y 50 pulsos de sincronismo vertical por
segundo.
En la figura se muestra un
diagrama de la seal de una nica
lnea con el sincronismo horizontal y
los niveles de voltaje. El flanco de
bajada del pulso de sincronismo es el
comienzo de una nueva lnea del
campo y el nivel de borrado (blanking
level) indica con cero voltios lo que
sera negro en la imagen. El mximo
nivel de blanco es equivalente a 0,7 voltios, mientras que el nivel de sincronismo est
fijado a -0,3 V.
Figura 2. 53. Sincronismo vertical
Figura 2. 54 Sincronismo de lnea
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 77
Ningn estndar especifica la cantidad de pxeles en horizontal que debe tener
un CCD, ya que los formatos nacieron para cmaras de tubo de vaco, en los que la
seal analgica se formaba de manera continua. Sin embargo, los CCD hacen un
muestreo de manera discreta. Cada fabricante de cmara ha elegido el nmero de
pxeles que quiere incluir, aunque muchos de ellos han adoptado un estndar para
RS170 de 752 pxeles. La resolucin vertical del sensor suele ser de 484 lneas, aunque
slo 480 son activas.
2.5.1 Vdeo analgico no estndar
Las seales de video no estndares, pueden ser una combinacin de: frecuencias
no estndar, resolucin no estndar o barrido progresivo. Las seales de video que no se
ajustan a uno de los estndares descritos anteriormente no pueden ser interpretadas por
un frame grabber convencional con circuitos de codificacin para estndares. Las
cmaras que tienen este tipo de seal son las cmaras de alta velocidad o alta resolucin
o las cmaras que se activan mediante trigger o captura asncrona.
2.5.2 Seal de vdeo digital
Las cmaras digitales utilizan la misma tecnologa que las analgicas, sin
embargo, el convertidor analgico-digital est dentro de la cmara y digitaliza el video
directamente y proporciona una seal de salida digital que puede ser de distintos tipos.
El hecho de que la seal se digitalice en la propia cmara hace que la calidad de la seal
sea mejor, pero tiene el inconveniente de que los cables entre la cmara y el frame
grabber no pueden ser muy largos. La salida digital paralela permite conectar la cmara
con un frame grabber mediante un cable multi hilos. Esta salida normalmente tiene el
formato RS-422 o LVDS (EIA-644). No obstante, se est imponiendo la conexin de
vdeo digital serie USB 2.0, FireWire o IEEE 1394 y GigaEthernet. A continuacin se
presentan los sistemas ms habituales para la conexin directa entre las cmaras
digitales y el ordenador.
2.5.2.1 USB (Universal Serial Bus)
USB es un sistema maestro (controladora USB) - esclavo (perifrico) para las
comunicaciones punto a punto, diseado para reemplazar de manera universal los
diversos protocolos de E/S tanto en serie como en paralelo. El dispositivo esclavo slo
puede comunicarse con el maestro (normalmente un ordenador) pero no con otros
esclavos.
Con USB 2.0 (2000) hay un aumento de velocidad hasta 480 Mbps (casi 40
veces la velocidad de USB 1.1) con una diferencia de coste casi mnimo. Bsicamente,
USB 2.0 incluye todo lo que ofrece USB 1.1 y aade el modo de alta velocidad. USB
2.0 tambin usa el mismo tipo de cables y conectores para conectar los dispositivos de
alta velocidad. La alta velocidad del USB le permite competir con la IEEE-1394a
(Firewire) de 400 Megabits/ seg., si bien la IEEE-1394b sigue siendo ms rpida, con
3,2 Gigabits/ seg.
Carlos Platero Apuntes de Visin Artificial
78 Dpto. Electrnica, Automtica e Informtica Industrial
Con respecto a la distancia, USB fue diseada como una extensin del bus del
ordenador personal, con la idea de que los perifricos estuviesen prximos, de forma
que cada cable no midiese ms de 5 metros. Otras interfaces, entre las que se incluyen la
RS-232, la RS-485, la IEEE-1394b, y Ethernet permiten el uso de cables de longitud
mayor. Si bien, la longitud de un vnculo USB se puede aumentar hasta los 30 metros
usando cables que unan 5 hubs y un dispositivo.
2.5.2.2 IEEE-1394 (Firewire)
La tecnologa FireWire (llamada as por su alta velocidad) la desarroll Apple
en 1986 y surgi de la necesidad de tener una conexin entre vdeocmaras digitales y
los ordenadores personales, de bajo coste y orientada al consumidor. Es uno de los
estndares de perifricos ms rpidos desarrollados hasta el momento y resulta
adecuado para el uso de perifricos multimedia.
En 1995, IEEE la adopt como estndar bajo el nombre de IEEE 1394. Desde
entonces se han desarrollado nuevas versiones que han aadido nuevas posibilidades y
caractersticas. Sony es una de las compaas que ha adoptado este estndar
desarrollando su propia versin conocida como i.Link que se puede encontrar en
muchos de sus ordenadores y videocmaras digitales.
2.5.2.3 Ethernet
Ethernet fue desarrollado a principios de los 70 y estandarizndose en los 80
bajo la tutela del comit IEEE 802. Fue diseado como un sistema de broadcast, de tal
manera que todos los elementos conectados a la red pudieran enviar mensajes cuando
quisieran y a quin quisieran, siendo recibidos los mensajes por todos los equipos de la
red, pero atendindolos slo el destinatario.
De la palabra Ethernet, Ether hace alusin al hecho de que el sistema no est
restringido por el medio fsico que utiliza para establecer la comunicacin, ya sea cables
de cobre, de fibra ptica o por ondas de radio. Existen varias versiones de Ethernet que
se diferencian en el tipo de cable empleado y ha habido una evolucin en las
velocidades:
1. Fast Ethernet: tambin conocida como 100Base-T o IEEE 802.3u, emplea el
mecanismo CSMA/CD como Ethernet pero tiene una tasa de transferencia mayor, de
100Mbps.
2. Ethernet Gigabit: es compatible tanto con Ethernet como Fast Ethernet, pero
su tasa de transferencia es mayor, 1000Mbps.
2.5.2.4 Comparacin de los distintos sistemas
En general, la IEEE-1394 puede ser ms rpida y flexible que USB, pero su
ejecucin/aplicacin es ms cara. Con USB, una nica tarjeta controla las
comunicaciones con varios dispositivos. El ordenador se encarga de las tareas ms
complejas, de forma que los dispositivos pueden ser relativamente simples y baratos.
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 79
Por su parte, los dispositivos IEEE-1394 pueden comunicarse directamente entre
ellos y una sola comunicacin puede dirigirse a mltiples receptores. Esta caracterstica
tiene como resultado una interfaz ms flexible, pero los dispositivos son ms complejos
y caros. La IEEE-1394 es ms adecuada para aplicaciones que requieran
comunicaciones extremadamente rpidas o para la emisin hacia mltiples receptores.
Mientras que la USB es idnea para perifricos comunes como teclados, impresoras,
escneres, as como aplicaciones de velocidad baja a moderada y sensibles al coste.
Ethernet presenta como ventajas la posibilidad de usar cables muy largos, la
capacidad de multidifusin, y la optimizacin de protocolos de Internet sobre Ethernet.
Si bien, al igual que ocurra con la IEEE-1394, el hardware que se necesita para
Ethernet es ms complejo y caro que el hardware perifrico habitual de la USB, por lo
que le resta versatilidad.

2.6 Tarjetas digitalizadoras
El nombre tarjeta digitalizadora no es correcto del todo, ya que sta incluye
operaciones de procesamiento e incluso permiten recibir seal de vdeo digital. Sin
embargo, este trmino es ampliamente aceptado por razones histricas, pues al principio
estas tarjetas no hacan ms que digitalizar la imagen y era el computador el encargado
de procesarlas. Estas tarjetas se podran clasificar en tres tipos: a) Digitializadoras de
bajo coste, b) Digitalizadoras con caractersticas multicanal y c) Digitalizadoras con
capacidad de procesamiento.
Una tarjeta digitalizadora o frame grabber tiene como propsito principal
muestrear, en tiempo real, la salida estndar de una cmara de vdeo, pasando la
informacin al computador. La informacin es almacenada temporalmente y una vez
all la informacin es procesada siguiendo las directrices de un programa. Dependiendo
de la aplicacin, la tarjeta puede ser programada para capturar y almacenar cuadros
individuales, recoger una cierta secuencia de cuadros o quizs leer de manera continua
la imagen de vdeo y realizar una tarea determinada en tiempo real. Algunas tarjetas
tienen caractersticas avanzadas como puede ser captura sncrona de las imgenes.
Carlos Platero Apuntes de Visin Artificial
80 Dpto. Electrnica, Automtica e Informtica Industrial
Las digitalizadoras con capacidades para el procesamiento en tiempo real
derivan sus prestaciones de los procesadores digitales de seal (DSP). stos pueden
realizar procesamientos bsicos sobre la seal de una manera encadenada y en tiempo
real.
2.6.1 Funcionamiento de la adquisicin de la seal de vdeo analgico
El funcionamiento en la adquisicin de vdeo analgico se hace, primeramente,
una adaptacin de impedancias de la seal de vdeo entrante y es separada por un lado
para obtener las seales de sincronismo y por otro el contenido de informacin de la
imagen. Seguidamente, se acondiciona el nivel de continua a un nivel estndar (DC
restoration), ya que la seal enviada por cada cmara puede variar ligeramente y este
proceso ajusta el nivel de negro a una tensin constante. Posteriormente, se hace pasar
la seal por un filtro paso bajo que elimina las altas frecuencias parsitas (low pass
filter) y se corrigen las variaciones que se hayan producido en el nivel de continua y la
ganancia (Offset and Gain). El fabricante normalmente ofrece la posibilidad de
modificar los parmetros de estos circuitos mediante el programa que se ejecuta en el
computador, de esta manera se puede conseguir una seal de mayor calidad. Debido a la
alta frecuencia de la seal de vdeo, es muy importante que las impedancias de cable
coaxial que se utilice y las de la cmara y entrada del digitalizador estn adaptadas. En
caso contrario, se traducir en una degradacin de la seal de vdeo.
2.6.1.1 Sincronizacin.
Ya que las seales de sincronismo vienen junto a la de vdeo, tal y como se ha
explicado, stas deben separarse de la informacin de la imagen. La precisin de las
seales de sincronismo es fundamental para la fidelidad de las imgenes capturadas por
el digitalizador. El primer paso es separar la informacin de vdeo de los impulsos de
sincronismo usando un circuito separador de sincronismo (sync stripper). La resultante
se denomina sincronismo compuesto, ya que contiene tantos los impulsos verticales
como los horizontales. Despus es
introducida como seal de mando a
un bucle de control en cadena
cerrada que en su salida tiene un
oscilador generador de sincronismo
(Hsync Generator), que es
controlado mediante una seal de
error producida por un circuito
comparador de fase (PLL Circuit),
que detecta las diferencias entre la
seal de sincronismo que se est
generando y la que debera ser. La
seal obtenida es la que
sincronizar en el convertidor
analgico digital que es el
encargado de pasar al formato
digital la informacin de las
imagenes.
Figura 2. 55. Diagrama de bloques de una digitalizadora
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 81
El circuito generador de sincronismo horizontal fluctuar por algn tiempo hasta
que el circuito PLL alcance un estado estable. Imprecisiones en la deteccin de la fase
producir el efecto denominado temblor de lneas o line jitter, que causa
desplazamientos horizontales de hasta 3 pxeles. En una tarjeta digitalizadora de
calidad, el temblor de lneas ser normalmente menor de 0.1 pxeles.
Para solucionar este problema, algunas cmaras permiten ser sincronizadas por
un oscilador exterior. En este caso el digitalizador ser el que genere las seales de
sincronismo vertical y horizontal o bien el sincronismo compuesto, haciendo que la
digitalizacin sea en el momento preciso y corrigiendo totalmente este problema. Se
tiene que tener especial cuidado cuando la longitud del cable sea elevada, ya que la
seal de sincronismo puede ser retrasada por la inductancia y capacidad del cable,
haciendo que la imagen aparezca desplazada.
Tambin ha de tenerse especial cuidado con el efecto de calentamiento de los
circuitos electrnicos de la cmara y la digitalizadora, ya que tambin pueden producir
variaciones en el comportamiento de estos y afectar directamente en la calidad de la
imagen. Es un buen hbito esperar una o dos hora con el equipo encendido hasta que la
cmara se estabilice trmicamente.
La digitalizacin se produce en el rango de vdeo de 0 a 0.7 voltios. El periodo
de muestreo para seales de televisin vara entre los 20 y los 30 MHz. Las tarjetas de
propsito general emplean 8 bits que es equivale a un byte de informacin por pxel.
2.7 El modelo proyectivo de la formacin de imgenes
El proceso de adquisicin de una imagen por el sistema de Visin Artificial se
modela en dos pasos: la formacin de la imagen en el elemento sensor CCD a travs de
los elementos pticos y la digitalizacin de la seal proveniente de la cmara. Cada uno
de estos procesos se puede describir de distintas formas, ms o menos complejas.
El modelo pin-hole es el ms simple para representar la formacin de la imagen.
Est basado en la proyeccin de perspectivas y reduce el sistema ptico a un punto
llamado centro ptico, C. Cada punto del espacio eucldeo se proyecta por un nico rayo
luminoso que pasa por el centro ptico, situado a una distancia f (distancia focal), hasta
el plano de la imagen. El eje ptico es la lnea perpendicular al plano de la imagen que
pasa por el centro ptico. En este modelo se carece de proceso de enfoque.
Con este modelo y con una secuencia de imgenes adquiridas consecutivamente
en el tiempo se trata de obtener la percepcin visual de los objetos proyectados en el
plano sensor. Para diferenciar las imgenes unas de otras se indexarn los parmetros.
As la proyeccin de un punto en el espacio M
wi
(x
wi
, y
wi
, z
wi
), teniendo el eje de
coordenadas sobre el punto focal de la posicin indexada i, se transforma en un punto
sobre el plano sensor, establecindose la relacin no lineal de:
Carlos Platero Apuntes de Visin Artificial
82 Dpto. Electrnica, Automtica e Informtica Industrial
wi
wi
i
i
wi
wi
i
i
z
y
f
y
z
x
f
x
= =
siendo x
i
e y
i
las coordenadas del punto proyectado. El signo menos refleja el
carcter invertido del modelo. Obsrvese que estas proporciones estn referenciadas en
magnitudes de longitud, generalmente expresado en milmetros. Sin embargo, los
algoritmos de extraccin de las coordenadas del punto proyectado sern dados en
pxeles. Habr que proponer la conveniente conversin.
Para la transformacin se requiere conocer el centro del plano sensor C
i
(c
xi
, c
yi
);
estos valores sern dados en pxeles desde el origen de coordenadas de la imagen
digitalizada, es decir, la esquina superior izquierda. Tambin es necesario conocer la
distancia interpixel de la cmara tanto en filas como en columnas (d
x
, d
y
). Hay que
destacar que C
i
es uno de los parmetros intrnsecos de la cmara, pues el
desplazamiento del zoom o el enfoque de las pticas har variar este parmetro de una
imagen a otra. En cambio, las distancias interpixel se mantendrn al ser un parmetro de
fabricacin. No obstante, la diferencia entre el nmero de columnas sensoras de la
cmara y la frecuencia de muestreo de la lnea modificar el valor interpixel de d
Y
.
Adems habr de considerar el efecto de prdida de sincronismo en la lectura de la
lnea, el llamado efecto temblor de lnea que suele evaluarse por el factor de
incertidumbre, k
y
. Por tanto, se redefine d
y
como:
x py
sy
y y
k n
n
d d = '
donde n
sy
es el nmero de elementos sensores columna que hay en una cmara y
n
py
es el nmero de pxeles de la imagen digitalizada.
Del planteamiento presentado se deduce que la relacin existente entre el punto
proyectado sobre la cmara y su valor en pxeles sobre la imagen digitalizada resulta
ser:
(2. 15)
(2. 16)

Figura 2. 56. Modelo pin-hole de la cmara


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 83
( )
( )
y yi yi i
x xi xi i
d c P y
d c p x
' =
=

teniendo p
xi
e p
yi
que son las coordenadas en pxeles de la imagen sobre el punto
proyectado en la cmara Esta disposicin de los signos har eliminar el anteriormente
mencionado efecto inversor del modelo pin-hole. Insertando las expresiones de la ec.
2.17 en la ec. 2.15 y presentndolo en coordenadas homogneas y en notacin matricial
se tendr:
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
.
|

\
|
'
=
|
|
|
.
|

\
|
1
1 0 0
0
0
1
wi
wi
wi
wi
yi
y
i
xi
x
i
yi
xi
z
y
z
x
c
d
f
c
d
f
p
p

En 2.18 est implcito el carcter ortogonal de los ejes de proyeccin. En el caso
de que no fuese as, el mapa de pxeles podra generalizarse a:
|
|
|
|
|
|
.
|

\
|
|
|
|
|
|
|
.
|

\
|
'
'

=
|
|
|
.
|

\
|
1
1 0 0
0
1
wi
wi
wi
wi
yi
y
i
xi
y
i
x
i
yi
xi
z
y
z
x
c
d
f
c
d
f
d
f
p
p


donde es un escalar que mide el desplazamiento rotacional entre los dos ejes
principales; si es cero es que stos son perpendiculares.
2.8 Calibracin geomtrica de las cmaras
La calibracin de las cmaras se puede dar en un doble sentido: a) geomtrica y
b) radiomtrica. La primera relaciona las transformaciones proyectivas desde la escena
exterior 3D de la cmara con el plano sensor y la segunda con los aspectos de radiacin
en cada uno de los pxeles. El segundo
aspecto fue tratado, someramente, en el
apartado 2.4.3. Aqu se trata de determinar
cual es el conjunto de transformaciones
proyectivas que relaciona la escena con el
plano sensor. Su utilidad resulta
fundamental en tareas de percepcin y de
navegacin visual. En todas estas
aplicaciones, se trata de analizar las
imgenes para obtener medidas
geomtricas del mundo exterior. Para
(2. 17)
(2. 18)
(2. 19)
Figura 2. 57. Correspondencia entre los puntos 3D
del espacio con los pxeles proyectivos
Carlos Platero Apuntes de Visin Artificial
84 Dpto. Electrnica, Automtica e Informtica Industrial
realizar estos algoritmos se exige de la calibracin geomtrica de las cmaras.
En funcin de lo comentado en el apartado anterior, existen dos tipos de
parmetros en las transformaciones proyectivas: a) parmetros intrnsecos y b)
parmetros extrnsecos. Los primeros son aquellos inherentes a la cmara y son: la
distancia focal, el centro ptico y el modelo de deformacin de la lente; mientras que los
parmetros extrnsecos son los que definen la posicin y orientacin de la cmara
respecto a un sistema de referencias 3D: vector de traslacin y matriz de rotacin.
2.8.1 Procedimiento general de calibracin
Aunque existen distintos mtodos para la calibracin de una cmara, el
procedimiento bsico es el mismo en todos ellos:
1. Determinar con precisin un conjunto de puntos 3D del mundo exterior.
2. Fijar sus correspondencias con las proyecciones de estos puntos 3D sobre
la imagen proyectada 2D.
3. Obtener mediante tcnicas de optimizacin la mejor solucin de la
determinacin de los parmetros intrnsecos y extrnsecos.
Los dos primeros tems requieren conocer una serie de puntos 3D y sus
correspondientes proyecciones en la imagen; son los que se denominan puntos de
calibracin. Dependiendo del algoritmo de calibracin, los puntos pueden ser coplanares
o no. Pero sea como fuere el tipo de
plantilla de calibracin, se sugiere un
patrn de cuadros blancos y negros, a
modo de tablero de ajedrez, tal que
facilite el proceso de extraccin de las
esquinas con precisin subpixel y sea
fcil de corresponder los puntos
exteriores 3D con sus proyecciones
2D. Realizado los pasos de
correspondencia se pasar a determinar
los parmetros intrnsecos y
extrnsecos mediante tcnicas de
optimizacin.


Figura 2. 58. Parmetros extrnsecos
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 85
2.9 Formatos grficos.
Las imgenes digitales se pueden almacenar en distintos soportes fsicos tales
como: discos duros, CDs, DVDs o memoria flash. Para este objetivo se han inventado
cientos de formatos con la funcin principal de comprimir la enorme cantidad de
informacin que contiene una imagen digital. Una primera clasificacin podra ser:
formatos grficos vectoriales y formatos grficos en mapa de bits. Este ltimo puede
dividirse adems en formatos con prdida o no de la informacin.
2.9.1 Formatos grficos vectoriales
Se almacenan las coordenadas de las figuras geomtricas simples como
segmentos, tringulos, rectngulos, circunferencias, etc., as como las rdenes
necesarias para rellenar con los colores adecuados. Para dibujos simples el fichero
resultante ocupar poco tamao comparando con lo que ocupara si estuviera en formato
de mapa de bits. Tal es el caso de ficheros generados por programas de generacin de
imgenes 3D como AutoCAD, libreras de computacin grfica como VTK o
programas de dibujos en general.
2.9.2 Formatos grficos en mapa de bits
Este formato es el ms intuitivo, ya que lo nico que hace es almacenar
secuencialmente los pxeles que componen la imagen en un fichero. El orden de
almacenamiento se puede entender considerando la imagen como una gran matriz de
pxeles. As partiendo de la esquina superior izquierda, avanzando por las columnas de
izquierda a derecha y por filas de arriba abajo.
Si el fichero se almacena as tal cual, se dice que est en formato crudo (*.raw),
ser necesario para su lectura saber cuantas filas y columnas tiene la imagen. El
inconveniente del formato en crudo es la gran cantidad de espacio que se necesita. La
mayora de los formatos actuales llevan consigo una reduccin sustancial del volumen
informativo. La compresin de las imgenes se hace siguiendo algunas de estas tres
estrategias:
1. Compresin en la codificacin: en vez de emplear un nmero fijo de bits
para cada nivel de gris o color, se emplea un cdigo ms corto a los
niveles ms probables y ms largo a los menos probables.
2. Compresin en la representacin: La similitud de intensidad en los
vecinos hace emplear las rachas, las cuales indican el nmero de vecinos
que se repiten. Se almacenan en vez de los valores de intensidad, el
nmero de vecinos con la misma intensidad.
3. Compresin por redundancia visual: Las imgenes vistas por el ojo
humano no es capaz de percibir el contraste de tonos muy prximos entre
s, por dicha razn en vez de almacenar los mapas de bits se aplican
transformaciones matemticas sobre la imagen, con el objetos de guardan
Carlos Platero Apuntes de Visin Artificial
86 Dpto. Electrnica, Automtica e Informtica Industrial
los principales coeficientes de la conversin. Evidentemente, la imagen
resultante es de peor calidad que la entrante. Hay perdidas de detalle. El
ejemplo ms caracterstico es el algoritmo de compresin JPEG basadas
en las transformadas discretas del coseno. Tambin son ejemplos de
compresin basada en redundancia visual los estndares de vdeo MPEG
y MPEG2.
2.10 Cuestiones
1. Diferencias entre la Visin Artificial y la Computacin Grfica sobre
la iluminacin.
2. Factores que influyen en la formacin de una imagen digital.
3. Calidad de una imagen.
4. Tcnicas de iluminacin.
5. Discrepancias entre el modelo de lente delgada y el modelo pin-hole.
6. Consecuencias de variar el diafragma.
7. Tipos de aberraciones y distorsiones pticas.
8. Diferencias entre cmaras lineales y cmaras TDI
9. Modelado geomtrico y radiomtrico de una cmara.
10. Cmaras CCD versus cmaras CMOS.
11. Ventajas e inconvenientes de las distintas arquitecturas de
transferencia: cuadro, interlnea, cuadro-interlnea.
12. Cmaras entrelazadas y cmaras progresivas.
13. Clasificacin de las seales de vdeo.
14. Partes de una digitalizadora de vdeo de bajo costo.
15. Tipos de archivos de imgenes.
Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 87
2.11 Problemas
Ejercicio 1
Una fuente luminosa puntual de 100 mW/sr se sita
en un escenario de 10m x 20m, en X e Y respectivamente,
tal cual se observa en la figura. Sabiendo que irradia por
igual en todas las direcciones. Calcular la iluminacin
mxima y mnima sobre el suelo.
La iluminacin mxima sobre el suelo se encontrar debajo del foco:
2
max 2
mi n
1 0 0
/
9
I
E m W m
d
= =
La mnima se encontrar a la distancia ms alejada entre el escenario y el foco:
2 2 2
max
15 6 16.43 d m = + =
El ngulo entre el foco y el extremo del escenario es de 79.4. La iluminacin
total ser:
2 2 2
, min , min min
0.068 / 0.364 / 0.37 /
H V
E mW m E mW m E mW m = = =
Ejercicio 2
Una luminaria se sita en el centro de
un escenario de 5m x 2m y a una altura de
3m. La intensidad luminosa es entregada por
el fabricante segn el diagrama polar
adjuntado. Calcular la iluminacin en los
puntos a), b) y c).
En el punto A, la intensidad es de 150 mW/sr
y el ngulo entre la normal de la superficie y el foco
es nula:
2
2
2
2
3
/ 6 . 16
/ 0
/ 6 . 16
cos
m mW E
m mW tg E E
m mW
h
I
E
a
H Va
Ha
=
= =
= =
o
o

Carlos Platero Apuntes de Visin Artificial
88 Dpto. Electrnica, Automtica e Informtica Industrial
En el punto B, la intensidad es de 130 mW/sr y el ngulo entre la normal de la
superficie y el foco es de 26.57:
2
2
2
2
3
/ 5 . 11
/ 2 . 5
/ 3 . 10
cos
m mW E
m mW tg E E
m mW
h
I
E
b
H Vb
Hb
=
= =
= =
o
o

En el punto C, la intensidad es de 140 mW/sr y el ngulo entre la normal de la
superficie y el foco es de 18.43:
3
2
2
2
2
co s
1 3 . 3 /
4 . 4 /
1 4 /
H c
Vc H
c
I
E m W m
h
E E t g m W m
E m W m
o
o
= =
= =
=

Ejercicio 3
Se tiene una cmara de vdeo a
calibrar. La ptica tiene una distancia
focal de 3mm y el tamao del pxel es de
5.6 m x 5.6 m. El nmero efectivo de
pxeles son 357(H) x 293(V). Cual es la
distancia mnima que podr ponerse una
rejilla de calibracin respecto de la
cmara, si sta se constituye por cuadros
blancos y negros de 27mm de lado y
segn se observa en la figura, hay 7x9
cuadrados?.
En la mnima distancia deber de entrar la rejilla completa. Se parte de la
hiptesis que los nueve cuadros deben de entrar en las 357 columnas, por tanto:
3
3
6
9 27 10
3 10 0.364
357 5.6 10
Y
Z f m
y


= = =


Habr que observar que en las filas entrar los siete cuadrados:
3
3
6
7 27 10
3 10 0.345
293 5.6 10
X
Z f m
x


= = =


Por tanto, se verifica que cuando la distancia es de 0.364 m entra por completo la
rejilla.

Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes
Dpto. Electrnica, Automtica e Informtica Industrial 89
Ejercicio 4
Se emplea una cmara con una lente
de 3mm y un sensor CMOS que tiene un
pixel cuadrado de 5.6m x 5.6m. El nmero
efectivo de pxeles es 357 (H) x 293 (V). Se
ha colocado una plantilla de calibracin a 500
mm respecto al eje de referencia en la
cmara. Sabiendo que los lados del
cuadrado son de 27mm y que las
coordenadas XYZ del punto indicado en la
rejilla son (50,50,500). Determinar en qu
pxeles de la cmara se proyectan las cuatro
esquinas del cuadrado seleccionado.
Considrese que no hay distorsin en la lente, el eje axial de la lente pasa por
el centro del elemento sensor y que los ejes de proyeccin son ortonormales.
El modelo pin-hole de la cmara quedar definido por:
0
5 3 5 . 7 1 0 1 4 6 . 5
0 0 5 3 5 . 7 1 1 7 8 . 5
1 0 0 1
1 1
0 0 1
i w i w i
xi
x w i w i
xi
i w i w i
yi yi
y w i w i
f x x
c
d z z
p
f y y
p c
d z z
| | | | | |
| | |
| | | |
| | |
| |
| | |
= =
| | '
| | |
| |
| | | \ . \ .
| | |
\ . \ . \ .

El primer punto quedar proyectado en el pxel (200,232) y los otros tres en
(229,232),(200,261) y (229,261).
Ejercicio 5
La imagen area fue adquirida a una altura de 2500 m
con una cmara con distancia focal de 125 mm. Sabiendo
que la distancia entre las dos marcas es de 30m, determinar
las coordenadas en pxeles de la segunda marca (la de la
derecha), si la marca de la izquierda est en el pxel
(250,500). Datos: Pxel cuadrado de 10 m.
El factor de magnificacin es:
0.125
2500
f
M
Z
= = , luego la
proyeccin de las dos marcas sobre el elemento sensor es: 0.0015 y M Y m = = , lo que da
una separacin en columnas de 150 pxeles. La coordenada del pixel de la derecha es
(250,650).



Carlos Platero Apuntes de Visin Artificial
90 Dpto. Electrnica, Automtica e Informtica Industrial
Derecho de Autor 2014 Carlos Platero Dueas.
Permiso para copiar, distribuir y/o modificar este documento bajo los trminos
de la Licencia de Documentacin Libre GNU, Versin 1.1 o cualquier otra
versin posterior publicada por la Free Software Foundation; sin secciones
invariantes, sin texto de la Cubierta Frontal, as como el texto de la Cubierta
Posterior. Una copia de la licencia es incluida en la seccin titulada "Licencia de
Documentacin Libre GNU".

La Licencia de documentacin libre GNU (GNU Free Documentation License)
es una licencia con copyleft para contenidos abiertos. Todos los contenidos de estos
apuntes estn cubiertos por esta licencia. La version 1.1 se encuentra en
http://www.gnu.org/copyleft/fdl.html. La traduccin (no oficial) al castellano de la
versin 1.1 se encuentra en http://www.es.gnu.org/Licencias/fdles.html

S-ar putea să vă placă și