Sunteți pe pagina 1din 12

UNIVERSIDAD NACIONAL DE INGENIERA

FACULTAD DE INGENIERA INDUSTRIAL Y DE SISTEMAS

Departamento de Sistemas y Telemtica


Inteligencia Artificial
ST 414 - V

Examen Final

PROFESOR: Ing. Samuel Oporto Daz

ALUMNOS:

Heredia Carrasco, Orlando


Huaraca Berrospi, Angelo
Marcelo Calla, Juan Miguel
Ramirez Curi, Luis Gabriel

Lima, 20 de Julio del 2016

Tabla de contenido
1.

2.

3.

Adquisicin............................................................................................... 3
1.1

Tomar de fotografas..........................................................................3

1.2

Extraer ROI........................................................................................ 3

1.3

Etiquetado de fotografas..................................................................3

1.4

Separacin datos de entrenamiento y datos de prueba....................3

1.5

Procesamiento de imagen.................................................................3

1.5.1

Leer la Imagen............................................................................. 3

1.5.2

Convertir escala grises................................................................4

1.5.3

Suavizar...................................................................................... 4

1.5.4

Ecualizar la imagen.....................................................................4

1.5.5

Invertir a negativo.......................................................................5

1.6

Extraer caractersticas de cada imagen............................................5

1.7

Construir el modelo SVM...................................................................5

1.7.1

Balancear muestras.....................................................................5

1.7.2

Entrenamiento del modelo..........................................................5

Consulta................................................................................................... 5
2.1

Captura del video de extraccin del ROI............................................5

2.2

Extraer las caractersticas del ROI.....................................................5

2.3

Consultar al modelo...........................................................................5

Procedimiento del conteo........................................................................5


3.1

Calcular el centroide de la imagen....................................................5

3.2

Calcular la persistencia del objeto.....................................................6

1. Adquisicin
1.1
Tomar de fotografas
En este punto se tiene que realizar tomas fotogrficas de la parte superior
de un fondo seleccionado, por el cual pasaran las personas que
procederemos a fotografiar cuando estn en el enfoque de la cmara, de
preferencia un bloque que sea cuente con un ingreso a una habitacin a
travs de una puerta, de la misma forma el fondo tiene que ser oscuro para
obtener resultados ms precisos.
1.2
Extraer ROI
En este punto nos concentraremos en las fotografas, que tengan a los
objetos (personas) dentro de ellas, para proceder a seleccionarlas y
extraerlas en una imagen con 200x200 pixeles de tamao para realizar los
procesos necesarios del trabajo, esta medida se ha tomado en base que si
usamos una mayor nos encontraremos con dificultades ya que solo nos
concentraremos en el objeto que est dentro de la fotografa.
1.3
Etiquetar fotografas
En esta punto las fotografas que tengamos almacenadas pasaran a ser
distribuidas manualmente, es decir las fotografas que cuenten con objetos
(personas) las ubicaremos en una carpeta con nombre fotografas con
objetos y las fotografas que solo tengamos un fondo sin objetos las
ubicaremos en una carpeta con nombre fotografas sin objetos, con el fin
de acceder a las fotografas que utilizaremos con ms frecuencia o las que
en realidad tengamos ms importancia que sern las fotografas con
objetos.
1.4
Separacin datos de entrenamiento y datos de prueba
En este punto se pasara a seleccionar los datos de entrenamiento y los
datos de prueba que usaremos en el proyecto. Tenemos en total 633
fotografas las cuales las pasaremos a dividir de la siguiente forma:

Con
Objetos
Sin
Objetos
Total

Datos de
Entrenamiento
166

Datos de
Prueba
120

Total

227

120

347

286

347

633

286

Esta seleccin de datos de prueba y de entrenamiento ha sido seleccionada


aleatoriamente.

1.5

Procesamiento de imagen
1.5.1

Leer la Imagen

En esta etapa, se capturar la imagen como un arreglo de tres dimensiones,


siendo la ltima dimensin, los componentes RGB de cada pxel de la
imagen de la imagen. La siguiente figura muestra la matriz que representa a
la imagen digitalizada.

1.5.2
Convertir escala grises
Para una mayor representacin de la imagen, la cual nos pueda facilitar el
procesamiento de la misma, se transforma la matriz de tres dimensiones a
una de dos dimensiones, siendo cada uno de los valores de la nueva matriz
el valor de intensidad de cada pxel de la imagen. La siguiente ecuacin se
utiliza para la transformacin.

Siendo R, G y B cada uno de los componentes de cada pxel de la imagen


original; y V, el valor de intensidad de cada pxel de la nueva imagen (nueva
matriz).
1.5.3
Suavizar
Para la eliminacin del ruido se har uso del filtro de mediana con una
vecindad de 3 x 3 (Poner el filtro de mediana en el marco terico y
referenciar aqu). El resultado se muestra en la siguiente figura:

1.5.4 Ecualizar la imagen


Para obtener un mayor contraste, se ampliar el histograma de la imagen
aplicando la ecualizacin del histograma antes mencionada (Poner
ecualizacin del histograma en el marco terico y referenciar aqu). El
resultado se muestra en la siguiente figura:

1.5.5
Invertir a negativo
Para poder identificar el objeto con mayor facilidad, se invertir la imagen a
negativo (Poner inversin de la imagen en el marco terico y referenciar
aqu). Esto convertir la parte de inters (la persona, en este caso) con
valores de intensidad altos. En la siguiente figura se muestra el resultado:

1.6
Extraer caractersticas LBP de cada imagen
Para la extraccin de caractersticas de la imagen, se us el descriptor LBP
Uniforme (Poner LBP Uniforme en el marco terico y referenciar aqu), el
cual describi a la imagen con un histograma que fcilmente se puede
convertir en un vector descriptor de la imagen de tamao 59. Las siguientes
figuras muestran el histograma LBP de dos muestras:

Histograma LBP (Persona)


0.2
0.15
0.1
0.05
0

Histograma LBP (Fondo)


0.35
0.3
0.25
0.2
0.15
0.1
0.05
0

1.7

Construir el modelo SVM

1.7.1 Balancear muestras


Como se haba mencionado anteriormente, se tiene un conjunto de
muestras de entrenamiento (166 muestras positivas y 227 negativas), para
tener muestras balanceadas se ha escogido aleatoriamente 61 de las
muestras positivas y se han adicionado a para tener un nuevo conjunto de
muestras de entrenamiento (227 muestras positivas y 227 negativas). La
siguiente figura muestra el proceso que se hizo en RapidMiner para llevar a
cabo el proceso.

1.7.2 Entrenamiento del modelo


Se us como tcnica de clasificacin Support Vector Machine (Poner svm en
el marco terico y referenciar aqu), con kernel RBF (Poner Kernel RBF en el
marco terico y referenciar aqu). Teniendo como parmetros de
clasificacin C y gamma, se prob con diferentes valores para estos
parmetros para optimizar el rea bajo la curva ROC (AUC por sus siglas en
ingls). Los parmetros ptimos encontrados fueron 32678 y 0.000488 para
C y gamma, respectivamente. A continuacin, se muestra la curva ROC
que
se
genera
para
estos
parmetros:

Una vez encontrado los parmetros, entrenamos el clasificador con las


muestras de entrenamiento. El resultado del rendimiento de la clasificacin
se resume en la siguiente matriz de confusin:

Como podemos observar, tiene un 100% de rendimiento con los datos de


entrenamiento.
(Ponerle mas indicadores, guense de la diapo del profe)
1.8
Realizacin de pruebas del modelo entrenado
Para la realizacin de las pruebas, tenemos 120 muestras con personas y
120 sin personas. El resultado del rendimiento del clasificador en las

muestras con las que no se hizo el entrenamiento se puede observar en la


siguiente matriz de confusin:

Es notable que el rendimiento para muestras que no han formado parte del
entrenamiento, es mayor que el 90%.
(Ponerle ms indicadores, guense de la diapo del profe)

2. Consulta
2.1
Captura del video
Se tendr una cmara en la parte superior de la puerta, la cual capturar
imgenes cada 0.005 segundos, estas imgenes se restarn cada una con el
anterior para verificar si hay un movimiento de pxeles (movimiento de un
cuerpo dentro de la imagen). Para esto, se restan las matrices que
representan a la imagen actual y a la anterior (poner frmula para la
diferencia de matrices con valor absoluto), y se recorre una ventana
que suma todos los pxeles en donde se encontr diferencia por toda la
imagen. Con un umbral determinado, verificamos si la diferencia de pxeles
es considerable para que pueda ser la representacin de una persona en
movimiento.

2.2
Extraccin del ROI
La ventana que tenga el mayor valor de suma de pxeles y que, adems,
sea mayor al umbral, se extraer de la imagen.

2.3
Extraer las caractersticas del ROI
Se recorrer una ventana deslizante (que variar en tamao) por toda la
imagen extrada y se calcular el vector de caractersticas LBP por cada
ventana.

Histograma LBP (Fondo)


0.35
0.3
0.25
0.2
0.15
0.1
0.05
0

2.4
Consultar al modelo
Por cada vector de caractersticas extradas se consultar al modelo
construido para detectar a la persona dentro la imagen.

3. Procedimiento del conteo


3.1
Calcular el centroide de la imagen
Si logra detectar a la persona en alguna ventana generada, se calcular la
posicin de la ventana dentro de la imagen total y se guardar en un vector
el cual contendr todas las posiciones donde se ha encontrado el objeto.

Si no logra detectar a la persona en alguna ventana, quiere decir que:


1. No hubo persona, si el vector de posiciones est vaco o,
2. La persona sali de la imagen, si el vector de posiciones no est
vaco.
3.2
Agrandar la ventana ROI
Una vez guardado la posicin final del objeto, se agrandar nuevamente la
ventana ROI y se capturar nuevamente una imagen para detectar el objeto
tan solo dentro de esta ventana. Esto se hace con el fin de reducir el
espacio para la deteccin del objeto, suponiendo que el objeto se mueve a
una velocidad finita en cualquier direccin de la imagen. (Poner frmula
para agrandar la ventana ROI un nmero de pxeles determinado
p)

3.3
Calcular la persistencia del objeto
Mientras se est detectando a la persona, se guardar su posicin en un
vector de posiciones. Cuando la persona sale de la imagen (ya no se detecta
a la persona), se grafica la trayectoria en la imagen. Si el punto final de la
trayectoria est dentro de la parte de la imagen etiquetada como puerta,
entonces quiere decir que la persona ha entrado a la habitacin y aumenta
el contador de personas. Si el contador llega al valor de 10 personas, suena
una alarma indicando que se ha llegado al lmite de personas en el
establecimiento. A continuacin, se muestra grficamente el traslado del
objeto de prueba en la imagen, la ltima posicin en la cual se detect el
objeto estuvo dentro de la parte de la imagen etiquetada como puerta

S-ar putea să vă placă și