Sunteți pe pagina 1din 3

ITCR. Castillo, Miranda, Rodrguez, Obando.

INFORME PROYECTO DE TEORIA DE COMUNICACION

INFORME PROYECTO DE TEORIA DE


COMUNCIACION

G.Castillo L. Miranda, D. Rodrguez, A. Obando

informacin, pero al menos la necesaria para poder realizar las


pruebas requeridas de voz.

Resumen En este informe se explicar la elaboracin de un


proyecto de procesamiento de seales. El presente proyecto
consiste en el procesamiento de voces mediante el uso del software
Matlab. En la primera parte del proyecto consiste en hacer un
programa que pueda distinguir entre un grupo de cuatro palabras
distintas. En la segunda parte se trata de poder distinguir entre las
voces de distintos sujetos con el fin de generar un sistema de
contrasea por medio de voz.

En la siguiente imagen bsicamente lo que vemos son unos


encabezados que dan informacin general acerca del proyecto.
Al lado izquierdo superior se encuentra dos cuadros de texto los
cuales cambian al recibir un parmetro de voz de entrada. En l
se indican cuando el programa ha correlacionado con xito un
comando con la voz entrante de igual forma con las contraseas.

I. INTRODUCCIN

En esta imagen se puede ver que se relacion con xito el


comando de Abrir.

Basicamente el proyecto posee dos grandes partes: una parte de


identificacion de comandos y una parte de autenticacion de
usuario por medio de una contrasena por voz. El proyecto se
realizo mediante el sotware matlab.
Se crearon unas funciones que se encargan de guardar las voces
originales y procesarlas. Y otra que se encarga de procesar uno
entrante en tiempo real y compararla con el previamente
grabado.
Para todo esto se utiliza la transformada rapida de fourier, la
cual se encarga de filtrar la parte positiva de la onda de manera
que sea mas facil de procesar la informacion entrante y poder
ver si existe correlacion entre la voz entrante y la grabada
previamente.

II. OBJETIVOS

Figura 1: Interfaz Grfica para la primera parte.


En la siguiente imagen se ve cuando el cuadro de texto es
utilizado para la segunda parte en donde se puede observar que
la contrasea es incorrecta. Ya sea porque no es el sujeto de
clave o porque dijo algn otro comando distinto de la
contrasea.

Objetivo General: Crear un programa capaz de procesar la


voz y tomar ciertas decisiones a partir de los mismos.

Objetivos Especficos:
Elaborar un software capaz de tomar cuatro. comandos
de voz y poder distinguir entre los mismos
Crear un software capaz de diferenciar entre la voz de
un sujeto y otro.
Demostrar mediante un arduino la capacidad del
software de tomar simular actuadores que se podran
activar a partir de estos comandos de voz.
Figura 2: Interfaz Grfica para la segunda parte.
III. INTERFAZ GRAFICA
A continuacin, se explicar brevemente la forma que en que
se desarroll la interfaz grfica del Proyecto. Al ser como un
prototipo es una interfaz muy simple que posee poca

En la parte inferior de la interfaz se muestra la parte matemtica


del procesamiento de seal. Del lado izquierdo se muestra la
onda entrante en su forma completa, del lado derecho se

ITCR. Castillo, Miranda, Rodrguez, Obando. INFORME PROYECTO DE TEORIA DE COMUNICACION


muestra la seal filtrada mediante la transformada rpida de
Fourier.

En la segunda parte que corresponde a la funcionalidad de


reproducir, lo nico que se hace es acceder a una grabacin
guardada anteriormente para que el usuario pueda emular lo que
dijo en la grabacin lo ms parecido posible.

IV. LOGICA DEL PROGRAMA


En el siguiente apartado se explicar mediante el uso de
diagramas de flujo la lgica que siguen los dos programas para
darle marcha al procesamiento de la seal. El programa est
conformado por dos scripts. Por lo tanto la explicacin se
dividir en dos.

Figura 3: Diagrama de flujo del primer script.


En el diagrama de flujo anterior se observa el primer script.
Bsicamente lo que hace este script es pedir un dato de entrada
que va de 1 a 5. Dependiendo de cul de esos se elija se modifica
entre los 4 comandos o la contrasea. Es un script muy sencillo
el cual nicamente se encarga de almacenar los audios para
posteriormente procesarlos.
El otro script se encarga de realizar el procesamiento, as como
otras funciones, como realizar la conexin con el arduino y
definir los puertos 7, 8 y 9 de este como salidas.

En la ltima parte, que corresponde a la de seguridad, el usuario


tendra la habilidad de grabar durante dos segundos con el fin
de pasar una contrasea por medio de su voz, donde se
identifica no solo que la contrasea sea la correcta sino que la
est diciendo la misma persona, para esta parte se realiza casi
lo mismo que en la parte 1, se normaliza y calcula la transforma
rpida de Fourier y se calcula el error entre la grabacin
existente y la grabacin actual, la diferencia aparece en que el
programa no solo reconoce a cual comando es el ms parecido
sino que el error calculado tiene que ser lo suficientemente bajo
para que solo la persona adecuada diciendo la contrasea
adecuada sea capaz de acceder. En este caso el error debe ser
menor a 4,5 ya que probamos que es un error lo suficientemente
pequeo como para descartar a las dems personas, pero no
tanto para no permitir ninguna aproximacin ni siquiera por
parte del dueo de la contrasea, por lo que es un valor
adecuado.
Cabe destacar que el cdigo interactuaba con el arduino con el
fin de cambiar los valores de su salida dependiendo de los
resultados obtenido y as prender y apagar leds, esto con el fin
de simular una aplicacin donde se puedan utilizar actuadores
dependiendo de los resultados obtenidos del procesamiento de
voz.

V. APLICACIONES INDUSTRIALES
Se escogi este Proyecto porque nos gustaba mucho y nos
pareci que podra llegar a ser muy til de ser utilizado en la
industria ya que es capaz de realizar controles de mquinas o de
lo que se necesite con solo decir una palabra o de proveer un
sistema bastante seguro por medio de la voz de la persona que
tiene acceso al sistema.

El programa cuenta con tres partes principales, grabar,


reproducir y seguridad, las cuales tienen diferentes
funcionalidades.
En la parte de grabar se le permite al usuario realizar una
grabacin durante un perodo de tiempo, 2 segundos en este
caso, posterior a esto el programa se encarga de normalizar la
grabacin para eliminar el ruido que se encuentra en esta y
calcular la transformada rpida de Fourier tanto de las
grabaciones originales los comandos) como de la que se acaba
de hacer. En una lista guarda los errores respectivos entre cada
uno de los comandos guardados previamente y la grabacin que
se acaba de realizar con el fin de obtener la correlacin de estos.
Seguido a esto el programa toma el error ms bajo de los que se
encuentra en esta lista y lo guarda en una variable con el fin de
poder utilizarla ms adelante, lo que hace con esta variable es
compararla con los valores que se encuentran en la lista, con el
fin de conocer la posicin en la lista en la que se ubica el error
ms y dependiendo de donde se encuentre esta, as logra
identificar el comando que est siendo grabado.

VI. CONCLUSIONES

El procesamiento de seales es una herramienta muy


til en la realizacin de proyecto de la actualidad,
debido a que permite una optimizacin en la forma en
que se analizan los sistemas, por ejemplo con video y
en este caso con voz.
Existen herramientas de software como Matlab que
permiten el procesamiento de seales con mucha
facilidad.
El control de mecanismos ya sea actuadores o de
seguridad por medio de voz, funcionan con una alta
eficacia.

ITCR. Castillo, Miranda, Rodrguez, Obando. INFORME PROYECTO DE TEORIA DE COMUNICACION

S-ar putea să vă placă și