Documente Academic
Documente Profesional
Documente Cultură
Tabla de contenido
RESEA HISTRICA 2
PRINCIPALES APLICACIONES 8
IDENTIFICACIN AUTOMATIZADA 8
DETERMINACIN DE LA IDENTIDAD 9
RECONOCIMIENTO DEL ESTADO EMOCIONAL 9
ANLISIS DEMOGRFICO 10
REFERENCIAS 12
INTRODUCCIN
Resea histrica
El concepto del anlisis de los factores estructurales de la voz data del siglo XXI. En 1867 el padre de
Alexander Graham Bell, Alexander Melville Bell, estableci las bases para la futura investigacin de la
voz. Invent un lenguaje conocido como habla visible, que es un alfabeto escrito que representa los
sonidos del habla humana. Se us para ensear a personas sordas a hablar cualquier idioma con un
acento estndar. [1]
El primer uso de esta tecnologa se dio en la segunda guerra mundial. Los soldados norteamericanos
usaban un equipo llamado espectrgrafo para interceptar transmisiones de radio. En 1976 Texas
Instruments dise el primer equipo biomtrico de voz capaz de registrar y determinar al usuario a la
que perteneca. [2]
1. Comparacin de patrones
El entrenamiento de patrones
La comparacin de patrones
1
=
=1
1
(, ) = ( ) ( )
Hidden Markov Models (HMM) este modelo presenta una aproximacin de cada patrn de
referencia como un modelo estocstico, en otras palabras se denominamos una seal de voz
como el modelo HMM realiza un reconocimiento de dicha seal calculando la probabilidad
(|) de que la palabra o frase corresponda a la seal de voz A [18]. Mediante la regla
se Bayes se escribe como:
()(|)
(|) =
()
Este modelo nace del concepto de los perceptrones multicapa conocidos como redes
neuronales artificiales. Constan de una etapa de entrada, una de salida y una o varias capas
ocultas, cada capa est compuesta por clulas llamadas neuronas cada una de ellas
conectadas a cada una de las neuronas de la capa siguiente mediante enlaces llamados
sinapsis, que transmiten las seales de una capa hacia otra cuando esta supera un umbral
determinado. Los estmulos en este caso seales de voz se introducen en la capa de entrada
y la respuesta de la neurona a la seal de entrada se da por una funcin de activacin. La
ilustracin 5 muestra grficamente la composicin de estas redes neuronales [18].
Ilustracin 5. a) neurona. b) perceptrn multicapa
Anlisis LPC: este mtodo consiste en generar valores de una seal peridica (seal de voz ) a
partir de valores anteriores de un sistema lineal y mediante estos valores determinar la funcin de
transferencia del filtro (cavidad) donde se gener la seal, para su posterior codificacin. La
ilustracin 4 muestra el modelo fuente filtro del tracto vocal.
Ilustracin 6. Fuente y filtro del tracto vocal.
PRINCIPALES APLICACIONES
Identificacin automatizada.
Determinacin de la identidad.
Reconocimiento del estado emocional.
Identificacin automatizada
El reconocimiento de voz acta como un factor de autenticacin y puede ser empleado en cualquier
sistema de seguridad. Actualmente, estos sistemas combinan dos o ms sistemas biomtricos para
garantizar un alto nivel de seguridad.
Este tipo se sistemas son empleados en cuentas bancarias, pagos mviles, acceso a reas restringidas,
desbloqueos de dispositivos, etc.
El sistema Secure VoIP, propuesto en la conferencia Internacional Computer and Applications
(ICCA), ofrece la encriptacin de datos de voz para luego trasmitir el mensaje, simultneamente
realiza una autentificacin en tiempo real del receptor y despus de esta ser validad, se desencripta
dicho mensaje para ser escuchado por el receptor [8].
Determinacin de la identidad
Anlisis demogrfico
o Kivox 360
Tipo Comercial
o BATVOX
o ASIS
Tipo Comercial
o VoiceTrust Proof-of-Life
Tipo Comercial
Referencias
[1] L. Myers, An Exploration of Voice Biometrics, SANS Institute Reading Room, 2004.
[3] T. H. John Hansen, Speaker Recognition by Machines and Humans, IEEE SIGNAL
PROCESSING MAGAZINE, pp. 74-99, 2015.
[6] D. D. Paul anup, Bangla Speech Recognition System using LPC and ANN.
[7] A. A.-Q. K. Daqrouq, "Discrete Wavelet Transform & Linear Prediction Coding Based
Method for Speech Recognition via Neural Network", INTECH, 2011.
[11] K. Wang, N. An y B. N. Li, Speech Emotion Recognition Using Fourier Parameters, IEEE
Transactions on Affective Computing, vol. 6, n 1, pp. 69-75, 2015.
[13] Y. Sun, M. Zhang y Z. Sun, Demographic Analysis from Biometric Data: Achievements,
Challenges, and New Frontiers, IEEE Transactions on Pattern Analysis and Machine
Intelligence, n 99, 2017.
[14] Global Voice Recognition Biometrics Market 2015-2019, TECHNAVIO, 2015. [En lnea].
Available: https://www.technavio.com/report/global-voice-recognition-biometrics-
market-2015-2019. [ltimo acceso: 3 11 2017].
[15] A. S.L., KIVOX 360 Product Data Sheet, AGNITIO S.L., Madrid, 2015.
[16] A. S.L., BATVOX Product Data Sheet, AGNITIO S.L., Madrid, 2015.
[17] A. S.L., ASIS Product Data Sheet, AGNITIO S.L., Madrid, 2015.
[18] S. Nuance Communications, Easy and secure biometric authentication Data Sheet,
Nuance Communications, S.A., Massachusetts, 2016.