Sunteți pe pagina 1din 4

ESCUELA POLITCNICA NACIONAL

FACULTAD DE INGENIERA ELCTRICA Y ELECTRNICA


Tcnicas avanzadas de procesamiento digital de seales
Integrantes:

ANDRS ACOSTA
ALEX CASA
CARLOS QUINTE
Proyecto

Red neuronal para el reconocimiento de


monoslabos
GR1
2017A
Escuela Politcnica Nacional Ing. Electrnica y Telecomunicaciones

1. Cdigos utilizados
Ejemplo del cdigo utilizado para obtener las muestras de voz

[eo1, fs]=audioread('el_1.wav');
elo1=eo1(8000:14000);
[go1, fs]=audioread('gel_1.wav');
gelo1=go1(7500:13500);
[so1, fs]=audioread('sal_1.wav');
salo1=so1(12000:18000);
[vo1, fs]=audioread('ver_1.wav');
vero1=vo1(6500:12500);

Codigo de red neuronal

x = I; %matriz con muestras de entrada


t = T; %matriz con targets
trainFcn = 'trainscg'; % algoritmo para entrenamiento
% Create a Pattern Recognition Network
hiddenLayerSize = 400;
net = patternnet(hiddenLayerSize);
% Setup Division of Data for Training, Validation, Testing
net.divideParam.trainRatio = 70/100;
net.divideParam.valRatio = 20/100;
net.divideParam.testRatio = 10/100;
% Train the Network
[net,tr] = train(net,x,t);
% Test the Network
y = net(x);
performance_t = perform(net,t,y);
figure(2)
plotconfusion(t,y)

Cdigo para probar la red neuronal

% Esto permite probar la red luego de entrenarla


xx=ver; % entrada que se va a probar
output=net(xx); % se obtiene salida con la red entrenada
output=sum(output,2)/2
[M,In]=max(output);
if (In==1)
fprintf('El monoslabo ingresado es EL\n');
elseif (In==2)
fprintf('El monoslabo ingresado es GEL\n');
elseif (In==3)
fprintf('El monoslabo ingresado es SAL\n');
else
fprintf('El monoslabo ingresado es VER\n');
end
Escuela Politcnica Nacional Ing. Electrnica y Telecomunicaciones
Escuela Politcnica Nacional Ing. Electrnica y Telecomunicaciones

2. Conclusiones del proyecto:

Se observ que para tener un porcentaje de error total menor al 20% la matriz de
confusin se necesita que la red neuronal realice al menos 13 interacciones.
Al momento de grabar archivos de voz, se debe tener mucho cuidado con la
pronunciacin, debido a que el monoslabo ver nos dio algunos inconvenientes.
Mediante la creacin y entrenamiento de redes neuronales podemos lograr un
sistema de reconocimiento de voz eficaz, y utilizarlo para otras aplicaciones como
son seguridad para algn sistema.
Para hacer la red neuronal ms eficiente se debe aumentar el valor del tamao de
capa oculta, ya que tal vez no reconozca algunas palabras debido a este conflicto.
Mientras ms muestras ingresemos a la red neuronal la red podr entrenarse mejor,
es decir al momento de ingresar un monoslabo, la red lo reconocer ms
fcilmente, pero esto generar ms datos, y la red tardar ms tiempo en acabar el
entrenamiento, aun as se tom las 6000 muestras como lo dice en las indicaciones.
Algunas muestras no arrojaban el valor correcto ya que, por la naturaleza de la voz
sern diferente, por ello se debe tomar un valor mximo.
Para un mejor rendimiento de la red neuronal se debi hacer entrenar una otra vez
la red para que reconozca la mayora de monoslabos.

S-ar putea să vă placă și