Documente Academic
Documente Profesional
Documente Cultură
T E S I S
PRESENTA:
Ing. Jorge Adrian García Márquez
DIRECTORES DE TESIS:
Dr. Rolando Menchaca Méndez
Dr. Ricardo Menchaca Méndez
i
ii
i
Resumen
i
Abstract
Studying the functioning of the human brain has become a multidisciplinary task
integrated by areas of research, including mathematics and psychology, which
have given rise to neurosciences. The computational sciences have contributed
methods, tools of analysis and visualization of the information obtained from
techniques of study of the human brain; such is the case of
electroencephalography.
II
Agradecimientos
Primero quiero agradecer a dios por guiarme en el buen camino y darme salud y
sabiduría para saber elegir las mejores elecciones en mi vida.
Quiero agradecer a la hermosa familia que tengo, a mis padres Irma Márquez y
Javier García por darme el don de la vida, por brindarme una excelente formación
académica, por estar conmigo todo el tiempo estando al pendiente de mí y
llenándome de todo su amor, apoyo y energía para cumplir con este logro. A mi
hermano Aldo García, por acompañarme siempre en momentos importantes y ser
un compañero de vida. A mi tía Blanca por siempre mostrarme su ánimo, amor y
apoyo incondicional desde que era pequeño.
Tengo que agradecer a mis directores de Tesis Dr. Rolando Menchaca y Dr.
Ricardo Menchaca por su apoyo y orientación en el desarrollo de este proyecto a
lo largo de esta etapa de mi vida.
III
Índice General
RESUMEN…………...………………………………………...…………………………...I
ABSTRACT…………….………………………………………...………………………..II
AGRADECIMIENTOS..………………………………………...………………………..III
ÍNDICE GENERAL….………………………………………...…………………………IV
ÍNDICE DE FIGURAS………………………………………...………………………...VII
CAPITULO 1
INTRODUCCIÓN………………………………………………………………………….1
1.1Introducción……………………………………………………………………1
1.3 Objetivos………….……………………..…………………………………….3
1.4 Justificación……….…………………………………………………………..4
CAPÍTULO 2
ELECTROENCEFALOGRAFÍA…………………………………………………………6
2.2 Electroencefalografía…………………………………………………………9
2.3 Electroencefalograma………………………………………………………...9
2.4 Electroencefalógrafo………………………………………………………...10
2.4.1 Componentes…………………………….………........................10
2.5 Señales…………………………………………………………………........13
IV
2.6 Electrodos…………………………………………………………………….15
2.6.1 Definición……….……………………………………....................15
2.6.2 Clasificación…………………………….………..........................16
2.7 Electrodos…………………………………………………………………….17
CAPÍTULO 3
V
3.2.2.9 Algoritmos de Aprendizaje Profundo (Deep
Learning)………………………………………………….…........55
CAPÍTULO 4
METODOLOGÍA Y PROCEDIMIENTO……………………………………………….67
CAPÍTULO 5
ANÁLISIS Y RESULTADOS…………………………………………………………...76
CAPÍTULO 6
RECOMENDACIONES………………………………………………………………….85
APORTACIONES………………………………………………………………………..86
REFERENCIAS CONSULTADAS……...……………………………………………..87
VI
Índice de Fíguras
Figura 1.1 Ingresos de la industria de entretenimiento en los últimos años
Figura 2.1 Experimentos de Luis Galvani en animales
Figura 2,2. Electroencefalógrafo tradicional
Figura 2.3. Representación gráfica de comportamiento de señales EEG
Figura 2.4. Rango de frecuencia de señales cerebrales
Figura 2.5. Electrodos conectados al cerebro
Figura 2.6. Portación del sistema Móvil-72
Figura 2.7. Elementos del sistema diadema multiposicional
Figura 2.8. Sistema Portable Nautilus
Figura 2.9. Sensor Portable Enobio
Figura 2.10. Diadema Mindwave
Figura 2.11. Diadema B-Alert X10
Figura 2.12. Dispositivo Emotiv EPOC
Figura 2.13. Dispositivo Emotiv Insight
Figura 2.14. Aplicaciones recientes de BCI
Figura 2.15. Discapacidad motriz - silla de ruedas utilizando una interfaz BCI
Figura 2.16. Entorno de una casa inteligente utilizando BCI
Figura 2.17. Usuarios jugando BrainBall
Figura 3.1. Ejemplo visual de aplicación de aprendizaje supervisado utilizando
clasificación
Figura 3.2. Ejemplo visual de aplicación de aprendizaje no supervisado sin
conocimiento a priori
Figura 3.3. Ejemplo visual de aplicación de aprendizaje semi-supervisado con
pequeños datos etiquetados
Figura 3.4. Ejemplo de algoritmo de regresión utilizando una medida de error
Figura 3.5. Gráfica que muestra regresión con tendencia creciente
Figura 3.6. Ejemplo de algoritmo utilizando una medida de similitud para
predicción
VII
Figura 3.7. Ejemplo visual donde se ve la aplicación del método KNN por
distancias
Figura 3.8. Ejemplo visual donde se ve la extensión que se hace de un
algoritmo
Figura 3.9. Muestra de estimación para LASSO (izq) y Regresión de Cresta (der);
región azul=regiones de restricción
Figura 3.10. Ejemplo de un árbol de decisión
Figura 3.11 Ejemplo de visualización del procedimiento arriba hacia abajo del
algoritmo ID3
Figura 3.12 Ejemplo de visualización del procedimiento algoritmo C 4.5
Figura 3.13 Ejemplo de aplicación probabilidad bayesiana, distribución posterior y
priori
Figura 3.14 Fórmula del teorema de Bayes
Figura 3.15 Función de distribución gaussiana
Figura 3.16 Ejemplo de una red bayesiana. Los nodos representan variables
aleatorias y los arcos relaciones de dependencia
Figura 3.17 Ejemplo de agrupamiento modelando 2 grupos de objetos
Figura 3.18 Ejemplo de agrupamientos (rojo, azul, verde), donde se ubica el
centroide al centro
Figura 3.19 Dendrograma con agrupamiento ascendente
Figura 3.20 Ejemplo donde se aprecian reglas de asociación de objetos
Figura 3.21 Ejemplo de estructura de una red neuronal
Figura 3.22 Ejemplo de estructura perceptrón con 5 neuronas de entrada
Figura 3.23 Neurona básica en backpropagation
Figura 3.24 Ejemplo de algoritmo Deep Learning visto desde una red neuronal
compleja
Figura 3.25 Arquitectura de la máquina de Boltzmann
Figura 3.26. Esquema general de una red de creencia profunda
Figura 3.27 Ejemplo de visualización de datos dimensionales
Figura 3.28 Variación de la diferencia entre PCA original y PCA iterativo en bloque
según el número de componentes principales utilizadas.
VIII
Figura 3.29 Un ejemplo de muestra de Sammon mapeando en distintas
coordenadas
Figura 3.30 Ejemplo de mapa perceptual
Figura 3.31. Ejemplo de combinación de modelos para una única predicción
Figura 3.32 Ejemplo de muestreo del algoritmo bagging
Figura 3.33 Diagrama de flujo de funcionamiento de Adaboost
Figura 4.1. Etapas de desarrollo de la interfaz BCI
Figura 4.2. Aplicación Akapong
Figura 4.3. Diseño de la Interfaz
Figura 4.4 Esquema básico del sistema para el control cerebral de un videojuego
utilizando el Emo-Engine
Figura 4.5. Entorno TestBench de Emotiv Suite
Figura 4.6 Esquema general del diseño lógico del sistema de software para el
control cerebral.
Figura 4.7. Archivos .java del SDK de Emotiv en el Proyecto
Figura 4.8. Código de configuración principal de diadema Emotiv
Figura 4.9. Hidratación de sensores
Figura 4.10. Pantalla de verificación del estado de los sensores Emotiv
Figura 5.1. Funcionamiento Interfaz BCI y Generación de archivos
Figura 5.2. Ejemplo de archivo .csv con datos crudos de la señal cerebral
Figura 5,3. Ejemplo de muestreo de la señal cerebral generada
Figura 5.4 Muestra de resultados al discretizar la señal (datos tratados)
Figura 5.5. Matriz de distancias entre los conjunto de datos de los usuarios
Figura 5.6. Resultado del muestro de matriz distancias en weka
Figura 5.7. Cuadro de desempeño de usuarios y observaciones
IX
Glosario, Siglas y Acrónimos
X
Heurística: Conjunto de técnicas o métodos para resolver un problema.
XI
CAPÍTULO 1
Introducción
La tecnología de interfaces cerebro-computadora (BCI’s) es una poderosa
herramienta de comunicaciones entre usuarios y sistemas que basa su
funcionamiento en la electroencefalografía, que permite acceder y extraer la
actividad cerebral, permitiendo a una computadora analizar la información de los
patrones de ondas cerebrales que son producidas por el pensamiento. La
comunidad científica inicialmente ha desarrollado BCI’s con aplicaciones
biomédicas permitiendo la generación de dispositivos de ayuda que han facilitado
la restauración de la capacidad de movimiento para los usuarios físicamente con
discapacidad y reemplazando la funcionalidad perdida de sus movimientos.
1
El propósito de este trabajo es utilizar las señales EEG para interactuar con un
videojuego, y el resultado es una herramienta que pueda ser usada como un
control de videojuegos para realizar un análisis en tiempo real de las señales
generadas por el dispositivo EEG.
2
1. Diseñar una serie de experimentos donde se obtiene la respuesta eléctrica
cerebral de un conjunto de sujetos de prueba, al momento de estar jugando
en el sistema propuesto. Las señales obtenidas son anotadas con los
comandos que los usuarios estén ejecutando para que sirvan de conjuntos
de entrenamiento a algoritmos de aprendizaje supervisado.
Objetivo General:
Objetivos Específicos:
3
Caracterizar el desempeño de un conjunto de algoritmos de
aprendizaje de máquina supervisados para recuperar los comandos
ejecutados a partir de la actividad cerebral.
Justificación:
4
12
10
8 Cine
6 Música
4 Videojuegos
2
0
2011 2012 2013 2014 2015 2016
En la actualidad los avances con respecto a sistemas BCI han ido creciendo
permitiendo así tener un campo grande para el desarrollo de muchos proyectos de
investigación, siendo una base firme para el desarrollo de nuevas tecnologías. Las
aplicaciones de los dispositivos BCI normalmente se han visto en el ámbito médico
donde permiten darles una ayuda de forma integral y funcional a personas que
presentan ciertas enfermedades o discapacidades, por ejemplo se han
desarrollado aplicaciones para ayudar a las personas con escasa movilidad
motora, interfaces de escritura, que pueden hacer de intérpretes entre el usuario y
un dispositivo robótico, aplicaciones para interpretar intenciones del usuario y que
éstas se traduzcan en movimiento, por ejemplo al usar una silla de ruedas para
combatir la necesidad de desplazamiento en caso de padecer una discapacidad
motora, así como aplicaciones en el campo de los videojuegos donde se ha
empezado analizar el estado emocional, ansiedad y cansancio de los jugadores.
5
CAPÍTULO 2
Electroencefalografía
En este capítulo se describe la técnica de electroencefalografía, la evolución que
ha tenido a lo largo del tiempo, el impacto que ha tenido con sus distintas
aplicaciones en la vida social, así como los distintos aparatos para captar señales
cerebrales.
6
Algunos dispositivos que son considerados como las bases para el
electroencefalógrafo actual fueron, el electroscopio de Benjamín Franklin (1700),
el Estimulador de Batería de Claudio Bernard (1850), la Bobina de inducción de
Boy Reymond (1850), y el Galvanómetro de Arsnoval (1822). Otra aportación
importante es la lámpara eléctrica de Thomas A. Edison, pues al colocarle un
elemento denominado “plate” en el interior del tubo de vacío con el objetivo de
facilitar el flujo de la corriente, permitió fabricar un precursor de los actuales
diodos. [2] [16]
2.1.2 Siglo XX
7
Bickford o Cairns, con heridos durante la Segunda Guerra Mundial se aportaron
posibilidades de tratamiento neuroquirúrgico [6].
8
2.2 Electroencefalografía
2.3 Electroencefalograma:
De raíces griegas, “electrón”, (que hace referencia al ámbar amarillo que sirvió
para los primeros experimentos de electricidad), la palabra encéfalo, formada por
“en” que significa dentro de, y “kephalé” que significa cabeza. Por último, “graphé”
que significa grabado o estructura. Concertando la definición con la unión de todas
las raíces griegas, electroencefalograma se define como el registro de la actividad
eléctrica del encéfalo [1].
9
2.4 Electroencefalógrafo
2.4.1 Componentes
Cables: Son los encargados de efectuar la unión entre los electrodos y la caja de
conexiones. Están conformados por un conjunto de hilos metálicos (que son
buenos conductores) flexibles donde en un extremo poseen un caimán y al otro se
le une un vástago que recibe el nombre de “banana”, estos últimos se insertan en
pequeños receptáculos. Cada uno de estos es sumamente frágil, por lo que su
manejo debe ser manipulado con delicadeza.
10
Cable blindado: Es el cable de unión entre el panel de electrodos y el equipo de
electroencefalografía. Éste tiene una longitud de hasta 5 metros y está cubierto
por una malla que le proporciona el blindaje necesario para evitar en su mayor
parte las señales emitidas por el medio ambiente.
Control de ganancia: El EEG posee controles de las ondas que recibe. El voltaje
se expresa gráficamente como la amplitud o altura de las ondas. La altura que
marca la deflexión de la plumilla se puede modificar con el “control de ganancia”.
Filtros: El medio ambiente está lleno de señales eléctricas que pueden ser
captadas fácilmente, estas señales pueden crear interferencia con las que se
11
desean registrar en un estudio de electroencefalografía. Los filtros están
diseñados para impedir el registro de la interferencia con el medio ambiente. Son
clasificados en: filtro de baja frecuencia, filtro de alta frecuencia, filtro de corriente
alterna
Plumilla: Consiste en un delgado tubo capilar metálico fijo al eje del galvanómetro.
12
2.5 Señales
a) Ondas Delta:
b) Ondas Theta:
13
(Movimientos Oculares Rápidos o en siglas del inglés REM). También se ha
mostrado que está relacionada a funciones mentales que involucran el acceso a
material subconsciente, meditación profunda e inspiración creativa.
c) Ondas Alfa:
d) Ondas Beta:
e) Ondas Gama:
14
f) Ondas Mu:
2.6 Electrodos
Son aquellos dispositivos que se conectan al cerebro (ver Figura 2.5), y que se
encuentran entre los generadores eléctricos del cerebro (neuronas) y el aparato
que registra su actividad (electroencefalógrafo). Son piezas de metal que son
colocados sobre la superficie corporal. Los electrodos actúan como transductores,
pues convierten una forma de energía en otra, que posteriormente se amplifica en
los circuitos del electroencefalógrafo.
15
2.6.1 Clasificación
Por otro lado, y según el sitio donde se colocan los electrodos se clasifican de la
siguiente manera:
Extracraneales
a) Adheridos:
b) De contacto:
Intracraneales
a) De aguja o sub-dérmicos:
16
b) Epi o subdurales:
Vástagos de acero inoxidable o material flexible con una borla que se pone en
contacto con las meninges, se utilizan generalmente para la detección de focos
epileptógenos.
c) Para Electrocorticografía:
d) Intracerebrales:
Tanto los sistemas de adquisición de señales EEG como las diademas portátiles,
han experimentado diversos cambios en los últimos años. Aquí una descripción de
los más recientes dispositivos BCI portátiles [4] [5].
17
de prueba; el gorro utiliza electrodos de (Ag y AgCl) para mediciones de señales
EEG de alta calidad [40], ver Figura 2.6 para más detalle.
18
La diadema es totalmente reconfigurable para distintos experimentos y
aplicaciones, los sensores se pueden fijar y mover a cualquiera de las 12
posiciones a lo largo de la circunferencia de la diadema para medir las señales de
las regiones frontal, occipital y temporal. Por otro lado cuenta con un tejido
altamente elástico que garantiza comodidad, se adapta a cualquier tamaño de
cabeza y proporciona presión de contacto para los electrodos secos.
El sistema cuenta con una batería de iones de litio incorporada, que permite
grabaciones continuas de hasta 10 horas. La batería se recarga a través de un
cojín de carga sin contacto dentro de 2 a 3 horas. El dispositivo es completamente
impermeable, lo que permite una fácil limpieza de los electrodos junto con la tapa,
sin necesidad de desconectar o desmontar algún elemento, ver Figura 2.8. El
Nautilus transmite datos a través de la banda de 2.4 GHz con un rango de
funcionamiento en interiores de unos 10 m.
19
2.7.1.4 Enobio 8:
20
Figura 2.10. Diadema Mindwave
Este sistema es una solución para aplicaciones móviles de EEG, que ofrece un
equilibrio de funcionalidad y simplicidad. El auricular ligero se coloca fácilmente y
sigue siendo cómodo para grabaciones de alta calidad extendidas en cualquier
hogar, laboratorio o entorno operativo, posee una combinación de 9 canales de
EEG de línea media y lateral [46].
21
Figura 2.11. Diadema B-Alert X10
22
Se pueden llevar a cabo investigaciones que aprovechan la detección de
expresiones faciales, métricas de rendimiento y emoción y mandatos mentales.
Presenta conectividad inalámbrica Bluetooth mediante un receptor USB trabajando
en la banda de 2.4 GHz, un ancho de banda de 0.2-43 Hz, una resolución de
muestreo de 16 bytes de los cuales 14 son efectivos y 2 son utilizados para la
identificación y descarte por ruido [7]. También tiene una tasa de muestreo
secuencial de los sensores de 128 Hz, es decir produce 128 muestras por
segundo. Debido a su fácil configuración y portabilidad, será el dispositivo que se
manejará durante este proyecto.
23
espacial proporciona información en profundidad sobre su actividad cerebral.
Insight presenta un diseño elegante, ligero y fácil de usar.
Medicina Educación
Neuroergonomía CAMPOS DE
Juegos y
y entornos APLICACIÓN
Entretenimiento
inteligentes DE BCI
Neuromarketing Seguridad y
y Publicidad Autentificación
2.7.2.1 Medicina:
24
Figura 2.15. Discapacidad motriz - silla de ruedas utilizando una interfaz BCI
Los entornos de este tipo como casas inteligentes (como la que se ve en la Figura
2.16), lugares de trabajo o transportes explotan el uso de este tipo de interfaces
para ofrecer seguridad, lujos y control fisiológico para la vida diaria del ser
humano. Este tipo de entornos por ejemplo han estado vinculados con el Internet
de las Cosas (IOT) y las tecnologías BCI [13]. Se ha llegado a proponer un
sistema de control cognitivo llamado “Sistema de Control Ambiental con Auto-
Ajuste” para vida inteligente el cual monitorea el estado mental del usuario y se
adapta a sus componentes de entorno en consecuencia.
25
Las señales cerebrales también han llegado a ayudar a mejorar las
condiciones del área de trabajo por la evaluación del estado cognitivo de un
operador. Éstas también analizan el impacto de fatiga mental por carga de trabajo
y el tiempo de tarea en las características de EEG. Un cuarto de operaciones por
supuesto también representa un lugar ideal para un lugar de trabajo inteligente
usando una aplicación basada en BCI, ya que ésta mide el nivel de estrés de una
cirugía y notifica de acuerdo al tipo de respuesta [38].
26
autorregulación y aprendizaje de habilidades, a través de la reacción neuronal
emitida por la resonancia magnética.
Por otro lado algunos juegos serios que utilizan EEG han sido empleados
para control emocional y rehabilitación neuroprostética. Por ejemplo el juego
BrainBall tiende a disminuir el nivel de estrés. Los usuarios pueden sólo mover la
pelota si se relajan, por el que el vencedor del juego es el jugador que logre estar
más relajado es decir, el que tenga más control de estrés, como se observa en la
Figura 2.17.
27
2.7.2.6 Seguridad y Autentificación:
28
2.7.3 Problemática de las interfaces BCI:
Por otro lado se tiene que prestar atención en todas las etapas que
componen la interfaz BCI para que la fiabilidad de la lectura obtenida sea
aceptable. En el caso de señales de tipo endógenas, éstas son producidas en el
interior del cerebro a partir de una intención o movimiento y sin ningún estímulo
externo que sirva de guía. Esto explica el hecho de que el entrenamiento de las
interfaces endógenas sea tan costoso en tiempo dado que no existe una
referencia exterior al sistema no estacionario y éste puede estar sujeto a múltiples
factores variables [38][39]. Por otro lado, para interfaces de tipo exógenas se debe
poner extremo cuidado en la generación de los estímulos, dado que la actividad
cerebral a analizar dependerá directamente de ellos. El tratamiento en la
generación de los estímulos es vital para que se generen patrones de señales en
el cerebro que ayuden a deducir las intenciones del usuario, considerando que
siempre habrá una cierta no estacionariedad [8].
29
CAPÍTULO 3
Teoría de algoritmos de aprendizaje de máquina
En este capítulo se describe el concepto de Aprendizaje de Máquina y sus
distintas técnicas para la manipulación y clasificación de datos a partir de sus
distintas clasificaciones existentes.
Por otro lado su objetivo es desarrollar técnicas que permitan a las computadoras
aprender. De forma más concreta, de crear programas capaces de generalizar
comportamientos a partir de una información no estructurada suministrada en
forma de ejemplos. Es, por lo tanto, un proceso de inducción del conocimiento.
30
3.2.1.1 Aprendizaje Supervisado:
Es una técnica para deducir una función a partir de datos de entrenamiento, los
cuales consisten de pares de objetos (normalmente vectores): una componente
del par son los datos de entrada y el otro, los resultados deseados [38] [41]. La
salida de la función puede ser un valor numérico o una etiqueta de clase. El
algoritmo produce una función que establece una correspondencia entre las
entradas y las salidas deseadas del sistema. Los tipos de problemas que resuelve
son los de clasificación (como el de la Figura 3.1, donde se trata de clasificar las
pelotas blancas en un grupo de los de la izquierda) y regresión.
31
Figura 3.2. Ejemplo visual de aplicación de aprendizaje no supervisado sin conocimiento a priori
Es una técnica de ML, que utiliza datos de entrenamiento tanto etiquetados como
no etiquetados: normalmente una pequeña cantidad de datos etiquetados junto a
una gran cantidad de datos no etiquetados, como se observa en la Figura 3.3. Hay
un problema de predicción deseado, pero el modelo debe aprender las estructuras
para organizar los datos, así como hacer predicciones [38].
Figura 3.3. Ejemplo visual de aplicación de aprendizaje semi-supervisado con pequeños datos
etiquetados
32
flexibles que hacen suposiciones acerca de cómo modelar los datos no
etiquetados.
La regresión tiene que ver con el modelado de la relación entre las variables
existentes utilizando una medida de error en las predicciones realizadas por el
modelo, como se observa en la Figura 3.4. Los métodos de regresión son muy
utilizados en estadística y se han enfocado en el aprendizaje de máquina
estadístico. Esto puede ser confuso, ya que podemos utilizar la regresión para
hacer referencia a la clase de problema y a la clase de algoritmo.
33
Los algoritmos de regresión más importantes son:
Este algoritmo consiste en encontrar una método para hallar una recta que se
ajuste de una manera adecuada a la nube de puntos definida por todos los pares
de valores muestrales (Xi,Yi).
Regresión lineal:
34
Figura 3.5. Gráfica que muestra regresión con tendencia creciente
Regresión logística
Este método resulta útil para los casos en los que se desea predecir la presencia o
ausencia de una característica o resultado según los valores de un conjunto de
predictores. Es similar a un modelo de regresión lineal pero está adaptado para
modelos en los que la variable dependiente es dicotómica (sólo puede tomar 2
valores). La regresión logística se puede aplicar a un rango más amplio de
situaciones de investigación que el análisis discriminante [48].
35
“quedan” dentro del modelo final son parcialmente responsables (quizá las
principales y hasta las únicas responsables) de las modificaciones que
experimenta la variable dependiente; las que no permanecen, no influyen
causalmente en el proceso, o su influencia no es apreciable.
Figura 3.6. Ejemplo de algoritmo utilizando una medida de similitud para predicción
36
supervisada, el cual realiza un aprendizaje supervisado basado en un conjunto de
entrenamiento y prototipos [50].
Figura 3.7. Ejemplo visual donde se ve la aplicación del método KNN por distancias
Es uno de los algoritmos más simples que existen que muestran la esencia
del aprendizaje basado en instancias. Asume que todas las instancias
corresponden a puntos que se encuentran en un espacio de dimensión n a partir
del cual se calcula la distancia más cercana (ver Figura 3.7 para más detalle). El
vecino más cercano de una instancia es definido en términos de la distancia
Euclidiana estándar.
37
transmisión (Se pierde alguna información contenida) y después son re-
trasladados a valores cercanos de los datos originales (no serán exactos) [51].
38
Los algoritmos más importantes son:
Regresión Ridge
Figura 3.9. Muestra de estimación para LASSO (izq) y Regresión de Cresta (der);
39
LASSO fue originalmente formulado para modelos de mínimos cuadrados y
este caso simple revela una cantidad sustancial sobre el comportamiento del
estimador, incluyendo su relación con la regresión de cresta (regression ridge) y la
mejor selección de subconjuntos y las conexiones entre las estimaciones de
coeficiente LASSO y el llamado umbral suave (ver Figura 3.9 para identificar esta
estimación). También revela que (como la regresión lineal estándar) las
estimaciones de coeficientes no necesitan ser únicas si las covariables son
colineales.
Red Elástica
Zou y Hastie en su artículo “Regularization and variable selection via the elastic
net” en 2005, proponen una nueva técnica de regularización y selección de
variables conocido como “Elastic Net” o red elástica, la cual retiene las ventajas de
Lasso, hace automáticamente selección de variables y contracción continua, y al
mismo tiempo supera algunas de sus limitaciones [16]. Con este nuevo método se
puede seleccionar grupos de variables correlacionadas. Este método es
particularmente útil cuando el número de predictores (P) es mucho más grande
que el número de observaciones (n).
40
Figura 3.10. Ejemplo de un árbol de decisión
41
Induction Decision Trees (ID3)
Fue desarrollado por J. Ross Quinlan en 1983 en su trabajo “Induction of Decisión
Trees”. Emplea un procedimiento de arrriba a abajo haciendo un recorrido voraz
por el espacio de las posibles ramificaciones sin backtracking (ver Figura 3.11
para más detalle de este procediiento). Para ello, ID3 hace uso de conceptos
como entropía y ganancia de información [19].
Figura 3.11 Ejemplo de visualización del procedimiento arriba hacia abajo del algoritmo ID3
Este algoritmo realiza un proceso recursivo sobre todas las ramas del
árbol generado. Inicialmente, se le llama con el conjunto de ejemplos, el de
atributos, y el nodo raíz del árbol de decisión que estará vacío. Su objetivo es
construir un árbol de decisión que explique cada instancia de la secuencia de
entrada de la manera más compacta posible a partir de una tabla de inducción.
Durante el proceso se elige el mejor atributo dependiendo de una determinada
heurística, se determinan las variables que portan información relevante para la
solución del problema y se establecen la secuencia dentro del árbol de decisión.
42
C4.5
Es un algoritmo usado para generar un árbol de decisión. Fue desarrollado y
publicado por Ross Quinlan en 1992 en su artículo “C4.5 Programs for Machine
Learning” y es una extensión del algoritmo ID3 desarrollado también por Quinlan
previamente [19]. Los árboles de decisión generados con C4.5 se pueden usar
para clasificación, por ello es conocido como un clasificador estadístico (ver Figura
3.12 para visualizar ejemplo).
Este algoritmo fue desarrollado por G.V Kass en su trabajo “An Exploratory
Technique for Investigating Large Quantities of Categorical Data” a principios de
los años 80 [42]. Asume que las variables explicativas son categóricas u ordinales.
43
Cuando no lo son, se discretizan. Inicialmente se diseñó para el caso de variable
respuesta Y categórica y posteriormente se extendió a variables continuas. Utiliza
contrastes de la χ2 de Pearson y la F de Snedecor.
Naive Bayes
44
términos de la distribución de probabilidad condicional del evento B dado A y la
distribución de probabilidad marginal de sólo A [21].
45
caracterizar matemáticamente una distribución gaussiana de N dimensiones [54].
De esta forma se tiene la Figura 3.15:
1
1 (− (𝒙−𝝁)𝑇 𝚺 −1 (𝒙−𝝁))
2
𝑁 1𝑒
(2𝜋) 2 ⋅ |𝚺|2
Figura 3.15 Función de distribución gaussiana
Donde:
Red bayesiana
46
Es un grafo acíclico dirigido (DAG) en la cual cada nodo representa una
variable y cada arco una dependencia probabilística, en la cual se especifica la
probabilidad condicional de cada variable dados sus padres. La variable a la que
apunta el arco es dependiente (causa-efecto) de la que está en el origen de éste.
Figura 3.16 Ejemplo de una red bayesiana. Los nodos representan variables
47
a los datos para organizarlos en grupos con características comunes, como se
observa en la Figura 3.17
K-medias
Figura 3.18 Ejemplo de agrupamientos (rojo, azul, verde), donde se ubica el centroide al centro
48
El algoritmo se compone de los siguientes pasos:
Agrupamiento jerárquico
49
Figura 3.19 Dendrograma con agrupamiento ascendente
50
3.2.2.7 Algoritmos con Aprendizaje de Regla de Asociación:
Son métodos que extraen reglas que explican mejor las relaciones observadas
entre las variables de datos [41]. Estas reglas pueden descubrir asociaciones
importantes y comercialmente útiles en grandes conjuntos de datos
multidimensionales que pueden ser explotadas por una organización, ver Figura
3.20 para identificar las reglas de asociación dadas en el ejemplo.
Algoritmo a priori
Fue propuesto por Agrawal y Srikant en 1994 dentro de su trabajo “Fast algorithms
for mining association rules”. Este algoritmo se utiliza en bases de datos
transaccionales, que permite encontrar de forma eficiente "conjuntos de objetos
frecuentes", los cuales sirven de base para generar reglas de asociación. Procede
identificando los ítems individuales frecuentes en la base y extendiéndolos a
conjuntos de mayor tamaño siempre y cuando esos conjuntos de datos aparezcan
suficientemente seguidos en dicha base de datos [25].
51
Algoritmo Eclat
52
Figura 3.21 Ejemplo de estructura de una red neuronal
Perceptron
Este algoritmo surge a partir del diseño de una neurona artificial en forma de
discriminador lineal por parte de Rosenblatt en 1957 descrita en su trabajo “The
perceptron: A Probabilistic model for Visual Perception” [39], el perceptrón; que
cuenta con señales de entrada, una asignación de pesos, una función de
activación, una unión sumadora y una salida además de características como el
reconocimiento y clasificación de patrones sencillos linealmente separables (ver
Figura 3.22 para identificar estos elementos).
53
Con esta teoría, se desarrolla un algoritmo capaz de generar un criterio
para seleccionar un sub-grupo a partir de un grupo de componentes más grande.
La limitación de este algoritmo es que si dibujamos estos elementos, se deben
poder separar con un hiperplano únicamente los elementos "deseados"
discriminándolos (separándolos) de los "no deseados". El perceptrón puede
utilizarse con otros perceptrones u otro tipo de neurona artificial, para formar redes
neuronales más complicadas.
Back-Propagation
54
Figura 3.23 Neurona básica en backpropagation
Figura 3.24 Ejemplo de algoritmo Deep Learning visto desde una red neuronal compleja
55
Los algoritmos más importantes son:
Máquina Boltzmann
56
Redes profundas de creencia (DBN)
Red convolucional
57
introducir un método de aprendizaje basado en Backpropagation para poder
entrenar el sistema correctamente.
Esto puede ser útil para visualizar datos dimensionales o para simplificar los datos
que pueden ser usados en un método de aprendizaje supervisado, ver Figura 3.27
para más detalle. Muchos de estos métodos se pueden adaptar para usarse en
clasificación y regresión.
58
Los algoritmos más importantes son:
Figura 3.28 Variación de la diferencia entre PCA original y PCA iterativo en bloque según el
número de componentes principales utilizadas.
PCA preserva tanta varianza como sea posible. Para que sea efectiva es
necesario que los datos tengan una dirección con una mayor varianza que otras,
sino la técnica deja de ser efectiva. También podemos entender a este algoritmo
como una transformación lineal de los datos en un nuevo sistema de coordenadas.
Así los datos se proyectan sobre nuevos ejes, siendo el primer eje el de mayor
varianza (ver Figura 3.28).
59
Regresión de los mínimos cuadrados parciales (PLSR)
Mapeo de Sammon
60
Figura 3.29 Un ejemplo de muestra de Sammon mapeando en distintas coordenadas
61
dimensiones, pero pueden representarse en más de dos (Ver Figura 3.30 como
ejemplo de este caso).
Ventajas:
Inconvenientes:
62
Análisis Discriminante Lineal (LDA)
Son modelos compuestos por múltiples modelos más débiles que se entrenan de
manera independiente y cuyas predicciones se combinan para hacer una
predicción general, como se aprecia en la Figura 3.31.
63
Los algoritmos más comunes dentro de éste grupo son:
Boosting
64
Figura 3.32 Ejemplo de muestreo del algoritmo bagging
AdaBoost
65
Figura 3.33 Diagrama de flujo de funcionamiento de Adaboost
Por otro lado se puede decir que se utiliza en conjunto con otros tipos de
algoritmos de aprendizaje para mejorar su rendimiento. La salida de los otros
algoritmos de aprendizaje ("aprendizajes débiles") se combina para representar la
salida final de este clasificador como se aprecia en la Figura 3.33. Es una técnica
adaptativa en el sentido de que los aprendizajes débiles son ajustados en favor de
aquellas instancias mal clasificadas por los clasificadores anteriores; sin embargo
es sensible a datos ruidosos y valores atípicos.
66
CAPÍTULO 4
Metodología y procedimiento
En este capítulo se describen el diseño y desarrollo de la interfaz BCI propuesta
que permite la conexión a un videojuego sencillo a través de la cual se obtienen
señales cerebrales para procesarlas e interpretarlas para realizar un movimiento
en específico.
67
Figura 4.2. Aplicación Akapong
El fin de desarrollar este tipo de aplicación era poder obtener a través del
dispositivo Emotiv, los comandos direccionales de izquierda y derecha del
movimiento de la raqueta, en su búsqueda de impactar la pelota en el escenario.
68
El diseño de la interfaz se pensó con la idea de que fuera amigable y fácil de usar
con el fin de recolectar información del usuario como lo es su nombre, sexo, edad
y el tipo de prueba que se le va a realizar (prueba de comandos derecha, prueba
de comandos izquierda y prueba híbrida) para más detalle ver Figura 4.3.
Emotiv API
Visualización
Control de Interfaz
EmoEngine
Aplicación de comandos
Obtención de
Análisis de la Señal
Características
EmoState
Figura 4.4 Esquema básico del sistema para el control cerebral de un videojuego utilizando el
Emo-Engine
69
4.3.1 Procesado de la señal y configuración de módulos del sistema en interfaz:
Por otro lado para el diseño lógico del sistema de software se utilizó otra de
las facilidades de usar Emotiv que es el kit de desarrollo (SDK) que se
esquematiza en la Figura 58, que forma parte del esquema de la Figura 56 en la
que se indica la interacción que existe entre los diferentes módulos internos y
70
externos que lo conforman, permitiendo así la identificación de patrones
cerebrales generados a partir de tareas mentales.
Figura 4.6 Esquema general del diseño lógico del sistema de software para el control cerebral.
71
su vez un estado facial, emocional o cognitivo del usuario. Estos datos se
recuperan mediante funciones definidas en la API Emotiv con el prefijo "ES_".
72
Figura 4.7. Archivos .java del SDK de Emotiv en el Proyecto
73
4.3.2 Preparación de entorno y adquisición de la Señal:
74
todos los sensores de color verde para no tener problema alguno al momento de
probar la aplicación.
75
CAPÍTULO 5
Pruebas y resultados
En este capítulo se describe la última parte en el desarrollo de la interfaz que
consiste en realizar pruebas iniciales y pruebas definitivas a distintos usuarios con
el fin primeramente de obtener señales a partir de las cuales se infiere el comando
que el usuario desea ejecutar.
Una vez teniendo la diadema bien conectada en la cabeza asegurándose que los
sensores hagan el contacto adecuado, que el dispositivo usb esté conectado ls
computadora y emitiendo una luz verde (prueba de que la diadema y el software
ya están sincronizados) y que los programas están configurados correctamente,
tanto de la aplicación como la interfaz, se procede a ejecutar el proyecto.
76
Al ejecutarlo se despliega la ventana de la interfaz de usuario donde se
registra el nombre, la edad y el sexo del usuario y lo más importante el tipo de
prueba a realizar.
Aplicación
(videojuego)
77
Figura 5.2. Ejemplo de archivo .csv con datos crudos de la señal cerebral
Por otro lado el panel TestBench nos ayudará a generar un archivo .edf
para poder visualizar gráficamente el comportamiento de la señal durante el lapso
de tiempo que duró la prueba como se ve en la Figura 5.3.
78
5.2.2 Clasificación de las señales eléctricas cerebrales:
Posteriormente una vez que hemos realizado las pruebas a los usuarios y hemos
obtenido los archivos .csv (generación de base de datos) y .edf (para visualización
de señal cerebral) ahora pasamos a la parte de clasificación de las señales para
saber si el comando detectado fue derecha o izquierda.
79
Figura 5.4 Muestra de resultados al discretizar la señal (datos tratados)
Ahora el siguiente paso ya con los valores discretos en todas las pruebas
fue utilizar el método de “edit distance” para cuantificar qué tan parecidos eran los
conjuntos de vectores de un usuario con otro para así poder obtener por medio de
la normalización de estos valores cuantificados un valor único que representaría la
distancia de un conjunto de datos de un usuario con otro. Este proceso se repitió
con todos los datos de todas las pruebas de los 10 usuarios hasta obtener una
matriz de distancias como se observa en la Figura 5.5.
Figura 5.5. Matriz de distancias entre los conjunto de datos de los usuarios
80
Finalmente con estos resultados se procedió a tratar de clasificar estas
señales en izquierda o derecha según su caso utilizando la técnica de aprendizaje
de máquina de agrupamiento (clúster) jerárquico por medio de los software de
Weka al cual se le metieron los valores obtenidos de la matriz de distancias.
Una vez utilizado el software de weka para intentar determinar el origen de los
datos es decir, si vienen de una prueba usando el comando izquierda o el
comando derecha a partir de la matriz de distancias, se observó que se generaron
2 grupos distintos o clústeres donde el grupo de color azul corresponde a toda
aquella información proveniente del comando derecha y de color rojo la del
comando izquierda, para más detalle ver Figura 5.6.
Comando Derecha
Comando Izquierda
Con esto se puede decir que sí es posible a partir del nivel de intensidad de los
sensores generados en las pruebas, aunque no de una manera sencilla debido a
la complejidad de la información, determinar si el usuario estaba pensando a la
izquierda o a la derecha.
81
Ahora bien, posteriormente se realizaron 2 tipos de pruebas a los usuarios
para conocer más sobre su actividad cerebral, primero se sometió a los individuos
a tratar de mover la raqueta en el menor tiempo posible ya sea que la movieran o
a la izquierda o a la derecha, y posteriormente ya con esa experiencia de poder
moverla, la segunda etapa de experimentos consistió en tratar ahora no sólo de
poder mover la raqueta sino que también trataran de golpear la pelota y repelerla.
82
utilizar de una manera más eficiente la diadema Emotiv se requiere la mayor
concentración posible y una imaginación amplia o considerablemente
desarrollada, requisito que cumplen a la perfección los niños.
Por otro lado se puede decir que en estos experimentos que se realizaron,
las mujeres presentaron un mejor desempeño al momento de utilizar la aplicación.
Otra observación interesante que se hizo fueron las secuelas que se presentaron
en algunos usuarios una vez terminadas las pruebas ya que hubo ocasiones
donde les ocasionaba dolor de cabeza debido al esfuerzo mental que realizaron al
intentar mover el objeto.
83
CAPÍTULO 6
Conclusiones y Trabajo Futuro
El objetivo inicial del proyecto era la creación de una interfaz cerebro-computadora
que permitiera obtener la información captada por los sensores de la diadema de
Emotiv al someter a un usuario a jugar una aplicación tratando de mover un objeto
a la izquierda o a la derecha el cual se cumplió de manera satisfactoria. El analizar
las diferentes ondas cerebrales fue de vital importancia para el cumplimiento del
mismo ya que están involucradas en las diferentes acciones cerebrales que
responden frente a estados mentales los cuales nos indican la reacción de nuestro
cerebro mediante impulsos eléctricos que son reflejadas en tiempo real.
84
A pesar de los problemas que puedan aún existir en el procesamiento de
las señales EEG se ha recorrido un gran camino en el desarrollo de este tipo de
tecnología que sin duda nos llevará a ese panorama idealizado del futuro en
donde todo nuestro entorno pueda ser controlado por algo más que las fuerzas
mecánicas a las que estamos acostumbrados y podamos entrar en una nueva era
en donde explotemos todo el potencial aún desconocido que poseemos los seres
humanos en nuestro cerebro y sea una nueva puerta al desarrollo que vendrá de
manera más común a futuro.
Trabajo Futuro:
85
Recomendaciones
Aportaciones
Como resultado de realizar este proyecto se aporta principalmente a la comunidad
científica una nueva forma de tratamiento de información de señales cerebrales
desde que está en su forma original (en datos crudos) hasta poder interpretarla,
analizarla y clasificarla de acuerdo al nivel de intensidad de los sensores.
86
Referencias Consultadas
[1] Martínez Villar R. G., Técnicas de electroencefalografía, (2a ed.). D.F., México:
(1998). Comunicaciones Científicas. pp. 75-85
[4] Wolpaw, J. R., Birbaumer, N., McFarland, D. J., Pfurtscheller, G., Vaughan, T.
M., “Brain-computer Interfaces for Communication and Control,” Clin.
Neurophysiol., 2002.
[5] Marttson, S., Paryni, J., y Fast-Berglund A. (2016). Evaluating four devices that
present operator emotions in real-time. Science Direct ELSEVIER. 50, p.p 524-
528.
87
[10] Nijholt, Anton., Plas-Oude Danny y Reuderink Boris. (2009). Turning
shortcomings into challenges: Brain–computer interfaces for games. Science
Direct ELSEVIER, 83, p.p 85-94.
[14] Kennard Robert y Hoerl Arthur (1970). Ridge Regression: Biased Estimation
for Nonorthogonal Problems. Technometrics, p.p 55-67
[15] Tibshirani, Robert. (1996). Regression Shrinkage and Selection via the
LASSO. Journal of the Royal Statistical Society, Volumen 58, p.p 267-288.
[16] Hui Zou y Hastie Trevor. (2005). Regularization and variable selection via the
elastic net. J.R Statist, Vol 67, p.p 301-320.
[17] Breiman, Leo, Friedman Jerome, Stone Charles y Oishen R.A. (1984).
Classification and Regression Trees. Wadsworth.
[18] Quinlan, J.R (1983). "Induction of Decision Trees". Machine Learning I, p.p 81-
106.
[19] Quinlan, J.R. (1992). C4.5 Programs for Machine Learning, San Mateo, CA:
Morgan Kaufmann.
[20] Kass, G.V (1980). An Exploratory Technique for Investigating Large Quantities
of Categorical Data. Applied Statistics, Vol 29, p.p 119-127.
[21] Bayes, Thomas. (1763) .An Essay towards solving a Problem in the Doctrine
of Chances. Vol 53, p.p 370-418.
88
[22] Pearl, Judea. (1980). Razonamiento Probabilístico en Sistemas Inteligentes. y
Razonamiento Probabilístico en Sistemas Expertos. p.p 552
[23] Berkhin P., A Survey of Clustering Data Mining Techniques. In Kogan J.,
Nicholas C, Teboulle M. (Eds.), Grouping Multidimensional Data, Recent Advances
in Clustering, 25-71, Springer-Verlag, 2006.
[25] Agrawal, R. and Srikant, R. (1994) Fast Algorithms for Mining Association
Rules in Large Databases. Proceedings of the 20th International Conference on
Very Large Data Bases, Santiago de Chile, 12-15 September 1994, 487-499.
[26] David E. Rumelhart, James L. McClelland and PDP Research Group (1987).
Parallel Distributed Processing: Explorations in the Microstructure of Cognition
[30] Wold, H. (1975), Soft Modeling by Latent Variables; The Non-linear Iterative
Partial Least Squares Approach. Perspectives in Probability and Statistics, , P.P 1-
2.
[31] Sammon, J.W., A nonlinear mapping for data structure analysis. JEEE
Transactions on Computers, 1969.18: p. 401-409
89
[32] Torgerson, W. S. (1952): Multidimensional Scaling: Theory and Method.
Psychometrika, 4, 401-419.
[35] Breiman, Leo (1996). Bagging predictors. Machine Learning. pp. 123-140.
90
[42] “Diadema multiposicional”. Google. Internet. 18 de diciembre del 2016.
Disponible en:
http://www.cognionics.com/index.php/products/mini-systems/multi-position-dry-
headband
[48] “Regresión Logística”. Google. Internet. 20 de abril del 2017. Disponible en:
https://www.ibm.com/support/knowledgecenter/es/SSLVMB_22.0.0/com.ibm.spss.
statistics.help/spss/regression/idh_lreg.htm
91
[50] “KNN”. Google. Internet. 20 de abril del 2017. Disponible en:
https://www.researchgate.net/publication/50390105_E_Fix_and_JL_Hodges_1951
_An_Important_Contribution_to_Nonparametric_Discriminant_Analysis_and_Densi
ty_Estimation_Commentary_on_Fix_and_Hodges_1951
https://www.researchgate.net/publication/226370746_Kohonen_T_Self-
Organized_Formation_of_Topologically_Correct_Feature_Maps_Biological_Cyber
netics_431_59-69
[53] “Algoritmo Naive Bayes”. Google. Internet. 20 de abril del 2017. Disponible en:
http://algoritmosmineriadatos.blogspot.mx/2009/12/algoritmo-naive-bayes.html
[54] “Gauss Naive Bayes”. Google. Internet. 20 de abril del 2017. Disponible en:
http://machinelearningmastery.com/naive-bayes-classifier-scratch-python/
[55] “Estatus Videojuegos”. Google. Internet. 15 de mayo del 2017. Disponible en:
http://www.ticbeat.com/cyborgcultura/videojuegos-la-industria-multimillonaria-
detras-del-mayor-entretenimiento-del-planeta/
92