Sunteți pe pagina 1din 10

Sistema de Proteccin de Datos usando Dinmica de

Tecleo.
Alejandra Lil Torres Jimnez1, Dr.Francisco Diego Acosta Escalante2
1
Divisin Acadmica de Informatica y Sistemas,
Programa de maestra en sistemas computacionales
Universidad Jurez Autnoma de Tabasco (UJAT),
Cunduacn-Jalpa de Mndez, Km,1. Cunduacn, Tabasco.
lilitorres_75@hotmail.com

Divisin Acadmica de Informtica y Sistemas,


Profesor-Investigador,
Universidad Jurez Autnoma de Tabasco (UJAT),
Cunduacn-Jalpa de Mndez, Km, 1. Cunduacn, Tabasco.
francisco_d_acosta@hotmail.com

Resumen. Hoy en da la informacin es un bien que da valor a las empresas. El


mecanismo tradicional de nombre de usuario/contrasea no es seguro, debido a
los ataques constantes de terceros por obtener la informacin de manera ilegal.
En este estudio se usa la dinmica de tecleo, para medir los tiempos de retardo
que cada usuario tiene al dactilografiar. Para ello se propone una metodologa
basada en la dinmica dactilar en conjuncin con modelos estocsticos para la
autenticacin.
Palabras claves: Dinmica de tecleo, Autenticacin, Seguridad computacional,
Modelos Estocsticos

1 Introduccin
El mecanismo de seguridad computacional mayormente utilizado para accesar a la
informacin en los sistemas de cmputo se basa en los nombres de usuario y
contraseas, lo que permite verificar dicha identidad en el proceso de autenticacin.
Sin embargo este proceso de autenticacin presenta algunos inconvenientes, tales
como: los usuarios adoptan como contraseas palabras obvias, como su nombre,
iniciales, fecha de nacimiento, las cuales pueden ser identificadas y robadas
fcilmente. En este caso, la seguridad del proceso de autenticacin depende
totalmente de la confidencialidad de la contrasea. Por lo tanto una contrasea, no es
suficiente para tener la seguridad que la persona es fsicamente quien dice ser. En la
biometra dinmica existe una tcnica para autenticar a una persona en base a su
dinmica de tecleo. Se sabe, que el ritmo al escribir en un teclado es especfico para
cada usuario que permiten distinguirla de los dems [11].

Alejandra Lil Torres Jimnez1, Dr.Francisco Diego Acosta Escalante2

En este articulo, se presenta una metodologa basada en la dinmica dactilar. Se


llama dinmica dactilar, a los eventos de pulsar-soltar y soltar pulsar y al tiempo
transcurrido entre estos dos eventos, es decir la velocidad del desplazamiento
transcurrido entre tecla y tecla. Estos tiempos se definen por usuario, teniendo as una
huella digital de acceso al sistema computacional de datos.
Para ello se desarrollo una herramienta capaz de medir los tiempos de tecleo de
cada usuario. Los componentes que integran esta herramienta son: rutinas para la
deteccin de eventos del teclado, un contador de tiempo, rutinas para la seleccin de
modelo estadstico dependiendo del comportamiento de los tiempos del usuario. Esta
herramienta se implemento en equipos mviles denominados laptop. Para el proceso
de autentificacin se han definido dos modelos estadsticos. El primero originado por
el comportamiento de los tiempos del usuario y el segundo basado en el
comportamiento de la totalidad de los tiempos de todos los usuarios. A esto le
denominamos autenticacin conjunta.

2. Biometra
Segn la ABIE [3] la biometra es una caracterstica mensurable, fsica o un rasgo del
comportamiento usada para reconocer o verificar la identidad de una persona. La
biometra se divide en esttica y dinmica.
2.1 Biometra esttica
Son aquellas caractersticas fisiolgicas que son nicas en cada ser humano y que son
estables en el tiempo (bajo circunstancias naturales). Ejemplos de estos rasgos son el
rostro, la mano, las huellas digitales, el iris.
2.2 Biometra Dinmica
Los psiclogos han demostrado que los seres humanos somos predecibles en nuestro
desempeo de tareas repetitivas y rutinarias. Aprovechando estas predicciones es que
se ha desarrollado la biometra dinmica o de comportamiento, que analiza rasgos de
la persona tales como la voz, la forma de escribir, la manera de teclear e incluso el
ritmo al caminar [4]

3. Dinmica de Tecleo
Para este estudio se define dinmica de tecleo o dinmica dactilar, a los eventos de
pulsar-soltar tecla, soltar pulsar tecla y al tiempo transcurrido entre estos dos
eventos, es decir la velocidad del desplazamiento transcurrido entre tecla y tecla.
Estos tiempos se definen por usuario, teniendo as un perfil del usuario que da acceso
al sistema computacional de datos. Marino [10] define cmo biometra de tecleo a
las tcnicas necesarias para identificar en qu medida existe una cierta regularidad en
el modo de tecleo de un usuario en un sistema informtico.
El punto central para el modelo de perfiles en estos sistemas consiste en poder
medir en el tiempo con la mayor precisin posible la ocurrencia de estos eventos. Una

Sistema de Proteccin de Datos usando Dinmica de Tecleo.

vez que se tienen registrados todos los eventos ocurridos en la entrada de texto por
parte del usuario, el resto consiste en aplicar un algoritmo para la obtencin de una
medida que represente a la muestra. Existen varias aproximaciones para procesar los
datos de tiempo: mtodos estadsticos, lgica difusa, redes radiales, redes neuronales
[2].

4. Trabajos Previos
Los avances que se han llevado a cabo en la tcnica biomtrica se han dado desde la
dcada de 1980. Desde entonces los investigadores han llevado a cabo numerosos
estudios donde proponen diversas metodologas, incluyendo la evaluacin de dos
caractersticas de los usuarios: el intervalo de tiempo soltar pulsar tecla y el
intervalo de tiempo pulsar soltar tecla.
Tambin se ha aadido la caracterstica de tiempo pulsar pulsar, el cual es el tiempo
que transcurre en el que se pulsa una tecla y se pulsa la siguiente tecla, as como el
tiempo de soltar la tecla anterior y presionar la tecla siguiente [9].
En diferentes trabajos [1], [7], [10],[14] el modelo para la clasificacin de usuarios se
basa en la medicin de los tiempos de tecleo con una precisin de milisegundos, en
centsimas de segundos [9].
Las tcnicas que se han utilizado para clasificar a los usuarios van desde modelo
difusos [9], clasificador de redes de funcin de base radial (RBF) [1]. El doctor
Marino [10] utiliza un clasificador basado en modelo estadstico y un clasificador
difuso.
La aportacin del trabajo de Clifford DSouza [5], en Australia y Aguilar en Mxico
[2], en dinmica de tecleo, se bas en los retardos entre teclas, que se analizaron en
base a funciones estadsticas de dispersin, sobre los tiempos de tecleo que se
obtienen al momento en que una persona desea autenticarse, se comparan con los de
su plantilla mediante una funcin de similitud (PS) para decidir su aceptacin o
rechazo. La confianza en este modelo se mide en base a los valores de dos variables:
la falsa aceptacin (aceptar como autntica a una persona que no lo es) y el falso
rechazo (no reconoce a una persona autentica como tal).
Iglesias [8] implementa el algoritmo de funciones estadsticas de dispersin que fuera
utilizado Aguilar [2] en un dispositivo PDA, omitiendo el modelo de adaptacin que le
permita al software reconocer la evolucin que va sufriendo la dinmica de tecleo del
usuario. Sin embargo hasta este momento no hemos encontrado ningn estudio que
nos indique los requerimientos mnimos que describan la longitud de un password,
utilizando dinmica de tecleo.

5. Metodologa propuesta
La importancia de la metodologa radica en definir por usuario lo que le hemos
denominado huella dinmica dactilar estocstica (HDDE), sta toma en cuenta los
comportamiento los tiempos de pulsar soltar (TCPS) la contrasea del usuario y el
entre tecleo (TCET). La metodologa consta de cuatro fases (figura 1): deteccin de
eventos, prueba de ajuste terica, definicin de la huella dinmica dactilar estocstica,
prueba de autenticidad, para ello se desarroll una herramienta de autentificacin.

Alejandra Lil Torres Jimnez1, Dr.Francisco Diego Acosta Escalante2

Figura 1: Metodologa propuesta

Herramienta de autenticacin. Es necesario realizar una herramienta que sea capaz


de recolectar los tiempos de tecleo del usuario, al momento de autenticarse. Esta debe
proporcionar un conjunto de tiempos pertenecientes a una secuencia de caracteres
escritos.
Los elementos necesarios para el desarrollo de este interfaz y de la aplicacin son:
rutinas para la deteccin de eventos del teclado, un contador de tiempo con una
precisin de cuatro cifras para la diferenciacin de los tiempos en cada usuario,
estadstico y normalizacin de estos tiempos (figura 2).

Figura 2. Herramienta de autentificacin. Deteccin de eventos.

Sistema de Proteccin de Datos usando Dinmica de Tecleo.

Fase 1. Deteccin de los eventos del teclado. La deteccin de los eventos del
teclado, es el elemento clave para la definicin de la HDDE, en este incorporan
rutinas que se encargan del manejo de los eventos de teclado como son: pulsar tecla o
soltar tecla. Se mide el comportamiento de tecleo del usuario:
El tiempo que transcurre cuando el usuario presiona una tecla y suelta la
misma tecla.
El tiempo que transcurre cuando el usuario suelta una tecla y presiona la
tecla siguiente. Este evento es llamado soltar-pulsar.
En la figura 2. Se representa mediante el algoritmo para la obtencin de los tiempos
de los eventos pulsar-soltar y soltar-pulsar.
1. En la caja de edicin o componente de entrada se esperar la ejecucin de un
evento sobre el teclado, es obvio que el primer evento que se genera es el pulsar
una tecla.
2. Se inicializa el valor de una variable X a 1, esta variable controlar el nmero de
tiempos T que se recolectarn, el cual estar determinado por la longitud de la
frase S.
3. De la misma manera se inicializa Tnt con un valor de 0, esta variable en pasos
ms adelante tomar el valor que regrese la llamada al contador cuando se est
pulsando una tecla.
4. Si el evento que se genera es el de presionar una tecla.
4.1. Si es la primera vez, continua en el paso cinco.
4.2 En caso de que fuera la segunda vez que se presiona una tecla (X = 1), se
cumple un ciclo del evento soltar pulsar.
(Guardamos en un arreglo en la ubicacin SP[X-1] el valor que se obtenga de
resta el valor que tenga el contador en ese momento menos el tiempo en el
cual se solt la tecla anterior el cual estar ya almacenado en el arreglo
PS[X-1].
5. Se le asigna a la variable Tnt a travs de la llamada a la funcin
ObtValorCont(),
el
valor
que
lleva
el
contador
(QueryPerformanceCounter).
6. Se incrementa el valor de n para almacenar la siguiente posicin de los arreglos
PS y SP. Se vuelve al estado inicial esperando el nuevo evento del teclado.
7. Si el evento que se genera fuera el de soltar una tecla.
7.1. Tnt tiene el valor que se asigno cuando la tela se presiono, en este momento
se cumple un ciclo del evento pulsar soltar, se guarda en un arreglo en la
ubicacin PS[X-1] el resultado de restar al valor que tiene actualmente en el
contador menos el tiempo en el que se presiono la tecla que es el valor que
tiene la variable Tant.
8. Se vuelve al estado inicial esperando el nuevo evento del teclado.
El resultado de todo este proceso se maneja en dos arreglo PS y SP en los cuales se
encuentran los tiempos en los que se llev a cabo los eventos pulsar soltar y
soltar pulsar respectivamente, el nmero de elementos en el arreglo SP ser un
elemento menos al del arreglo SP.

Alejandra Lil Torres Jimnez1, Dr.Francisco Diego Acosta Escalante2

Figura 2. Algoritmo para la obtencin de los tiempos de los eventos pulsar-soltar y soltarpulsar.

Para definir el modelo estadstico debemos considerar lo siguiente, cada tiempo


dactilar es una variable aleatoria Xi, que denota un espacio . es el espacio
muestreal de un experimento con un rango Rx se define en , adems si un evento A
es un tiempo dactilar en y B es un tiempo dactilar en Rx, entonces los tiempos son
equivalentes si

Px ( B) = P( A) donde A = {e X (e ) B}

(1)

Cada vez que ocurre A, ocurre B y viceversa. Cabe aclarar este es importante porque
se asocian espacios diferentes.
Este espacio c describe un comportamiento de dinmica dactilar de la contrasea al
cual lo vinculamos a una distribucin modelo. Ocurre de igual manera con el
comportamiento con la dinmica dactilar entre tecleo de la contrasea p. Este
comportamiento se define como una distribucin de frecuencias obtenida de los
eventos TCPS y TCET (Figura 3)
Fase 2. Modelo Estadstico. Esta fase consiste en definir los comportamientos de
los tiempos de pulsar-soltar y el entre tecleo en la dactilografa de la contrasea en el
sistema de proteccin de datos. Este comportamiento se ajusta a distribuciones
modelos, al compararlos con las distribuciones de frecuencia obtenidas de la
muestra de una poblacin [14]. La adaptacin de distribucin concuerda
automticamente con la dinmica dactilar contra las distribuciones de probabilidad.
Se lleva a cabo un ajuste matemtico para determinar el conjunto de parmetros para

Sistema de Proteccin de Datos usando Dinmica de Tecleo.

cada distribucin que mejor describa las caractersticas de los datos. Luego, la
proximidad de cada ajuste se evala utilizando uno de varios estndares tales como
pruebas de bondad de ajuste. Se elige el ajuste de clasificacin ms alta para
representar la dinmica.
Pruebas de bondad y ajuste (PBD). Son un conjunto de pruebas matemticas
realizadas con el objeto de encontrar el mejor ajuste entre una distribucin de
probabilidad estndar y una distribucin de un conjunto de datos, entre las que
destacan: Chi-cuadrada, Kolmogorov-Smirnov y Anderson-Darling [15]. Para este
estudio se utiliza la PBD Chi-cuadrada.
La prueba Chi cuadrada que compara la distribuciones de frecuencias observadas
(Oi) de las dinmicas en intervalos de la clase isimo. Se calcula la frecuencia
esperada en el intervalo psimo (Ei). La prueba esta definida por la ecuacin 2.
K

O2 =
i =1

(Oi Ei ) 2
Ei

H o : O2 ~ 0

H 1 : O2 > 0

Se acepta

(2)

Se rechaza

Esta prueba medimos la precisin general separando la distribucin en reas de igual


probabilidad y comparando los puntos de datos dentro de cada rea con la cantidad de
puntos de datos esperados. Generalmente, un valor-p mayor a 0.5 indica un ajuste
cerrado. Se definen las siguientes distribuciones con base al comportamiento de la
dinmica dactilar (figura 3): Beta, Gamma, Logstica, Lognormal, Valor Extremo
Mximo, Valor Extremo Mnimo, Pareto, T de Student, Triangular, Weibull.

Figura 3. Comportamiento del evento pulsar-soltar y la definicin del modelo.

Alejandra Lil Torres Jimnez1, Dr.Francisco Diego Acosta Escalante2

Fase 3. Huella dinmica dactilar estocstica (HDDE). La definicin de huella para


este artculo consta de dos elementos: el primero de ellos es la distribucin esperada
de los tiempos al dactilografiar la contrasea del usuario y la distribucin esperada de
los tiempos que existe entre teclas que es particular del usuario. La HDDE es
particular para cada usuario y define el grado de confianza desde 1 hasta + 1 de la
relacin de los pares

Figura 4. HDDE con un coeficiente de 0.95

Fase 4. Prueba de autentificacin. Para acceder a los recursos del sistema


informtico, el usuario tendr que teclear su identidad de usuario (contrasea) La
identidad del usuario sirve como entrada para hacer una bsqueda a la base de datos
de la existencia o no de un registro previo del usuario. En caso negativo, se crear un
nuevo registro para ese usuario y en seguida se solicitara que teclee n veces su
contrasea.
De cada secuencia de caracteres que componen la contrasea ser extrada un
conjunto de caractersticas. Basndose en ese conjunto de caractersticas se realizara
el perfil dactilografico del usuario.
Con el mismo criterio, aqu necesitamos un factor sobre la comparacin de los
perfiles digitales contra los que el usuario escribe. A este factor le llamamos
Tolerancia y lo tomamos como una medida porcentual sobre la cantidad de
pendientes donde se es igual el perfil registrado a la contrasea alimentada. As, este
factor va de 0% a 100%. Si nuestro factor de tolerancia es de 80% le estamos diciendo
que mientras el sistema no identifique el 80% de las pendientes correctamente, no se
le dar acceso al usuario. Desde luego que es posible generar ms parmetros de
comparacin, as como una incertidumbre de tolerancia, por ejemplo, comparada
contra la del perfil, sea igual en 10%, por ejemplo. De esta manera, se estara
incorporando ms precisin a la comparacin, evitando as que un impostor pudiese,
incluso sabiendo el mtodo de verificacin usado, duplicarlo.

Sistema de Proteccin de Datos usando Dinmica de Tecleo.

6. Resultados
Se realizaron tres experimentos con 27 especimenes escogidos aleatoriamente.
Donde se identificaron usuarios, definieron contrasea y dinmica de tecleo. Por
usuario se define el comportamiento de la dinmica dactilar. Con base a estas
dinmicas se obtuvieron los modelos estocsticos que se muestran en la tabla 1, por
simplicidad solo se muestran los cinco primeros especimenes.

Muestra
1
2
3
4
5

Contrasea
Pulsar - Soltar
Entre tecleo
Extremo - Mximo Weibull
Logstica
T de Students
Triangular
Normal
Logstica
T de Students
Extremo - Mximo Extremo - Mximo

Tabla 1. Modelos estocsticos definidos por la metodologa

En las figura 5 y 6. Se muestra los ajustes realizados a los comportamientos de las


dinmicas dactilares, las cuales al definirse sustituyen a los datos histricos y son
comparados con los nuevos eventos que el usuario realice para accesar a la
informacin que el sistema de proteccin resguarda. Los resultados se realizaron con
una confiabilidad del 95 %.

Figura 5 . Modelo Estocstico PS, muestra 1

Figura 6 . Modelo Estocstico ET, muestra 1

7. Conclusin y recomendacin.
En este trabajo se propone un modelo estocstico para la autenticacin de usuarios
a travs de la biometra dinmica de tecleo. La medicin de los tiempos se realizo a
travs de una llamada a la funcin QueryPerformanceCounter funcin del API de
Windows que devuelve el tiempo que ha estado Windows activo, obteniendo con esta
funcin los tiempos de los eventos pulsar-soltar y solar-pulsar con un precisin de
cuatro cifras. Por los resultados obtenidos este Sistema de Proteccin basado en la
dinmica dactilar estocstica puede incrementar los niveles de seguridad en los

10

Alejandra Lil Torres Jimnez1, Dr.Francisco Diego Acosta Escalante2

sistemas de cmputo y dispositivos mviles como laptop, ya que requiere una doble
autentificacin, debido a la implementacin de los dos modelos estocsticos.

Referencias
1.

2.
3.
4.
5.

6.
7.

8.

9.

10.
11.
12.
13.
14.
15.
16.
17.

Acevedo Daniel, Glemarys Hernndez y Scalise P Eugenio. Identificacin de


Usuarios Basado en el Reconocimiento de Patrones de Tecleo Universidad Central
de Venezuela, Facultad de Ciencias (2000).
Aguilar Hernndez Jos Guadalupe. Autenticacin de usuarios a travs de biometra
de tecleo. Universidad Jurez Autnoma de Tabasco-DAIS. (2006).
Asociacin de Biometra Informtica Espaola (ABIE) universidad Autnoma de
Madrid. (2005)
D. Umphress and G. Williams. Identity Verification Through keyboard
Characteristics. International Journal of Man-Machine Studies, (1985).
Darren Clifford DSouza. Typing Dynamics Biometric Authentication, Department
of Information Technology and Electrical Engineering University of Queensland,
(2002).
Davies Security for Computer Networks: An Introduction to Data Security John
Wiley and Sons, New York, (2002).
Enzhe Yu, Sungzoon Cho, Keystroke dynamics identity verification problems and
practical solutions Department of Industrial Engineering, College of Engineering,
Seoul National University, (2004).
Iglesias Galvan Gerardo Sistema de Autenticacin para Dispositivos Mviles
Basado en Biometra de Comportamiento de Tecleo. Instituto Tecnolgico de
Morelia, Departamento de Sistemas y Computacin, (2007).
Lizrraga Araujo, Sucupira Jr., Yabu-uti y Ling. Autenticacin personal por
dinmica de tecleo basada en lgica difusa Universidad Estatal de Campinas
(UNICAMP).
Marino Tapiador Mateo. Biometra de tecleo, autenticacin de usuarios Ingeniera
Informtica, Universidad Autnoma de Madrid, Mayo del (2000).
Miller Benjamin Vital Sings of Identity.IEEE,Spectrum,pp 22-30, 1994
Monrose Fabian, Aviel D. Rubin, Keystroke Dynamics as a Biometric for
Authentication New York University, New York, NY (1999).
Obaidat M. S. Keystroke dynamics based Authentication Monmouth University
Applied Science University (2002).
Pardo-Torres Jorge Alberto, Notas de Estadsticas Avanzada. 2007.
Pardo-Torres Jorge Alberto, Seminario de Anlisis de Riesgo a proyectos de
Inversin en la Industria del Gas y del Petrleo, 2007.
Ross J. Anderson and Ross Anderson. Security Engineering: A Guideto Building
Dependable Distributed Systems. Wiley, (2001).
W.G. de Ru and J.H.P. Eloff, Enhanced Password Authentication through Fuzzy
Logic IEEE Expert / Intelligent Systems & Their Applications,
Noviembre/Diciembre (1997).

S-ar putea să vă placă și