Documente Academic
Documente Profesional
Documente Cultură
SANGOLQUÍ
2016
ii
CERTIFICACIÓN
iii
AUTORÍA DE RESPONSABILIDAD
iv
AUTORIZACIÓN
v
DEDICATORIA
AGRADECIMIENTO
A todos mis amigos, con los que compartí esta etapa mi vida dentro y fuera
de las aulas. Gracias por los momentos de alegría y tristeza, y por brindarme
siempre su apoyo y amistad incondicional.
ÍNDICE
CERTIFICACIÓN ........................................................................................... ii
AUTORIZACIÓN ........................................................................................... iv
DEDICATORIA ............................................................................................... v
AGRADECIMIENTO ...................................................................................... vi
ABSTRACT .................................................................................................. xv
CAPÍTULO I................................................................................................... 1
INTRODUCCIÓN ........................................................................................... 1
1.2.1. General.......................................................................................... 2
CAPÍTULO II.................................................................................................. 7
CAPÍTULO III............................................................................................... 19
CAPÍTULO IV .............................................................................................. 57
CAPÍTULO V ............................................................................................... 88
REFERENCIAS ........................................................................................... 90
x
ÍNDICE DE TABLAS
Tabla 1 Ejemplo de Respuestas Opción múltiple HIT 1.1 – HIT 1.3 ........... 47
Tabla 2 Ejemplo de respuestas de selección del Protocolo 2 ..................... 47
Tabla 3 Respuestas similitud Protocolo 3 100 workers ............................... 48
Tabla 4 Ejemplo de resultados workers HIT 1.1 ......................................... 60
Tabla 5 Resultados HIT 1.1 ........................................................................ 60
Tabla 6 Ejemplos resultados HIT 1.2 .......................................................... 62
Tabla 7 Resultados HIT 1.2 ........................................................................ 62
Tabla 8 Ejemplo de respuestas por workers HIT 1.3 .................................. 64
Tabla 9 Resultados HIT 1.3 ........................................................................ 64
Tabla 10 Resultados totales Protocolo 1 .................................................... 64
Tabla 11 Datos importantes protocolo 2 ..................................................... 66
Tabla 12 Detalles firmas utilizadas en el Protocolo 2 .................................. 66
Tabla 13 Ejemplo resultados workers ......................................................... 67
Tabla 14 Resultados Protocolo 2 ................................................................ 67
Tabla 15 Ejemplo Firmantes Protocolo 3 .................................................... 69
Tabla 16 Parámetros de configuración 100 workers ................................... 70
Tabla 17 Resultados workers 60 workers ................................................... 71
Tabla 18 Resultados Protocolo 3 100 workers............................................ 71
Tabla 19 Parámetros de configuración 500 workers ................................... 72
Tabla 20 Ejemplos resultados 500 workers ................................................ 72
Tabla 21 Resultados 500 workers............................................................... 72
Tabla 22 Evolución FRR y FAR para 100 workers...................................... 74
Tabla 23 Evolución FRR y FAR para 500 workers...................................... 75
Tabla 24 Rendimiento comparativo para 20 firmantes................................ 76
Tabla 25 Rendimiento comparativo FAR .................................................... 78
Tabla 26 Rendimiento comparativo FRR .................................................... 80
xi
ÍNDICE DE FIGURAS
RESUMEN
PALABRAS CLAVE:
DTW
FDE
AMAZON MTURK
WORKERS
TASA DE FALSA ACEPTACIÓN
xv
ABSTRACT
KEYWORDS:
DTW
FDE
AMAZON MTURK
WORKERS
FALSE ACCEPTANCE RATE
1
CAPÍTULO I
INTRODUCCIÓN
1.1. Antecedentes
1.2. Objetivos
1.2.1. General
1.2.2. Específicos
CAPÍTULO II
del nombre del firmante y de la forma que los firmantes desean ser
presentados a las demás personas, así como lo explica Diaz-Cabrera (2015)
Las firmas occidentales están generalmente compuestas por texto, el cual
es a veces difícil de leer debido a la velocidad con que se firma, además del
adorno. El texto en una firma occidental define la identidad del firmante el cual
refleja su nombre, el nombre de la familia o simplemente una combinación de
letras iniciales. El adorno o la rúbrica en las firmas occidentales se definen por
una especie de garabato escrito más rápidamente y sin mucha atención.
2.4. Crowdsourcing
Multitud (crowd)
definida
Tarea con un
Utiliza el Internet
objetivo claro
Utiliza una
La recompensa
convocatoria
Crowdsourcing recibida por la
abierta de
multitud es clara
longitud variable
Es un proceso
El crowdsourcer
asignado en línea
está claramente
de tipo
identificado
participativo
La compensación
recibida por el
crowdsourcer
está definida
Crowdsourcing
participantes
Ventajas
Maximiza resultados
2.5.1. Workers
19%
Estados Unidos
47% India
34% Misceláneo
2.5.2. Requesters
Crear un proyecto
(tareas)
Obtener resultados
INICIO
Ingresar la información de
contacto, fecha de nacimiento
Ingresar a la página web y pregunta de seguridad. Esta
www.mturk.com información sirve para crear
una cuenta de pagos en
Amazon
FIN
Ingresar su información personal.
Recuerde que solo se aceptan
personas residentes en Estados
Unidos
Dar click en
Es usted una persona la opción de
NO
natural? Are you a
business?
SI
Los proyectos en MTurk son las herramientas que permiten programar las
actividades a través de HIT que serán realizadas por los workers. En los
proyectos se describe la actividad a realizar así como el valor por realizar la
actividad y el tiempo que estará disponible para su realización. En la figura 9
se muestra un diagrama de flujo con los pasos necesarios para crear un
proyecto. En el Anexo 2 se muestra el diagrama de flujo con más detalles
sobre la creación de un proyecto en MTurk.
INICIO
En la pestaña Enter
Properties, ingresar el nombre SI
del proyecto
FIN
Establecer los parámetros de
la HIT
CAPÍTULO III
Configuración de la actividad
Diseño de la interfaz
3.2.1. Prueba 1
3.2.2. Prueba 2
3.2.3. Prueba 3
3.2.4. Prueba 4
Parámetro Configuración
Base de datos BIOSECURE DS2
Objetivo Analizar el rendimiento del humano con
diferente tipo de información tales como
estática y dinámica (imagen, trazo y
características de la firma.)
Firmantes 6
Tiempo de ejecución 2 minutos (*1’12’’)
Cantidad de workers 60
Costo por worker $0.04
Costo total $2.40
Figura 17 Datos importantes protocolo 1
*El tiempo promedio que les toma a los workers realizar la tarea.
El protocolo 1 cuenta con tres HITs descritas a continuación:
HIT 1.1: Presenta la imagen de la firma de entrenamiento y la firma
de prueba, con el objetivo de identificar la similitud entre firmas a
través de información estática. La figura 18 muestra la visualización
de la HIT 1.1 en MTurk.
28
Para el desarrollo de HIT 1.1, HIT 1.2 y HIT 1.3 las firmas seleccionadas
son genuinas y falsificadas que provienen de la primera sesión de la base de
datos BIOSECURE DS2. Inicialmente se han elegido 6 firmantes cuyas firmas
muestran diferentes estilos, esta variedad permitirá a los workers entregar
distintos criterios sobre la estructura de la firma y las razones por las que son
iguales o distintas. La selección de firmas se ha hecho de acuerdo al género
y a tres rangos de edades que son:
Rango 1: 18-30 años
31
Parámetro Configuración
Base de datos BIOSECURE DS2
Evaluar el desempeño del
humano en reconocimiento de
Objetivo
firmas con poco tiempo y poca
información
Firmantes 6
Tiempo de ejecución 1 minuto (*30’’)
Cantidad de workers 30
Costo por worker $0.02
Costo total $0.60
Figura 21 Datos importantes protocolo 2
*El tiempo promedio que les toma a los workers realizar la tarea.
Parámetro Configuración
Base de Datos BiosecurID
Comparar el rendimiento del humano
Objetivo en un posible escenario real con mayor
información.
Firmantes 4
Tiempo de ejecución 3 minutos (2’)
Cantidad de workers 60
Costo por worker $0.03
Número de actividades 4
Costo de actividad por
$0.12
worker
Costo total $7.20
Figura 23 Datos importantes protocolo 3
Parámetro Configuración
Base de datos BiosecurID
Comparar el rendimiento del
humano en un posible
Objetivo
escenario real con mayor
información.
Firmantes 20
Tiempo de ejecución 3 minutos (2’)
Cantidad de workers 500
Costo por worker $0.03
Número de actividades 4
Costo de actividad por $0.12
worker
Costo total $60
Figura 28 Datos importantes protocolo 3
Las imágenes y video utilizados están alojados en un sitio web que en este
caso es Photobucket. Photobucket permite almacenar fotografías, gifs,
presentaciones con diapositivas y videos. En la figura 36 se puede observar
el acceso a los beneficios de este sitio para lo cual se crea una cuenta gratuita
que cuenta con 2Gb de almacenamiento libre.
dar click en la pestaña Edit del proyecto al que pertenece la plantilla, como se
ve en la figura 37.
Una vez que se elige Edit se accede a otra pantalla que presenta las
opciones de edición, para editar el código de la plantilla HIT se debe dar click
en Design Layout. La figura 38 muestra las opciones de Design Layout.
Nombres de la
variables usadas
en la plantilla
Una vez que ha expirado el tiempo que la actividad está disponible para
ser ejecutada, se descarga desde MTurk los resultados generados por los
workers, tal como se explicó en la sección 3.4.2 y se puede observar en la
figura 40.
La clasificación de los datos se realiza en dos etapas básicas:
Etapa 1: En MTurk es posible aceptar o rechazar el trabajo
realizado por un worker, por lo tanto, si el requester no está
conforme con la respuesta obtenida se rechaza la respuesta y la
misma no aparece en el archivo de datos de salida.
Etapa 2: En esta etapa la clasificación de datos se realiza tanto de
forma subjetiva (interpretación y clasificación) como objetiva
(ponderada) por medio del uso de software matemático. Se aplica
45
5%
9% Dimensión
43% Patrón
6%
Patrón
Estilo de las
38%
56% letras
Punto inicial y
final iguales
Protocolo 1
En el protocolo se tiene una pregunta de opción múltiple para las HIT 1.1,
HIT 1.2 y HIT 1.3. Cada pregunta de opción múltiple tiene tres respuestas
posibles que son:
Equal (Igual)
Not Similar (No similar)
Not Equal (No igual)
47
Tabla 1
Ejemplo de Respuestas Opción múltiple HIT 1.1 – HIT 1.3
Protocolo 2
En protocolo 2 las respuestas se obtienen de las firmas seleccionadas por
el worker. Dependiendo del criterio puede elegir más de una firma y por lo
tanto se puede tener más de una respuesta válida.
La tabla 2 muestra ejemplos de respuestas dadas por los workers.
Tabla 2
Ejemplo de respuestas de selección del Protocolo 2
Worker ID Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8
A3Q7NPNR63WDJJ 2 5
A3HDJ664DGY14O 5
A784BOYEKRJCD 6 7
APA3LLSQ8OOSL 7
A3QLMSLL4AYTDT 1
A22I19IP73HB0D 3
A3Q7NPNR63WDJJ 1 6 7
AWIO57CI1ZBIH 1
A16SO41Z0J0RNR 3 7 8
48
Protocolo 3
En el protocolo 3 las respuestas provienen de la calificación otorgada al
worker a cada firma de prueba. Las respuestas están en el rango de 1 a 10
dependiendo si la firma es considerada genuina o falsificada.
La tabla 3 muestra un ejemplo de las respuestas recogidas en este
protocolo.
Tabla 3
Respuestas similitud Protocolo 3 100 workers
Worker ID S1 S2 S3 S4 S5 S6 S7 S8
A1EK1N6M8VCQ66 1 2 1 1 2 3 1 1
A1GR8T8TUTJO00 3 7 8 7 8 8 4 6
A1HL0NR9KG5Z0G 1 9 10 2 9 7 1 2
A1O0BPP1U58KCW 8 6 6 4 8 4 9 7
A1OP238L5ZBHZV 4 7 7 6 6 4 3 5
Bucles del texto: Se refiere a los lazos y giros tanto de la rúbrica como
de los caracteres. En la figura 53 se muestra un ejemplo de una firma con
bucles.
52
Descripción del
atributo a medir
Firma a ser
etiquetada
Inicio
Ejecutar el programa principal Se crea estructura gallery Calcular la distancia de Dividir 1/sc_g_manual y Proceso para Random
automatic_matching.m Manhattan obtener sc_g Forgery y Skilled Forgery
CAPÍTULO IV
ANÁLISIS DE RESULTADOS
Parámetro Configuración
Base de datos BIOSECURE DS2
Firmantes 6
Tiempo de ejecución 2 minutos
Cantidad de workers 60
Costo por worker $0.04
Costo total $2.40
Figura 61 Parámetros globales del protocolo 1
us: usuario
f: número de firma
s: sesión
59
us03_f07_s01 G us21_f02_s01 G
us03_f22_s01 F us21_f19_s01 F
us01_f10_s01 G us100_f14_s01 G
us01_f23_s01 F us100_f22_s01 F
La HIT 1.1 cuenta con una pregunta de opción múltiple que tiene tres
posibles respuestas de acuerdo a la similitud entre la firma de prueba y la de
entrenamiento.
Las tres opciones son:
Estoy seguro que las firmas son iguales.
Las firmas no parecen muy similares.
Estoy seguro que las firmas no son iguales.
Tabla 4
Ejemplo de resultados workers HIT 1.1
Worker ID Resp op 1
A1RS4SD1UJ2X4C ND
A30Z6PTO0HTHZC FR
A3RX5VBYG7R6IY FR
AW2OFN1WI4DGP FA
A1MXLPG2UO1GEC FR
A2XLCUBIYZDT8M ND
AD1ILDUXZHASF ND
A2HXOT3SKCMYGC FA
A3FVZPBGHHK5LP FA
A2UG68DTOFPQCO FR
Tabla 5
Resultados HIT 1.1
us03_f03_s01 G us21_f02_s01 G
us03_f22_s01 F us21_f19_s01 F
us05_f09_s01 G us51_f04_s01 G
us05_f20_s01 F us51_f16_s01 F
La HIT 1.2 cuenta con una pregunta de opción múltiple que tiene tres
posibles respuestas de acuerdo a la similitud entre la firma de prueba y la de
entrenamiento.
Las tres opciones son:
Estoy seguro que los trazos de las firmas son iguales.
Los trazos de las firmas no parecen muy similares.
Estoy seguro que los trazos de las firmas no son iguales.
Tabla 6
Ejemplos resultados HIT 1.2
Worker ID Resp op 2
A1RS4SD1UJ2X4C ND
A30Z6PTO0HTHZC FR
A3RX5VBYG7R6IY FR
AW2OFN1WI4DGP FA
A1MXLPG2UO1GEC FA
A2XLCUBIYZDT8M ND
AD1ILDUXZHASF FA
A2HXOT3SKCMYGC FR
A3FVZPBGHHK5LP ND
A2UG68DTOFPQCO FR
Tabla 7
Resultados HIT 1.2
La HIT 1.3 cuenta con una pregunta de opción múltiple que tiene tres
posibles respuestas de acuerdo a la similitud entre la firma de prueba y la de
entrenamiento así como de las características en presión, x e y.
Las tres opciones son:
Estoy seguro que las características de las firmas son iguales.
Las características de las firmas no parecen muy similares.
Estoy seguro que características de las firmas no son iguales.
64
Tabla 8
Ejemplo de respuestas por workers HIT 1.3
Tabla 9
Resultados HIT 1.3
Tabla 11
Datos importantes protocolo 2
Parámetro Configuración
Base de datos BIOSECURE DS2
Firmantes 6
Tiempo de ejecución 1 minuto
Cantidad de workers 30
Costo por worker $0.02
Costo total $0.60
Tabla 12
Detalles firmas utilizadas en el Protocolo 2
Tabla 13
Ejemplo resultados workers
Worker ID F1 F2 F3 F4 F5 F6 F7 F8
AKH0WFAUBUKUS FR A FR A FR A A FR
A36T173B6ZGBL8 A A FR A FR FR A FR
A31EJNMP33VREV A A A A A FR A FR
AWIO57CI1ZBIH FR A A A FR FR A FR
A1NF6PELRKACS9 FR A FR A FR A A FR
Tabla 14
Resultados Protocolo 2
Tabla 15
Ejemplo Firmantes Protocolo 3
us02_f06g_s01 E us07_f01g_s01 E
us02_f07g_s01 E us07_f02g_s01 E
us02_f08f_s01 P us07_f01f_s01 P
us02_f04g_s01 P us07_f05g_s01 P
us02_f05f_s01 P us07_f02f_s01 P
us08_f01g_s01 E u18_f01g_s01 E
us08_f02g_s01 E u18_f02g_s01 E
us08_f01f_s01 P u18_f01f_s01 P
us08_f09g_s01 P u18_f05g_s01 P
us08_f08f_s01 P u18_f02f_s01 P
Umbral
Para evaluar las dos condiciones mencionadas hay que tomar en cuenta
la ubicación y el orden de las firmas de prueba y firmas de entrenamiento.
70
Tabla 16
Parámetros de configuración 100 workers
Parámetro CONFIGURACIÓN
Base de Datos BiosecurID
Firmantes 4
Tiempo de Ejecución 3 minutos (2’)
Cantidad de Workers 60
Costo por Worker $0.03
Número de Actividades 4
Costo de Actividad Por Worker $0.12
Costo Total $7.20
Tabla 17
Resultados workers 60 workers
Worker ID F1 F2 F3 F4 F5 F6 F7 F8
A1EK1N6M8VCQ66 A FR A FR FR FR A FR
A1GR8T8TUTJO00 A A FA A A A A A
A1HL0NR9KG5Z0G A A FA FR A A A FR
A1O0BPP1U58KCW FA A FA FR A FR FA A
A1OP238L5ZBHZV A A FA A A FR A A
Tabla 18
Resultados Protocolo 3 100 workers
Tabla 19
Parámetros de configuración 500 workers
Parámetro Configuración
Base de datos BiosecurID
Firmantes 20
Tiempo de ejecución 3 minutos (2’)
Cantidad de workers 500
Costo por worker $0.03
Número de actividades 4
Costo de actividad por worker $0.12
Costo total $60
Tabla 20
Ejemplos resultados 500 workers
Worker ID F1 F2 F3 F4 F5 F6 F7 F8
A2122A7BZNUWXO A FR A FR FR A A FR
A25TGUQ8QEW9FJ FA A FA A A A FA FR
A2BA1R9MAHHWJH FA A FA A A A FA A
A2FW2A0XGWD73O FA A FA A A A FA A
A2U4H12NH6Z4QL A A A A A A FA FR
Tabla 21
Resultados 500 workers
indica que firmas genuinas están siendo rechazadas en una proporción similar
a las firmas falsificadas que están siendo aceptadas. Por lo tanto se sigue
observando que un workers por sí solo no es lo suficientemente hábil en el
reconocimiento de firmas manuscritas. Esto involucra que si combinamos las
respuestas de los workers podría tal vez existir una mejora.
25
20
FAR
15
70 % mejoramiento FRR
10
5
0
1 worker 3 5 7 10 20 30
workers workers workers workers workers
Número de workers
Tabla 22
Evolución FRR y FAR para 100 workers
20
FAR
15
FRR
10
5 80 % mejoramiento FRR
0
1 5 10 20 50 100 200 300 400 500
Número de workers
Tabla 23
Evolución FRR y FAR para 500 workers
Tabla 24
Rendimiento comparativo para 20 firmantes
Evolución FAR
40,00
35,00
30,00
FAR % 25,00
20,00
15,00
10,00
5,00
0,00
300
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
50
100
200
400
500
# etiquetadores / workers
Tabla 25
Rendimiento comparativo FAR
Combinación de
FAR FAR FAR
respuestas de
Manual Crowdsourcing DTW
Workers/etiquetadores
1 10,96 37,60 2,93
2 11,01 37,10 2,93
3 11,32 36,60 2,93
4 11,64 36,10 2,93
5 11,64 35,70 2,93
6 11,61 35,05 2,93
7 11,61 33,75 2,93
8 11,55 33,10 2,93
9 11,50 32,45 2,93
10 11,49 31,80 2,93
11 11,27 31,64 2,93
12 11,18 31,48 2,93
13 11,24 31,32 2,93
14 11,28 31,16 2,93
15 11,23 31,00 2,93
16 11,23 30,84 2,93
17 11,21 30,68 2,93
18 11,21 30,52 2,93
19 11,21 30,36 2,93
20 11,21 30,00 2,93
50 11,21 26,40 2,93
100 11,21 23,80 2,93
200 11,21 23,80 2,93
300 11,21 23,80 2,93
400 11,21 23,80 2,93
500 11,21 23,80 2,93
79
Evolución FRR
35,00
30,00
25,00
20,00
FRR %
15,00
10,00
5,00
0,00
6
1
2
3
4
5
7
8
9
10
11
12
13
14
15
16
17
18
19
20
50
100
200
300
400
500
# etiquetadores / workers
Tabla 26
Rendimiento comparativo FRR
Combinación de
FRR FRR FRR
respuestas de
Manual Crowdsourcing DTW
Workers/etiquetadores
1 9,46 31,40 2,92
2 9,15 28,56 2,92
3 9,16 25,72 2,92
4 9,31 22,88 2,92
5 9,33 17,20 2,92
6 9,22 15,90 2,92
7 9,26 14,60 2,92
8 9,16 13,30 2,92
9 9,13 12,00 2,92
10 9,11 13,20 2,92
11 9,01 12,95 2,92
12 8,95 12,70 2,92
13 8,96 12,45 2,92
14 8,96 12,20 2,92
15 8,96 11,95 2,92
16 8,91 11,70 2,92
17 8,88 11,45 2,92
18 8,88 11,20 2,92
19 8,88 10,95 2,92
20 8,88 10,40 2,92
50 8,88 8,10 2,92
100 8,88 7,00 2,92
200 8,88 7,00 2,92
300 8,88 7,00 2,92
400 8,88 7,00 2,92
500 8,88 7,00 2,92
5%
9% Dimensión
43% Patrón
6%
Patrón
5
4,5
índice de discriminabilidad
4
3,5
3
2,5
2
1,5
1
0,5
0
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13
Atributos
Random Skilled
Atributos
A1: Forma A4: Orden A9: Indecisión A12: Longitud de
los trazos
A2: Proporción A5: Signos de A10: Alineación A13: Espaciado
puntuación con la línea base de la grafía
A3: Bucles del A6-A8: A11: Inclinación
texto Embellecedores de los trazos
del texto
Figura 75 Atributos de las firmas
Atributos inspirados
Características Nuevas
en FDEs utilizados en
extraídas con características
la etiquetación
crowdsourcing discriminantes
manual
Área total
ocupada por la
Dimensión Proporción firma.
Perímetro
Proporcionalidad
Trazos de Presión del punto
Punto inicial y final
entrada/salida inicial y final
Conexión entre
Orden de la firma caracteres
Patrón Espaciado de la grafía Legibilidad
Forma del texto Área ocupada por
un caracter
Indecisión
Inclinación de los
trazos
Bucles del texto
Estilo de letras Signos de puntuación
Longitud de trazos
característicos
Embellecedores del
texto
Desplazamiento en Alineación con la línea
los ejes x e y base
Figura 76 Características, atributos y nuevas características
discriminantes
CAPÍTULO V
5.1. Conclusiones
REFERENCIAS