Sunteți pe pagina 1din 12

Maestra Ciencias de la computacin.

Minera de datos

IDENTIFICACION DE OPERACIONES
FRAUDULENTAS POR DIFERENTES
CANALES DE PAGO EN EMPRESA DE
ENTRETENIMIENTO

Autores:
Henry Martnez
Pablo Castillo
Caracas, 07 de Marzo del 2017
Proceso de minera de datos empleado:
CRISP DM
Fase I. Comprensin del Negocio
1.1 Contexto Inicial
Empresa de
entretenimiento

Canales de venta

Web Aplicacin Mvil Autoservicio Taquilla

El problema actual es que diferentes usuarios emplean el mismo instrumento de pago por diferentes
canales y de manera muy repetitiva, con diferentes correos electrnicos inclusive.
Fase I. Comprensin del Negocio

1.2 Objetivo del Negocio


Determinar registros con referencias de valores y uso anormal de las tarjetas de crdito
por los distintos canales de venta con el fin de obtener las posibles operaciones de
fraude.

1.3 Criterios de xito


Dada la complejidad de la operacin, desde el punto de vista del negocio se establece
como exitoso la posibilidad de poder determinar las referencias de uso con un aceptable
porcentaje de fiabilidad de 75%, de forma tal que se pueda emitir un reporte y enviar al
procesador de tarjetas para evaluacin y posible bloqueo a travs de los canales de venta.
Fase I. Comprensin del Negocio
2. Evaluacin de la situacin

2.1 Inventario de los recursos


Software: Weka, base de datos SQL Server, Microsoft Excel.
Hardware: equipo servidor en la nube Microsoft Azure. Pc Core I3. 12
GB de RAM.
Fuente de datos es una base de datos SQL Server con la informacin
de las operaciones desde el ao 2011 hasta el 2017.

2.2 Requerimientos, supuestos y limitaciones


Limitacin legal de acceso a los datos de las tarjetas de crdito, dbito.
Fase I. Comprensin del Negocio

2.3 Riesgos y contingencias


En caso de problemas de procesamiento de datos, se emplear un servidor
de procesamiento en la nube Microsoft Azure.

2.4 Terminologas propias del negocio


Los trminos son comunes no se detallaran.

2.5 Costo y Beneficios


Dado que el propsito de este proyecto es de fin acadmico no se obtiene ningn valor
monetario por la ejecucin del mismo, pero si el beneficio de obtener una solucin
aproximada a un problema empleando tcnicas y herramientas de ltima generacin
Fase I. Comprensin del Negocio
3. Objetivos de la Minera de Datos
3.1 Objetivos

Para lograr el objetivo de la minera de datos, se emplearn tcnicas descriptivas


empleando mtodos de agrupamiento (clustering) para luego detectar anomalas o
desviaciones.
Por lo cual se plantean los siguientes objetivos:

Identificar aquellas variables que permitan determinar las operaciones de fraude.


Determinar y detectar registros con referencias de valores y uso anormal que puedan
determinar que tarjetas de crdito y debito estn siendo empleadas para realizar
operaciones de fraude a travs de los diferentes canales de ventas.
Proporcionar un reporte con el listado de las posibles tarjetas, para enviarlas al canal
de pago, para su posterior anlisis y bloqueo.
Fase I. Comprensin del Negocio
3. Objetivos de la Minera de Datos
3.2 Criterios de xito

Desde el punto de vista de la minera de datos se establece como criterio de xito la


posibilidad de describir que tarjetas se estn empleando para cometer operaciones de
fraude, por lo cual, se define un porcentaje de fiabilidad de 75%. El grado de fiabilidad lo
determinar el algoritmo especifico que se emplee para conseguir el modelo de la
minera de datos.
Fase I. Comprensin del Negocio

4. Generacin del plan del proyecto

4.1 Plan.
Etapa 1: Anlisis de la estructura de los datos, toma de informacin.
Etapa 2: Construccin de consultas en lenguaje SQL para obtener las muestras.
Etapa 3: Preparacin de los datos, seleccin, limpieza, conversin, formateo de ser necesario,
con el propsito de tener los datos preparados.
Etapa 4: Seleccin y aplicacin de las tcnicas para obtener el modelo.
Etapa 5: Anlisis de los resultados y posible repeticin de la etapa 4.
Etapa 6: Desarrollo de las pantallas e interfaces a bases de datos con el modelo
que se obtuvo en la etapa 4.
Etapa 7: Presentacin de los resultados.

4.2 Herramientas, equipo y tcnicas


Weka, SQL Server
Fase II. Comprensin de los datos

1. Recopilacin inicial de los Datos

Los datos empleados para este proyecto son basados en operaciones de venta realizadas a
travs de los diferentes canales de atencin. Existe un impedimento legal con respecto a
la informacin detallada de los datos de las tarjetas de crdito, por ello, slo podemos
usar la respuesta que proporciona el punto de venta.

Los datos que se emplearan consisten en las tablas:

Detalle de ventas: Representa la tabla la cual tiene el detalle de la venta realizada, cada operacin est
identificada por un cdigo.
Transaccin de pago: Cada operacin est identificada por el cdigo de pago.
Usuarios: Cada usuario est identificado por su cdigo.
Canales de venta: Cada canal de venta est identificado por un cdigo.
Fase II. Comprensin de los datos

Atributos especficos aplicados en la tarea de Minera de Datos

1. Identificador del usuario


2. Identificador de la operacin de venta
3. Fecha y hora de la operacin de venta
4. Canal de venta
5. Nmero de tarjeta.
6. Tipo de tarjeta.

Las tablas en la que se almacenan los datos necesarios para la realizacin de la tarea de minera de datos
son:
Detalle de ventas
Transaccin de pago
Usuarios
Canales de venta
Fase II. Descripcin de los datos
Login

Login de los usuarios


Longitud: 27 campos
tblClient Se tienen 30000 Reg
tblOrderHistory

Contiene los diferentes Tiene el detalle de la


canales de venta. Venta, nos permite
Longitud: 10 campos relacionar login con el
Se tienen 5 Reg tblTrans_Cash tblTransTicket correo del usuario
Longitud: 93 campos
Se tienen 30000 Reg

Tiene el historial del pago Contiene todas las ventas


para la venta o reembolso. y reembolsos de boletera.
Longitud: 45 campos Longitud: 37 campos
Se tienen 30000 Reg Se tienen 30000 Reg

tblTransInventory tblPaymentHistory

Contiene todas las ventas y Contiene todas las operaciones


reembolsos de concesiones con sus mtodos de pago.
Longitud: 63 campos Longitud: 33 campos
Se tienen 30000 Reg Se tienen 30000 Reg

S-ar putea să vă placă și