Documente Academic
Documente Profesional
Documente Cultură
en la Toma de Decisiones
Presentan:
Miguel Angel Reyes Roque
Ricardo Herrera Martínez
CONTENIDO
Índice
Descripción del tema _____________________________________________________________1
Descripción de Datos _____________________________________________________________4
Análisis exploratorio. _____________________________________________________________5
Modelos iniciales ________________________________________________________________9
Resultados ____________________________________________________________________11
Información de contacto ________________________________ Error! Bookmark not defined.
Información de la compañía ______________________________ Error! Bookmark not defined.
WEKA
SITUACIÓN ACTUAL
Las campañas de Marketing son de vital importancia para cada una de las organizaciones que pretenden crecer,
mantener o concretizar sus ventas. Así, en la industria de la banca se presentan campañas que buscan que los
usuarios de servicios financieros, como créditos o adquisición de tarjetas, sean clientes potenciales que no
busquen nuevos servicios de la competencia.
Para poder medir la penetración de nuevos servicios bancarios se generan multiples estudios y se generan
estadísticas que determinen la aprobación o desaprobación del servicio dentro de la cartera de sus clientes.
El principal problema que se deberá resolver es si el servicio que se pretende brindar será o no contratado por los
clientes ya que en caso de que no sea factible venderlo se podrían perder millones de dólares de inversión. Los
datos fueron obtenidos de llamadas realizadas del Call Center del área de marketing del Banco en cuestión.
OBJETIVO
Este estudio se genera con el objetivo de medir la eficacia de ventas vía telemarketing para fondos de inversión a
largo plazo, pronosticando si este servicio va a ser contratado o no (variable dependiente) por el cliente mediante
un modelo predictivo de Minería de Datos y con ello resolver la problemática de lanzar o no el servicio al
mercado.
Los resultados esperados serán poder determinar si será rentable la salida al mercado del servicio, los beneficios
esperados a obtener serán las posibles ganancias que se generen si el producto es viable.
Páginá 1
WEKA
PROCESO
A continuación se presenta en forma general el proceso para el Análisis de Minería.
Páginá 2
WEKA
a) Si el valor es categórico o numérico y puede ser inputado mediante un método de clasificación (árbol de
decisión, Análisis discriminante, Regresión logística, etc) entonces el dato se agregará de esa forma.
b) Si el valor no puede inputarse como en el inciso anterior entonces se procederá a realizar un análisis
estadístico de la serie (en caso de valores numéricos) y se determinará si se inputa algún valor con sentido.
c) En caso que no se puedan realizar los incisos anteriores se estudiará si se inputa un valor NaN (valor no
válido) o si se elimina el registro de la base.
a) Series Numéricas
1) Media, Moda, Mediana
2) Varianza
3) Kurtosis
4) Sesgo
5) Distribución
6) Cuartiles
b) Series No Numéricas
1) Repeticiones
2) Valores Nulos
3) Categorías
4) Patrones
Páginá 3
WEKA
Descripción de Datos
Información y descripción de Variables.
Fuente:
Páginá 4
WEKA
Análisis exploratorio.
EDAD
Análisis descriptivo:
Edad
Media 40.9 Edad
Error típico 0.05 1200
Mediana 39.0 1000
Moda 32.0 800
Desviación estándar 10.6
600
Varianza de la muestra 112.8
400
Curtosis 0.3
200
Coeficiente de asimetría 0.7
0
Rango 77.0
y mayor...
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
Mínimo 18
Máximo 95
Cuenta 45,211
MARITAL
En un primer acercamiento a la concentración del estado civil podemos observar que de toda nuestra
información, el 28.29% se encuentra en single, sin embargo de aquellos que si contratarían el servicio
tenemos un 36.15% es decir, está por arriba de la media general, lo cual indica que puede ser un
factor para contratar el servicio.
Páginá 5
WEKA
Distribución "marital"
EDUCATION
Análogamente a la concentración del nivel de educación podemos observar que de toda nuestra
información, el 28.42% se encuentra en tertiary, sin embargo de aquellos que si contratarían el
servicio tenemos un 37.74% es decir, está por arriba de la media general, lo cual indica que puede
ser un factor para contratar el servicio.
Distribución "education"
Páginá 6
WEKA
JOB
Análogamente a la concentración del nivel de educación podemos observar que de toda nuestra
información, el 20.92% se encuentra en management, sin embargo de aquellos que si contratarían el
servicio tenemos un 24.60% es decir, está por arriba de la media general, lo cual indica que puede
ser un factor para contratar el servicio.
Distribución "job"
Páginá 7
WEKA
MONTH
Análogamente a la concentración del mes en cual fue contactado, podemos observar que de toda
nuestra información, febrero, marzo y abril, septiembre, octubre y noviembre tienen una mayor
concentración de aquellos que si contratarían el servicio por arriba de la media general, lo cual indica
que puede ser un factor para contratar el servicio.
month
16000
14000
12000
10000
8000
6000
4000
2000
0
jan feb mar apr may jun jul aug sep oct nov dec
Páginá 8
WEKA
Modelos iniciales
PRELIMINARES
- Carga de base
- Eliminar las variables “day” y “pdays”
- Tomar el J48 con los siguientes parámetros:
Páginá 9
WEKA
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
Weighted Avg. 0.900 0.566 0.886 0.900 0.888 0.428 0.806 0.900
a b <-- classified as
38792 1130 | a = no
Páginá 10
WEKA
Resultados
TITULO 1
Páginá 11
WEKA
Anexos
=== Run information ===
Relation: bank-full-weka.filters.unsupervised.attribute.Remove-R10,14
Instances: 45211
Attributes: 15
age
job
marital
education
default
balance
housing
loan
contact
month
duration
campaign
previous
poutcome
Páginá 12
WEKA
------------------
| poutcome = success
| | poutcome = unknown
| | | | contact = unknown
Páginá 13
WEKA
Number of Leaves : 27
Páginá 14
WEKA
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
Weighted Avg. 0.900 0.566 0.886 0.900 0.888 0.428 0.806 0.900
a b <-- classified as
38792 1130 | a = no
Páginá 15