Sunteți pe pagina 1din 4

MINERA DE DATOS

Diplomatura en enfoques integrados de inteligencia de negocios: Gestin y tecnologas.


Universidad Eafit

Mdulo: Minera de Datos


Candidato a Magister en Ciencias Estadsticas - Gustavo Valencia Z

Presentacin:
Las tcnicas de Minera de Datos hoy en da son consideradas una herramienta
tecnolgica para la toma de decisiones y descubrimiento de nuevo conocimiento en los
escenarios de la industria y la investigacin. Por medio de la minera de datos se destaca
la gran importancia de la informacin como activo estratgico y lo esencial de un
adecuado anlisis para lograr identificar la tan anhelada ventaja en los negocios y/o
innovacin investigativa. La Minera de Datos enmarca un completo conjunto de
tcnicas que buscan la extraccin de conocimiento de diversas fuentes de informacin;
este conocimiento oculto entre millones de registros, es lo que anlogamente se
llamaran minerales preciosos que brindaran a las organizaciones grandes ventajas
competitivas.

Objetivo:
Presentar los fundamentos y tcnicas principales de la Minera de Datos. El mdulo
consta de cinco partes. Las dos primeras proporcionan una motivacin e introduccin a
la materia. Las tres partes siguientes son de corte tcnico, al tratar algunos conceptos
bsicos estadsticos y diversas tcnicas de modelacin por medio de aplicativos de
minera de datos.
La asignatura no tiene ninguna otra asignatura como prerrequisito ni cuenta con
recomendaciones sobre conocimientos previos.

V03-20130401

Temario del mdulo:


Competencias especificas
El alumno comprender los conceptos ms relevantes en
el campo de la DM y ser capaz de disear modelos
bsicos para problemas especficos.
El alumno ser capaz de conocer las metodologas ms
relevantes de DM y aplicarlas en problemas especficos.
El alumno ser capaz de reconocer algunas de las
principales herramientas de DM y desarrollar modelos
bsicos para las principales situaciones de negocio.
Bloque temtico
I.
Motivacin
II.

Introduccin

Tema
Tema 1. Aplicacin de la
DM en la industria
Tema 2. Conceptos Bsicos
Tema 3. Que no es DM
Tema 4. Clasificacin de
tcnicas de DM

III.
IV.
V.

Metodologas de
DM
Conceptos
estadsticos
Minera de datos
aplicada

Tema 5. Tipos de
metodologas
Tema 6. Conceptos
estadsticos
Tema 7. Tipos de
herramientas
Tema 8. Entender y preparar
los datos
Tema 9. Modelado y
evaluacin
Tema 10. Minera de texto
Tema 11. Web Data Mining

Instructor:
Gustavo A Valencia Z
www.gustavovalencia.com
academics@gustavovalencia.com
Candidato a Magister en Ciencias Estadsticas
Especialista en Estadstica
Especialista en Gerencia para Ingenieros
GIAC Analista certificado en computacin Forense
Ingeniero Electrnico
V03-20130401

Apartados
Algunas situaciones de
negocio a resolver.
Definicin e historia de la
Minera de Datos.
Errores comunes sobre DM.
Tcnicas ms populares y su
clasificacin segn
situaciones a resolver.
Metodologas CRISP-DM y
SEMMA.
Algunos conceptos
estadsticos de apoyo.
Herramientas de minera de
datos en la industria y la
investigacin.
Anlisis descriptivo.
Operacin con campos y
registros.
Modelos predictivos, de
segmentacin y asociacin.
Conceptos bsico-tericos.
Conceptos bsico-tericos.

Trayectoria del Instructor:


Sus estudios de Maestra en Ciencias Estadsticas los ha realizado en la Universidad Nacional de
Colombia, sede Medelln, donde actualmente est en la etapa de finalizacin y entrega del
trabajo de grado titulado: Modelo Estadstico para dosificacin de escaneo de antivirus.
Aplicacin a un Sistema de Informacin Bancaria.
Cuenta con ponencias internacionales en WORLDCOMP, (The World Congress in Computer
Science, Computer Engineering, and Applied Computing), Las Vegas, USA; donde en
conferencias de Minera de datos y Seguridad ha expuesto sus investigaciones.
Cuenta con la certificacin Internacional, GIAC Certified Forensic Analyst (GCFA) (Analista
certificado en computacin forense) de Sans Institute, USA.
Es especialista en Estadstica de la Universidad Nacional de Colombia, sede Medelln, con el
trabajo de grado titulado: Creacin de roles en un sistema de informacin Bancario por medio de
anlisis de conglomerado bietpico. Igualmente cuenta con estudios de especializacin en
Gerencia para Ingenieros de la Universidad Pontificia Bolivariana, Colombia, con el artculo: La
minera de datos como herramienta para la toma de decisiones estratgicas.
Es Ingeniero Electrnico de la Universidad Pontificia Bolivariana (Colombia).
Durante los ltimos 7 aos ha asistido a mltiples entrenamientos y capacitaciones nacionales
(Colombia) e internacionales (USA) relacionados con herramientas de minera de datos tales
como IBM SPSS Modeler y SAS Enterprise Miner. Igualmente ha asistido a congresos y talleres
internacionales relacionados a minera de datos, tal es el caso de The 2012 International
Conference on Data Mining, 11th International Conference on Security and Management,
Predictive Analytics World 2011 y M2010 Data Mining Conference SAS. Durante los ltimos 7
aos ha asistido a mltiples cursos a nivel nacional (Colombia) relacionados a tpicos de
Seguridad de TI y prevencin del fraude, tales como: aseguramiento de bases de datos, sistemas
operativos, computacin forense entre otros.
Durante 7 aos fue parte del equipo de Seguridad del Grupo Bancolombia, donde con tcnicas de
inteligencia analtica y minera de datos desarroll modelos para incrementar la seguridad de la
compaa, en tpicos como la prevencin del fraude, control de riesgos, seguridad fsica y de TI,
control de acceso lgico y aseguramiento de plataformas, aplicativos y bases de datos.
Actualmente hace parte del grupo de investigacin en Estadstica de la Universidad Nacional de
Colombia, sede Medelln, grupo catalogado nivel A1 por Colciencias. Es docente de los siguientes
cursos:

Fundamentos de Inferencia Estadstica. Facultad de Ingeniera. Universidad Pontificia


Bolivariana.
Visualizacin de Informacin. Especializacin en Inteligencia de Negocios. Universidad
Pontificia Bolivariana.
Minera de datos. Diplomatura en enfoques integrados de inteligencia de negocios: Gestin
y tecnologas. Universidad Eafit.
Visualizacin de Informacin. Diplomatura en enfoques integrados de inteligencia de
negocios: Gestin y tecnologas. Universidad Eafit.
Inteligencia de Negocios. Especializacin en Sistemas de Informacin. Universidad Eafit.

V03-20130401

Bibliografa:
A continuacin se esbozan algunos de las referencias bibliogrficas representativas. Sin
embargo, en el transcurso del mdulo cada sesin detallada las referencias por temas. El
compendio completo de las referencias puede ser consultado en el archivo Referencias Minera
de Datos.pdf.
Prez, L. Minera de datos: Tcnicas y herramientas, 2007. Thomson.
SPSS. Introduccin a Clementine, 2008, SPSS.
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C. and Wirth R. CRISP-DM 1.0,
2007. SPSS
Johnson, R. and Wichern, D. Applied Multivariate Statistical Analysis, 1998. Prentice Hall
Torgo, L. Data Mining with R: Learning with Case Studies, 2011. Chapman & Hall/CRC.
SAS. Getting Started with SAS Enterprise Miner 6.1, 2009. SAS Publishing
Kuma V, Next Generation of Data Mining, 2009. Chapman & Hall/CRC.
Witten, I. and Frank, E. Data Mining: Practical Machine Learning Tools and Techniques, 2005. Morgan
Kaufmann
Liu, B. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, 2007. Springer
Olson, D. & Delen, D. Advanced Data Mining Techniques, 2008. Springer
Fayyad U, Grinstein G & Wierse A. Information Visualization in Data Mining and Knowledge Discovery
Morgan Kaufmann Series in Data Management Systems, 2002. Elsevier.
Taniar, D. Data Mining and Knowledge Discovery Technologies, 2008 .IGI
Conover W. J. Practical Nonparametric Statistics, 1999. Jhon Wiley & Son, Inc.
Walpole, R. Probalilidad para ingeniera y ciencias. Pearson, 2007.

V03-20130401

S-ar putea să vă placă și