Sunteți pe pagina 1din 3

Programa

PROGRAMA DE CURSO

CURSO : Minería de Datos / Data Mining


SIGLA : INP3430
CRÉDITOS : 10 UC/6 SCT
CARÁCTER : Optativo
MÓDULOS : 2
REQUISITOS : Curriculo 041501 o Alumno posgrado UC
Autorización profesor.
DISCIPLINA : Ingeniería

I. DESCRIPCION

Este curso busca dar a conocer las principales teorías y prácticas de la Minería de
Datos comprendiendo sus
potencialidades y limitaciones. Los conocimientos adquiridos son aplicables a la
creación de programas
capaces de extraer conocimiento relevante desde bases de datos y permitirán conocer
algunas de las
principales aplicaciones en que estas técnicas han alcanzado una amplia aceptación.

II. OBJETIVOS

1. Diseñar soluciones a problemas reales de minería de datos, mediante la


elaboración de modelos
capaces de resolver problemas actuales que involucren el análisis de
información.
2. Conocer y aplicar herramientas de software gratuito a tareas concretas de
obtención de información
desde bases de datos.

III. CONTENIDOS

1. El concepto y proceso de Minería de Datos, tipos de problemas en que la Minería


de Datos es
relevante.
2. Data Warehouse y OLAP: Arquitecturas, implementaciones, aplicaciones en Minería
de Datos.
3. Prepa
transformaciones, integración e inconsistencias.
4. Reducción de la Información (Análisis de las Componentes principales)
5. Reglas de Asociación (Algoritmo Apriori, Fp-growth)
6. Clasificación:
6.1.
6.2. Naive Bayes.
6.3. Razonamiento en Base a casos (KNN, Locally Weighted Regression.).
7. Clustering
7.1. Clustering particional: K-Means, Mean Shift, EM-GMM, BIRCH y otros.
7.2. Medidas de similaridad para distintos tipos de datos.
7.3. Clustering aglomerativo.
8. Selección de Modelos (Hold Out, Cross Validation, Bootstrapping.).
9. Métodos de Selección de Variables: Filter, Wrappers, Correlation Based Feature
Selection,
10. Relief and ReliefF algorithms. Toward Optimal Feature Selection..
11. Métodos Avanzados y aplicaciones.
11.1. Visualización.
11.2. Minería de texto.
11.3. Detección de Anomalías.

PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE


DPTO. CIENCIA DE LA COMPUTACIÓN, ESCUELA DE INGENIERÍA / Diciembre 2012

IV. METODOLOGIA

- Clases expositivas.
- Actividades prácticas.
- Lecturas individuales.

V. EVALUACION

- 2 Controles 60%
- Actividades de laboratorio 40%

VI. BIBLIOGRAFIA

Berry, M. and Linoff, G., " M T q M S d


Customer
S pp " W 2004 (T á )

Berson, A., Thearling, K., and Smith, S. "B Data Mining Applicat CRM" M G
H
2000.

Dyche, J., " -Data: Turning I W


"
Addisson Wesley, 2000.

Han, J and Kamber M. "Data mining:Concepts T q " M K


2005.

Hastie T., Tibshirani R., and Friedman J. "T S L M ,


Inference,
P " Sp 200 .
Inmon, W.H., "B W " J Wiley and
Sons; 3th edition,
2005.

Kimball, R. and Ross, M. "T p


mode " J W S 2011.

Mitchell T. M. "Machine Learning", McGraw Hill, 1997 (Texto


clásico)

Witten, I H., Eibe,F., and Hall, M. "Practical Machine Learning Tools and Techniques"
M
Kauffman, 2011

PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE


DPTO. CIENCIA DE LA COMPUTACIÓN, ESCUELA DE INGENIERÍA / Diciembre 2012

S-ar putea să vă placă și