Documente Academic
Documente Profesional
Documente Cultură
INTEGRANTES
Muoz Cisneros Luis
Tijero Urbano Luis Erick
Pea Jacobo Fabian
Chauca Marcos Yerson
Dominguez Mendoza Delfor
Tipacti Cornejo Pedro
MINERA DE DATOS
Contenido
1.
2.
3.
4.
2.1.
REDES NEURONALES:.......................................................................................................... 3
2.2.
2.3.
2.4.
2.5.
2.6.
REGLAS DE ASOCIACION:.................................................................................................... 4
3.2.
3.3.
APLICACIONES............................................................................................................................. 5
6.
7.
RAPIDMINER ....................................................................................................................... 8
7.2.
7.3.
MINERA DE DATOS
MINERIA DE DATOS
1. MINERIA DE DATOS
Extraccin de conocimiento en grandes bases de datos.
La minera de datos o exploracin de datos es un campo de la estadstica y
las ciencias de la computacin referido al proceso que intenta descubrir patrones
en grandes volmenes de conjuntos de datos. El objetivo general del proceso de
minera de datos consiste en extraer informacin de un conjunto de datos y
transformarla en una estructura comprensible para su uso posterior. Adems de
la etapa de anlisis en bruto, que involucra aspectos de bases de datos y
de gestin de datos, de procesamiento de datos, del modelo y de las
consideraciones de inferencia, de mtricas de Intereses, de consideraciones de
la Teora de la complejidad computacional, de post-procesamiento de las
estructuras descubiertas, de la visualizacin y de la actualizacin en lnea.
La tarea de minera de datos real es el anlisis automtico o semi-automtico de
grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (anlisis clster), registros
poco usuales (la deteccin de anomalas) y dependencias (minera por reglas de
asociacin). Esto generalmente implica el uso de tcnicas de bases de datos
como los ndices espaciales.
MINERA DE DATOS
2.1.
REDES NEURONALES:
2.2.
REGRESION LINEAL:
2.3.
ARBOLES DE DECISION:
2.4.
MODELOS ESTADISTICOS:
2.5.
AGRUPAMIENTO O CLUSTERING:
MINERA DE DATOS
2.6.
REGLAS DE ASOCIACION:
3.2.
MINERA DE DATOS
3.3.
4. APLICACIONES
MINERA DE DATOS
5.1.
MINERA DE DATOS
MINERA DE DATOS
RAPIDMINER
En la encuesta anual (2015) del prestigioso portal internacional de Minera de Datos KDnuggets
(www.KDnuggets.com), RapidMiner obtuvo el segundo lugar (despes de R) como la
herramienta de Data Mining ms utilizada por expertos en DataMining.
MINERA DE DATOS
7.2.
RapidMiner Studio: Versin stand-alone para analistas. Implementa todos los operadores de data
mining, modelos predictivos, modelos descriptivos, transformacin de datos, series de tiempo, etc.
RapidMiner Server: Versin Servidor de RapidMiner. Permite trabajo colaborativo, escalable y
concurrente mltiples usuarios, capacidad de delegar en bases de datos (In-Database Mining) y
otras mejoras de funcionalidad como: plataforma Web de publicacin de reportes, implementacin
de sistemas de scoring, diseo y navegacin Web de de Reportes, Single-sign on, integracin va
Servicios Web, entre otras.
7.3.
Este proceso comienza con la carga de datos. Despus de finalizar el operador de entrada se realiza
un tpicopaso de aprendizaje. Aqu se utiliza una implementacin de un aprendiz de rbol de decisin
que tambinpuede manejar valores numricos (similar al muy conocido algoritmo C4.5).
Cada operador puede requerir algunas entradas y entrega algunas salidas. Estos tipos de entrada y
salida sepasan entre los operadores. En este ejemplo el primer operador "Input" no requiere ninguna
entrada yentrega un conjunto de ejemplos como salida. Este conjunto de ejemplos es tomado por el
aprendiz, el cualentrega la salida final: el modelo aprendido.
Debido a que este flujo de datos es lineal, el diseo del proceso se denomina cadena de
operadores. Msadelante veremos procesos ms sofisticados en la forma de rbol de operadores.
1. En el panel izquierdo seleccionar la pestaa Operators. Luego seleccionar el
operador RepositoryAccess Retrieve y arrastrarlo a la zona de trabajo.
2. En la pestaa Parameters del panel derecho, utilizar el navegador a la derecha del parmetro
repository entry para localizar el archivo //Samples/data/Golf.
MINERA DE DATOS
4. Conectar la salida del operador Retrieve a la entrada del operador Decision Tree, haciendo clic
izquierdoen el conector out (output, salida) del primero y luego otro clic en el conector tra (training
set, conjunto deentrenamiento) del segundo.
5. De la misma forma, conectar la salida mod (model, modelo) del operador Decision Tree al
puerto res dela zona de trabajo.
10
MINERA DE DATOS
11
MINERA DE DATOS
En este ejemplo se construy un Modelo Predictivo para saber si se debera jugar o no al tenis, en
base a los datos recogidos de experiencias anteriores. Para ver estos datos hacer doble clic sobre
la tabla Golf de lapestaa Repositories de la derecha. Aparece otra pestaa entre las pestaas
Result Overview y Tree(Decision Tree) de la vista de resultados, denominada ExampleSet
(//Samples/data/Golf). Seleccionar laopcin Data View.
12
MINERA DE DATOS
13