Sunteți pe pagina 1din 22

A principios de los aos ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar

los trminos de Minera de Datos y KDD. Esta tecnologa ha sido un buen punto de encuentro entre personas pertenecientes al mbito acadmico y al de los negocios.

Evolucin Coleccin de datos (Aos 60) Acceso a datos. (Aos 80) Data Warehouse y soporte a la toma de decisiones. (Aos 90) Data Mining (1995)

Cada vez es ms frecuente el almacn de informacin en bases de datos como en:


Data Warehouse Empresas de Marketing Escuelas Gobierno

La bsqueda tradicional de datos se realiza mediante anlisis estadsticos. A finales de los 80s la estadstica se ampli a tcnicas como lgica difusa, razonamiento heurstico y redes neuronales. Actualmente, las tcnicas anteriores se aprovechan para generar conocimiento.

La Minera de Datos es la extraccin automtica de informacin predictiva escondida desde bases de datos. La Minera de Datos estudia mtodos y algoritmos que permiten la extraccin automtica de informacin sintetizada que permite caracterizar las relaciones escondidas.

El Data Mining (DM) es un conjunto de tcnica de anlisis de datos que permiten: Extraer Patrones, Tendencias y Regularidades para describir y comprender mejor los datos.

Extraer Patrones y Tendencias para predecir comportamientos futuros.

Un proyecto de minera de datos tiene varias fases necesarias que son, esencialmente: Comprensin del negocio y del problema que se quiere resolver. Determinacin, obtencin y limpieza de los datos necesarios. Creacin de modelos matemticos. Validacin, comunicacin, etc. de los resultados obtenidos. Integracin, si procede, de los resultados en un sistema transaccional o similar.

El entorno de la minera de datos suele tener una arquitectura cliente servidor. La minera de datos produce cinco tipos de informacin: Asociaciones. Secuencias. Clasificaciones. Agrupamientos. Pronsticos. Los mineros de datos usan varias herramientas y tcnicas. En algunos casos, los datos se consolidan en un almacn de datos

Explorar los datos que se encuentran en las profundidades de las bases de datos.
Predecir futuras tendencias y comportamientos , permitiendo en los negocios la toma de decisiones.

En las aplicaciones de la Minera de Datos se hace sobre datos previamente recolectados. Los datos no cambian mientras estn siendo analizados. Por lo que los datos generados son confiables y consistentes para stos datos.

La Minera de Datos y las Bases de Datos comerciales estn disponibles para resolver problemas de decisin de negocios.
La Minera de Datos es una tecnologa que ayuda a enfocarse en la informacin ms importante en los almacenes de datos.

Las Herramientas de la Minera de Datos:


Predicen

tendencias futuras y comportamientos. Pueden responder a preguntas que consumaran demasiado tiempo para resolverlas.

La automatizacin, herramientas tpicas de decisin.

provee soporte de

Las Herramientas obtienen de las bases de datos patrones escondidos.


Las Tcnicas de la Minera de Datos pueden ser implementadas rpidamente en software y en las plataformas de hardware existente. Las Herramientas de Minera de Datos pueden ser implementadas en plataformas cliente-servidor o computadoras de procesamiento paralelo.

Las Tcnicas de la Minera de Datos son el resultado de un largo proceso de investigacin y desarrollo de productos. La Minera de Datos esta soportada por tres tecnologas que son lo suficientemente maduras: Coleccin masiva de datos. Computadoras con multiprocesamiento. Algoritmos de minera de datos.

Las tcnicas para la Minera de Datos son:


Redes Neuronales Artificiales.

rboles de Decisin.
Algoritmos Genticos. Modelos Lineales.

La Minera de Datos ha surgido del potencial del anlisis de grandes volmenes de informacin. Su fin es obtener resmenes y conocimiento para la toma de decisiones. Adems se pretende construir experiencia a partir de millones de transacciones.

Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automtico inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin de neuronas en una red que colabora para producir un estmulo de salida. Algunos ejemplos de red neuronal son: El Perceptrn. El Perceptrn multicapa. Los Mapas Autoorganizados, tambin conocidos como redes de Kohonen.

rboles de decisin.- Un rbol de decisin es un modelo de prediccin utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema. Ejemplos:
Algoritmo ID3. Algoritmo C4.5.

Algunas de las aplicaciones de la Minera de Datos son:


Compaias Farmaceuticas. Compaias de crdito. Compaias de transporte. Compaias de consumo. Reacciones qumicas. Comercio, monitoreo.

En Internet E-bussines: Perfiles de clientes, publicidad dirigida, fraude. Buscadores Inteligentes: Generacin de jerarquas, bases de conocimiento web. Gestin del Trfico de la Red: Control de e>ciencia y errores. El Mundo de los Negocios Banca: Grupos de clientes, prstamos, oferta de productos. Compaas de Seguros: Deteccin de fraude, administracin de recursos. Marketing: Publicidad dirigida, estudios de competencia. En Mundo de la Ciencias Meteorologa:Teleconexiones (asociaciones espaciales), prediccin. Fsica: Altas energas, datos de colisiones de partculas (bsqueda de patrones). Bio-Informtica: Bsqueda de patrones en ADN, proyectos cient>cos como genoma humano, datos geofsicos, altas energas, etc.

Facilidad con que se puede caer en una falsa interpretacin. Es fcil equivocarse.
Tiempo y espacio. Privacidad

BD

Datos

Seleccin

Preprocesado

Seleccin de caractersticas

Extraccin de conocimiento

Evaluacin

Modelo clasificador

S-ar putea să vă placă și