Sunteți pe pagina 1din 7

Instituto Tecnolgico de Mrida

Ingeniera en Sistemas Computacionales

Anlisis y Extraccin
Minera de datos, KDD

Evert Emmanuel Snchez Aguilar

Grupo: 9SF

Mrida Yucatn 31 Agosto del 2012

ANLISIS DE MINERA DE DATOS KDD


Minera de datos es una etapa (de anlisis) del Knowledge Discovery in Databases el cual se podra traducir como Descubrimiento de conocimiento en bases de datos. Es un campo muy extendido en sistemas computaciones; en donde se trata de descubrir conocimiento nuevo a partir de grandes conjuntos de datos almacenados histricamente, se pueden descubrir patrones, recurrencias, desviaciones. Para llegar a estos datos se utiliza varios mtodos de inteligencia artificial, aprendizaje automtico, estadstica, bases de datos. La meta del proceso de Minera es la destilacin de la informacin de un conjunto de datos convirtindola en una estructura comprensible para su uso posterior <la carnita de la informacin>. Como un anlisis involucra muchos aspectos de bases de datos y gestin de datos como tambin procesamiento de datos, modelo y consideraciones de inferencia, mtrica de intereses, como tambin consideraciones de la teora de la complejidad computacional, post-procesamiento de estructuras descubiertas, incluyendo a la visualizacin y la actualizacin en lnea. Por tratarse de un trmino de moda este puede ser frecuentemente mal utilizado, ya que pueden utilizarlo para describir cualquier forma de datos a gran escala o de procesamiento de informacin. Por otra parte tambin es utilizado como sistema de apoyo de informacin (IA). No hay que olvidar que el trmino clave es descubrir conocimiento. Pero, Qu tareas hace la Minera de Datos? Fcil! Hace un anlisis automtico (a veces semiautomtico), de extensas cantidades de datos para extraer patrones de datos desconocidos hasta el momento. Engloba Anlisis Clster, Deteccin de Anomalas y Asociacin Minera Regla. Todos esos patrones encontrados pueden usarse como una especie de resmenes de datos de entrada para despus poder ser procesado (Analizndolo). Hay que tomar en cuenta que la recoleccin de datos, preparacin de datos, interpretacin de los resultados y la informacin no son parte de la etapa de minera de datos, pero si pertenecen al KDD como pasos adicionales.

PROCESO DE MINERA DE DATOS


1. 2. 3. 4. 5. 6. Seleccin del conjunto de datos Anlisis de las propiedades de los datos Transformacin del conjunto de datos de entrada Seleccionar y aplicar la tcnica de minera de datos Extraccin de conocimiento Interpretacin y evaluacin de datos

Estos son los pasos que tiene la minera de datos. El primer paso Seleccin del conjunto de datos" trata de estableces las variables objetivo como pueden ser el predecir, calcular o inferir. Tambin incluyen a las Variables Independientes que son los procesos para llegar al clculo. Como segundo paso tenemos el Anlisis de las propiedades de los datos aqu los actores principales son los histogramas, diagramas de dispersin, valores atpicos y valores nulos.

Tercer paso Transformacin del conjunto de datos de entrada aqu se realiza el anlisis previo, el cual prepara los datos para que estos sean procesados con la tcnica de minera de datos ms acorde, conocido tambin como el pre-procesamiento de datos. Cuarto paso Seleccionar y aplicar la tcnica de minera de datos Aqu es donde elegimos y construimos el mtodo que usaremos ya sea predictivo de clasificacin o segmentacin Quinto Paso Extraccin de conocimiento la parte ms representativa donde se elige la tcnica de minera, de la cual obtendremos el modelo de conocimiento, nos representara los patrones, el comportamiento de los valores, la relacin de las variables del problema. Tambin se puede aplicar varias tcnicas a la vez para el procesamiento de los datos. Sexto paso Interpretacin y evaluacin de datos en este paso se validad los datos obtenidos comprobndolos para verificar si son satisfactorias. Si se encontraron varios modelos para abordar, elegir el ms adecuado al problema. Si no se encontr uno apropiado se debe de alterar alguno de los pasos para llegar al adecuado. Si el resultado es aceptable sea que proporciona buenas salidas y mrgenes de error adecuados, el producto est listo para ser explotado.

PROTOCOLO DE UN PROYECTO DE MINERA DE DATOS


Fases necesarias para un proyecto Comprensin del negocio y del problema que se quiere resolver. Determinacin, obtencin y limpieza de los datos necesarios. Creacin de modelos matemticos. Validacin, comunicacin, etc. de los resultados obtenidos. Integracin, si procede, de los resultados en un sistema transaccional o similar.

La interrelacin de estas fases es un verdadero espagueti ya que de manera ms profunda encontraremos otras sub fases, usando una metodologa correcta los proyectos son ms fciles de manejar

TCNICAS DE MINERA DE DATOS


Estas tcnicas provienen principalmente de la inteligencia artificial y la estadstica. Herramientas ms representativas: Agrupamiento o Clustering: Algoritmo K-means, Algoritmo K-medoids IA: Redes Neuronales, Redes Neuronales, Perceptrn, Perceptron Multicapa, Mapas Auto organizados, Regresin Lineal, Arboles de Decisin. Modelos estadsticos, Reglas de asociacin.

Reglas de Asociacin

Agrupamiento o Clustering

Algoritmo Kmeans Algoritmo Kmedoids

Apriori Partition Eclat

Modelo estadstico

Modelo de Bernoulli Modelo Binomial.

Redes Neuronales Redes Neuronales Perceptrn

Modelo Binomial negativo. Modelo Hipergeomtrico. Modelo de Poisson.

IA

Modelo Geomtrico.

Perceptron Multicapa
Mapas Autoorganizados Regresin Lineal Arboles de Decisin

EJEMPLOS DE USO DE MINERA DE DATOS MINERA MUSICAL


La msica, los artistas, compositores, las disqueras, el mundo. La msica y su basto universo es muy grande y saber si una cancin tendr xito es muy difcil de predecir. Puede que lances una cancin y en tu pas no tuvo xito y en otro s, no se sabe, las disquera no querrn invertir en gneros que no son populares o que ya estn casi olvidados. Un dato depende del otro. En la actualidad son muy populares las aplicaciones mviles que nos dicen el nombre de la cancin que estamos escuchando, muy til si no sabes el nombre de la cancin para que despus la puedes conseguir y seguir disfrutndola. Aqu es donde entra la minera de datos, al ser ofrecidas de manera global estas aplicaciones el alcance y los datos son muy bastos.

En concreto el servicio que quiero exponer es el de Tracia de Sony, el cual como ya habamos mencionado identifica que rola estas escuchando, pero aqu es donde se vuelve interesante, el servicio cuenta con una pgina web (http://www.trackid.info) en donde te despliega toda la informacin de la cancin: Artista, Gnero, Ao, Etc. Identificada y adems te muestra que se est escuchando en tiempo real en otras partes del mundo en un mapa. Es informacin valiosa extrada de montaas de datos, por ejemplo las disqueras podran ver en parte del globo sus artistas estn teniendo xito, y en donde no.

Los artistas igual sabran dnde estn teniendo pegue, que cancin es la ms gustada. Para los usuarios saber que se est escuchando en otros pases y probar si eso que se escucha all es bueno para escucharlo aqu tambin, todo un intercambio cultural desde la palma de tu mano. Y otro sin fin de aplicaciones que se le pueden dar a esta informacin extrada.

TIENDAS DE AUTOSERVICIO, PROMOCIONES


Oxxo es una cadena de tiendas de autoservicio abierta las 24 horas del da muy extendida en el pas, salen como hongos en cualquier parte de la ciudad, ellos manejan promociones con sus alimentos, en concreto quiero hablar sobre los hotdogs o Vikingos los cuales observe que ciertos das de la semana son ms baratos. Llegue a la conclusin de que para llegar esta decisin; abaratar el producto, surgi de una minera de datos la cual arrojo que ciertos das se debe de dar ms barato el producto para que no haya prdidas en la tienda a nivel nacional. Esto fue extrado de la informacin de todo el pas de todas las tiendas vieron el padrn de los das que no se venda el producto. Hicieron la promocin para contrarrestar esta problemtica logrando una solucin que beneficiara a las dos partes; tanto al cliente como a la empresa.

REFERENCIAS
http://en.wikipedia.org/wiki/Knowledge_extraction http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos http://www.trackid.info http://old.dii.uchile.cl/~ris/articulos/Vol14.pdf#page=61 http://www.oxxo.com/tienda/test-comida.php

S-ar putea să vă placă și