Documente Academic
Documente Profesional
Documente Cultură
Anlisis y Extraccin
Minera de datos, KDD
Grupo: 9SF
Estos son los pasos que tiene la minera de datos. El primer paso Seleccin del conjunto de datos" trata de estableces las variables objetivo como pueden ser el predecir, calcular o inferir. Tambin incluyen a las Variables Independientes que son los procesos para llegar al clculo. Como segundo paso tenemos el Anlisis de las propiedades de los datos aqu los actores principales son los histogramas, diagramas de dispersin, valores atpicos y valores nulos.
Tercer paso Transformacin del conjunto de datos de entrada aqu se realiza el anlisis previo, el cual prepara los datos para que estos sean procesados con la tcnica de minera de datos ms acorde, conocido tambin como el pre-procesamiento de datos. Cuarto paso Seleccionar y aplicar la tcnica de minera de datos Aqu es donde elegimos y construimos el mtodo que usaremos ya sea predictivo de clasificacin o segmentacin Quinto Paso Extraccin de conocimiento la parte ms representativa donde se elige la tcnica de minera, de la cual obtendremos el modelo de conocimiento, nos representara los patrones, el comportamiento de los valores, la relacin de las variables del problema. Tambin se puede aplicar varias tcnicas a la vez para el procesamiento de los datos. Sexto paso Interpretacin y evaluacin de datos en este paso se validad los datos obtenidos comprobndolos para verificar si son satisfactorias. Si se encontraron varios modelos para abordar, elegir el ms adecuado al problema. Si no se encontr uno apropiado se debe de alterar alguno de los pasos para llegar al adecuado. Si el resultado es aceptable sea que proporciona buenas salidas y mrgenes de error adecuados, el producto est listo para ser explotado.
La interrelacin de estas fases es un verdadero espagueti ya que de manera ms profunda encontraremos otras sub fases, usando una metodologa correcta los proyectos son ms fciles de manejar
Reglas de Asociacin
Agrupamiento o Clustering
Modelo estadstico
IA
Modelo Geomtrico.
Perceptron Multicapa
Mapas Autoorganizados Regresin Lineal Arboles de Decisin
En concreto el servicio que quiero exponer es el de Tracia de Sony, el cual como ya habamos mencionado identifica que rola estas escuchando, pero aqu es donde se vuelve interesante, el servicio cuenta con una pgina web (http://www.trackid.info) en donde te despliega toda la informacin de la cancin: Artista, Gnero, Ao, Etc. Identificada y adems te muestra que se est escuchando en tiempo real en otras partes del mundo en un mapa. Es informacin valiosa extrada de montaas de datos, por ejemplo las disqueras podran ver en parte del globo sus artistas estn teniendo xito, y en donde no.
Los artistas igual sabran dnde estn teniendo pegue, que cancin es la ms gustada. Para los usuarios saber que se est escuchando en otros pases y probar si eso que se escucha all es bueno para escucharlo aqu tambin, todo un intercambio cultural desde la palma de tu mano. Y otro sin fin de aplicaciones que se le pueden dar a esta informacin extrada.
REFERENCIAS
http://en.wikipedia.org/wiki/Knowledge_extraction http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos http://www.trackid.info http://old.dii.uchile.cl/~ris/articulos/Vol14.pdf#page=61 http://www.oxxo.com/tienda/test-comida.php