Documente Academic
Documente Profesional
Documente Cultură
ASESOR:
ING. RAFAEL CRUZ REYES.
29 MAYO, 2016.
Contenido.
1
1.-Resumen.......................................................................................................... 3
2.-Antecedentes................................................................................................... 3
3.- Planteamiento del Problema............................................................................. 7
4.- Objetivo General.............................................................................................. 7
5.- Hiptesis......................................................................................................... 8
6.- Justificacin.................................................................................................... 8
7.- Objetivos Particulares...................................................................................... 8
8.- Marco Terico................................................................................................ 10
9.- Estado del Arte.............................................................................................. 11
10.- Marco Metodolgico..................................................................................... 13
11.-Anexo 1........................................................................................................ 14
Marco Terico.................................................................................................... 14
12.-Anexo 2........................................................................................................ 19
Estado del Arte................................................................................................... 19
13. Anexo 3........................................................................................................ 26
Marco metodolgico........................................................................................ 26
14.- Cronograma................................................................................................. 33
15.- Referencias Bibliogrficas............................................................................34
1.-Resumen.
A travs del tiempo se ha modificado y ha evolucionado el obtener el
pronstico del clima, anteriormente se predecan por los patrones de las nubes
actualmente siguen siendo fundamentales, pero se han visto beneficiadas ya que
estas actividades se han automatizado gracias a los sistemas de alta tecnologa
en meteorologa.
Es por esto la propuesta de este trabajo de investigacin sobre al
descubrimiento de reglas para generar pronostico mediante la Implementacin del
algoritmo Id3 y J48 de weka para procesamiento de datos meteorolgicos de
Toluca.
2.-Antecedentes.
A travs del tiempo se ha modificado y ha evolucionado el obtener el
pronstico del clima, anteriormente se predecan por los patrones de las nubes
actualmente siguen siendo fundamentales, pero se han visto beneficiadas ya que
estas actividades se han automatizado gracias a los sistemas de alta tecnologa
en meteorologa. Todo se debe a que la informacin y el constante cambio de
climas debido a diferentes aspectos que influyen en esta no se tienen un
pronstico exacto [Pacheco, 2005].
Los mtodos mencionados se han vuelto obsoletos por el crecimiento en
volumen y la variedad de informacin que existe, por lo cual han surgido nuevas
herramientas y tcnicas que ayudan a la extraccin de conocimiento til, una de
ellas es la minera de datos [Lpez, 2006].
Se denomina Minera de Datos a la aplicacin de tcnicas de aprendizaje
automtico, que exploran grandes cantidades de datos para descubrir patrones
importantes previamente desconocidos [Britos, 2005; Prez, 2006; Tan, 2006],
tiles y comprensibles para las personas que desean utilizar los datos para la
toma de decisiones [Hand, 2001; Prez, 2006].
La minera de datos puede analizar cualquier tipo de informacin, siendo las
tcnicas de minera diferentes para cada una de ellas [Hernndez, 2004], pero en
concreto se puede ver que las herramientas de minera para el descubrimiento de
conocimiento se aplican en bases de datos relacionales, espaciales, temporales,
textuales y multimedia; adems de datos no estructurados provenientes de la web
[ Cios, 2007].
Minera de datos
Evaluacin e interpretacin
Difusin y uso.
Para ello nicamente se requiere que los datos a analizar se almacenen con un
cierto formato, conocido como ARFF (Attribute-Relation File Format). WEKA se
distribuye como software de libre distribucin desarrollado en Java. Est
constituido por una serie de paquetes de cdigo abierto con diferentes tcnicas de
preprocesado, clasificacin, agrupamiento, asociacin, y visualizacin, as como
facilidades para su aplicacin y anlisis de prestaciones cuando son aplicadas a
los datos de entrada seleccionados [Lpez, 2006].
Estos paquetes pueden ser integrados en cualquier proyecto de anlisis de datos,
e incluso pueden extenderse con contribuciones de los usuarios que desarrollen
nuevos algoritmos.
Con objeto de facilitar su uso por un mayor nmero de usuarios, WEKA
adems incluye una interfaz grfica de usuario para acceder y configurar las
diferentes herramientas integradas.
Para seleccionar algunas de las tcnicas disponibles para aplicarlas a
ejemplos concretos, siguiendo el acceso desde la herramienta al resto de tcnicas
implementadas, una mecnica totalmente anloga a la presentada a modo
ilustrativo.
Para reforzar el carcter prctico de este captulo, adems se adoptar un formato
de tipo tutorial, con un conjunto de datos disponibles sobre el que se irn
aplicando las diferentes facilidades de WEKA. Se sugiere que el lector aplique los
pasos indicados y realice los anlisis sugeridos para cada tcnica con objeto de
familiarizarse y mejorar su comprensin. Los ejemplos seleccionados son
contienen datos provenientes del campo de la enseanza, correspondientes a
alumnos que realizaron las pruebas de selectividad en los aos 1993-2003
procedentes de diferentes centros de enseanza secundaria de la comunidad de
Madrid. Por tanto, esta gua ilustra la aplicacin y anlisis de tcnicas de
extraccin de conocimiento sobre datos del campo de la enseanza, aunque sera
directa su traslacin a cualquier otra disciplina [Steinach, 2006]
La minera de datos consiste en la extraccin no trivial de informacin que reside
de manera implcita en los datos. Dicha informacin era previamente desconocida
y podr resultar til para algn proceso. En resumen, la minera de datos prepara,
sondea y explora los datos para sacar la informacin oculta en ellos.Minera de
datos abarca todo un conjunto de tcnicas enfocadas en la extraccin de
conocimiento implcito en las bases de datos. Las bases de la minera de datos se
encuentran en la inteligencia artificial y en el anlisis estadstico. Mediante los
modelos extrados utilizando tcnicas de minera de datos se aborda la solucin a
problemas de prediccin, clasificacin y segmentacin [Zamorano, 2006].
6.- Justificacin.
Analizar los resultados de las pruebas que se realicen con cada algoritmo y
evaluar los resultados de cada algoritmo. Para que de esta manera se puedan
identificar las reglas de cada algoritmo con los datos del clima de Toluca en un
determinado tiempo.
7.- Objetivos Particulares.
1) Comprensin del negocio.
4) Modelado.
Implementacin del modelo para el algoritmo J48 y construccin del mismo.
5) Comprensin del negocio.
8) Modelado.
Implementacin del modelo para el algoritmo Id3 y construccin del mismo.
9) Evaluacin e interpretacin.
El
proceso
Conocimiento
de
[Zaki,
2014],
[Cao,
2009],
[Hammergren, 2009], [ Ballard, 1998],
[Dean, 2014], [ Witten, 2011], [Aldana,
2009], [Cios, 2007], [Pyle, 1999],
[Maimon, 2010] [ North, 2012], [Han,
2006], [Lane, 2007], [Ullman, 2010],
[Molina, 2006].
Extraccin
Preparacin de Datos
Tcnicas de Evaluacin
Minera de Datos
[Zaki,
2014],
[Cao,
2009],
[Hammergren, 2009], [Ballard, 1998],
[Dean, 2014], [ Witten, 2011], [Aldana,
2009], [Cios, 2007], [Pyle, 1999],
[Maimon, 2010], [North, 2012], [Han,
2006], [Lane, 2007], [Ullman, 2010],
[Molina, 2006].
El
proceso
Conocimiento
de
Extraccin
Preparacin de Datos
Tcnicas de Evaluacin
[Warwick,2000]
[Thomas, 2001].
data
processingand
analysis [Waterloo,
[Maarten,2010].
[Jiel, 2014],
[Jiang, 2014].
2010],
[Yue,
Modelado Evaluacin
2014],
Introduccin a Weka
[Maimon, 2010].
El explorador
[Witten, 2011].
[Witten, 2011].
El experimentador
[Witten, 2011].
[Molina, 2006].
11.-Anexo 1
Marco Terico
Para la toma de decisiones en IA lo hace por medio de la lgica difusa la
cual sienta las bases de una nueva forma de lgica. El ser humano muestra
dicultad para tomar decisiones cuando se tiene informacin imprecisa. La lgica
difusa fue creada para emular la lgica humana y tomar decisiones acertadas a
pesar de la informacin [Ponce, 2010].
La teora de la decisin, que combina la teora de la probabilidad con la
teora de la utilidad, proporciona un marco completo y formal para la toma de
decisiones (eco- nmicas o de otra ndole) realizadas bajo incertidumbre, esto es,
en casos en los que las descripciones probabilsticas capturan adecuadamente la
forma con la que se toman las decisiones en el entorno; lo cual es adecuado para
grandes economas en las que cada agente no necesita prestar atencin a las
acciones que lleven a cabo el resto de los agentes individualmente. Cuando se
trata de pequeos economas, la situacin se asemeja ms a la de un juego: las
acciones de un jugador pueden afectar significativamente a la utilidad de otro
(tanto positiva como negativamente) [Russell, 2004].
Entre los asistentes estaban John McCarthy, Marvin Minsky, Allen Newell y
Herbert Simn [Bentez,].El nacimiento de la IAes unido al del ordenador.
En efecto el matemtico Alan Turn propuso un test que pudiera decidir si
una maquina era inteligente o no [Bourcier, 2003]. Como todo sistema de
informacin, los agentes inteligentes nos proveen de informacin para ayudarnos
a tomar las decisiones ms acertadas.
En este caso, el agente inteligente goza de cierta autonoma y realiza
acciones en nuestro nombre. Un agente robotizado, digamos, podra enviar
correos electrnicos, felicitar un cumpleaos o buscar artculos ms baratos en
Internet. Un agente inteligente puede leer tambin titulares de un peridico o de
una revista, con determinados parmetros de busca, y presentrnoslos. Como
decamos, otro tipo de agente inteligente conocido como Shop bots puede buscar
en Internet el artculo que nos ofrezca ms ventajas [Cancelo, 2003].
Un agente es algo capaz de percibir y actuar. De acuerdo con este enfoque,
se considera la IA como el estudio y construccin de agentes racionales. En el
caso del enfoque de la IA segn las leyes del pensamiento, todo el nfasis se
pona en hacer inferencias correctas. La obtencin de estas inferencias a veces
forma parte de lo que se considera un agente racional, puesto que una manera de
actuar racionalmente es el razonamiento lgico que asegure la obtencin de un
resultado determinado, con lo que se actuar de conformidad con tal razonamiento
[Ponce, 2010].Existe una poblacin de agentes simples que producen en su
conjunto un comportamiento global ms complejo. Simulan el comportamiento de
las hormigas, las cuales se unen para conseguir objetivos que no podran lograr
de forma individual. Las hormigas dejan un rastro de feromonas por donde
pasan. Esto les permite por ejemplo encontrar el camino ms corto hasta una
fuente de comida. Cuando una hormiga encuentra una fuente de comida, coge la
que puede, la lleva al hormiguero y vuelve a por ms. La hormiga que encuentra el
camino ms corto puede hacer ms viajes, lo cual incrementa el nivel de
feromona de ese camino en particular [Romero, 2006].Un agente inteligente es un
programa especialmente concebido para realizar ciertas tareas de manera
autnoma en una red por encargo de un usuario. Esta herramienta permite ganar
tiempo en la vigilancia y la colecta de informacin de inters para la empresa. El
usuario define los parmetros de la tarea que realizar de manera autnoma el
agente, luego el agente informa de los resultados al usuario [Rusell, 2004]. El
campo de la IA se compone de varias reas de estudio, las ms comunes e
importantes son: bsqueda de soluciones, sistemas expertos, procesamiento del
lenguaje natural, reconocimiento de modelos, robtica, aprendizaje de las
mquinas ,lgica ,incertidumbre y lgica difusa [Ponce,2010].Aqu se presentan
unas cuantas aplicaciones; Planificacin autnoma, juegos, control, diagnosis,
robtica, procesamiento de lenguaje y resolucin de problemas [Vindel, 2003].Las
aplicaciones ms frecuentes de la inteligencia artificial incluyen campos como la
robtica ,el anlisis de imgenes o el tratamiento automtico de textos, sistemas
expertos , anlisis de texto y estos pueden aplicarse en la medicina , economa
,ingeniera ,biologa ,etc. [Bentez,2006].
los que estn en nuestra red social, ya sea fsico o el virtual. Considere una
situacin en la que tengo una experiencia de usuario pobre con mi proveedor de
cable; tan pobre que puedo cancelar todos mis servicios y buscar otro proveedor
[Dean, 2006].
Para pre-procesamiento de datos que tenga xito, es esencial disponer de
una
visin
global
de
los
datos.
Descriptivedatasummarizationtechniquescanbeusedtoidentifythetypicalpropertiesof
yourdataandhighlightwhichdatavaluesshouldbetreatedasnoiseoroutliers. Por lo
tanto, primero introducimos los conceptos bsicos de resumen de datos
descriptivos en el funcionamiento concreto de las tcnicas de pre-procesamiento
de datos. Para muchas tareas de pre-procesamiento de datos, los usuarios les
gustaran aprender sobre caractersticas de los datos con respecto tanto la
tendencia central y la dispersin de los datos. Medidas de tendencia central
incluyen media, la mediana, la moda y de gama media, mientras que las medidas
de dispersin de los datos incluyen los cuartiles, rango (IQR), y la varianza. Estas
estadsticas descriptivas son de gran ayuda en la comprensin de la distribucin
de los datos. Estas medidas se han estudiado ampliamente en la literatura
estadstica. Desde el punto de vista de la minera de datos, es necesario examinar
cmo se pueden calcular en grandes bases de datos. En particular, es necesario
introducir las nociones de medida distributiva, medida algebraica, y la medida
holstica. Saber qu tipo de medida que nos ocupa puede ayudarnos a elegir una
implementacin e fi cliente para ellos [Hand, 2001].
Es probable que su tarea de anlisis de datos implicar la integracin de
datos, que combina datos de mltiples fuentes en un almacn de datos coherente,
como en el almacenamiento de datos. Estas fuentes pueden incluir mltiples
bases de datos, cubos de datos, o FL en los archivos. Hay una serie de cuestiones
a considerar durante la integracin de datos. La integracin de esquemas y la
coincidencia de objeto puede ser complicado [Tuya, 2007].Desde el punto de vista
de la minera de datos, es necesario examinar cmo se pueden calcular eficiente
en grandes bases de datos. En particular, es necesario introducir las nociones de
medida distributiva, medida algebraica, y la medida holstica. Saber qu tipo de
medida que nos ocupa puede ayudarnos a elegir una implementacin e fi cliente
para ellos [Maimon, 2010].
12.-Anexo 2
Estado del Arte
Minera de datos es el conjunto de tcnicas y tecnologas que permiten
explorar grandes bases de datos, de manera automtica o semiautomtica, con el
objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto[Casas ,2013].
La minera de datos es el proceso de detectar la informacin accinales de
grandes conjuntos de datos. Utiliza el anlisis matemtico para deducir los
patrones y tendencias que existen en los datos. Normalmente, estos patrones no
se pueden detectar mediante la exploracin tradicional de los datos porque las
relaciones son demasiado complejas o porque hay demasiado datos [Vindel,
2014].
Es un campo de las ciencias de la computacin referido al proceso que
intenta descubrir patrones en grandes volmenes de conjuntos de datos [Maimn,
2010].Extraccin de conocimientos lineales, de patrones no implcitos previamente
desconocidos y [potencialmente tiles que trabaja en arqueologa de datos e
inteligencia de negocios [Hand, 2012].Tiene por objeto organizar todos los
mtodos desarrollados significativo en el campo en un catlogo coherente y
unificado; presenta enfoques y tcnicas de evaluacin de desempeo; y explica
con casos y herramientas de software, el uso de los diferentes mtodos. Los
objetivos de este captulo introductorio son para explicar el proceso KDD, y
posicionarse dentro de la DM [Hand, 2001].La minera de datos ha atrado una
gran cantidad de atencin en la industria de la informacin y en la sociedad en su
conjunto en los ltimos aos, debido a la amplia disponibilidad de grandes
cantidades de datos y la necesidad inminente para convertir esos datos en
informacin y conocimiento til [Maimn, 2010].La razn principal por la que
estamos viendo cambios dramticos en la minera de datos est relacionado con
los cambios en las tecnologas de almacenamiento, as como capacidades
computacionales. Sin embargo, todos los paquetes de software no pueden tomar
ventaja de la capacidad del hardware actual. Esto es especialmente cierto en el
modelo de computacin distribuido. Una evaluacin cuidadosa se debe hacer para
asegurar que los algoritmos son distribuidos y el aprovechamiento eficaz de toda
la potencia de clculo disponible para usted [Dean, 2006].
La minera de datos permite a las personas a encontrar e interpretar esos
patrones, lo que ayuda a tomar decisiones ms informadas y servir mejor a sus
clientes. Dicho esto, tambin hay preocupacin por la prctica de la minera de
13. Anexo 3
Marco metodolgico
La metodologa CRISP-DM (Cross Industry Standard Process for Data
Mining) CRISPDM [CRISP-DM, 2000], es la gua de referencia ms ampliamente
utilizada en el desarrollo de proyectos de Data Mining, como se puede constatar
en la grfica presentada en la figura 2.3. Esta grfica, publicada el ao 2007 por
kdnuggets.com, representa el resultado obtenido en sucesivas encuestas
efectuadas durante los ltimos aos, respecto del grado de utilizacin de las
principales guas de desarrollo de proyectos de Data Mining. En ella se puede
observar, que a pesar de que el uso de aun frente a otras, la gua de referencia
ms ampliamente utilizada [Chapman, 2004].
Est dividida en 4 niveles de abstraccin organizados de forma jerrquica en
tareas que van desde el nivel ms general, hasta los casos ms especficos y
organiza el desarrollo de un proyecto de Data Mining, en una serie de seis fases
([CRISP-DM, 2000]).
A continuacin se describen cada una de las fases en que se divide [Clinton,
2006].
1. Fase de comprensin del negocio o problema La primera fase de la gua de
referencia CRISP-DM, denominada fase de comprensin del negocio o
problema: es probablemente la ms importante y aglutina las tareas de
comprensin de los objetivos y requisitos del proyecto desde una
perspectiva empresarial o institucional, con el fin de convertirlos en
objetivos tcnicos y en un plan de proyecto. Esta tarea tiene como objetivo
representar los objetivos del negocio en trminos de las metas del proyecto
de DM, como por ejemplo, si el objetivo del negocio es el desarrollo de una
campaa publicitaria para incrementar la asignacin de crditos
hipotecarios, la meta de DM ser por ejemplo, determinar el perfil de los
clientes respecto de su capacidad de endeudamiento.
Produccin de un plan del proyecto. Finalmente esta ltima tarea de la primera
fase de CRISP-DM, tiene como meta desarrollar un plan para el proyecto, que
describa los pasos a seguir y las tcnicas a emplear en cada paso.
2. Fase de comprensin de los datos La segunda fase (figura 2.7), fase de
comprensin de los datos, comprende la recoleccin inicial de datos, con el
objetivo de establecer un primer contacto con el problema, familiarizndose con
ellos, identificar su calidad y establecer las relaciones ms evidentes que permitan
definir las primeras hiptesis. En esta tarea, se efectan verificaciones sobre los
datos, para determinar la consistencia de los valores individuales de los campos,
la cantidad y distribucin de los valores nulos, y para encontrar valores fuera de
rango, los cuales pueden constituirse en ruido para el proceso. La idea en este
punto, es asegurar la completitud y correccin de los datos.
3. Fase de preparacin de los datos En esta fase y una vez efectuada la
recoleccin inicial de datos, se procede a su preparacin para adaptarlos a las
tcnicas de Data Mining que se utilicen posteriormente, tales como tcnicas de
visualizacin de datos, de bsqueda de relaciones entre variables u otras medidas
para exploracin de los datos. Limpieza de los datos. Esta tarea complementa a la
anterior, y es una de las que ms tiempo y esfuerzo consume, debido a la
diversidad de tcnicas que pueden aplicarse para optimizar la calidad de los datos
a objeto de prepararlos para la fase de modelacin. Estructuracin de los datos.
Esta tarea consiste principalmente, en la realizacin de transformaciones
sintcticas de los datos sin modificar su significado, esto, con la idea de permitir o
facilitar el empleo de alguna tcnica de DM en particular, como por ejemplo la
reordenacin de los campos y/o registros de la tabla o el ajuste de los valores de
los campos a las limitaciones de las herramientas de modelacin (eliminar comas,
tabuladores, caracteres especiales, mximos y mnimos para las cadenas de
caracteres, etc.).
4. Fase de modelado En esta fase de CRISP-DM, se seleccionan las tcnicas
de modelado ms apropiadas para el proyecto de Data Mining especfico. Las
tcnicas a utilizar en esta fase se eligen en funcin de los siguientes criterios: o
Ser apropiada al problema.Disponer de datos adecuados. Despus de
seleccionada la tcnica, se ejecuta sobre los datos previamente preparados para
generar uno o ms modelos. Todas las tcnicas de modelado tienen un conjunto
de parmetros que determinan las caractersticas del modelo a generar.
La seleccin de los mejores parmetros es un proceso iterativo y se basa
exclusivamente en los resultados generados. Estos deben ser interpretados y su
rendimiento justificado. Evaluacin del modelo. En esta tarea, los ingenieros de
DM interpretan los modelos de acuerdo al conocimiento preexistente del dominio y
los criterios de xito preestablecidos. Expertos en el dominio del problema juzgan
los modelos dentro del contexto del dominio y expertos en Data Mining aplican sus
propios criterios (seguridad del conjunto de prueba, prdida o ganancia de tablas.
5. Fase de evaluacin En esta fase se evala el modelo, teniendo en cuenta el
cumplimiento de los criterios de xito del problema. Debe considerarse adems,
que la fiabilidad calculada para el modelo se aplica solamente para los datos sobre
los que se realiz el anlisis. Es preciso revisar el proceso, teniendo en cuenta los
resultados obtenidos, para poder repetir algn paso anterior, en el que se haya
posiblemente cometido algn error. Fase de evaluacin ([CRISP-DM, 2000]).
Determinacin de futuras fases. Si se ha determinado que las fases hasta este
momento han generado resultados satisfactorios, podra pasarse a la fase
siguiente, en caso contrario podra decidirse por otra iteracin desde la fase de
[Adams, 2013]
[Aldana, 2009]
[Arenas, 2008]
[Anguiano, 2009]
[Baeza, 1999]
[Ballard, 1998]
[Britos, 2005]
[Cabrera, 2011]
[Cao, 2009]
[Chakrabarti, 2003]
[Chapman, 1999]
[Cichosz, 2015]
[Cios, 2007]
[Dean, 2014]
[Enge, 2010]
[Google, 2011]
sg242238.pdf
Britos, Paola; Hossian, Alejandro; Garca,
Ramn; Sierra, Enrique. Minera de Datos
Basado en Sistemas Inteligentes. Ed. Nueva
Librera, Buenos Aires 2005 1 edicin.
Biblioteca Facultad de Ingeniera UAEMEX.
Cabrera Jimnez, Juan. Clasificacin de
Documentos
usando
Naive
Bayes
Multinomial
y
Representaciones
Distribucionales.
Instituto
Nacional
de
Astrofsica ptica y Electrnica. Puebla,
Mxico
2011.
http://ccc.inaoep.mx/~esucar/Clasesmgp/Proyectos/2011/Reporte_Proyecto_Clasi
ficacion_de_Documentos.pdf
Cao, Longbing. Data Mining for Business
Applications. Ed. Springer, USA 2009.
Biblioteca Personal.
Chakrabarti, Soumen. Mining the Web
Discovering Knowledge from Hypertext Data.
Ed. Elsevier, USA 2003. Biblioteca Personal.
Chapman, Pete. CRISP-DM 1.0. SPSS Inc.
USA 1999. Biblioteca Personal.
Cichosz, Pawet. Data Mining Algorithms
Explained Using R. Ed. John Wiley and Sons
Inc,
USA
2015.
http://cdn4.filepi.com/g/J5L9l29/1425615453/
b6cfec867389e54d0c9ae11de916f009
Cios, Krzysztof; Pedrycz, Witold; Swiniarski,
Roman; Kurgan, Lukasz. Data Mining a
Knowledge
Discovery
Approach.
Ed.
Springer, USA 2007. Biblioteca Facultad de
Ingeniera UAEMEX.
Dean, Jared. Big Data, Data Mining and
Machine Learning. Ed. John Wiley and Sons
Inc,
USA
2014.
http://cdn3.filepi.com/g/kU0oOR9/142561541
1/65c6565c2fe9193ee893c6e518a15f8c
Enge, Eric; Spencer, Stephan; Fishkin, Rand.
The Art of SEO Mastering Search Engine
Optimization. Ed. Orilley Media, USA, 2010.
http://it-ebooks.info/book/96/
Google Inc. Guia para principiantes sobre
optimizacin
para
motores
de
[Han, 2006]
[Hand, 2001]
[Hammergren, 2009]
[Hernndez, 2004]
[Imhoff, 2003]
[Jerkovic, 2010]
[Kimball, 2002]
bsqueda.Google
Inc,
2011.
https://static.googleusercontent.com/media/w
ww.google.com/es//intl/es/webmasters/docs/g
uia_optimizacion_motores_busqueda.pdf
Han, Jiawei; Kamber, Micheline. Data Mining
Concepts and Techniques. Ed. Elsevier, USA
2006
2a
edicin.
http://www.mis.boun.edu.tr/gulser/index_files/
DM%20Concepts%20%26%20Techniques
%20_%20Han%26Kamber.pdf
Hand, David; Mannila, Heikki; Smyth,
Padhraic. Principles of Data Mining. Ed.
Massachusetts Institute of Technology, USA
2001.
Biblioteca
Facultad
de
IngenieraUAEMEX.
Hammergren, Thomas; Simon, Alan. Data
Warehousing for Dummies. Ed. Wiley
Publishing Inc. USA 2009, 2a edicin.
http://dspace.utamu.ac.ug:8080/xmlui/bitstrea
m/handle/123456789/87/%5BThomas_C._Ha
mmergren
%5D_Data_Warehousing_For_Dummie
%28BookFi.org%29.pdf?
sequence=1&isAllowed=y
Hernndez Orallo, Jos; Ferri Ramrez,
Cesar; Ramrez, Ma. Jos. Introduccin a la
Minera de Datos. Ed. Pearson, Madrid 2004.
Biblioteca Unidad Acadmica Tianguistenco
UAEMEX.
Imhoff, Claudia; Galemmo, Nicholas; Geiger,
Jonathan. Mastering Data Warehouse
Design. Ed. Wiley Publishing Inc. USA 2003.
http://artemisa.unicauca.edu.co/~ecaldon/doc
s/bd/mastering.pdf
Jerkovic, John. SEO Warrior. Ed. Orilley
Media,
USA,
2010.
http://itebooks.info/book/173/
Kimball, Ralph; Ross, Margy. The Data
Warehouse Toolkit. Ed. John Wiley and Sons
Inc.
2a
edicin,
USA
2002.
http://home.elka.pw.edu.pl/~rbzoma/The
%20Data%20Warehouse%20Toolkit%20%20The%20Complete%20Guide%20to
%20Dimensional%20Modeling%20(2nd
[Lane,2007]
[Lara, 2014]
[Ledford, 2008]
[Manning, 2009]
[Maimon, 2010]
[Mitchell, 1997]
[Molina, 2006]
[Murphy, 2012]
[North, 2012]
%20Ed%202002%20Wiley)%20-%20Kimball
%20&%20Ross.pdf
Lane,
Paul.
Oracle
Database
Data
Warehousing Guide. Ed. Oracle, USA 2007.
http://docs.oracle.com/cd/B28359_01/server.1
11/b28313.pdf
Lara, Pablo; Martnez, Jos ngel. Agentes
Inteligentes en la bsqueda y recuperacin
de informacin. Ed. Planeta UOC, Barcelona,
2014.
http://eprints.ucm.es/5840/1/2004-LibAgentes.pdf
Ledford,
Jerri.
SEO
Search
Engine
Optimization. Ed. Wiley Publishing, USA,
2008. http://it-ebooks.info/book/1879/
Manning,
Christopher.
Introduction
to
Information
Retrieval.
Ed.
Cambridge
University Press, Inglaterra 2009. Biblioteca
Personal.
Maimon, Oded; Rokach, Lior. Data Mining
and knowledge Discovery Handbook. Ed.
Springer,
USA
2010,
2a
edicin.
http://www.cs.bme.hu/nagyadat/Data_Mining_
and_Knowledge_Discovery.pdf
Mitchell, Tom. Machine Learning. Ed.
McGraw-Hill
1997.
http://personal.disco.unimib.it/Vanneschi/McG
rawHill_-_Machine_Learning_Tom_Mitchell.pdf
Molina, Jos. Tcnicas de Anlisis de Datos
Aplicaciones prcticas utilizando Microsoft
Excel y Weka. Ed. Universidad Carlos III,
Madrid
2006.
http://www.giaa.inf.uc3m.es/docencia/II/ADato
s/apuntesAD.pdf
Murphy, Kevin. Machine Learning a
Probalistic Perspective. Ed. Massachusetts
Institute
of
Technology,
USA
2012.
http://www.cs.ubc.ca/~murphyk/MLbook/pmlintro-22may12.pdf
North, Matthew. Data Mining for the Masses.
Ed.
Creative
Commons
2012.
https://rapidminer.com/wpcontent/uploads/2013/10/DataMiningForTheM
[Pacheco, 2005]
[Prez, 2006]
[Pyle, 1999]
[Salton, 1988]
[Tan, 2006]
[Ullman, 2010]
[Varguez, 2012]
[Witten, 2011]
[Zaki, 2014]
asses.pdf
Pacheco Leal, Samuel. El clasificador Naive
Bayes en la Extraccin de Conocimiento de
Bases de Datos. Universidad Autnoma del
Estado de Nuevo Len. Mxico 2005.
Biblioteca Personal.
Prez, Cesar; Santn, Daniel. Data Mining
Soluciones con Enterprise Miner. Ed.
Alfaomega, Madrid 2006 1 edicin.
Biblioteca Facultad de Ingeniera UAEMEX.
Pyle, Dorian. Data Preparation for Data
Mining. Ed. Morgan Kaufmann Publishers,
USA
1999.
http://www.temida.si/~bojan/MPS/materials/D
ata_preparation_for_data_mining.pdf
Salton, Gerard; Buckley, Christopher. TermWeighting Approaches In Automatic Text
Retrieval. Ed. Pergarson Press, Gran
Bretaa, 1988. Biblioteca Personal.
Tan, Pang-Ning; Steinbach, Michael; Kumar,
Vipin. Introduction to Data Mining. Ed.
Pearson Education, Boston 2006. Biblioteca
Facultad de Ingeniera UAEMEX.
Ullman, Jeffrey; Leskovec, Jure; Rajaraman,
Anand. Mining of Massive Datasets. Stanford
University,
USA
2010.
https://rapidminer.com/wpcontent/uploads/2013/10/DataMiningForTheM
asses.pdf
Varguez Moo, Martha. Clasificacin de
Documentos usando Maquinas de Vectores
de Apoyo. Facultad de Matemticas,
Universidad Autnoma de Yucatn, Mxico
2012. Biblioteca Personal.
Witten, Ian; Frank, Eibe; Hall, Mark. Data
Mining Practical Machine Learning Tools and
Techniques. Ed. Elsevier, USA 2011.
Biblioteca Personal.
Zaki, Mohammed; Meira, Wagner. Data
Mining and Analysis Fundamental Concepts
and algorithms. Ed. Cambridge University
Press,
USA
2014.
http://www.cs.rpi.edu/~zaki/PaperDir/DMABO
OK.pdf