Documente Academic
Documente Profesional
Documente Cultură
Inteligencia Articial
MINERIA DE DATOS
1.
Existen algoritmos diseados para realizar clasicaciones en minera de datos, algunos de los cuales son OneR, ZeroR, J48, etc, de los cuales Se analizarn
ZeroR y Ridor aplicados en un ejemplo.
1.1.
Algoritmo ZerorR
Algoritmo Ridor
Ridor abrevia a RIpple-DOwn Rule. Este algoritmo genera una regla por
defecto que se ajuste a la mayora de los ejemplos de entrenamiento y luego
busca excepciones con la menor tasa de error al clasicar los propios ejemplos
de entrenamiento. A continuacin genera las excepciones a las excepciones con
menos error, de manera recursiva. As, lleva a cabo una expansin de excepciones en forma de rbol donde la raz est formada por la regla por defecto.
Las excepciones son un conjunto de reglas que predicen las clases que no contempla la regla por defecto. IREP una implementacin de Ridor y es el algoritmo
empleado para encontrar excepciones. ste construye las reglas aadiendo un
trmino al antecedente en cada iteracin de tal forma que el error se minimice.
Los trminos del antecedente son de la forma (atributo signo valor). [2]
1.3.
Ejemplo
Para el siguiente ejemplo se han creado 2 archivos .ar sobre las condiciones
necesarias para jugar un partido de tenis. La nica diferencia entre los archivos
es que uno de ellos se agrega el atributo de si jugar o no.
Para descargar la librera de WEKA bamos a la siguiente direccin: http://
www.cs.waikato.ac.nz/ml/weka/downloading.html. Como adicional se utiliz el siguiente programa http://publicacioneshenry.wordpress.com/2011/
05/11/weka-with-data-mining-done-in-java/ para realizar la lectura de los
archivos.
Archivo JugarTenis.ar
@relation " Jugar Tenis "
@attribute
@attribute
@attribute
@attribute
@data
soleado , Alta , Alta , FALSE
soleado , Alta , Alta , TRUE
nublado , Alta , Alta , FALSE
lluvioso , Media , Alta , FALSE
lluvioso , Baja , Normal , FALSE
lluvioso , Baja , Normal , TRUE
nublado , Baja , Normal , TRUE
soleado , Media , Alta , FALSE
soleado , Baja , Normal , FALSE
lluvioso , Media , Normal , TRUE
soleado , Media , Normal , TRUE
nublado , Baja , Alta , TRUE
nublado , Alta , Normal , FALSE
lluvioso , Media , Alta , TRUE
Archivo JugarTenisCompleto.ar
@relation " Jugar Tenis Completo "
@attribute
@attribute
@attribute
@attribute
@attribute
@data
soleado , Alta , Alta , FALSE , NO
soleado , Alta , Alta , TRUE , NO
nublado , Alta , Alta , FALSE , SI
lluvioso , Media , Alta , FALSE , SI
lluvioso , Baja , Normal , FALSE , SI
lluvioso , Baja , Normal , TRUE , NO
nublado , Baja , Normal , TRUE , SI
soleado , Media , Alta , FALSE , NO
soleado , Baja , Normal , FALSE , SI
lluvioso , Media , Normal , TRUE , SI
soleado , Media , Normal , TRUE , SI
nublado , Baja , Alta , TRUE , SI
nublado , Alta , Normal , FALSE , SI
lluvioso , Media , Alta , TRUE , NO
2.
Bibliografa
Referencias
[1] J. Serrano. Mtodos de Aprendizaje Automtico para el Descubrimiento de Conocimiento en Datos Mdicos sobre Arterosclerosis. Disponible en: http://www.ejbi.org/en/ejbi/article/
41-es-metodos-de-aprendizaje-automatico-para-el-descubrimiento-de-conocimiento-en-dato
html Fecha de consulta: 03-07-2014.
[2] M. Rigoberto. Aplicacin de tcnicas de minera de datos con Weka Acknowledge Explorer. Disponible en: http://innovaciontec.idict.
cu/innovacion/article/viewFile/244/245 Fecha de consulta: 03-072014.
[3] H. Angelica. Minera de datos: competencias bsicas. Disponible en:
http://inteligenciartificialudec.wikispaces.com/file/view/
TRABAJO+DE+INT+ARTFICIAL+WEKA.pdf Fecha de consulta: 03-07-2014.