Sunteți pe pagina 1din 7

Introduccin.

En esta prctica mostraremos la utilizacin del software WEKA, el cual es una plataforma de software gratuito para el aprendizaje automtico y minera de datos escritos en Java, es posible implementar y utilizar los mtodos en Java y configurar el servicio web. Se encuentran disponibles una gran cantidad de algoritmos de clasificacin y verificacin. La caracterstica ms importante es que es posible trabajar con los parmetros, comprobar los parmetros, encontrar algoritmos de clasificacin y construir el modelo del sistema. Trabajar en WEKA es muy sencillo e intuitivo. En primer lugar para trabajar con WEKA es necesario un formato especial de archivo llamado formato ARFF Dicho software ser utilizado para el desarrollo de un rbol de decisin, un rbol de decisin es un modelo de prediccin utilizado en el mbito de la inteligencia artificial. Los rboles de decisiones sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resolucin de un problema. Ellos proveen una visin grfica de la toma de decisin necesaria, especifican las variables que son evaluadas, qu acciones deben ser tomadas y el orden en la cual la toma de decisin ser efectuada. Cada vez que se ejecuta un rbol de decisin, solo un camino ser seguido dependiendo del valor actual de la variable evaluada. Dada una base de datos se construyen diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resolucin de un problema. La base de datos utilizada para dicho rbol se obtendr del sitio de UC Irvine Machine Learning Repository: http://archive.ics.uci.edu/ml/

Desarrollo
En esta prctica mostraremos cmo generar un rbol en el entorno de weka, para esto necesitamos una base de donde partir. Acudimos al sitio

http://archive.ics.uci.edu/ml/ que es un conjunto de datos o un repositorio de datos de diferentes contextos y tamaos. Seleccionamos el ejemplo Balloons del repositorio, en donde: El globo esta inflado si el color es Amarillo y el tamao es pequeo o la edad es adulto y la accin es estirar.

Segn el repositorio los atributos y sus respectivos valores son los siguientes:
Color size act age inflated yellow, purple large, small stretch, dip adult, child T, F

En el repositorio tambin encontramos la base de los ejemplos:


YELLOW,SMALL,STRETCH,ADULT,T YELLOW,SMALL,STRETCH,CHILD,T YELLOW,SMALL,DIP,ADULT,T YELLOW,SMALL,DIP,CHILD,T YELLOW,LARGE,STRETCH,ADULT,T YELLOW,LARGE,STRETCH,CHILD,F YELLOW,LARGE,DIP,ADULT,F YELLOW,LARGE,DIP,CHILD,F PURPLE,SMALL,STRETCH,ADULT,T PURPLE,SMALL,STRETCH,CHILD,F PURPLE,SMALL,DIP,ADULT,F PURPLE,SMALL,DIP,CHILD,F PURPLE,LARGE,STRETCH,ADULT,T PURPLE,LARGE,STRETCH,CHILD,F PURPLE,LARGE,DIP,ADULT,F PURPLE,LARGE,DIP,CHILD,F

Con los datos anteriores generamos el archivo arff que ser la base de datos de weka para generar el rbol de desicin. Nos queda un archivo con el siguiente contenido:
@RELATION Ballons @ATTRIBUTE @ATTRIBUTE @ATTRIBUTE @ATTRIBUTE @ATTRIBUTE color {YELLOW,PURPLE} size {LARGE,SMALL} act {STRETCH,DIP} age {ADULT, CHILD} Inflated {T,F}

@DATA YELLOW,SMALL,STRETCH,ADULT,T YELLOW,SMALL,STRETCH,CHILD,T YELLOW,SMALL,DIP,ADULT,T YELLOW,SMALL,DIP,CHILD,T YELLOW,LARGE,STRETCH,ADULT,T YELLOW,LARGE,STRETCH,CHILD,F YELLOW,LARGE,DIP,ADULT,F YELLOW,LARGE,DIP,CHILD,F PURPLE,SMALL,STRETCH,ADULT,T PURPLE,SMALL,STRETCH,CHILD,F PURPLE,SMALL,DIP,ADULT,F PURPLE,SMALL,DIP,CHILD,F PURPLE,LARGE,STRETCH,ADULT,T PURPLE,LARGE,STRETCH,CHILD,F PURPLE,LARGE,DIP,ADULT,F PURPLE,LARGE,DIP,CHILD,F

Guardamos el archivo con extension *.arff, por ejemplo: Balloons.arff.

Ahora procedemos a crear el rbol en weka, para ello, primero abrimos weka, seleccionamos la opcin Explorer hasta llegar a una interfaz como la siguiente.

Abrimos el archivo de base que creamos desde Open File y seleccionamos nuestro archivo. Una vez cargado veremos algo como lo siguiente:

Nos posicionamos en la pestaa Clasify y seleccionamos un algoritmo clasificador. Para este caso seleccionamos el algoritmo J48 que est dentro de la seccin Trees (rboles).

A continuacin ejecutamos el clasificador sobre el atributo Inflated que es nuestra clase y veremos lo siguiente:

Despus damos clic derecho sobre el elemento en la lista y seleccionamos la opcin Visualize tree.

Nos resulta un rbol como el siguiente:

Conclusiones

S-ar putea să vă placă și