Documente Academic
Documente Profesional
Documente Cultură
DPTOIA-IT-2009-06
julio, 2009
Tag’s Jerárquicos
(Visualización de Datos Mediante Nubes de
Etiquetas)
Luis R. Chinchilla H.
Máster en Sistemas Inteligentes
Este artículo ofrece un poco de historia sobre las nubes de etiquetas, sus categorías, sus
ventajas, sus deficiencias y también algunas sugerencias para el etiquetado de datos y enlaces
de una forma más profunda y efectiva. Y de cómo esta “alternativa” puede llevarse a aplicar al
filtrado de etiquetas jerárquicos (Tag’s Jerárquicos), utilizando sus rasgos más importantes de
visualización, con el objetivo de que el usuario a simple vista identifique los temas más
importantes.
“La visualización tradicional de datos se centra en hacer resumen de los números y las relaciones
en concreto; el objetivo es poner de relieve al mismo tiempo importantes patrones
en representación de los datos con exactitud. Este es un fino enfoque en ciencias sociales para
estudiar la dinámica de las interacciones en línea. Sin embargo, para nuestro propósito también
es importante que la visualización intuitiva evoque una respuesta que representa el sentir de la
conversación, así como la de representar su dinámica.” [5]
1
TagCloud o Tagging: (Termino en Ingles) es el proceso de etiquetado de datos con palabras clave relacionadas. La
idea básica de la nube de etiquetas es representar a las etiquetas de acuerdo a su significado, su peso y su frecuencia en
relación con otras etiquetas. Esto se hace con los tamaños de fuente y colores. La más importante etiqueta, es la más
grande en tamaño y más fuerte en color en aparecer (o al menos debería aparecer).
1. Tag´s Jerárquicos
Las TagCloud o Nubes de Etiquetas aparecen cada vez con más frecuencia. Muchos se oponen por
encontrarlas obsoletas, pero otros ya han visto que hay algo detrás de este recurso. Es bueno saber que las
TagClouds son algo más que nubecitas de palabras: tienen una gran utilidad y son fáciles de implementar
en un sitio web.
El invento de este sistema se lo debemos a Jim Flanagan [3] y fue implementado por primera vez en el sitio
de intercambio de imágenes Flickr. Las TagClouds fueron popularizadas por Technorati entre otras
empresas y hoy en día se pueden ver en miles de sitios. Son una herramienta visual que agrupa etiquetas o
“tags” que están asociadas entre sí por pertenecer a un mismo contenido. En esta Nube que se genera
podemos ver tres grados de palabras, distinguidos generalmente por tamaño. Las más pequeñas son las
menos buscadas; las de mayor tamaño se reconocen como tags populares.
Las Nubes de Etiquetas nos permiten ver la relación de los tags entre sí. Es importante seleccionar una
correcta forma de visualización que se entienda a simple vista. Algunos deciden darle determinado color
a los tags más populares y otro a los menos solicitados; sin embargo está comprobado que la mejor
manera de mostrar las diferentes categorías de tags es dando mayor o menor tamaño de tipografía a
las palabras. De esta manera se hace evidente para todos cuáles son los tags más populares y cuáles no.
¿Y para qué nos sirven realmente las Nubes de Etiquetas? Bueno, en primer lugar nos permiten acceder al
contenido más importante rápidamente, pero también dejan ver qué palabras son populares en este
momento y qué palabras no. Al implementar Nubes de Etiquetas en un sitio, se puede optar por dos
modalidades: Tags emergentes y “All-time tags”:
Tags emergentes
La categoría de Tags emergentes reúne a todos los tags que cuentan con una popularidad en crecimiento.
Teniendo como referencia varios sitios de la misma temática que hayan implementado Nubes de Etiquetas,
podemos ver que hay algunas palabras populares que se repiten y otras palabras que están “emergiendo”
hacia la popularidad. Y esta información es muy valiosa porque se puede trasladar a otros terrenos. Así,
Tim O’Reilly –investigador y consultor en marketing, e-comerce y desarrollo web– declaró en una de sus
conferencias que él mismo había encontrado una gran utilidad en las Nubes de Etiquetas. Viendo la
creciente popularidad del tag Ajax, pudo predecir que si escribía un libro sobre el tema, iba a tener un
notable número de ventas. Así fue
-1-
Tag’s Jerárquicos (Nube de Etiquetas)
En los Tags emergentes, los tags más populares varían más y hay más cambios en la Nube. Esto es porque
el sistema considera las últimas entradas de los usuarios. ¿Qué genera esto? Que los tags populares sean
los populares en ese momento, no lo populares de hace unas semanas.
All-time tags
En las llamadas “All-time tags”, al contrario de las emergentes, aumentar de categoría lleva tiempo: el
sistema toma en cuenta no sólo las últimas entradas de los usuarios, sino un balance de la cantidad total
de entradas. Las TagClouds de Flickr están basadas en este sistema.
Pero además de su utilización en el sector del marketing directo, las Nubes de Etiquetas también nos
ayudan a conocer qué es lo que buscan los usuarios en nuestro sitio. Si sabemos cuáles son las palabras
más buscadas podemos atraer aún más la atención de los interesados generando contenido especial sobre
el tema en cuestión. A su vez, el webmaster puede incorporar publicidad interna desde el tag más popular
a otras secciones del sitio que quiera promocionar. Es cuestión de ver todas las posibilidades que nos
brinda esta sencilla herramienta y exprimirla al máximo.
En comparación con los patrones convencionales de navegación, las nubes de etiquetas no ofrecen
necesariamente una opción más cómoda e intuitiva en la navegación. Sin embargo, utilizado
correctamente, pueden proporcionar a los visitantes una instantánea ilustración de los temas principales,
dando una muy concreta y precisa orientación de los contenidos del sitio Web. Dado que los seres
humanos tienden a pensar en conceptos y modelos, es más fácil hacerse una idea del contenido, si
presentan los principales conceptos se presentan de inmediato - en piezas digeribles, y priorizados por su
peso. De hecho, la principal ventaja de las nubes de etiquetas se encuentra en su capacidad para destacar
los más importantes y/o temas populares, dinámica que no es el caso de los menús de navegación
convencionales.
Hay una variedad de formas de aplicar la nube de etiquetas. Algunos métodos son más populares que las
de los demás. La mayoría de las nubes son los principales ordenados alfabéticamente.
En la primera vista el etiquetado puede parecer una tarea simple: se tiene una base de datos, se describe,
se encuentran las palabras claves adecuadas, se añade las etiquetas, y listo. Sin embargo, aunque el
etiquetado en sí es muy potente, también tiene algunas deficiencias. El problema es que el lenguaje
natural que utilizamos es ambiguo. Si bien el etiquetado de datos con etiquetas hacen mejor la
comprensión de estos datos y estas etiquetas. Sin embargo, las palabras clave por lo general no son
suficientemente específicas.
“diseño” Por ejemplo, no es claro si la etiqueta de " diseño" se relaciona con el diseño gráfico, diseño web,
diseño de software o el diseño de arquitectura de hardware. La mayoría de las palabras tienen varios
significados diferentes por lo que la calidad de la nube de etiquetas se va desordenado y resulta inútil una
vez que la etiqueta de datos contiene demasiadas etiquetasen común.
Para limpiar y mantener una estructura jerárquica de las nubes de etiquetas se necesita seguir algunas
sencillas instrucciones. “Conceptos pueden ser descritos en una variedad de maneras, pero dar al
concepto el peso que merece”, así que es necesario agrupar etiquetas similares y elegir una única etiqueta
que identifique al grupo.
Una de las aplicaciones en donde se pueden ver útiles las nubes de etiquetas, como antes se había dicho
en la identificar información relevante, esto es de acuerdo al tamaño y el color de su letra, estas etiquetas
se muestran en ordena aleatorio o ordenadamente, y la mayoría de ellas tiene relación entre sí. Sin
embargo, que pasa cuando ocurren casos como anteriormente se vio, cuando una etiqueta es ambigua y
no se sabe a qué se refiere, una de las soluciones que se ha dado es la de organizar las nubes de etiquetas
mediante grupos, en la que la etiqueta principal representa y da como categoría principal a las demás
etiquetas.
Subgrupos de etiquetas
Etiqueta Raíz
Como vemos en la ilustración 2, aquí se muestra una etiqueta principal que agrupa una colección de
etiquetas que tiene relación a ellas, y dentro de estas se forman nuevos grupos o colecciones que siguen el
mismo patrón que se etiqueta raíz.
Basándose en el análisis de simple de texto, los sinónimos pueden ser controlados agrupando etiquetas
semánticamente similares en grupos, por ejemplo; favorite and favorites, rock and roll and rock n roll. Esto
también ayuda a eliminar un poco la ambigüedad entre las etiquetas, por ejemplo; pocos usuarios saben
que “música electrónica” y “Intelligent dance music (IDM)” representan un mismo género de música,
mediante la agrupación de las etiquetas el usuario puede ver que estas dos etiquetas están en el mism o
grupo, indicando que tienen el mismo significado. Y como extra este se le brinda al usuario conocimiento
adicional, en este caso sobre música.
2. Caso de Estudio
Continuando con el tema de etiquetas que tiene una estructura jerárquica y utilizando como medio de
visualización las nubes de etiquetas, se ha llevado en práctica un caso de estudio sobre la información
contenida en el sitio web www.java2s.com. Este sitio contiene información acerca de códigos de fuentes de
los lenguajes de programación más usados, base de datos, artículos, productos y una gran variedad de
información sobre el campo de programación (Java, C++, Visual Studio, PHP, XML, HMTL, SQL SERVER,
etc.), la información en el sitio se encuentra organizada en categorías, y cada categoría contiene una serie
de tópico, cada tópicos contiene una variedad de temas y cada tema contiene como resultado final:
códigos fuentes, artículos, etc.
La dinámica del sitio para encontrar la información que se necesita es muy sencilla, se busca la categoría
(“Java”), se muestra los tópicos que pertenecen a la categoría (“3D, Ant, Chart, Class, etc..), de la lista de
tópicos se selecciona un tópico (“3D”) y este tópico se muestran los temas contenidos en el, una vez que
hemos llegado al tema que necesitamos, se selecciona y este muestra la información que se estaba
encontrando (“Spheres, cylinders, and cones of different resolutions and colors”).
Este tipo de presentación de la información es muy común en los sitios web, lo cual lleva que el usuario
buscar primero la categoría que se desea e ir bajando hasta los niveles inferiores para llegar a la
información que se necesita, uno de los problemas que se presenta es que inicialmente se le muestra al
usuario toda la colección de categorías, y cada vez que se va yendo a los niveles inferiores se vuelve a
repetir lo anterior, se sobrecarga al usuario de información que no se necesita, o en el caso que es la
información que se necesite no se le ofrece a primera vista cuales son las categorías, tópicos o temas con
mayor relevancia.
Así uno de los propósitos de este artículo es la de presentar una alternativa de poder realizar las búsqueda
dentro de este sitio con mucha más detalle y eliminar la información que no sea necesaria, así como la de
dar relevancia a temas que podrían interesar al usuario. Para llevar a cabo esta alternativa se tomo como
método de visualización nubes de etiquetas, con el propósito de que le permita al usuario tener de entrada
que etiquetas tiene más relevancia con tan solo ver su tamaño y su color.
Nivel Inicial
Nivel Intermedio
Nivel Final
Etiquetas Seleccionadas
Nota: Por cada grupo de la jerarquía de etiquetas se crea una nueva nube de etiquetas.
Ilustración 6: Tag's Jerárquicos mediante Nube de etiquetas y Barras de Navegación, selección múltiple de
etiquetas
Para el caso en donde no se muestran las etiquetas del nivel anterior, se cuenta con una vista miniatura de
nivel anterior, con esta vista miniatura se puede interactuar ya que aparecen las etiquetas que se
seleccionaron para generar las nuevas nubes de etiquetas, así que si en esta vista se afecta la selección este
ocasiona que las nubes de etiquetas se vean afectadas también, mostrando solamente las etiquetas de las
seleccionadas del nivel anterior. Además, se cuenta con una estructura árbol, en donde se ilumina en qué
nivel de la estructura jerárquica se encuentra actualmente.
Ilustración 7: Tag's Jerárquicos mediante Nube de etiquetas y Barras de Navegación, vista miniatura y
indice de niveles
Este prototipo brinda al usuario poder navegar tanto en niveles siguientes y niveles anteriores, además
permite ordenar (Ascendente o descendentemente) las etiquetas de las siguientes maneras:
De forma default (según creación inicial de la nube de etiqueta)
Por orden alfabético
Por el tamaño de letra de las etiquetas
Por el valor de peso de la etiqueta
Además, se pueden realizar búsquedas dentro de las nubes de etiquetas, resaltan las etiquetas que
cumplas con el criterio de búsqueda (Color fuerte para las coincidencias y débil para las que no)
Descripción detallada del prototipo (Tag's Jerárquicos mediante Nube de etiquetas y Barras de
Navegación):
Ordenamiento de etiquetas, si la flecha se encuentra habilitada, Permite moverse entre los niveles,
esta solo ordena las etiquetas de la barra de navegación activa tanto anteriores y siguientes
Permite cambiar el estilo de las barras de navegación (ExploreBar, Búsqueda de etiquetas, si la flecha se
SideBar, NavigationPane). Además, con la opción “Skins” cambia el encuentra habilitada, solo busca dentro de la
aspecto de la ventana. barra de navegación activa.
Esta alternativa anquen resuelve algunos problemas del prototipo anterior, aunque sigue presentando
algunos problemas:
Aun se pierde contexto de los niveles de la jerarquía, ya que solo presenta una vista del nivel
anterior y el siguiente.
La variedad de colores de las etiquetas no brindan información extra.
Una de sus ventajas es que maneja muy bien las grandes colecciones de etiquetas y lleva un control sobre
los niveles de las etiquetas. Como mejora se podría dar utilidad a la variedad de colores, indicando que un
grupo de colores tiene una relación o interés común, ejemplo para el tópico “java” este presenta temas
como el manejo de ambientes “2D” y “3D”, estas tiene un interés común que es el manejo de las
dimensiones, así que podrían identificar colocando un mismo color para estas etiquetas.
Al presionar la etiqueta de un disco, este obtiene el foco y se despliegan sus etiquetas (siempre utilizando
nube de etiquetas), estas etiquetas se colocan dentro del disco que las contiene de forma aleatoria
(identificando cada etiqueta mediante un adecuado tamaño de letra). Cada vez que un grupo obtiene el
foco, los discos se reordenan.
La variedad de colores de las etiquetas no brindan información extra (sirven únicamente para
visualización).
No se comporta muy bien con grandes cantidades de datos, ya que necesita un gran espacio
físico para generar los discos.
No se tiene idea de las etiquetas de los demás discos, hasta que se le proporciona el foco.
3. Conclusiones
En este artículo se investigo maneras en las cuales se pueden aplicar las nubes de etiquetas y de utilizar
agrupamiento de etiquetas para dar una mejor visualización de la información, además mostrar el
rendimiento de las TagCloud para el entendiendo y dar una alternativa para visualizar etiquetas con
estructura jerárquica. Se presentan algunas anotaciones sobre la investigación:
Se debe tener cuidado al utilizar variedad de colores, Los visitantes tiene que ser capaces de obtener una
inmediata compresión de cómo se distribuyen los pesos de las etiquetas; una variedad de colores no
proporciona ninguna información útil. Se hacen las siguientes preguntas: ¿Qué significado tienen los
colores utilizados? ¿El color verde es más importante que el color azul? Se recomienda que a lo mucho
entre 2 a 3 colores sean utilizados para distinguir las etiquetas de la nube.
Mediante una estructura jerárquica, el usuario llega a un mejor entendimiento, especialmente relacionando
categorías, además el usuario puede realizar mejor las búsquedas con el menor porcentaje de problemas
de ambigüedad.
4. Referencias
[2]. TagClusters: Semantic Aggregation of Collaborative Tags beyond TagClouds, Ya-Xi Chen, Rodrigo
Santamaría, Andreas Butz, Roberto Therón. Media Informatics, University of Munich, Department of
Informatics and Automatics, University of Salamanca
[4]. Tag Clouds Gallery: Examples And Good Practices, By Smashing Editorial, November 2007,
http://www.smashingmagazine.com/2007/11/07/tag-clouds-gallery-examples-and-good-practices/
[5]. Hearst M. A. What’s up with Tag Clouds? May 2008. Accessed December 30, 2008.
http://www.perceptualedge.com/articles/guests/whats_up_with_tag_clouds.pdf.
http://www.ddss.nl/Weimar/staff/Dirk.Donath
[6]. http://codigofuentes.blogspot.com/2009/04/tags-jerarquicos-nube-de-etiquetas.html
[7]. http://sethgoldstein.wordpress.com/2006/11/10/mf-2006-api-naturalexpression/