Sunteți pe pagina 1din 12
Taxonomías y Metadata en la Gestión de Contenido Empresarial Documento de Conceptos y Mejores Prácticas

Taxonomías y Metadata en la Gestión de Contenido Empresarial

y Metadata en la Gestión de Contenido Empresarial Documento de Conceptos y Mejores Prácticas Enero 2007

Documento de Conceptos y Mejores Prácticas

Enero 2007

Versión 2.0

1

Taxonomías y Metadata – Conceptos y Mejores Prácticas

Taxonomías y Metadata en la Gestión de Contenido Empresarial Introducción El contenido electrónico que manejan

Taxonomías y Metadata en la Gestión de Contenido Empresarial

Introducción

El contenido electrónico que manejan las empresas ha crecido en los últimos años de forma abrupta. El hecho de manejar demasiada información representa un gran problema en las empresas “conectadas” de hoy en día. Las dificultades para catalogar y recuperar información no estructurada efectivamente es un problema eterno.

Se estima que un empleado promedio destina 15% de su tiempo, o seis horas a la semana, en busca de información y que el 50% de las búsquedas que realiza fallan en encontrar la información deseada. Eso significa que sus trabajadores desperdician el 7,5% de su jornada laboral porque no encuentran la información que necesitan. Ahora calcule el 7,5% de su nómina salarial y eso es cuanto usted está perdiendo cada año por búsquedas ineficaces.

Por más alto que este costo parezca, no representa su costo real. El costo real de no tener un acceso efectivo a la información proviene de:

Duplicar trabajos pre-existentes porque alguien no lo pudo encontrar en una búsqueda de texto Re-comprar productos de información que ya había adquirido pero que no pudo encontrar en la red Decisiones inconsistentes basadas en documentos distintos Oportunidades perdidas por no haberlas detectado a tiempo debido a la inhabilidad para encontrar información

Todos estos costos son evitables. Y la respuesta está en la clasificación de sus documentos. Si usted organiza su propia información, ¿porqué esperar menos del contenido corporativo?

Taxonomías

¿Qué es exactamente una taxonomía? En términos generales, una taxonomía es una estructura jerárquica de categorías siguiendo un protocolo de género-especie o general- específico. Permite clasificar los documentos de acuerdo a su contenido. Por lo tanto, es parte inherente de cualquier sistema complejo de gestión de contenidos. Gracias a la

2

Taxonomías y Metadata – Conceptos y Mejores Prácticas

taxonomía se organiza la estructura y se guía el indexado, etiqueta do y asociaciones del

taxonomía se organiza la estructura y se guía el indexado, etiquetado y asociaciones del contenido.

¿Qué preferiría usted, tener que realizar una búsqueda dentro de un conjunto de 20.000 documentos, o que los mismos se presenten en categorías que lo ayuden a estrechar su búsqueda y descubrir documentos nuevos y relacionados?

Ya sea para encontrar información, entrar en acción o producir resultados, las taxonomías y la clasificación son la solución. Los beneficios son simples: proveen la estructura y organización que hacen que la información empresarial sea manejable, usable y por ende más valiosa.

Una buena taxonomía también puede mejorar el proceso de decisión. Puede encuadrar la manera en que las personas toman decisiones, y ayudarlos a encontrar la información que necesitan para tener en cuenta todas las alternativas posibles. Con una buena taxonomía, los tomadores de decisiones disfrutan una nueva perspectiva.

Metadata

Para manejar, manipular e integrar la información se necesita nombrarla y describirla. Estos nombres y descripciones son “metadata” literalmente, información de la información.

En una organización, la metadata es utilizada por cualquiera que trabaje con información, ya sea estructurada o no estructurada. Esto es siempre así, aunque no utilicen específicamente el término metadata, aunque la metadata este guardada separada de la información, o aunque las personas no puedan distinguir entre la información que usan y como la nombran o la describen.

La metadata es un factor crítico de éxito en la estrategia de gestión de contenidos. Es más que información de la información, es cómo está codificado el conocimiento de la organización, y puede ser utilizado para determinar no solo lo que el contenido es sino quién lo usa, cómo lo usa, cómo será entregado y cuándo, etc

3

Taxonomías y Metadata – Conceptos y Mejores Prácticas

El empezar? desafío de diseñar y constr uir una taxonomía. ¿Por donde Embarcar un proyecto

El

empezar?

desafío

de

diseñar

y

construir

una

taxonomía.

¿Por

donde

Embarcar un proyecto de creación de una taxonomía puede ser intimidante, ya sea empezando desde cero o utilizando taxonomías ya existentes. Existen tres conceptos básicos a tener en cuenta para un proyecto exitoso de taxonomías.

1.- Definir un equipo de proyecto

En el ambiente corporativo, el desarrollo de una taxonomía es una actividad multi- disciplinaria que cruza las fronteras y líneas de la organización. Un equipo típico de taxonomía consiste en representantes de las siguientes especialidades:

IT: Arquitectura y gestión de la información; gestión de contenidos, gestión de metadata Biblioteca o centros de información Web Site Comunicaciones corporativas Editores, Escritores, Publicadores

En definitiva, se puede asignar la tarea a cualquiera en la organización que tenga un conocimiento profundo del contenido empresarial. La construcción de una taxonomía incluye tecnología y es un proceso iterativo, por lo tanto la participación del staff de IT es de gran ayuda.

2.- Analizar dependencias, planificar el proyecto

Lo más importante es darse cuenta que lo proyectos de taxonomías casi nunca empiezan desde cero. Existe un número de recursos internos y externos que asisten en el diseño de la taxonomía. Si no se toma el tiempo para analizar y planificar el proyecto, seguramente perderá más tiempo re-creando lo que ya tiene. Una buena práctica en el planeamiento de una taxonomía es pensar globalmente, pero actuar localmente.

Tareas a realizar durante el planeamiento:

4

Taxonomías y Metadata – Conceptos y Mejores Prácticas

Defina el propósito de la taxonomía que esta construyen do y sus objetivos: o Un

Defina el propósito de la taxonomía que esta construyendo y sus objetivos:

o Un enunciado claro de porqué y para qué se construye la taxonomía ayudará a no perder el rumbo en los momentos de debate acerca de cómo debe

estructurarse la taxonomía, con qué nivel de apertura, etc. Desarrolle un plan para analizar contenido y necesidades del usuario:

o Es de vital importancia establecer un inventario lo más exhaustivo posible de los tipos de contenidos que serán organizados en la taxonomía, así como quiénes serán los usuarios y los criterios más comunes por los que estos usuarios intentarán buscar estos contenidos. Establezca roles y responsabilidades:

o Defina claramente y en forma temprana “quién hará qué”.

Capacite al equipo de trabajo: propósitos de la taxonomía, características,

aplicaciones y funciones. Analizar relación entre metadata y taxonomías:

o No es aconsejable separar ambos análisis. Ambos conceptos están íntimamente relacionados y deben estar diseñados en forma coherente, en base a un análisis conjunto.

3.- Desarrollar la taxonomía

Una vez conformado el equipo, analizadas las dependencias y realizado el planeamiento, se debe comenzar a construir la taxonomía. Esta etapa se puede dividir en cuatro pasos:

a. Creación de la taxonomía

Las dos tareas más importantes para crear una taxonomía son:

i. Crear categorías y asignar jerarquía: la necesidad de categorizar y posicionar los contenidos en las resultantes taxonomías requiere una clasificación cuidadosa y deliberada de cada fuente de información. La asignación de etiquetas (metadatos) que unen el contenido con una categoría específica representan un esfuerzo necesario para la creación de una taxonomía.

ii. Crear las reglas que caracterizan las categorías y los documentos que serán asignados a ellas: la idea es definir las reglas que deberán seguir los usuarios a la hora de definir en qué categoría de la taxonomía ingresarán un contenido. Las reglas pueden consistir en términos sinónimos y acrónimos, que conducen los documentos a la categoría apropiada. Por ejemplo, para una categoría denominada “FAQ”, la reglas a crear incluirán “frequently asked questions”, “faq”, “preguntas frecuentes” y otros términos usados comúnmente para referirse a las FAQ. Adicionalmente puede tratarse de reglas de negocio, tales como definir

5

Taxonomías y Metadata – Conceptos y Mejores Prácticas

relaciones entre categorías de la ta xonomía y tipos ya pre-establecidos de documentos (“todos los

relaciones entre categorías de la taxonomía y tipos ya pre-establecidos de documentos (“todos los materiales de capacitación a usuarios deben ser bajo la categoría “Capacitación”). Regular cuidadosamente el uso de cada categoría permite encaminarse hacia una terminología corporativa, a un estándar de clasificación, que asegura poder encontrar los documentos en la categoría dónde deben estar.

b. QA de la taxonomía

Este es uno de los pasos más importantes antes de publicar una taxonomía para su uso:

testearla para asegurarse la calidad. Durante esta fase, expertos en la materia deben:

Revisar la taxonomía poblada de datos Clickear en cada categoría Reveer los documentos Verificar que los documentos se encuentren en sus respectivas categorías Verificar si existe la necesidad de crear nuevas categorías Verificar si hay demasiados documentos en una categoría Documentar todo lo que encuentra, los cambios que realiza y por qué los realiza

En cada caso, se deben refinar las reglas que se definieron, crear sub-categorías adicionales o eliminar categorías.

c. Publicación de la Taxonomía

Una vez finaliza la etapa de QA, se procede a publicar la taxonomía a los usuarios finales. Si bien la mayoría esta familiarizado con el uso de taxonomías, no esta de más tener en cuenta lo siguiente:

Distribuya tutoriales para el uso, navegación y búsqueda de información en las taxonomías Implementar un mecanismo de feedback y sugerencias de parte de los usuarios finales Trabaje en conjunto con el equipo de proyecto y el de calidad para realizar chequeos Implemente un programa de satisfacción del usuario

d. Mantenimiento de la Taxonomía

6

Taxonomías y Metadata – Conceptos y Mejores Prácticas

El trabajo no finaliza con la pu blicación de la taxo nomía. A través del

El trabajo no finaliza con la publicación de la taxonomía. A través del tiempo los usuarios crearán documentos sobre productos, tecnologías, clientes, mercados, etc. La forma en que los usuarios usan el contenido cambiará continuamente, por lo tanto es necesario invertir en mantenimiento de modo de que la taxonomía continúe siendo relevante y utilizable. El tiempo dedicado al mantenimiento de la taxonomía dependerá de su tamaño, la volatilidad del contenido, la dedicación de recursos y la frecuencia con la que se agrega contenido.

Establezca auditorías regulares de la taxonomía Establezca procesos de mantenimiento y colaboración Revise las sugerencias de los usuarios y realice cambios si es necesario Distribuir las tareas de mantenimiento entre los expertos de cada categoría simplifica el proceso

Regla de Diseño de las Taxonomías – “10 x 4”:

Existe una regla general que surge de la experiencia de los usuarios, que dice que desde el punto de vista de un usuario promedio una taxonomía bien diseñada nunca presentará más de 10 tópicos o nodos en cualquier nivel de la taxonomía, y que cualquier “ruta” no debiera contener más de 4 niveles (un usuario no irá nunca más allá de 3 o 4 niveles para buscar información). Claro está esto coloca un desafío para colecciones de contenido altamente diversas y detalladas, y debe ser tomada tan solo como una referencia.

Taxonomías en COLDview:

En particular la aplicación en COLDview de las Taxonomías presenta otro impacto, más allá de los conceptos hasta aquí planteados. Se trata de la relación entre las categorías o nodos de la taxonomía COLDview con la Seguridad de Acceso.

El objetivo de esta relación es poder establecer un control sobre qué documentos son accedidos (o publicados) por cada usuario. Esto se resuelve en COLDview indicando en las herramientas de Administración de Seguridad para cada Perfil de Usuario, en qué nodos de la taxonomía dicho usuario podrá:

o

Publicar documentos; y/o,

o

Consultar documentos; y/o,

o

Descargar documentos (“download”); y/o

o

Eliminar documentos.

Es importante destacar que a efectos de mantener la flexibilidad esta definición no es “jerárquica”, es decir que la habilitación a un nodo “padre” no implica la habilitación automática a todos sus “hijos”. Podría entonces darse acceso al nodo padre, y a alguno de los nodos hijos (o a ninguno de ellos). Por el contrario podría no darse acceso a un nodo superior y sí a alguno de nivel inferior en la jerarquía de la taxonomía.

7

Taxonomías y Metadata – Conceptos y Mejores Prácticas

También es importante mencionar que cada usuario visualizará solamente los nodos o categorías a los

También es importante mencionar que cada usuario visualizará solamente los nodos o categorías a los que está habilitado.

Nota – Perfiles de Usuarios:

Se entiende por Perfil de Usuario a una agrupación de usuarios. De este modo se definen Perfiles a los que luego se le asignarán múltiples usuarios, los que heredarán las características de seguridad definidas en el Perfil.

Categoría de Acceso:

Existe un tipo de metadata especial en COLDview que permite calificar o categorizar un documento al momento de su publicación de acuerdo a su nivel de confidencialidad. De este modo un documento puede ser categorizado como Confidencial, o como Secreto, etc. En las herramientas de Administración de Seguridad se podrá limitar para cada categoría o nodo de la Taxonomía, y en cada Perfil de Usuario, a qué Categoría de Acceso de los documentos podrá consultar. De este modo podría por ejemplo restringirse que cierto grupo de usuarios no visualice documentos categorizados como “confidenciales”.

Metadata: mejores prácticas y estrategias de diseño

A partir de aquí lo guiaremos en como definir una estrategia de implementación de metadata que se ajuste a las necesidades de su organización Se ampliará el concepto de metadata, se detallarán los desafíos e inconvenientes que la rodean y se definirán las mejores prácticas asociadas a la implementación de metadata.

Concepto

Existe un pensamiento común alrededor del concepto de metadata: en la mayoría de las organizaciones la metadata es frecuentemente malentendida, no utilizada y desaprovechada por aquellos que podrían beneficiarse de ella. Esto ocurre principalmente por que no se logró una buena estrategia de implementación. Existe la tendencia a complicar demasiado el concepto de metadata, haciéndolo poco entendible para la mayoría de los usuarios finales.

El concepto principal de metadata es comúnmente referido a “información de la información”. En resumen, es cualquier atributo que describe a un documento. Este documento que usted está leyendo en este momento tiene un título, un autor, un nombre de archivo, una descripción, una fecha en el que fue creado, un campo de búsqueda, palabras relacionadas, y cualquier otro atributo. Eso es metadata. Debido al impacto que tiene la información, necesitamos metadata más que nunca. Los valores que provee son:

8

Taxonomías y Metadata – Conceptos y Mejores Prácticas

• Integración e interoperabilidad: Las organizaciones que generan cantidades masivas de datos pueden utilizar

Integración e interoperabilidad: Las organizaciones que generan cantidades masivas de datos pueden utilizar metadata como lenguaje común para combinar los documentos en diferentes repositorios, logrando una integración. A través de la descripción consistente de la información los documentos se pueden combinar más allá de su diversidad geográfica, funcional u organizacional.

Gestión: La metadata cobra más importancia especialmente en aquellas organizaciones que tengan que cumplir con regulaciones como Sarbanes-Oxley, teniendo la posibilidad de mantener un registro y control de los documentos. Mediante la metadata se puede inculcar a la organización a tener una contabilidad de los documentos, controlar el versionado y cumplir con los procedimientos de seguridad. Esto se traduce en beneficios directos, ya que el tiempo utilizado en rehacer documentos o usar documentos incorrectos se reduce.

Filtrado y categorización: Nos acerca la idea de recuperar documentos con mayor facilidad. Una buena metadata se complementa con la taxonomía, permitiendo a los usuarios navegar de forma intuitiva a través de la misma estrechando los campos de búsqueda para obtener información exacta.

En general hay tres tipos de metadata:

Metadata descriptiva: Se utiliza para describir objetos/documentos con el propósito de identificarlos y recuperarlos. Puede incluir elementos como título, descripción, autor, palabras clave, etc. Generalmente, es el tipo de metadata que un usuario final utilizará para buscar un objeto.

Metadata estructural: Se usa para indicar la relación lógica entre objetos, por ejemplo la secuencia de páginas para un grupo de imágenes de un libro. Permite describir el contenido por agrupamientos, ya sea capítulos, secciones, expedientes, carpetas, etc. La metadata estructural especifica una presentación coherente del contenido digital.

Metadata administrativa: es la información utilizada para la gestión de los documentos y el control de acceso a los mismos. Puede incluir información sobre cómo y cuando fue generado el archivo, el tipo de formato y otra clase de información técnica. También información sobre derechos de autor y de preservación a largo plazo de los objetos digitales. Campos de metadata administrativa muy útiles son el “Estado” y la “Versión” del documento, permitiendo describir en que fase o etapa se encuentra un documento o a que versión corresponde, siendo esta última de reconocimiento automático a igualdad de características de un documento.

9

Taxonomías y Metadata – Conceptos y Mejores Prácticas

Mejores Prácticas

Mejores Prácticas

Existen muchas razones por la cual las organizaciones no obtienen valor de su metadata. ¿Como se revierte la situación? ¿Cuál es la clave? La respuesta está en simplificar la estrategia y considerar las necesidades de los usuarios finales. Las siguientes son mejores prácticas que pueden ayudar a la organización a recorrer el camino correcto en la estrategia de implementación de metadata.

Tómese el tiempo para definir los casos de uso de metadata: muchas organizaciones cometen el error de crear demasiados campos de metadata que nunca serán completados. Exigen demasiados detalles o definen procesos rigurosos que nunca serán realizados. Para que esto no ocurra trabaje con los verdaderos dueños del contenido: los usuarios finales. Trate de entender como lo clasifican, como lo buscan y como lo usan.

Empiece con una estrategia simple de metadata que soporte una evolución a través del tiempo: como se menciona arriba, muchas organizaciones tienden a complicar demasiado las estrategias, incluyendo muchos campos de metadata, y muchos pasos para el proceso de publicación. La idea es hacerlo simple, y dejar que crezca lógicamente a través del tiempo, en la medida que lo necesite.

Busque feedback de los usuarios finales y los publicadores: construya mecanismos de feedback para asegurarse que el sistema será intuitivo. Pregunte qué campos de metadata desearían adicionar, entre qué opciones de una lista desearían elegir. Instale el mensaje de que el feedback es crítico para hacer el sistema más funcional, y esté preparado para reaccionar. No sirve de nada recolectar feedback y luego no actuar sobre él.

Focalícese en la comunicación, educación, y capacitación durante el ciclo del proyecto: asegúrese que todos los usuarios responsables de publicar contenido entiendan por qué se les está pidiendo que completen metadata para sus documentos. Eduque a la organización acerca del valor de la metadata. Si los usuarios estuvieron involucrados en el proceso de definición de metadata responderán de manera rápida y favorable en este tipo de entrenamiento.

Defina un plan de seguridad para sus sistemas: mas allá de la cantidad de educación que se le brinde a aquellos que publican contenido, siempre habrá alguno que no realice un buen trabajo completando metadata. Para evitar esto defina un sistema de seguridad, autorizando a publicar sólo aquellos que realicen un buen trabajo. También se pueden realizar chequeos al azar de documentos para tener una

10

Taxonomías y Metadata – Conceptos y Mejores Prácticas

idea de cómo se están publicando e identi ficar a quienes no lo están haciendo

idea de cómo se están publicando e identificar a quienes no lo están haciendo bien. Se le debe dar importancia al rol de publicador.

Defina estándares que tengan sentido para todos los usuarios: asegúrese que los nombres se escriban siempre consistentemente, tanto el nombre de los archivos como el de los documentos. Asimismo defina estándares en el uso de acrónimos y abreviaciones. En resumen, trate de lograr una consistencia en la manera en que se debe completar cada campo. Esto conducirá a presentar la información de la misma forma a todos los usuarios y será familiar para ellos.

Limite al mínimo el uso de campos manuales de texto: aún los mejores encargados del contenido o publicadores tienden a ser menos exactos cuando deben completar más de 3 campos manualmente. Los campos que típicamente se deberían dejar para ser completados manualmente son Nombre o Titulo del Documento y Descripción. Las listas desplegables o valores por default ayudan a limitar el número de de campos manuales. Simplifique también esas listas al máximo posible. El objetivo no es tener una infinidad de opciones, sino que el usuario identifique rápidamente la opción que desea.

Piense en metadata como una pieza del sistema Taxonomía/Navegación: el uso más efectivo de la metadata se encuentra en la integración con la taxonomía y el motor de búsqueda. Los componentes deben ser considerados como complementos y en consecuencia tienen que ser diseñados en conjunto.

¿Como empezar?

1) Forme un equipo de metadata: Reúna un equipo con representantes de la organización que entiendan como funcionan los documentos. El equipo debería estar conformado por individuos que den a conocer las perspectivas del área que representan.

2) Eduque el equipo de metadata: Dedique tiempo a educar a todos los miembros acerca de los beneficios de la metadata, la problemática asociada y las mejores prácticas.

3) Defina el propósito del proyecto: planifique el proyecto y los esquemas que se construirán. Identifique los tipos de documentos que se van a publicar. Tenga en cuenta la audiencia (los usuarios) y el futuro.

11

Taxonomías y Metadata – Conceptos y Mejores Prácticas

4) Defina los casos de uso: Plan ifique de que manera los us uarios obtendrán

4) Defina los casos de uso: Planifique de que manera los usuarios obtendrán mayor valor de la metadata. Es decir, tener en cuenta cómo los usuarios clasifican la información, que campos utilizan o desearían utilizar para buscar un documento, etc.

5) Investigue campos potenciales de metadata: Que cada miembro del equipo confeccione una lista con los 10 campos que cree que se deberían incluir. Una vez que todos lo han hecho, que el grupo resuelva la diferencias entre ellos. De esta manera se pueden identificar los campos más relevantes.

6) Defina criterios de metadata: Para cada campo defina sus reglas y limitaciones

- Nombre del Campo

- Manual o Automático

- Tipo de campo (texto, fecha, lista desplegable, numérico, etc.)

- Formato

- Límite de caracteres

- Valores

12

Taxonomías y Metadata – Conceptos y Mejores Prácticas