Sunteți pe pagina 1din 205

Diseo y

desarrollo de
tesauros
Ana M. Martnez Tamayo
Paola V. Mendes
Ctedra de Organizacin del Conocimiento II
Departamento de Bibliotecologa
Facultad de Humanidades y Ciencias de la Educacin
Universidad Nacional de La Plata

Facultad de Humanidades y Ciencias de la Educacin


Universidad Nacional de La Plata
La Plata, Argentina, 2013

Libro publicado bajo Licencia CreativeCommons (CC) AtribucinNoComercialCompartirDerivadasIgual 3.0 http://creativecommons.org/licenses/by-ncsa/3.0/deed.es_AR

Prefacio

La presente obra, de carcter introductorio, est dirigida a estudiantes y


profesionales de Bibliotecologa, Documentacin o Ciencia de la Informacin de
lengua espaola, que se enfrentan por primera vez al tema del diseo y desarrollo
de tesauros.
Una objecin que puede hacerse a esta obra es que ya se han publicado otros
textos, de reconocidos autores, sobre este tema. Tambin existen diversas normas
de organismos normalizadores y especializados en esta rea, particularmente la
International Organization for Standardization (ISO) y la International Federation of
Library Associations and Institutions (IFLA). Varios de estos manuales y de estas
normas se citan aqu y nos reconocemos en deuda con todos ellos.
Sin embargo, como afirma un viejo refrn, cada maestrito con su librito. Nos
importa encuadrar el diseo y desarrollo de tesauros dentro del marco referencial
de

la

Organizacin

del

Conocimiento,

entendida

en

su

relacin

con

la

Bibliotecologa, la Documentacin y la Ciencia de la Informacin, tal como ha sido


recomendado por el IV Encuentro de Directores de Escuelas de Bibliotecologa y III
Encuentro de Docentes de Bibliotecologa del Mercosur, celebrado en Montevideo en
2000. Este marco referencial nos obliga a considerar el tesauro como un sistema de
organizacin del conocimiento y a usar una terminologa acorde.
Por otra parte, y a diferencia de los textos citados en esta obra, recogemos el
aporte de las nuevas normas de diseo y desarrollo de tesauros publicadas en este
siglo veintiuno, especialmente la norma internacional ISO 25964-1/2, que ha
puesto el nfasis en la publicacin electrnica del tesauro y en el aprovechamiento
de los recursos informticos para la interoperabilidad entre los tesauros y otros
sistemas de organizacin del conocimiento.
Por supuesto, tambin nos interesa reflejar nuestros puntos de vista, as como
las coincidencias y las diferencias con otros autores. Nada de esto va en detrimento
de otras ideas o posiciones.
En los captulos 1 y 2 hacemos una introduccin a la Organizacin del
Conocimiento, as como a sus sistemas y procesos. En el Captulo 3 se analizan
distintos enfoques con los que se han estudiado los sistemas de organizacin del
conocimiento. Estos tres captulos constituyen el marco de referencia en el que
insertamos el tesauro y su diseo y desarrollo.

Adentrndonos en el tema especfico de esta obra, en los captulos 4 y 5


ofrecemos una definicin de tesauro y su caracterizacin, as como una breve
resea de su origen y su razn de ser.
En el Captulo 6 presentamos el diseo y desarrollo de tesauros como una
cadena de procesos de organizacin del conocimiento, basndonos en conocidas
tcnicas de gestin. Un apartado especial en este captulo est dedicado al principio
de garanta en el que deben basarse todas las decisiones del diseo y desarrollo de
un tesauro.
En el Captulo 7 se profundiza sobre el vocabulario del tesauro, sus formas
gramaticales, la desambiguacin y la relacin de equivalencia. A continuacin, en el
Captulo 8 se procede a explicar las relaciones jerrquicas y asociativas, mientras
que en el Captulo 9, se describe el orden sistemtico, que hemos tratado de
relacionar de manera simple con el anlisis de facetas.
En el Captulo 10 nos referimos a la evaluacin, publicacin y actualizacin,
como procesos finales y continuos del diseo y desarrollo del tesauro. En el
Captulo 11 abordamos los modelos, mtodos, experiencias y dificultades de la
interoperabilidad

entre

el

tesauro

otros

sistemas

de

organizacin

del

conocimiento. Por ltimo, en el Captulo 12, resumimos las recomendaciones para


el programa informtico de gestin de tesauros y los modelos de datos propuestos
para su diseo y desarrollo.
Finalmente, queremos manifestar nuestro agradecimiento a la Facultad de
Humanidades y Ciencias de la Educacin de la Universidad Nacional de La Plata, en
especial a la Prosecretara de Gestin Editorial y Difusin, por la posibilidad que nos
han brindado de publicar el presente texto.
Es nuestro deseo que esta obra sea til para aquellas personas a las que est
dirigida. Tambin deseamos que pueda enriquecerse con las crticas, comentarios y
sugerencias que nos hagan conocer.

Las autoras

Tabla de contenido

Pgina
Prefacio

Etiquetas y smbolos usados en un tesauro


Aclaracin de abreviaturas y siglas
ndice de figuras y tablas

6
7
9

1. La organizacin del conocimiento


1.1 El trmino organizacin del conocimiento
1.2 Qu es la organizacin del conocimiento?
1.3 Organizacin del conocimiento vs. Organizacin de la informacin
1.4 Representacin y organizacin del conocimiento
1.5 Organizacin del conocimiento y gestin del conocimiento
Autoevaluacin
Apndice A: Alcance de la organizacin del conocimiento

11
11
12
19
20
22
24
25

2. Sistemas y procesos de organizacin del conocimiento


2.1 Sistemas de organizacin del conocimiento
2.2 Lengua natural y organizacin del conocimiento
2.3 Procesos de la organizacin del conocimiento
Autoevaluacin

28
28
34
37
42

3. Distintos enfoques para estudiar los SOC


3.1 Enfoque lingstico
3.2 Enfoque terminolgico
3.3 Enfoque bibliotecolgico
Autoevaluacin

43
43
47
53
57

4. El tesauro
4.1 Definicin y caracterizacin del tesauro
4.2 Componentes del tesauro
4.3 Las funciones del tesauro
4.4 Tipos de tesauros
Autoevaluacin

58
58
59
61
65
67

5. La historia del tesauro


5.1 El origen de la indizacin poscoordinada
5.2 El origen del tesauro
5.3 Las normas para el diseo y desarrollo de tesauros
5.4 Los tesauros en Argentina
Autoevaluacin

68
68
69
73
75
77

6. Diseo y desarrollo del tesauro


6.1 Consideraciones previas
6.2 Planificar el tesauro
6.3 Hacer el tesauro
6.4 Evaluar el tesauro
6.5 Actuar para mejorar el tesauro
6.6 Principio de garanta
Autoevaluacin

78
78
79
82
87
87
88
90

7. El vocabulario del tesauro


7.1 El trmino preferente
7.2 Formas gramaticales de los trminos preferentes
7.3 Singular y plural
7.4 Forma autorizada del nombre
7.5 Abreviaturas y sigla
7.6 Trminos multipalabra
7.7 Desambiguacin: calificadores y notas
7.8 Relacin de equivalencia
Autoevaluacin

91
91
93
96
98
100
101
105
109
112

8. Las relaciones jerrquicas y asociativas


8.1 Relacin jerrquica
8.2 Relacin asociativa
Autoevaluacin

113
113
118
122

9. El orden sistemtico del tesauro


9.1 Definicin y anlisis del dominio
9.2 Anlisis de facetas
9.3 Notacin
9.4 Principios del anlisis de facetas
Autoevaluacin

123
123
126
136
138
141

10. Evaluacin, publicacin y actualizacin del tesauro


10.1 Evaluacin del tesauro
10.2 Publicacin del tesauro
10.3 Actualizacin del tesauro
Autoevaluacin
Apndice B:Ejemplos de tesauros electrnicos

142
142
146
153
154
155

11. El tesauro y la interoperabilidad


11.1 Modelos estructurales de interoperabilidad
11.2 Mapeo equivalente
11.3 Mapeo jerrquico
11.4 Mapeo asociativo
11.5 Tesauros multilinges
11.6 Algunas experiencias de interoperabilidad con tesauros
11.7 Dificultades de la interoperabilidad entre SOC
Autoevaluacin

168
169
171
174
174
174
177
180
181

12. Software de gestin, modelo de datos y formatos de intercambio


12.1 Software de gestin
12.2 Modelo de datos
12.3 Desarrollo automtico de tesauros
Autoevaluacin
Apndice C: Modelos para tesauros

182
182
183
185
188
189

Bibliografa

191

Etiquetas y smbolos usados en el tesauro


A continuacin se muestran las etiquetas y smbolos utilizados para las notas,
notacin y relaciones. Estn basadas en la norma ISO 25975-1:2005, pero debe
tenerse en cuenta que las recomendaciones de la norma para el espaol no estn
completas. Por lo que hemos agregado de nuestra parte las etiquetas NH, TGE y
TEE.

Abreviaturas y siglas

AENOR Asociacin Espaola de Normalizacin y Certificacin


ANSI: American National Standard Institute
ARMARC Archivo de Autoridades de Materia en Formato MARC
ASC Afrika Studiecentrum
ASTIA: Armed Services Technical Information Abstracts
BC: Bibliographic classification
BMD: Bureau Marcel van Dijk
BNF Bibliothque Nationale de France
BS: British standard [norma britnica]
BSI: British Standards Institute
CAICYT: Centro Argentino de Informacin Cientfica y Tcnica
CAT Chinese Agricultural Thesaurus
CC: Colon classification
CDU: Clasificacin decimal universal
COSATI: Committee on Scientific and Technical Information
CRG: Classification Research Group
DCMI Dublin Core Metadata Initiative
DeCS: Descriptores en Ciencias de la Salud
DOI Digital Object Identifier
FRAD: Requisitos funcionales para datos de autoridad
FRBR: Requisitos funcionales para registros bibliogrficos
FRSAD: Requisitos funcionales para datos de autoridad de materia
ICONTEC Instituto Colombiano de Normas Tcnicas y Certificacin
IFLA: International Federation of Library Associations and Institutions
IRAM: Instituto Argentino de Normalizacin
ISBN: Nmero estndar internacional de libros
ISKO: International Society for Knowledge Organization
ISO: International Organization for Standardization
ISSN: International Standard Serial Number
IUBMB: International Union of Biochemistry and Molecular Biology
IUPAC: International Union of Pure and Applied Chemistry
IZ Thesaurus Socialwissenschaften
KB Koninklijke Bibliotheek
KWAC: Keyword and context (palabra clave y contexto)
KWIC: Keyword in context (palabra clave en el contexto)
KWOC: Keyword out of context (palabra clave fuera de contexto)
LCC: Library of Congress classification
LCSH: Library of Congress subject headings
LEMB: Lista de encabezamientos de materia para bibliotecas
7

MADS: Metadata authority description schema


MARC Machine Readable Cataloging
MeSH: Medical subject headings
NISO: National Information Standards Organization
OAI-PMH Open ARchives Initiative Protocol Metadata Harvesting
OC: Organizacin del conocimiento
OIT Organizacin Internacional del Trabajo
ONU Organizacin de las Naciones Unidas
OWL: Web ontology language
PMEST: Personalidad, materia, energa, espacio y tiempo
POC Procesos de organizacin del conocimiento
RDF Resource description framework
SAR Sistema de almacenamiento y recuperacin
SCDD: Sistema de clasificacin decimal de Dewey
Sears: Lista de encabezamientos de materia para bibliotecas
pequeas de Sears
SKOS: Simple knowledge organization system (Sistemas simples de
organizacin del conocimiento)
SOC: Sistema de organizacin del conocimiento
SWD Schlagwortnormdatei
TEE Tesauro europeo de educacin
UAT Unified astronomy thesaurus
UML Unified modelling language
UNBIS United Nations Bibliographic Information System
UNESCO: Organizacin de las Naciones Unidas para la Educacin, la
Ciencia y la Cultura
URI Uniform resource identifier
W3C: World Wide Web Consortium
Web: World Wide Web
WWW: World Wide Web
XML: Extensible markup language

ndice de figuras y tablas

Pgina
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura

2.1
3.1
3.2
3.3
4.1
4.2
4.3
5.1
5.2
5.3
5.4
6.1
7.1
8.1
8.2
9.1
9.2
9.3
9.4
10.1
10.2
10.3
B1
B2
B3

Figura
Figura
Figura
Figura
Figura

B4
B5
B6
B7
B8

Figura B9
B10
B11
B12
B13
Figura
Figura
Figura
Figura
Figura

11.1
11.2
11.3
C1
C2

Sistemas de organizacin del conocimiento (SOC)


Tringulo del concepto
Relacin obra-thema
Relacin thema-nomen
Modelo del proceso de la indizacin
Registro bibliogrfico de un catlogo en lnea
REgistro metadatos de un repositorio institucional
Crecimiento de las publicaciones peridicas 1800-2000
Ejemplo de fichas peek-a-boo de William E. Batten
Ejemplo de una ficha Zatocard de Calvin Mooers
Ejemplo de fichas Uniterm de Mortimer Taube
Curva de crecimiento de trminos
Vocabularios de indizacin y de entrada
Prueba de la relacin jerrquica gnero-especie
Ejemplo de una relacin polijerrquica
Dominio, categoras y facetas
Faceta, caractersticas de divisin y subfacetas
Subfacetas de segundo, tercero y cuarto nivel
Cadena
Ejemplo de la seccin sistemtica del tesauro
Orden sistemtico en forma de mapa de tpicos
Ejemplo de un registro individual de trmino preferente
Interfaz de bsqueda del tesauro Agrovoc
Lista alfabtica de trminos del tesauro Agrovoc
Registro individual de un trmino preferente del tesauro
Agrovoc
Despliegue del orden sistemtico del tesauro Agrovoc
Interfaz de bsqueda del tesauro Spines
Seccin sistemtica del tesauro Spines
Seccin alfabtica del tesauro Spines
Registro individual de un trmino preferente del tesauro
Spines
Interfaz del Tesauro de OIT
Registro individual de un trmino preferente del Tesauro
de OIT
Interfaz del Tesauro Europeo de Educacin
Lista sistemtica del Tesauro Europeo de Educacin
Registro individual de un trmino preferente del Tesauro
Europeo de Educacin
Modelo de interoperabilidad de vinculacin directa
Modelo de interoperabilidad de estructura de hub
Modelo de interoperabilidad de mapeo selectivo
Modelo de datos propuesto por la norma ISO 25963
Modelo de concepto SKOS tomado del Tesauro de la
Unesco

32
48
54
55
6|
62
63
69
70
71
72
84
91
115
118
131
132
133
134
151
151
152
155
156
157
158
159
160
161
162
163
164
165
166
167
169
170
170
189
190

Tabla
Tabla
Tabla
Tabla
Tabla
Tabla

2.1
2.2
3.1
9.1
10.1
12.1

Caractersticas de los SOC segn sus funciones


Lengua natural vs. SOC
Entidades del modelo FRBR-FRAD-FRSAD
Comparacin de una notacin ordinal y una jerrquica
Mtodos de evaluacin de tesauros
Vocabulario del modelo SKOS

10

30
36
54
138
142
185

1. La Organizacin del Conocimiento

En esta obra, entendemos que el tesauro es un sistema de organizacin del


conocimiento y que su diseo y desarrollo es un conjunto de procesos de
organizacin del conocimiento. Para establecer el marco de referencia pertinente,
comenzaremos

por

revisar

las

distintas

concepciones

la

Organizacin

del

Conocimiento una disciplina emergente y la diferenciaremos de otras reas.

1.1 El trmino organizacin del conocimiento


La Organizacin del Conocimiento en el sentido que aqu se trata tiene una
historia varias veces milenaria, que puede remontarse, entre otros antecedentes, a
las bibliotecas sumerias dos mil aos aC (Dalby, 1986). En tiempos ms cercanos,
la Organizacin del Conocimiento evolucion dentro de la Bibliotecologa, la
Documentacin y la Ciencia de la Informacin (en adelante BDCI), con los aportes
de figuras como los estadounidenses Melvil Dewey, Charles Ammy Cutter, Henry
Evelyn Bliss, Mortimer Taube, Calvin Moers, Hans Peter Luhn, los belgas Paul Otlet
y Henri La Fontaine, el bibliotecario indio Shiyali Ramamrita Ranganathan y los
miembros del Classification Research Group (CRG) de Gran Bretaa, entre los
cuales podemos mencionar a Bernard I. Palmer, Arthur J. Wells, Brian C. Vickery,
Douglas J. Foskett, Barbara Kyle, Jack Mills, Derek W. Langridge, Eric J. Coates,
Jason Farradane y Derek Austin.
Se acepta que el trmino organizacin del conocimiento fue acuado por Henry
E. Bliss en dos de sus obras: The organization of knowledge and the system of the
science y The organization of knowledge in libraries and the subject approach to
books. Para Bliss, la organizacin o clasificacin de los libros en las bibliotecas
deba ser consistente con el desarrollo de la ciencia, es decir del conocimiento. Este
conocimiento expresado en la investigacin, la enseanza y la sistematizacin de
los estudios en las universidades, as como en las publicaciones acadmicas deba
determinar el orden de los libros en el estante y de los registros bibliogrficos en el
catlogo sistemtico (Bliss, 1929, 1933).
Inicialmente,

el

trmino

organizacin

del

conocimiento

no

tuvo

mayor

repercusin, pero en la segunda mitad del siglo veinte comenz a usarse de nuevo
a partir de las obras del profesor estadounidense Jesse H. Shera (Documentation
and the organization of knowledge) en 1966 y de los profesores alemanes Dagobert

11

Soergel (Dokumentation und Organisation des Wissens) e Ingetraut Dahlberg


(Grundlagen universaler Wissensordnung) en 1971 y 1974, respectivamente.
Desde entonces, la Organizacin del Conocimiento ha ido ganando espacio como
un nuevo campo de estudio, particularmente a partir de 1989. Ese ao, la entonces
International Society for Classification cambi su nombre por International Society
for Knowledge Organization (ISKO) y su revista International Classification pas a
llamarse Knowledge Organization. La institucionalizacin de la disciplina y su
rgano de difusin, no solo han dado nuevo impulso al trmino de Bliss, sino que
proporcionan adems un fuerte respaldo acadmico.
La corriente de ISKO ha encontrado eco en la regin del Mercosur, donde
distintos autores la han enriquecido con sus contribuciones. Ms an, en el IV
Encuentro de Directores y III de Docentes de Escuelas de Bibliotecologa del
Mercosur, celebrado en Montevideo del 24 al 27 de mayo de 2000, se resolvi
recomendar la Organizacin del Conocimiento como marco referencial para la
enseanza de los temas que aqu nos ocupan (Arest & Ceretta, 2001).

1.2 Qu es la Organizacin del Conocimiento?


La especialista alemana Ingetraut Dahlberg, fundadora y expresidente de ISKO,
recuerda que la existencia de una ciencia descansa sobre el hecho de que posee su
propio objeto de estudio y su propia rea de actividad. As, explica que en el caso
de la Organizacin del Conocimiento ambos elementos se encuentran presentes en
el mismo nombre de la disciplina: el conocimiento (objeto) y la organizacin
(actividad).

Por

tanto,

cualquier

declaracin

cientfica

relacionada

con

la

Organizacin del Conocimiento debe reducirse a conceptos de ambos, es decir a


conceptos del conocimiento y a conceptos de la organizacin (Dahlberg, 2006a).
Respecto al objeto, es decir el conocimiento, Dahlberg considera que si bien es
cierto que el conocimiento existe en la mente de una persona y, por lo tanto, es
subjetivo e individual, tambin es cierto que puede compartirse gracias a la
capacidad de los seres humanos para tratar con las cosas del mundo y a su
habilidad lingstica para expresar experiencias y puntos de vista. Entonces, a qu
conocimiento se refiere la Organizacin del Conocimiento?
Para responder esta pregunta recurrimos al profesor Mario G. Barit de la
Universidad de la Repblica (Uruguay):

El objeto de estudio de esta disciplina [Organizacin del Conocimiento] es el


conocimiento socializado, entendiendo por tal todo nuevo conocimiento que se
publica y socializa por distintas vas, la mayora de las cuales persigue registrar la

12

paternidad y la defensa de los derechos consiguientes de sus autores o creadores,


tanto como la efectiva difusin del conocimiento generado o sus aplicaciones (Barit,
2001, p. 227).

El profesor Jos Augusto Chaves de Guimares, de la Universidade Estadual


Paulista Jlio de Mesquita Filho (Brasil), coincide con lo anterior cuando afirma:

El objeto de investigacin de la Organizacin del Conocimiento reside en aquello que


Dahlberg (1993, p. 214) denomina conocimiento en accin, o sea, algo de lo cual
existe un cierto consenso social, un conocimiento registrado y socializado, cuya
organizacin y representacin sern desarrollados de modo que a partir de l pueda
ser generado nuevo conocimiento (Guimares, 2008, p. 85).

En el mismo sentido, el consultor britnico Alan Gilchrist hace referencia a los


profesores japoneses Ikujiro Nonaka e Hirotaka Takeuchi, quienes distinguen entre
el conocimiento tcito (almacenado en la mente de un individuo) y el conocimiento
explcito (registrado en un documento). Gilchrist seala que la nica aproximacin
al conocimiento, en el rea de la BDCI, es a travs del conocimiento explcito
(Gilchrist, 2011).
Ahora bien, para algunos autores el conocimiento comunicado es justamente la
informacin, como se deduce de las siguientes afirmaciones:

Conocimiento es lo que yo s. Informacin es lo que nosotros sabemos, es decir el


conocimiento compartido (Foskett, 1996, p. 3).

Informacin es el contenido de un mensaje o algo que es comunicado


(Svenonius, 2000, p. 7).

Informacin: conocimiento que es comunicado (ISO, 2001, p. 8).

La comunicacin del conocimiento puede ser oral, como sucede por ejemplo
cuando se diserta en una conferencia o cuando se debate en una mesa redonda.
Para que pueda ser organizado en las bibliotecas, los centros de documentacin o la
World Wide Web, se requiere que el conocimiento socializado se registre en un
soporte fsico (papel, registros audiovisuales, memorias informticas, etc.), con lo
cual se convierte en un documento (ISO, 2001, p. 11).
Entonces, el objeto de la Organizacin del Conocimiento es el conocimiento
socializado y registrado, explcito o documentado.
En cuanto a la actividad organizacin, Dahlberg (2006a) distingue dos
aplicaciones:
13

Construccin

de

sistemas

de

conceptos:

consiste

en

estructurar

el

conocimiento contenido en las unidades de conocimiento (conceptos) en un


orden sistemtico, de acuerdo con sus caractersticas, para crear un sistema
de conceptos, por ejemplo un tesauro o un sistema de clasificacin. Otros
autores prefieren llamarlos sistemas de organizacin del conocimiento
(SOC), trmino que adoptamos en esta obra.

Correlacin de los conceptos con los objetos de la realidad: se refiere a la


correlacin de los conceptos contenidos en los SOC con aquellos expresados
en los documentos. Esta correlacin incluye: a) la asignacin de notaciones
tomadas de un sistema de clasificacin y b) la asignacin de trminos
controlados tomados por ejemplo de un tesauro, o palabras claves extradas
del

propio

documento.

Estas

aplicaciones

constituyen

los

principales

procesos de la descripcin de contenido, es decir la clasificacin y la


indizacin.
Sobre la base de lo anterior, Dahlberg aporta la siguiente definicin:

La

Organizacin

del

Conocimiento

es

la

ciencia

de

estructurar

ordenar

sistemticamente las unidades de conocimiento (conceptos) de acuerdo con sus


elementos de conocimiento inherentes (caractersticas) y la aplicacin de conceptos y
clases de conceptos ordenados por esta va para la asignacin de contenidos de valor
de los referentes (objetos/sujetos) de todas clases (Dahlberg, 2006b).

En otro artculo, Dalhberg (1993) establece el alcance de la Organizacin del


Conocimiento mediante un esquema de conceptos que se reproduce en el Apndice
A de este captulo. A pesar del tiempo transcurrido y de la necesidad de incluir
algunas novedades como los mapas conceptuales y las ontologas, el esquema de
Dahlberg ayuda a comprender de qu se ocupa la Organizacin del Conocimiento.
Por otro lado, la misma Dahlberg (2006a), estima que la Organizacin del
Conocimiento puede considerarse una nueva ciencia y la relaciona con el sistema de
clasificacin Information Coding Classification, elaborado por ella misma en 1982.
De acuerdo con esto, Dahlberg ubica la Organizacin del Conocimiento en la clase
81 Ciencia de la Ciencia y, especficamente, dentro de la 814 Sistematologa de la
Ciencia de la Ciencia. Esto nos recuerda al Broad System of Ordering publicado
hace ms de tres dcadas por la Federacin Internacional de Documentacin y la
Unesco, de modo que podra incluirse en la clase 116 Ciencia de la Ciencia y del
Conocimiento (Coates et al., 1981).
Otros autores tambin han propuesto definiciones de la Organizacin del
Conocimiento. El profesor Birger Hjrland de la Aalborg Universitet (Dinamarca)
define la disciplina, en dos sentidos:
14

En un sentido estricto, la Organizacin del Conocimiento (OC) trata sobre actividades


tales como la descripcin documental, la indizacin y la clasificacin llevada a cabo
en bibliotecas, bases de datos bibliogrficas, archivos y otros tipos de instituciones
de

la

memoria

por

bibliotecarios,

archivistas,

especialistas

de

informacin,

especialistas en materias, as como por algoritmos de computacin y personas


comunes. La Organizacin del Conocimiento como campo de estudio se ocupa de la
naturaleza y calidad de tales procesos organizadores del conocimiento, as como de
los sistemas organizadores del conocimiento usados para organizar documentos,
representaciones documentales, obras y conceptos (Hjrland, 2008a, p. 86).

En un sentido amplio, la OC trata sobre la divisin social del trabajo mental, es decir
la organizacin de universidades y otras instituciones de investigacin y educacin
superior, la estructura de las disciplinas y profesiones, la organizacin social de los
medios de produccin y la diseminacin del conocimiento (Hjrland, 2008a, p. 86).

La definicin de Hjrland, en sentido estricto, abarca tanto los SOC como los
procesos de Organizacin del Conocimiento (POC) y resalta varios aspectos: a) el
mbito en el que se llevan a cabo (bibliotecas, bases de datos, archivos, etc., a los
que en conjunto denomina instituciones de la memoria), b) quines los llevan a
cabo (bibliotecarios, archivistas, especialistas de informacin) y c) el aporte de los
usuarios y de la tecnologa informtica.
En cuanto a la definicin en un sentido amplio, Hjrland no se limita como
Bliss al conocimiento desarrollado en las instituciones acadmicas, sino que se
extiende tambin hacia otros organismos productores de conocimiento que actan
en la sociedad, como las asociaciones profesionales, las empresas, agencias de
gobierno, organismos no gubernamentales, etc. (La Organizacin del Conocimiento
en sentido amplio escapa al alcance de esta obra).
Broughton et al. entre los que se encuentra el propio Hjrland tambin
distinguen entre el sentido estricto y el sentido amplio de la Organizacin del
Conocimiento. Respecto al sentido estricto aportan la siguiente definicin:

La Organizacin del Conocimiento (OC), en sentido estricto, trata sobre los sistemas
organizadores del conocimiento (SOC), tales como los registros bibliogrficos, los
sistemas de clasificacin (por ejemplo SCDD, LCC y CDU), los tesauros, las redes
semnticas y sobre los procesos organizadores del conocimiento tales como la
clasificacin, la descripcin documental, la catalogacin descriptiva, la indizacin y
el anlisis por materia. La OC se lleva a cabo en instituciones de la memoria, tales
como bibliotecas, archivos, museos y bases de datos en lnea y en Internet, pero
tambin fuera de tales instituciones, por ejemplo en los ndices analticos de los libros

15

y los llamados sistemas de gestin de informacin personales [] La asignacin de


trminos, textos y notaciones a los registros (o a los objetos mismos como en los
recursos digitales), est relacionada con el contenido intelectual o semntico de los
recursos y es independiente del formato en que la informacin es presentada. La OC
tambin se interesa por el diseo de SOC y los principios y metodologas para
construir herramientas semnticas (Broughton et al., 2005, p. 133-134).

Al igual que la anterior, esta definicin abarca los SOC y los POC, pero extiende
el mbito de la Organizacin del Conocimiento, en sentido estricto, ms all de las
instituciones de la BDCI, para incluir tanto la industria editorial que produce los
ndices analticos de libros y revistas, como los sistemas de gestin personales.
Seala que los POC se aplican a los registros bibliogrficos, pero tambin a los
registros metadatos que se incrustan o vinculan a los recursos digitales disponibles
en la Web. Tanto Hjrland como Broughton et al. incluyen dentro de los POC a los
procesos de descripcin de contenido (clasificacin, indizacin, etc.), pero no son
muy explcitos en cuanto al diseo y desarrollo de SOC, que tambin es un
conjunto de procesos de organizacin del conocimiento.
El profesor Claudio Gnoli de la Universit degli study di Pavia (Italia) propone un
modelo tentativo para estudiar la Organizacin del Conocimiento. El modelo se basa
en una estructura formada por cuatro capas (Gnoli, 2011). La primera capa se
refiere a las teoras y abordajes del conocimiento que provienen de otras disciplinas
como la Filosofa de la Ciencia, la Psicologa, la Sociologa, etc. La segunda capa
abarca los SOC. La tercera capa, que Gnoli llama de representaciones, incluye las
normas y formatos de naturaleza tcnica como MARC, RDF, SKOS u OWL, que
permiten representar e intercambiar datos en entornos digitales y que constituyen
la gran novedad del tramo final del siglo veinte y del presente. Por ltimo, la cuarta
capa se refiere a la aplicacin de las teoras, los SOC y las representaciones a los
directorios, catlogos, bibliografas, etc. de archivos, bibliotecas, museos u otras
instituciones similares; en otras palabras, la cuarta capa se ocupa de los POC.
Barit et al., en su Diccionario de organizacin del conocimiento, aportan la
siguiente definicin:

rea del conocimiento de formacin reciente, que estudia las leyes, los principios y
los procedimientos por los cuales se estructura el conocimiento especializado en
cualquier disciplina, con la finalidad de representar temticamente y recuperar la
informacin contenida en documentos de cualquier ndole, por medios eficientes que
den respuesta rpida a las necesidades de los usuarios. La Organizacin del
Conocimiento se nutre de los aportes recibidos de la Informtica, la Lingstica, la
Terminologa y las Ciencias de la Informacin. Garca Marco (1995) seala que es
una disciplina cientfica (esto es, sujeta a mtodo cientfico) y social, de carcter

16

aplicado pues tiene como objetivo optimizar la circulacin del conocimiento en las
sociedades. El objeto de estudio de la Organizacin del Conocimiento es el
conocimiento socializado o registrado, y en lo que hace a la Bibliotecologa y
Documentacin, da cuenta del desarrollo terico-prctico para la construccin, la
gestin, el uso y la evaluacin de clasificaciones, taxonomas, nomenclaturas,
ontologas temticas y lenguajes documentales. Asimismo, ampara el conjunto de
conocimientos vinculados al anlisis de informacin en general, considerando
aspectos semnticos, cognitivos e informticos (Barit et al., 2013).

Para estos autores, la Organizacin del Conocimiento abarca la teora (leyes,


principios, conjunto de conocimientos) y se ocupa tanto de los SOC a los que
denominan lenguajes documentales como de los POC (construccin, gestin, uso y
evaluacin de los SOC). Adems, reconocen el carcter interdisciplinar de la
Organizacin del Conocimiento (aspectos semnticos, cognitivos e informticos),
pero destacan que ocupa un lugar en la BDCI. Cumple adems con una funcin
(representar y recuperar informacin, dar respuesta al usuario) y adhiere a la
concepcin de Garca Marco en cuanto se trata de una ciencia social de carcter
aplicado.
Por su parte el profesor Miguel ngel Esteban Navarro de la Universidad de
Zaragoza (Espaa) propone otra definicin:

La Organizacin del Conocimiento es la disciplina especfica que se dedica dentro de


la Ciencia de la Informacin Documental al estudio de los fundamentos tericos del
tratamiento y la recuperacin de la informacin y a la construccin, mantenimiento,
uso y evaluacin de los instrumentos lgico-lingsticos ms adecuados para
controlar los procesos de recuperacin, clasificacin, ordenacin y almacenamiento
del contenido informativo de los documentos con el fin de permitir su recuperacin y
comunicacin. Se ocupa, por tanto, de los principios y herramientas puestos en
accin para la gestin del conocimiento humano desde una triple perspectiva: su
representacin, su organizacin y su comunicacin documental (Esteban Navarro,
1996, p. 97-98).

En esta definicin tambin se hace referencia a la teora, a los SOC


(instrumentos

lgico-lingsticos)

los

POC

(construccin

de

los

SOC,

recuperacin,

clasificacin, ordenacin, almacenamiento), y se considera que la

Organizacin del Conocimiento es una disciplina dentro de lo que este autor


denomina Ciencia de la Informacin Documental.
Ms all de estas definiciones, el mismo Esteban Navarro, junto al profesor
Francisco Javier Garca Marco de la Universidad de Zaragoza, aclaran que la
Organizacin del Conocimiento es una disciplina en formacin:
17

La Organizacin del Conocimiento se encuentra en la actualidad ante dos retos


comunes a todas las disciplinas cientficas durante su nacimiento y consolidacin. Por
una parte, debe definir sus fundamentos gnoseolgicos, establecer sus principios
teorticos y metodolgicos y fijar sus lmites dentro del mapa de las ciencias para
disear el tipo de relaciones y de intercambio de conocimientos y de mtodos que
mantendr con las disciplinas concurrentes en su formacin o prximas. Y, por otra
parte, debe acotar su campo de accin en la praxis, construir una teora adecuada
para analizar la realidad sobre la que acta y guiar el ejercicio de su prctica en ella,
y, como complemento, desarrollar los instrumentos tcnicos necesarios para ejercer
adecuadamente esa dimensin prctica. En definitiva, se encuentra generando una
tecnologa (Esteban Navarro & Garca Marco, 1995, p. 149-150).

1.2.1 La Organizacin del Conocimiento y la interdisciplinariedad

La profesora espaola Mara Jos Lpez Huertas, expresidente y actual


vicepresidente de ISKO, denomina conocimiento multidimensional a las nuevas
formas de estudiar la realidad consecuencia del posmodernismo que reaccionan
contra la excesiva especializacin de la ciencia, en favor de un conocimiento
complejo, producto de la

multidisciplinariedad, la interdisciplinariedad

y la

transdisciplinariedad (Lpez Huertas, 2007). La Organizacin del Conocimiento se


nutre de otras disciplinas como la Epistemologa, la Psicologa Cognitiva, la
Sociologa del Conocimiento y, particularmente, con la Conceptologa, la Lingstica,
la Terminologa, la Informtica y la Teora de la Comunicacin (Garca Marco, 1995;
Guimaraes (2001a).
Por otra parte, la BDCI

es considerada como la disciplina central de la

Organizacin del Conocimiento en este sentido estricto (Hjrland, 2008, p. 86) y,


en este sentido, se ha propuesto a la Organizacin del Conocimiento como marco
terico referencial para aquellas actividades de la BDCI relacionadas con el
tratamiento temtico (Barit, 2001).
Guimares, en varias publicaciones, ha procurado encuadrar las distintas
corrientes de la BDCI dentro de la Organizacin del Conocimiento (Guimares,
2001b, 2008, 2009; Guimares et al., 2012). As, reconoce tres corrientes:

Corriente

bibliotecolgica

de

origen

estadounidense

(catalogacin

de

materia).

Corriente documental de origen francs (anlisis de contenido, anlisis


formal de contenido, descripcin de contenido).

Corriente informacional de origen britnico (indizacin).

18

Guimares destaca que estas corrientes comparten una historia comn y


estudian

fenmenos

semejantes

pesar

de

las

distintas

denominaciones

(Guimares, 2009) y concluye que la organizacin del conocimiento acta como


espacio de agregacin entre las dems corrientes, contribuyendo significativamente
para el dilogo entre las mismas (Guimares et al., 2012).

1.2.2 mbito de la Organizacin del Conocimiento

Finalmente, puede afirmarse que la Organizacin del Conocimiento ya no es


patrimonio exclusivo de las bibliotecas, centros de documentacin y otras
instituciones de la BDCI, sino que se ha extendido a otros organismos que
gestionan conocimiento como las empresas, agencias de gobierno u otros
organismos, y a la World Wide Web. Como afirma Mara Ins Cordeiro, exdirectora
de la Biblioteca Nacional de Portugal y asesora del Consorcio CDU:

La Organizacin del Conocimiento ha sido siempre reconocida como una de las


funciones primarias de las bibliotecas, que han sido uno de los principales
proveedores de este servicio. Los profundos cambios introducidos por Internet han
incrementado

el

inters acerca del

conocimiento

y de

la Organizacin del

Conocimiento, diversificando las perspectivas acerca de la gestin de conocimiento.


El campo se ha vuelto ms complejo y menos claro como campo profesional. De
repente, la Organizacin del Conocimiento se encuentra a s misma en la mltiple
encrucijada del paisaje sobrecargado y distribuido de la informacin generado por la
WWW (Cordeiro, 2003, p. 66).

1.3 Organizacin del conocimiento vs. organizacin de la informacin

Algunos especialistas limitan la Organizacin del Conocimiento al diseo y


desarrollo de SOC, pero consideran que la descripcin de contenido es incumbencia
de la Ciencia de la Informacin (Brscher & Caf, 2008; Caf et al., 2012).
Otros, por el contrario, consideran que Organizacin del Conocimiento se ocupa
bsicamente de la descripcin de contenido. Por ejemplo, el profesor emrito James
D. Anderson, de la Rutgers University (Estados Unidos), propone una definicin que
toma en cuenta la indizacin, la clasificacin, etc. y los productos de estos procesos
(catlogos, bibliografas), pero no hace referencia al diseo y desarrollo de los SOC
necesarios para llevar a cabo esos procesos:

La Organizacin del Conocimiento en Bibliotecologa y Ciencia de la Informacin


consiste en diversos aspectos: identificacin de los mensajes (con frecuencia

19

llamados obras); identificacin de los textos en los cuales se representan los


mensajes (obras); descripcin de los documentos en los cuales se presentan los
textos; y descripcin del contenido, caractersticas y significado de los mensajes. Las
identificaciones y descripciones resultantes se organizan en ndices, catlogos, bases
de datos, bibliotecas digitales y otros sistemas de recuperacin de informacin para
el acceso de los interesados. La creacin y organizacin de estas identificaciones y
descripciones

se

llaman

indizacin,

condensacin,

catalogacin,

clasificacin

bibliogrfica, bibliografa, gestin de registros y gestin de conocimiento, en varios


contextos (Anderson, 2003, p. 471-472).

Finalmente, otros autores rechazan el concepto organizacin del conocimiento


y prefieren organizacin de la informacin, como afirman la profesora emrita de
la University of Pittsburg (Estados Unidos) Arlene G. Taylor y el profesor emrito de
la University of Sheffield (Gran Bretaa) Tom D. Wilson:

El conocimiento existe en la mente de un individuo que ha estudiado una materia, la


ha comprendido y quizs ha contribuido con algo a travs de la investigacin u otros
medios [] la informacin es la comunicacin o recepcin de conocimiento [...] As,
eleg usar el trmino informacin en lugar de conocimiento como expresin de lo que
creo que nosotros organizamos cuando organizamos en beneficio de otras personas
(Taylor, 2004, p. 3).

El conocimiento involucra los procesos mentales de comprensin, entendimiento y


aprendizaje que ocurren en la mente y solo en la mente [] Siempre que deseamos
expresar lo que conocemos, solo podemos hacerlo por mensajes de uno u otro tipo:
orales, escritos, grficos, gestuales o incluso a travs del lenguaje corporal. Tales
mensajes no portan conocimiento, ellos constituyen informacin que una mente
cognoscente puede asimilar, entender, comprender e incorporar a sus propias
estructuras de conocimiento [] La consecuencia de este anlisis es que todo lo
externo a la mente que pueda ser manipulado en cualquier forma, puede definirse
como datos, si consiste en simples hechos, o como informacin, si los datos estn
incorporados en un contexto de relevancia para el receptor [] De modo que los
datos y la informacin pueden ser gestionados, los recursos de informacin pueden
ser gestionados, pero el conocimiento (es decir lo que conocemos) nunca puede ser
gestionado, excepto por el individuo que conoce y, aun as, solo imperfectamente
(Wilson, 2002).

1.4 Representacin y Organizacin del Conocimiento


Algunos autores, en particular del mbito iberoamericano, prefieren el trmino
representacin y organizacin del conocimiento (Esteban Navarro, 1996; Esteban
20

Navarro & Garca Marco, 1995) o bien al revs, organizacin y representacin del
conocimiento (Fujita, 2008; Guimares, 2012; Pea Vera, 2010, 2011). La revista
Scire: representacin y Organizacin del Conocimiento1, publicada por la Facultad
de Filosofa y Letras de la Universidad de Zaragoza, Espaa, hace referencia al
trmino en cuestin tanto en el subttulo como en su poltica editorial.
Segn la profesora venezolana Tania Pea Vera (2010, 2011) los procesos de
representacin

incluyen

la

descripcin,

la

catalogacin,

la

indizacin

la

condensacin, mientras que para Esteban Navarro (1996) comprenden la indizacin


y la condensacin. Ambos autores coinciden en que los procesos de organizacin
son la clasificacin y la ordenacin.
Estos procesos de representacin se limitan a los POC de la descripcin de
contenido, pero el diseo y desarrollo de SOC tambin incluye otros procesos de
representacin. Por eso, adherimos a la posicin de Dahlberg (2006a) para quien la
Organizacin del Conocimiento comprende la representacin como una forma
necesaria para comunicar el conocimiento individual que es subjetivo, compararlo
con las representaciones de otras personas y contrastarlo contra la realidad para
verificar su verdad. La representacin del conocimiento afirma Dahlberg se ocupa
tanto de la estructura lgica de los conceptos (Conceptologa) como de la
designacin de stos (Terminologa) y distingue cuatro niveles de representacin,
de lo ms simple a lo ms complejo:

Elementos de conocimiento: son las caractersticas de los conceptos a partir


de las cuales se pueden predicar las propiedades o hacer declaraciones
sobre los objetos. Las caractersticas son abstracciones de las propiedades
de los objetos del mundo real o del ideal, que se expresan mediante
enunciados.

Unidades de conocimiento o conceptos: son representaciones mentales de


los objetos del mundo real o del ideal y constituyen la sntesis de las
caractersticas. Se expresan mediante designaciones verbales o simblicas
como los trminos preferentes de un tesauro o las notaciones de un sistema
de clasificacin.

Unidades de conocimiento amplias: son combinaciones de conceptos, como


pueden ser las declaraciones, las definiciones y los textos. Las notas de
definicin o de alcance de los tesauros y sistemas de clasificacin, as como
los registros bibliogrficos y los resmenes productos de la descripcin de
contenido son ejemplos de estas unidades amplias.

Scire: http://www.ibersid.eu/ojs/index.php/scire/index

21

Sistemas de conocimiento: son estructuras planificadas y cohesivas que


ordenan los conceptos de un determinado dominio, por ejemplo un sistema
de clasificacin o un tesauro.

La misma Dahlberg (2006a) considera que la representacin del conocimiento


es parte de la Organizacin del Conocimiento y por lo tanto basta con este ltimo
trmino, que en definitiva es el que se ha generalizado. De nuevo Esteban Navarro
& Garca Marco (1995) ofrecen una explicacin:

Se trata, por tanto, de una ciencia tridimensional, ya que se ocupa de los principios,
mtodos e instrumentos puestos en accin para la gestin del conocimiento humano
desde una triple perspectiva: su representacin, su organizacin y su comunicacin
documental.

No

obstante,

la

Ciencia

de

la

Representacin,

Organizacin

Comunicacin del Conocimiento se denomina de modo ms simple y breve


Organizacin del Conocimiento, debido a que la organizacin es el elemento
mediador entre los otros dos actos, ya que, por un lado, la representacin se efecta
con la finalidad de permitir una eficaz organizacin, y, por otro, la comunicacin
exige una correcta recuperacin, cuyo xito depende de la calidad de la organizacin
(Esteban Navarro & Garca Marco, 1995, p. 149).

1.5 Organizacin del conocimiento y gestin del conocimiento


El trmino Organizacin del Conocimiento no debe confundirse con otro trmino
de amplia difusin en aos recientes que es gestin del conocimiento. Este ltimo
se refiere a una nueva forma de gestin para las empresas u otros organismos,
basada en el reconocimiento de que su principal activo es el capital intelectual, es
decir el conocimiento que poseen las personas que all se desempean. La Gestin
del Conocimiento es:

Un proceso sistmico y especfico de cada organismo para adquirir, organizar y


comunicar el conocimiento de los empleados, de modo que otros empleados puedan
hacer uso de ese conocimiento para ser ms efectivos y productivos en su trabajo
(Gottschalk, 2007, p. 25).

En este marco y a partir del trabajo pionero de Nonaka y Takeuchi, se ha


distinguido entre conocimiento tcito y conocimiento explcito (Choo, 2003). Como
ya se mencion, el conocimiento tcito es aquel que existe en la mente de las
personas y se manifiesta a travs de sus acciones. El conocimiento explcito es el
conocimiento

que

ha

sido

formalizado

documentado

en

procedimientos, especificaciones tcnicas, instructivos, normas, etc.

22

manuales

de

Un sistema de gestin de conocimiento debe procurar que la mayor cantidad


posible de conocimiento tcito se convierta en conocimiento explcito, porque es
este ltimo el que puede ser gestionado. En este sentido, Choo (2003) seala que
uno de los proyectos ms importantes de la Gestin del Conocimiento es la creacin
de repositorios institucionales que tienen como objetivo capturar el conocimiento
registrado y organizarlo de modo que pueda ser recuperado fcil y rpidamente.
En consecuencia, dentro de un sistema de gestin del conocimiento, la
Organizacin del Conocimiento es til para: a) la descripcin del contenido de
aquellos documentos que formarn parte del repositorio institucional y b) el diseo
y desarrollo de SOC especficos, particularmente tesauros, taxonomas y ontologas
que sern aplicados al sitio Web y la intranet del organismo.
De este modo, podemos decir que en el mbito de un organismo pblico o
privado, la Organizacin del Conocimiento puede ser de utilidad para la Gestin del
Conocimiento, de una manera similar aunque no idntica a lo que ocurre en una
biblioteca.

23

Autoevaluacin

a. En el mbito de la Bibliotecologa, la Documentacin y la Ciencia de la


Informacin, quin fue el primero en utilizar el trmino Organizacin del
Conocimiento? Quines retomaron el trmino en la segunda mitad del siglo
veinte?

b. Cul es el objeto de estudio de la Organizacin del Conocimiento?

c. De qu se ocupa la Organizacin del Conocimiento?

d. Cul es su funcin?

e. Quin la lleva a cabo?

f.

En qu mbitos se lleva a cabo?

g. La Organizacin del Conocimiento, es una ciencia, una disciplina, una


especialidad o un campo de conocimiento?

h. Con las respuestas de las preguntas b a g redacte su propia definicin de


Organizacin del Conocimiento.

i.

Cul es la diferencia entre Organizacin del Conocimiento y Gestin del


Conocimiento?

j.

De qu manera puede contribuir la Organizacin del Conocimiento a la Gestin


del Conocimiento?

24

Apndice A. Alcance de la Organizacin del Conocimiento2


0 Divisiones de forma
01 Bibliografas
02 Revisiones bibliogrficas
03 Diccionarios, terminologas
04 Sistemas de clasificacin y tesauros
05 Publicaciones peridicas y series
06 Actas de congresos
07 Libros de texto
08 Otras monografas
09 Normas, directrices

1 Fundamentos tericos y problemas generales


11 Orden y organizacin del conocimiento
12 Conceptologa y organizacin del conocimiento
14 Teora de sistemas y organizacin del conocimiento
15 Psicologa y organizacin del conocimiento
16 Ciencia y organizacin del conocimiento
17 Problemas en organizacin del conocimiento
18 Investigacin de la organizacin del conocimiento
19 Historia de la organizacin del conocimiento

2 Sistemas de clasificacin y tesauros: estructura y construccin


21 Cuestiones generales de sistemas de clasificacin y tesauros
22 Estructura y elementos de sistemas de clasificacin y tesauros
23 Construccin de sistemas de clasificacin y tesauros
24 Relaciones
25 Taxonoma numrica
26 Notacin. Cdigos
27 Mantenimiento, actualizacin y almacenamiento de sistemas de clasificacin y tesauros
28 Compatibilidad y concordancia entre sistemas de clasificacin y tesauros
29 Evaluacin de sistemas de clasificacin y tesauros

3 Clasificacin e indizacin: metodologa


31 Teora de clasificacin e indizacin
32 Anlisis por materia
33 Tcnicas de clasificacin e indizacin
34 Clasificacin e indizacin automticas
35 Ordenamiento manual y automatizado
2

Traducido de Dahlberg, Ingetraut. 1993. Knowledge organization: its scope and possibilities.
Knowledge Organization, vol. 20, n 4, p. 211-222.

25

36 Codificacin
37 Reclasificacin
38 Generacin de ndices
39 Evaluacin de la clasificacin y la indizacin

4 Sistemas de clasificacin y tesauros universales


41 Sistemas de clasificacin universales en general
42 Clasificacin decimal universal
43 Sistema de clasificacin decimal de Dewey
44 Clasificacin y epgrafes de Library of Congress
45 Bliss bibliographic classification
46 Colon classification
47 Library bibliographical classification
48 Otros sistemas de clasificacin y tesauros universales
49 (Vaca)

5 Taxonomas especializadas en
51 Forma y estructura
52 Energa y materia
53 Cosmos & geografa
54 Biologa
55 Humanidades
56 Ciencias sociales
57 Economa y tecnologa
58 Ciencia e informacin
59 Cultura

6 Sistemas de clasificacin y tesauros especializados en


61 Forma y estructura
62 Energa y materia
63 Cosmos & geografa
64 Biologa
65 Humanidades
66 Ciencias sociales
67 Economa y tecnologa
68 Ciencia e informacin
69 Cultura

7 Representacin del conocimiento por lengua natural y terminologa


71 Problemas generales de la lengua natural respecto a la organizacin del conocimiento
72 Semntica
73 Procesamiento automtico de la lengua
74 Problemas gramaticales

26

75 Sistemas y tecnologa de recuperacin en lnea


76 Problemas de lxicos/diccionarios
77 Problemas de terminologa
78 Terminologa orientada por materia
79 Problemas de sistemas multilinges y traduccin

8 Clasificacin e indizacin aplicada


81 Problemas generales, catlogos, directrices, reglas, ndices
82 Clasificacin e indizacin de datos
83 Clasificacin e indizacin de ttulos
84 Clasificacin e indizacin de informacin primaria (excepto 85)
85 Clasificacin e indizacin del texto de los libros
86 Clasificacin e indizacin de informacin secundaria
87 Clasificacin e indizacin de materiales distintos al libro
88 Clasificacin e indizacin en campos temticos
89 Clasificacin e indizacin en ciertas lenguas

9 Ambiente de la Organizacin del Conocimiento


91 Problemas profesionales y organizacionales
92 Personas e instituciones en la organizacin del conocimiento
93 Organizaciones de clasificacin e indizacin en el nivel nacional e internacional
94 (Vaca)
95 Educacin y entrenamiento en organizacin del conocimiento
96 Cuestiones legales en organizacin del conocimiento
97 Aspectos econmicos en organizacin del conocimiento
98 Estudios de usuarios y organizacin del conocimiento
99 Normalizacin en organizacin del conocimiento

27

2. Sistemas y procesos de organizacin del


conocimiento

Como se explic en el Captulo 1, la organizacin del conocimiento se ocupa de


sistemas y procesos, que trataremos de explicar en este captulo, as como el uso
de la lengua natural en los procesos de organizacin y recuperacin del
conocimiento registrado.

2.1 Sistemas de organizacin del conocimiento


A lo largo de los aos, se han acuado diferentes y numerosos trminos para
designar el mismo o casi el mismo concepto: lenguajes de indizacin, lenguajes
documentales, lenguajes documentarios, lenguajes de recuperacin de informacin,
lenguajes

de

materias,

lenguajes

terminolgicos,

vocabularios

controlados,

vocabularios estructurados, vocabularios controlados y estructurados (IFLA, 2011,


p. 84). A estos trminos se han sumado otros ms recientes: sistema de
organizacin
conocimiento

del

conocimiento

(Hjrland,

representacin

(Hodge,

2008a).

organizacin

2000)

Tambin

del

se

sistema

han

conocimiento

organizador

propuesto

(Esteban

sistema

Navarro,

del
de

1996),

instrumento de organizacin del conocimiento (Fujita, 2008) y herramienta de


organizacin del conocimiento (Neelamegan, 2013).
Esta diversidad terminolgica es producto de distintas corrientes y concepciones
de los especialistas en el tema. Aqu elegimos el trmino sistema de organizacin
del conocimiento porque se relaciona directamente con la disciplina a que nos
referimos y porque ha logrado mayor difusin en la ltima dcada. Este trmino
comenz a utilizarse en la dcada de 1990 (Hjerppe, 1990, 1996), pero parece
haber logrado mayor difusin a partir del primer congreso de la ACM Digital
Libraries, que se llev a cabo en Pittsburgh, Estados Unidos, en 1998 (Hodge,
2000). Desde entonces, se han hecho intentos por definirlo, aunque todava no se
ha llegado a un acuerdo y de hecho existen distintas posiciones entre los expertos.
Una primera posicin, tal vez la ms difundida, es la de aquellos que han puesto
el nfasis en establecer una tipologa de los SOC y se conforman con una definicin
por

extensin,

que

abarque

los

distintos

tipos.

En

2000

la

especialista

estadounidense Gail Hodge prepar un informe para la Digital Library Federation,


avalado por el Council on Library and Information Resources de su pas, en el que
aporta la siguiente definicin de SOC:
28

El trmino sistemas de organizacin del conocimiento intenta abarcar todos los tipos
de esquemas para organizar la informacin y promover la gestin de conocimiento.
Los sistemas de organizacin del conocimiento incluyen los esquemas de clasificacin
y

categorizacin

que

organizan

los

materiales

en

un

nivel

general,

los

encabezamientos de materia que proporcionan acceso ms detallado y los archivos


de autoridades que controlan las versiones variantes de la informacin clave como
los nombres geogrficos y personales. Los sistemas de organizacin del conocimiento
tambin incluyen vocabularios altamente estructurados, como los tesauros, y los
esquemas menos tradicionales, como las redes semnticas y las ontologas. Debido a
que los sistemas de organizacin del conocimiento son mecanismos para organizar
informacin, estn en el corazn de cada biblioteca, museo y archivo (Hodge, 2000,
p. 1).

Como se puede observar, la definicin anterior no enuncia las caractersticas de


los SOC, sino que solamente enumera los distintos tipos que abarca este trmino.
En su informe, Hodge propone una tipologa de los SOC, que incluye las siguientes
categoras:

Listas de trminos: listas de autoridades, glosarios, diccionarios, listas de


nombres geogrficos.

Clasificaciones y categoras: encabezamientos de materia, sistemas de


clasificacin.

Listas de relaciones: tesauros, redes semnticas, ontologas.

Otros autores europeos, basados en la definicin de Hodge, tambin consideran


que el trmino sistema de organizacin del conocimiento comprende tesauros,
listas de trminos, ontologas, sistemas de clasificacin, taxonomas, listas de
nombres geogrficos, diccionarios, bases de datos lxicas, mapas conceptuales y
espaciales, mapas de ruta semnticos, etc. (Hill & Koch, 2001; Tudhope & Koch,
2004).
En 2006, los profesores Douglas Tudhope de la University of Glamorgan (Gran
Bretaa), Traugott Koch de la Lunds Universitet (Suecia) y la experta Rachel Heery
de UKOLN (Gran Bretaa) presentaron un informe al Joint Information System
Committee de Gran Bretaa, en el que clasifican los SOC por su estructura y su
propsito (Tudhope et al., 2006).
De acuerdo con su estructura, estos autores clasifican los SOC como sigue:

Listas de trminos no estructuradas: listas de seleccin (pick lists), listas de


autoridades, glosarios, diccionarios, anillos de sinnimos.

Taxonomas: sistemas taxonmicos cientficos, taxonomas Web, taxonomas


corporativas.

29

Encabezamientos de materia: listas de epgrafes generales como LCSH o


especializadas como MeSH.

SOC basados en relaciones: tesauros, sistemas de clasificacin, bases de


datos lxicas (por ejemplo WordNet) y ontologas.

Los mismos autores agrupan los SOC de acuerdo con su funcin, como sigue:

Con fines de recuperacin: SOC destinados a la clasificacin e indizacin en


catlogos de bibliotecas, bibliografas, bibliotecas digitales etc.

Con fines lingsticos: los SOC utilizados en la traduccin asistida por


computadora, la ingeniera de lenguaje, la minera de textos y las bases de
datos lxicas como WordNet.

Con fines de inteligencia artificial: las ontologas.

Con fines de e-aprendizaje (e-learning): los metadatos para objetos de


aprendizaje y sus repositorios, muchas veces ligados a las bibliotecas
digitales.

Con fines cientficos: las taxonomas y nomenclaturas cientficas, entre


otros.

La profesora Marcia Lei Zeng de la Kent State University (Estados Unidos),


basndose tambin en el trabajo de Hodge y el de Tudhope et al., propone cuatro
categoras para clasificar los SOC por su estructura (Zeng, 2008):

Listas de trminos: incluye las listas de seleccin, diccionarios, glosarios y


anillos de sinnimos.

Modelos similares a metadatos: listas de autoridades, directorios, listas de


nombres geogrficos.

Clasificacin y categorizacin: encabezamientos de materia, esquemas de


categorizacin, taxonomas, sistemas de clasificacin.

Modelos de relaciones: tesauros, redes semnticas, ontologas.


Tabla 2.1 Caractersticas de los SOC segn sus funciones

30

Zeng reconoce cinco funciones de los SOC que se muestran en la Tabla 2.1.
Como se puede observar, no todos los SOC cumplen con todas las funciones o no lo
hacen en el mismo grado.
Por su parte, los profesores Renato Rocha Souza y Maurcio Barcellos Almeida
de la Universidade Federal de Minas Gerais (Brasil), junto al ya mencionado
Douglas Tudhope, han analizado en sucesivos artculos distintas propuestas de
otros autores, a partir de lo cual presentan una tipologa de los SOC, con un criterio
amplio y no mutuamente excluyente, de modo que algunos SOC han sido
clasificados en ms de una categora (Souza et al., 2010; 2012). Segn el tipo de
estructura, los SOC se dividen de la siguiente manera:

Texto no estructurado: resmenes, surrogados.

Listas de trminos y/o conceptos: folksonomas, diccionarios, glosarios,


listas de autoridades, listas de etiquetas, anillos de sinnimos, lneas de
concordancia, vocabularios controlados.

Estructuras de conceptos y relaciones: vocabularios controlados, sistemas


de clasificacin, esquemas de categorizacin, encabezamientos de materia,
ndices

para

la

recuperacin

de

informacin,

diccionarios

de

datos,

taxonomas, tesauros, redes semnticas, ontologas.

Estructuras de conceptos, relaciones y distribucin: mapas mentales, mapas


argumentales, mapas conceptuales, rich pictures (representaciones de
conceptos

mediante

imgenes),

modelos

entidad-relacin,

modelos

referenciales, modelos de datos.


Las tipologas anteriores son propuestas y, por lo tanto, estn sujetas a
discusin, ya que de hecho no coinciden totalmente entre ellas, ni se ajustan a una
definicin precisa que exprese sin ambigedad las caractersticas esenciales de un
SOC. El tema requiere un anlisis ms profundo que excede al alcance de esta
obra.
En

una

segunda

posicin,

encontramos

Birger

Hjrland,

mencionado

anteriormente, quien utiliza en sus textos dos trminos similares, pero no idnticos,
para referirse a los SOC: a) knowledge organization systems que puede traducirse
como sistemas de organizacin del conocimiento (Hjrland, 2008b) y b) knowledge
organizing systems o sistemas organizadores del conocimiento (Hjrland, 2008a).
Para Hjrland se trata de un trmino general que se refiere, entre otras cosas a
las herramientas que presentan una interpretacin organizada de las estructuras
del conocimiento (Hjrland, 2008b). Tambin analiza los SOC en un sentido
amplio y en un sentido estricto (Figura 2.1).

31

Figura 2.1. Sistemas de organizacin del conocimiento (SOC), segn Hjrland


(2006-2008b).

En el sentido amplio de los SOC, Hjrland incluye las bibliografas, las teoras y
sistemas conceptuales, las culturas y subculturas, las disciplinas y la divisin social
del trabajo, las enciclopedias, los medios de comunicacin, las lenguas y los
sistemas simblicos, los modelos de actores, sistemas y procesos en diferentes
dominios, etc. En un sentido estricto, es decir en el rea de la BDCI, Hjrland
agrupa ciertos SOC a los que denomina herramientas semnticas y postula la
siguiente definicin:

Una herramienta semntica es una herramienta que proporciona informacin


semntica, esto es informacin acerca del significado de las palabras y otros
smbolos as como las relaciones entre smbolos y conceptos (relaciones semnticas)
(Hjrland, 2007).

Entre las herramientas semnticas, Hjrland incluye los lenguajes de indizacin,


que define como lenguas usadas para la clasificacin o la indizacin de las
materias de los documentos (Hjrland, 2006) y los divide en dos grandes grupos:
a) los sistemas de clasificacin y b) los lenguajes de indizacin verbales, ya sean
libres o controlados (tesauros, listas de epgrafes, etc.), que se distinguen segn su
forma de coordinacin. Dentro de las herramientas semnticas, se incluyen tambin
los mapas conceptuales, los hipertextos, los anillos de sinnimos, tipologas,
folksonomas y aquellos otros incluidos en la tipologa de Hodge.
Segn Hjrland, las herramientas semnticas tienen semejanzas y diferencias.
Por un lado, comparten dos caractersticas: a) de una u otra forma despliegan un
32

conjunto de smbolos y conceptos, y b) proporcionan informacin acerca de las


relaciones semnticas entre los conceptos desplegados. As, los conceptos son las
unidades de conocimiento que se organizan y la manera en que se organizan es de
acuerdo con su significado, es decir de acuerdo con las relaciones semnticas entre
los conceptos. Por otro lado, las herramientas semnticas se diferencian entre s
por la clase de smbolos y conceptos seleccionados y por la informacin
proporcionada acerca de cada concepto, en particular sus relaciones semnticas.
Broughton et al. coinciden en su preferencia por el trmino sistemas
organizadores del conocimiento y en el enfoque sobre el sentido amplio y el sentido
estricto de los SOC. Definen el trmino en sentido estricto como tipos de
herramientas semnticas que proporcionan la seleccin de conceptos e informacin
acerca de sus relaciones semnticas (Broughton et al., 2005, p. 142) e incluyen
los siguientes:

Sistemas de clasificacin como SCDD, CDU, LCC

Sistemas de clasificacin facetados como la segunda edicin de BC

Listas de epgrafes como LCSH

Sistemas basados en la bsqueda por texto libre

Tesauros

Mapas bibliomtricos

Algoritmos de los motores de bsqueda

Sistemas de archivo (basados en el principio de procedencia)

Ontologas

Redes semnticas

Mapas de tpicos

De modo que para los autores que proponen esta segunda posicin, sistema de
organizacin del conocimiento es un concepto amplio que incluye, entre otros pero
no exclusivamente las herramientas semnticas, y son estas ltimas las que
coinciden, al menos en parte, con las tipologas de los SOC propuestas por los
autores de la primera posicin.
Otros autores iberoamericanos consideran que sistema de organizacin del
conocimiento es lo mismo que lenguaje documental o lenguaje documentario:
Los SOC tambin llamados lenguajes documentales, sistemas organizadores del
conocimiento o sistemas de organizacin y representacin del conocimiento []
(Barit et al., 2013).

Los lenguajes documentarios, caracterizados como sistemas de organizacin del


conocimiento y correspondientes a las listas de encabezamientos de materia y a los
tesauros, tienen como primera funcin representar el contenido de los documentos

33

contenidos en un sistema de recuperacin de informacin funcin por el contenido


y, como segunda funcin, mediar la recuperacin de informacin por medio de la
representacin de las preguntas formuladas por los usuarios funcin por el uso
(Boccato, 2008, p. 120).

Tambin nosotros hemos afirmado anteriormente que a los SOC se los ha


conocido como lenguajes documentales (Martnez Tamayo & Valdez, 2009, p. 28),
pero debe tenerse en cuenta que los SOC van ms all de los tradicionales sistemas
de clasificacin, listas de epgrafes y tesauros y que exceden el campo de la BDCI.
Finalmente, llama la atencin que ninguna de las definiciones y tipologas
anteriores haga referencia a que un SOC es, precisamente, un sistema. Por ende no
declaran, de manera explcita y completa, cules son los elementos componentes
de este sistema, cmo se interrelacionan y estructuran, ni cul es su propsito. En
ese sentido, recordamos que Dahlberg (2006a) los llama sistemas de conceptos y
coincidimos con la recomendacin de Estaban Navarro (1996) respecto a que la
definicin del trmino debe basarse el anlisis de las palabras que lo forman.
As, en esta obra definimos el trmino sistema de organizacin del conocimiento
como un sistema

y especficamente como un sistema de conceptos. Los

componentes del sistema son, por lo tanto, los conceptos de un dominio,


expresados

por

designaciones

unvocas

(notaciones,

epgrafes,

trminos

preferentes, etc.), interconectados mediante distintos tipos de relaciones y


estructurados en un orden determinado. En el rea de la BDCI, la funcin de un
SOC es facilitar la organizacin y recuperacin del conocimiento registrado. Son
ejemplos de SOC para la BDCI los sistemas de clasificacin, las listas de epgrafes,
las listas de autoridades, los tesauros, las taxonomas y las ontologas.

2.2 La lengua natural y la organizacin del conocimiento


La lengua natural tambin se utiliza en el proceso de bsqueda, por ejemplo en
aquellos sistemas de recuperacin que permiten buscar por las palabras claves de
ttulo, de resumen o del texto completo del documento. No obstante, presenta
algunas dificultades derivadas principalmente de la sinonimia y la homonimia. Por
ejemplo, si el autor de un documento utiliza el trmino
recuperarlo usando el trmino de bsqueda

canes, el usuario no podr

perros. Si el usuario busca el trmino

violeta por inters en la flor, tambin recuperar documentos sobre el color


violeta o las personas de nombre Violeta. En otras palabras, el usuario final
de un sistema de recuperacin puede perder informacin debido a la sinonimia y

34

obtener recuperaciones falsas a causa de la homonimia. Para solucionar estos


problemas, es necesario recurrir a un SOC porque su vocabulario es unvoco.
Durante largo tiempo se ha planteado la controversia respecto a la recuperacin
por lengua natural o por medio de un SOC, como si fueran antagnicos, cuando en
realidad son complementarios. Elaine Svenonius (1986) y Jennifer Rowley (1994)
han distinguido en esto varias eras, a partir del siglo diecinueve.
La primera era comenz con el bibliotecario britnico Samson Low, que en 1854
indiz el British catalogue of books utilizando palabras claves del ttulo de los libros,
es decir la lengua natural usada por los autores. Su discpulo Andrea Crestadoro
llev a cabo una experiencia similar con el catlogo de la Manchester Free Library.
Por el contrario, cuando el estadounidense Charles A. Cutter public en 1876 las
primeras reglas para redactar los epgrafes y Melvil Dewey hizo lo propio con su
sistema de clasificacin, dieron lugar a los primeros SOC. Hacia la primera mitad
del siglo veinte la prctica habitual en las bibliotecas era indizar con una lista de
epgrafes y clasificar con un sistema de clasificacin. En esta era surgieron los SOC
universales y precoordinados ms conocidos: LCSH, Sears, SCDD, CDU, CC, BC.
La segunda era se inicia con la aparicin, a partir de 1958, de los primeros
ndices realizados con una computadora: los famosos KWIC, KWOC y KWAC,
elaborados mediante la extraccin automtica de las palabras claves del ttulo de
los documentos. Esta tcnica abri de nuevo el debate entre la lengua natural y los
SOC. La controversia se vio reforzada an ms por los llamados estudios de
Cranfield, llevados a cabo en Gran Bretaa entre 1957 y 1962. En particular los
resultados de Cranfield 2 sealaban que la lengua natural, sin control o con un
mnimo de control de vocabulario, lograba una recuperacin tan eficiente como los
SOC (Dubois, 1987; Lancaster, 2002; Rowley, 1994; Svenonius, 1986). Entonces,
para qu gastar dinero y esfuerzo en el diseo de un SOC y en la indizacin
realizada por humanos, si basta con la lengua natural y una computadora
programada para extraer las palabras claves?
La tercera era se inicia justamente con la proliferacin de las bases de datos
bibliogrficas y los catlogos en lnea, que permitieron llevar a cabo nuevas
investigaciones sobre el desempeo de los usuarios en la bsqueda por materia,
entre ellos el estudio realizado por Carol Tenopir (1985) sobre la base de datos
Harvard Business Review de texto completo. Estas investigaciones demostraron que
tanto la bsqueda por lengua natural como aquella por medio de un SOC ofrecen
resultados efectivos, pero distintos. Para aclarar mejor esta idea, es necesario
explicar primero las ventajas y desventajas que ofrecen tanto la lengua natural
como los SOC para la recuperacin, as como dos variables de medicin que son las
tasas de precisin y acierto.

35

En la Tabla 2.2 se comparan las ventajas y desventajas de la lengua natural y


los SOC para la recuperacin de informacin (Aitchison et al., 2000; Dubois, 1987).

Tabla 2.2. Lengua natural vs. SOC

Por otro lado, los experimentos de Cranfield introdujeron dos variables


operativas para medir el desempeo de los sistemas de recuperacin (Claverdon &
Mills, 1985; Foskett, 1996; Lancaster, 2002). Las variables son:

Tasa de precisin: es la proporcin de documentos recuperados que son


relevantes. Dicho de otra manera, es la capacidad de reducir o limitar una
bsqueda, hasta recuperar si se necesita un solo recurso.

Tasa de acierto: es la proporcin de documentos relevantes que son


recuperados, es decir la capacidad de ampliar una bsqueda o de encontrar
todos los recursos que tratan sobre un mismo tema.

Entonces, los estudios a los que hacamos referencia, realizados sobre bases de
datos de texto completo, demostraron que la lengua natural y los SOC pueden
mejorar tanto la precisin como el acierto, pero de diferente manera (Dubois,
1987; Rowley, 1994; Svenonius, 1986; Tenopir, 1985):

La lengua natural mejora la precisin por el mayor nivel de especificidad y la


actualizacin de sus trminos, mientras que los SOC lo hacen mediante el
uso de frases o trminos multipalabra y el control de homnimos.

36

La lengua natural mejora el acierto cuando se realiza sobre un resumen o


el texto completo por la exhaustividad de su cobertura. En cambio, los SOC
mejoran el acierto por el control de sinnimos y las relaciones jerrquicas y
asociativas.

La conclusin a la que se lleg es que la combinacin de ambas modalidades en


el mismo sistema de recuperacin mejora la eficacia, porque las ventajas de una
compensan las desventajas de la otra, es decir la lengua natural y los SOC son
complementarios y combinados ofrecen al usuario mayores oportunidades de lograr
una bsqueda exitosa.
En adicin, otros investigadores demostraron que los usuarios finales tienen
tambin sus preferencias, ya sea por la lengua natural o por los SOC (Ensor, 1992;
Fidel, 1991; 1992).
Una nueva era se abre en el presente y hacia el futuro. Por un lado Google, con
su algoritmo de bsqueda, ha revalorado la recuperacin por lengua natural,
mientras que la Web Semntica propuesta por el World Wide Web Consortium
(W3C) promueve ciertos formatos comunes para los datos y la inclusin de
contenido semntico en las pginas Web, con la idea de permitir no solo la conexin
a travs de la red, sino tambin la reunin de conceptos (Dextre Clarke, 2008;
W3C, 2011). Esta propuesta de la Web Semntica abre nuevos caminos para los
SOC y ofrece varias herramientas especficas para su gestin, como los lenguajes
SKOS para los SOC en lnea y OWL para el desarrollo de ontologas.

2.3 Procesos de organizacin del conocimiento


El Diccionario de la lengua espaola define proceso como conjunto de fases
sucesivas de un fenmeno natural o de una operacin artificial (Real Academia
Espaola, 2013). Otra fuente ms especfica propone la siguiente definicin:
Secuencia de procedimientos interdependientes y vinculados que, en toda etapa,
consume uno o ms recursos (empleado, tiempo, energa, mquinas, dinero) para
convertir entradas (datos, materiales, partes, etc.) en salidas. Estas salidas luego
sirven de entrada para la siguiente etapa hasta lograr una meta conocida o un
resultado final (BusinessDictionary, 2013).

As,

por

ejemplo,

el

proceso

de

la

condensacin

consume

recursos

(condensador, computadora, electricidad, dinero) para transformar elementos de


entrada (documento, normas, instructivos, etc.) en una salida o resultado el
resumen o la nota de contenido, que a su vez puede ser la entrada de otro

37

proceso como la indizacin y contribuir a un producto final como puede ser el


registro bibliogrfico de un catlogo o de una bibliografa.
Podemos afirmar, entonces, que los POC son aquellos procesos que permiten
organizar el conocimiento con el fin de facilitar su recuperacin. Tambin nos
permitimos considerar dos tipos de POC: a) los POC de la descripcin de contenido
y b) los POC para el diseo y desarrollo de SOC.

2.3.1 Procesos de organizacin del conocimiento de la descripcin de contenido

Nos referimos aqu a los procesos involucrados en la correlacin conceptoobjeto, descripta por Dahlberg (2006).
En 1949, la documentalista britnica Edith Ditmas describi las tareas que se
realizan en las bibliotecas y centros de documentacin como un proceso exacto y
continuo, que denomin proceso documental. Casi tres dcadas despus, el
documentalista

francs

Jacques

Chaumier

renombr

este

proceso

cadena

documental, entendiendo que en realidad se trata de numerosos procesos, cada


uno de los cuales constituye un eslabn concatenado con los dems procesos para
culminar en uno o varios productos, de modo similar a lo que en el mbito
industrial se conoce como una cadena productiva (Chaumier, 2004).
Los procesos de la cadena documental reciben distintas designaciones segn se
trate de la Bibliotecologa o de la Documentacin y la Ciencia de la Informacin.
La

norma

ISO

5127,

referida

al

vocabulario

de

la

informacin

la

documentacin, ofrece dos definiciones de biblioteca:

Biblioteca 1: coleccin organizada de documentos seleccionados y procesados para


uso por una poblacin destinataria predefinida. Biblioteca 2:es un organismo o parte
de un organismo en el cual se construye la Biblioteca 1 y se hace disponible por los
servicios de su personal (ISO, 2001, p. 35).

De modo que una biblioteca requiere, obligatoriamente, la creacin de una


coleccin de documentos, real o virtual, que debe ser organizada. Los procesos que
permiten organizar la coleccin se denominan en nuestro medio procesos tcnicos y
su producto final es el catlogo de la biblioteca, que consiste en la lista ordenada
de un sistema de recuperacin bibliogrfica, que permite el acceso a los datos y
ubicaciones de los documentos en una o varias colecciones (ISO, 2001, p. 72). Los
procesos tcnicos incluyen: a) el desarrollo de la coleccin, b) la catalogacin
descriptiva, c) la catalogacin de materias y d) la condensacin. Los POC son los
dos ltimos.

38

El proceso de la catalogacin de materias abarca procedimientos tales como el


anlisis conceptual, la asignacin de puntos de acceso verbales y controlados que
representan el contenido del documento en un registro bibliogrfico y la asignacin
de una signatura topogrfica u otro elemento que remita a la ubicacin fsica del
documento.
El proceso de la condensacin permite incluir en el registro bibliogrfico una
forma condensada como la nota de contenido o el resumen. Aunque no todas las
bibliotecas incluyen estas formas condensadas en sus catlogos, su utilidad ha sido
sealada por otros autores y recomendada por asociaciones internacionales
(Dwyer, 1991; IFLA, 2011).
Por otro lado, un centro de documentacin es un organismo que lleva a cabo
funciones de documentacin (ISO 2001, p. 36), es decir las funciones de
compilacin

procesamiento

continuos

sistemticos

de

la

informacin

registrada, con el propsito de almacenamiento, clasificacin, recuperacin,


utilizacin, o transmisin (ISO 2001, p. 10). Tambin se conocen como servicios
de indizacin y resumen.
Un centro de documentacin no necesita desarrollar una coleccin propia como
es el caso de una biblioteca. Si bien se realiza una seleccin de los documentos que
han de procesarse, stos no tienen que pertenecer necesariamente al centro de
documentacin, ni tampoco formar una coleccin.
Segn varios documentalistas espaoles, los procesos de la cadena documental
que se llevan a cabo en un centro de documentacin se dividen en dos grandes
etapas: a) la colecta o seleccin de documentos y b) el tratamiento de la
informacin. A su vez, el tratamiento de la informacin se divide en otras dos
etapas: el anlisis documental y la recuperacin (Lpez Yepes, 2004; Pinto Molina,
2001; Ruiz Prez, 1992). El anlisis documental es entendido de la siguiente
manera:

Consiste en extraer de un documento sus elementos ms significativos al objeto de


expresar su contenido de una forma distinta a la que presenta el original y por
supuesto abreviada (Pinto Molina, 2001, p. 34).

Aquella operacin del proceso documental que tras un reconocimiento o estudio


intelectual y objetivo del documento, transforma la informacin en ste contenida,
ofrecindola en productos que hacen posible su adecuada identificacin, seleccin,
recuperacin y utilizacin por parte del usuario interesado, dentro de un conjunto
documental ms amplio (Ruiz Prez, 1992, p. 55).

39

Se reconocen dos tipos de anlisis documental: el anlisis documental formal y


el anlisis documental de contenido, o simplemente anlisis formal y anlisis de
contenido. El anlisis de contenido incluye dos POC: la indizacin y la condensacin
(Lpez Yepes, 2004; Pinto Molina, 2001; Ruiz Prez, 1996).
Otros documentalistas vinculados a la Unesco usan una denominacin distinta
(Guinchat et al., 1990; Wersig & Neveling, 1976). As, el trmino descripcin
documental se prefiere al anterior y se define como:

Descripcin de un documento que contiene todos los datos acerca de un documento


que pueden ser de valor en un sistema de documentacin especfico; incluye por lo
general la descripcin bibliogrfica y la descripcin de contenido que surge del
anlisis documental, la condensacin y la indizacin (Wersig & Neveling, 1976, p.
98).

Se llama descripcin de contenido (DC) por analoga con la expresin descripcin


bibliogrfica (DB), al conjunto de operaciones mediante las cuales se describe
aquello de que trata un documento o un asunto (hecho, conceptos, nmeros,
imgenes, etc.) y los productos resultantes. Estas operaciones y productos se
denominan comnmente clasificacin, indizacin, condensacin y anlisis (Guinchat
et al., 1990, p. 121).

De modo que la descripcin documental abarca la descripcin bibliogrfica y la


descripcin de contenido y esta ltima incluye varios POC: la clasificacin, la
indizacin y la condensacin. Ntese que para Wersig & Neveling (1976) el trmino
anlisis documental tiene un significado distinto que para los autores espaoles
antes mencionados.
El producto final por excelencia de un centro de documentacin es una
bibliografa especializada, que se define como un sistema de recuperacin
bibliogrfica que permite el acceso a los datos que describen e identifican
documentos (ISO, 2001, p. 72).
Ahora bien, ciertas bibliotecas, como las nacionales y algunas especializadas,
tambin producen bibliografas y por lo tanto es correcto referirse al proceso de
indizacin en bibliotecas.
En este sentido, algunos autores consideran que la catalogacin de materias y
la indizacin de materias son lo mismo y han establecido un paralelismo entre
catalogacin e indizacin. De este modo, se refieren a una indizacin descriptiva y
una indizacin de materias (Hjrland, 2007b; IFLA, 2011; Lancaster, 1995).
Tambin hay discrepancias en cuanto a considerar el proceso de clasificacin como
una forma de indizacin (IFLA, 2011; ISO, 2001; Lancaster, 2002), la indizacin

40

como una forma de clasificacin (Naumis Pea, 2003) o la indizacin y la


clasificacin como procesos distintos (Dahlberg, 2006; Tudhope et al., 2006). Aqu
no profundizaremos en esta polmica.
Por otro lado, se reconocen dos tipos de indizacin (Foskett, 1996):

La indizacin derivada que surge de la extraccin automtica de palabras


claves del ttulo, el resumen o el texto completo del documento. Tambin se
conoce como indizacin automtica.

La indizacin asignada que consiste justamente en la asignacin, por un


indizador, de un epgrafe, un trmino preferente o una notacin.

A su vez, la indizacin puede ser precoordinada o poscoordinada. Es


precoordinada cuando los conceptos son coordinados por el indizador en la etapa de
almacenamiento. Por el contrario, la indizacin es poscoordinada cuando los
conceptos son coordinados por el usuario final en la etapa de recuperacin. El
tesauro es un SOC que se aplica al proceso de la indizacin asignada y
poscoordinada.
Los procesos anteriores, de una u otra manera, tambin se cumplen en otros
sistemas de recuperacin, por ejemplo en los sitios Web, donde los contenidos
pueden indizarse y condensarse mediante registros metadatos que facilitan la
recuperacin.

2.3.2 Procesos de organizacin del conocimiento para el diseo y desarrollo de SOC

Son aquellos procesos que tienen que ver con lo que Dahlberg (2006) denomina
construccin de sistemas de conceptos. Incluyen, entre otros, la definicin y
anlisis del dominio, el control del vocabulario, la determinacin de las relaciones
semnticas, la construccin del orden sistemtico, la publicacin, la evaluacin y
actualizacin continua del SOC. Se explicarn con mayor detalle en captulos
posteriores, aplicados al diseo y desarrollo del tesauro.

41

Autoevaluacin

a. En qu categoras incluyen al tesauro los autores Hodge, Tudhope et al., Zeng


y Souza et al.?

b. Cules son las diferencias y semejanzas que muestran las herramientas


semnticas mencionadas por Hjrland?

c. Cmo define sistema de organizacin del conocimiento?

d. Qu ventajas y desventajas tienen para la recuperacin, respectivamente, el


uso de la lengua natural y el uso de un sistema de organizacin del
conocimiento como el tesauro?

e. Por qu la lengua natural y los sistemas de organizacin del conocimiento se


complementan en la etapa de recuperacin?

f.

Qu procesos de organizacin del conocimiento de la cadena documental se


llevan a cabo, generalmente, en una biblioteca?

g. Qu procesos de organizacin del conocimiento de la cadena documental se


llevan a cabo, generalmente, en un centro de documentacin?

42

3. Distintos enfoques para estudiar los SOC

En el Captulo 2 hicimos referencia a la diversidad terminolgica empleada para


designar los SOC. En parte, esta situacin se debe a que los SOC han sido
estudiados desde distintos puntos de vista. A continuacin analizaremos los SOC de
acuerdo con tres enfoques: lingstico, terminolgico y bibliotecolgico.

3.1 Enfoque lingstico


La lingstica documental, muy difundida en las ltimas dcadas del siglo
veinte,propone apropiarse de la teora lingstica particularmente de la corriente
estructuralista para fundamentar el diseo y aplicacin de los SOC, que bajo este
enfoque han sido designados lenguajes documentales. Garca Gutirrez lo explica
de la siguiente manera:

La denominacin lingstica documental surge en el momento en que los


elementos que intervienen en el proceso comunicativo-documental exceden su
tradicional naturaleza lgica y mecanicista y son descritos, se transforman y
organizan, al menos esa es nuestra propuesta, como elementos de comportamiento
fundamentalmente lingstico manteniendo y potenciando sus objetivos habituales
[] Se pretende demostrar, en realidad, que la exaltacin del mensaje, de la
comunicacin, de los signos, de la estructura y de los enunciados en Documentacin
sugiere un mayor aprovechamiento de la Teora Lingstica como fundamento de los
mtodos y procesos documentales (Garca Gutirrez, 1990, p. 11).

La profesora cubana Dolores Vizcaya Alonso adhiere a esta posicin y de cierta


manera enfatiza el vnculo con la corriente estructuralista iniciada por Ferdinand de
Saussure:

Todo lo que sobre lenguajes documentarios se estudie, se tendr que hacer, de una
forma u otra, dentro del campo de la lingstica; y cuando de esta disciplina se trata,
no se puede comenzar a escribir nada sin dedicarle las primeras lneas a quien tan
merecidamente fuera llamado el padre de la lingstica moderna: Ferdinand de
Saussure (Vizcaya Alonso, 1997, p. 15).

As como el objeto de estudio de la Lingstica es la lengua natural, el objeto de


estudio de la lingstica documental es el lenguaje documental, es decir los SOC.
43

Dentro de este enfoque, haremos algunas precisiones. En primer lugar,


podemos distinguir entre lenguaje y lengua. El lenguaje es una capacidad abstracta
y general de comunicacin. Existen diversas formas de comunicacin humanas y no
humanas que constituyen un lenguaje, pero no una lengua en sentido estricto; por
ejemplo el lenguaje corporal humano o el lenguaje de las abejas. En cambio la
lengua, si bien es un tipo de lenguaje, es un sistema concreto y particular de signos
que forman un lxico o vocabulario, una semntica y una sintaxis (ISO, 2001;
Lyons, 1984; Naumis Pea, 2008).
Es importante aclarar que el ingls, un idioma que ejerce fuerte influencia sobre
la terminologa tanto de la Lingstica como de la BDCI, posee un solo vocablo
language para expresar tanto el concepto de lenguaje como el de lengua. Por el
contrario, otras lenguas tienen un vocablo diferente para cada concepto: en francs
langage y langue, en italiano linguaggio y lingua, en portugus linguagem y lngua,
en espaol lenguaje y lengua (ISO, 2001; Lyons, 1984; Naumis Pea, 2008). La
traduccin del ingls a estos ltimos idiomas hizo que se acuaran en la BDCI los
trminos lenguaje natural, lenguaje artificial, lenguaje de indizacin, lenguaje de
descriptores, lenguaje documental o lenguaje documentario, es decir que se usara
lenguaje en lugar de lengua. Aqu utilizaremos lengua natural para referirnos al
objeto de estudio de la Lingstica, pero debido a su uso generalizado
aceptaremos lenguaje documental, lenguaje documentario, lenguaje de indizacin y
otros trminos similares usados en la BDCI, entendiendo que se trata de lenguas,
en este caso artificiales.
Ahora es preciso distinguir entre lengua natural y lengua artificial. La lengua
natural es aquella hablada por una comunidad lingstica particular. El francs, el
ruso, el mandarn, el swahili, el guaran o el quekch son ejemplos de lenguas
naturales. En la actualidad, se hablan miles de lenguas naturales en todo el mundo
y se conocen tambin numerosas lenguas muertas o extintas.
Una lengua natural tiene variadas funciones, ya que con ella se puede redactar
un informe tcnico, narrar una historia cierta o ficticia, dar una orden, discutir un
asunto, influir sobre otras personas, componer un poema o establecer contacto con
otros mediante un simple hola. Adems, la lengua natural posee un lxico
plurisemntico y su sintaxis se establece con el uso.
Por el contrario, las llamadas lenguas artificiales, entre las que se encuentran
los lenguajes documentales, tienen una nica funcin, su vocabulario es unvoco y
su sintaxis se establece con anterioridad al uso. Entonces, los lenguajes
documentales o SOC son lenguas artificiales. Su nica funcin es organizar el
conocimiento socializado y registrado para que pueda ser recuperado; no sirven
para otra cosa. Adems, como seala Svenonius (2003), los SOC, en tanto lenguas

44

artificiales, constan tambin de un lxico o vocabulario, una semntica y una


sintaxis.
El lxico o vocabulario es el conjunto finito de los signos de una lengua, ya sea
en general o pertenecientes al uso de una regin, una actividad determinada, un
campo semntico dado, una persona o un grupo de personas (ISO, 2001; Lpez
Yepes, 2004; Real Academia Espaola, 2011; Wersig & Neveling, 1976).
El vocabulario de un SOC es por lo tanto el conjunto de signos que han sido
aceptados para su aplicacin en los procesos de organizacin del conocimiento. Al
igual que en la lengua natural, los signos de un SOC constan de significado (imagen
mental) y de significante (imagen acstica o, en el caso de los SOC, imagen
grfica) y la relacin entre significado y significante es arbitraria.
Los signos de un SOC pueden tomarse de la lengua natural como sucede en las
listas de epgrafes y en los tesauros, o pueden tomarse de otro tipo de sistema
como es el caso de las notaciones de un sistema de clasificacin, para las cuales se
utilizan nmeros, letras o una combinacin de ambos. En todos los casos y en
virtud de un artificio que se conoce como control del vocabulario, cada signo del
SOC es despojado de todos sus significados menos uno y de todos sus significantes
menos uno, de modo que la totalidad de los signos resultan unvocos, eliminndose
as la sinonimia y la homonimia, que caracterizan la lengua natural, pero que
presentan tantos problemas para la recuperacin.
La profesora estadounidense Marcia Bates (1988) seala que el control del
vocabulario tambin incluye las reglas para formalizar el significante (forma
gramatical, gnero y nmero, estructura del sintagma) y los britnicos Aitchison et
al. (2000) afirman que el control del vocabulario consta de cuatro fases:

Control

del

significante:

eleccin

de un

solo significante, su

forma

gramatical, ortografa, gnero y nmero, etc.

Control de sinnimos: seleccin de solo uno de los sinnimos disponibles


para expresar un concepto.

Control de signos especiales: seleccin de trminos prestados, jergas,


nombres comerciales y nombres propios.

Control del significado o desambiguacin: eleccin de un solo significado,


que debe ser el ms efectivo para los propsitos del SOC. Esta restriccin se
logra mediante calificadores, notas de definicin y notas de alcance, como se
ver ms adelante en el Captulo 7.

45

El producto del control del vocabulario es un vocabulario controlado, que


definimos como el conjunto restringido de signos de un SOC autorizados para uso
en los POC (ISO, 2001; Lpez Yepes, 2004).
Algunos autores consideran que vocabulario controlado es un sinnimo de
lenguaje documental o de SOC y, por lo tanto, se afirma que los tesauros, las listas
de epgrafes y los sistemas de clasificacin son vocabularios controlados (ISO,
2011; Lancaster, 2002; NISO, 2005). Nosotros no estamos de acuerdo con esto
porque consideramos que el vocabulario controlado es un componente del SOC,
junto con la semntica y la sintaxis.
La semntica es la rama de la Lingstica que se ocupa del sentido o el
significado de los signos, as como de la relacin entre los mismos, tanto desde un
punto de vista sincrnico como diacrnico (Barit et al., 2013). En un SOC, la
semntica se evidencia en la red de significados que se establece en un sistema
de organizacin del conocimiento, entre los distintos trminos que forman su
estructura (Barit et al., 2013). En un tesauro, esta red de significados se explicita
en las relaciones de equivalencia, jerarqua y asociacin (Hjrland, 2007a,b; ISO,
2001; Svenonius, 2003; Wersig & Neveling, 1976).
Finalmente, la sintaxis es ladisciplina que se ocupa del estudio de la estructura
gramatical de la lengua, y de las reglas que gobiernan la construccin de frases o
sentencias que forman el discurso, as como de la relacin entre las palabras que
las forman (Barit et al., 2013). En un SOC, la sintaxis es el conjunto de reglas
utilizadas para combinar descriptores o smbolos de clasificacin, de modo tal que
expresen una secuencia lgica (Barit et al., 2013). En este ltimo sentido, la
sintaxis de los SOC puede ser precoordinada o poscoordinada (Foskett, 1996;
Svenonious, 2003; Wersig & Neveling, 1976).
Barit et al. ofrecen dos acepciones para el trmino precoordinacin:
a. Procedimiento de combinacin de dos o ms trminos o smbolos
notacionales incorporado originalmente en un lenguaje documental (Barit
et al., 2013). En este caso, el signo del SOC puede ser una frase que
combine los conceptos que se desea representar (Miller y Teitelbaum,
2002). Ejemplos de este tipo de precoordinacin son los siguientes epgrafes
de LEMB:

comunicacin en administracin de bibliotecas


conservacin y restauracin de libros
programas nacionales para adquisicin y catalogacin

46

b. Combinacin de trminos o smbolos que realiza el indizador o el


clasificador considerando las temticas involucradas en el documento que
est procesando (Barit et al., 2013). En este caso se debe construir una
cadena precoordinada cuyos componentes deben seguir un orden de
mencin preestablecido (Miller y Teitelbaum, 2002). Los siguientes epgrafes
de LEMB y notaciones de CDU son ejemplo de cadenas precoordinadas:

bibliotecarios-tica profesional
bibliotecas-historia-hasta 400 d.C.
bibliotecologa-historia-Argentina-1810-1902
004:023
026(82)20

Las listas de epgrafes como LCSH, LEMB, Sears o ARMARC y los sistemas de
clasificacin como SCDD y CDU son precoordinados.
Por otro lado, tambin Barit et al. (2013) definen poscoordinacin como
procedimiento de libre combinacin de trminos o descriptores al momento en que
se define la ecuacin de bsqueda. En este caso, los trminos se almacenan en
cualquier orden y es el usuario final quien los coordina en su estrategia de
bsqueda (Miller & Teitelbaum, 2002). Los siguientes son ejemplos tomados del
Tesauro Spines:

economa
economa humana
economa de mercado

As, los tesauros son los SOC apropiados para la indizacin poscoordinada.

3.2 Enfoque terminolgico


Como se ver en captulos posteriores, este enfoque terminolgico es de
primordial relevancia para el diseo y desarrollo de un tesauro.
Comenzaremos por aclarar que la palabra terminologa puede entenderse en
dos sentidos. Por un lado, la terminologa (con minscula) es el conjunto de
trminos especializados propios de una disciplina o un campo de conocimiento. De
este modo, es comn referirse a la terminologa mdica, la terminologa
informtica, la terminologa jurdica, etc. Tambin se conoce como lengua de
especialidad.

47

Por otro lado, la Terminologa (con mayscula) es la disciplina o el campo


multidisciplinario

que

estudia

las

unidades

terminolgicas

los

productos

terminolgicos (glosarios, diccionarios, etc.) y propone una teora sobre ellos.


Quienes estudian los SOC desde el punto de vista de la Terminologa, lo hacen
generalmente sobre la base de la trada objeto-concepto-designacin, que resulta
de especial utilidad cuando se aplica al diseo de un tesauro (Figura 3.1).

Figura 3.1. Tringulo del concepto. El concepto es la representacin mental


de un objeto y se expresa mediante una designacin que denota al objeto.

La norma ISO 25964 para el diseo y desarrollo de tesauros afirma que un


trmino es una palabra o frase usada para etiquetar un concepto; a su vez,
define concepto como unidad de pensamiento (ISO, 2011, p. 3 y 12). Si bien
estas afirmaciones son correctas, llama la atencin la escasa y superficial
informacin que ofrece la norma tanto de concepto como de trmino.
Barit seala que el manejo de los conceptos en el rea de la BDCI es
indispensable tanto para lograr el control del vocabulario como para la recuperacin
de la informacin. Sin embargo afirma ese autor los profesionales de la BDCI
hemos sido extremadamente descuidados en el estudio de los conceptos, tendiendo
a trabajar apenas con las etiquetas o fachadas de los conceptos, sin considerar
los aspectos relativos a la construccin y definicin de los mismos (Barit, 2000a,
p. 31).
Debido a la importancia que esto tiene para el diseo de un tesauro,
recurriremos a otra fuente para explicarlo con mayor detalle: nos referimos a la
norma ISO 704:2009 sobre principios y mtodos del trabajo terminolgico (ISO,
2009). Esta norma terminolgica tiene numerosos puntos en comn con las normas

48

para el diseo de tesauros, pero ofrece precisiones que no se encuentran en estas


ltimas.

3.2.1 Objeto

Para la norma ISO 704:2009, un objeto es cualquier cosa que un ser humano
pueda percibir o concebir. Dahlberg (1978) lo llama referente.
El objeto puede ser concreto o material, como un edificio, una silla, un libro, un
nio, un bosque. Tambin puede ser abstracto o inmaterial como la felicidad, la
tristeza, el pensamiento, las ideologas, las acciones. Por ltimo, el objeto puede
ser imaginario como una sirena, un centauro, Hamlet, la Hogwarts School o
Macondo.
Todos los objetos tienen una o ms propiedades que los caracterizan y permiten
comprenderlos y aprehenderlos.

3.2.2 Concepto

Un concepto es la representacin mental de un objeto. A travs de la


observacin y de un proceso de abstraccin llamado conceptualizacin, un objeto
del mundo real o del mundo ideal es categorizado como una unidad de
conocimiento que es precisamente el concepto (ISO, 2009). Otros autores lo llaman
nocin (Barit, 2000a), pero aqu usamos concepto, siguiendo la citada norma ISO
704:2009.
Barit (2000b, p. 40) identifica los siguientes rasgos definitorios de concepto:

a.

Todo concepto es una construccin abstracta, que utiliza el lenguaje como va


para representar (o sea, volver a presentar) de un modo comprensible o
inteligible, un objeto o un fenmeno de la realidad (presente, pasada o incluso
futura) o del reino de lo ideal.

b.

Todo concepto o nocin corresponde a la expresin de una unidad aislable,


autnoma de pensamiento. Es, para decirlo de otra manera, una parte
significativa de la realidad material o ideal sobre la cual la reflexin humana
ejerce una segmentacin o delimitacin convencional [].

c.

Asimismo, y por consecuencia, cada concepto o nocin se constituye en una


unidad mnima y autosuficiente de conocimiento.

d.

La construccin de un concepto implica necesariamente su definicin, usualmente


por medio de claves de lenguaje [].

e.

Desde una ptica terminolgica, todava es posible agregar un quinto rasgo o


atributo de las nociones, y es que cada una de ellas, en tanto unidad orgnica de
conocimiento, se inserta necesariamente en una rama, una parte, una disciplina,

49

en suma, del saber especializado. No cabe hablar de conceptos en Terminologa


sin el marco referencial de una disciplina (cientfica, tcnica) o de una
especialidad, y del sistema de conceptos que la representa. Ausente ese marco,
solo encontramos palabras de la lengua general con sus significados, pero no
conceptos especializados, pues los conceptos son en ltima instancia, unidades
cognitivas que adquieren su significacin plena slo en el contexto de un sistema
nocional disciplinario.

Un concepto puede ser general o individual (ISO, 2009). Es un concepto general


cuando representa a un conjunto de objetos que comparten propiedades comunes,
por ejemplo: organismos internacionales, universidades, pases americanos, naves
espaciales. En cambio, es un concepto individual cuando representa un objeto
nico, distinto de todos los dems y que constituye una unidad inconfundible, por
ejemplo: Organizacin de las Naciones Unidas, Universidad de Buenos Aires,
Paraguay, Apolo 11.
El concepto, ya sea general o individual, se construye a partir de las
caractersticas que predican o declaran las propiedades del objeto. Cada propiedad
del objeto se abstrae como una caracterstica del concepto. Entonces, un concepto
es la abstraccin de un objeto y una caracterstica es la abstraccin de una
propiedad del objeto.
Las caractersticas pueden ser, bsicamente, de dos tipos:

Caractersticas

esenciales:

son

aquellas

caractersticas

necesarias

suficientes para determinar un concepto y son imprescindibles para definir el


objeto sin ambigedad. Por ejemplo, el concepto caballo tiene, entre otras,
las siguientes caractersticas esenciales: es un mamfero perisodctilo,
pertenece al gnero equus, especie ferus, subespecie caballus, es herbvoro.

Caractersticas accidentales: son aquellas caractersticas adicionales o


posibles que solo se pueden generalizar respecto a una parte del objeto o a
ciertos tipos de objetos. Siguiendo con el ejemplo del concepto caballo, las
siguientes seran caractersticas accidentales: es un alazn, posee una
marca blanca en la cara de tipo lucero, tiene calcetines blancos en tres
patas, compite en deportes ecuestres.

El conocimiento de las caractersticas del concepto hace posible: a) construir el


concepto, b) definir el concepto, c) establecer las relaciones entre los conceptos y
d) modelar un sistema de conceptos (Dahlberg, 1978).
Dado que las caractersticas y los conceptos son representaciones mentales o
abstracciones, para comunicarlos es necesario recurrir a la lengua. As, una
caracterstica se expresa mediante un enunciado y un concepto se expresa por
medio de una definicin o de una designacin.
50

3.2.3 Definicin

De acuerdo con Barit et al., una definicin es:

Conjunto de enunciados que describen un objeto (cosa, ser, fenmeno, entidad), en


un nivel de abstraccin dado, con la finalidad de establecer su identidad, y
diferenciarlo inequvocamente de otros objetos. La definicin de un trmino es un
presupuesto bsico para la comunicacin, el intercambio en uno o varios idiomas y la
argumentacin, y constituye un elemento insustituible en la construccin del
pensamiento cientfico. Debe cumplir, entre otros, los siguientes requisitos: precisin,
concisin, claridad, autosuficiencia y un nivel de exhaustividad adecuado a los
destinatarios (Barit et al., 2013).

La definicin establece los lmites del concepto, hace posible su comprensin y


lo distingue de otros conceptos. El conjunto de caractersticas que forma el
concepto

se

denomina

la

intensin

del

concepto.

El

conjunto de

objetos

conceptualizados como un concepto se conoce como la extensin del concepto


(ISO, 2009). Entonces, se puede establecer una definicin por intensin o una
definicin por extensin. Por ejemplo:

Definicin por intensin de caballo: mamfero, herbvoro, perisodctilo del


gnero Equus, especie ferus, subespecie caballus. Posee cuello y cola
poblados de cerdas largas y abundantes, domesticado desde hace unos
5500 aos. En general es de gran porte, aunque vara en tamao, pelaje,
marcas y actividades a las que se destina.

Definicin por extensin de caballo: el caballo puede ser rabe, anglo rabe,
criollo argentino, connemara, hannoveriano, poni australiano, holstein, poni
camargue, appaloosa, haflinger, poni dartmoor, jaca galesa, andaluz, de
silla, poni new forst, lipizzano, de tiro holands [].

La norma ISO 704:2009 considera que el tipo de definicin ms conveniente en


el rea de la Terminologa es la llamada definicin por intensin. Este tipo de
definicin se compone de un concepto superordenado, que ubica el concepto en su
contexto, seguido por las caractersticas que lo delimitan. Como seala Barit
(2000a), el principio involucrado en la definicin por intensin es el de gnero
prximo y diferencia especfica, que ha sido tambin sealado por otros autores
para las definiciones en los tesauros y otros SOC (Aguado et al., 1999; Hudon,
1996; Vickery, 1960a).
A continuacin se presentan tres ejemplos de definicin por intensin:

51

caballo
DEF mamfero del orden de los Perisodctilos, solpedo, del gnero
Equus, especie ferus, subespecie caballus. Es herbvoro, de cuello
y cola poblados de cerdas largas y abundantes, domesticado desde
hace unos 5500 aos. Suele ser de gran porte, aunque vara en
tamao, pelaje, marcas y actividades a las que se destina.

caballo deportivo
DEF caballo que se destina a la prctica de los deportes ecuestres
como el salto de obstculos, la hpica, el polo, la doma, etc.

Secretariat
DEF caballo deportivo que se destac en la hpica. Naci en Estados
Unidos el 30 de marzo de 1970 y muri el 4 de octubre de 1989. Hijo
de

Bold

Ruller

en

la

yegua

Somethingroval.

Propiedad

del

stud

Meadow Stable de Penny (Chenery) Tweedy. Particip en 21 carreras


con una marca de 21-16-3-1. En 1973 gan la Triple Corona y los
tres aos que corri, 1972, 1973 y 1974 fue designado Caballo del
Ao.

El primer concepto (caballo) es el ms general, mientras que el ltimo


(Secretariat) es el ms especfico. El gnero prximo se hereda de una definicin a
otra: caballo deportivo hereda el gnero caballo, mientras que Secretariat hereda
el gnero caballo deportivo. Esta cualidad de heredar el gnero prximo resulta
muy til en un tesauro para establecer las relaciones jerrquicas, que a veces se
designan como relaciones padre-hijo. Por ejemplo, de las tres definiciones
anteriores se puede determinar la relacin jerrquica entre los conceptos:

caballo
caballo deportivo
Secretariat

3.2.4 Designacin

La designacin es la expresin de un concepto por medios verbales o


simblicos. As, la moneda argentina puede designarse por medio del trmino pesos
o del smbolo $, mientras que la norma jurdica que regula los derechos morales y
patrimoniales del autor de una obra puede designarse por el trmino derecho de
autor o por el smbolo .

52

Entre las designaciones verbales se puede hacer una distincin entre trmino y
nombre propio. Un concepto general se designa mediante un trmino, mientras que
un concepto individual se designa mediante un nombre propio. Volviendo al
ejemplo del apartado anterior, caballo y caballo deportivo son trminos que
designan conceptos generales. En cambio Secretariat es un nombre propio que
designa un concepto individual.
En la lengua natural, un concepto puede ser expresado por una o varias
designaciones (sinonimia). A su vez una designacin puede expresar uno o varios
conceptos (homonimia). Por el contrario, en un SOC cada concepto debe
expresarse por una y solo una designacin e inversamente cada designacin debe
expresar uno y solo un concepto. Segn el tipo de SOC, la designacin puede ser,
por ejemplo, un epgrafe, una notacin, un trmino preferente, o una forma
autorizada del nombre.

3.2.5 Relaciones semnticas y sistemas de conceptos

Cada concepto es una unidad de conocimiento, pero no es una unidad aislada,


sino que mantiene relaciones semnticas con otros conceptos. Estas relaciones
permiten construir una estructura que constituye un sistema de conceptos, definido
como un conjunto de conceptos estructurado de acuerdo con las relaciones entre
ellos (ISO, 2009, p. 8).
Un SOC, en tanto sistema de conceptos, debe definir los conceptos, designarlos
en forma unvoca, relacionarlos por su semntica y organizarlos en un orden
determinado. En el tesauro, las relaciones semnticas son de tres tipos:

Relacin de equivalencia: se establece entre un trmino o un nombre propio


elegidos para la indizacin y sus sinnimos o formas variantes.

Relacin jerrquica: se establece entre un concepto que representa un


gnero o un todo y otro que representa una especie, una parte, o un
ejemplo del anterior.

Relacin asociativa: se establece entre dos conceptos, que no pueden


considerarse ni equivalentes, ni jerrquicos.

3.3 Enfoque bibliotecolgico


Los Functional requirements for subject authority data (FRSAD) son parte del
nuevo modelo conceptual que ha propuesto IFLA para las bases de datos
bibliogrficas y de autoridades, que se integra en la llamada familia FRBR con los
requisitos

funcionales

para

registros

bibliogrficos
53

(FRBR)

los

requisitos

funcionales para datos de autoridad de nombres propios (FRAD) (IFLA, 2004,


2009b, 2010).
Originalmente, el modelo FRBR defini tres grupos de entidades segn se
muestra en la Tabla 3.1. Sin embargo, desde el primer momento se not que las
entidades del Grupo 3 no eran del todo correctas, ya que como hemos visto, un
concepto representa un objeto y ste a su vez puede ser cualquiera de las
entidades de los grupos 1, 2, 3 u otras ms. De modo que para no alterar el
modelo, los responsables de FRSAD se vieron obligados a postular dos superclases
que responden a los trminos en latn thema y nomen.

Tabla 3.1. Entidades del modelo FRBR-FRAD-FRSAD

Thema (en plural themata o themas) es cualquier entidad usada como materia
de una obra. Una obra puede tener como materia uno o varios themas y, a su vez,
un thema puede ser materia de una o varias obras, segn se muestra en la Figura
3.2.

Figura 3.2. Relacin obra-thema. Ntese la doble flecha que relaciona estas
entidades: una obra puede tener uno o ms themas como materia y un
thema puede ser materia de una o ms obras.

54

Por otra parte, nomen (en plural nomina o nomens) es cualquier signo o
secuencia de signos por los que se conoce, refiere o dirige un thema. Por ejemplo,
el thema

puede tener como nomens anteojos, espejuelos, gafas, lentes o la

notacin de CDU 617.7-089.24.


La relacin entre thema y nomen se esquematiza en la Figura 3.3. Como se
puede observar, en la lengua natural, un thema puede ser designado por uno o
varios nomens (sinonimia) y a su vez un nomen puede designar uno o varios
themas (homonimia). Al contrario, en un SOC un thema puede ser designado por
uno o varios nomens (uno preferente y otros equivalentes o no preferentes), pero
un nomen slo puede designar un thema.

Figura 3.3. Relacin thema-nomen. A) En la lengua natural la flecha es doble


en ambas direcciones, pues un thema puede tener uno o ms nomens y a la
inversa, un nomen puede designar uno o ms themas. B) En un SOC la flecha
es doble en un sentido y simple en el otro, porque un thema puede tener uno
o ms nomens (solo uno preferente), pero un nomen puede designar un solo
thema.

Este enfoque bibliotecolgico permite generalizar el asunto o materia, ms all


de las diferencias que existen entre los distintos SOC. As por ejemplo, el thema en
un tesauro siempre es un concepto y por lo tanto, el enfoque terminolgico se
ajusta perfectamente. En cambio en los SOC precoordinados, el thema puede ser
un concepto o una combinacin de conceptos.
El nomen en un tesauro puede ser un trmino preferente, un trmino no
preferente, una forma autorizada del nombre o una forma variante del nombre,
como se detalla en el Captulo 7.
En una lista de epgrafes el nomen puede ser un epgrafe, una forma autorizada
del nombre, una cadena precoordinada o las formas variantes de todos stos. De
forma similar, en un sistema de clasificacin el nomen puede ser una notacin o
una cadena precoordinada de notaciones, as como los equivalentes verbales de

55

stas. Por ejemplo, observemos los siguientes nomens de la lista de epgrafes


ARMARC y del sistema de clasificacin CDU:

iglesia y problemas sociales


enciclopedias y diccionarios para nios
oceonografa-aparatos e instrumentos
331.2 Salarios. Sueldos. Remuneraciones. Pagos
37:61(82) Enseanza de la medicina en Argentina

56

Autoevaluacin

a. Cules son los distintos enfoques con que se han estudiado los SOC?

b. Explique la diferencia entre lengua natural y lengua artificial.

c. Qu caractersticas posee el vocabulario de un SOC?

d. Indique cmo se evidencian la semntica y la sintaxis en un SOC.

e. Explique la trada objeto-concepto-designacin.

f.

Qu tipo de definicin se recomienda para un tesauro?

g. Qu designacin verbal le corresponde a un concepto general?

h. Qu designacin verbal le corresponde a un concepto individual?

i.

Qu significado tienen los trminos thema y nomen?

j.

Explique las relaciones entre obra y thema y entre thema y nomen.

k. Mencione las relaciones thema-thema y nomen-nomen.

57

4. El tesauro

En los captulos anteriores hemos establecido un marco de referencia general.


Ahora nos introduciremos, especficamente, en el tema del tesauro. Lo definiremos
y caracterizaremos, analizando tambin su funcin y su tipologa.

4.1 Definicin y caracterizacin del tesauro


En el Captulo 2 se estableci que el tesauro es un SOC y que diversos
especialistas lo han clasificado en distintas categoras: es una lista de relaciones
(Hodge, 2000), un SOC basado en relaciones (Tudhope et al., 2006), un modelo de
relaciones (Zeng, 2008), una estructura de conceptos y relaciones (Souza et al.,
2010; 2012), o una herramienta semntica (Broughton et al., 2005; Hjrland,
2007a). Estas categoras resaltan principalmente las relaciones entre los conceptos
del tesauro.
Tambin establecimos en el Captulo 3 que los SOC, en tanto lenguas
artificiales, constan de un vocabulario, una semntica y una sintaxis (Svenonius,
2003). Explicamos adems la trada objeto-concepto-designacin de importancia
crtica para el tesauro (Barit, 2000a; ISO, 2009).
Sobre esta base y teniendo en cuenta las numerosas definiciones de tesauro
que aparecen en la bibliografa, nos permitimos establecer nuestra propia definicin
como marco de referencia para esta obra:

Un tesauro es un sistema de organizacin del conocimiento.

Se compone de: a) un vocabulario controlado, b) una estructura de


relaciones semnticas explcitas de equivalencia, jerarqua y asociacin, c)
un orden sistemtico que evidencia el sistema de conceptos de un dominio,
d) una sintaxis poscoordinada y e) una cobertura limitada a un dominio
determinado.

Se aplica a la organizacin y recuperacin del conocimiento registrado, en


bases de datos bibliogrficas, bibliotecas virtuales, portales Web, etc.

Como todos los SOC, un tesauro impone una cierta concepcin del mundo, de
acuerdo con el dominio que trata, los usuarios a los que est dirigido, la lengua en
que se elabora, la cultura de una regin, pas, de grupo tnico u organismo del que
procede.

58

4.2 Componentes del tesauro


Hemos mencionado en nuestra definicin los componentes del tesauro. Ahora
explicaremos brevemente cada uno de ellos.

4.2.1 El vocabulario controlado

El tesauro, en tanto SOC, consta de un vocabulario controlado formado por un


conjunto de trminos y nombres propios que designan, respectivamente, conceptos
generales e individuales. En el vocabulario de un tesauro se elimina toda sinonimia
y homonimia, con el fin de aportar consistencia a la recuperacin.
Si bien las normas y los manuales para el diseo y desarrollo de tesauros
incluyen recomendaciones respecto a la redaccin de los trminos y nombres
propios segn se detalla en el Captulo 7 de esta obra, es importante tener en
cuenta que el elemento esencial del vocabulario de un tesauro es el concepto y no
el trmino o el nombre que lo designa, ya que estos ltimos pueden variar, pero no
el concepto que debe definirse con precisin.

4.2.2 Las relaciones del tesauro

Los conceptos incluidos en un tesauro se vinculan semnticamente entre s


mediante relaciones de equivalencia, jerarqua y asociacin.
La relacin de equivalencia es la que se establece entre un trmino que ha sido
seleccionado para el tesauro y los sinnimos que han sido descartados, o bien entre
una forma aceptada del nombre propio y las variantes que ste pudiera tener.
La relacin jerrquica se establece entre un concepto que representa el gnero
o el todo y otro que representa una especie, una parte o un ejemplo del anterior.
La relacin asociativa es aquella que se establece entre dos conceptos, pero que
no es ni equivalente ni jerrquica.
Un tesauro debe presentar las tres relaciones de modo explcito y recproco; si
carece de alguna de ellas no es un tesauro. Estas relaciones se describen con
detalle en los captulos 7 y 8.

4.2.3 Orden sistemtico

Los conceptos del tesauro se ordenan formando un orden sistemtico o


clasificado. El orden sistemtico es una caracterstica del tesauro que hace evidente

59

el sistema de conceptos del dominio y sita cada concepto en ese contexto, de


modo similar al esquema de un sistema de clasificacin.
La metodologa sugerida por la norma ISO 25964 y otros autores para construir
el orden sistemtico es el anlisis de facetas (ISO, 2011; Mills, 2004), que se trata
en el Captulo 9, aunque no es el nico mtodo posible.

4.2.4 Sintaxis poscoordinada

El

tesauro

es

un

SOC

desarrollado

especialmente

para

la

indizacin

poscoordinada, es decir los trminos y los nombres propios se almacenan en el


registro bibliogrfico o metadatos sin un orden de cita o de mencin predefinido y
son coordinados por el usuario en el momento de la recuperacin. Esta
caracterstica tambin establece una diferencia entre el tesauro y las listas de
epgrafes que son precoordinadas.

4.2.5 El dominio del tesauro

En general, se considera que el tesauro es un tipo de SOC limitado a una cierta


especialidad, campo temtico o dominio, distinto de otros SOC que procuran
abarcar la universalidad del conocimiento. En efecto, el tesauro naci con el
propsito de resolver problemas de recuperacin en reas especficas de la ciencia
y

la

tecnologa

y,

hasta

ahora,

los

numerosos

tesauros

elaborados

son

especializados.
Sin embargo, no podemos evitar que nos surja una duda: La especializacin es
realmente una caracterstica del tesauro o no se ha presentado la oportunidad de
desarrollar un tesauro universal?
Por un lado, desarrollar un tesauro es una iniciativa costosa; por otro lado,
existen SOC universales que con peridicas actualizaciones han dado solucin a las
bibliotecas generales o similares. Entonces, es posible que no se haya planteado la
necesidad de construir un tesauro general o enciclopdico, lo cual no significa que
no se pueda hacer. De hecho, las experiencias de interoperabilidad entre tesauros
que se han llevado a cabo desde hace varias dcadas, de alguna manera reflejan la
necesidad de contar con tesauros ms generales en cuanto a su alcance temtico
(Martnez Tamayo et al., 2011a).
Ms an, la pretendida tesaurizacin de algunas listas de epgrafes universales
como LCSH, Sears y, en Amrica Latina, la versin digital de LEMB y la lista
ARMARC, si bien insatisfactoria en sus resultados (Dykstra, 1988; Rolland-Thomas,
1989), tambin sugiere la posibilidad de un tesauro universal.

60

No obstante y a pesar de nuestras dudas, aqu aceptamos el carcter


especializado que suele asignarse al tesauro.

4.3 Las funciones del tesauro


El tesauro surgi con el fin de facilitar la indizacin y la bsqueda en sistemas
de almacenamiento y recuperacin (SAR) como los catlogos de biblioteca o las
bibliografas. Esta funcin por supuesto sigue vigente hoy en da. Sin embargo, a
partir del surgimiento de la Web y especialmente de la Web semntica, el tesauro
tambin se ha destinado a otras funciones como la navegacin, la bsqueda
expandida o la asistencia en la indizacin automtica.

4.3.1 El tesauro en los registros bibliogrficos y metadatos

En una base de datos bibliogrfica como un catlogo de biblioteca o una


bibliografa, el tesauro cumple su funcin tanto en el proceso de indizacin, como
en el de bsqueda, que estn ntimamente vinculados, como las dos caras de una
moneda. El profesor australiano Antony C. Foskett (1996) explica la relacin entre
estos procesos basndose en el conocido modelo de la comunicacin de ShannonWeaver (Figura 4.1).

Figura 4.1. Modelo del proceso de la indizacin. Muestra al autor como


emisor, la obra como mensaje, el usuario final como receptor y al indizador
como intrprete.

Brevemente, para Foskett el autor del contenido de un documento emite un


mensaje (la obra), en un determinado cdigo. Luego, el indizador decodifica el
mensaje del autor, lo interpreta y describe en un registro bibliogrfico que es
almacenado en la base de datos, emitiendo as un nuevo mensaje, en un nuevo
cdigo: los trminos y nombres propios del tesauro (figuras 4.1 y 4.2).

61

Figura 4.2. Registro bibliogrfico de un catlogo en lnea. La flecha seala los


trminos preferentes, que han sido tomados del Tesauro de la Unesco. (La
figura muestra un registro bibliogrfico del catlogo de la Biblioteca de la
Facultad de Humanidades y Ciencias de la Educacin de la Universidad
Nacional de La Plata).

Por su parte, el usuario final presenta su consulta utilizando tambin los


trminos y nombres propios del tesauro y el sistema le devuelve una respuesta,
que decodifica e interpreta; es por tanto el receptor final del mensaje.
El tesauro tambin puede usarse para la indizacin de un recurso Web,
mediante un registro metadatos. Este tipo de registros puede incrustarse en el
mismo documento o puede generarse aparte y enlazarse por un hipervnculo
(Angelozzi & Martn, 2010). Su normalizacin se basa en un esquema metadatos
como el de la Dublin Core Metadata Initiative (DCMI), dentro de cuyos elementos
se encuentran las palabras claves, notaciones, epgrafes o trminos preferentes de
un tesauro, que es la opcin recomendada (DCMI, 2012). En la Figura 4.3 se
muestra un ejemplo de registro metadatos.

62

Figura 4.3. Registro metadatos de un repositorio institucional. Ntense las


etiquetas DC que corresponden al esquema de la DCMI. (La figura muestra
un registro metadatos del repositorio Memoria Acadmica de la Facultad de
Humanidades y Ciencias de la Educacin de la Universidad Nacional de La
Plata).

De modo que el tesauro, en tanto SOC, tiene una funcin claramente definida:
indizar y recuperar el conocimiento registrado. Esta funcin hace que el tesauro sea
distinto, por ejemplo, de los bancos terminolgicos, los glosarios y los diccionarios
de sinnimos e ideas afines, que si bien muestran similitud, tienen otras
finalidades.

4.3.2 El tesauro de segunda generacin

La profesora canadiense Michle Hudon recuerda que las primeras discusiones


sobre las ventajas de la publicacin electrnica de tesauros tuvieron lugar en la
ltima dcada del siglo veinte y resaltaban principalmente la reduccin de los
costos, as como la expectativa de un incremento en la disponibilidad de tesauros
en la Web y del uso de stos. Pero afirma Hudon: Lo que era visto como una
opcin atractiva en 1995 se convirti rpidamente en la nica opcin si es que los
tesauros han de cumplir un rol en el nuevo mundo de la informacin (Hudon,
2003, p. 116).
63

Hudon distingue entre los tesauros de primera generacin y los tesauros de


segunda generacin. Los primeros son tesauros estticos, en su mayora impresos.
Algunos han sido digitalizados y se encuentran en la Web como archivos PDF.
Otros, si bien en formato html no agregan mayores innovaciones ni facilitan su uso
en diferentes aplicaciones.
Por el contrario, el tesauro de segunda generacin debe ser dinmico, con
registros almacenados en una base de datos accesible mediante los motores de
bsqueda como Google o Yahoo. Los trminos preferentes y las formas autorizadas
del

nombre deben estar hipervinculados entre s

mediante sus relaciones

semnticas. El tesauro debe facilitar la navegacin a travs del orden sistemtico y


el orden alfabtico. Tiene que ser fcil de consultar, intuitivo, con mnimas
instrucciones y ayudas suficientes, pero simples. Es importantsimo que el tesauro
pueda interactuar con distintas aplicaciones como las bases de datos bibliogrficas,
los portales Web, etc. y estar disponibles en los puestos de trabajo tanto del
indizador como del usuario final.
Una de las funciones que cumple el tesauro en un sistema de recuperacin
moderno es su apoyo a la indizacin automtica. Es una tcnica basada en
programas informticos que seleccionan y procesan las palabras del texto de los
documentos y las convierten en trminos de indizacin. La indizacin automtica se
basa en el anlisis lingstico (morfolgico, sintctico y semntico) y en el anlisis
estadstico (frecuencia u ocurrencia de una palabra y su ponderacin). El proceso es
el siguiente (Cleveland & Cleveland, 2013; Gil Leiva, 2008):

Eliminacin de palabras vacas: el sistema descarta artculos, preposiciones,


conjunciones, etc., mediante una lista de palabras vacas o stopword que la
computadora pueda desechar.

Anlisis lingstico: el sistema realiza la desambiguacin de trminos, la


lematizacin (steeming) y el anlisis tanto de la sintaxis como de la
semntica.

Anlisis estadstico: clculo de la frecuencia de palabras y frases en el texto


y en la coleccin y ponderacin de las mejores palabras y frases.

La funcin del tesauro en la indizacin automtica consiste en facilitar la


traduccin de las palabras o frases seleccionadas por la computadora a los trminos
preferentes del tesauro. Esto se hace mediante mtodos de mapeo, que

le dan

consistencia a la indizacin, ya que la computadora selecciona palabras, pero no


distingue conceptos.
Otra funcin del tesauro de segunda generacin es la de facilitar la bsqueda
expandida, que se define como la etapa del proceso de recuperacin en la que se
enriquece la pregunta inicial del usuario mediante la adicin de trminos que

64

mejoran la recuperacin. Esta funcin es til porque los trminos empleados por el
usuario no siempre reflejan con exactitud su verdadero inters. El aporte del
tesauro en este caso consiste en mapear los trminos de bsqueda del usuario
contra los trminos preferentes del tesauro, sugiriendo adems las relaciones
jerrquicas y asociativas correspondientes y facilitando la navegacin.
En un estudio realizado por Shiri & Revie (2006) sobre la base de datos CAB
abstracts, especializada en ciencias biolgicas, se comprob que el 60% de las
bsquedas se expandieron mediante los trminos del tesauro. De ellas, los usuarios
seleccionaron principalmente relaciones jerrquicas y, en menor proporcin, las
asociativas. Sin

embargo,

los autores mencionados sealan

que

en

otras

investigaciones las relaciones asociativas han sido las preferidas por los usuarios
para la expansin. Como quiera que sea, la bsqueda expandida por medio de un
tesauro es una ventaja.
El tesauro puede cumplir adems con otras funciones como la verificacin de la
ortografa y la sugerencia de trminos alternativos, como la tpica opcin Quiso
decir ? que se encuentra disponible en los motores de bsqueda de la Web o en
los nuevos catlogos de biblioteca NextGen.
Hudon (2003) va ms all y propone que los tesauros deben considerarse
imprescindibles, no solo para las bases de datos bibliogrficas disponibles en la
Web, sino tambin para los portales temticos e incluso para los motores de
bsqueda de la Web.

4.4 Tipos de tesauros


Un macrotesauro es un tesauro de cobertura temtica amplia, que suele tener
bajo nivel de especificidad, mientras que un microtesauro es un tesauro dedicado a
un campo de conocimiento restringido, con un alto nivel de especificidad (Barit et
al., 2013). Un macrotesauro puede actuar como paraguas para interconectar varios
microtesauros, de modo tal que los temas generales sean indizados por el
macrotesauro y los especficos por alguno de los microtesauros.
Un tesauro de bsqueda es un tesauro que intenta asistir al usuario final
durante la etapa de recuperacin, an cuando el sistema de informacin se maneje
slo con lengua natural, para lo cual sugiere las posibles relaciones de equivalencia,
jerarqua y asociacin (Aitchison et al., 2000; Bates, 1986, 1989). Un tesauro
comn, que se utiliza para la indizacin, puede usarse tambin como tesauro de
bsqueda.

65

Un tesauro multilinge es un tesauro en varios idiomas. El tesauro de UNBIS3,


creado por la Biblioteca Dag Hammarskjld de la ONU, con sus versiones en rabe,
chino, ingls, francs, ruso y espaol, es un ejemplo de tesauro multilinge. Otros
tesauros del sistema de la ONU cuentan tambin con esta caracterstica.
Un clasauro es un SOC hbrido entre el tesauro y el sistema de clasificacin.
Introducido por Bhattacharyaa (1982), su finalidad es utilizar un solo SOC para la
indizacin y la clasificacin, es decir para describir el contenido de los documentos
en el catlogo o la bibliografa y para ordenar dichos documentos en el estante u
otro tipo ordenamiento sistemtico. El SOC Chinese Classified Thesaurus de la
Biblioteca Nacional de China es un ejemplo de clasauro.

http://lib-thesaurus.un.org/LIB/DHLUNBISThesaurus.nsf/$$searche

66

Autoevaluacin
1. Qu es un tesauro?

2. Cules son los componentes del tesauro? Explque cada uno de ellos.

3. Describa las funciones del tesauro en una base de datos bibliogrfica, segn
Foskett.

4. Qu funcin puede cumplir el tesauro en la indizacin automtica?

5. Qu funcin puede cumplir el tesauro en la bsqueda expandida?

6. Qu tipos de tesauros podemos encontrar?

67

5. La historia del tesauro

En este captulo trataremos sobre el origen del tesauro, que est ntimamente
ligado a la aparicin de la indizacin poscoordinada y sta, a su vez, a la necesidad
de procesar la enorme cantidad de informacin cientfica y tecnolgica generada
por la investigacin en el siglo veinte.

5.1 El origen de la indizacin poscoordinada


Si bien hubo algunos antecedentes previos, puede decirse que la indizacin
poscoordinada comenz hacia fines de la II Guerra Mundial. Debido justamente a la
guerra, se produjeron en los pases beligerantes cantidades masivas de informes
tcnicos que registraban los resultados de investigaciones relacionadas con el
conflicto y, hacia el final de la contienda, se sumaron a stos millones de
documentos obtenidos en los pases vencidos (Chu, 2003; Varlejs, 2004).
De igual modo, la posguerra trajo consigo una expansin an mayor de la
investigacin cientfica y los desarrollos tecnolgicos, estimulada por los altos
presupuestos que destinaron los gobiernos, las universidades y la industria a estos
fines. El resultado fue un nuevo flujo de conocimiento y, por extensin, una
avalancha de publicaciones cientficas. Este fenmeno es conocido como la
explosin de la informacin y afect principalmente a las revistas especializadas y a
los sistemas de recuperacin. A manera de ejemplo, entre 1910 y 1960 la literatura
sobre Economa creci de 5.000 a 40.000 artculos por ao y la de Psicologa de
30.000 a 90.000 (ISSN Center, 2011; Riaz, 1989; van Dijk, 1972). As, el nmero
de publicaciones peridicas registr un crecimiento exponencial durante todo el
siglo veinte (Figura 5.1).
Hacia 1970 las revistas cientficas o acadmicas comunicaban al menos el 70%
de los nuevos conocimientos y desarrollos tecnolgicos (Mijailov & Guiliarevski,
1974). A esto haba que agregar los informes tcnicos, las patentes, las normas, las
tesis y un largo etctera, que inclua adems las imgenes fijas y en movimiento u
otros materiales multimedia con contenido cientfico, por ejemplo las fotografas de
microorganismos tomadas a travs de un microscopio, las imgenes del nacimiento
de una estrella captadas por un telescopio, o el registro flmico de un conflicto
social.

68

Figura 5.1. Crecimiento de las publicaciones peridicas desde 1800 hasta


2000. Alrededor de 100 ttulos en 1800, 1000 ttulos en 1850, 10.000 en
1900, 100.000 en 1950 y 1.000.000 en 2000 (Fuentes: ISSN Center, 2011,
Raz, 1989).

Antes de la Segunda Guerra Mundial, prcticamente la nica forma de indizacin


conocida era la asignacin de epgrafes, pero lleg un momento en que esto no fue
suficiente para el procesamiento de los documentos y se hizo necesario probar con
algo nuevo. Las propuestas innovadoras culminaron en lo que hoy conocemos como
indizacin poscoordinada (Kilgour, 1998).
Una de las primeras iniciativas en este sentido fue la del britnico William E.
Batten, que se desempeaba en el Britains Imperial Chemical Industries, Patents
and Intelligence Department. En 1944 Batten dise un sistema para indizar las
patentes, basado en una ficha tabular, cuya grilla o matriz de 20 filas por 20
columnas, contaba con 400 celdas en total (Figura 5.2). Las fichas diseadas por
Batten fueron conocidas como fichas peek-a-boo o fichas de coincidencia ptica.
En el sistema de Batten, a cada ficha se le asignaba un trmino que se extraa
del propio documento. Entonces, si el documento n 46 era la patente de un
ventilador para autos, se tomaba la ficha del trmino ventiladores y se abra un
orificio en el nmero de documento correspondiente (el 46 en la Figura 5.2). Luego
se tomaba la ficha de autos y se haca lo mismo. Cuando el usuario solicitaba
informacin sobre ventiladores para autos, se tomaban las dos fichas, se
superpona una a la otra y se contrastaban contra una fuente de luz. El rayo de luz
solo poda pasar por los orificios que coincidan en ambas fichas, que era
justamente el nmero de documento que inclua ambos conceptos, es decir el 46.

69

Figura 5.2. Ejemplo de una ficha peek-a-boo de William E. Batten. Como se


puede observar, el rayo de luz pasa por el orificio que se encuentra en la fila
40, columna 6, es decir, el documento 46, que trata sobre ventiladores y
autos.

Otra propuesta fue la del estadounidense Calvin N. Mooers, que en 1947


invent una mquina a la que llam Zator, capaz de coordinar dos o ms fichas
perforadas en el borde. Por cada documento ingresado en la coleccin, se abra una
ficha Zatocard que soportaba un mximo de 40 perforaciones en el borde (Figura
5.3). Cada perforacin corresponda a un trmino, que Mooers denomin descriptor,
de modo que se podan asignar hasta 40 descriptores por documento. El sistema
Zatocode serva para una coleccin de 10.000 documentos o un poco ms.
Para la recuperacin, se marcaban en la mquina Zator los descriptores que se
deseaba recuperar. Todas las fichas se colocaban en un dispositivo de la mquina,
semejante a una caja, que al accionarse comenzaba a moverse, agitando todas las
fichas de modo tal que slo aquellas que respondan a los descriptores indicados
caan fuera de la caja. El sistema produca algunas recuperaciones falsas, pero en
general

fue eficaz. Una

fotografa

de la

mquina

Zator puede verse

en

http://www.flickr.com/photos/acrl/2387064291/.
La tercera propuesta fue el sistema Uniterm del bibliotecario estadounidense
Mortimer Taube. El sistema Uniterm era similar al de Batten, pero ms sencillo.
Alrededor de 1952 Taube dise una ficha con diez columnas numeradas del 0 al 9.
Al igual que la ficha peek-a-boo, cada ficha Uniterm corresponda a un trmino (de
ah la palabra uniterm o unitrmino). Taube consideraba equivocadamente que
un trmino era igual a una palabra, de manera que el concepto escuelas pblicas

70

daba lugar a dos fichas: una para escuelas y otra para pblicas. Luego de varias
experiencias y crticas, qued claro que esta modalidad provocaba numerosas
recuperaciones falsas, por lo que Taube debi modificar su criterio y aceptar que
muchos trminos son frases.

Figura 5.3. Ejemplo de una ficha Zatocard de Calvin Mooers. En el cuerpo de


la ficha se registraban los datos identificatorios del tem y en el borde se
perforaban los descriptores correspondientes, en este caso ventiladores y
automviles.

Por otro lado, cada documento ingresado en la coleccin reciba un nmero


consecutivo que era anotado en la columna de la ficha, haciendo coincidir el ltimo
dgito del nmero de documento con el nmero de la columna. Por ejemplo, el
documento 25 era anotado en la columna 5, el 282 en la columna 2, el 1318 en la
columna 8 y as sucesivamente. Para la recuperacin en el sistema Uniterm se
tomaban las fichas de los trminos que se deseaba coordinar y se verificaba qu
nmeros de documento coincidan. En la Figura 5.4 se muestra un ejemplo de la
ficha Uniterm.
A partir del sistema Uniterm, Taube concibi la teora de la indizacin
coordinada sobre la cual dict numerosas conferencias. El debate surgido alrededor
de esta teora llev a la conclusin de que en todo sistema de recuperacin es
necesario coordinar los trminos: en un caso, por ejemplo cuando se usa una lista
de epgrafes, la coordinacin la realiza el indizador en la etapa de almacenamiento
y se denomina indizacin precoordinada y en el otro, por ejemplo el tesauro, la
coordinacin la lleva a cabo el usuario en el momento de la recuperacin y se
conoce como indizacin poscoordinada. Los sistemas peek-a-boo, Zatocode y

71

Uniterm fueron entonces los primeros sistemas de indizacin poscoordinada


(Kilgour, 1998).

Figura 5.4. Ejemplo de la fichas Uniterm de Mortimer Taube. El documento


que trata sobre ventiladores y autos es el 46, que se encuentra en la
columna 6.

El sistema Uniterm fue el primero en ser probado en una computadora: en 1954


en la Naval Ordinance Test Station y en 1958 en la Gas Turbine Division of General
Electric, ambos de Estados Unidos. Estas experiencias abriran el camino para el
procesamiento informtico y para la creacin del tesauro.

5.2 El origen del tesauro


Como se mencion, los sistemas poscoordinados se basaron en el uso de
trminos independientes, en lugar de las cadenas precoordinadas que caracterizan
a las listas de epgrafes. El problema que presentaban los unitrminos (una palabra
vs. una frase) se vio agravado por otros aspectos como las formas gramaticales, la
sinonimia y la homonimia, as como la falta de un sistema de conceptos acorde con
la especialidad o dominio de los documentos a ser indizados.
Como solucin, se presentaron en Estados Unidos tres propuestas que, si bien
fueron formuladas por separado, coincidan en sealar la necesidad de crear un
nuevo

tipo

de

SOC,

basado

en

trminos

72

bien

definidos

ordenados

sistemticamente. Las tres propuestas tambin coincidieron en que ese SOC deba
ser semejante al conocido diccionario de sinnimos e ideas afines Rogets thesaurus
of English words and phrases y que deba acompaarse adems de un ndice
alfabtico (Aitchison & Dextre Clarke, 2004; Roberts, 1984).
Una de estas propuestas fue la de Calvin N. Mooers, a quien se acredita como
autor del trmino recuperacin de informacin y que, como ya vimos, fue el
inventor

del

sistema

Zatocode.

En

1947

Mooers

intercambi

alguna

correspondencia con varios colegas, proponiendo la creacin de una lista de


trminos organizada sistemticamente como el Rogets thesaurus. Denomin
descriptores a los trminos y diccionario de descriptores al nuevo SOC que
propona.
En el mismo ao, Charles L. Bernier y Evan J. Crane del Chemical Abstract
Service, sin conocer la propuesta de Mooers, hicieron un planteo similar y
distinguieron tres tipos de relaciones: de subordinacin, de coordinacin y de
equivalencia. Diez aos despus, el mismo Bernier sugiri la conexin de dos SOC
de este tipo, en el sentido actual de macrotesauro y microtesauro.
Por ltimo, en 1951 Hans P. Luhn, ingeniero de la IBM, propuso organizar los
trminos en familias conceptuales y agregar un ndice alfabtico. Aunque en algn
momento Luhn se autoadjudic la primicia del tesauro, se sabe que los otros
autores mencionados le precedieron y que adems l conoca la propuesta de
Mooers. Tanto Luhn como Helen Brownson fueron los primeros en usar el trmino
tesauro para referirse al nuevo SOC (Aitchison & Dextre Clarke, 2004; Roberts,
1984; Vickery, 1960b).
En 1957, B.E. Holm y L.E. Rasmussen, de la empresa E.I. du Pont de Nemours
de Estados Unidos, iniciaron estudios para adoptar el sistema Uniterm de Mortimer
Taube. No del todo satisfechos con este sistema y luego de varias modificaciones,
en 1959 completaron el Technical thesaurus of the E.I. du Pont de Nemours & Co.
Engineering Departament, que, segn Lancaster (2002), puede considerarse el
primer tesauro que entr realmente en operaciones.

5.3 Las normas para el diseo y desarrollo de tesauros


Despus del tesauro de du Dont se desarrollaron otros como el Thesaurus of
ASTIA descriptors en 1960, el Chemical engineering thesaurus en 1961 y el
Thesaurus of engineering terms en 1964, todos en Estados Unidos, que en general
siguieron la metodologa de du Pont.
Entre 1965 y 1967 se llev a cabo el Proyecto LEX, coordinado por el U.S.
Department of Defense, con la participacin de otros organismos pblicos y
73

privados, en particular relacionados con la industria y la tecnologa. El proyecto


tuvo dos productos: por un lado el Thesaurus of engineering and scientific terms
que fusionaba y ampliaba los tesauros mencionados en el prrafo anterior y por
el otro, las primeras directrices para el diseo de tesauros, que fueron aprobadas
por el Committee on Scientific and Technical Information (COSATI) y recomendadas
para todas las agencias del gobierno estadounidense (Lancaster, 2002).
A partir de ah, comenzaron a desarrollarse diversas normas y directrices. Cabe
aclarar que tanto las normas como las directrices son conjuntos de reglas e
instrucciones que pueden seguirse para la ejecucin de algo, en este caso del
diseo y desarrollo de tesauros. La diferencia consiste en que una norma debe ser
aprobada por un organismo normalizador como la International Organization of
Standardization (ISO) en el mbito internacional, o por los organismos nacionales
correspondientes, como el Instituto Argentino de Normalizacin y Certificacin
(IRAM). En cambio las directrices suelen ser recomendaciones de una institucin de
reconocido prestigio dentro de una especialidad, pero que no tiene el poder de
aprobar normas, por ejemplo la Unesco o la IFLA.
Segn Lancaster (2002), el desarrollo de las normas y directrices para el diseo
de tesauros sigui dos corrientes: una estadounidense y otra britnica. La primera
se inici justamente con las directrices de COSATI en 1967. Sobre esta base, la
Unesco redact en 1971 sus directrices para tesauros monolinges, que tuvieron
gran aceptacin internacional (Unesco, 1971). Estas directrices influyeron en la
redaccin y aprobacin de la primera norma internacional que fue la ISO 2788 de
1974. Ese mismo ao y tambin basada en COSATI, se redact y aprob la primera
norma estadounidense, ANSI/NISO Z39.19:1974, que tuvo dos ediciones ms en el
siglo veinte y una cuarta en 2005.
Paralelamente, en 1969 se public en Gran Bretaa el Thesaurofacet: a
thesaurus and faceted classification for engineering and related subjects (Aitchison
et al., 1969). Como su nombre lo indica, este tesauro se dise armonizando las
directrices de COSATI con la metodologa del anlisis de facetas, creada por el
bibliotecario indio Shiyali Ramamrita Ranganathan. El anlisis de facetas tuvo desde
el

principio

la

fuerte

adhesin

de

numerosos

especialistas

britnicos

que

conformaron el CRG y para 1969 ya haba sido aplicado al diseo tanto de sistemas
de clasificacin como a las listas de epgrafes (Coates, 1988).
Sobre la base de esta tradicin britnica, el organismo normalizador de ese pas
aprob la norma BS 5723 de 1979 y dos miembros del CRG, Derek Austin y Peter
Dale, prepararon la segunda edicin de las directrices de Unesco, publicada en
1981 y traducida al espaol tres aos despus. La nueva edicin de las directrices
de la Unesco tuvo otra vez una marcada influencia en la revisin de la norma ISO

74

2788 y, consecuentemente, la segunda edicin de esta ltima fue publicada en


1986 (ISO, 1986).
En 1985, la Unesco public las primeras directrices para tesauros multilinges,
que dieron lugar a la norma ISO 5964 de ese mismo ao (ISO, 1985). Ms de dos
dcadas despus, IFLA public sus directrices para este mismo tipo de tesauros
(IFLA, 2009a).
No bien comenz el siglo veintiuno y ante el avance de la tecnologa
informtica, se inici la revisin de la norma estadounidense Z39.19, que se public
en 2005. Por primera vez, una norma dej de lado la presentacin impresa y la
gestin manual del tesauro para ocuparse principalmente de su presentacin en
lnea, de las funciones que debe cumplir el software de gestin y de cmo debe
orientarse hacia la interoperabilidad entre tesauros y otros SOC, incluyendo los
tesauros multilinges, que dejan as de tener una norma separada. Adems de este
aporte innovador, la ANSI/NISO Z39.19:2005 ampli su cobertura hacia otros SOC
como las listas de trminos, los anillos de sinnimos y las taxonomas, que escapan
al alcance de la presente obra (NISO, 2005).
Para no ser menos, el organismo normalizador britnico, BSI Group, tambin
decidi revisar su norma nacional. La nueva norma BS 8723-1/4 se public en cinco
partes entre 2005 y 2008 (BSI Group, 2005-2008). Fiel a sus tradiciones, la norma
britnica conserva su orientacin hacia el anlisis de facetas, pero al igual que la
estadounidense pone el nfasis en adecuar el tesauro a las nuevas tecnologas de la
informacin y la comunicacin. Adems del tesauro, tambin esta norma incluye
otros SOC como los sistemas de clasificacin, las listas de epgrafes, las taxonomas
y las ontologas, que no trataremos aqu.
Por ltimo, la norma internacional tambin ha sido objeto de revisin. Las
normas ISO 2788:1986 para tesauros monolinges y la ISO 5964:1985 para
tesauros multilinges se dieron de baja y han sido sustituidas por una nica norma
publicada en dos partes: la ISO 25964-1/2. La parte 1, dedicada al tesauro,
apareci en 2011 y la parte 2, dedicada a la interoperabilidad del tesauro con otros
SOC, se public en 2013. Como sucedi anteriormente, la nueva norma ISO est
basada en la norma britnica (ISO 2011; 2013).

5.4 Los tesauros y las normas en Argentina


En nuestro pas, a mediados de la dcada de 1970, el Centro Argentino de
Informacin Cientfica y Tcnica (CAICYT) reuni a varios especialistas nacionales
para conformar un grupo de trabajo encargado de elaborar un Inventario de
lenguajes documentarios no tradicionales (CAICYT, 1980). El llamado Grupo
75

CAICYT fue el principal promotor del Seminario Regional sobre Lenguajes de


Indizacin, dictado por el profesor Frederick W. Lancaster (), y auspiciado por la
Unesco, que se llev a cabo en Buenos Aires entre el 14 y el 26 de agosto de 1978
(Lancaster, 1985). Este seminario marc un antes y un despus respecto a los
tesauros en nuestro medio, ya que el Grupo CAICYT se convirti en un agente
multiplicador de la metodologa para el diseo y desarrollo de tesauros y organiz
un nuevo seminario regional, destinado a docentes, que se realiz en 1982 (Molina
& Ztara, 1998).
La consecuencia lgica de este impulso fue la aparicin de los primeros tesauros
argentinos, como el de recursos hdricos (Ztara, 1983) y el de Psicologa (Garca &
Monfasani, 1984, 2009), considerados entre los mejores tesauros en lengua
espaola (lvaro Bermejo et al., 1989a,b).
Un hecho trascendente, que situ a la Argentina entre los pases que disponan
de una norma nacional para tesauros monolinges, fue la publicacin de la norma
IRAM 32057:1983 (IRAM, 1983). Esta norma se bas principalmente en la primera
edicin de la ISO 2788:1974, debido a lo cual hoy en da se encuentra
desactualizada (Martnez Tamayo & Mendes, 2010). Al cierre de esta edicin, el
Subcomit de Documentacin de IRAM haba iniciado las tareas correspondientes
para adoptar una nueva norma IRAM-ISO 25964, que constituir, sin duda, un
valioso aporte al diseo y desarrollo de tesauros en nuestro pas.

76

Autoevaluacin

a. Qu situaciones contribuyeron al surgimiento de la indizacin poscoordinada?

b. Explique brevemente los sistemas de indizacin propuestos por Batten, Mooers


y Taube.

c. Describa las propuestas que surgieron ante el problema de los unitrminos.

d. Explique cmo se inici el desarrollo de las normas y/o directrices para el diseo
de tesauros.

e. Qu aportes hicieron las normas estadounidense, britnica e internacional (ISO


25964) publicadas en el siglo veintiuno?

f.

Qu suceso motiv la aparicin de los primeros tesauros en Argentina?

g. Cul es la situacin de la norma argentina para el diseo y desarrollo de


tesauros?

77

6. Diseo y desarrollo del tesauro

En este captulo trataremos sobre el diseo y desarrollo del tesauro desde el punto
de vista de la gestin de un proyecto. Para explicarlo nos permitimos recurrir al
conocido Crculo de Deming y sus cuatro etapas: planificar, hacer, evaluar y actuar.
Dentro de cada etapa, explicaremos algunas cuestiones esenciales para disear un
tesauro.

6.1 Consideraciones previas


Antes que nada, debe tenerse en cuenta que el diseo y desarrollo de un
tesauro suele ser muy costoso, tanto en dinero como en esfuerzo y en tiempo. Por
lo tanto, antes de emprender un proyecto de esta envergadura, es necesario
analizar las posibilidades de llevarlo a cabo. Un clsico anlisis de fortalezas,
debilidades, oportunidades y amenazas puede resultar adecuado para este fin. No
obstante, se recomienda poner atencin a las siguientes cuestiones (Aitchison et
al., 2000; ISO, 2011).
Existe un tesauro sobre el dominio que interesa y en la lengua o lenguas que
se necesita? Si la respuesta a esta pregunta es afirmativa, entonces conviene
adquirir y utilizar ese tesauro. Si la respuesta es negativa, se buscan otras
soluciones.
Existe un tesauro sobre el dominio, pero en otro idioma, que pueda traducirse?
Si la respuesta es afirmativa, habr que obtener los permisos correspondientes de
los autores y editores antes de poner manos a la obra. De lo contrario, se contina
buscando otra solucin.
Existe un tesauro o varios que se puedan adaptar? La adaptacin puede ser de
distintos tipos: se puede derivar un tesauro ms especfico (microtesauro) de un
tesauro ms general (macrotesauro); tambin se pueden fusionar dos o ms
tesauros ya existentes que por separado no satisfacen todas las necesidades,
convertir un sistema de clasificacin en un tesauro, o recurrir a otros mtodos de
interoperabilidad (Martnez Tamayo et al., 2011a). Si la respuesta a esta pregunta
es

afirmativa,

entonces

tambin

se

procede

obtener

los

permisos

correspondientes antes de emprender las acciones.


Se cuenta con los recursos suficientes para completar el tesauro y su
publicacin? Si se inician las tareas de disear un tesauro y ste queda inconcluso

78

por la falta de recursos, el costo habr sido inmenso, porque se perdern los
recursos invertidos sin haber logrado ningn beneficio.
Se dispondr de recursos para actualizarlo peridicamente en el futuro? El
vocabulario de un tesauro no es esttico; por el contrario es necesario revisarlo en
forma continua para descartar los trminos que han dejado de usarse, modificar los
trminos que as lo requieran e incorporar trminos nuevos.
Si las respuestas a las preguntas anteriores lo justifican, entonces y solo
entonces se puede pensar en disear un nuevo tesauro.

6.2 Planificar el tesauro


Una vez tomada esta decisin, se deben tener en cuenta otras consideraciones
que hacen a la gestin del proyecto.

6.2.1 Equipo de trabajo

El diseo y desarrollo de un tesauro no puede ser obra de una sola persona,


pues se trata de un proyecto complejo. Se requiere conformar un equipo de trabajo
multidisciplinario, que puede requerir:

Un director responsable de la conduccin y coordinacin del proyecto y la


obtencin de los recursos.

Profesionales de la BDCI con experiencia en el diseo y desarrollo de


tesauros.

Futuros usuarios. Un tesauro suele tener dos tipos de usuarios: los


indizadores responsables de la indizacin y los usuarios finales que actan
en la recuperacin. Es muy conveniente que representantes de ambos
grupos participen activamente en el equipo de trabajo.

Expertos en el dominio del tesauro, con conocimiento especfico sobre la


terminologa de ese dominio.

Informticos y diseadores grficos que aporten la tecnologa necesaria para


poner a punto el software de gestin del tesauro, disear una versin
amigable y atractiva en lnea y asesorar sobre otros temas de su
incumbencia.

Si se decide que el tesauro sea multilinge, se requerir tambin la


participacin de al menos un traductor por cada idioma extranjero.

Es conveniente contar con la asesora de lingistas y terminlogos.

Se deber disponer adems de personal auxiliar suficiente para el trabajo de


secretara y gestin administrativa.
79

Todo esto, desde luego, en la medida justa que se necesite.


El diseador de un tesauro, o quien asume la responsabilidad de dirigir el
proyecto de diseo y desarrollo de un tesauro, debe reunir ciertas cualidades: una
buena

cultura

general,

una

slida

formacin

acadmica

permanente,

conocimientos de idiomas extranjeros, particularmente el ingls, aptitud para


trabajar en equipo y conocimiento del dominio y la terminologa del tesauro.
La aptitud para el trabajo en equipo es indispensable, porque generalmente el
diseo de un tesauro no es una tarea para una sola persona, sino que requiere un
equipo de trabajo multidisciplinario (vase el Captulo 6).
Respecto al conocimiento sobre el dominio del tesauro existen dos cuestiones a
tener en cuenta. El propsito de un tesauro es facilitar la indizacin y la
recuperacin

del

conocimiento

registrado,

que

son

actividades

propias

del

profesional de la BDCI, es decir este profesional es el que sabe qu es un tesauro y


para qu se usa. Por otro lado, para disear un sistema de conceptos propio de un
dominio, debe tenerse un buen conocimiento de ese dominio. Lo ideal sera que el
diseador del tesauro fuera, simultneamente, un profesional de la BDCI y del
dominio del tesauro, pero esto no es fcil de lograr. Entonces, podra sugerirse que
el diseador de tesauros sea:

Un profesional de la BDCI (bibliotecario, documentalista, profesional de la


informacin), con experiencia en el uso y el diseo de tesauros y que
adems est familiarizado con el dominio y la terminologa del tesauro,
aunque no sea un especialista. Si este es el caso, deber contar con la
asesora de uno o varios expertos en el dominio, que puedan ser consultados
si es necesario.

Un experto en el dominio del tesauro, que est familiarizado con la BDCI, en


especial con el uso y el diseo de tesauros. Si este es el caso, deber contar
con la asesora de uno o varios profesionales de la BDCI, especializados en
el uso y diseo de tesauros.

6.2.2 Plan de accin

Una vez conformado el equipo de trabajo, ste proceder a desarrollar el plan


de accin del proyecto, especificando los objetivos, metas, resultados esperados,
los procesos que habrn de implementarse, los plazos de realizacin y los recursos
necesarios para llevarlo a cabo.
Todo tesauro tiene un objetivo principal: guiar al indizador y al usuario final en
la eleccin del mismo trmino [o nombre propio] para el mismo concepto (ISO,

80

2011, p. 15). Sin embargo, como hemos visto, el tesauro puede cumplir tambin
otras funciones que deben planificarse.
El plan tambin debe especificar a qu usuarios estar dirigido, as como el nivel
de conocimiento que estos usuarios tienen tanto del dominio como del uso del
tesauro. Por ejemplo, un tesauro sobre la enfermedad de Chagas para profesionales
de la Salud ser diferente a un tesauro sobre el mismo dominio orientado a
pacientes o a la comunidad en general.
Tambin se deben determinar algunas caractersticas del tesauro: si ser
publicado en forma impresa, en lnea o ambas; si habr de integrarse a un sistema
de recuperacin particular o a una lista de autoridades de nombres; si debe ser
compatible con otros SOC; si se aplicarn las recomendaciones de las normas
estrictamente o se harn excepciones, etc.

6.2.3 Los recursos

La provisin de recursos exige un compromiso institucional slido y a largo


plazo para que el proyecto sea sostenible y sustentable. La responsabilidad puede
recaer en una sola institucin o en varias, por ejemplo si el tesauro es parte de un
proyecto colectivo. Los recursos a tener en cuenta son, entre otros, los siguientes:

a) Recursos financieros y fsicos

Los recursos financieros deben asegurar tanto la finalizacin de una primera


edicin del tesauro, como su actualizacin peridica a lo largo de los aos.

Tambin se debe disponer de espacio fsico adecuado, con el mobiliario y


equipamiento tecnolgico necesario y suficiente para que cada uno de los
integrantes del equipo de trabajo pueda llevar a cabo su tarea.

b) Recursos bibliogrficos

Es indispensable que el equipo de trabajo pueda contar con acceso permanente


a las fuentes que permitan extraer y verificar la terminologa del dominio y decidir
otros aspectos, ya sean tratados, manuales, revistas especializadas, diccionarios,
glosarios, enciclopedias, bases de datos bibliogrficas, bancos terminolgicos,
nomenclaturas, etc. Los tesauros u otros SOC especializados en dominios
relacionados tambin son de utilidad. Es preferible que estas fuentes estn
disponibles en lnea.

81

c) Normas y manuales

Para el diseo y desarrollo de tesauros conviene basarse en las normas que


recomiendan las prcticas aceptadas y consensuadas. En nuestro pas, en este
momento, se hace necesario recomendar la norma internacional ISO 25964 (ISO,
2011; 2013), en la que nos basamos aqu. Como se indic en el Captulo 5,
actualmente, el Subcomit de Documentacin del IRAM se encuentra realizando las
tareas necesarias para adoptar como propia la mencionada norma, que ser
publicada como norma IRAM-ISO. Si bien las normas brindan una buena gua, debe
tenerse en cuenta que solo pretenden recoger lo mejor de lo llevado a cabo hasta
ahora, sin presuponer ni coartar los avances que se producirn en el futuro
(Garca Marco, 2006, p. 15). En otras palabras, la norma no se debe aplicar a
ciegas, sino con una actitud crtica y teniendo en cuenta los avances posteriores.
Hay dos manuales clsicos que cuentan con varias ediciones: uno es el de los
britnicos Aitchison et al. (2000) y el otro es del estadounidense Lancaster (2002).
Del mbito iberoamericano se pueden mencionar el de Naumis Pea (2008),
publicado en Mxico y los de Currs (1998) y Gil Urdiciain (2004) publicados en
Espaa. No obstante, debe tenerse en cuenta que ninguno de estos manuales han
tomado en cuenta las normas publicadas en el siglo veintiuno.
Todos los miembros del equipo multidisciplinario deben conocer en profundidad
la norma y tener acceso permanente a la consulta de los manuales y otras fuentes.

d) Programa informtico de gestin de tesauros

Para gestionar el tesauro es necesario crear una base de datos especfica, que
requiere un programa informtico apropiado. Hasta hace unos aos, las normas y
manuales se referan a este recurso como una herramienta para producir tesauros
impresos. Las normas publicadas en este siglo han puesto el nfasis en el tesauro
electrnico, disponible en la Web. Para esto se recomienda un software que
gestione la base de datos del tesauro, pero tambin que sea compatible con
modelos de datos como SKOS o MADS y los programas de intercambio como el
XML. En el Captulo 12 se tratan estos temas.

6.3 Hacer el tesauro


Los POC de diseo y desarrollo del tesauro deben especificarse en la etapa de
planificar y llevarse a cabo durante la etapa de hacer. Para implementar estos
82

procesos es indispensable cumplir, rigurosamente, con el principio de garanta, que


se explica en el Apartado 6.6. Hay experiencias de tesauros desarrollados por
medios automatizados

o semiautomatizados, aunque muchos requieren total o

parcialmente del trabajo intelectual de los expertos.


Tradicionalmente, las normas y manuales han sugerido tres mtodos para
abordar el diseo y desarrollo de un tesauro. Como es costumbre en la BDCI, cada
uno de los mtodos ha recibido variados nombres (AENOR, 1990; Aitchison et al.,
2000; BSI Group, 2005; ISO, 2011; IRAM, 1983; Gil Urdiciain, 2004; Lancaster,
1985, 2002; Naumis Pea, 2008; NISO, 2005).

6.3.1 Mtodo deductivo, terico, sinttico, a priori o top-down

Un grupo de expertos en el dominio del tesauro, basado en distintas obras de


referencia especializadas, identifica aquellos conceptos ms generales y a partir de
ellos construye el orden sistemtico de arriba hacia abajo, es decir organizando los
conceptos de lo general a lo especfico. Una vez completado el orden sistemtico,
se procede a realizar el control del vocabulario de los trminos y nombres propios
incluidos.
Este mtodo resulta til para preparar el orden sistemtico, pero presenta
inconvenientes en los niveles jerrquicos ms bajos, ya que al basarse en el juicio
de los expertos la colecta de trminos puede resultar incompleta y las decisiones
pueden apartarse del principio de garanta.

6.3.2 Mtodo inductivo, emprico, analtico, a posteriori o bottom-up

Primero se colectan los trminos y nombres propios de distintas fuentes


bibliogrficas, por alguna tcnica de extraccin de palabras claves o de estudios
bibliomtricos. Si se puede acceder a las historias de bsqueda de los usuarios
finales de bases de datos relacionadas con el dominio del tesauro, tambin se
extraen los trminos de bsqueda. A medida que se van colectando los trminos y
nombres propios, se procede al control del vocabulario y se van agrupando para
establecer los niveles jerrquicos de abajo hacia arriba, es decir de lo especfico a lo
particular.
Gil Urdiciain (2004) recomienda la indizacin de unos 2000 documentos y la
colecta de unos 15.000 trminos antes de organizar las jerarquas. Aunque estas
cifras dan idea del tamao de un tesauro, debe tenerse en cuenta que hay tesauros
con un nmero mayor o menor de trminos, dependiendo de cada dominio.
Lancaster (1985) relaciona la colecta con la disminucin de trminos nuevos. En la

83

Figura 6.1 se muestra la curva propuesta por ese autor para vigilar el momento en
que la cantidad de trminos nuevos disminuye, que es el momento de comenzar a
organizar las jerarquas.

Figura 6.1. Curva de crecimiento de trminos. En el inicio de la colecta hay


un crecimiento pronunciado porque todos los trminos son nuevos, pero en
cierto momento comienzan a repetirse y la incorporacin de trminos nuevos
disminuye (Lancaster, 1985).

El mtodo inductivo resulta efectivo para lograr un vocabulario completo y


cumple estrictamente con el principio de garanta, pero al no contar con un orden
sistemtico previo, se complica la organizacin de los trminos y nombres propios.

6.3.3 Mtodo mixto o hbrido

Este mtodo, fuertemente recomendado por la norma ISO 25964, combina los
dos anteriores. As, el grupo de expertos esboza un orden sistemtico preliminar,
mientras que la colecta de trminos se realiza extrayendo los trminos y nombres
propios mediante procesos informticos.
Los trminos y nombres propios seleccionados son controlados y distribuidos en
las distintas categoras ya establecidas en el orden sistemtico preliminar. A medida
que se avanza en la tarea, se van realizando los ajustes en el orden sistemtico
esbozado, de modo que todos los trminos y nombres propios sean ordenados, aun
cuando no hayan sido tomados en cuenta inicialmente.
Este mtodo mixto permite lograr un vocabulario completo y organizar el orden
sistemtico con un estricto cumplimiento del principio de garanta.

84

6.3.4 Los procesos del diseo y desarrollo de un tesauro

A continuacin se presentan los principales procesos del diseo y desarrollo de


tesauros. Algunos autores se refieren a estos procesos como etapas o fases (Gil
Urdiciain, 2004; Naumis Pea, 2008; Shearer, 2004), pero en este manual, como
se explic en el Captulo 2, los consideramos procesos de la organizacin del
conocimiento.

a) Definicin y anlisis del dominio

Como ya se mencion, una de las caractersticas del tesauro es su condicin de


SOC especializado en un dominio. En consecuencia, un primer proceso a llevar a
cabo es definir y analizar el dominio del tesauro.
Un

dominio es el

mbito de una

actividad, una

esfera

especfica

de

conocimiento, influencia o actividad. Puede ser una disciplina, arte o profesin, una
especialidad de stas o un campo multidisciplinario.
Hay distintas recomendaciones para definir el dominio de un tesauro, que se
mencionan en el Captulo 9.

b) Control del vocabulario

El proceso de control de vocabulario incluye varias operaciones, cuyo propsito


es lograr un vocabulario normalizado y unvoco, es decir controlado. Algunas de
estas operaciones pueden realizarse en forma simultnea.

Colecta: se realiza mediante el mtodo inductivo ya descripto. Los trminos


y nombres propios colectados se registran en la base de datos del tesauro
como candidatos, es decir estn propuestos, pero an no han sido
analizados y aprobados. La extraccin automtica de palabras claves es una
tcnica til para la colecta. Tambin hay experiencias en la aplicacin de
mtodos bibliomtricos para la colecta y seleccin de trminos candidatos.

Seleccin: no todos los trminos y nombres propios candidatos deben pasar


al tesauro. De hecho, se deber analizar cada candidato y decidir si
corresponde o no incluirlo en el tesauro. Este anlisis significa estudiar en
profundidad cada concepto general y el trmino que lo designa, as como
cada concepto individual y el nombre propio que lo designa.

Control de homnimos o desambiguacin: cada trmino que se incorpora al


tesauro debe representar un solo concepto general, es decir no puede haber

85

un trmino con dos significados distintos. De igual manera, un concepto


individual debe estar representado por un solo nombre propio.

Control de sinnimos: si un trmino candidato tiene uno o ms trminos


sinnimos, deber elegirse uno y solo uno como trmino preferente y
establecer una relacin de equivalencia con los otros trminos. De igual
modo, si existen dos o ms formas variantes para un nombre propio, deber
elegirse una y solo una como forma autorizada del nombre y establecer
una relacin de equivalencia con las otras variantes.

Normalizacin: se debe redactar una forma normalizada para cada trmino


preferente y cada forma autorizada del nombre, siguiendo una norma
pertinente. La norma ISO 25964 aporta las recomendaciones para las
formas y accidentes gramaticales de los trminos preferentes. Para
normalizar los nombres propios conviene recurrir mejor a una norma de
catalogacin.

En el Captulo 7 se describen las recomendaciones para el vocabulario del


tesauro y la relacin de equivalencia.

c) Determinacin de las relaciones jerrquicas y asociativas

Una vez que se completa el control del vocabulario, se procede a establecer las
relaciones jerrquicas y asociativas. Aitchison et al. (2000) se refieren a stas como
relaciones de micronivel. En ambos casos se trata de una relacin entre dos
trminos preferentes o entre un trmino preferente y una forma autorizada del
nombre. Se detallan en el Captulo 8.

d) Construccin del orden sistemtico

Este proceso consiste en organizar los trminos preferentes y las formas


autorizadas del nombre en un esquema lgico que evidencie el sistema de
conceptos del dominio. Aitchison et al. (2000) se refieren a este orden como las
relaciones de macronivel.
Como se mencion anteriormente, conviene esbozar el orden sistemtico con
anterioridad a la colecta de trminos y nombres propios para facilitar la distribucin
de estos ltimos en el orden sistemtico y ajustar ste a medida que se procede en
el anlisis, hasta consolidar el orden sistemtico definitivo.

86

El anlisis de facetas es la metodologa recomendada para llevar a cabo el


proceso de construccin del orden sistemtico del tesauro y se describe en el
Captulo 9.

e) Publicacin del tesauro

Hoy en da la tendencia es publicar el tesauro en formato digital y no impreso,


como era comn hasta no hace mucho tiempo. De hecho, las normas de diseo y
desarrollo de tesauros publicadas en este siglo veintiuno apenas hacen referencia a
la versin impresa.
Las recomendaciones para la publicacin del tesauro se presentan en el Captulo
10.

6.4 Evaluar el tesauro


La tercera etapa del diseo y desarrollo de un tesauro es su evaluacin. Hay dos
evaluaciones a tener en cuenta:

Evaluacin previa a la publicacin: antes de publicar la primera edicin de


un tesauro, se recomienda hacer una evaluacin, a modo de prueba piloto,
que permita hacer los ajustes necesarios antes de ofrecerlo al pblico para
su uso.

Evaluacin peridica: el tesauro debe ser evaluado a intervalos regulares,


para poder eliminar los posibles errores y determinar mejoras tanto en el
vocabulario y las relaciones del tesauro, como en el programa informtico,
especialmente en lo que hace a la interfaz usuario-sistema. En la evaluacin
se deben tener en cuenta las crticas y sugerencias de los usuarios del
tesauro.

En el Captulo 10 se hace referencia a las posibles formas de evaluacin.

6.5 Actuar para mejorar el tesauro


Es la cuarta etapa del diseo y desarrollo de un tesauro. Una vez que se
conocen los resultados de la evaluacin, se deben hacer los ajustes necesarios para
implementar las mejoras que surjan de la propia evaluacin.
En el Captulo 10 tambin se hace referencia al mejoramiento continuo del
tesauro, especialmente a su actualizacin.

87

6.6 Principio de garanta


El diseo y desarrollo de un tesauro no surge de la nada. Debido a que el
diseador del tesauro se ve obligado a tomar decisiones importantes en cada uno
de los procesos y operaciones de su diseo y desarrollo, resulta imprescindible que
sus decisiones cuenten con un respaldo intelectual que garantice su validez. Hace
ya un siglo que Wyndham Hulme postul las bases de este principio, indispensable
para desarrollar cualquier SOC (Barit, 2009, 2011).
La profesora canadiense Clare Beghtol (1986) ha definido con exactitud el
principio de garanta para un sistema de clasificacin.

En general, la garanta de un sistema de clasificacin puede pensarse como la


autoridad que un clasificacionista invoca primero para justificar y subsecuentemente
para verificar decisiones acerca de qu clases/conceptos incluir en el sistema, en qu
orden las clases/conceptos deben aparecer en los esquemas, en qu unidades se
dividirn las clases/conceptos, hasta dnde debe proceder la subdivisin, cunto y
dnde se dispone de sntesis, si los rdenes de mencin son estticos o variables y
cuestiones similares (Beghtol, 1986, p. 110).

Adaptando esta definicin al tesauro, podemos afirmar que la garanta es la


autoridad que invoca el diseador del tesauro primero para justificar y luego para
verificar sus decisiones acerca de los conceptos, trminos y nombres propios que se
han de incluir en el tesauro, las relaciones entre ellos, en qu lugar del orden
sistemtico deben aparecer, en qu unidades se dividirn y hasta qu nivel de
especificidad debe completarse el proceso de divisin. Recurdese que la sntesis y
el orden de mencin al que hace referencia Beghtol no se aplican al tesauro, por ser
ste un SOC poscoordinado.
El principio de garanta ha evolucionado desde la primera aproximacin de
Hulme y hoy en da se ha especificado como seala Barit (2009, 2011a,b):

Principio de garanta literaria, bibliogrfica o documental: los conceptos que


formarn parte del tesauro deben extraerse de una fuente bibliogrfica
especializada, ya sean tratados, manuales, artculos de revista, informes
tcnicos, patentes, obras de referencia, etc., cualquiera sea su soporte
fsico. Los bancos terminolgicos o las nomenclaturas, en particular los que
proceden de organismos especializados en el dominio del tesauro, son
tambin valiosos.

Principio de garanta del usuario: el tesauro debe tener en cuenta la


terminologa del usuario final. En este sentido, es muy til revisar las
historias de bsqueda (transaction logs), realizadas por los usuarios en
88

bases de datos bibliogrficas afines al tesauro que se desea desarrollar.


Tambin es conveniente consultar a los usuarios finales a travs de
encuestas, entrevistas u otros medios y contar con un grupo de ellos como
miembros del equipo de trabajo.

Principio de garanta organizacional: el tesauro debe reflejar la terminologa


del organismo u organismos para los que se disea. Este principio resulta
particularmente importante cuando el tesauro se destina al sistema de
gestin de conocimiento de una empresa, una agencia de gobierno u otros
organismos.

Principio de garanta cultural: el tesauro debe respetar la terminologa y las


particularidades culturales de la comunidad acadmica, profesional o social a
la que estar dirigido. En este sentido es importante tomar en cuenta
aquellos trminos que pudieran resultar discriminatorios u ofensivos para los
usuarios finales (Todaro & Martnez, 2006a,b).

89

Autoevaluacin
a) Qu debemos tener en cuenta antes de comenzar a disear un tesauro?

b) Mencione cmo debe estar conformado el equipo de trabajo ideal para disear y
desarrollar el tesauro.

c) Indique qu recursos son necesarios para un proyecto de diseo y desarrollo de


un tesauro.

d) Qu normas y manuales conviene tener en cuenta para el diseo y desarrollo


del tesauro?

e) Describa las principales caractersticas que debe tener el software de gestin de


tesauros.

f)

Cules son los procesos ms importantes del diseo y desarrollo de un


tesauro?

g) En qu consiste el principio de garanta?

90

7. El vocabulario del tesauro

En este captulo presentaremos el vocabulario del tesauro. Este vocabulario suele


dividirse en dos: el vocabulario de indizacin y el vocabulario de entrada (Figura
7.1). El primero incluye los trminos preferentes y las formas autorizadas del
nombre que pueden usarse en la indizacin; el segundo incluye los sinnimos, cuasi
sinnimos y formas variantes del nombre, que no pueden usarse en la indizacin,
pero que remiten al trmino o al nombre aceptados. El vocabulario de indizacin se
presenta en este captulo.

Figura 7.1. Vocabularios de indizacin y de entrada. Solo los trminos


preferentes y las formas autorizadas del nombre pueden usarse para la
indizacin.

7.1 El trmino preferente


Es el signo ms importante del tesauro. Un trmino preferente es un trmino
usado para designar un concepto cuando se indiza (ISO, 2011). Como se indic en
el Captulo 3, un trmino es la designacin verbal de un concepto general, de modo
que cada trmino preferente representa un concepto general (y solo uno) y que
cada concepto general es designado por un trmino preferente (y solo uno).

91

Hasta 2005 las distintas normas preferan el vocablo descriptor muy usado en
nuestro medio para referirse al trmino preferente, pero las normas que se
publicaron a partir de ese ao le han dado preferencia a este ltimo (BSI Group,
2005; NISO, 2005; ISO, 2011). Por este motivo, aqu usaremos trmino
preferente.
Cuando se disea un tesauro se debe elegir un nico trmino para cada
concepto, de ah que se denomine trmino preferente, pues ha sido preferido sobre
los dems sinnimos que pudieran corresponder.
Sin pretender ser exhaustivos, a continuacin se presentan algunos ejemplos de
trminos preferentes:
Cosas y sus partes fsicas:
animales salvajes
automviles de carrera
patas
radiadores
ros
Materiales:
abrasivos
acero inoxidable
celulosa
fsforo
mrmol de carrara
Actividades o procesos:
auditora externa
coccin
diagnstico
gestin de calidad
oxidacin
Eventos o hechos:
aniversarios
apertura de cuenta
carnavales
festividades religiosas
huelgas
Propiedades de personas, cosas, materiales o acciones:
personalidad
elasticidad
resistencia
fortaleza
opacidad
92

Disciplinas, oficios o campos temticos:


botnica
carpintera
ciencias de la tierra
historia
ingeniera biomdica
paleontologa
Unidades de medicin:
kilogramo
megabyte
metro cbico
minuto
milmetro
Tipos de personas y organizaciones:
jvenes
centros de investigacin
organismos internacionales
personas adoptadas
pintores

7.2 Formas gramaticales de los trminos preferentes


Para la redaccin de un trmino preferente se recomiendan tres formas
gramaticales: un sustantivo, una frase nominal adjetivada o una frase nominal
preposicional.
Un sustantivo, sin artculo precedente, es la forma ideal para un trmino
preferente, porque es la ms fcil de recuperar y se considera un trmino
preferente simple. Ejemplos:

alegra
alimentos
esttica
mquinas
vuelos

Sin embargo, es imposible que el vocabulario de un tesauro se forme solamente


con trminos preferentes simples, ya que en muchos casos se requiere agregar al
sustantivo un modificador, directo o indirecto. Se trata entonces de trminos

93

preferentes compuestos o multipalabra. Un trmino multipalabra puede ser de dos


tipos:
Una frase nominal adjetivada es aquella cuyo ncleo es un sustantivo y su
modificador un adjetivo (modificador directo). Se trata, entonces, de trminos
preferentes multipalabra. Ejemplo:

asentamientos marginales
discos compactos
medicina alternativa
pensamiento crtico
vuelos espaciales

Una frase nominal preposicional es aquella cuyo ncleo es un sustantivo y su


modificador es una frase preposicional (modificador indirecto). En lo posible, deben
evitarse y sustituirse por frases nominales adjetivadas. Por ejemplo bibliotecas de
hospitales podra sustituirse por bibliotecas hospitalarias. En adicin, las
frases nominales preposicionales son las ms afectadas por las reglas para
fraccionar trminos multipalabra, segn se explica en el Apartado 7.6 de este
captulo. Cuando no es posible sustituirlo, entonces puede redactarse un trmino
preferente multipalabra como los siguientes:

agencia de seguridad
atencin al cliente
bibliotecas para ciegos
patinaje sobre hielo
vuelos de cabotaje

En ocasiones es necesario incorporar al tesauro frases que no se ajustan a las


tres formas gramaticales mencionadas, pero que estn aceptados y son de uso
comn en un determinado dominio. Deben aceptarse sin cambios porque los
usuarios finales del tesauro harn sus bsquedas por esas frases. Algunos ejemplos
son los siguientes:

cromatografa lquida de alto desempeo


factor II de crecimiento similar a la insulina
medios de comunicacin de masas
organizaciones no gubernamentales
procesamiento automtico de datos

94

Los adjetivos, solos o como primera palabra del trmino preferente, no se


permiten a menos que sean trminos aceptados en el dominio del tesauro. Es
comn en idiomas como el ingls, pero son raros en lengua espaola. Por ejemplo,
el Tesauro de UNBIS acepta como trminos preferentes:

libre autodeterminacin de los pueblos


libre comercio
libre eleccin de empleo

La norma estadounidense ANSI/NISO Z39.19:2005 propone la inclusin de


algunos adjetivos con el fin de armar frases nominales adjetivadas (NISO, 2005).
Por ejemplo:

Pequeos
NA

Combnese

con

un

sustantivo,

por

ejemplo

animales

pequeos,

automviles pequeos, etc.

Esta opcin es una invitacin a la incoherencia y a la prdida del control de


vocabulario, ya que distintos indizadores podran aplicarla con diferentes criterios.
Por este motivo, la norma ISO 25964 prefiere no recomendar su prctica (ISO,
2011). En nuestra lengua, adems, habra que tener cuidado con la coincidencia
necesaria entre el gnero y el nmero de sustantivos y adjetivos.
Los adverbios tampoco estn permitidos como nica o primera palabra del
trmino preferente, a menos que sea de uso comn en el dominio del tesauro. Por
ejemplo, el Tesauro de UNBIS acepta los siguientes trminos preferentes:

no alineacin
no proliferacin nuclear
no violencia

Los verbos, en cualquier conjugacin, tampoco pueden usarse como trminos


preferentes. En su lugar deben emplearse sustantivos, por ejemplo: fabricacin y
no fabricar, construccin y no construir, curacin y no curar.
La frase coordinada, que une dos sustantivos con la conjuncin y, si bien est
permitida en las listas de epgrafes por su carcter precoordinado, no tiene sentido
en un tesauro. Por ejemplo los epgrafes diccionarios

enciclopedias o

computadoras y mujeres, que estn aceptados en las listas de epgrafes LEMB y


ARMARC, en un tesauro deberan expresarse con cuatro trminos preferentes:

95

computadoras
diccionarios
enciclopedias
mujeres

La coordinacin de estos trminos se har en el momento de la bsqueda


mediante el uso del operador booleano AND, por ejemplo diccionarios AND
enciclopedias, computadora AND mujeres, computadoras AND diccionarios.
Otra frase no permitida es la frase invertida, como golf, campos de o bien
oracin, libros de. Hace dcadas se usaba en algunos SOC, sobre todo en ingls,
con el propsito de anteponer el sustantivo, pero no tiene sentido en espaol. La
norma ISO 25964 recomienda que, en cualquier idioma, se redacte el trmino
preferente en el orden de la lengua natural (ISO, 2011). Por lo tanto, los ejemplos
anteriores seran: campos de golf, libros de oracin.

7.3 Singular y plural


La norma ISO 25964 establece distintos criterios para la redaccin del trmino
preferente en singular o en plural, segn se trate de conceptos concretos o
abstractos (ISO, 2011).
Si es un concepto concreto y el ncleo del trmino preferente es un sustantivo
cuantificable, que puede responder a la pregunta cuntos/as?, debe expresarse en
plural. Por ejemplo:

ampollas de vidrio
empresas industriales
frmacos
libros infantiles
mascotas

Si es un concepto concreto y el ncleo del trmino preferente es un sustantivo


no cuantificable, que puede responder a la pregunta cunto/a?, se redacta en
singular. Por ejemplo:

aluminio
calor
carbn vegetal
colesterol
cloruro de sodio
96

En el caso de las partes del cuerpo, hay un tratamiento especial: si en un


mismo organismo hay dos o ms partes iguales, el trmino preferente se redacta
en plural; si hay una sola, se redacta en singular. Por ejemplo:

arteria aorta
arterias
brazos
cerebro
glndulas suprarrenales

Generalmente, los conceptos abstractos se representan en singular, como se


ejemplifica a continuacin.

El concepto es un fenmeno. Por ejemplo:


felicidad
personalidad
verano

El concepto es una propiedad. Por ejemplo:


claridad
conductividad
eficiencia

El concepto es un sistema de creencias o una ideologa. Por ejemplo:


budismo
cristianismo
socialismo

El concepto es una accin. Por ejemplo:


circulacin sangunea
decoracin de interiores
fusin

El concepto es una disciplina. Por ejemplo:


administracin de empresas
ingeniera civil
psicologa

No obstante, cuando el concepto abstracto posee varias especies, el trmino


preferente se redacta en plural:

ciencias biolgicas
ciencias exactas
conjuntos
ideologas
97

reacciones qumicas

Hay casos en los que el singular y el plural tienen distintos significados, por
ejemplo pintura como arte y pinturas como materiales con los que se pinta. Si se
considera que la diferencia no est clara y puede prestarse a confusiones, deben
diferenciarse con una nota de alcance como se indica ms adelante en el apartado
7.7.3.

7.4 Forma autorizada del nombre


Un nombre propio es la designacin verbal de un concepto individual, que a su
vez representa un objeto nico, como puede ser una persona, una institucin, un
pas determinado, una marca comercial, etc. Al igual que los trminos preferentes,
debe seleccionarse una (y solo una) forma autorizada del nombre para cada
concepto individual.
Hace unos aos, tanto las normas como los manuales se referan a esta forma
autorizada del nombre con el trmino identificador (Aitchison et al., 2000; IRAM,
1983; Lancaster, 2002), pero las nuevas normas publicadas en el siglo veintiuno no
solo han eliminado este trmino, sino que han cambiado su significado, definindolo
como un nmero o smbolo que identifica al trmino preferente (BSI Group, 2005;
ISO, 2011; NISO, 2005).
Otros autores prefieren referirse a los nombres propios como descriptores
onomsticos, descriptores geogrficos, descriptores temporales, etc. (Gil Urdiciain,
2004), pero las normas y directrices vigentes nunca han usado estos trminos. La
citada norma ISO 25964 los llama simplemente nombres propios, pero este trmino
no distingue entre la forma autorizada y las formas variantes del nombre, de modo
que

hemos

preferido

utilizar

estos

dos

ltimos

trminos,

segn

las

recomendaciones de IFLA para el control de autoridades de nombres propios (IFLA,


2009b).
Las formas autorizadas del nombre pueden ser de distinto tipo y a continuacin
se muestran algunos ejemplos:

Nombre propio de persona:


Juan de la Cruz, Santo, 1542-1591
Mafalda (personaje de historieta)
McCartney, Paul, 1942Bikila, Abebe, 1932-1973
Sarmiento, Domingo Faustino, 1811-1888

98

Nombre propio de dinasta o familia:


Casa de Borbn
Casa de Windsor
Dinasta Ming, 1368-1644
Dinasta Ptolomica, 323-30 aC
Rockefeller (familia)

Nombre propio de ente corporativo:


Aeropuerto El Tehuelche (Puerto Madryn, Argentina)
Colombia. Ministerio de Comercio, Industria y Turismo
Estudiantes de La Plata (club de ftbol)
Mura (restaurante : La Plata)
Organizacin Panamericana de la Salud

Nombre propio de un objeto o marca:


Friendship 7 (nave espacial)
Libertad (fragata)
Red Door (perfume)
Santa Mara (carabela)
Tango 01 (avin)

Nombre propio de acontecimiento o reunin:


Congreso Nacional Bioqumico (11 : 2009 : Mar del Plata)
Festival de Cine de San Sebastin (1953 : San Sebastin)
Revolucin de Mayo, 1810
Tratado de Versalles, 1919
Guerra Mundial, 1939-1945

Nombre propio de ttulo:


Don Segundo Sombra
Inmunologa e inmunoqumica
Quijote
Rocky (pelcula cinematogrfica)
Social science citation index

Nombre propio de espacio (lugar o accidente geogrfico):


La Rioja (Argentina : provincia)
La Rioja (Espaa : provincia)
Metrpolis (ciudad de historieta)
Plaza Italia (La Plata, Argentina)
Popocatpetl (volcn, Mxico)

Nombre propio de tiempo:


Barroco, 1600-1750
Edad Contempornea, 1453-1789
Gran Depresin, 1929-1934
Perodo Hispnico, 1536-1810
99

Quattrocento, 1400-1499
Si el nombre propio incluye un artculo antes del sustantivo, la forma autorizada
del nombre tambin debe incluirlo. Por ejemplo:
El Salvador
La Habana (Cuba)
Los Angeles Lakers (club de bsquetbol)
Un tesauro puede mostrar numerosos nombres propios, pero es muy difcil, si
no imposible, que pueda incluir todos los que se necesitan a la hora de indizar en
una biblioteca. Por ejemplo, el Tesauro de la Unesco posee la forma autorizada del
nombre Argentina, pero no para Misiones o Ro Negro. Posee el trmino preferente
dramaturgo, pero carece de un nombre propio para Alejandro Casona o para
Roberto Arlt.
Para solucionar este problema, el diseador del tesauro puede proporcionar una
instruccin en una nota de alcance, por ejemplo:

Argentina
NA sese para obras sobre el pas en general. Para las obras sobre
una

provincia

localidad,

indcese

por

el

nombre

propio

normalizado de acuerdo con una norma de catalogacin, por ejemplo


Santa Fe (Argentina : provincia).

dramaturgos
NA sese para obras sobre dramaturgos en general. Para obras sobre
un

dramaturgo

en

particular

indcese

por

el

nombre

propio

normalizado de acuerdo con una norma de catalogacin. Por ejemplo


Miller, Arthur, 1915-2007.

Tambin se puede tomar la decisin de no incluir ningn nombre propio y


aconsejar el uso de una lista de autoridades de nombres.

7.5 Abreviaturas y siglas


Las abreviaturas no estn permitidas en el tesauro, porque afectan la
recuperacin. Se debe preferir familia a flia., provincia a prov., polica a pca.
Las siglas estn permitidas cuando son ms conocidas que el nombre in
extenso, por ejemplo: UNESCO en lugar de Organizacin de las Naciones Unidas para
la

Educacin

la

Ciencia

la

Cultura,

SIDA

en

lugar

de

sndrome

de

inmunodeficiencia adquirida o lser por light amplification by stimulated emission


of radiation.
100

7.6 Trminos multipalabra


Como se ha mencionado, los trminos preferentes pueden constar de una o
varias palabras. La nueva norma internacional ISO 25964 usa el trmino multi-word
term o trmino multipalabra, en sustitucin de trmino compuesto que utilizaban
las normas anteriores, razn por la cual lo preferimos aqu (ISO, 2011).
Los trminos multipalabra pueden ser de dos tipos: una frase nominal
adjetivada (escuelas pblicas) o una frase nominal preposicional (bibliotecas
para ciegos), que estn formadas por un ncleo y un modificador, directo o
indirecto:

Ncleo: siempre es un sustantivo y suele indicar el gnero al que pertenece


el trmino. En los ejemplos del prrafo anterior los ncleos son escuelas y
bibliotecas, respectivamente.

Modificador directo: es un adjetivo y suele representar la especie. En el caso


del primer ejemplo, el modificador directo es pblicas.

Modificador indirecto: es una frase preposicional. En el segundo ejemplo, el


modificador indirecto es para ciegos.

En general, la norma y los manuales recomiendan fraccionar estos trminos


multipalabra en sus elementos ms simples, excepto cuando pueda afectar la
comprensin del indizador y del usuario final. Sin embargo, como se mencion, no
todos los conceptos pueden expresarse con una sola palabra. Esta contradiccin
entre lo conveniente (una sola palabra) y lo necesario (dos o ms palabras), genera
problemas que deben resolverse (Atchison et al., 2000; ISO, 2011; Lancaster,
2002; Naumis Pea, 2008).
La principal ventaja del trmino preferente multipalabra es que mejora la tasa
de precisin en el momento de la bsqueda, evitando las recuperaciones falsas. Por
ejemplo, el trmino preferente control de calidad permite obtener mejores
resultados que la coordinacin de los trminos preferentes control + calidad, ya que
esta ltima opcin podra recuperar un texto en el que se leyera, por ejemplo, el
control de la ortografa es indispensable para la calidad del texto, que no tiene
nada que ver con el concepto control de calidad.
Volviendo entonces a la norma ISO 25964, queda claro que, siempre que sea
posible, el trmino multipalabra debe descomponerse en trminos ms simples.
Esta accin se conoce como fraccionamiento de trminos multipalabra y puede ser
de dos tipos: a) fraccionamiento semntico o b) fraccionamiento sintctico. Pero, si
el fraccionamiento afecta la comprensin, entonces se mantiene el trmino
multipalabra.
101

A continuacin se presentan las recomendaciones de la norma ISO 25964 para


mantener o fraccionar los trminos multipalabra. Solo constituyen una gua, pero
no son de aplicacin obligatoria, pues cada uno de los casos que se presenta puede
dar lugar a numerosas excepciones, dependiendo principalmente de la conveniencia
para los usuarios finales.

7.6.1 Mantenimiento del trmino multipalabra

En los siguientes casos, debe mantenerse el trmino multipalabra:

Cuando el trmino est aceptado y es de uso comn por los usuarios finales,
segn el dominio del tesauro. Por ejemplo:
cromatografa capilar electrocintica micelar
procesamiento digital de seales

Cuando el fraccionamiento puede conducir a una prdida de significado o


ambigedad, por ejemplo:

alimentos

animales

podra

recuperar

informacin sobre animales que sirven de alimento o sobre alimentos para


animales.

Los trminos que incluyen un nombre propio. Por ejemplo


enfermedad de Chagas
teorema de Pitgoras

Los trminos cuyos modificadores han perdido su significado original. Por


ejemplo:
mesas redondas
sillas de tijera

Los trminos cuyo modificador sugiere una semejanza, a modo de metfora


o smil. Por ejemplo, estructuras de rbol no puede fraccionarse en
estructuras + rboles, porque la recuperacin no sera pertinente.

Los trminos multipalabra que al separarse producen otros trminos que no


llegan a cubrir el mismo concepto. Por ejemplo:
establecimientos de salud
piletas de natacin

Los trminos en los que el ncleo posee un significado diferente en ausencia


del modificador. Por ejemplo:
animales de peluche
flores de papel

102

7.6.2 Fraccionamiento semntico

Un trmino, sea simple o multipalabra, que representa un concepto A, puede


fraccionarse en varios trminos preferentes que, si bien por separado representan
conceptos diferentes, una vez poscoordinados pueden significar lo mismo que el
concepto A. Por ejemplo: el trmino termmetros puede fraccionarse en los
trminos preferentes temperatura + medicin + instrumentos, que deberan
asignarse

juntos

para

significar

termmetros.

Igualmente,

los

trminos

fisicoqumica y biotecnologa pueden fraccionarse, respectivamente, en los trminos


preferentes fsica + qumica y biologa + tecnologa.
Esta tcnica puede producir una fuerte prdida de consistencia en la indizacin y
de precisin en la recuperacin, de modo que la norma ISO 25964 no recomienda
su aplicacin.

7.6.3 Fraccionamiento sintctico

Los trminos multipalabra pueden fraccionarse sintcticamente en los siguientes


casos:

Cuando el ncleo (subrayado) se refiere a una propiedad o parte y el


modificador representa el conjunto o poseedor de tal propiedad o parte, se
fracciona:
motores de avin
lmparas de cristal
vagones de ferrocarril
Los trminos preferentes despus del fraccionamiento seran:
aviones
cristal
ferrocarriles
lmparas
motores
vagones

Contrariamente, cuando el ncleo es el todo o poseedor y el modificador es


la parte o propiedad, el trmino multipalabra se mantiene:
aviones comerciales
cristal cortado
ferrocarriles elctricos

Cuando el ncleo es una accin transitiva y el modificador es el objeto sobre


el que recae la accin, se fracciona:
consumo de agua
103

laminacin de acero
cultivo de cereales
Los trminos preferentes resultantes despus del fraccionamiento seran:
acero
agua
cereales
consumo
cultivo
laminacin

Contrariamente, cuando el ncleo es el objeto y el modificador es una accin


que recae sobre aquel, se mantiene el trmino multipalabra:
acero laminado
agua potable
cereales procesados

Cuando el ncleo es una accin intransitiva y el modificador es el objeto que


realiza la accin, se fracciona:
comportamiento del consumidor
crecimiento del maz
oxidacin de metales
Los trminos preferentes resultantes despus del fraccionamiento seran:
comportamiento
consumidores
crecimiento
maz
metales
oxidacin

Contrariamente, cuando el ncleo es el objeto y el modificador es una accin


en la que aqul ha estado involucrado, se mantiene el trmino multipalabra:
consumidores informados
maz desgranado
metales oxidados

Como se puede observar, las frases con modificador indirecto son las ms
afectadas por el fraccionamiento sintctico.
Por otro lado, la norma ISO 25964 se hace eco de lo recomendado por
Lancaster (2002) recomiendan fraccionar las frases con dos modificadores directos.
Por ejemplo:

cmaras cinematogrficas
cmaras submarinas
y no cmaras cinematogrficas submarinas
104

estructuras metlicas
estructuras prefabricadas
y no estructuras metlicas prefabricadas

vuelos espaciales
vuelos tripulados
y no vuelos espaciales tripulados

7.6.4 Fraccionamiento de nombres propios

Los nombres propios nunca se fraccionan. Slo los trminos preferentes y los
trminos no preferentes estn sujetos a estas recomendaciones.

7.7 Desambiguacin: calificadores y notas


Como ya se ha mencionado, los trminos preferentes deben ser unvocos. Hay
casos en que los trminos resultan ambiguos y se requiere desambiguarlos. Existen
dos recursos para hacerlo: los calificadores y las notas.

7.7.1 Homgrafos y calificadores

Los homnimos son trminos que poseen un mismo significante, pero distinto
significado. Pueden ser fonticos (homfonos) o grficos (homgrafos). Estos
ltimos son trminos de idntica grafa, pero que representan conceptos diferentes.
Para distinguir uno de otro en el contexto de un tesauro, se agrega al trmino
preferente un trmino aclaratorio entre parntesis, que se denomina calificador. Por
ejemplo:

diafragma (msculo)
diafragma (dispositivo intrauterino)

Mercurio (deidad)
Mercurio (planeta)
mercurio (metal)

pinturas (materiales)
pinturas (obras de arte)

105

tanques (contenedores)
tanques (vehculos militares)

El calificador es parte del trmino preferente y por lo tanto no se pueden


separar. El indizador deber asignarlos tal cual aparecen en el tesauro.
Por lo general el calificador se agrega solamente cuando los homgrafos
aparecen en el mismo tesauro. Tomando el ejemplo de mercurio, es difcil que en
un mismo tesauro se necesite distinguir entre la deidad y el metal. Sin embargo,
hoy en da la interoperabilidad entre dos o ms tesauros es cada vez ms comn y
algunos consideran que es conveniente agregar el calificador aunque el homgrafo
no aparezca en el mismo tesauro, en previsin de un posible proceso de
interoperabilidad (ISO, 2011).

7.7.2 Nota de definicin

Como su nombre lo indica, la nota de definicin proporciona la definicin de un


trmino y es utilizada cuando el trmino puede interpretarse de modo ambiguo o
equvoco.
La norma internacional ISO 25964 recomienda que, si es necesaria una nota de
definicin, sta sea independiente de las otras notas (ISO, 2011). Modifica as las
disposiciones de las normas previas, en las cuales la definicin deba incluirse como
una nota de alcance. La etiqueta para la nota de definicin es DEF. Por ejemplo:

educacin comparada
DEF Estudio comparativo entre las teoras y prcticas educativas
vigentes en diferentes pases.

informtica
DEF

Ciencia

que

estudia

los

medios

fsicos

lgicos

para

el

tratamiento de la informacin.

Las normas y manuales para el diseo de un tesauro coinciden en que no todos


los trminos preferentes requieren una nota de definicin (Aitchison et al., 2000;
ISO, 2011; Lancaster, 2002). No obstante, algunos autores sugieren que sera
conveniente que todos los trminos preferentes contaran con una definicin e
incluso, como se mencion en el Captulo 3, se ha recomendado la definicin por
intensin (gnero prximo y diferencia especfica) como conveniente, no solo para
desambiguar el trmino preferente, sino tambin para facilitar la identificacin de
las relaciones jerrquicas (Aguado et al., 1999; Barit, 2000a; Hudon, 1996;
106

Vickery, 1960a). De hecho, hay tesauros que efectivamente definen todos sus
trminos preferentes.

7.7.3 Nota de alcance

Se trata de una nota destinada a precisar y/o restringir el significado de un


trmino preferente (Barit, 2013).
En otros pases de lengua espaola se utilizan tambin los sinnimos nota
aclaratoria, nota de aplicacin, nota explicativa y nota de indizacin (AENOR, 1990;
Gil Urdiciain, 2004; Gil Leiva, 2008). Nosotros preferimos mantener nota de alcance
que es la forma utilizada por la norma argentina IRAM 32057:1983 y en otros
pases latinoamericanos, como Uruguay y Mxico (Barit, 2013; IRAM, 1983;
Naumis Pea, 2008).
No todos los trminos preferentes requieren una nota de alcance, slo aquellos
que puedan resultar ambiguos. La nota se indica bajo el trmino preferente y su
etiqueta es NA. Se reconocen varios tipos de nota de alcance (Aitchison, 2000; ISO,
2011; Lancaster, 2002):

Nota de inclusin o limitacin positiva. Ejemplo:


educacin artstica
NA sese para las obras que tratan sobre la enseanza del
dibujo, la grfica, la pintura y la escultura.

becas de estudio
NA sese para las becas a estudiantes de los ciclos primario y
secundario.

Nota de exclusin o limitacin negativa. Ejemplo:

desarrollo
NA Excluye las obras que tratan sobre el desarrollo experimental
o individual.

personas desplazadas
NA Excluye a los refugiados polticos. Para estos ltimos sese
refugiados.

Nota de instruccin. Ejemplo:

107

arquitectos
NA sese para las obras que tratan sobre los arquitectos en
general.

Para

las

obras

que

tratan

sobre

un

arquitecto

en

particular, indcese por el nombre propio normalizado de acuerdo


con una norma de catalogacin, por ejemplo Rohe, Ludwig Mies van
der, 1886-1969.

anemia
NA sese para obras muy generales. Prefiranse en lo posible los
trminos especficos, por ejemplo anemia hemoltica.

La nota de alcance puede ser recproca, cuando involucra a varios trminos


preferentes. Por ejemplo:

teatro
NA sese para las obras sobre el teatro como gnero literario. Las
obras

sobre

el

local

destinado

la

representacin

teatral

se

indizan por teatros.

teatros
NA

sese

para

representacin

las

obras

teatral.

Las

sobre
obras

el
sobre

local
el

destinado

teatro

como

la

gnero

literario se indizan por teatro.

7.7.4 Nota histrica

La nota histrica se indica bajo un trmino preferente para indicar desde cundo
se utiliza el trmino y, en caso de modificacin, relaciona el o los trminos
preferentes que designaban anteriormente el mismo concepto.
Para la norma ISO 25964, la etiqueta de la nota histrica es HN (historical
note). Las normas espaola y argentina, as como otras normas latinoamericanas
vigentes no contemplan todava este tipo de nota, de modo que no se cuenta con
una etiqueta normalizada en nuestra lengua (AENOR, 1990; IRAM, 1983; Oficina
Nacional de Normalizacin, 2000; ICONTEC, 1998). En 2013, el Subcomit de
Documentacin de IRAM aprob la etiqueta NH (nota histrica) para la norma
IRAM-ISO 25963 que se encuentra en curso y as la usamos aqu. Los siguientes
son ejemplos de notas histricas:

108

Chequia
NA Las obras sobre el territorio de Chequia, referidas a los aos
comprendidos entre 1918 y 1992 deben indizarse por Checoslovaquia.
DEF Estado europeo independiente fundado el 1 de enero de 1993, a
partir de la divisin de Checoslovaquia.
NH Trmino incorporado el 1993-01-10.

diabetes mellitus tipo 1


UP diabetes juvenil
UP diabetes mellitus insulinodependiente
NH Sustituye a los trminos en desuso diabetes juvenil y diabetes
mellitus insulinodependiente, de acuerdo con la recomendacin del
Expert Committee on the Diagnosis and Classification of Diabetes
Mellitus de la American Diabetes Association. Trmino incorporado
en 1997-09-01.

Los trminos preferentes y las formas autorizadas del nombre pueden tener,
simultneamente, notas de definicin, de alcance e histrica.

7.8 Relacin de equivalencia


Como sealamos anteriormente, el vocabulario del tesauro est formado por un
vocabulario de indizacin y un vocabulario de entrada. El primero est formado por
los trminos preferentes y las formas autorizadas del nombre, el segundo por los
trminos no preferentes y las formas variantes del nombre, que se incluyen en el
tesauro solo para remitir, respectivamente, a los trminos preferentes y a las
formas autorizadas del nombre.
Un trmino no preferente es un sinnimo o cuasi sinnimo del trmino
preferente, que no se puede asignar en la indizacin, pero que remite al trmino
preferente de un tesauro.
De manera similar, la forma variante del nombre es una forma del nombre
propio que no se puede asignar en la indizacin, pero que remite a la forma
autorizada del nombre en un tesauro.
La relacin entre un trmino preferente y un trmino no preferente, o entre una
forma autorizada del nombre y una forma variante del nombre es una relacin de
equivalencia. Algunos autores la designan como relacin de sinonimia (Barit,
2009; Naumis Pea, 2008), pero relacin de equivalencia se encuentra aceptado
tanto

por

la

norma

argentina,

como

109

por

la

espaola

otras

normas

latinoamericanas, de modo que es el trmino que usamos aqu (AENOR, 1990;


Oficina Nacional de Normalizacin, 2000; ICONTEC, 1998; IRAM, 1983).
En la relacin de equivalencia se usan dos etiquetas: a) el trmino no preferente
o la forma variante del nombre remiten al trmino preferente o a la forma
autorizada del nombre con la etiqueta USE y b) el trmino preferente y la forma
autorizada del nombre informan sobre los trminos no preferentes y las formas
variantes del nombre con la etiqueta UP, que significa usado por. Por ejemplo:

cacahuate

man

USE man

UP cacahuate

Confederacin Helvtica

Suiza

USE Suiza

UP Confederacin Helvtica

Las etiquetas anteriores pueden sustituirse por los smbolos en lugar de USE
y = en lugar de UP. Ejemplo:

anacardos

castaas de caj

castaas de caj

= anacardos

Godoy Alcayaga, Lucila

Mistral, Gabriela, 1889-1957

= Mistral, Gabriela, 1889-1957

= Godoy Alcayaga, Lucila

Cuando el diseador de un tesauro se enfrenta con un conjunto de sinnimos o


cuasi sinnimos, debe seleccionar uno de ellos como trmino preferente. Para esto
deber guiarse estrictamente por el principio de garanta que se explica en el
Captulo 6. Sin nimo de ser exhaustivos, a continuacin se describen algunos
criterios para orientar la seleccin:

Origen lingstico, por ejemplo: polglota USE multilinge.

Nombre popular o cientfico: Solanum tuberosum USE papa.

Nombre comercial o nombre comn: biromes USE lapiceras.

Siglas o nombre desarrollado: PVC USE policloruro de vinilo.

Trminos actuales u obsoletos: diabetes juvenil USE diabetes tipo 1.

Variaciones ortogrficas: sicologa USE psicologa.

Variaciones culturales: parqueos USE estacionamientos.

Trminos prestados: estudio de mercado USE marketing.

Los cuasi sinnimos son trminos, que si bien no son sinnimos en un sentido
estricto, en el tesauro son tratados como tal. Por ejemplo:

110

trastornos mentales

enfermedades mentales

USE enfermedades mentales

UP trastornos mentales

Tambin pueden ser extremos de un continuum como algunos antnimos. Debe


decidirse si se incorporan ambos trminos o si uno de ellos representa al otro. Por
ejemplo:

fro

calor

USE calor

UP fro

desnutricin

nutricin

USE nutricin

UP desnutricin

subdesarrollo

desarrollo

USE desarrollo

UP subdesarrollo

Otra funcin de la relacin de equivalencia es el llamado reenvo ascendente. En


este caso, la relacin no se da entre sinnimos, sino entre un concepto especfico,
que no se considera necesario incorporar al tesauro, y un trmino preferente ms
general que lo incluya. Por ejemplo:

ballenas

cetceos

USE cetceos

UP ballenas

ingenieros mecnicos

ingenieros

USE ingenieros

UP ingenieros mecnicos

pino blanco

pinos

USE pinos

UP pino blanco

Dentro de la relacin de equivalencia, tambin se incluye el reenvo de un


trmino

multipalabra

poscoordinarse.

En

fraccionado

este

caso,

se

los

trminos

agrega

un

preferentes

smbolo

para

poscoordinacin. Por ejemplo:

motores de camin

camiones

USE motores + camin

UP+ motores de camin

motores
UP+ motores de camin
111

que

deben

indicar

la

Autoevaluacin
a. Explique la diferencia entre vocabulario de indizacin y vocabulario de entrada.

b. Qu es un trmino preferente?

c. Describa las formas gramaticales recomendadas para un trmino preferente.

d. Mencione en qu casos se debe redactar el trmino preferente en singular o en


plural.

e. Si se decide no incorporar nombres propios al tesauro: qu prcticas se


pueden seguir?

f.

En qu casos se pueden usar abreviaturas o siglas en un tesauro?

g. En qu casos se debe mantener un trmino multipalabra?

h. En qu casos se debe fraccionar un trmino multipalabra?

i.

Describa los recursos para desambiguar un trmino

j.

Explique la relacin de equivalencia

k. Qu etiquetas y smbolos indican una relacin de equivalencia?

l.

En qu casos se recomienda establecer una relacin de equivalencia?

112

8. Las relaciones jerrquicas y asociativas

En captulos anteriores hemos mencionado que una de las caractersticas


distintivas del tesauro es su red de relaciones explcitas. En este captulo nos
referiremos a las relaciones jerrquicas y asociativas que forman parte del
micronivel sealado por Aitchison et al. (2000).
Las relaciones jerrquicas y asociativas constituyen una red de referencias
cruzadas que permite, tanto al indizador como al usuario final, elegir el trmino
preferente o la forma autorizada del nombre que ms convenga para indizar o para
recuperar informacin (Aitchison et al., 2000; BSI Group, 2005; Lancaster, 2002;
ISO, 2011).
Todas estas relaciones son explcitas y recprocas, de modo tal que si el trmino
A est relacionado con B, el trmino B tambin debe estar relacionado con A.

8.1 Relacin jerrquica


La relacin jerrquica se establece entre dos trminos preferentes o entre un
trmino preferente y una forma autorizada del nombre. Uno representa el gnero o
el todo y se denomina trmino genrico; la etiqueta que lo precede es TG. El otro
representa la especie, la parte o un ejemplo del anterior y se denomina trmino
especfico; su etiqueta es TE. Si bien los dos elementos de la relacin son trminos
preferentes o formas autorizadas del nombre, se encuentran en un distinto nivel de
jerarqua. Ejemplo:

reptiles

serpientes

TE serpientes

TG reptiles

La etiqueta TG puede sustituirse por el smbolo < y la de TE por >. Ejemplo:

automviles deportivos

automviles

< automviles

> automviles deportivos

Las normas y manuales citados permiten, de manera opcional, indicar en todos


los trminos preferentes el trmino tope, es decir el trmino ms genrico de una
cadena de conceptos (Barit, 2013). En un tesauro facetado, el trmino tope es la
faceta de primer nivel, segn se explica en el Captulo 9. En Espaa y en Cuba el
113

trmino tope se conoce como trmino cabecera (AENOR, 1990; Oficina Nacional de
Normalizacin, 2000). La etiqueta del trmino tope es TT. En el siguiente ejemplo,
los trminos preferentes muebles

de

oficina,

escritorios,

escritorios

gerenciales y escritorios secretariales comparten un mismo TT muebles:

muebles
TE muebles de oficina
TE muebles del hogar

muebles de oficina
TT muebles
TG muebles
TE escritorios
TE mesas

escritorios
TT muebles
TG muebles de oficina
TE escritorios gerenciales
TE escritorios secretariales

escritorios gerenciales
TT muebles
TG escritorios

Escritorios secretariales
TT muebles
TG escritorios

Todos los trminos preferentes y las formas autorizadas del nombre deben
tener, al menos, una relacin jerrquica. Si carecen de una relacin jerrquica, se
denominan trminos hurfanos. Un tesauro no debe tener ningn trmino hurfano.
De acuerdo con la norma ISO 25964, hay cuatro tipos de relacin jerrquica que
describen a continuacin (ISO, 2011).

8.1.1 Relacin jerrquica gnero-especie

En este caso, el trmino genrico es el gnero y el trmino especfico es la


especie. Tambin se conoce como relacin jerrquica genrica. Es la ms comn de

114

las relaciones jerrquicas y se puede verificar con la prueba que se muestra en la


Figura 8.1.

Figura 8.1. Prueba de la relacin jerrquica gnero-especie: Algunos motores


son elctricos, pero todos los motores elctricos son motores. Por lo tanto,
motores es el gnero y motores elctricos la especie.

Algunos ejemplos de relacin jerrquica gnero-especie son:

embarcaciones a vela

embarcaciones

TG embarcaciones

TE embarcaciones a vela

inmigrantes italianos

inmigrantes

TG inmigrantes

TE inmigrantes italianos

Aunque no es obligatorio, se puede agregar a la etiqueta de esta relacin una


letra G para indicar que es una relacin gnero-especie. En este caso sera TGG
(trmino genrico gnero-especie) y TEG (trmino especfico gnero- especie). Por
ejemplo:

hospitales peditricos

hospitales

TGG hospitales

TEG hospitales peditricos

8.1.2 Relacin jerrquica todo-parte

En esta relacin, el trmino genrico representa el todo y el trmino especfico


representa una parte de ese todo. Tambin se denomina relacin jerrquica
partitiva. La norma ISO 25964 solo permite cuatro tipos de relaciones todo-parte
(ISO, 2011).
115

Sistemas y rganos del cuerpo

ventrculos

corazn

TG corazn

TE ventrculos

pulmones

sistema respiratorio

TG sistema respiratorio

TE pulmones

Lugares geogrficos

Chubut

Argentina

TG Argentina

TE Chubut

Trelew

Chubut

TG Chubut

TE Trelew

Disciplinas y sus especialidades

oncologa

medicina

TG medicina

TE oncologa

oncohematologa

oncologa

TG oncologa

TE oncohematologa

Estructuras sociales

facultades

universidades

TG universidades

TE facultades

parroquias

dicesis

TG dicesis

TE parroquias

Tambin aqu se puede agregar a la etiqueta de esta relacin una letra P para
indicar que es una relacin todo-parte. En este caso sera TGP (trmino genrico
partitivo) y TEP (trmino especfico partitivo). Por ejemplo:

intestino delgado

sistema digestivo

TGP sistema digestivo

TEP intestino delgado

116

Facultad de Derecho

Universidad de los Andes

TGP Universidad de los Andes

TEP Facultad de Derecho

8.1.3 Relacin jerrquica enumerativa o ejemplar

En esta relacin, el trmino genrico es el gnero o el todo y el trmino


especfico es un ejemplo del anterior, designado por una forma autorizada del
nombre. Por ejemplo:

Universidad de Palermo

universidades

TG universidades

TE Universidad de Palermo

Mart, Jos, 1853-1895

escritores

TG escritores

TE Mart, Jos, 1853-1895

La norma internacional ISO 25964 establece que la etiqueta opcional para la


relacin jerrquica enumerativa es BTI/NTI broader term (instantial), narrower
term (instantial), pero las normas espaola, argentina y otras latinoamericanas
vigentes no la han contemplado todava (AENOR, 1990; Oficina Nacional de
Normalizacin, 2000; ICONTEC, 1998; IRAM, 1983). En 2013 el Subcomit de
Documentacin

del

IRAM

aprob

las

etiquetas

TGE/TEE

(trmino

genrico

enumerativo y trmino especfico enumerativo) para la norma IRAM-ISO 25963 que


se encuentra en curso y as se usan en esta obra. Por ejemplo:

Lann (volcn, Argentina)

volcanes

TGE volcanes

TEE Lann (volcn, Argentina)

Atitln (lago, Guatemala)

lagos centroamericanos

TGE lagos centroamericanos

TEE Atitln (lago, Guatemala)

8.1.4 Relacin polijerrquica

Es la relacin que se establece entre un trmino preferente y dos o ms


trminos genricos, segn el ejemplo que se muestra en la Figura 8.2.
Existen dos posiciones respecto a la relacin polijerrquica. Algunos autores
seguidores del anlisis de facetas consideran que la estructura sistemtica debe
ser monojerrquica, es decir cada concepto debe tener un solo concepto genrico.
Aplicado al tesauro, significa que un trmino preferente solo puede tener un TG.

117

Este enfoque coincide con el principio de lugar de definicin nica postulado por
Farradane (1952) y revalorado ms recientemente por otros autores (Gnoli, 2007).

Figura 8.2. Ejemplo de una relacin polijerrquica. El trmino preferente


rganos tiene en este caso dos trminos genricos: instrumentos de viento e
instrumentos de teclado. Es por tanto una relacin polijerrquica.

Contrariamente, en la estructura polijerrquica un concepto puede tener ms de


un concepto genrico, es decir un trmino preferente podra mostrar ms de un TG.
Este enfoque est aceptado por las especificaciones de la norma ISO 25964,
aunque se aclara que solo ocurre en algunos casos y debe tener un fundamento
lgico (ISO, 2011). Una discusin sobre este tema se puede encontrar en el artculo
de Miller (1997).

8.2 Relacin asociativa


Es una asociacin conceptual entre dos trminos preferentes o formas
autorizadas del nombre, que no se puede considerar como una relacin de
equivalencia, ni como una relacin jerrquica. Su reciprocidad es obligatoria y su
etiqueta es TR (trmino relacionado). Por ejemplo:

aviadores

aviones

TR aviones

TR aviadores

La etiqueta TR puede sustituirse por el smbolo . Por ejemplo:

acero laminado

laminacin

laminacin

acero laminado

La relacin asociativa ofrece una gran libertad para relacionar los conceptos
representados en el tesauro y su potencial ha sido valorado por otros autores
(Tudhope et al., 2001).
118

Las normas y manuales publicados en el siglo pasado sealaban dos tipos de


relacin asociativa: la intracategora y la intercategora. Esta diferencia ha sido
eliminada en la nueva norma internacional ISO 25964 que seguimos en el presente
trabajo (ISO, 2011).
Esta norma internacional brinda, sin pretensin de ser exhaustiva, algunas
orientaciones para establecer las relaciones asociativas.

Una disciplina o campo de estudio y su objeto o fenmeno estudiados. Por


ejemplo:

biologa

seres vivos

TR seres vivos

TR biologa

qumica

fenmenos qumicos

TR fenmenos qumicos

TR qumica

Una operacin o proceso y su agente o instrumento. Por ejemplo:

administracin

administradores

TR administradores

TR administracin

procesamiento de datos

computadoras

TR computadoras

TR procesamiento de datos

Una accin y el producto de esa accin. Por ejemplo:

fotoduplicacin

fotocopias

TR fotocopias

TR fotoduplicacin

construccin

viviendas

TR viviendas

TR construccin

Una accin y su receptor u objetivo. Por ejemplo:

curacin

enfermos

TR enfermos

TR curacin

compra

proveedores

TR proveedores

TR compra

119

Un objeto o material y sus propiedades. Por ejemplo:

aluminio

maleabilidad

TR maleabilidad

TR aluminio

vino

color

TR color

TR vino

Un artefacto y sus partes, cuando stos no califican para una relacin


jerrquica todo-parte (vase el apartado 8.1.2). Por ejemplo:

bicicletas

manubrios

TR manubrios

TR bicicletas

gestin

planificacin

TR planificacin

TR gestin

Conceptos vinculados por una dependencia causal. Por ejemplo:

farmacodependencia

frmacos

TR frmacos

TR farmacodependencia

hbito de fumar

cigarrillos

TR cigarrillos

TR hbito de fumar

Un objeto o proceso y su contra agente. Por ejemplo:

plagas

plaguicidas

TR plaguicidas

TR plagas

infecciones

antibiticos

TR antibiticos

TR infecciones

Un objeto y su unidad de medida. Por ejemplo:

voltaje

voltio

TR voltio

TR voltaje

presin atmosfrica

hectopascal

TR hectopascal

TR presin atmosfrica
120

Un organismo o sustancia engendrado o derivado de otro. Por ejemplo:

mulas

burros

TR burros

TR mulas

chicle

Manilkara zapota

TR Manilkara zapota

TR chicle

Un trmino preferente puede tener todas o algunas de las relaciones semnticas


aqu descriptas. Por ejemplo:

papas
UP patatas
TT tubrculos
TG tubrculos comestibles
TE papas amarillas
papas coloradas
papas negras
papines
TR pur de papas

patatas
USE papas

Lo mismo sucede con las formas autorizadas del nombre. Por ejemplo:

Borges, Jorge Luis, 1899-1986


NA

Comparte

el

sinnimo

colectivo

autor Adolfo Bioy Casares.


TT escritores
TG escritores argentinos
TR Bioy Casares, Adolfo, 1914-1999

121

Honorio

Bustos

Domecq

con

el

Autoevaluacin
a. Explique la relacin jerrquica.

b. Qu etiquetas y smbolos indican una relacin jerrquica?

c. Qu tipos de relacin jerrquica reconoce la norma ISO 25964?

d. Qu es un trmino hurfano? Se pueden aceptar trminos hurfanos en un


tesauro?

e. Explique la relacin asociativa.

f.

Qu etiquetas y smbolos indican una relacin asociativa?

g. Mencione en qu casos se recomienda establecer una relacin asociativa.

122

9. El orden sistemtico del tesauro

Nos referiremos aqu a las relaciones de macronivel, es decir al orden sistemtico


del tesauro (Aitchison et al., 2000). Se trata de construir un esquema o plan de
organizacin de los conceptos correspondientes al dominio del tesauro. Esos
conceptos, designados por los trminos preferentes y las formas autorizadas del
nombre, se agrupan lgicamente de acuerdo con sus semejanzas y se separan por
sus diferencias, de modo similar a un sistema de clasificacin. Para lograr este
orden sistemtico tambin es indispensable cumplir con el principio de garanta,
que se explic en el Apartado 6.6.

9.1 Definicin y anlisis del dominio


Un dominio es una esfera o mbito especfico de conocimiento, influencia o
actividad. Puede ser una disciplina, arte o profesin, una especialidad de stas o un
campo multi o interdisciplinario. Una vez que se ha tomado la decisin de disear
un tesauro, el primer paso es definir su dominio con exactitud.
Tennis (2003) propone dos ejes analticos para definir un dominio:

Eje 1 reas de modulacin: establece la extensin y el nombre del dominio.


La extensin es el alcance total del dominio, es decir su cobertura: lo que
incluye y lo que no incluye. Por su parte el nombre designa al dominio, es la
denominacin por la cual debe llamarse ese dominio.

Eje 2 Grados de especializacin: establece la focalizacin y la interseccin


del dominio. Mediante la focalizacin, la extensin del dominio disminuye,
mientras que su intensidad aumenta. En otras palabras, mientras ms
restringido sea el alcance del dominio, ms profunda ser su especializacin.
Por su parte, la interseccin ubica un dominio frente a otros dominios. Puede
ocurrir que un dominio est claramente separado de otros, o bien que se
interseque con alguno, dando lugar a un nuevo dominio con un nuevo
nombre.

Una vez definido el dominio del tesauro, es necesario analizarlo. Hjrland y


Albrechtsen (1995) han sealado que la mejor manera de estudiar la informacin o
el conocimiento registrado en el rea de la BDCI es analizar los dominios de
conocimiento como comunidades de pensamiento o de discurso, que son parte de la
divisin social del trabajo. La organizacin del conocimiento, la estructura, los

123

patrones de cooperacin, las formas lingsticas y de comunicacin, los SAR y los


criterios de relevancia son segn los autores citados reflejos de los objetos de
trabajo de estas comunidades y de su rol en la sociedad.
Barit et al. definen el anlisis de dominio de la siguiente manera:

Denominacin genrica de un conjunto de metodologas que tienen como objetivo


comn establecer las fronteras de un espacio especializado del saber, y determinar
su estructura interna de conceptos y relaciones, con el propsito de representar el
conocimiento que le es propio a travs de una estructura conceptual o de otras
modalidades. El anlisis de dominio se realiza a partir de la identificacin de los
problemas y los tpicos propios del rea, tal como se expresan en su literatura de
referencia. Las aproximaciones pueden ser cuantitativas, cualitativas y mixtas. Estas
metodologas

se

utilizan

tanto

para

elaborar

sistemas

de

organizacin

del

conocimiento y otras estructuras, como para revisarlas y evaluarlas (Barit et al.,


2013, en lnea).

Entre los mtodos aportados por la BDCI para el anlisis de dominio, Hjrland &
Albrechtsen (1995) mencionan algunas ideas de Bliss sobre la identificacin de la
estructura de una disciplina, el anlisis de facetas que explicaremos aqu, los
estudios bibliomtricos y los estudios de usuarios, particularmente de las conductas
de bsqueda.
En la actualidad, los diseadores de tesauros enfrentan un gran desafo respecto
a la definicin y el anlisis de dominio, que es aquello que Lpez Huertas (2007)
denomina conocimiento multidimensional, es decir la tendencia actual producto del
posmodernismo que rechaza la excesiva especializacin de las ciencias, en favor
de un conocimiento marcado por la multidisciplinariedad, la interdisciplinariedad y
la transdisciplinariedad. Morn ofrece las siguientes definiciones:

Se conoce por interdisciplina la forma de organizacin de los conocimientos, donde


los mtodos que han sido utilizados con xito dentro de una disciplina, se transfieren
a otra, introducindolos en ella sobre la base de una justificacin, que pretende
siempre una ampliacin de los descubrimientos posibles o la fundamentacin de
estos. Como resultado, se puede obtener una ampliacin y cambio en el mtodo
transferido, o incluso un cambio disciplinario total, cuando se genera una disciplina
nueva, con carcter mixto, como es el caso de la terapia familiar, que toma mtodos
de la Antropologa, la Psicologa, la Sociologa y los aplica a la familia. Otro tanto
ocurre, aunque con una estructuracin formal diferente, en ciencias como la
Bioqumica, y otras cercanas a los dominios tecnolgicos, la robtica, y campos
aplicados [...]

124

La pluridisciplina o multidisciplina por su parte, no altera los campos y objetos de


estudio disciplinarios, ni el arsenal metodolgico: consiste en juntar varias disciplinas
para que cada una proyecte una visin especfica sobre un campo determinado. Cada
disciplina aporta su visin especfica, y todas confluyen en un informe final de
investigacin que caracteriza desde las perspectivas involucradas lo que se investiga.
No obstante, la pluridisciplina hace avanzar formas organizativas nuevas y produce
impactos en los investigadores, cuando se transcienden los lmites formales antes
expuestos, se forman colectivos estables durante perodos temporales amplios, y se
termina intercambiando saberes en un ejercicio que comienza a trascender las
fronteras de cada una de las disciplinas involucradas. Los estudios pluridisciplinarios
no solo aportan lo extra que concierne al trabajo conjunto, sino lo que se revierte
sobre la propia ciencia y el modo de concebir la investigacin []
La transdisciplina es una forma de organizacin de los conocimientos que trasciende
las disciplinas de una forma radical. Se ha entendido la transdisciplina haciendo
nfasis en a) lo que est entre las disciplinas, b) lo que las atraviesa a todas, y c) lo
que est ms all de ellas. A pesar de las diferencias antes mencionadas, y de la
existencia en el pasado de la interpretacin de la transdisciplina como una mega o
hiperdisciplina, todas las interpretaciones coinciden en la necesidad de que los
conocimientos cientficos se nutran y aporten una mirada global que no se reduzca a
las disciplinas ni a sus campos, que vaya en la direccin de considerar el mundo en
su unidad diversa. Que

no lo separe, aunque

distinga las diferencias. La

transdisciplina representa la aspiracin a un conocimiento lo ms completo posible,


que sea capaz de dialogar con la diversidad de los saberes humanos. Por eso el
dilogo de saberes y la complejidad son inherentes a la actitud transdisciplinaria, que
se plantea el mundo como pregunta y como aspiracin (Morn, 2012, en lnea).

Algunas de las caractersticas de esta nueva forma de entender el conocimiento


y que afectan especialmente a los tesauros son (Lpez Huertas, 2007):

Terminologa no consensuada e inestable

Terminologa de aluvin (interdisciplinas de reciente creacin)

Lmites conceptuales no bien definidos

Fronteras epistemolgicas confusas

Falta de taxonomas o clasificaciones cientficas

Dinmicas conceptuales sin definir

Se desconoce la interaccin entre las especialidades que constituyen la


interdisciplina

Falta de modelos tcnicos para abordar estos espacios

Por otro lado, en un tesauro hay algunos temas que no forman parte del
dominio, pero que suelen ser necesarios. Vickery (1960) los llama temas
marginales y se debe decidir si se incluyen o no. Si se incluyen, es preciso
considerar

hasta

qu

nivel

de

especificidad
125

se

deben

desarrollar,

aunque

generalmente se opta por un nivel menos especfico que aquel del dominio. Algunos
temas marginales comunes a casi todos los tesauros son los siguientes:

Legislacin

Historia

Educacin

Investigacin

Tecnologa

Administracin

Estadstica

Obras de referencia, publicaciones

Bibliotecas, archivos, museos

Sociedades, asociaciones

9.2 Anlisis de facetas


En el Captulo 6, explicamos que el mtodo inductivo es ideal para realizar la
colecta de trminos y nombres propios. Por otro lado, el mtodo deductivo permite
construir el orden sistemtico para proceder a distribuir en ese esquema los
trminos y nombres propios colectados. Ambos mtodos se complementan y la
metodologa recomendada para esto es justamente el anlisis de facetas.
Entonces, el anlisis de facetas consiste en organizar los conceptos, designados
por los trminos preferentes y formas autorizadas del nombre, en facetas
homogneas mutuamente excluyentes, derivadas de un universo comn (Vickery,
1960a).
El creador del anlisis de facetas fue el bibliotecario y profesor indio Shiyali
Ramamrita Ranganathan, quien aplic sus ideas en un sistema de clasificacin de
su autora titulado Colon classification y expuso su teora en el libro Prolegomena to
library classification (Ranganathan, 1933, 1937). Desde mediados del siglo veinte,
un grupo de expertos britnicos, seguidores de Ranganathan y reunidos en el CRG,
han revisado el mtodo del anlisis de facetas, aplicndolo a todo tipo de SOC
(Broughton, 2011).

9.2.1 Aislados y focos

Un concepto que ha sido seleccionado para un SOC, pero que an no ha sido


incluido en el esquema del orden sistemtico, se conoce en el anlisis de facetas
como aislado. Un aislado es, entonces, un concepto simple que puede situarse en
varios contextos diferentes, conforme a sus caractersticas intrnsecas y que es
126

susceptible de ser incluido dentro de una faceta (Barit et al., 2013). Cuando el
aislado se incorpora a una faceta, se convierte en un foco.
Si se aplica a un tesauro, el anlisis de facetas consiste bsicamente en
convertir los aislados en focos, es decir en organizar los trminos preferentes y las
formas autorizadas del nombre en un esquema facetado.
Siguiendo a Vickery (1960) y a Mills (1960; 2004) las etapas del anlisis de
facetas para un tesauro son:

Identificacin de las categoras apropiadas para el dominio

Divisin del dominio en facetas amplias

Divisin de cada faceta en subfacetas especficas

Orden de clasificacin de las facetas y subfacetas

Adicin de una notacin

Vinculacin con la seccin alfabtica

9.2.2 Categoras y facetas

En el campo de la organizacin del conocimiento, Barit ofrece la siguiente


definicin de categoras:

Son abstracciones simplificadas, con fuerza de herramientas intelectuales, usadas


por los clasificacionistas para indagar las regularidades de los objetos del mundo
fsico y del ideal y de las nociones [conceptos] que los representan. Este anlisis y
representacin es realizado con miras a organizar lgicamente los sistemas de
conceptos, suficientes para la organizacin del conocimiento en trminos generales y
el anlisis de materia o clasificacin de documentos en trminos especficos (Barit,
2000b, p. 5).

Ranganathan (1967) estableci cinco categoras fundamentales que denomin


personalidad, materia, energa, espacio y tiempo (PMEST). Para este autor, las
cinco categoras, en ese orden estricto, podan ser aplicadas a todos los dominios.
Por el contrario, el CRG postul que las categoras a emplear deben surgir del
anlisis del propio dominio, con lo cual pueden o no coincidir de un dominio a otro
(Mills, 1960, 2004; Spiteri, 1998; Vickery, 1960a). No obstante, se reconoce que
ciertas categoras aparecen frecuentemente. Aitchison et al. (2000) las resumen
como sigue:

a) Entidades, cosas, objetos


(por caractersticas)
Entidades abstractas, por ejemplo; ideas, disciplinas, fundamentos
127

Entidades naturales, por ejemplo: radiacin, nubes, ros


Entidades vivas, organismos, por ejemplo: bacterias, virus, mamferos
Artefactos, por ejemplo: manufacturas, obras de arte
Atributos, propiedades, cualidades, estados, condiciones, por ejemplo:
temperatura, color, confiabilidad, tamao
Sustancias materiales, sustancias componentes, por ejemplo: minerales,
madera, cuero, plsticos, drogas
Partes, componentes, por ejemplo: partes del cuerpo, techos, pisos
Entidades completas, entidades complejas, por ejemplo: motores de
vehculos, barcos, edificios, escuelas
(por funciones)
Agentes (individuos, personal, organizaciones que realizan una accin),
por ejemplo: artistas, marineros, mdicos, asociaciones profesionales
Agentes (equipamiento, aparatos que realizan una accin), por ejemplo:
herramientas, computadoras, respiradores, lavavajillas.
Pacientes

(receptores

de

una

accin),

por

ejemplo:

vctimas,

beneficiarios, audiencias
Productos finales, por ejemplo: alimentos, residuos, resultados de la
investigacin

b) Acciones, actividades
Procesos

funciones,

por

ejemplo:

desarrollo,

enfermedades,

pensamiento, caminata
Operaciones, por ejemplo: enseanza, curacin, gerenciamiento

c) Espacio
Espacio geopoltico, por ejemplo: pases, provincias, ciudades
Espacio geofsico, por ejemplo: ros, montaas, islas

d) Tiempo
Perodos de duracin, por ejemplo: siglos, dcadas, aos.

Recurrimos ahora a un ejemplo que nos permita explicar mejor el anlisis de


facetas. Supongamos que el dominio del tesauro es Bibliotecologa y que hemos
analizado las fuentes pertinente para lograr el principio de garanta. Tambin
hemos identificado y definido algunos conceptos relevantes, que hemos designado
con ciertos trminos. Controlamos ese vocabulario inicial y obtuvimos los siguientes
trminos preferentes, que son nuestros aislados.

128

bibliotecarios
DEF Profesionales que ejercen la bibliotecologa.

bibliotecas
DEF Instituciones que se caracterizan por desarrollar una coleccin
de documentos, organizar esa coleccin y prestar servicios a una
comunidad de usuarios. Cuenta para esto con el aporte de personal
directivo, profesional y auxiliar.

catalogadores
DEF

Bibliotecarios

que

se

especializan

en

el

proceso

de

catalogacin.

directivos
DEF Miembros del personal que cumplen la funcin de dirigir la
biblioteca.

empleados
DEF Miembros del personal que cumplen una funcin auxiliar en la
biblioteca.

informticos
DEF Profesionales que ejercen la informtica.

licenciados
DEF Profesionales que poseen el grado acadmico de Licenciado.

magisters
DEF Profesionales que poseen el grado acadmico de Magister.

personal
DEF

Conjunto

de

personas

que

cumplen

alguna

funcin

en

la

biblioteca.

procesos
DEF

Conjunto

de

actividades

transformadoras

que

convierten

entrada (recursos) en una salida (producto, servicio).

profesionales
129

una

DEF Miembros del personal de la biblioteca cuya funcin requiere el


ejercicio de una profesin universitaria.

recursos
DEF Conjunto de bienes materiales, financieros y tecnolgicos con
que cuenta la biblioteca para alcanzar sus objetivos y producir sus
servicios.

referencistas
DEF Bibliotecarios que se especializan en el proceso de referencia.

servicios
DEF Productos de la biblioteca que dan respuesta a las necesidades
de los usuarios y que son el resultado de los procesos.

usuarios
DEF

Personas

organizaciones

que

demandan

servicios

de

la

biblioteca.

Ahora bien, al analizar estos conceptos en relacin a las categoras notamos


varias cosas:
El aislado bibliotecas corresponde a la categora [entidades complejas], ya
que se trata de una institucin que consta de numerosos elementos (personas,
bienes, ideas etc.) que deben funcionar en conjunto para el logro de los objetivos.
Los aislados bibliotecarios, catalogadores, referencistas, directivos,
empleados,

informticos,

licenciados,

magisters,

personal

profesionales corresponden a las personas que cumplen funciones en la biblioteca,


es decir que llevan a cabo una accin. Pertenecen por eso a la categora [agentes].
Notamos tambin que catalogadores y referencistas comparten el atributo
de ser bibliotecarios. Por su parte bibliotecarios, informticos, licenciados
y

magisters

son

profesionales.

Adems

profesionales,

directivos

empleados son miembros del personal. A su vez, personal es el aislado ms amplio


o genrico dentro de la categora [agentes].
El aislado usuarios se refiere a las personas u organizaciones que reciben las
acciones realizadas por los agentes. Pertenecen entonces a la categora [pacientes].
El aislado procesos es un conjunto de actividades y por ende pertenece a la
categora [acciones].
El aislado recursos pertenece a la categora [materiales].
El aislado servicios pertenece a la categora [producto final].
130

Lo que hemos hecho es categorizar, dentro del dominio Bibliotecologa, un


conjunto de aislados previamente seleccionados y controlados, que ya han sido
aceptados con sus respectivos trminos preferentes y definiciones.
El esquema resultante de esta primera etapa del anlisis de facetas puede
observarse en la Figura 9.1. Las facetas de primer nivel constituyen los trminos
tope de las relaciones jerrquicas del tesauro.

Figura 9.1. Dominio, categoras y facetas. Esquema que muestra el dominio


(bibliotecologa), las categoras por las que se ha analizado ese dominio y las
facetas resultantes, que constituyen el primer nivel del orden sistemtico.
Ntese que las categoras se indican entre corchetes y con letra cursiva.

Una faceta se define como el total de subclases que resulta de la aplicacin de


una nica caracterstica (Mills, 1960, p. 8). O tambin: conjunto total de
subdivisiones de un concepto o clase, derivadas del mismo principio de divisin
(Barit et al., 2013).

9.2.3 Subfacetas y focos

Seguimos ahora con los dems aislados de la categora [agentes]. Encontramos


que tres de ellos directivos,

profesionales

y empleados comparten el

atributo de ser miembros del personal y por lo tanto podran constituir una
subfaceta de la faceta personal. Por otro lado, los tres conceptos se diferencian
entre s por la funcin que cumplen, y tomaremos este atributo como la
caracterstica de divisin [por funcin] (Figura 9.2).

131

Figura 9.2. Faceta, caracterstica de divisin y subfacetas. Esquema que


muestra una faceta (personal), una caracterstica de divisin [por funcin] y
una subfaceta de tres focos (directivos, profesionales, empleados). Ntese
que la caracterstica de divisin tambin se indica entre corchetes y letra
cursiva, pero a diferencia de la categora, se le antepone la preposicin por.

Podemos definir ahora tres elementos del anlisis de facetas: atributo,


caracterstica de divisin y subfaceta.
Un atributo es una cualidad presente en un objeto. Algunos atributos permiten
dividir un concepto y otros no. Ranganathan (1967) utiliz el siguiente ejemplo: la
posesin del rostro es un atributo de los seres humanos, pero no permite la divisin
porque todos poseemos un rostro, por lo tanto es un atributo que no sirve para
obtener conceptos ms especficos. En cambio, el sexo, la edad, la estatura, el color
del cabello son atributos que s permiten la divisin en conceptos ms especficos
como varn y mujer, jvenes y viejos, altos y bajos, rubios y morenos. El atributo
de un concepto, elegido para obtener conceptos ms especficos, es una
caracterstica de divisin (Ranganathan, 1967; ISO, 2011) o principio de divisin
(Mills, 1960).
Una subfaceta se define como una serie de subclases derivadas de una clase
superior por la aplicacin de una nica caracterstica (Vickery, 1960a, p. 39). Se
trata en definitiva del conjunto de focos que resultan de la aplicacin de una nica
caracterstica de divisin. Ranganathan llam a esto array, mientras que el CRG
prefiri subfacet. En espaol se ha traducido como hilera, serie, rango o subfaceta,
que preferimos aqu (Barit et al., 2013; Mills, 1960, 2004; Vickery, 1960a). Todos
los focos de una subfaceta tienen el mismo nivel jerrquico, por eso la norma ISO
25964, refirindose especficamente al tesauro, denomina a los focos de una misma
subfaceta trminos hermanos y define subfaceta como el conjunto de trminos
hermanos (ISO, 2011, p. 1).
Continuamos analizando dos aislados ms: bibliotecarios e informticos.
Ambos comparten el atributo de ser profesionales, pero se diferencian por la

132

profesin que ejercen. Entonces, [por profesin] ser la caracterstica de divisin


usada para ubicarlos en el esquema. Obtendremos as una subfaceta de tercer nivel
(Figura 9.3).
Sin embargo, tambin encontramos otros dos aislados licenciados

magisters cuyas definiciones claramente establecen que son profesionales, pero


se distinguen uno de otro por el grado acadmico. Entonces tenemos otra
caracterstica de divisin [por grado acadmico] que aplicamos tambin a
profesionales y obtenemos otra subfaceta de tercer nivel, distinta a la del prrafo
anterior (Figura 9.3).
Es decir, se pueden aplicar una o ms caractersticas de divisin a un mismo
concepto, siempre y cuando cada una de ellas produzca una subfaceta con focos
homogneos y mutuamente excluyentes.

Figura 9.3. Subfacetas de segundo, tercero y cuarto nivel. Los aislados


referidos a los distintos profesionales han sido organizados por dos
caracterstica de divisin: [por profesin] y [por grado acadmico], que
resultan en dos subfacetas de tercer nivel. A su vez los aislados referidos a
los

distintos

tipos

de

bibliotecarios

han

sido

organizados

segn

la

caracterstica de divisin [por especialidad] para obtener una subfaceta de


cuarto nivel.

Tomemos ahora los aislados catalogadores y referencistas. De acuerdo con


su definicin, comparten el atributo de ser bibliotecarios y se diferencian por su
especialidad. La caracterstica de divisin ser [por especialidad]. El resultado es
una subfaceta de cuarto nivel, que tambin se muestra en la Figura 9.3.
Una subfaceta debe incluir todos los focos que derivan de la caracterstica de
divisin. Para agotar la divisin, en un sistema de clasificacin generalmente se
utiliza una clase residual otros. Pero en un tesauro no puede haber un trmino
preferente otros. Algunas veces, como afirma Mills (2004) se recurre a conceptos

133

expresados por una frase negativa. Por ejemplo, si al trmino preferente bebidas
se le aplica la caracterstica de divisin [por contenido de alcohol] se obtendrn los
trminos preferentes bebidas alcohlicas y bebidas no alcohlicas. Este
ltimo concepto estara incluyendo todos los tipos de bebidas que no son
alcohlicas y con esto el nivel de exhaustividad de la subfaceta estara completo.
Se procede igual con todos los aislados, es decir con todos los conceptos
designados por trminos preferentes o formas autorizadas del nombre.

9.2.4 La cadena y las relaciones jerrquicas

Observemos ahora la Figura 9.4, donde se muestran todos los niveles del
esquema referido al ejemplo.

Figura 9.4. Cadena. Esquema que muestra el dominio y las facetas y


subfacetas, hasta el cuarto nivel. Se distinguen dos cadenas completas: a)
personal,

profesionales,

bibliotecarios,

catalogadores

2)

personal,

profesionales, bibliotecarios y referencistas.

Los trminos preferentes personal,

profesionales,

bibliotecarios

catalogadores forman una cadena. Los conceptos personal, profesionales,


bibliotecarios y referencistas forman otra cadena. Entonces, podemos decir
que una cadena es un conjunto de focos subordinados, derivados de la aplicacin
de distintas caractersticas de divisin. De acuerdo con Barit et al., una cadena es:

134

Serie jerrquica de trminos de extensin decreciente e intensin creciente derivada


por subdivisiones sucesivas, producto de la aplicacin de caractersticas cada vez
ms especficas. El trmino que se ubica en el extremo cenital de una cadena se
llama summun genus y corresponde al trmino tope de un tesauro o a la clase de un
sistema de clasificacin. Lo que caracteriza a una cadena es que todos sus trminos
sin excepcin, estn en relacin jerrquica unos respecto de otros (Barit et al.,
2013, en lnea).

En la seccin sistemtica de un tesauro, las cadenas de la Figura 9.4 se


indicaran como sigue (tngase en cuenta que slo se ha desarrollado la categora
[agentes]:

[agentes]

[pacientes]

personal

usuarios

[por funcin]

[materiales]

directivos

recursos

profesionales

[acciones]

[por profesin]

procesos

bibliotecarios

[producto final]
servicios

[por especialidad]
catalogadores
referencistas
informticos
[por grado acadmico]
licenciados
magisters
empleados

En una cadena no se pueden saltar los conceptos de nivel intermedio. Por


ejemplo:

Cadena incorrecta:

Cadena correcta:

sistema circulatorio

sistema circulatorio

aurculas

corazn

ventrculos

aurculas
ventrculos

135

9.2.5 Etiqueta de nodo

Como se puede observar en las figuras 9.1 a 9.4, se han indicado entre
corchetes tanto las categoras como las caractersticas de divisin. La norma ISO
25964 llama a esta indicacin node label que se ha traducido al espaol como
indicador clasificatorio (AENOR, 1990) y tambin como etiqueta de nodo (ICONTEC,
1998). El Subcomit de Documentacin del IRAM adopt etiqueta de nodo para la
norma IRAM-ISO 26954-1, cuya preparacin se encuentra en curso.
El trmino etiqueta de nodo se define como una etiqueta que se inserta en el
orden sistemtico para mostrar cmo han sido ordenados los trminos (ISO,
2011, p. 7).
La etiqueta de nodo de la categora se escribe entre corchetes y con letra
cursiva, mientras que la etiqueta de nodo de la caracterstica de divisin se escribe
entre corchetes, con letra cursiva y anteponiendo la preposicin por, como se
puede observar en las figuras 9.1 a 9.4.

9.2.6 El orden de archivo u orden de intercalacin

La metodologa del anlisis de facetas fue creada inicialmente para los sistemas
de clasificacin y, en ese caso, deben completarse dos etapas ms: a) la definicin
del orden de cita u orden de mencin y b) la definicin del orden de intercalacin.
En un tesauro no se requiere un orden de mencin porque es un SOC
poscoordinado. Sin embargo, se debe prestar atencin al orden de intercalacin. De
acuerdo con Mills (1960; 2004) el orden de intercalacin tiene dos componentes:

Orden de las facetas y las subfacetas: es la sucesin en que las facetas y las
subfacetas (cada una de ellas considerada como un bloque) se ordenan una
tras otra. Este orden se basa en el principio de extensin decreciente, o
dicho de otra forma de lo general a lo particular.

Orden de los focos en una subfaceta: se basa en el principio de secuencia


til de Ranganathan, que se explica en el Apartado 9.3, inciso o).

9.3 Notacin
La notacin es un conjunto de smbolos que representan un concepto en
algunos SOC, especialmente en los sistemas de clasificacin (ISO, 2011). Los
smbolos pueden ser letras, nmeros, signos de puntuacin o una combinacin de
todos stos.
En un tesauro, la notacin puede servir para dos cosas:
136

Mecanizacin: dado que la notacin tiene un valor ordinal, facilita la


organizacin de los conceptos del orden sistemtico por medio de un
programa informtico.

Nexo: en los tesauros impresos la notacin sirve de nexo entre la seccin


alfabtica y la seccin sistemtica. En los tesauros en lnea esta funcin no
es necesaria, dado que todos los trminos preferentes y las formas
autorizadas del nombre deben estar hipervinculados, de tal manera que un
simple clic del mouse remita del orden alfabtico al sistemtico.

La notacin debe reunir ciertas cualidades que describe Foskett (1996):

Unicidad: cada notacin debe representar un concepto y solo uno, evitando


la sinonimia y la homonimia.

Simplicidad: la notacin debe ser fcil de comprender, usar y recordar.

Brevedad: la notacin debe ser breve. Para ello es necesario que la notacin
de base, es decir la notacin que corresponde a las facetas de primer nivel,
sea lo ms corta posible. Una decisin que debe tomarse es si conviene usar
nmeros o letras para la notacin. Si se opta por los nmeros, una base de
un dgito podr albergar hasta 10 facetas (del 0 al 9). Para extenderla, sera
necesario recurrir a una base de dos dgitos (del 00 al 99) o de tres dgitos
(del 000 al 999), lo cual puede producir notaciones muy extensas. Si se opta
por letras, la base de una sola letra podra albergar hasta 26 facetas y sera
ms fcil mantener una notacin breve.

Hospitalidad: el sistema de notacin debe permitir que en el futuro los


nuevos conceptos sean acomodados en facetas, subfacetas o focos, sin
alterar las notaciones existentes.

Expresividad: la notacin debe evidenciar el orden sistemtico del tesauro.

Segn los smbolos utilizados, la notacin puede ser de dos tipos (Gil Urdiciain,
2004):

Notacin pura: utiliza un solo tipo de smbolo, por ejemplo solo nmeros o
solo letras.

Notacin mixta: utiliza una combinacin de smbolos, por ejemplo letras y


nmeros, o letras maysculas y letras minsculas.

Respecto al orden, tambin hay dos tipos de notacin (Vickery, 1960a):

Notacin jerrquica: indica claramente el orden del esquema de lo general a


lo particular. Tiene la ventaja de ser expresiva, pero tambin tiene la
desventaja de perder brevedad.

Notacin ordinal: ordena los conceptos en el esquema, pero no hace


evidente las jerarquas. No es expresiva, pero ayuda a mantener la
brevedad.

137

En la Tabla 9.1 se compara un ejemplo de notacin ordinal con otro de notacin


jerrquica. Ntese que ambos tipos de notacin expresan el orden del esquema,
pero mientras que en la notacin jerrquica es fcil de reconocer (la notacin ms
corta representa un concepto ms general y la notacin ms larga representa un
concepto ms especfico), en la notacin ordinal no es posible distinguir qu
conceptos estn subordinados a otros.

Tabla 9.1. Comparacin de una notacin ordinal y una jerrquica

9.4 Principios del anlisis de facetas


Como se mencion anteriormente, la metodologa del anlisis de facetas
procede de dos fuentes: Ranganathan y el CRG. Ambos han aportado numerosos
principios que deben observarse cuando se intenta aplicar esta metodologa al
desarrollo de un SOC.
Ranganathan postul 46 cnones, 13 postulados y 22 principios que se exponen
en su libro Prolegomena to library classification. Por un lado, algunos de estos
cnones, postulados y principios resultan reiterativos y, por el otro, el estilo de
redaccin de Ranganathan no resulta fcil de leer.
El CRG, si bien se basa en los principios de Ranganathan, tiene sus propios
aportes, particularmente en lo que se refiere a las categoras fundamentales.
Desafortunadamente, el CRG nunca public un texto similar a Prolegomena, que
reuniera la teora del anlisis de facetas segn el enfoque de este grupo. Por el
contrario, los principios se encuentran dispersos en numerosos artculos y otras
fuentes.
Por lo antes expuesto, la profesora canadiense Louise Spiteri propuso
compatibilizar los principios de Ranganathan con los del CRG, para simplificar su

138

explicacin y comprensin. A continuacin se describen los principios del anlisis de


facetas, de acuerdo con el modelo simplificado de Spiteri (1998).
Principios de la caracterstica de divisin:
a. Principio de diferenciacin: una caracterstica de divisin debe generar al
menos dos focos mutuamente excluyentes.
b. Principio de relevancia: una caracterstica de divisin debe ser relevante
para el propsito del tesauro.
c. Principio de averiguabilidad: una caracterstica de divisin debe poderse
averiguar y definir.
d. Principio de permanencia: una caracterstica de divisin debe continuar sin
cambios, mientras no se modifique el esquema.
e. Principio de homogeneidad y exclusin mutua: una caracterstica de divisin
debe producir focos homogneos y mutuamente excluyentes, es decir los
contenidos de un foco no pueden superponerse con los de ningn otro y
cada foco debe proceder de una nica caracterstica de divisin.
f.

Principio

de

las

categoras

fundamentales:

no

existen

categoras

fundamentales para todos los dominios. Las categoras deben basarse en la


naturaleza del dominio a ser analizado.
Principios del orden de las facetas, subfacetas y focos:
g. Principio de sucesin relevante: la sucesin de caractersticas de divisin
debe ser relevante para el propsito del tesauro.
h. Principio de sucesin consistente: la sucesin de caractersticas de divisin
en el esquema debe mantenerse consistentemente, mientras el esquema no
sea modificado.
Principios de la terminologa:
i.

Principio del contexto: la denotacin de un trmino debe estar determinada


por las diferentes facetas, subfacetas y focos, pertenecientes a la misma
cadena del trmino en cuestin.

j.

Principio de actualidad: el trmino usado para designar un foco debe ser de


uso corriente entre los especialistas del dominio del tesauro.

Principios de la notacin:
k. Principio de sinonimia: la notacin debe ser nica; no puede haber dos
notaciones diferentes para un mismo concepto.
l.

Principio de homonimia: el concepto representado por una notacin debe ser


nico; no puede haber dos conceptos representados por la misma notacin.

m. Principio de hospitalidad: el sistema notacional debe permitir la adicin de


nuevas facetas y focos, en cualquier punto del esquema.

139

Principios del orden de clasificacin:


n. Los focos en la cadena deben mostrar una extensin decreciente, de lo
general a lo particular.
o. Los focos en la subfaceta deben ordenarse de acuerdo con alguno de los
criterios de la secuencia til expresados por Ranganathan, entre ellos:
complejidad creciente o decreciente, concrecin creciente o decreciente,
cantidad creciente o decreciente, contigidad espacial (lejana o cercana en
el espacio), orden cronolgico (lejana o cercana en el tiempo), orden
evolutivo (lejana o cercana del origen), orden cannico, etc. De no existir
otro criterio ms conveniente, se puede recurrir al orden alfabtico.

140

Autoevaluacin
a. Qu se entiende por dominio del tesauro?

b. En qu consisten los ejes reas de Modulacin y Grados de Especializacin?


c. Qu es el anlisis de dominio?

d. Qu se entiende por temas marginales?

e. Cules son las etapas del anlisis de facetas?

f.

Qu son las categoras?

g. Cul es la diferencia entre aislado y foco?

h. Qu es una faceta?

i.

Defina atributo, caracterstica de divisin y subfaceta.

j.

Qu es la notacin y para qu sirve en un tesauro?

k. Describa las cualidades que debe poseer la notacin.

l.

Cules son los principios del anlisis de facetas?

141

10. Evaluacin, publicacin y actualizacin del


tesauro

Los procesos finales del diseo y desarrollo de un tesauro son la evaluacin, la


publicacin y la actualizacin. Los explicaremos a continuacin.

10.1 Evaluacin del tesauro


La evaluacin es el proceso de obtener evidencias para juzgar el grado en que
se han alcanzado los objetivos y las metas establecidas. En consecuencia, la
evaluacin del tesauro consiste en obtener evidencias para juzgar en qu grado
cumple con las funciones de indizacin y recuperacin.
Como afirman Owens & Cochrane (2004), la evaluacin de tesauros puede
realizarse por distintos mtodos. Por ejemplo, puede ser evaluado por un experto,
comparado

con

otros

tesauros,

contrastado

con

las

normas,

probado

en

experiencias reales de indizacin y recuperacin, etc. Con distinta terminologa, Gil


Leiva (2008) y Lancaster (2002) reconocen varios tipos de evaluacin de tesauros
que se presentan en la Tabla 10.1.

Tabla 10.1. Mtodos de evaluacin de tesauros

10.1.1 Evaluacin intrnseca cualitativa

La evaluacin intrnseca cualitativa requiere que un experto o un grupo de


expertos revise las caractersticas del tesauro y las contraste contra la norma que
se ha seguido. Esta evaluacin debe determinar si el tesauro consta de una
portada, una introduccin con todos los elementos que se mencionan en el

142

Apartado 10.2.1, si incluye calificadores y notas, si la reciprocidad de las relaciones


es consistente, si las formas gramaticales, la tipografa y las etiquetas utilizadas,
son las recomendadas, etc.

10.1.2 Evaluacin intrnseca cuantitativa

La evaluacin intrnseca cuantitativa o estadstica requiere la aplicacin de


indicadores.
La experiencia ms conocida para la evaluacin de tesauros usando indicadores
es la realizada por el Bureau Marcel Van Dijk (BMD) de Bruselas, que en 1976 llev
a cabo un estudio sobre 10 tesauros monolinges y 10 tesauros multilinges
(Commission des Communauts Europennes, 1976). El BMD propuso varios
indicadores que tambin han sido aplicados por otros autores (lvaro Bermejo et
al., 1989a,b), aunque Lancaster (2002) lleg a la conclusin de que si bien algunos
son ingeniosos, otros resultan triviales e incluso arbitrarios. Por otro lado, hay que
tener en cuenta que el BMD bas su evaluacin en la primera edicin de la norma
ISO 2788:1974 que fue sustituida por una segunda edicin hace casi 30 aos y
recientemente por la norma ISO 25964.
Nosotros hemos propuesto un conjunto de indicadores, basados en las normas
publicadas en este siglo veintiuno. Aunque los indicadores fueron probados en una
muestra de tres tesauros, la intencin ha sido que los mismos sean incorporados al
software

de

gestin,

de

modo

que

puedan

producir informes

estadsticos

automticamente. Los indicadores se describen a continuacin (Martnez Tamayo et


al., 2009, 2011b):
a. Porcentaje de trminos preferentes que designan ms de un concepto, por
ejemplo el trmino preferente nombres y cdigos identificadores de
observacin lgica del Tesauro Spines. Se define como A/B*100, donde
A es el nmero de trminos preferentes que designan ms de un concepto y
B es el nmero total de trminos preferentes. El valor de referencia es 0, ya
que las normas establecen que un trmino preferente debe designar un solo
concepto.
b. Media de palabras por trmino preferente. Se define como A/B, donde A es
el nmero de palabras de los trminos preferentes y B es el nmero total de
trminos

preferentes.

Se

expresa

como

x +DE

(media + un

desvo

estndar). El valor de referencia es 2,0+1,0, es decir un rango promedio


entre 1 y 3 palabras por trmino preferente. Este rango coincide con el
estudio realizado por Gil Leiva & Rodrguez Muoz (1997), quienes para una

143

muestra de 1284 trminos preferentes asignados en bases de datos


cientficas espaolas, identificaron un 86% con una, dos o tres palabras.
c. Porcentaje
especificadas

de

trminos

por

las

preferentes

normas,

por

con

formas

ejemplo

el

gramaticales

trmino

no

preferente

informacin/biblioteca, cooperacin del Tesauro de la Unesco. Se


define como A/B*100, donde A es el nmero de trminos preferentes que
presentan formas gramaticales distintas a las especificadas por la norma y B
es el nmero total de trminos preferentes. El valor de referencia debera
ser 0, pero como tambin aqu las normas admiten excepciones, se debe
asumir

que

mientras

menor

sea

este

porcentaje,

mayor

ser

el

cumplimiento con las recomendaciones de la norma.


d. Porcentaje de trminos preferentes con formas de singular y plural no
recomendados. Se define como A/B*100, donde A es el nmero de trminos
preferentes que presentan formas de singular o plural distintas a las
especificadas por las normas y B es el nmero total de trminos preferentes.
El valor de referencia es 0, ya que en este caso no hay excepciones.
e. Porcentaje

de

trminos

preferentes

que

carecen

de

relacin

jerrquica (trminos hurfanos). Se define como A/B*100, donde A es el


nmero de trminos preferentes que carecen de relacin jerrquica y B es el
nmero total de trminos preferentes. El valor de referencia para este
indicador es 0, ya que todo trmino preferente debe tener al menos una
relacin jerrquica.
f.

Porcentaje de trminos preferentes con dos o ms trminos genricos. Se


define como A/B*100, donde A es la suma de trminos preferentes que
poseen dos o ms TG y B es el nmero total de trminos preferentes. Si se
aplica el concepto de estructura monojerrquica, entonces el valor de
referencia de este indicador es 0, ya que ningn trmino preferente puede
tener

ms

de

un

TG. Si

se

aplica

el

concepto

de

estructura

polijerrquica (vase el Apartado 8.1.4) no hay un valor de referencia, pero


siendo que la norma considera que esta situacin se produce solo en
algunos casos y debe tener slidos fundamentos lgicos, se asume que
mientras menor sea el porcentaje, mayor ser el cumplimiento con la
norma.
g. Porcentaje de trminos preferentes con un solo trmino especfico. Se define
como A/B*100, donde A es el nmero de trminos preferentes que poseen
un solo TE y B es el nmero total de trminos preferentes. El valor de
referencia para este indicador es 0, ya que en un tesauro no puede haber un

144

trmino preferente con un solo TE, segn el principio de diferenciacin


postulado por Ranganathan (vase el Apartado 9.4, inciso a).

10.1.3 Evaluacin extrnseca

Finalmente, para la evaluacin extrnseca que mide el comportamiento del


tesauro en la indizacin y la recuperacin se recomienda lo siguiente:

Prueba de indizacin: consiste en distribuir una edicin preliminar del


tesauro entre un cierto nmero de bibliotecas especializadas, centros de
documentacin u otras instituciones de la BDCI para una experiencia real de
indizacin,

durante

un

perodo

de

varios

meses.

Las

instituciones

participantes deben comunicar todos los errores y fallas que encuentren, as


como las sugerencias que estimen convenientes, tanto del propio tesauro,
como de la interfaz.

Prueba de recuperacin: las mediciones ms conocidas son las tasas de


precisin y de acierto propuestas por Claverdon y Mills (1985). En el
resultado de estas mediciones intervienen distintas variables como la
exhaustividad y la especificidad de la indizacin, la interfaz usuario-sistema,
la experiencia de bsqueda de los usuarios finales, etc., pero tambin
pueden aplicarse especficamente a la evaluacin del tesauro, cuando la
recuperacin se realiza exclusivamente por los trminos preferentes y las
formas autorizadas del nombre (Foskett, 1996; Lancaster, 1995).

La tasa de precisin ha sido incorporada como indicador en la norma IRAM-ISO


11620 (IRAM, 2007). Se define como A/B, donde A es el nmero de documentos
recuperados que son relevantes y B es el nmero total de documentos recuperados
en la bsqueda. Es una medida de la capacidad del sistema de recuperacin para
encontrar un documento, por un punto de acceso determinado, en este caso un
trmino preferente o un forma autorizada del nombre.
La tasa de acierto se define como A/B, donde A es el nmero de documentos
relevantes recuperados y B es el nmero total de documentos relevantes en la base
de datos. Es una medida de la capacidad del sistema de recuperacin para reunir
conjuntos de documentos que respondan a un determinado punto de acceso, por
ejemplo un trmino preferente o un forma autorizada del nombre.
Entre la tasa de precisin y la de acierto existe una relacin inversamente
proporcional, es decir: a mayor precisin, menor acierto y a mayor acierto, menor
precisin. En general, se privilegia la precisin.

145

Los tipos de evaluacin que se han mencionado, no son excluyentes, sino


complementarios, es decir se pueden aplicar todos o algunos al mismo tesauro y de
hecho conviene que as se haga.

10.1.4 Cundo realizar la evaluacin

Hay dos momentos en los que se debe evaluar el tesauro por parte del equipo
de trabajo responsable de su diseo y desarrollo:

Una primera evaluacin, antes de publicar la primera edicin, como se indic


ms arriba.

Peridicamente para su actualizacin, teniendo en cuenta adems las


sugerencias, comentarios y quejas que los indizadores y los usuarios finales
hayan hecho llegar.

Los mtodos de evaluacin sugeridos aqu tambin se pueden aplicar a un


tesauro cuando se necesita considerar su adquisicin, pero esta evaluacin
obviamente es realizada por terceros. Resulta muy til que quienes realizan este
tipo de evaluaciones hagan conocer los resultados a los miembros del equipo de
trabajo responsable del tesauro.

10.2 Publicacin del tesauro


La publicacin del tesauro puede ser impresa o digital. Hasta hace algunos aos,
la mayora de los tesauros se publicaban impresos en papel, pero en la actualidad
se cuenta con numerosos tesauros digitales, muchos de ellos disponibles en la Web.
La tendencia, por supuesto, es propiciar la incorporacin de tesauros en lnea y que
sta sea la forma de publicacin habitual. La norma ISO 25964 refleja esta
tendencia, en contraposicin con las normas anteriores que ponan el nfasis en la
publicacin impresa (ISO, 2011).
Cualquiera sea el tipo de publicacin, los componentes del tesauro son:

Portada o pgina de inicio: identifica al tesauro con la mencin del ttulo, los
nombres de los creadores y colaboradores, el nmero de edicin, la
editorial, el lugar y la fecha de publicacin, el ISBN, DOI, etc.

Tabla de contenido: debe enumerar todas las secciones del tesauro y remitir
a stas mediante hipervnculos. Si el tesauro est disponible en la Web, la
tabla de contenido puede presentarse en una tabla lateral o en solapas.

Introduccin: debe brindar, tanto al indizador como al usuario final, la


informacin que se detalla en el Apartado 10.2.1.

146

Seccin sistemtica: como su nombre lo indica, despliega el orden


sistemtico del tesauro. Debe estar hipervinculada con la seccin alfabtica.

Seccin alfabtica: muestra los trminos preferentes y no preferentes, as


como las formas autorizadas y variantes del nombre, en una secuencia
alfabtica. Debe estar hipervinculada con la seccin sistemtica.

10.2.1 Introduccin del tesauro

La introduccin del tesauro tiene como propsito informar, tanto al indizador


como al usuario final, los aspectos que se mencionan a continuacin, en lo posible
con abundantes ejemplos ilustrativos:

El dominio del tesauro, su alcance y los temas marginales. Conviene


mencionar a qu tipo de institucin, usuarios finales y documentos est
destinado el tesauro.

Los idiomas en que se presenta el tesauro.

Indicacin de la norma que se ha seguido para desarrollar el tesauro.

El significado de todas las convenciones, abreviaturas, etiquetas y signos de


puntuacin empleados en el tesauro.

El nmero de trminos y nombres propios, discriminados por trminos


preferentes y no preferentes, formas autorizadas y variantes.

La fecha de incorporacin del ltimo trmino o nombre propio.

Las reglas o criterios empleados en la seleccin de los conceptos, la


seleccin y redaccin de los trminos y nombres propios.

La poltica de actualizacin, incluyendo la frecuencia, las fechas y los


procedimientos pertinentes, as como el nombre y domicilio del responsable
a donde deben enviarse los comentarios y sugerencias.

Referencias a las fuentes utilizadas en la compilacin del tesauro, as como


los agradecimientos a las personas y organizaciones, ajenas al equipo
multidisciplinario, que han colaborado con el tesauro. En este sentido, es
necesario contar con el permiso escrito de las personas u organizaciones a
mencionar en tales agradecimientos.

10.2.2 Registros individuales de trminos y nombres propios

Para cada trmino preferente o forma autorizada del nombre se debe generar
un registro individual, que debe mostrar los siguientes datos en el mismo orden que
se presenta:

147

trmino preferente o forma autorizada del nombre


CC Notacin o cdigo de clasificacin
NA Nota de alcance
UP trmino no preferente
TT trmino tope
TG trmino genrico
TE trmino especfico
TR trmino relacionado
DEF Nota de definicin
NH Nota histrica
CM Categora a la que se asigna el concepto

Tomando nuevamente el ejemplo del Captulo 9, se tendra:

profesionales
CC 220
NA sese

para

obras

que

tratan

sobre

los

profesionales

universitarios en general. Para obras sobre los profesionales que


ejercen una profesin especfica, use el trmino que designe esa
profesin, por ejemplo bibliotecarios, informticos.
UP profesionistas
TT personal
TG personal
TE bibliotecarios
TE informticos
TE licenciados
TE magisters
DEF Miembros del personal de la biblioteca, cuya funcin requiere
del ejercicio de una profesin universitaria.
NH Incorporado el 30-11-2011.
CM Agentes

Por otra parte, el tesauro debe desplegar tambin las relaciones de equivalencia
desde un trmino no preferente o una forma variante del nombre al respectivo
trmino preferente o forma autorizada del nombre. Por ejemplo:

Profesionistas

Drabenstott, Karen

USE profesionales

USE Markey, Karen

148

10.2.3 Tipografa

Existe cierta libertad en cuanto a la tipografa que debe emplearse, pero se


recomienda diferenciar claramente los trminos preferentes de los no preferentes y
las formas autorizadas del nombre de sus formas variantes. No obstante, la norma
ISO 25964 sugiere las siguientes pautas (vanse los ejemplos del Apartado
10.2.2):

El trmino preferente y la forma autorizada del nombre se deben escribir


con letra regular (ni cursiva, ni negrita).

El trmino no preferente y la forma variante del nombre se escriben con


letra cursiva.

Las etiquetas de las relaciones (USE/UP, TG/TE, TR/TR) de las notas, de la


notacin y de la categora de materia, se indican en mayscula compacta y
negrita.

La etiqueta de nodo, como ya se mencion, se indica en letra cursiva y entre


corchetes. Cuando se refiere a la caracterstica de divisin, se antepone la
preposicin por. No as cuando se trata de la categora. Por ejemplo:

Categora:

[agentes]

Caracterstica:

[por funcin]

Los trminos preferentes y no preferentes se escriben en minsculas,


incluyendo su letra inicial. Se exceptan aquellos casos que incluyen
obligatoriamente una letra mayscula. Por ejemplo:

bilogos
D-alanina transaminasa
novelas policiales
pH

En las formas autorizadas y variantes del nombre se usar mayscula solo


para las letras iniciales como indica la gramtica espaola, el resto de las
letras en minscula.

Misiones (Argentina)
Torre Nilsson, Leopoldo, 1924-1978
Universidad de Buenos Aires

149

No conviene usar las maysculas compactas o en bloc para resaltar el


trmino preferente o la forma autorizada del nombre, porque dificultan la
lectura, por ejemplo:

plaguicidas y no PLAGUICIDAS

Las siglas se exceptan de la instruccin anterior, ya que deben escribirse


en mayscula compacta y sin punto, de modo que puedan recuperarse como
una palabra:

CONICET
SIDA
UNESCO

Cuando los trminos van acompaados de nmeros, letras griegas o signos


de puntuacin, stos deben respetarse. Las letras griegas se escriben como
una palabra para facilitar la indizacin y la recuperacin. Por ejemplo:

cadena beta de alfa-cristalina


molcula 1 de adhesin intercelular
N-acetil muramoil-L-alanina amidasa
receptor erbB-3
xilano endo-1,3-beta-xilosidasa

10.2.4 Secciones sistemtica y alfabtica

En

la

Figura

10.1

se

muestra

un

ejemplo

de

la

seccin

sistemtica

correspondiente al ejemplo que hemos venido desarrollando.


La seccin sistemtica no requiere indicar las relaciones de equivalencia o las
relaciones asociativas, sino solamente el orden sistemtico completo que incluye las
relaciones jerrquicas entre trminos preferentes o entre stos y las formas
autorizadas de los nombres (Aitchison et al., 2000; Gil Urdiciain, 2004; Naumis
Pea, 2008; ISO, 2011; Lancaster, 2002).

150

Figura 10.1. Ejemplo de la seccin sistemtica del tesauro. La jerarqua se


muestra con TE1, TE2, TE3. Adems cada nivel de la jerarqua se puede
expandir [+] o contraer [-]. La interfaz corresponde al software TemaTres.

Una forma novedosa de presentar la seccin sistemtica del tesauro es a travs


de un mapa de tpicos como el que se muestra en la Figura 10.2.

Figura 10.2. Orden sistemtico en forma de mapa de tpicos. Al marcar una


etiqueta se abren los trminos ms especficos

Consulte la versin

interactiva en http://highwire.stanford.edu/htj/HWTree.html?catid=0.

151

Por otra parte, es conveniente que cuando se despliegue el registro individual


de un trmino preferente o forma autorizada del nombre, se muestre tambin la
cadena jerrquica, como se muestra en la Figura 10.3.
Por su parte, la seccin alfabtica, como su nombre lo indica, muestra los
trminos preferentes y no preferentes, ms las formas autorizadas y variantes de
los nombres, siguiendo la secuencia alfabtica. Bajo cada trmino preferente o cada
forma autorizada del nombre se debe desplegar toda la informacin incluida en el
registro individual, como se mencion en el Apartado 10.2.2. A su vez, bajo cada
trmino no preferente y cada forma variante del nombre debe aparecer el reenvo
al trmino preferente o a la forma autorizada del nombre que corresponda.
No est de ms reiterar que todos los trminos preferentes y las formas
autorizadas del nombre deben estar hipervinculados con sus correspondientes
trminos no preferentes y formas variantes del nombre, as como con sus
respectivos trminos genricos, especficos y relacionados.

Figura 10.3. Ejemplo de registro individual de un trmino preferente. La


flecha indica la cadena Inicio

personal

profesionales

bibliotecarios

catalogadores. Esta cadena pertenece a la faceta personal. Ntese tambin


la nota de alcance, el trmino genrico y el trmino relacionado. La interfaz
corresponde al software TemaTres.

Un tesauro debe vincular la parte alfabtica con la sistemtica, de modo que


tanto el indizador como el usuario final puedan comprobar qu lugar ocupa un
152

trmino o un nombre propio en el sistema de conceptos representado en el tesauro.


En un tesauro impreso era obligatorio que cada trmino preferente o cada forma
autorizada del nombre tuvieran una notacin, porque sta serva de nexo entre
ambas secciones. En cambio, en un tesauro electrnico el nexo entre las dos
secciones est dado por los hipervnculos o enlaces correspondientes.
Por otro lado, algunos tesauros impresos incluan un ndice permutado para
facilitar la bsqueda de un trmino o nombre propio particular. En un tesauro
digital esto tampoco es necesario, porque se sustituye por el casillero de bsqueda,
que puede localizar cualquier palabra, sin importar si se trata de la primera palabra
o alguna posterior.
En el Apndice B de este captulo se muestran varios ejemplos de tesauros
electrnicos.

10.3 Actualizacin del tesauro


Como ya se mencion, el tesauro necesita una revisin permanente de los
trminos y nombres propios y del ajuste correspondiente de las relaciones y la
ubicacin en el orden sistemtico, con el fin de agregar nuevos trminos, eliminar
los trminos obsoletos y modificar los trminos que exijan determinados cambios,
segn sea necesario.
El tesauro digital y en lnea tiene la gran ventaja de que las actualizaciones
pueden estar disponibles en forma inmediata para indizadores y usuarios finales, o
al menos acortar los tiempos de actualizacin.
Es de gran utilidad para el equipo de trabajo ofrecer la posibilidad, tanto a los
indizadores como a los usuarios finales que utilicen el tesauro, de enviar sus
crticas, comentarios o sugerencias, para lo cual se puede incluir un formulario
especial. De esta manera, se contar con un valioso aporte para la futura
actualizacin.
El equipo de trabajo debe mantenerse activo, ms all de la publicacin de la
primera edicin para actualizarla peridicamente.

153

Autoevaluacin
a. En qu consiste la evaluacin del tesauro?

b. Explique los tipos de evaluacin que se han descripto para el tesauro.

c. En qu momento debe evaluarse el tesauro?

d. Qu secciones debe contener un tesauro?

e. Indique los aspectos que no deben faltar en la introduccin de un tesauro.

f.

Qu tipografa sugiere la norma de tesauros para los trminos, nombres


propios y etiquetas de relacin?

g. Qu informacin debe presentarse bajo un trmino preferente o una forma


autorizada del nombre?

h. Qu informacin se incluye en la seccin alfabtica del tesauro?

i.

Qu informacin se incluye en la seccin sistemtica del tesauro?

154

Apndice B: Ejemplos de tesauros electrnicos

Figura B1. Interfaz de bsqueda del tesauro Agrovoc. El tesauro es publicado por la
Organizacin de las Naciones Unidas para la Alimentacin y la Agricultura. Ntese el carcter
multilinge del tesauro, que obliga a marcar el idioma (Spanish). Tambin puede elegirse el
tipo de trmino que se desea buscar (todos los trminos, acrnimos, compuestos qumicos,
nombres comunes de animales y bacterias, etc.). Se puede buscar por los trminos en uso o
por aquellos que han sido eliminados. Permite elegir si la expresin de bsqueda utilizada es
la palabra inicial, final, contenida en el texto o exacta. Finalmente se encuentra el casillero
de

bsqueda

en

el

que

se

ha

indicado

maz,

(http://aims.fao.org/standards/agrovoc/functionalities/search).

155

como

trmino

buscar.

Figura B2. Lista alfabtica de trminos del tesauro Agrovoc que incluyen la palabra maz.
Ntese lo siguiente: a) en la primera columna aparece el cdigo o notacin de cada trmino,
b) en la segunda columna los trminos ordenados alfabticamente, c) en la tercera columna
el status del trmino (descriptor o no descriptor) y en la cuarta columna aparecen dos
opciones: el botn + permite ver el registro individual del trmino preferente, mientras que
el botn E remite al orden sistemtico. Los trminos descriptor y no descriptor, de larga
historia, se encuentran muy difundidos. Sin embargo, la norma ISO 25964 ha considerado
ms adecuados trmino preferente y trmino no preferente, respectivamente.

156

Figura B3. Registro individual de un trmino preferente en el tesauro Agrovoc. En la parte


superior aparece el trmino preferente en espaol Maz (ES), a continuacin el status
indicando que se trata de un descriptor o trmino preferente, no tiene nota de alcance (SN)
y las notas histricas indican la fecha de alta y la ltima modificacin, que en este caso
coinciden. Luego se despliegan todas las relaciones: a) UF (used for) para la relacin de
equivalencia, con la aclaracin de que no hay equivalencias en espaol; b) BT (broader term
o trmino genrico) que en este caso es Cereales (ES); c) luego aparecen varios NT
(narrower terms o trminos especficos) y finalmente los RT (related terms o trminos
relacionados). No hay descripciones adicionales para este trmino preferente, pero podra
haberlas para otros trminos.

157

Figura B4. Despliegue del orden sistemtico del tesauro Agrovoc. Hacia arriba del trmino
preferente Maz se incluye el trmino genrico inmediato, en este caso Cereales (ES), y los
trminos superiores a ste. Cada punto indica un nivel ms alto de especificidad en el orden
sistemtico. Por debajo del trmino preferente Maiz se incluyen los trminos especficos (NT)
y relacionados (RT). Los trminos genricos y especficos ofrecen la posibilidad de marcar el
botn E para continuar navegando por el orden sistemtico, o bien la opcin + para ir
directamente al registro individual del trmino.

158

Figura B5. Interfaz de bsqueda del tesauro Spines. Este tesauro ha sido elaborado por la
Unesco y su versin en lnea y en espaol es gestionada por el Instituto de Estudios
Documentales sobre Ciencia y Tecnologa del Consejo Superior de Investigaciones Cientficas
de Espaa. Como se puede apreciar, cuenta con un casillero de bsqueda para localizar el
trmino que interesa al usuario. Tambin se pueden marcar, en las pestaas que aparecen
en la parte superior de la interfaz, tanto la seccin alfabtica como la seccin sistemtica o
jerrquica. (http://thes.cindoc.csic.es/buscar_form_esp.php?thes=SPIN).

159

Figura B6. Seccin sistemtica del tesauro Spines. Se puede navegar a travs del orden
sistemtico del tesauro abriendo o cerrando los botones + o -. As, la faceta de primer nivel
Economa.

Desarrollo

econmico

social puede abrirse en un segundo nivel de

especificidad que incluye, entre otros, el trmino preferente Desarrollo. Este a su vez
puede abirse en un tercer nivel de especificidad en el que se encuentra Desarrollo
industrial. Finalmente, ste se abre en un cuarto y ltimo nivel que incluye dos trminos
preferentes: Cambio

interindustrial e Industrializacin. No todas las jerarquas

cuentan con cuatro niveles, ya que puede haber algunas con menos o ms niveles de
especifidad. Un clic en cualquiera de los trminos remite al registro individual del trmino
preferente.

160

Figura B7. Seccin alfabtica del tesauro Spines. Ntese en la parte superior el ndice A/Z. La
lista muestra una parte de la pgina 10 de la letra D, en la que se encuentra el trmino
preferente Desarrollo industrial. Los trminos en negrita son los preferentes, mientras
que los no preferentes se indican en letra cursiva. Tambin aqu un clic en cualquiera de los
trminos remite al registro individual del trmino preferente.

161

Figura B8. Registro individual de un trmino preferente en el tesauro Spines. El trmino


preferente Desarrollo industrial se resalta en color azul. Se incluye un trmino genrico
(TG) y dos trminos especficos (TE), as como numerosos trminos relacionados (TR).
Aunque no han sido necesarios en este caso, el tesauro tambin muestra las notas de
alcance (NA) y los trminos equivalentes (UP). Por ltimo reenva a los equivalentes en
ingls y francs, ya que se trata de un tesauro multilinge.

162

Figura B9. Interfaz del Tesauro de OIT. Este tesauro es gestionado por la Organizacin
Internacional del Trabajo. Ntese el ndice A/Z que constituye la seccin alfabtica del
tesauro. Debajo de este ndice, aparecen tres opciones: trminos tope, trminos hurfanos
(que no deberan existir) y las categoras por las que se ha analizado el dominio. El tesauro
es multilinge, de modo que en el casillero de bsqueda se ha indicado el idioma para buscar
el trmino Bibliotecario. Ms abajo se puede ver la leyenda Resultados de bsqueda para
Bibliotecario bajo la cual se puede acceder al hipervnculo correspondiente al trmino
preferente (http://www.ilo.org/thesaurus/defaultes.asp).

163

Figura B10. Registro individual de un trmino preferente en el Tesauro de OIT. Ntese la


categora a la que pertenece el trmino (SC), el trmino genrico (BT), los trminos
relacionados (RT) y las equivalencias en francs (FRE) e ingls (ENG). Por ltimo se muestra
la nota histrica (ltima actualizacin).

164

Figura B11. Interfaz del Tesauro europeo de educacin. Es gestionado por la Comisin de las
Comunidades Europeas. En el ngulo superior derecho aparece el casillero de bsqueda. En
el margen izquierdo se brinda acceso a la lista sistemtica y a la lista alfabtica, as como un
men desplegable para elegir el idioma, ya que se trata de un tesauro multilinge
(http://www.freethesaurus.info/redined/es/index.php).

165

Figura B12. Lista sistemtica del Tesauro europeo de educacin, que muestra las distintas
categoras bajo las cuales se han ordenado los trminos preferentes. La lista alfabtica est
constituida por un ndice A/Z.

166

Figura B13. Registro individual de un trmino preferente en el Tesauro europeo de


educacin. Ntese en la parte superior la cadena correspondiente al trmino. Luego aparecen
la nota de alcance, el trmino genrico (TG), el trmino preferente resaltado en negrita, los
trminos especficos (TE), el trmino relacionado (TR) y las equivalencias en los otros
idiomas del tesauro.

167

11. El tesauro y la interoperabilidad

En la actualidad y gracias a la Web, existe la posibilidad de que un sistema de


recuperacin pueda incorporar una funcin de bsqueda distribuida, es decir una
bsqueda simultnea en mltiples fuentes, cualquiera sea su localizacin. Sin
embargo, este tipo de bsqueda por lo general se encuentra limitada a la lengua
natural, de modo que el usuario enfrenta los problemas de sinonimia y homonimia
que se explicaron en el Captulo 2. A esto debe agregarse la dificultad que presenta
la bsqueda distribuida cuando el contenido de los documentos se encuentra en
distintas lenguas, como ocurre en la Web.
Por

otra

intercambiar

parte,
los

muchos

registros

sistemas

bibliogrficos

de
de

recuperacin
bases

de

tambin
datos

requieren

desarrolladas

previamente con total independencia. Tales bases de datos suelen estar indizadas
con distintos SOC, de modo que necesitan compatibilizarse, tanto en lo conceptual
como en lo terminolgico, mediante alguna forma de interoperabilidad (Martnez
Tamayo et al., 2011a; Neelamegan & Lalita, 2013).
La interoperabilidad se define como la habilidad de dos o ms sistemas para
intercambiar informacin y usar la informacin que ha sido intercambiada (ISO,
2013, p. 7). As, la interoperabilidad entre SOC se propone armonizar las
equivalencias y las relaciones jerrquicas y asociativas entre los conceptos de dos o
ms SOC, con el fin de intercambiar esos conceptos. Un tesauro puede interoperar
con otro tesauro, con una lista de epgrafes, un sistema de clasificacin o cualquier
otro SOC (Aitchison et al., 2000; Chang y Zeng, 2002a,b; Lancaster, 2002;
Martnez Tamayo et al., 2011a; Neelamegan & Lalita, 2013).
Esta compatibilidad entre SOC no es una novedad. Ya en 1939 la conocida lista
de encabezamientos de materia de Sears asign a cada epgrafe una notacin de
SCDD, haciendo ambos SOC compatibles (Miller, 2007). En las dcadas de 1970 y
1980 se llevaron a cabo diversos proyectos de este tipo (Aitchison et al., 2000;
Lancaster, 2002). Para 1995 el tema haba adquirido tal importancia, que la ISKO
organiz en Varsovia el Seminario sobre Compatibilidad e Integracin de Sistemas
de Ordenacin, que culmin con una serie de recomendaciones tanto para la
investigacin, la educacin y el intercambio de informacin, como para el desarrollo
de sistemas y esfuerzos cooperativos (ISKO, 1996).
En este siglo veintiuno, la disponibilidad de tesauros y otros SOC en lnea, as
como los recursos que ofrece la tecnologa informtica, han facilitado numerosos y
variados proyectos de interoperabilidad entre SOC. En consecuencia, las nuevas
168

normas de diseo y desarrollo de tesauros han dedicado buena parte de sus


recomendaciones a la interoperabilidad (BSI Group, 2007, 2008; ISO, 2013; NISO,
2005).

11.1 Modelos estructurales de interoperabilidad


La norma ISO 25964-2 describe distintos modelos de interoperabilidad entre
SOC que, si bien se presentan por separado para facilitar la explicacin, en la
prctica suelen superponerse o combinarse (ISO, 2013).

Unidad estructural: en este modelo, todos los SOC participantes comparten


exactamente los mismos conceptos y las mismas relaciones jerrquicas y
asociativas. En cambio, los trminos pueden variar, por ejemplo cuando se
trata de dos o ms SOC en distintos idiomas.

Vinculacin directa: este modelo vincula dos o ms SOC que no comparten


la misma estructura. Adems de diferenciarse en el alcance, el idioma y la
estructura, la vinculacin puede incluir distintos tipos de SOC, por ejemplo
un tesauro con un sistema de clasificacin o con una lista de epgrafes. Debe
establecerse un mapeo directo entre los conceptos de un SOC y aquellos de
cada uno de los otros SOC. El modelo puede extenderse a cualquier cantidad
de SOC y todos los SOC pueden usarse para la bsqueda en una coleccin
indizada con cualquiera de los otros SOC (Figura 11.1).

Figura 11.1. Modelo de interoperabilidad de vinculacin directa. Cada uno


de los SOC vinculados es compatible con todos y cada uno de los dems
SOC.

Estructura central o hub: en lugar de establecer un mapeo directo entre


cada par de SOC, se elige un SOC como hub o SOC central, hacia el cual se
mapea cada uno de los otros SOC, de modo que cada concepto en el hub
debe ser mapeado al correspondiente concepto de los otros SOC y
169

viceversa, pero no entre todos los SOC. La interoperabilidad se establece


entre cada SOC y el hub (Figura 11.2).

Figura 11.2. Modelo de interoperabilidad de estructura de hub. El SOC B es el


hub. Cada uno de los otros SOC se vincula con el hub, pero no con los dems
SOC. Es decir, para vincular el SOC A con el SOC C, es necesario pasar a
travs del SOC B que es el hub.

Mapeo selectivo: en algunos casos no es necesario mapear la totalidad de


los SOC, sino solamente una parte de ellos. Hay dos opciones: mapear el
rea que se superpone o mapear solamente los trminos preferentes que se
han usado en la indizacin (Figura 11.3).

Figura 11.3. Modelo de interoperabilidad de mapeo selectivo. Arriba: solo


se mapean los conceptos superpuestos o que forman la interseccin del
SOC A y del SOC B. Abajo: se mapean los trminos del SOC A, usados
realmente en la indizacin y los trminos del SOC B.

170

El primer modelo, es decir el de unidad estructural, se recomienda para un


tesauro multilinge nuevo, donde cada concepto es designado por un trmino
preferente en cada una de las lenguas y donde las relaciones jerrquicas y
asociativas son las mismas. Por el contrario, los dems modelos se recomiendan
para mapear SOC existentes y de distinto tipo, porque al ser diseados
independientemente, los conceptos y relaciones pueden no coincidir de manera
exacta.
El mtodo para lograr la interoperabilidad es el mapeo, es decir el proceso de
establecer relaciones entre los conceptos de un SOC y los conceptos de otro SOC.
El mapeo es ms complicado cuando los SOC involucrados son de diferente tipo,
particularmente entre un SOC poscoordinado y un SOC precoordinado, ya que en
ste ltimo es necesario descomponer primero las cadenas precoordinadas.
La interoperabilidad ocurre entonces entre dos o ms SOC, que pueden ser de
dos tipos, segn su funcin:

SOC fuente: es el SOC que sirve como punto de partida cuando se busca un
trmino o concepto correspondiente en otro SOC.

SOC blanco: es el SOC en el que se encuentra un trmino o concepto


correspondiente a un trmino o concepto del SOC fuente.

11.2 Mapeo equivalente


El punto crtico de la interoperabilidad es la equivalencia, pues no es posible
establecer jerarquas y asociaciones si no se han establecido primero las
equivalencias entre trminos. Se debe diferenciar entre a) la equivalencia intraSOC, que se explic en el Captulo 7 y b) la equivalencia inter-SOC que se describe
aqu.
Esta equivalencia inter-SOC se establece entre las designaciones de los distintos
SOC, es decir entre los trminos preferentes y las formas autorizadas del nombre.
Por ejemplo, en el tesauro A el trmino preferente es batata y en el tesauro B es
boniato, o bien en el Tesauro A la forma autorizada del nombre es Cortzar,
Julio y en el Tesauro B es Cortzar, Julio, 1914-1984. Tambin pueden estar
en distinta lengua, por ejemplo guarderas y crches, Suiza y Suisse.
En otros casos el concepto de un SOC se designa con un trmino, mientras que
en el otro SOC se designa con dos o ms. Por ejemplo en el Tesauro A el trmino
preferente es polticas de salud y en el Tesauro B se requieren dos trminos
preferentes: polticas + salud.

171

Un trmino puede representar un concepto en un tesauro y otro concepto


diferente en un segundo tesauro. Por ejemplo, un tesauro de fotografa puede
incluir el trmino preferente diafragma, para referirse al dispositivo que regula la
cantidad de luz que ha de pasar en las cmaras fotogrficas, mientras que un
tesauro de acstica puede tener el trmino preferente diafragma para referirse al
dispositivo que transforma las vibraciones del sonido en impulsos elctricos o
viceversa en algunos aparatos de sonido como el micrfono.
Hay entonces distintos tipos de equivalencia inter-SOC, que se indican con la
etiqueta EQ:

Equivalencia simple: el SOC blanco contiene un concepto idntico al


concepto del SOC fuente, permitiendo un inmediato mapeo uno-a-uno. Por
ejemplo: el trmino preferente enseanza secundaria del Tesauro de la
Unesco y la notacin 373.5 de CDU. Por ejemplo:

SOC fuente

SOC blanco

jardinera

EQ

635

computadoras

EQ

computadores

computadoras

EQ

ordenadores

man

EQ

amendoim

Pases Bajos

EQ

Deutschland

En la equivalencia simple se distinguen dos grados de equivalencia exacto e


inexacto que se indican con los smbolos = y ~, respectivamente:
Equivalencia exacta: en un mapeo equivalente la equivalencia es exacta
cuando el trmino preferente del SOC fuente y el trmino preferente del SOC
blanco designan el mismo concepto y pueden usarse indistintamente. Por
ejemplo: castaas de caj =EQ anacardos.
Equivalencia inexacta: en un mapeo equivalente, los trminos preferentes
considerados
equivalencia

equivalentes
entonces

es

no

siempre

inexacta.

Por

son

exactamente

ejemplo:

lo

mismo.

bibliotecologa

La
~EQ

biblioteconoma.

Equivalencia compuesta: un concepto complejo que ha sido designado en el


SOC fuente por un nico trmino preferente puede estar expresado en el
SOC blanco por una combinacin de dos o ms trminos. Se produce as un
mapeo uno-a-muchos. Por ejemplo: el epgrafe de la lista ARMARC
administracin de fbricas es equivalente a la precoordinacin de dos
trminos preferentes del

Tesauro de la Unesco: administracin

fbrica. Cuando en un mapeo selectivo se convierten trminos de


172

indizacin, todos los trminos preferentes del SOC blanco deben aplicarse al
registro indizado con el trmino del SOC fuente. En la bsqueda deben
combinarse con el operador booleano AND. El smbolo usado es la adicin
(+). Por ejemplo:

SOC fuente

SOC blanco

polticas de salud

EQ

polticas + salud

economa domstica

EQ

economa + hogar

ciencia y tecnologa

EQ

ciencia + tecnologa

gestin de museos

EQ

gestin + museos

autos de competencia

EQ

autos + competencias

Equivalencia compuesta por interseccin: debe su nombre a que es posible


representarla grficamente como una interseccin de conjuntos. Ocurre
cuando el concepto del SOC blanco tiene un alcance ms general que el
concepto en el SOC fuente. Se establece una relacin del tipo reenvo
ascendente. Por ejemplo, el trmino preferente isomerasa de peptidilprolil
del DeCS y el trmino preferente isomerasas del tesauro Spines que no
cuenta con trminos ms especficos. Este tipo de equivalencia no es
reversible, pues el trmino general tambin puede abarcar otros conceptos
especficos. Por ejemplo:

SOC fuente

SOC blanco

bibliotecas pblicas

EQ

bibliotecas

papa blanca

EQ

papas

perros de caza

EQ

perros

automviles deportivos

EQ

automviles

Jujuy

EQ

Argentina

Equivalencia compuesta acumulada: es aquella en la que un concepto


complejo del SOC fuente equivale a la suma o conjunto de dos o ms
conceptos del SOC blanco. Por ejemplo: el trmino preferente corrientes
de agua del Tesauro Spines equivale a la suma de los epgrafes aguas |
canales | ros | cataratas (hidrografa) de la lista ARMARC. Cuando
en un mapeo selectivo se convierten trminos de indizacin, todos los
trminos preferentes del SOC blanco deben aplicarse al registro indizado con
el trmino preferente del SOC fuente. En la bsqueda deben combinarse con
el operador booleano OR. El smbolo de la barra vertical (|) debe indicarse
entre los trminos preferentes del SOC blanco.
173

SOC fuente

SOC blanco

transportes

EQ

aviones | barcos | trenes | automotores

escuelas

EQ

escuelas pblicas | escuelas privadas

jvenes

EQ

mujeres jvenes | varones jvenes

frutos secos

EQ

nueces | castaas | avellanas | manes

flores

EQ

flores de jardn | flores silvestres

11.3 Mapeo jerrquico


El mapeo jerrquico se establece cuando un concepto es claramente ms
general que el otro. Al igual que la relacin jerrquica en un tesauro, la relacin
entre los conceptos de distintos SOC puede ser del tipo gnero-especie o
enumerativa. La relacin todo-parte tambin puede mapearse jerrquicamente, en
las circunstancias limitadas que describe la norma ISO 25964-1.
El mapeo jerrquico de un concepto especfico a un concepto genrico se
expresa con el formato: amebas BM protozoos. El mapeo jerrquico recproco es
protozoos NM amebas. BM significa broader mapping o mapeo genrico, mientras
que NM significa narrower mapping o mapeo especfico. Dado que no existe todava
una norma de interoperabilidad entre tesauros en espaol, en esta obra se ha
decidido mantener las etiquetas en ingls.

11.4 Mapeo asociativo


El mapeo asociativo se establece cuando los conceptos de dos o ms SOC no
califican

para

el

mapeo

equivalente

jerrquico,

pero

estn

asociados

semnticamente. La etiqueta para este mapeo es RM (related mapping). Por


ejemplo alcohol RM alcoholismo y alcoholismo RM alcohol. Al igual que en el
caso anterior, dado que no existe todava una norma de interoperabilidad entre
tesauros en espaol, en esta obra se ha decidido mantener las etiquetas en ingls.
La norma ISO 25964-2 aclara que la lnea divisoria entre el mapeo asociativo y
la equivalencia inexacta es difcil de definir y subjetiva, por lo cual recomienda
hacerlo pragmticamente de acuerdo con el contexto en el que se usar el mapeo.

11.5 Tesauros multilinges


Un tesauro multilinge es aquel en el que cada concepto debe estar
representado por igual en todas las lenguas incluidas, es decir todos los idiomas
174

son tratados en igualdad de condiciones. Ejemplos de este tipo son los tesauros del
sistema de la ONU, entre ellos el Tesauro de la Unesco, el Tesauro de la OIT, el de
UNBIS, Agrovoc, etc.
La

metodologa

para

tratar

un

tesauro

multilinge

es

una

forma

de

interoperabilidad. Las recomendaciones especficas provienen de dos fuentes: la


norma ISO 25964-1/2 (ISO, 2011; 2013) y las directrices de IFLA para tesauros
multilinges (IFLA, 2009a).
Cuando todos los conceptos del tesauro multilinge se expresan con un trmino
en cada idioma y comparten las relaciones jerrquicas y asociativas, se dice que es
un tesauro simtrico. Lo ideal por supuesto es un tesauro multilinge simtrico,
pero no siempre es posible, ya que puede haber variaciones de un idioma a otro y
de hecho se han identificado varios problemas que suelen presentarse. En tal caso,
se trata de un tesauro asimtrico.
Antes de continuar, es necesario definir dos trminos:

Lengua fuente: es la lengua que sirve como punto de partida en la


traduccin de un trmino o en la bsqueda de sus equivalencias.

Lengua blanco: es la lengua que proporciona la traduccin o el equivalente


de un trmino que existe en una lengua fuente.

11.5.1 Problemas frecuentes

A continuacin se presentan los problemas ms comunes en los tesauros


multilinges. En los ejemplos, la lengua se indica en negrita y de acuerdo al cdigos
de dos letras para idiomas de la norma ISO 639-1: en = ingls, es = espaol, fr =
francs, it = italiano, pt = portugus (ISO, 2002).

El trmino en la lengua fuente posee un calificador que no es necesario en la


lengua blanco:

Lengua fuente

en cranes (birds)
en cranes (lifting equipment)

Lengua blanco

es gras
es grullas

El trmino en la lengua fuente tiene sinnimos, pero no en la lengua blanco.


Se respeta la situacin sin imponer sinnimos en el tesauro de la lengua
blanco.

175

Lengua fuente

es computadoras
UP computadores
UP ordenadores

computadores
USE computadoras

ordenadores
USE computadoras

Lengua blanco

en computers

El trmino en una de las lenguas no tiene equivalente en la otra. Se


recomiendan tres soluciones:

a) Transformar el trmino preferente (mercadotecnia) en un trmino no


preferente.

Lengua fuente

en marketing

Lengua blanco

es mercadotecnia
UP marketing

Solucin

es marketing
UP mercadotecnia

b) Importar el trmino de la lengua fuente como trmino prestado de la


lengua blanco.

Lengua fuente

fr pret--porter

Lengua blanco

es pret--porter

c) Crear un neologismo o trmino acuado en la lengua blanco.

Lengua fuente

en scanner

Lengua blanco

es escner

176

11.5.2 Presentacin del tesauro multilinge

En la presentacin de un tesauro multilinge, los idiomas deben identificarse


con el cdigo ISO de idiomas ya mencionado (ISO, 2002). Se debe seguir el
formato del siguiente ejemplo (ISO, 2011):

Versin en ingls

tomato
es tomate
it pomodoro
UF Solanum lycopersicum

Versin en espaol

tomate
en tomato
it pomodoro
UP jitomate
UP Solanum lycopersicum

Versin en italiano

pomodoro
en tomato
es tomate
UP Solanum lycopersicum

Ntese que la versin en espaol del ejemplo anterior tiene un sinnimo ms


(jitomate) que las otras versiones. Esto es as porque la cantidad de sinnimos y
cuasisinnimos de un trmino vara de una lengua a otra. En un tesauro multilinge
no se requiere la equivalencia entre los trminos no preferentes de las distintas
lenguas.

11.6 Algunas experiencias de interoperabilidad con tesauros


Sin

pretender

ser

exhaustivos,

continuacin

se

presentan

algunas

experiencias de interoperabilidad entre uno o varios tesauros, o entre un tesauro y


otro tipo de SOC.

11.6.1 Entre dos o ms tesauros

CAT-AGROVOC: este proyecto compatibiliza el Tesauro Chino de Agricultura


(CAT) y el tesauro multilinge AGROVOC de la FAO (Liang et al., 2005).
177

ASESG: es un proyecto del Centro de Ecosistemas Acuticos del Instituto de


Investigacin y Tecnologa Agropecuaria de Catalua. La interoperabilidad se ha
establecido entre cinco tesauros que abarcan las ciencias acuticas, pesca,
agricultura, alimentacin, medio ambiente y economa (Revert y Sebasti, 2009).
Unified Astronomy Thesaurus (UAT): es un proyecto coordinado por la American
Astronomy Society para crear un tesauro colaborativo con el fin de compatibilizar
varios tesauros independientes de astronoma y astrofsica. En el proyecto
participan asociaciones profesionales, sociedades cientficas, editores, bibliotecarios
y curadores con experiencia en el dominio y en tesauros adicionales (Accomazzi et
al., 2014).
Thesaurus of GTS: es un proyecto realizado por profesionales de China y los
Pases Bajos, que han creado un tesauro multilinge en siete idiomas sobre las
escalas de los tiempos geolgicos (Ma et al., 2011).

11.6.2 Entre tesauros y listas de epgrafes

LCSH-ERIC: es un trabajo experimental realizado en OCLC para probar la


metodologa de trabajo Open Archives Initiative Protocol for Metadata Harvesting
(OAI-PMH). La metodologa se aplic al tesauro de ERIC y la lista de epgrafes LCSH
(Vizine Goetz, 2004). Esta metodologa tambin ha sido descripta en Argentina
(Ferreyra, 2009).
SWD-IZ: el objetivo de esta experiencia alemana ha sido relacionar los
conceptos indizados en dos bases de datos, una que indiza con el Thesaurus
Sozialwissenschaften de ciencias sociales y otra que utiliza la lista de epgrafes
Schlagwortnormdatei (SWD) (Zhang, 2006).

11.6.3 Entre tesauros y sistemas de clasificacin

Proyecto HILT. Es un proyecto llevado a cabo por el Centre for Digital Library
Research de la University of Strachclyde en Gran Bretaa. El objetivo es lograr un
mapeo de diversos tesauros en ingls, usando como hub SCDD (Mcgregor et al.,
2007; McCulloch y Macgregor, 2008; Nicholson, 2002; Nicholson y McCulloch,
2006).
Proyecto KoMoHe: es un proyecto del Bundesministerium fr Bildung und
Forschung de Alemania, iniciado en 2004 y concluido en 2007. En total se
vincularon 25 SOC (16 tesauros, 4 listas de trminos, 2 listas de epgrafes y 3

178

sistemas de clasificacin, incluyendo SCDD), de 11 disciplinas, en alemn, ingls y


ruso (Mayr, 2008, 2009).
Multilingual Thesaurus of Education: es un proyecto piloto realizado en la India.
Vincula un tesauro en ingls, derivado del esquema de educacin de la Colon
Classification (CC), y diversas lenguas locales (tamil, kannada, tulu, malayalam,
punjabi, hindi, snscrito), a las cuales se piensa agregar el urdu y el rabe. El
proyecto incluye adems las notaciones de CC y SCDD (Neelamegan & Lalita,
2013).
ERIC-TEE-CDU: es un estudio experimental realizado en la Universidad de
Barcelona, que estableci la equivalencia entre los trminos preferentes del tesauro
ERIC en ingls y el Tesauro Europeo de Educacin (versin en cataln), con
notaciones de CDU (Granados y Nicolau, 2007, 2008). Se trata de un mapeo
selectivo, basado en la indizacin.
ASC-CDU: es un proyecto realizado en la biblioteca del Afrika-Studiecentrum
(ASC) de Leiden, Holanda, entre 2001 y 2006. Cada trmino preferente del tesauro
de ASC tiene asignada una notacin de CDU, con lo cual se abre la posibilidad de
establecer ms adelante la conexin con otros tesauros, usando CDU como hub
(van Doorn y Polman, 2010).
BiblioPhil: es un proyecto de interoperabilidad realizado en la Biblioteca Central
Universitar de Bucarest, Rumania, que ha derivado un tesauro trilinge (rumano,
ingls y francs) a partir de las clases de CDU (Frncu y Sabo, 2010). Los trminos
preferentes en las tres lenguas quedan as vinculados a las notaciones.
STITCH. Entre 2006 y 2007 las bibliotecas nacionales de Holanda y Francia
(Koninklijke Bibliotheek o KB y Bibliothque Nationale de France o BNF) llevaron a
cabo este proyecto con el fin de hacer interoperables el sistema de clasificacin
Iconclass con que se clasifica la base de datos de manuscritos medievales de la KB
y el tesauro Mandragore con el que se indiza otra base de datos sobre el mismo
tema en la BNF (Angieli & Antoine, 2008a,b).
VISION: es un sistema experimental desarrollado en China, que consiste en una
red integrada, formada por la fusin de un tesauro y un sistema de clasificacin en
un nuevo SOC denominado Clasificacin y Tesauro Chinos. Este SOC ha sido
aplicado a los registros bibliogrficos de la biblioteca de la Universidad de Beijing
(Wang, 2003).

11.6.4 Tesauros y ontologas

Algunos tesauros han sido usados como base para crear ontologas y por este
motivo se consideran lenguajes de transicin. Las relaciones en una ontologa son

179

ms formales que en un tesauro y en general se considera que el tesauro requiere


una reingeniera tanto estructural como conceptual para ser reusado o tratado
como una ontologa, pero puede ser la base para su desarrollo (Kless et al., 2012).

11.7 Dificultades de la interoperabilidad entre SOC


Lancaster (2002) ha sealado los principales problemas de la interoperabilidad
entre SOC:

Nivel de especificidad

Nivel de precoordinacin

Solapamiento de trminos

Falta de normalizacin

Grado de actualizacin de los SOC

Para solucionar los primeros tres problemas, Tennis (2004) ha propuesto


focalizar la investigacin en el concepto como unidad de conocimiento, la materia
como cuerpo de ideas organizado o sistematizado y el orden sistemtico
facetado. Con respecto a la normalizacin, hoy en da es un problema resuelto con
la nueva norma de diseo y desarrollo de tesauros ISO 25964 (ISO, 2011; 2013).
En cuanto a la actualizacin, es obvio que si uno de los SOC que interoperan no se
actualiza ms o menos al mismo tiempo que los otros, ser muy difcil mantenerlos
interoperables.
En adicin existen algunas dificultades metodolgicas, pues si bien los mtodos
informticos resultan efectivos cuando se trata de mapear trminos en el rea de
las ciencias duras, en otros campos como las ciencias sociales se necesita recurrir al
trabajo intelectual de los expertos para establecer el correspondiente mapeo
(Lauser et al., 2008).

180

Autoevaluacin

a. En el contexto de los SOC, defina el trmino interoperabilidad.

b. Explique los distintos modelos de interoperabilidad.

c. A qu se llama SOC fuente y SOC blanco?

d. Seale como se establece el mapeo equivalente.

e. Qu etiqueta indica una equivalencia inter-SOC?

f.

Describa los distintos tipos de equivalencias inter-SOC.

g. Seale cmo se establece el mapeo jerrquico.

h. Qu etiquetas indican una relacin jerrquica inter-SOC?

i.

Seale cmo se establece el mapeo asociativo.

j.

Explique por qu un tesauro multilinge se debe tratar como una forma de


interoperabilidad.

k. Qu problemas se pueden presentar en el diseo de un tesauro multilinge?

181

12. Software de gestin, modelo de datos y


formatos de intercambio
En captulos anteriores hemos hecho hincapi en la necesidad de presentar los
tesauros en lnea. Este captulo est dedicado a las recomendaciones bsicas de la
norma ISO 25964-1/2 para el software de gestin de la base de datos del tesauro y
el modelo de datos, as como algunas referencias al desarrollo automtico de
tesauros (ISO, 2011; 2013).

12.1 Software de gestin


Un tesauro debe gestionarse como una base de datos. Hay programas
adecuados para este fin, como TemaTres, que ha sido desarrollado en Argentina y
aplicado

ms

de

cien

(http://www.r020.com.ar/tematres/).
evaluados

comentados

SOC

Otros

en

en

software

la

distintos
de

Web,

este
por

tipo

idiomas
han

ejemplo

sido
en

http://www.willpowerinfo.co.uk/thessoft.htm.
Tambin se puede disear la base de datos del tesauro utilizando los siguientes
formatos de autoridades:

MARC 21 format for authority data desarrollado por Library of Congress


(http://www.loc.gov/marc/authority/).

UNIMARC

manual

authority

format

desarrollado

por

IFLA

(http://archive.ifla.org/VI/8/projects/UNIMARC-AuthoritiesFormat.pdf).
Ambos formatos incluyen los campos necesarios para el trmino preferente, las
relaciones de equivalencia, jerrquicas y asociativas, las equivalencias en otras
lenguas, as como la notacin de un sistema de clasificacin si se desea hacerlo
compatible con el tesauro (Library of Congress, 2013; Willer, 2009).
Los requisitos funcionales de FRSAD tambin aportan lo necesario para
desarrollar una lista de autoridades de materia, que puede aplicarse perfectamente
al diseo de un tesauro. Como se mencion en el Captulo 3, FRSAD es un modelo
conceptual para datos de autoridades de materia, desarrollado por IFLA y adecuado
para implementar bases de datos relacionales, que ha establecido dos superclases
thema y nomen cuyos atributos y relaciones son los siguientes (IFLA, 2010):

Thema: los atributos son el tipo de thema y la nota de alcance; las


relaciones son las jerrquicas y las asociativas.

Nomen: los atributos son tipo de nomen, SOC, fuente de referencia,


representacin, idioma, escritura del nomen, escritura de conversin, forma
182

del nomen, tiempo de validez, audiencia y status. Las relaciones son las de
equivalencia y las relaciones todo-parte que se refieren a los sistemas
precoordinados, es decir las subdivisiones, que no son necesarias en el
tesauro.
La norma ISO 25964 describe las recomendaciones bsicas para el programa
informtico de gestin del tesauro, que pueden resumirse como sigue (ISO, 2011):

Capacidades: el programa debe contar con capacidad de almacenamiento,


gestin, importacin, exportacin y edicin de datos, as como de bsqueda,
visualizacin y navegacin. Es conveniente que pueda gestionar ms de un
tesauro, en uno o ms idiomas. Debe permitir la incorporacin, modificacin
y

eliminacin

de

trminos

nombres

propios

candidatos,

trminos

preferentes y no preferentes, formas autorizadas y variantes del nombre,


notas, notaciones, relaciones semnticas y niveles jerrquicos.

Limitaciones: el programa no debe tener limitaciones respecto al nmero de


caracteres de los trminos y nombres propios, notas, etiquetas, etc.
Tampoco debe limitar la cantidad de trminos, de relaciones por trmino, o
de los niveles jerrquicos y debe facilitar la inclusin de facetas, subfacetas
y etiquetas de nodo. Debe establecer automticamente las reciprocidades
correspondientes a las relaciones semnticas del tesauro.

Validacin: el programa debe validar todas las relaciones, de modo que no


haya en el tesauro ni trminos hurfanos, ni relaciones sin la debida
reciprocidad. Tambin debe verificar que cada concepto est representado
por un solo trmino preferente o una sola forma autorizada del nombre, as
como la ortografa.

Vinculacin: es indispensable que el programa permita vincular la base de


datos del tesauro con la base de datos bibliogrfica que ser indizada y
consultada con dicho tesauro de modo tal que tanto el indizador como el
usuario final puedan operar con ambas bases de datos simultneamente.

Tambin se recomienda que sea compatible con los modelos de datos


apropiados para incluir un tesauro en la Web, como SKOS o MADS.

12.2 Modelo de datos


Un modelo de datos es un modelo abstracto que describe cmo se deben
representar y usar los datos. En el caso del tesauro, proporciona la descripcin
genrica de su estructura y su semntica.
La norma ISO 25964-1 recomienda un modelo diseado de acuerdo con las
convenciones del lenguaje unificado de modelado (UML o unified modelling
183

language). Contiene cinco clases principales que son: Thesaurus, ThesaurusArray,


ThesaurusConcept, ThesaurusTerm y Note, as como otras clases subsidiarias de
stas. Tambin indica el carcter obligatorio u opcional de los datos y sus posibles
ocurrencias (repetibles, no repetibles). El modelo se muestra en el Apndice C.
Como su nombre lo indica, UML es un lenguaje de modelado que permite
describir un plano o modelo del

sistema

en nuestro caso un tesauro,

especificando, visualizando, construyendo y documentando artefactos de un


sistema de software, gracias a su alta capacidad grfica.
Adems del modelo propuesto por la norma ISO, tambin debe tenerse en
cuenta el Simple Knowledge Organization System (SKOS), que es un modelo
elaborado por el W3C para la Web Semntica, es decir para ordenar el caos de la
Web. El modelo ha sido desarrollado especficamente para expresar cualquier SOC
incluidos los tesauros, de forma tal que sus datos puedan intercambiarse entre
distintas aplicaciones informticas y publicarse en la Web (W3C, 2009). Adems,
SKOS se ha mapeado con el modelo FRSAD de IFLA (Zeng & Zummer, 2009a,b).
En SKOS los datos se expresan como tripletas RDF (sujeto-predicado-objeto) y
pueden codificarse usando cualquier sintaxis RDF, por ejemplo RDF/XML. El
Resource Description Framework (RDF) es un marco de especificaciones para
representar informacin en la Web. El eXtensible Markup Language (XML) es un
lenguaje

de

marcado

para

almacenar

datos

intercambiar

informacin

estructurada.
En el modelo SKOS, un SOC cualquiera es concebido como un esquema de
conceptos. Tanto el esquema de conceptos como cada uno de los conceptos que lo
integran se reconocen por un identificador uniforme de recursos (URI o Uniform
Resource Identifier), que consiste en una cadena de caracteres que identifica
inequvocamente un recurso Web, de modo que cualquiera pueda referirse al
esquema o a cada uno de los conceptos sin ambigedad. Este URI facilita que los
conceptos SKOS puedan reusarse en otros esquemas y que se facilite el mapeo
entre dos o ms esquemas, por lo que SKOS resulta ideal para la interoperabilidad
entre SOC.
A cada concepto SKOS se le puede asignar una o ms etiquetas lxicas, en
cualquier idioma o escritura. Tambin se pueden asignar notaciones y se pueden
documentar notas de alcance, de definicin, histricas o de edicin. Un concepto
SKOS puede vincularse a otro concepto SKOS mediante relaciones semnticas de
equivalencia, jerarqua

y asociacin. Adems, los conceptos SKOS

pueden

agruparse en colecciones como las etiquetas de nodo o las categoras.


El vocabulario de SKOS se muestra en la Tabla 12.1. Un ejemplo para un
trmino preferente marcado con SKOS se muestra tambin en el Apndice C.

184

Tabla 12.1 Vocabulario del modelo SKOS

12.3 Desarrollo automtico de tesauros


En cuanto al aporte informtico para el desarrollo de tesauros, se distinguen
tres metodologas:

Tesauro manual: desde luego no se trata de un tesauro hecho u operado


con la mano, como hace suponer el adjetivo. Es un tesauro cuyo diseo y
desarrollo se basa principalmente en el trabajo intelectual de seres
humanos, expertos en el dominio del tesauro y en los mtodos para su
elaboracin. La tecnologa informtica es usada como una herramienta de
apoyo que se aplica a los procesos involucrados como la colecta de trminos
u otros. Desde el sector informtico, especialmente de los desarrolladores
Web, se considera que este tipo de tesauros resulta caro, consume tiempo,
se desactualiza y es ineficiente para la bsqueda en la red (Zeng, 2012),
aunque por supuesto es muy discutible.

185

Tesauro

automtico:

es

un

tesauro

desarrollado

por

computadoras

programadas especialmente. Se trata de una estructura de datos construida


mediante la extraccin de palabras claves y la determinacin automtica de
las relaciones entre esas palabras claves. El investigador chino Wen Zeng
considera que el desarrollo de un tesauro automtico tiene cuatro etapas
(Zeng, 2012):

a. Extraccin de trminos. Incluye tanto la extraccin propiamente dicha de


los trminos de los documentos, especialmente del rea cientfica y
tcnica, como el anlisis lingstico de esos trminos, en particular las
estructuras sintcticas.

b. Determinacin

automtica

de las relaciones semnticas. Para

las

relaciones asociativas se indica un anlisis estadstico de coocurrencias o


una asociacin basada en la estructura de los documentos. Para las
relaciones jerrquicas se toma en cuenta primero la forma de los
trminos y luego se calcula por similaridad, de acuerdo al nmero de
palabras similares y a la localizacin del trmino.

c. Traduccin automtica de los trminos. Tanto Zeng como otros autores


consideran indispensable que los tesauros operativos en la Web sean
multilinges para poder realizar una bsqueda existosa en la Web, dado
la enorme cantidad de recursos disponibles en numerosos idiomas.

d. Evaluacin de los resultados.

Tesauro semiautomtico: es una metodologa que de una u otra manera


combina las anteriores. Lauser et al. (2008) concluyen, a partir de una
investigacin sobre tesauros de agricultura, que los trminos provenientes
de las ciencias duras como la qumica y la biologa son ms adecuados para
su extraccin por medios automticos, no as los trminos de otras reas
como la economa o la administracin que requieren mayor trabajo
intelectual de los expertos.

Cabe resaltar la utilidad de los estudios bibliomtricos como apoyo a cualquiera


de las metodologas comentadas. Schneider (2004) seala que la contribucin de
estos mtodos se basa en a) la capacidad del anlisis de cocitacin y del anlisis del
contexto de citas para identificar especficamente importantes trminos candidatos

186

para el tesauro porque surgen de los contextos y acuerdos de la comunidad


cientfica y b) la capacidad del anlisis de cocitacin y de cotrminos para detectar
las relaciones semnticas entre los trminos.

187

Autoevaluacin
a. Qu opciones pueden elegirse para la creacin de la base de datos del tesauro?

b. Qu capacidades debe tener el programa informtico de gestin de tesauros?


c. Qu limitaciones debe tener el programa informtico de gestin de tesauros?
d. Qu debe validar el programa informtico de gestin de tesauros?
e. Qu vinculaciones debe facilitar el programa informtico de gestin de
tesauros?
f.

Con qu modelos debe ser compatible para funcionar en la Web?

g. Qu es el modelo SKOS?
h. Desde el punto de vista informtico, qu tipo de tesauros hay y en qu
consisten?

188

Apndice C: Modelos de datos

Figura C1. Modelo de datos propuesto por la norma ISO 25964. Puede consultarse en
http://www.niso.org/apps/group_public/download.php/12351/Correspondence%20ISO25964
-SKOSXL-MADS-2013-12-11.pdf.

189

Figura

C2.

Modelo

de

concepto

SKOS

tomado

del

Tesauro

de

la

Unesco

(http://skos.um.es/unescothes/C00525/rdfxml) Se ha resaltado lo siguiente: en rojo el


concepto (skos:Concept) con su correspondiente URI. En azul el trmino preferente
(skos:prefLabel) en los cuatro idiomas del tesauro: ingls, francs, espaol y ruso. En lila las
relaciones jerrquicas (skos:narrower y skos:broader). En verde las relaciones asociativas
(skos:related). En violeta las relaciones de equivalencia (skos:altLabel) en los cuatro
idiomas.

190

Bibliografa
Accomazzi, Alberto; Gray, Norman; Erdmann, Chris; Biemesderfer, Christ; Frey, Katie &
Soles, Justin. 2014. The Unified Astronomy Thesaurus. En Manset, N & Forshay, P,
editors. ADASS XXIII Proceedings ASP Conference Series. Astronomical Society of the
Pacific. Disponible en http://arxiv.org/pdf/1403.6656v1.pdf [Consulta 30 Abr 2014].
AENOR (Asociacin Espaola de Normalizacin). 1990. Directrices para el establecimento y
desarrollo de tesauros monolinges. Madrid: La Asociacin (UNE 50106:1990).
Aguado, Amelia; Pisarello, Rosa Z.; Martnez, Ana M.; Delorenci, Cecilia. 1999. Definicin:
nuevas tendencias en tesauros y otros vocabularios controlados. En: Lpez Huertas,
Mara Jos; Fernndez Molina, Juan Carlos, editores. La representacin y la organizacin
del conocimiento en sus distintas perspectivas: su influencia en la recuperacin de la
informacin: Actas del IV Congreso ISKO Espaa EOCONSID99, Granada, 22-24 de abril
de

1999.

Granada:

Universidad

de

Granada,

p.

127-132.

Disponible

en

http://www.ugr.es/~isko/ [Consulta 30 Abr 2014].


Aitchison, Jean & Dextre Clarke, Stella. 2004. The thesaurus: a historical viewpoint with a
look to the future. En: Roe, Sandra K. & Thomas, Alan R. The thesaurus: review,
renaissance, and revision. Binghamton NY: Haworth Press, p. 5-21.
Aitchison, Jean; Gilchrist, Alan & Bawden, David. 2000. Thesaurus construction and use: a
practical manual. 4th ed. London: Aslib.
Aitchison, Jean; Gomersall, Alan & Ireland, Ralph. 1969. Thesaurofacet: a thesaurus and
faceted classification for engineering and related subjects. Whetstone: English Electric
Company.
lvaro Bermejo, Concepcin; Villagr Rubio, ngel & Sorli Rojo, ngela. 1989a. Desarrollo de
lenguajes documentales formalizados en lengua espaola: una evaluacin: I: vigencia
terica y prctica de los lenguajes controlados. Revista Espaola de Documentacin
Cientfica, vol. 12, n 2, p. 154-159.
lvaro Bermejo, Concepcin; Villagr Rubio, ngel & Sorli Rojo, ngela. 1989b. Desarrollo de
lenguajes documentales formalizados en lengua espaola: II: evaluacin de los tesauros
disponibles en lengua espaola. Revista Espaola de Documentacin Cientfica; vol. 12,
n 3, p. 283-297.
Anderson, James D. 2003. Organization of knowledge. En: Feather, John & Sturges, Paul,
editors. International encyclopedia of information and library science. 2nded. New York:
Routledge, p. 471-490.
Angelozzi, Silvia M. & Martn, Sandra G. 2010. Metadatos para la descripcin de recursos
electrnicos en lnea: anlisis y comparacin de metadatos. Buenos Aires: Alfagrama.
Angjeli, Anila & Isaac, Antoine. 2008a. Web semntica e interoperabilidad de vocabularios:
un experimento en el mbito de los manuscritos iluminados. En World Library and
Information Congress, IFLA General Conference and Council: Libraries Without Borders:
Navigating Towards Global Understanding. (74th : 2008 : Qubec). The Hague:
IFLA. http://archive.ifla.org/IV/ifla74/papers/129-Angjeli_Isaac-trans-es.pdf.
30 Abr 2014].

191

[Consulta

Angjeli, Anila & Isaac, Antoine. 2008b. Semantic Web and vocabulary interoperability: an
experiment with illumination collections. International Cataloging and Bibliographic
Control, vol.38, n 2, 25-20.
Arest, Alicia & Ceretta, Mara Gladys, comp. 2001. Actas del IV Encuentro de Directores y III
de Docentes de Escuelas de Bibliotecologa y Ciencia de la Informacin del Mercosur,
Montevideo, 24-27 de mayo de 2000. Montevideo: Universidad de la Repblica, p. 381399.
Barit, Mario. 2000a. Los conceptos y su representacin: una perspectiva terminolgica para
el tratamiento temtico de la informacin. Scire, vol. 6, n 1, p. 31-53. Disponible en
http://ibersid.eu/ojs/index.php/scire/article/view/1123/1105 [Consulta 30 Abr 2014].
Barit, Mario. 2000b. The notion of category: its implications in subject analysis and in the
construction and evaluation of indexing languages. Knowledge Organization, v. 27, n
1/2, p. 4-10.
Barit, Mario. 2001. Referenciales tericos vigentes en el rea de tratamiento temtico de la
informacin y su expresin metodolgica. En Arest, Alicia & Ceretta, Mara Gladys, comp.
Actas del IV Encuentro de Directores y III de Docentes de Escuelas de Bibliotecologa y
Ciencia de la Informacin del Mercosur, 24-27 de mayo de 2000, Montevideo, Uruguay.
Montevideo: EUBCA, p. 224-233.
Barit, Mario. 2009. Garanta literaria y normas para construccin de vocabularios
controlados: aspectos epistemolgicos y metodolgicos. Scire, vol. 15, n 2, p. 13-24.
Disponible en http://ibersid.eu/ojs/index.php/scire/article/view/3709/3470 [Consulta 30
Abr 2014].
Barit, Mario. 2011a. La garanta literaria como herramienta de revisin de sistemas de
organizacin del conocimiento: modelo y aplicacin Tesis doctoral. Granada:
Universidad

de

Granada.

Disponible

en

http://digibug.ugr.es/bitstreat/10481/17583/1/19711864.pdf [Consulta 30 Abr 2014].


Barit, Mario. 2011b. La garanta cultural como justificacin en sistemas de organizacin del
conocimiento: aproximacin crtica. Palabra clave (La Plata), vol. 1, n 1, p. 2-11.
Disponible

enhttp://www.palabraclave.fahce.unlp.edu.ar/article/view/PCv1n1a03/1869

[Consulta 30 Abr 2014].


Barit, Mario; Cabrera Castromn, Gabriela; Colombo, Stephanie; Duarte Blanco, Amanda;
Odella, Mara Luisa; Simn, Luca & Vergara Mario. 2013. Diccionario de organizacin del
conocimiento: clasificacin, indizacin, terminologa [en lnea]. 5 ed. Montevideo:
PRODIC.

Disponible

en

http://archivos.liccom.edu.uy/diccionario/Diccionario%20Definitivo%20%5B3-1113%5D.htmlConsulta 30 Abr 2014].


Bates, Marcia J. 1989. Rethinking subject cataloging in online environment. Library
Resources and Technical Services, vol. 33, n 4, p. 400-412.
Bates, Marcia. 1986. Subject access in online catalogs: a design model. Journal of the
American Society for Information Science, vol. 37, n 6, p. 367-376.
Bates, Marcia. 1988. How to use controlled vocabularies more effectively in online searching.
Online, vol. 12, n 6, p. 45-56.

192

Beghtol, Clare. 1986. Semantic validity: concepts of warrant in blbliographic classification


systems. Library Resources & Technical Services, vol. 30, n 2, p. 109-123.
Bhattacharyaa, Ganesh. 1982. Classaurus: its fundamentals, design and use. En Dahlberg,
Ingetraut, editor. Universal classification: subject analysis and ordering systems:
Proceedings of the 4th International Study Conference on Classification Research and 6th
Annual Conference of Gesellshaft fr Klassification, Augsburg, 28 June-2 July, 1982.
Frankfurt: Indeks Verlag, 1989, p. 139-148.
Bliss, Henry E. 1929. The organization of knowledge and the system of the sciences. New
York: H.W. Wilson.
Bliss, Henry E. 1933. The organization of knowledge in libraries and the subject-approach to
books. New York: H.W. Wilson.
Boccato, Vera Regina Casari. 2009. A linguagem documentria vista pelo contedo, forma e
uso na perspectiva de catalogadores e usuarios. En: Fujita, Maringela Spotti Lopes, org.
A indexao de libros: a percepo de catalogadores e usuarios de bibliotecas
universitrias: um estudo de observao do contexto sociocognitivo com protocolos
verbais. So Paulo: Cultura Acadmica.
Brscher, Marisa & Caf, Ligia. 2008. Organizao da Informao ou Organizao do
Conhecimento? [en lnea]. En IX ENANCIB: Diversidade Cultural e Polticas de
Informao, So Paulo, 17 Agosto 2008. [s.L.]: Associao Nacional de Pesquisa e PsGraduao

em

Cincia

da

Informao.

Disponible

en

http://www.slideshare.net/doritchka/brascher-e-caf-organizao-da-informao-ou-doconhecimento [Consulta 30 Abr 2014].


Broughton, Vanda. 2011. Brian Vickery and the Classification Research Group: the legacy of
faceted classification. En Facets of knowledge organization: a tribute to Professor Brian
Vickery 1918-2009: ISKO UK Bienal Conference, London 4th-5th July 2011. London: ISKO
UK. Disponible en http://www.iskouk.org/conf2011/papers/broughton.pdf [Consulta 30
Abr 2014].
Broughton, Vanda; Hansson, Joacim; Hjorland, Birger; Lpez Huertas, Mara Jos. 2005.
Knowledgeorganization]. En: Kajberg, Leif; Lorring, Leif; editors. European curriculum
reflections on library and information science education. Copenhagen: Royal School of
Information Science, p. 133-148.
BSI Group. 2005. Structured vocabularies for information retrieval: guide. Part 1: definitions,
symbols and abbreviations. London: The Group (BS 8723-1:2005).
BSI Group. 2005. Structured vocabularies for information retrieval: guide. Part 2: thesauri.
London: The Group (BS 8723-2:2005).
BSI Group. 2007. Structured vocabularies for information retrieval: guide. Part 3:
vocabularies other than thesauri. Geneva: The Group. (BSI 8723-3:2007).
BSI Group. 2007. Structured vocabularies for information retrieval: guide. Part 4:
Interoperability. London: The Group (BS 8723-4:2007).
BSI Group. 2008. Structured vocabularies for information retrieva: guide. Part 5: Exchange
formats and protocols for interoperability. London: The Group (BS 8723-5:2008).
Business

dictionary

[en

lnea].

2013.

[s.L.]:

WebFinance.

http://www.businessdictionary.com/ [Consulta 30 Abr 2014].

193

Disponible

en

Caf, Ligia Maria Arruda; Agustn Lacruz, Mara del Carmen & Barros, Camila Monteiro de.
2012. Organizao do conhecimento: anlise conceitual. En: Prez Pais, Mara del
Carmen & Gonzlez Bonome, Mara de los ngeles, eds.. Actas del X Congreso ISKOEspaa, Ferrol, 20 de junio-1 de julio de 2011 [en lnea]. La Corua: Universidad de la
Corua,

p.

283-302.

Disponible

en

http://ruc.udc.es/dspace/bitstream/2183/11615/1/CC_132_art_18.pdf [Consulta 30 Abr


2014].
CAICYT (Centro Argentino de Informacin Cientfica y Tecnolgica). Grupo de Trabajo sobre
Lenguajes de Indizacin. 1980. Inventario de lenguajes documentarios no tradicionales
en lengua espaola y portuguesa. Buenos Aires: El Centro.
Chan, Lois Mai y Marcia Lei Zeng. 2002a. Ensuring interoperability among subject
vocabularies and knowledge organization schemes: a methodological analysis. En IFLA
journal. Vol. 28, n 5/6, 323-327.
Chan, Lois Mai y Marcia Lei Zeng. 2002b. Asegurando la interoperabilidad entre vocabularios
de materia y esquemas de organizacin del conocimiento. En IFLA Council and General
Conference

(68th

2002;

Glasgow).

The

Hague:

IFLA. http://archive.ifla.org/IV/ifla68/papers/008-122s.pdf. [Consulta20 Oct 2013].


Chaumier, Jacques. 2004. Les techniques documentaires. 9e ed. Paris: Presses Universitaires
France. (Que sais-je).
Choo, Chun Wei. 2003. Perspectives on managing knowledge in organizations. En:
Williamson, Nancy J.; Beghtol, Clare, editors. Knowledge organization and classification
in international information retrieval. New York: Haworth Information Press, p. 205-220.
Chu, Heting. 2003. Information representation and retrieval in the digital age. Medford NJ:
American Society for Information Science and Technology, p. 1-24 (ASIST monograph
series).
Claverdon, C. W.; Mills, J. 1985.The testing of index language devices.En: Chan, L. M.;
Richmond P. A.; Svenonius, E., eds. Theory of subject analysis: a sourcebook. Littleton:
Libraries Unlimited, p. 221-246.
Cleveland, Donald B. & Cleveland, Ana D. 2013. Introduction to indexing and abstracting. 4th
ed. Westport CT: Libraries Unlimited.
Coates, Eric J. 1988. Subject catalogs: headings and structure. 2nd ed. London: Library
Association Publishing, 186, p.
Coates, Eric J.; Lloyd, Geoffrey; Simandl, Dusan. 1981. BSO: Systeme general de clasement:
tables et index. 3a rev. Pars: FID, Unesco (PGI/81/2.0).
Commission des Communauts Europennes. Dfinition des charactristiques essentielles
des thesauri: Rapport final. Bruxelles; Bureau Marcel van Dijk, 1976, vol. 1.
Cordeiro, Mara Ins. 2003. Knowledge organization from libraries to the Web: strong
demands on the weakest side of international librarianship. En: Williamson, Nancy J. and
Beghtol, Clare, editors. Knowledge organization and classification in international
information retrieval. New York: Haworth Information Press, p. 65-79.
Currs, Emilia. 1998. Tesauros: manual de construccin y uso [en lnea]. Madrid: Kaher II.
Disponible

en

194

http://www.uam.es/personal_pdi/ciencias/ecurras/tesaurosmanualdeconstruccionyuso.p
df [Consulta 30 Abr 2014].
Dahlberg, Ingetraut. 1978. Teoria do conceito. Cincia da Informao, vol. 7, n 2, p. 101106.

Disponible

en

http://revista.ibict.br/ciinf/index.php/ciinf/article/view/1680/1286

[Consulta 30 Abr 2014].


Dahlberg, Ingetraut. 1993. Knowledge organization: its scope and possibilities. Knowledge
Organization, vol. 20, n 4, p. 211-222.
Dahlberg,

Ingetraut.

2006a.

Knowledge

organization:

new

science?

Knowledge

organization, vol. 33, n 1, p. 11-19.


Dahlberg, Ingetraut. 2006b. Definitionen aus dem Begriffsfeld Wissensorganisation. En:
Internationale Gesellschaft fr Wissensorganization, Deutsche Sektion e.V. [en lnea].
Disponible en http://www.isko-de.org/index.php?id=dahlbergdefinitionen [Consulta 30
Abr 2014].
Dalby, Andrew. 1986. Sumerian catalogs. The Journal of Library History, vol. 21, n 3, p.
475-487.
Dextre Clarke, Stella G. 2008. The last 50 years of knowledge organization: a journey
through my personal archives. Journal of Information Science, vol. 34, n 4, p. 427-437.
Dijk, Marcel van; Slipe, Georges van. 1972. El servicio de documentacin frente a la
explosin de la informacin. Buenos Aires: Consejo Nacional de Investigacin Cientfica y
Tcnica.
Doorn, Marlene van y Katrien Polman. 2010. From classification to thesaurus and back?:
subject indexing tools at the Library of the Afrika-Studiecentrum Leiden. En Knowledge
organization, vol. 37, n 3, 203-208.
Dubois, Pablo. 1987. Free text vs. controlled vocabulary: a reassessment. Online Review,
vol. 11, n 4, p. 243-253.
Dwyer, Jim. 1991. Enhancing access to information: designing catalogs for the 21st Century.
Cataloging & Classification Quarterly, vol. 13, n , p. 29-51.
Dykstra, Mary. 1988. LC subject headings disguised as a thesaurus. Library Journal, vol.
113, n 4, p. 42-46.
Ensor, Pat. 1992. User practices in keyword and boolean searching on the online public
access catalog. Information Technology and Libraries, vol. 11, n 3, p. 210-219.
Esteban Navarro, Miguel A. 1996. El marco disciplinar de los lenguajes documentales: la
organizacin del conocimiento y las ciencias sociales. Scire, vol. 2, n 1, p. 93-107.
Disponible en http://www.ibersid.eu/ojs/index.php/scire/article/view/1051 [Consulta 30
Abr 2014].
Esteban Navarro, Miguel ngel; Garca Marco, Francisco Javier. 1995. Las Primeras Jornadas
sobre Organizacin del Conocimiento: Organizacin del Conocimiento e Informacin
Cientfica.

Scire,

vol.

1,

1,

p.

149-157.Disponible

http://www.ibersid.eu/ojs/index.php/scire/article/view/1038/1020

[Consulta

30

en
Abr

2014].
Farradane, Jason E. L. 1952. A scientific theory of classification and indexing: further
considerations. Journal of Documentation, vol. 8, n2, p. 73-92.

195

Ferreyra, Diego. 2009. Explotacin de repositorios OAI a travs de la armonizacin de


vocabularios controlados. En Encuentro Nacional de Catalogadores (2 : 2009 : Buenos
Aires).

Buenos

Aires:

Biblioteca

Nacional.

http://www.bn.gov.ar/descargas/catalogadores/ponencias/251109_11a.pdf. [Consulta20
Oct 2013].
Fidel, Raya. 1991. Searchers selection of search keys: III. Searching styles. Journal of the
American Society for Information Science, vol. 42, n 7, p. 515-527.
Fidel, Raya. 1992. Who needs controlled vocabulary? Special Libraries, vol. 83, n 1, p. 1-9.
Foskett, Antony C. 1996. The subject approach to information. 5th ed. London: Library
Association Publishing.
Frncu, Victoria y Sabo, Cosmin-Nicolae. 2010. Implementation of a UDC-based multilingual
thesaurus in a library catalogue: the case of BiblioPhil. En Knowledgeorganization. Vol.
37, n 3, 209-215.
Fujita, Maringeles Spotti Lopez. 2008. Organizao e representao do conhecimento no
Brasil: anlise de aspectos conceituais e da produo cientfica do ENANCIB no perodo
de 2005 a 2007. Tendencias da Pesquisa Brasileira em Cincia da Informao, vol. 1, n
1. Disponible en http://inseer.ibict.br/ancib/index.php/tpbci/article/view/4 [Consulta 30
Abr 2014].
Garca de Kohen, Marta B.; Monfasani, Rosa E. 1984. Tesauro argentino de psicologa.
Revista Espaola de Documentacin Cientfica, vol. 7, n 3, p. 229-232.
Garca de Kohen, Marta B.; Monfasani, Rosa E. 2009. Tesauro de psicologa. Buenos Aires:
Direccin de Biblioteca de la Facultad de Psicologa de la Universidad de Buenos Aires.
Disponible en: http://bvs.psi.uba.ar/local/File/tesauro/TESAUROpresent.pdf [Consulta 30
Abr 2014].
Garca Gutirrez, Antonio L. 1990. Estructura lingstica de la documentacin: teora y
mtodo. Murcia: Universidad de Murcia.
Garca Marco, Francisco Javier. 1995. Los contenidos y la secuencia docente de la
organizacin y representacin del conocimiento: una propuesta interdisciplinar [en lnea].
Organizacin del Conocimiento en Sistemas de Informacin y Documentacin, vol. 1, p.
219-228.

Disponible

en

http://dialnet.unirioja.es/descarga/articulo/2341341.pdf

[Consulta 30 Abr 2014].


Garca Marco, Francisco Javier. 2006. Los mltiples afloramientos de la organizacin del
conocimiento en el ciclo de la informacin documental. Scire, vol. 12, n 1, p. 9-22.
Gil Leiva, Isidoro. 2008. Manual de indizacin: teora y prctica. Gijn: Trea.
Gil Urdiciain, Blanca. 2004. Manual de lenguajes documentales. 2 ed. Gijn: Trea.
Gilchrist, Alan. 2011. A note on the theory and practice of knowledge organization and
knowledge

representation.

Scire,

vol.

17,

1,

p.

23-28.

http://www.ibersid.eu/ojs/index.php/scire/article/view/3920/3635

Disponible

[Consulta

30

en
Abr

2014].
Gnoli, Claudio. 2011. Ontological foundations in knowledge organization: the theory of
integrative levels applied in citation order. Scire, vol. 17, n 1, p. 29-34.
Gnoli, Claudio. 2007. Progress in synthetic classification: towards unique definitions of
concepts [en lnea]. En: UDC Seminar 4 -5 June 2007: The Hague: UDC Consortium.

196

Disponible

en

http://arizona.openrepository.com/arizona/bitstream/10150/105614/1/synthetic.pdf
[Consulta 30 Abr 2014].
Gottschalk, Peter. 2007. Knowledge management systems: value shop creation. Hershey PA:
Idea Group.
Granados Colillas, Maringels y Anna Nicolau. 2008. Improving subject searching
Granados, Maringels y Anna Nicolau. 2007. Aplicacin de un nuevo sistema de indizacin en
una coleccin de recursos especializados en ciencias de la educacin. En El profesional de
la

informacin,

vol.

16,

6,

627-635.

Disponible

en

http://www.elprofesionaldelainformacion.com/contenidos/2007/noviembre/09.pdf
[Consulta 30 Abr 2014].
Guimares, Jos Augusto Chaves de. 2001a. Ensino de tratamento temtico da informao
nos cursos de biblioteconoma do Mercosur: anlise e perspectivas de un core curriculum
luz dos avanos tericos da rea de organizao do conhecimento. Marilia: Faculdade
de Filosofia e Cincias da UNESP.
Guimares, Jos Augusto Chaves de. 2001b. Brasil: principales tendencias y enfoques en el
rea. En: Arest, Alicia & Ceretta, Mara Gladys, comp. Actas del IV Encuentro de
Directores y III de Docentes de Escuelas de Bibliotecologa y Ciencia de la Informacin
del Mercosur, Montevideo, 24-27 de mayo de 2000. Montevideo: Universidad de la
Repblica, p. 336-339.
Guimares, Jos Augusto Chaves de. 2008. A dimenso terica do tratamento temtico da
informao e suas interlocues com o universo cientfico da International Society for
Knowledge Organization (ISKO). Revista Ibero-americana de Cincia da Informao, vol.
1,

1,

p.

77-99.Disponible

en

http://seer.bce.unb.br/index.php/RICI/article/view/2761/2331 [Consulta 30 Abr 2014].


Guimares, Jos Augusto Chaves de. 2009. Abordagens tericas de tratamento temtico da
informao (TTI): catalogao de assunto, indexao e anlise documental. Ibersid:
Revista de Sistemas de Informacin y Documentacin, vol. 3, p. 107-117. Disponible en
http://www.ibersid.eu/ojs/index.php/ibersid/article/view/3730 [Consulta 30 Abr 2014].
Guimares, Jos Augusto; Pinho, Fabio Assis & Ferreira, Gustavo Maletti. 2012. Relaes
tericas da organizao do conhecimento com as abordagens de catalogao de assunto,
indexao e anlise documental: uma anlise de dominio da revista Scire (1995-2010).
Scire,

vol.

18,

2,

p.

31-41.

Disponible

en

http://www.ibersid.eu/ojs/index.php/scire/article/view/3971 [20 Oct 2013].


Guinchat, Claire; Menou, Michel. 1990. Introduccin general a las ciencias y tcnicas de la
informacin y la documentacin. 2 ed. Pars: Unesco.
Hill, Linda; Koch, Traugott. 2001. Networked knowledge organization systems: introduction
to a special issue [editorial]. Journal of Digital Information, vol. 1, n 8.Disponible en
http://journals.tdl.org/jodi/article/view/32/33 [20 Oct 2013].
Hjerppe, Roland. 1990. A framework for characterizing systems for knowledge organization:
a first basis for comparisons and evaluations. Advances in Knowledge Organization, vol.
3, p. 21-34.

197

Hjerppe, Roland. 1996. Go with the flow, or abide by the side, or watch the waves?:
challenges of change for knowledge organization. Advances in Knowledge Organization,
vol. 5, p. 10-25.
Hjrland, Birger & Albrechtsen, Hanne. 1995. Toward a new horizon in information science:
domain-analysis. Journal of the American Society for Information Science, vol. 46, n 6,
p. 400-425.
Hjrland, Birger. 2006. Indexing language. En: Lifeboat for knowledge organization. [s.L.]:
The

Author.

Disponible

en

http://www.iva.dk/bh/lifeboat_ko/CONCEPTS/indexing_languages.htm [Consulta20 Oct


2013].
Hjrland, Birger. 2007a. Semantics and knowledge organization. Annual Review of
Information Science and Technology, vol. 41, p. 367-404.
Hjrland, Birger. 2007b. Semantic tool.En: Lifeboat for knowledge organization. [s.L.]: The
Author. Disponible en http://www.iva.dk/bh/lifeboat_ko/CONCEPTS/semantic_tools.htm
[Consulta20 Oct 2013]
Hjrland, Birger. 2008a. What is knowledge organization (KO)? Knowledge Organization, vol.
35, n 2/3, p. 86-102.
Hjrland, Birger. 2008b. Knowledge organization systems. En: Lifeboat for knowledge
organization.

[s.L.]:

The

Author.

Disponible

en

http://www.iva.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_systems.htm
[Consulta 30 Abr 2014].
Hodge, Gail. 2000. Systems of knowledge organization for digital libraries: beyond traditional
authority files. Washington DC: Digital Library Federation, Council on Library and
Information Resources. Disponible en: http://clir.org/pubs/reports/pub91/contents.html
[Consulta 30 Abr 2014].
Hudon, Michle. 1996. Preparing terminological definition for indexing and retrieval thesauri:
a model. Advances in Knowledge Organization, v. 5, p. 363-369.
Hudon, Michle. 2003. True and tested products: thesauri on the Web. The Indexer, vol. 23,
n 3, p. 115-119.
ICONTEC (Instituto Colombiano de Normas Tcnicas y Certificacin). 1998. Documentacin:
Gua para el establecimiento y desarrollo de tesauros monolinges. 2a actualizacin.
Bogot: El Instituto (NTC 1476:1998).
IFLA (International Federation of Library Associations and Institutions). 2004. Requisitos
funcionales de los registros bibliogrficos. Madrid: Ministerio de Cultura. Disponible en
http://www.ifla.org/files/assets/cataloguing/frbr/frbr-es.pdf[20 Oct 2013].
IFLA (International Federation of Library Associations and Institutions). 2009a. Guidelines for
multilingual thesauri. The Hague: The Federation. (IFLA professional reports, n
115).Disponible

en

http://archive.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf

[Consulta 30 Abr 2014].


IFLA (International Federation of Library Associations and Institutions). 2009b. Requisitos
funcionales de los datos de autoridad (FRAD): un modelo conceptual. La Haya: La
Federacin. Disponible en http://www.ifla.org/files/assets/cataloguing/frad/frad_2009es.pdf [Consulta 30 Abr 2014].

198

IFLA (International Federation of Library Associations and Institutions). 2010. Functional


requirements for subject authority data: a conceptual model. The Hague: The
Federation. Disponible en http://www.ifla.org/files/classification-and-indexing/functionalrequirements-for-subject-authority-data/frsad-final-report.pdf [Consulta 30 Abr 2014].
IFLA (International Federation of Library Associations and Institutions). 2011.Guidelines for
subject access in national bibliographies. The Hague: The Federation. Disponible en
http://www.ifla.org/files/assets/classification-and-indexing/subject-access-by-nationalbibliographic-agencies/nba_guidelines_draft_2011-05.pdf [Consulta 30 Abr 2014].
IRAM (Instituto Argentino de Normalizacin y Certificacin). 1983. Tesauros monolinges
para la recuperacin de informacin: estructura y desarrollo. Buenos Aires: El Instituto
(IRAM 32057:1983).
IRAM

(Instituto

Argentino

de

Normalizacin

Certificacin).

2007.

Informacin

documentacin: indicadores de desempeo en bibliotecas. Buenos Aires: IRAM, 2007


(IRAM-ISO 11620:2007).
ISKO (International Society for Knowledge Organization). 1996. Compatibility and integration
of order systems: research seminar proceedings of the TIP/ISKO Meeting (1995 :
Warsaw). Warsaw: Stowarzyszenie Bibliotekarzy Polskich.
ISO (International Organization for Standardization). 1985. Documentation: guidelines for
the establishment and development of multilingual thesauri. Geneva: The Organization
(ISO 5964:1985).
ISO (International Organization for Standardization). 1986. Documentation: guidelines for
the establishment and development of monolingual thesauri. 2nd ed. Geneva: The
Organization (ISO 2788:1986).
ISO (International Organization for Standardization). 2001. Information and documentation:
vocabulary. Geneva: The Organization (ISO 5127:2001).
ISO (International Organization for Standardization). 2002. Codes for the representation of
names of languages. Part 1: Alpha-2 code. Geneva: The Organization (ISO 639-1:2002).
ISO (International Organization for Standardization). 2005. Quality management systems:
fundamentals and vocabulary = Systmes de management de la qualit: principles
essentiels et vocabulaire. Geneva: The Organization (ISO 9000:2005).
ISO (International Organization for Standardization). 2009. Terminology work: principles and
methods = Travail terminologique: principles et methodes. Geneva: The Organization
(ISO 704:2009).
ISO (International Organization for Standardization). 2013. Information and documentation:
thesauri and interoperability with other vocabularies: Part 2. Interoperability with other
vocabularies. Geneva: The Organization (ISO 25964-2:2013).
ISO (International Organization for Standardization).2011. Information and documentation:
thesauri and interoperability with other vocabularies: Part 1. Thesauri for information
retrieval.Geneva: The Organization (ISO 25964-1:2011).
ISSN International Center. 2011. Total number of records in the ISSN register. Paris: The
Center.

Disponible

en

http://www.issn.org/files/issn/statistiques/Total-number-of-

records.pdf [Consulta 30 Abr 2014].

199

Kilgour, Frederick G. 1998. Origins of coordinate searching. En: Hahn, Trudi B.; Buckland,
Michael K., editors. Historical studies in information science. Medford NJ: Information
Today, p. 107-115.
Lancaster, Frederick W. 1985. A thesaurus construction and use: a condensed course. Paris:
Unesco

(PGI-85/WS/11).

Disponible

en

http://unesdoc.unesco.org/images/0007/000703/070359eb.pdf [Consulta 30 Abr 2014].


Lancaster, Frederick W. 1995. Indizacin y resmenes: teora y prctica. Buenos Aires: EB
Publicaciones.
Lancaster, Frederick W. 2002 [1986]. El control del vocabulario en la recuperacin de
informacin. 2 ed. Valencia: Universitt de Valencia. (Colleccio Educaci. Materials).
Liang, Anita C. et al. 2005. The mapping schema from Chinese Agricultural Thesaurus to
AGROVOC. En Agricultural Ontology Service Workshop on Ontologies: the More Practical
Issues and Experience. (6th : 2005 : Vila Real, Portugal). Rome: Food and Agriculture
Organization. ftp://ftfao.org/docrep/fao/008/af241e/af241e00.pdf.

[Consulta20

Oct

2013].
Lpez Yepes, Jos, coord. 2004. Diccionario enciclopdico de ciencias de la documentacin.
Madrid: Sntesis.
Lyons, John. 1984. Introduccin al lenguaje y a la lingstica. Barcelona: Teide, p. 1-24.
Lyons, John. 1997. Semntica lingstica: una introduccin. Barcelona: Paids Ibrica.
Ma, Xiaogang; Carranza, Emmanuel J.M.; Wu, Chonglong; Meer, Freek D. van der & Liu,
Gang. 2011. Computers & Geosciences, vol. 37, p. 1602-1615. Disponible en
http://tw.rpi.edu/media/2013/03/07/a10a/skos_cg.pdf [Consulta 30 Abr 2014].
Macgregor, George; Joseph, Anu & Dennis, Nicholson. 2007. A SKOS core approach to
implementing and M2M terminology mapping server. En: International Conference on
Semantic Web and Digital Libraries (ICSD-2007), Bangalore, February 21-13, 2007.
Disponible en http://strathprints.strath.ac.uk/2970/1/strathprints002970.pdf. [Consulta
30 Abr 2014].
Martnez Tamayo, Ana M. & Valdez, Julia C. 2009. Indizacin y clasificacin en bibliotecas.
Buenos Aires: Alfagrama.
Martnez Tamayo, Ana M.; Mendes, Paola V. 2010. La norma argentina de construccin de
tesauros IRAM 32057: necesidad de actualizacin. 1. El vocabulario controlado.
Informacin,

cultura

sociedad,

21,

p.

11-30.

Disponible

en

http://www.scielo.org.ar/pdf/ics/n21/n21a02.pdf [Consulta 30 Abr 2014].


Martnez Tamayo, Ana M.; Ristuccia, Cristina A., Stubbs, Edgardo A., Valdez, Julia C.,
Gamba, Viviana L., Mendes, Paola V., Unzurrunzaga, Carolina; Caminotti, Mara L. 2009.
Concepto, forma y longitud de los trminos preferentes del tesauro: una propuesta de
indicadores de calidad. Anales de Documentacin, n 13, p. 185-195. Disponible en
http://revistas.um.es/analesdoc/article/viewFile/107151/101821

[Consulta

15

Nov

2011].
Martnez Tamayo, Ana M.; Ristuccia, Cristina A., Stubbs, Edgardo A., Valdez, Julia C.,
Gamba, Viviana L., Mendes, Paola V., Unzurrunzaga, Carolina; Caminotti, Mara L.
2011b. La estructura sistemtica del tesauro: indicadores para evaluar su calidad.
Revista Espaola de Documentacin Cientfica, vol. 34, n 1, p. 29-43. Disponible en

200

http://redc.revistas.csic.es/index.php/redc/article/view/681/755.

[Consulta

15

Nov

2011].
Martnez Tamayo, Ana M.; Valdez, Julia C.; Stubbs, Edgardo A.; Gonzlez Tern, Yanina;
Kesler,

Mara

Ins.

2011a.

Interoperabilidad

de

sistemas

de

organizacin

del

conocimiento: el estado del arte. Informacin, Cultura y Sociedad, n 24, p. 15-37.


Disponible en http://www.scielo.org.ar/pdf/ics/n24/n24a02.pdf [Consulta 30 Abr 2014].
Mayr, Philipp & Petras, Vivien. 2008. Cross-concordances: terminology mapping and its
effectiveness for information retrieval. En World Library and Information Congress, IFLA
General

Conference

and

Council. (74th : 2008

: Qubec). The

Hague: IFLA,

2008. http://archive.ifla.org/IV/ifla74/papers/129-Mayr_Petras-en.pdf. [Consulta20 Oct


2013].
Mayr, Philipp &Petras, Vivien. 2009. Cross-concordances: terminology mapping and its
effectiveness for information retrieval. En International cataloging and bibliographic
control. Vol. 38, n 3, 43-52.
McCulloch, Emma y George Macgregor. 2008. Analysis of equivalence mapping for
terminology services. En Journal of information science. Vol. 34, n 1, 70-92.
Mijailov,

Alexandre

I.

&

Guiliarevskii,

Rudzhero

S.

1974.

Curso

introductorio

de

informtica/documentacin. Caracas: Fundacin Instituto Venezolano de Productividad.


Miller, Joseph & Bristow, Barbara A., editor. 2007. Sears list of subject headings. 19thed. New
York: H.W. Wilson.
Miller, Uri. 1997. Thesaurus construction: problems and their roots. Information Processing
and Management, vol. 33, n 4, p. 481-493.
Miller, Uri; Ruth Teitelbaum. 2002. Pre-coordination and post-coordination: past and future.
Knowledge Organization, vol. 29, n. 2, p. 87-93.
Mills, Jack. 1960. A modern outline of library classification. 2nd ed. London: Chapman & Hall.
Mills, Jack. 2004. Library classification and logical division in information retrieval. Library
Trends, vol. 52, n 3, p. 541-570.
Molina, Celia; Ztara, Ethel. 1998. Actividades terminolgicas en la Argentina: enfoque desde
la bibliotecologa y la documentacin [en lnea]. En Actas del VI Simposio de RITERM, La
Habana, 1998. [s.L.]: RITERM, 1998.
Morn, Edgar. 2012. Qu es transdisciplinariedad? [en lnea]. Mxico DF: Multiversidad
Mundo Real. Disponible en http://www.edgarmorin.org/que-es-transdisciplinariedad.html
[Consulta 15 May 2014].
Naumis Pea, Catalina. 2003. Indizacin y clasificacin: un problema conceptual y
terminolgico. Documentacin de las Ciencias de la Informacin, vol. 26, p. 23-40.
Disponible

en

http://revistas.ucm.es/index.php/DCIN/article/view/DCIN0303110023A/19329 [Consulta
30 Abr 2014].
Naumis Pea, Catalina. 2008. Los tesauros documentales y su aplicacin en la informacin
impresa, digital y multimedia. Buenos Aires: Alfagrama.
Neelamegan, Arashanapalai & Lalitha, S.K. 2013. Multilingual thesaurus and interoperability.
DESIDOC Journal of Library & Information Technology, vol. 33, n 4, p. 289294.Disponible

en

201

http://www.publications.drdo.gov.in/ojs/index.php/djlit/article/view/4883/2841
[Consulta 30 Abr 2014].
Nicholson, Dennis y Emma McCulloch. 2006. Interoperable subject retrieval in a distributed
multi-scheme environment: new developments in the HILT Project. En Scire. Vol. 12, n
1,

109-124. http://ibersid.eu/ojs/index.php/scire/article/view/1589/1561.

[Consulta20

Oct 2013].
Nicholson, Dennis. 2002. Subject-based interoperability: issues from the high level thesaurus
(HILT)

Project.

En

IFLA

Council

and

General

Conference.

(68th

Glasgow). http://archive.ifla.org/IV/ifla68/papers/006-122e.pdf. [Consulta20 Oct 2013].


NISO (National Information Standards Organization). 2005. Guidelines for the construction,
format, and management of monolingual controlled vocabularies. Bethesda MD: NISO
Press

(ANSI/NISO

Z39.19:2005).

http://www.niso.org/apps/group_public/download.php/6487/Guidelines%20for%20the%
20Construction,%20Format,%20and%20Management%20of%20Monolingual%20Controll
ed%20Vocabularies.pdf. [Consulta20 Oct 2013].
Oficina Nacional de Normalizacin. 2000. Directrices para el establecimiento y desarrollo de
tesauros monolinges. La Habana: La Oficina. (Norma cubana 2788:2000). Disponible en
http://www.sld.cu/galerias/pdf/sitios/centromed/nc_iso_202788_directrices_para_el_est
ablecimiento_y_desarrollo_de_tesauros_monolingues.pdf [Consulta 30 Abr 2014].
Owens, Leslie A.; Cochrane, Pauline A. 2004. Thesaurus evaluation. En: Roe, Sandra K.;
Thomas, Alan R., editores. The thesaurus: review, renaissance, and revision. New York:
Haworth Information Press, p. 87-102.
Oxford University Press. 2013. Oxford advanced learners dictionary. Oxford: Oxford
University Press. Disponible en http://oald8.oxfordlearnersdictionaries.com/ [Consulta20
Oct 2013].
Pea Vera, Tania. 2010. El acceso al saber requiere aplicar organizacin y representacin del
conocimiento. Revista Interamericana de Bibliotecologa, vol. 33, n 1, p. 13-29.
Disponible en http://eprints.rclis.org/17281/1/5800.pdf [Consulta 30 Abr 2014].
Pea Vera, Tania. 2011. Organizacin y representacin del conocimiento: incidencia de las
tecnologas de la informacin y la comunicacin. Buenos Aires: Alfagrama.
Pinto Molina, Mara, editor. 2001. Catalogacin de documentos: teora y prctica. 2 ed.
Madrid: Sntesis (Bibliotecologa y Documentacin.
Prytherch, Raymond J. 2004. Harrods librarians glossary and reference book: a dictionary of
over 10.200 terms, organizations, projects and acronyms in the areas of information
management, library science, publishing and archive management. 10th ed. Hants:
Ashgate Publishing Ltd.
Ranganathan, Shiyali Ramamrita. 1933. Colon classification. Madras: The Madras Library
Association.
Ranganathan, Shiyali Ramamrita. 1937. Prolegomena to library classification. Madras: The
Madras Library Association.
Ranganathan, Shiyali Ramamrita. 1967. Prolegomena to library classification. 3rd ed.
London:

Asian

Publishing

202

House.

Disponible

en

http://arizona.openrepository.com/arizona/handle/10150/106370

[Consulta

30

Abr

2014].
Real Academia Espaola. 2013. Diccionario de la lengua espaola. 22 ed. Madrid: La
Academia. Disponible en http://www.rae.es [Consulta 30 Abr 2014].
Revert, Carmen & Sebasti, Montserrat. 2009. Aquatic science subject Gateway Project as a
model of interoperability. En ISKO-UK 2009 Conference. (2009 : London). London: ISKOUK

Chapter. http://www.iskouk.org/conf2009/papers/reverte_ISKOUK2009.pdf.

[Consulta20 Oct 2013].


Riaz, Muhammad. 1989. Advanced indexing and abstracting practices. New Delhi: Atlantic
Publishers & Distributors, 1989.
Roberts, Norman. 1985. The pre-history of the information retrieval thesaurus. Journal of
Documentation, vol. 40, n 4, p. 271-285.
Rolland-Thomas, Paule. 1989. Thesaural codes: an appraisal of their use in the Library of
Congress subject headings. Cataloging and Classification Quarterly, vol. 16, n 2,p. 7191.
Rowley, Jennifer. 1994. The controlled versus natural indexing languages debate revisited: a
perspective on information retrieval practice and research. Journal of Information
Science, vol. 20, n 2, p. 108-118.
Ruiz Prez, Rafael. 1992. El anlisis documental. Granada: Universidad de Granada.
San Segundo, Rosa. 2007. Incidencia de aspectos culturales y sociales en la organizacin del
conocimiento transdisciplinar. Actas del 8 Congreso ISKO-Espaa, Len, 18-20 de abril
de 2007. Len: Universidad de Len.
Schneider, Jesper W. 2004. Verification of bibliometric methods applicability for thesaurus
construction PhD Thesis. Copenhaguen: Royal School of Library and Information
Science.
Shearer, James R. 2004. A practical exercise in building thesaurus. En: Roe, Sandra K.;
Thomas, Alan R., editores. The thesaurus: review, renaissance, and revision. Binghamton
NY: Haworth Information Press, p. 35-56.
Shiri, Ali & Revie, Crawford. 2006. Query expansion behavior within a thesaurus-enhanced
search environment: a user-centered evaluation. Journal of the American Society for
Information Science and Technology, vol. 57, n 4, p. 462-478.
Souza, Renato Rocha; Tudhope, Douglas &Almeida, MaurcioBarcellos. 2010. The KOS
spectra: a tentative typology of knowledge organization systems. En: Gnoli, Claudio &
Mazzocchi, Fulvio, editors. Paradigms and conceptual systems in knowledge organization:
Proceedings of the Eleventh International ISKO Conference, 23-26 February 2010.
Advances in Knowledge Organization, vol. 12, p. 122-128.
Souza, Renato Rocha; Tudhope, Douglas &Almeida, MaurcioBarcellos. 2012. Toward a
taxonomy of KOS. Knowledge Organization, vol. 39, n 3, p. 179-192.
Spiteri, Louise. 1999. A simplified model for facet analysis. Canadian Journal of Information
and

Library

Science,

vol.

23,

1,

p.

1-30.Disponible

http://iainstitute.org/en/learn/research/a_simplified_model_for_facet_analysis.php
[Consulta 30 Abr 2014].

203

en

Svenonius, Elaine. 1986. Unanswered questions in the design of controlled vocabularies.


Journal of the American Society for Information Science, vol. 37, n 5, p. 331-340.
Svenonius, Elaine. 2000. The intellectual foundation of information organization. Cambridge
MT: MIT Press (Digital libraries and electronic publishing).
Svenonius, Elaine. 2003. Design of controlled vocabularies. En: Encyclopedia of library and
information

science.

New

York:

Marcel

Dekker.

http://polaris.gseis.ucla.edu/gleazer/260_readings/Svenonius.pdf.

Disponible

en

[Consulta20

Oct

2013].
Taylor, Arlene G. 2004. The organization of information. 2nd ed. Westport: Libraries
Unlimited.
Tennis, Joseph T. 2003. Two axes of domains for domain analysis. Knowledge Organization,
vol. 30, n 3/4, p. 191-195.
Tennis, Joseph T. 2004. Layers of meaning: disentangling subject access interoperability. En
Advances

in

classification

research.

Vol.

12,

122. http://faculty.washington.edu/jtennis/Tennis_layers_2001.pdf.

113-

[Consulta20

Oct

2013].
Tenopir, Carol. 1984. Searching Harvard Business Review Online: lessons in searching a full
text database. Online, vol. 9, p. 71-78.
Todaro,

Alicia

J.;

Martnez

Tamayo,

Ana

M.

2006a.

Las

razas

en

una

lista

de

encabezamientos de materia en espaol. Cincia da Informao, vol. 35, n 3, p. 272281 Disponible en http://www.scielo.br/pdf/ci/v35n3/v35n3a27.pdf [Consulta 30 Abr
2014.
Todaro, Alicia J.; Martnez Tamayo, Ana M. 2006b. La mujer en una lista de encabezamientos
de materia para bibliotecas. Investigacin Bibliotecolgica (Mxico), vol. 20, n 41, p.
195-206.

Disponible

en

http://www.scielo.org.mx/scielo.php?pid=S0187-

358X2006000200009&script=sci_arttext[Consulta20 Oct 2013].


Tudhope,

Douglas;

Alani,

Harith;

Jones,

Christopher.

2001.

Augmenting

thesaurus

relationships: possibilities for retrieval. Journal of Digital Information, vol. 1, n 8.


Disponible en http://journals.tdl.org/jodi/index.php/jodi/article/view/181 [Consulta 15
Ago 2013].
Tudhope, Douglas; Koch, Taugott & Heere, Rachel. 2006. Terminology services and
technology:

JISC

state

of

the

art

review.

[s.L.]:

JISC.

Disponible

en

http://opus.bath.ac.uk/23563/
Tudhope, Douglas; Koch, Traugott. 2004. New applications of knowledge organization
[editorial].

Journal

of

Digital

Information,

vol.

4,

4.

Disponible

en

http://journals.tdl.org/jodi/article/view/109/108 [20 Oct 2013].


Unesco (Organizacin de las Naciones Unidas para la Educacin, la Ciencia y la Cultura).
1971. Guidelines for the establishment and development of monolingual thesauri for
information

retrieval.

Paris:

La

Organizacin.

Disponible

en

http://unesdoc.unesco.org/images/0000/000059/005951eb.pdf. [Consulta20 Oct 2013].


Varlejs, Jana. 2004. The technical report and its impact on post-World War II information
systems: two case studies. En: Rayward, W. Boyd; Bowden, Mary Ellen, editors. The
history and heritage of scientific and technological information systems: proceedings of

204

the

2002

Conference,

p.

89-99.

Disponible

en

http://books.google.com.ar/books?id=76OOQannpBgC&pg=PA89&dq=WWII+information
+kilgour&hl=es&ei=S1AbTo72IIfq0gGbvmWBQ&sa=X&oi=book_result&ct=result&resnum=7&ved=0CEwQ6AEwBg#v=onepage&
q&f=false [Consulta 30 Abr 2014].
Vickery, Brian C. 1960a. Faceted classification: a guide to construction and use of special
schemes. London: Aslib.
Vickery,

Brian

C.

1960b.

Thesaurus:

new

word

in

documentation.

Journal

of

Documentation, vol. 16, n 4, p. 181-189.


Vizcaya Alonso, Dolores. 1997. Lenguajes documentarios. Rosario: Nuevo Parhadigma.
Vizine-Goetz, Diane; Carol Hickey; Andrew Houghton & Roger Thompson. 2004. Vocabulary
mapping for terminology services. En Journal of digital information, vol.4 n 4.
http://journals.tdl.org/jodi/article/view/114/113. [Consulta 30 Abr 2014].
W3C (World Wide Web Consortium). 2009. Manual de SKOS (simple knowledge organization
system): nota del Grupo de Trabajo del W3C de 18 de agosto de 2009. [s.L.]: El
Consorcio. http://skos.um.es/TR/skos-primer/ [Consulta 30 Abr 2014].
W3C (World Wide Web Consortium). 2011. W3C semantic Web activity. Disponible en
http://www.w3.org/2001/sw/ [Consulta20 Oct 2013].
Wang, Jun. 2003. A knowledge network contructed by integrating classification, thesaurus,
and metadata in digital library. En International information & library research. Vol. 35,
n 2/4, 383-397.
Wersig, Gernot & Neveling, Ulrich. 1976. Terminology of documentation. Paris: Unesco.
Wilson, Tom D. 2002. The nonsense of knowledge management. Information Research, vol.
8, n 1. Disponible en http://informationr.net/ir/8-1/paper144.html
Zeng, Marcia Lei. 2008. Knowledge organization systems (KOS). Knowledge Organization,
vol. 35, n 2/3, p. 160-182.
Zeng, Marcia y Maja Zummer. 2009a. Mapping FRSAD model and other abstract models.En
ISKO-UK

2009

Conference.

(2009

London).

London:

http://www.iskouk.org/conf2009/papers/zeng_ISKOUK2009.pdf.

ISKO-UK
[Consulta

Chapter.
30

Abr

2014].
Zeng, Marcia y Maja Zummer. 2009b. Introducing FRSAD and mapping it with SKOS and
other models. En:Proceedings of the World Library and Information Congress, IFLA
General

Conference

and

Council.

(75th

2009

Milan).

The

Hague:

IFLA. http://conference.ifla.org/past/2009/200-zeng-en.pdf [Consulta 30 Abr 2014].


Zeng, Wen. 2012. Exploration and study of multilingual thesauri automation construction for
digital libraries in China. Electronic Library, vol. 30, n 2, p. 233-247.
Zhang, Xueying. 2006. Concept integration of document databases using different indexing
languages. Information Processing & Management. Vol. 42, n 1, 121-135.
Ztara de Ribezzo, Ethel, coord. 1980. Tesauro sobre recursos hdricos. Ezeiza: Instituto
Nacional del Agua y del Ambiente.

205

S-ar putea să vă placă și