Sunteți pe pagina 1din 195

UNIVERSIDADE FEDERAL DE MINAS GERAIS

ESCOLA DE CINCIA DA INFORMAO

Benildes Coura Moreira dos Santos Maculan

TAXONOMIA FACETADA NAVEGACIONAL:


construo a partir de uma matriz categorial
para trabalhos acadmicos

Belo Horizonte
Junho, 2011

Benildes Coura Moreira dos Santos Maculan

TAXONOMIA FACETADA NAVEGACIONAL:


construo a partir de uma matriz categorial
para trabalhos acadmicos

Dissertao apresentada para exame da


banca do Programa de Ps-Graduao em
Cincia da Informao, da Escola de Cincia
da Informao da Universidade Federal de
Minas Gerais, como requisito para obteno
do ttulo de Mestre em Cincia da Informao.
Linha de Pesquisa: Organizao e Uso da
Informao
Orientadora: Gercina
Oliveira Lima

Belo Horizonte
Junho, 2011

ngela

Borm

de

M175t
2011

Maculan, Benildes Coura Moreira dos Santos


Taxonomia facetada navegacional : construo a partir de uma matriz
categorial para trabalhos acadmicos [manuscrito]. / Benildes Coura Moreira dos
Santos Maculan. 2011.
191f. : enc.
Orientadora: Gercina ngela Borm de Oliveira Lima.
Dissertao (Mestrado) Universidade Federal de Minas Gerais, Escola de
Cincia da Informao.
Bibliografia: f. 141
1. Organizao da informao. 2. Recuperao da informao. 3. Bibliotecas
digitais. 4. Ferramentas de busca. 5. Biblioteca digital de teses e dissertaes. 6.
Taxonomia facetada navegacional. 7. Navegao facetada. 8. Matriz categorial
para trabalhos acadmicos. 9. Teoria da anlise do domnio. 10. Anlise categorial
temtica. I. Lima, Gercina ngela Borm de Oliveira. II. Universidade Federal de
Minas Gerais, Escola de Cincia da Informao. III. Ttulo.
CDU: 025.49:004.55

Dedico este trabalho


ao meu filho Sandro,
que me encanta,
que entende o caos de meus pensamentos e ideias,
ordenando-os,
que compartilha minhas dores e muitas alegrias:
te amo, filhinho.

Dedico, ainda,
a meu pai (in memoriam)
em quem sempre me espelhei.

AGRADECIMENTO ESPECIAL
Agradeo especialmente professora Gercina A. B. de O. Lima, que inicialmente foi
orientadora, depois amiga, e, hoje, um gostoso misto disso tudo.
Sou sua orientada desde 2007, ainda na iniciao cientfica, e, desde ento, venho
aprendendo muito com ela, minha eterna Mestre.
Em um dado momento, tornamo-nos amigas...
Como amiga, sentiu minhas dores... Tambm riu de minhas bobagens!
E nos divertimos bastante...
E trabalhamos muito!
Ento, meu agradecimento para a amiga e para a orientadora...
Como amiga esteve sempre por perto, efetiva e afetivamente entendendo o que passei no
mestrado, e sendo solidria em todos os momentos.
J como orientadora, se manteve firme nas exigncias, mas constantemente paciente,
encorajadora e generosa.
E sempre disposta a tirar o melhor de mim.
Nossa convivncia composta de liberdade, empatia e comprometimento.
Obrigada Gessy, pois voc especial para mim e abenoada pelos Anjos!
Obrigada, por me ensinar!

AGRADECIMENTOS
No me dem um espao para escrever livremente... eu aproveito!
Deus Superior, que me conforta, ilumina e a quem sou grata pelo muito que tenho, ainda
que, s vezes, no entenda seus desgnios. Agradeo a Ele por me fazer otimista!
Aos meus pais, de quem me orgulho e dos quais aprendi importantes lies (e ainda
aprendo!).
Ao meu filho Sandro, com quem tenho muitas afinidades e admiro a inteligncia, lealdade e
companheirismo. Se chegar a um impasse, sei que posso contar com ele e com sua clareza
de ideias. Sua contribuio neste estudo foi inestimvel, principalmente nos ltimos
momentos. Obrigada, filhinho!
Patrcia, querida mediadora, e Serginho, meus filhos por afeio. E ao Xande, por toda a
ateno e considerao, o que no tem preo.
Tininha, mais que uma estimada e querida irm, uma filha por afeto. E ao Wagner, pela
amizade e carinho sem medida.
Libria, meu anjo da guarda, que cuida de mim, principalmente nos ltimos seis anos.
minha famlia, to numerosa que seria impossvel citar: irmos, irms, cunhados e
cunhadas, com os quais festejo e decomponho tristezas.
minha irm Isabel, especialmente, que tambm leu este trabalho.
Aos sobrinhos e sobrinhas, suas namoradas e namorados, e queridos agregados! Adoro a
todos vocs, ao que compartilhamos e a nossas sadas juntos!
Aos amigos de infncia, dos tempos memorveis em Monl.
turma de amigos do Sandro, aos quais verdadeiramente estimo, valorizo e aprecio. Adoro
a companhia e convvio!
Noca, amiga que sempre cuida de mim.
Ao marco ECI em minha vida, na graduao em Biblioteconomia, em 2005, que me fez
renascer. Encontrei amigos, desafios e um mundo acadmico desconhecido, que me salvou!
Na trajetria at aqui, muitas pessoas foram importantes: obrigada! Esto todos guardados
em meu corao.
profa. Marlene, primeira incentivadora, acertando-me com palavras animadoras.
profa. Beatriz, primeira orientadora: fui sua monitora e ela me incentivou a querer mais.
profa. Adriana Bogliolo que estimulou-me a escrever o primeiro artigo.
Aos professores que instigaram-me em sala de aula: Adriana, Alcenir, Antnio, Bax, Beatriz,
Bernadete, Casal, Cludia, Devanir, Eduardo, Gercina, Guiomar, Helena, Leandro, Ldia,
Mrcia Milton, Marlene, Marta Arajo, Marta Aun, Maurcio, Mnica, Oswaldo, Paulo da
Terra, Renato, Ricardo, Vander e Vera.

Aos professores de fora de sala de aula, dos quais me orgulho: Ana Maria, Cida Moura,
Conceio, Cristina, Jorge Tadeu, Jlia, Marlia, Marta Pinheiro, Lgia e Rose.
Aos professores Alcenir, Bernadete, Casal, Cristina, Guiomar, Mnica e Paulo da Terra, pelo
carinho especial.
Aos funcionrios e colaboradores da ECI, sobretudo a Claudinha, Lucimeire, Luiz Henrique,
Roberto, Snia, Walisson.
Aos eternos amigos da sala dos bolsistas, com os quais aprendi demais, especialmente
Aline, Aninha e Lorena.
Carol Cota, estimada amiga, que esteve comigo toda a graduao e que sempre
generosa comigo. Que leu, palpitou e normalizou este trabalho. Que me aceita, implica, s
vezes, e a quem abuso com meus pedidos de ltima hora: e ela nunca falha! Vale ouro!
Aos colegas de graduao, pela cumplicidade desse tempo inesquecvel, em especial ao
Diplofundo, Cris, Ju, Michella e Raquel.
Aos colegas de ps-graduao, pelo conhecimento compartilhado.
Graciane, querida amiga, to determinada e disciplinada! Alma boa!
Fernanda, valiosa amiga, de todas as horas, pelos momentos divididos e pelas alegrias
multiplicadas. Ta-ta-de-mais!
rica Sarsur, pelas correes, pontuaes e melhoras lingusticas neste texto.
Aos colegas do MHTX, entre bolsistas e orientandos, pelo enriquecimento advindo das
calorosas discusses, pela ajuda dos bolsistas e, tambm, pela saudosa MHTXroska.
ajuda inestimvel de Patrcia Penido.
Ao Flvio Pontes, por sua grande contribuio nesta pesquisa, pelas figurinhas trocadas, por
sua seriedade, dedicao e comprometimento.
s professoras Cristina, Ldia e Madalena, pelas valiosas contribuies na etapa de
qualificao.
Aos amigos da secretaria do PPGCI, Clio, Gisele e Nely, pela competncia do trabalho e
pelo constante apoio administrativo e no atendimento de excelncia. Vocs so demais!
Aos amigos da Biblioteca Etelvina Lima, especialmente Elaine e Eliane, pelo suporte,
sobretudo no momento de levantamento de dados deste trabalho.
CAPES, pela contribuio financeira durante o desenvolvimento deste estudo.
Aos professores, Eduardo Wense, Cristina Ortega, Ldia Alvarenga e Maurcio Almeida, que
me honraram ao aceitar meu convite para compor a Banca de Defesa desta Dissertao.

The value of knowledge is largely tied


to the way in which that knowledge is
organized. If you cant find it, its not
likely to be of much use to you.
Marc Rapport
Unfolding Knowledge
Knowledge Management E-zine

RESUMO
Esse trabalho investigou o uso da taxonomia facetada como instrumento de organizao da
informao, para dar consistncia e padronizao aos contedos informacionais de
trabalhos acadmicos. A finalidade foi facilitar o acesso s informaes, apresentando ao
usurio a opo de uma navegao pelos termos da estrutura facetada, apresentados em
uma interface de busca. O ambiente de pesquisa foi a biblioteca digital de teses e
dissertaes (BDTD), da Escola de Cincia da Informao (ECI), da Universidade Federal
de Minas Gerais (UFMG), tendo como insumo as teses e dissertaes oriundas da linha de
pesquisa Organizao e Uso da Informao. O objeto emprico foram as dez categorias
fundamentais temticas e os termos que as alimentaram, procedentes da anlise conceitual
realizada nos resumos informativos dos trabalhos acadmicos do corpus. O objetivo
norteador deste estudo foi criar uma taxonomia facetada navegacional, denominada
TAFNAVEGA, a partir de uma matriz categorial desenvolvida para trabalhos acadmicos,
visando demonstrar a sua adequao para a representao sistematizada e semntica do
contedo de teses e dissertaes. Pretendeu, ainda, contribuir para maior visibilidade do
contedo das pesquisas cientficas e facilitar a busca e a recuperao dessas informaes.
A metodologia envolveu procedimentos de natureza emprica, exploratria, com uma
abordagem qualitativa em relao anlise da literatura especializada da rea. Alm disso,
recorreu ao mtodo de pesquisa aplicada, visto que ofereceu a criao de um mecanismo
para ser empregado na navegao facetada. Esse percurso metodolgico incluiu o uso da
teoria da anlise de domnio para a identificao do domnio, do usurio da BDTD e de suas
necessidades informacionais, assim como do Modelo de Leitura Documentria, de Fujita e
Rubi (2006), para o desenvolvimento da matriz categorial para trabalhos acadmicos. Para a
criao das categorias fundamentais temticas foi utilizado o mtodo da anlise de
contedo, com a tcnica da anlise categorial temtica, juntamente com os princpios da
teoria da anlise facetada de Ranganathan. A reviso de literatura foi pautada em trabalhos
sobre navegaes facetadas atravs de taxonomias tambm facetadas, utilizadas como
instrumento facilitador da explorao, busca e recuperao de informaes em diferentes
bibliotecas digitais. Ademais, a fundamentao se baseou em conhecimentos relacionados
com a busca e a recuperao em sistemas de recuperao da informao. Abordou, ainda,
o vocabulrio controlado do tipo taxonomia, as bibliotecas digitais, focando a ateno em
bibliotecas de teses e dissertaes, e a navegao hipertextual, mostrando a navegao
pela taxonomia facetada. Os resultados demonstraram que o mecanismo TAFNAVEGA
facilitou a tarefa de explorao, busca e recuperao de contedos dos documentos, dando
acesso a dados tais como teorias, mtodos e instrumentos de coleta de dados,
possibilitando combinar essas diferentes informaes. Conclui-se que a possibilidade de
refinamento da busca atravs da estrutura da taxonomia facetada navegacional auxilia o
usurio a explorar os resultados das pesquisas concludas, uma vez que d maior
visibilidade ao contedo disponvel na biblioteca digital de teses e dissertaes, sem
sobrecarreg-lo de informaes.
Palavras-chave: Taxonomia facetada navegacional. Navegao facetada. Busca e
recuperao da informao. Biblioteca digital de teses e dissertaes. Matriz categorial para
trabalhos acadmicos. Teoria da anlise de domnio. Anlise categorial temtica.

ABSTRACT
This dissertation studies the use of faceted taxonomy as an instrument of organization of
information in order to give consistency and standardization to informational contents of
university papers. Its aim was to facilitate the access to information, offering to users the
possibility to navigate through the terms of the faceted structure, presented in a search
interface. We had as input thesis and dissertations which followed the line of research
Organization and Use of Information of the digital library of thesis and dissertations (BDTD)
of the Information Science College (ECI) of the Federal University of Minas Gerais (UFMG).
The empirical object were the ten fundamental thematic categories and the terms which fed
them, coming from the conceptual analysis carried out in the information summaries of the
university papers of the corpus. The objective of this study was also to make up a navigating
faceted taxonomy, called TAFNAVEGA, from a category matrix developed for university
works, aiming to demonstrate its adequacy to the systematized and semantic representation
of the content of thesis and dissertations. In addition to that, this work intends to contribute
for more visibility of the content of scientific researches, and to facilitate the search and
retrieval of this information. The methodology encompasses procedures of exploratory and
empirical nature, with a qualitative approach in relation to the analysis of the literature of that
field. Besides, it made use of the method of applied research, inasmuch as it showed a
mechanism to be used in faceted navigation. This methodological route included the use of
the theory of domain analysis to identify the domain, the BDTD user, and his information
needs, as well as the Model of Documentary Reading, by Fujita and Rubi (2006) for the
development of the category matrix for university works. For the creation of the fundamental
thematic categories were used the method of content analysis, the technique of the thematic
category analysis, together with the principles of the theory of faceted analysis of
Ranganathan. The literature review was based on papers about faceted navigation through
faceted taxonomies, used as instrument to explore, search and retrieve information in
different digital libraries. The grounding based itself on knowledge related to search and
retrieval in information retrieval systems, approaching the vocabulary of the taxonomy type,
the digital libraries, focusing on thesis and dissertation libraries, and the hypertextual
navigation, showing this through faceted taxonomy. The results demonstrated that the
mechanism TAFNAVEGA facilitated the task of exploration, search and retrieval of content of
documents, giving access to data such as theories, methods and instruments of data
gathering, enabling the combination of these different pieces of information. We conclude
that the possibility of search improvement through the structure of the navigating faceted
taxonomy helps the user to explore the results of finished researches, inasmuch as it
provides more visibility to the content available in the digital library of thesis and
dissertations, without overloading it with information.
Keywords: Navigating faceted taxonomy. Faceted navigation. Search and retrieval of
information. Digital library of thesis and dissertations. Category matrix for university papers.
Theory of domain analysis. Thematic category analysis.

LISTA DE FIGURAS
FIGURA 1 Grau de complexibilidade em diferentes vocabulrios controlados .................. 45
FIGURA 2 Esquema da rvore de Porfrio ..................................................................... 49
FIGURA 3 Ilustraes de rvore Baniana ......................................................................... 50
FIGURA 4 Exemplo de taxonomia navegacional............................................................... 57
FIGURA 5 O sujeito na Anlise de Domnio ...................................................................... 77
FIGURA 6 Processo de extrao de conceitos dos resumos informativos do corpus...... 126
FIGURA 7 Envolvimento do pesquisador com respondentes .......................................... 130
FIGURA 8 Tabela para elaborao de resumo informativo ............................................. 131
FIGURA 9 Tabela de categorias fundamentais ............................................................... 134
FIGURA 10 Campos e relacionamentos entre facetas .................................................... 135
FIGURA 11 Relaes entre documentos do corpus ........................................................ 136
FIGURA 12 Relao entre categorias ............................................................................. 136
FIGURA 13 Relao direta entre categorias e documentos ............................................ 137
FIGURA 14 Relao expandida entre categorias e documentos ..................................... 138
FIGURA 15 Resultado das interrelaes disponveis para recuperao ......................... 138
FIGURA 16 Busca usando a TAFNAVEGA (1) ............................................................... 139
FIGURA 17 Busca usando a TAFNAVEGA (2) ............................................................... 140
FIGURA 18 Busca usando a TAFNAVEGA (3) ............................................................... 141
FIGURA 19 Envolvimento do pesquisador com respondentes ........................................ 189

LISTA DE GRFICOS
GRFICO 1 Percentual de preenchimento das CAFTE (resumos do corpus) ................. 127
GRFICO 2 Problemas em resumos informativos do corpus da pesquisa ...................... 128
GRFICO 3 Relao dos temas abordados no corpus ................................................... 184
GRFICO 4 Relao dos objetos empricos utilizados no corpus ................................... 186
GRFICO 5 Mtodos utilizados nas pesquisas do corpus .............................................. 187
GRFICO 6 Tipos das pesquisas referentes ao corpus .................................................. 188
GRFICO 7 Tipos de instrumentos de coleta de dados .................................................. 188

LISTA DE QUADROS
QUADRO 1 Comparao entre as categorias de Ranganathan e CRG ............................ 51
QUADRO 2 Sntese das metodologias da anlise categorial temtica .............................. 86
QUADRO 3 Modelo de leitura Documentria de Fujita e Rubi (2006) ............................... 96
QUADRO 4 Sugestes de perguntas da Norma NBR-12.676 ........................................... 97
QUADRO 5 Relao de documentos do corpus (por ano)* ............................................. 105
QUADRO 6 Consolidao da estrutura textual de documentos acadmicos ................... 109
QUADRO 7 Etapa da categorizao (Anlise de Contedo) ........................................... 111
QUADRO 8 Validao das "categorias iniciais"............................................................... 112
QUADRO 9 Primeira coluna do MCTCA ......................................................................... 119
QUADRO 10 Primeira e segunda coluna do MCTCA ...................................................... 121
QUADRO 11 Matriz categorial para trabalhos acadmicos (teses e dissertaes) ......... 123
QUADRO 12 Matriz categorial para extrao de conceitos ............................................. 125
QUADRO 13 Paridade entre as categorias de Ranganathan, CRG e CAFTE ................. 142
QUADRO 14 Sntese estatstica dos temas .................................................................... 185

LISTA DE SIGLAS
ABNT

Associao Brasileira de Normas Tcnicas

AC

Anlise de Contedo

ACT

Anlise categorial temtica (semntica)

AD

Anlise documentria

AF

Anlise Facetada

BD

Biblioteca digital

BDS

Biblioteca digital semntica

BDTD

Bibliotecas digitais de teses e dissertaes

BU

Biblioteca Universitria

CAFTE

Conjunto de categorias fundamentais temticas

CAPES

Coordenao de Aperfeioamento de Pessoal de Nvel Superior

CC

Construo de Categorias

CC

Cincia da Computao

CI

Cincia da Informao

CMS

CROSI Mapping System

CRG

Classification Research Group

DW

Data Warehouse

ECI

Escola de Cincia da Informao

GIC

Gesto da Informao e do Conhecimento

GUI

Graphical User Interface

HIBROWSE

High resolution Interface for Browsing and Searching

IBICT

Instituto Brasileiro em Informao em Cincia e Tecnologia

ICS

Informao, Cultura e Sociedade

IEC

International Elecrotechnical Commission

IIB

Instituto Internacional de Bibliografia

ISAGOGE

Introductio in Praedicamenta

ISO

International Organization for Standardization

LD

Linguagem documentria

LSP

Language for Special Purpose

MARC

Machine Readable Cataloging

MCTCA

Matriz Categorial para trabalhos acadmicos do tipo teses e


dissertaes

MEC

Ministrio da Educao

MHTX

Prottipo Mapa Hipertextual

MIT

Massachusetts Institute of Technology

MLD

Modelo de Leitura Documentria

MSN

Microsoft Network

NASA

National Aeronautics and Space Administration

NLS

On-Line System

NT

New Technology

OLAP

On-line Analytical Processing

OPACs

On-line Public Access Catalogs

OUI

Organizao e Uso da Informao

OWL

Web Ontology Language

PDF

Portable Document Format

PMEST

Personalidade, Matria, Energia, Espao e Tempo.

POSEDU

Portal Semntico Educacional

PPGCI

Programa de Ps-Graduao em Cincia da Informao

RAVE

Relation Browser

RB

Relation Browser

RDF

Resource DesVription Framework

SeCo

Semantic Computing Research Group

SIMILE

Semantic Interoperability of Metadata and Information in Unlike


Environments

SMART

System for the Mechanical Analysis and Retrieval of Text

SPO

Subject, Predicate, Object

SRI

Sistema de recuperao da informao

SWED

Semantic Web Environmental Directory

TAD

Teoria da anlise de domnio

TAF

Teoria da anlise facetada

TAFNAVEGA

Taxonomia facetada navegacional

UC

Unidades de Contexto

UFMG

Universidade Federal de Minas Gerais

UNESCO

Organizao das Naes Unidas para a Educao, a Cincia e a


Cultura

UR

Unidades de Registro

USP

Universidade de So Paulo

VC

Vocabulrio controlado

W3C

World Wide Web Consortium

XFML

Exchangeable Faceted Metadata Language

XML

Extensible Markup Language

XSLT

Extensible Stylesheet Language for Transformation

SUMRIO
1

INTRODUO ....................................................................................................... 16

1.1

Problema e justificativa .......................................................................................... 19

1.2

Objetivo geral ......................................................................................................... 22

1.3

Objetivos especficos ............................................................................................. 22

1.4

Estrutura da dissertao ........................................................................................ 23

METODOLOGIA .................................................................................................... 25

2.1

Caractersticas da pesquisa ................................................................................... 25

2.2

O caminho metodolgico ........................................................................................ 25

REVISO DA LITERATURA ................................................................................. 30

FUNDAMENTAO TERICO-METODOLGICA............................................... 43

4.1

Vocabulrio controlado: a taxonomia da hierrquica facetada .......................... 43

4.2

A taxonomia facetada navegacional ....................................................................... 55

4.3

Recuperao da informao .................................................................................. 58

4.4

Bibliotecas digitais .................................................................................................. 66

4.5

Navegao hipertextual .......................................................................................... 70

4.5.1

Navegao por meio da taxonomia facetada.......................................................... 72

4.6

Definindo o domnio: a teoria da anlise de domnio .............................................. 75

4.6.1

Identificando o usurio: a comunidade cientfica .................................................... 80

4.7

Mtodo de anlise de contedo: a tcnica categorial temtica ............................... 82

4.7.1

Anlise categorial temtica e anlise facetada: similaridades ................................ 89

4.8

Modelo de Leitura Documentria de Fujita e Rubi .................................................. 94

4.9

Documentos acadmicos: teses e dissertaes ..................................................... 98

DESCRIO DOS PROCEDIMENTOS E ANLISE DOS RESULTADOS ......... 103

5.1

Recorte temporal e levantamento do material emprico ........................................ 103

5.1.1

Codificao do corpus da pesquisa ...................................................................... 105

5.2

Identificao do domnio, do usurio e de suas necessidades ............................. 105

5.3

Criao da taxonomia facetada navegacional ...................................................... 107

5.3.1

Desenvolvimento das categorias fundamentais temticas.................................... 108

5.3.2

O algoritmo para o processo de extrao de conceitos ........................................ 118

5.4

O experincia do MCTCA na anlise do corpus da pesquisa ............................... 125

5.5

Apresentao da implementao tecnolgica da TAFNAVEGA ........................... 133

5.6

Paridade entre as categorias fundamentais de Ranganathan, CRG e da


TAFNAVEGA ....................................................................................................... 142

CONSIDERAES FINAIS ................................................................................. 144

REFERNCIAS ................................................................................................................. 150


APNDICES ...................................................................................................................... 172
APNDICE A Lista do corpus da pesquisa ..................................................................... 172
APNDICE B Qualificao dos autores das fontes especializadas ................................. 174
APNDICE C Conjunto de categorias iniciais ................................................................. 175
APNDICE D Conjunto de categorias intermedirias ..................................................... 176
APNDICE E Definies para o conjunto de categorias finais ........................................ 177
APNDICE F Dados estatsticos do processo de extrao de conceitos ........................ 180
APNDICE G Termos de indexao dos resumos.......................................................... 181
APNDICE H Metodologias de anlise categorial temtica ............................................ 183
APNDICE I Outros resultados da anlise do corpus da pesquisa ................................. 184
ANEXOS ........................................................................................................................... 190
ANEXO A Modelo de busca facetada: prottipo TerveSuomi.fi ....................................... 190
ANEXO B Modelo de busca facetada: Relation Browser Demo ...................................... 191

16

1 INTRODUO
Nesta introduo, so apresentados o tema, o problema e as
justificativas deste trabalho, assim como os objetivos e a descrio da
estrutura desta dissertao.
O saber cientfico dinmico e primordial no desenvolvimento do conhecimento
humano, num ciclo aberto de reconstruo. A evoluo da cincia acontece com a
possibilidade de replicao, quando um novo conhecimento emerge a partir de algo j
descoberto. Para obter o conhecimento desvendado, o conjunto de saberes deve ser
registrado, com informaes expressas em uma linguagem de comunicao que possa ser
acessada e recuperada.
A cincia passa sempre por revises em suas teorias, seja porque no se
adaptam mais realidade emprica existente ou devido descoberta de novos fenmenos.
Sendo assim, as teorias cientficas so falveis e esto, continuamente, sendo substitudas
ou recondicionadas, principalmente para se ajustarem poca histrica ou cientfica. Assim,
o conhecimento humano est em constante fluxo, sempre se transformando, aperfeioando
e ampliando.
A comunicao cientfica permite perceber as diferentes abordagens tericas,
epistemolgicas e prticas que caracterizam uma rea do conhecimento. Dessa maneira, na
academia so recorrentes as discusses acerca das formas de disponibilizao,
comunicao e difuso desse conhecimento, visando uma maior visibilidade institucional,
que possa legitimar e promover maior prestgio do conhecimento produzido nesse meio.
A Cincia da Informao (CI) disciplina especialmente voltada para entender
os fluxos de informao em diferentes ambientes, a fim de facilitar seu acesso e uso
(BORKO, 1968), promovendo a transferncia da informao. Acredita-se que o ser humano
primordialmente social, ligado a grupos de interesses, tradicionalmente transmitindo seu
conhecimento a outro, e quem o recebe soma-o aos seus prprios saberes. Assim acontece
a evoluo humana, e tambm dessa forma se desenvolve a cincia e tecnologia.
Nesse contexto, o tema da recuperao da informao importante, pois
percebe-se que a sociedade tem a informao como insumo essencial, e as funcionalidades
oferecidas pelas tecnologias de comunicao expandiram as formas de compartilhamento e
busca dessas informaes, movimento intensificado com a expanso da Internet.
O compartilhamento de informaes intermediado por sistemas de informao,
que tm origem, pode-se declarar, ainda com a biblioteca de Alexandria, que reuniu fontes
de informao e as armazenou e organizou, visando a sua preservao e recuperao.
Desde ento, esses sistemas se desenvolvem e procuram se adaptar s necessidades e
demandas informacionais de uma comunidade de usurios. Nesse sentido, os sistemas de

17

informao esto cada vez mais focados na flexibilidade1 e na integrao, o que permite
diferentes interaes entre usurios e sistemas. Nessa trajetria, de Alexandria
contemporaneidade, os sistemas de informao mudaram seu foco da organizao do
documento para a disponibilidade de informao, o que mudou a forma de gerenciamento
do recurso informacional.
Em vista disso, afirma-se que o desenvolvimento de sistemas automatizados de
armazenamento, de busca e de recuperao de informao, acontecimento percebido a
partir dos anos 1950, tem envolvido profissionais de diferentes reas (Cincia da
Computao, Web Design, Arquitetura da Informao, Cincia da Informao, entre outras)
em pesquisas que abordam o assunto sob diferentes aspectos.
A ttulo de resgate histrico, interessante observar que, j no incio do sculo
XX, Paul Otlet, com sua ideia de mesa mvel, recomendava o desenvolvimento de
ferramentas que possibilitassem o acesso s informaes, de modo a permitir sua
transferncia. Otlet imaginou uma espcie de carteira escolar com rodas, com a qual os
usurios poderiam buscar, ler e anotar informaes, retiradas das bases de dados,
armazenadas em fichas de papel. Assim, pode-se afirmar que Otlet criou o primeiro esboo
de um sistema de recuperao da informao (SRI) semiautomatizado.
Um SRI ocupa-se de parte significativa do processo que envolve os fluxos de
informao: seleo, representao, organizao, armazenamento, busca e acesso aos
recursos informacionais. Nesse contexto, so preocupao constante dos pesquisadores as
questes que envolvem a criao de mecanismos para acesso remoto s informaes
disponibilizadas, principalmente em ambiente de bibliotecas digitais, onde a organizao da
informao deve garantir ao usurio facilidade de acesso s informaes de sua
necessidade.
importante mencionar tambm que a organizao da informao pode ser feita
a partir de diferentes abordagens metodolgicas, com vistas a imprimir consistncia e
padronizao aos contedos informacionais, facilitando sua organizao e posterior
recuperao. Nesse sentido, os vocabulrios controlados, tais como os tesauros e as
taxonomias, podem ser utilizados para estruturar certo domnio2, aprimorando a recuperao
de informaes.

Esse termo tem sido muitas vezes utilizado como atributo dos SRI. Flexibilidade pode ser entendida como a
qualidade de algo que tem maleabilidade, que fcil de manejar, e que est apto para variadas coisas ou
aplicaes (FERREIRA, 2009). Assim, um sistema de informao flexvel aquele capaz de absorver
mudanas em suas estruturas de informao, seja permitindo incluso de novos termos ou substituindo
termos obsoletos.
Domnio pode ser entendido como uma rea de conhecimento (especialidade), um conjunto literrio ou, ainda,
a tarefa de um grupo de pessoas trabalhando juntas em um projeto ou em uma organizao (HJORLAND;
ALBRECHTSEN, 1995). Esse tema ser tratado mais detalhadamente no Captulo Quatro, subcaptulo 4.5
deste documento.

18

Com relao s taxonomias, seu uso tem sido ampliado em ambiente digital,
para a estruturao de informaes organizacionais, com o objetivo de organizar as
informaes, orientar o usurio (cliente) e facilitar a busca por produtos e servios,
propiciando sua recuperao.
Para uma melhor compreenso, oportuna uma definio para o termo
taxonomia, trata-se de um conjunto de termos estruturados de forma hierrquica, que so
utilizados para representar o domnio no qual a taxonomia aplicada. Essa forma de
organizao a adotada tradicionalmente. Contudo, nos dias atuais, verificam-se mudanas
no conceito de taxonomia, e na sua forma de organizao: elas podem, tambm, ser
apresentadas em forma de listas, rvores, poli-hierarquias, matrizes, facetas ou sistemas de
mapas (LAMBE, 2007). Sobre essa ltima forma (taxonomia por facetas), alm das
propriedades de representar e organizar um domnio, ela pode, ainda, correlacionar
diferentes linguagens usadas em um ambiente e criar mecanismos de acesso, com
agregao de metadados que podem possibilitar a localizao de contedos informacionais.
Sabe-se que, em uma biblioteca digital, a taxonomia facetada atua como um
mapa conceitual, j que cada tpico da estrutura se interrelaciona com outro e pode ser
explorado atravs da navegao. Assim, essa forma de apresentao contribui para a
comunicao e o compartilhamento de conhecimento.
Ainda sobre as bibliotecas digitais, tem-se constatado um desenvolvimento no
sentido de aprimorar as formas de armazenamento, disponibilizao e acesso s
informaes contidas em seus bancos de dados. Historicamente, esses esforos perpassam
Paul Otlet, com suas ideias revolucionrias, o Memex3 (Vannevar Bush), o projeto Xanadu 4
(Theodore Nelson), culminando com o desenvolvimento da Internet, sendo esta constituda
por um conjunto de tecnologias que permite o compartilhamento e a disponibilizao de
informaes.
importante destacar tambm que, nas instituies de ensino, as facilidades
tecnolgicas tm contribudo para a disponibilizao de informaes acadmicas em
bibliotecas digitais. Ademais, observa-se a crescente migrao de peridicos cientficos para
o meio digital. Ento, verificado um crescimento quantitativo da implantao de bibliotecas
digitais de teses e dissertaes (BDTD) em instituies de ensino superior, visando
divulgao de resultados detalhados de pesquisas j concludas. Como consequncia
dessas iniciativas, evitam-se esforos replicados em pesquisa similares e a perda de
energia intelectual com o uso de metodologias e teorias, talvez, j obsoletas.

3
4

Bush imaginou uma espcie de mquina que facilitasse o armazenamento de informaes, para posterior
recuperao e uso.
O projeto Xanadu refere-se idealizao de uma ampla rede de informaes, sendo considerado o primeiro
passo para o desenvolvimento daquilo que, atualmente, conhecido como hipertexto.

19

No se pode perder de vista, que o desenvolvimento de BDTDs observado,


principalmente, aps a Portaria 13/2006-CAPES5, que estabelece a obrigatoriedade da
divulgao digital das teses e dissertaes defendidas nos programas de ps-graduao
stricto sensu no pas. Contudo, percebe-se que o acesso a contedos especficos dessas
pesquisas ainda precrio, pois as teses e dissertaes so documentos textuais, em
linguagem natural e com forma semiestruturada, dificilmente acessvel compreenso e
inferncia da mquina. Dessa forma, para que os sistemas computacionais possam
recuperar essas informaes com agilidade e eficincia, o contedo informacional dos
documentos precisa ser organizado de modo estruturado.
Nesse contexto, entende-se que a taxonomia facetada pode auxiliar na
estruturao do contedo informacional das teses e dissertaes, atravs da representao
dos conceitos em um sistema facetado de termos. Com isso, busca-se facilitar o acesso s
informaes, oferecendo ao usurio a opo de navegao pelos termos, apresentados em
uma interface amigvel6 de busca.
Face ao exposto, apresentam-se, a seguir, o problema e as justificativas
referentes proposta desta pesquisa, assim como os objetivos geral e especficos.

1.1

Problema e justificativa
A partir do incio do sculo XXI, possvel notar um aumento nos projetos de

implantao de bibliotecas digitais de teses e dissertaes (BDTD), tanto nacionais 7 quanto


estrangeiras (ROSETTO, 2008), especialmente, como j afirmado, aps a obrigatoriedade
instituda pela Portaria 13/2006-CAPES. Vale registrar que o objetivo dessa portaria
regular a forma para disponibilizao digital da produo cientfica, sobretudo das teses e
dissertaes, a fim de oferecer acesso pblico a essa produo, bem como divulgar o
conhecimento cientfico acumulado nas pesquisas (SOUZA, A., 2006, on-line). Entretanto,
essa obrigatoriedade no tem se mostrado suficiente para divulgar a cincia em geral e o
saber produzido pelos programas de ps-graduao. Certamente, pode-se perceber que,
somente a partir do acesso aos resultados das pesquisas, a sociedade observou um avano
em seu conhecimento cientfico, terico ou aplicado, criando novas tecnologias ou produtos,
como salientado por Mueller (2000).
Nesse

sentido,

de

fato,

ferramentas

tecnolgicas

sofisticadas

funcionalidades disponveis. Porm, as formas de busca e recuperao de informaes em


BDTDs ainda no superam, em grande medida, as de uma biblioteca tradicional, uma vez
5
6
7

CAPES Coordenao de Aperfeioamento de Pessoal de Nvel Superior.


Interface amigvel aquela considerada fcil e intuitiva de usar, sem poluio visual que desoriente o usurio.
Como exemplo, pode-se citar o projeto da Biblioteca Digital Brasileira de Teses e Dissertaes (BDTD), do
Instituto Brasileiro de Informao em Cincia e Tecnologia (IBICT); a Biblioteca Nacional Digital Brasil; e a
Rede Memria Virtual Brasileira.

20

que, geralmente, permitem o acesso apenas a elementos descritivos (autor e data, por
exemplo), ao resumo, s palavras-chave e ao texto completo dos documentos. Nesse ltimo
caso, inclusive, o texto, em geral, apresentado no formato Portable Document Format
(PDF), que aberto em aplicativo independente da biblioteca digital, impedindo que o
sistema possa varrer seu contedo durante as buscas. Nesse caso, estando os outros
elementos (descritivos, resumo e palavras-chave) incompletos, haver perda de
informaes.
importante destacar tambm, que h o problema de palavras-chave e ttulos
que no so representativos do contedo dos documentos, alm do entrave provocado por
resumos incompletos, observados na literatura por diferentes estudos (BORKO; CHATMAN,
1963; VIEIRA, 1988; NOGUEIRA, 1997; GIL LEIVA; FUJITA; RUBI, 2008; ELIEL, 2008;
SOUZA, 2009).
Ademais, mostra-se pertinente apontar que, nas buscas por assunto, comum
as bibliotecas digitais oferecerem a busca simples e a busca avanada. Nessas duas
formas, o sistema faz uma varredura nos elementos descritivos (ttulo, autor e data), no
resumo e nas palavras-chave. Entretanto, em ambas, h problemas para o usurio: na
busca simples, geralmente, o usurio submete, no mnimo, uma palavra ao sistema, sendo
que o resultado de sua busca pode apresentar problemas de ambiguidade, envolvendo
questes de falta de preciso8 e de revocao9. Com relao busca avanada, h a
possibilidade de buscas combinadas, visando a refinamento dos resultados, normalmente,
atravs da busca booleana10 (or, and e not). Porm, o maior problema nesta forma de
busca, refere-se ao fato de que o usurio, recorrentemente, est inapto para utiliz-la, seja
porque no consegue acompanhar as mudanas tecnolgicas (barreira tecnolgica), seja
por comodismo (barreira psicolgica) (FIGUEIREDO, 1987), ou mesmo pelo motivo de
considerar que as buscas booleanas so de difcil compreenso (BAEZA-YATES; RIBEIRONETO, 1999).
Tendo isso em vista, acredita-se que possvel oferecer ao usurio,
principalmente em uma biblioteca digital especializada, informaes j estruturadas
(organizadas), com resultados j refinados, sob a perspectiva das necessidades de
informao desse usurio, que seja uma estrutura fcil de usar e interpretar, como forma de
minimizar os problemas apontados na busca simples (ambiguidade) e na busca booleana
(inaptido do usurio em utiliz-la). Para tanto, a caracterstica textual semiestruturada das
teses e dissertaes exige a criao de mecanismos que orientem a estruturao do recurso
8
9
10

Preciso o ndice da relao entre o nmero de documentos recuperados considerados relevantes em


relao ao total de documentos recuperados.
Revocao o ndice da relao entre o nmero de documentos relevantes sobre um tema recuperados pelo
sistema em relao ao total de documentos existentes no banco de dados sobre esse mesmo tema.
A lgica booleana derivada da teoria dos conjuntos e possui uso universal para ampliao ou refinamento
de resultados.

21

informacional, melhorando a eficincia na localizao de informaes especficas. Ento,


devem-se reconhecer suas partes ou captulos, alm de sua sequncia de ideias, a fim de
organiz-los e classific-los ordenadamente.
Nesse cenrio, entende-se que a taxonomia facetada possui qualidade
estruturante, que permite organizar as informaes dispersas no texto. Alm disso, visto que
provm de um vocabulrio controlado, ela possibilita a padronizao da terminologia
utilizada de modo que exclui as ambiguidades e, por essa razo, melhora a eficincia da
recuperao dos contedos informacionais. A ambiguidade pode ser uma qualidade em
textos poticos, porm, em textos cientficos e ambientes especializados ela deve ser
sempre evitada, pois compromete o sentido e o significado expressos pelo autor.
Na mesma direo das ideias abordadas acima, Figueiredo (2006, on-line)
afirma que as taxonomias podem tambm assumir representaes grficas 11, facilitando
ainda mais a explorao e a compreenso do universo de contedo em questo. Assim
sendo, essa estruturao, concebida a partir da taxonomia facetada navegacional, permite
que as informaes [...] [sejam] organizadas respeitando-se os temas, os assuntos e a
hierarquia estipulados pela ferramenta, apresentando-se ao usurio aquilo que h de mais
relevante naquele contexto (NONATO et al., 2008, p.132), orientando, dessa maneira, sua
busca.
Outro aspecto relevante indica que o uso da taxonomia facetada navegacional
permite operar e refinar a busca de forma progressiva, de modo que o usurio saiba,
exatamente, quais informaes esto disponveis no banco de dados, sem que haja a
possibilidade de um resultado de busca vazio12. Alis, essa particularidade confirmada
por Prazeres et al. (2006, p.2), quando afirmam que
Uma das vantagens da navegao baseada em facetas a possibilidade de
se combinar um ou mais valores. Por exemplo, possvel obter todas as
pginas escritas em portugus (faceta lngua), escritas entre 2001 e 2002
(faceta data), do tipo texto (faceta tipo do contedo). Um exemplo deste tipo
13
de navegao pode ser visto no projeto Simile-Longwell .

Em face disso, com essa interface de navegao, o usurio tem os recursos de


uma busca avanada, sem a necessidade de indicar as combinaes lgicas 14, pois isso j
se apresenta, semanticamente, implcito na estrutura facetada. O usurio pode, ento,
escolher nveis de especificidade e restringir a busca gradativamente, usando os termos
dispostos na taxonomia facetada, como se fosse um menu do SRI.

11
12
13
14

um tipo de interface que permite a interao do usurio com os recursos digitais a partir de elementos
visuais. Essas representaes so conhecidas como Graphical User Interface (GUI).
Entende-se aqui, que as categorias vazias no so apresentadas ao usurio, o que impede a obteno de
um resultado vazio, pois s aparece para escolha aquilo que, efetivamente, existe.
Disponvel em: <http://simile.mit.edu/wiki/ Faceted_Browser>.
Como a utilizada pela busca booleana, considerada difcil pelo usurio.

22

luz dessas consideraes, entende-se que a importncia deste estudo na CI


est na relevncia do tema da organizao da informao em ambientes digitais, sobretudo
no que concerne busca e ao aperfeioamento da recuperao da informao, o que, no
caso especfico desta pesquisa, pode impactar positivamente no processo de comunicao
cientfica.
Por essa razo, a proposta desta pesquisa criar uma taxonomia facetada para
navegao, como opo de busca em bibliotecas digitais de teses e dissertaes,
priorizando as necessidades dos pesquisadores, com vistas a promover maior visibilidade
ao conhecimento cientfico acumulado.
Para tanto, este estudo tem como expectativa responder s questes seguintes:
Como evidenciar as informaes disponibilizadas nas BDTDs, referentes aos resultados
detalhados das pesquisas? De que modo possvel facilitar o acesso do usurio que busca
esse tipo de informaes acadmicas? Como refinar essa busca, de maneira que as
informaes possam ser buscadas em formato estruturado e o usurio no seja
sobrecarregado com informaes?
Levando-se em considerao a proposta e a expectativa, a seguir so
apresentados o objetivo geral e os objetivos especficos delimitados nesta pesquisa.

1.2 Objetivo geral


Criar uma taxonomia facetada navegacional a partir de uma matriz categorial,
desenvolvida para trabalhos acadmicos, visando a uma representao sistematizada e
semntica do contedo de teses e dissertaes capaz de facilitar a busca e a recuperao
das informaes.

1.3 Objetivos especficos


1) Demonstrar a adequao do uso de categorias conceituais como potencial
mecanismo para estruturar o contedo textual dos trabalhos acadmicos;
2) Contribuir para maior visibilidade do contedo das pesquisas cientficas,
evidenciando, principalmente, os resultados detalhados das pesquisas acadmicas;
3) Aprimorar a busca por contedos disponveis em bibliotecas digitais de teses
e dissertaes, atravs da navegao pela taxonomia facetada.

23

1.4 Estrutura da dissertao


Esta pesquisa possui seis captulos, nos quais so abordados os assuntos
considerados pertinentes apresentao, anlise e entendimento das questes discutidas,
sendo organizado da seguinte maneira:
Captulo 1: Introduo: com destaque para a comunicao cientfica, visando
melhoria na qualidade dos sistemas de recuperao de informao, com a possibilidade do
uso de taxonomias facetadas como mecanismo de navegao e acesso s informaes.
Foram apresentados tambm os problemas, as justificativas e a proposta (indicada no
objetivo geral e nos objetivos especficos), incluindo a estrutura desta dissertao.
Captulo 2: Metodologia da pesquisa: primeiramente foram apresentadas as
caractersticas da pesquisa. Em seguida, no subcaptulo caminho metodolgico,
apresenta-se o universo e o recorte de investigao, com o corpus e o objeto emprico
manuseado. Indicam-se, ainda, os mtodos e tcnicas aplicados, assim como a
fundamentao

terico-metodolgica

que

respaldo

aos

procedimentos.

Essas

informaes so fornecidas de forma sinttica, uma vez que as descries detalhadas se


encontram no Captulo Cinco, de Descrio dos procedimentos e anlise de resultados e
no Captulo Quatro, da Fundamentao terico-metodolgica.
Captulo 3: Reviso da literatura: neste captulo busca-se atualizar informaes
sobre o tema de busca e navegao atravs de estruturas facetadas, com foco no uso de
taxonomias. Para isso, descrevem-se trabalhos que respondam a questes sobre quais
procedimentos metodolgicos e os fundamentos tericos que vm sendo empregados para
a criao desse instrumento, de forma que possa ser um facilitador para a explorao,
busca e recuperao de informaes em bibliotecas digitais, principalmente nos ltimos dez
anos. Alm disso, descrevem-se os possveis avanos alcanados e as disciplinas que
esto engajadas neste tipo de pesquisa e aplicao, assim como a Cincia da Informao
se insere nesse contexto. Ao final, citam-se os trs principais livros que nortearam esta
pesquisa, descrevendo o contedo dos mesmos.
Captulo 4: Fundamentao terico-metodolgica: este captulo inicia abordando,
brevemente, os fundamentos tericos sobre os vocabulrios controlados como instrumento
de representao e organizao da informao. Verticaliza sobre o tema da taxonomia,
apresentando sua forma mais tradicional, a hierrquica, depois a forma facetada, at chegar
ao produto final que a taxonomia facetada navegacional. Nesse percurso so tambm
indicados, alm dos fundamentos tericos, os princpios metodolgicos de criao, uma vez
que os dois esto imbricados. Expe os fundamentos tericos acerca da busca em sistemas
de recuperao da informao (SRI) de bibliotecas digitais (BD), especialmente nas BDs de
teses e dissertaes. Depois, indica os princpios tericos da navegao hipertextual e a

24

facetada para, em seguida, discorrer sobre a Teoria da Anlise de Domnio (TAD) e a


metodologia indicada para a identificao da comunidade cientfica e suas necessidades de
informao. Logo aps, descreve-se os fundamentos do mtodo da Anlise de Contedo,
especificamente aprofundando sobre a aplicao da tcnica da anlise categorial temtica e
fornecendo um confrontamento entre os procedimentos metodolgicos dessa tcnica e da
Teoria da Anlise Facetada. Dando prosseguimento, apresenta-se o mtodo utilizado para o
desenvolvimento do Modelo de Leitura Documentria de Fujita e Rubi (2006). Finalmente,
caracterizam-se documentos do tipo teses e dissertaes, uma vez que eles so o material
emprico manuseado nesta investigao.
Captulo 5: Descrio dos procedimentos e anlise dos resultados: esse captulo
descreve detalhadamente todos os procedimentos dos mtodos e tcnicas adotados nas
diferentes etapas de desenvolvimento da proposta da taxonomia facetada navegacional,
denominada de TAFNAVEGA, assim como a anlise dos resultados. A proposta
apresentada desde a identificao do domnio, do usurio e de suas necessidades de
informao, seguindo com a apresentao do conjunto de categorias fundamentais, depois
com a formulao de um algoritmo para sistematizar o processo de extrao de conceitos
dos documentos e, finalizando, faz uma demonstrao do aplicativo. O objetivo do
mecanismo possibilitar ao usurio uma forma mais fcil de acessar, alm de elementos
tais como o ttulo, autor, ano e resumo do documento, informaes estruturadas sobre
temas, mtodos, teorias e os resultados das pesquisas j concludas. Captulo 6:
Consideraes finais: neste ltimo captulo volta-se o olhar para os pressupostos e as
questes que motivaram a pesquisa, buscando responder, analiticamente, aos objetivos
determinados como meta de investigao, sempre indicando de que forma os resultados
podem contribuir para o avano do conhecimento e das discusses dentro da rea da
Cincia da Informao. Finalmente, apontam-se, a partir de observaes durante a
pesquisa, possibilidades para trabalhos futuros.

25

2 METODOLOGIA
O mtodo cientfico envolve um conjunto de procedimentos sistemticos e
racionais, utilizados no intuito de alcanar o objetivo proposto, traando um caminho mais
seguro e econmico, capaz de permitir detectar erros e facilitar as decises sobre a postura
do investigador (MARCONI; LAKATOS, 2010, p.65). Nessa perspectiva, a pesquisa, para
esses autores, um procedimento formal, com mtodo de pensamento reflexivo, que
requer um tratamento cientfico e se constituiu no caminho para conhecer a realidade ou
para descobrir verdades parciais (ibidem, p.139).
Nessa direo, o percurso metodolgico, com a aplicao dos procedimentos
necessrios para a concluso deste estudo, informado a partir de agora.

2.1 Caractersticas da pesquisa


Esta pesquisa envolveu procedimentos de natureza emprica, uma vez que
houve a manipulao de documentos para anlise, cujos resultados dos dados foram
usados na concretizao do objetivo deste estudo. Segundo Demo (2000, p.21), a pesquisa
emprica trata da face emprica e factual da realidade; produz e analisa dados, procedendo
sempre pela via do controle emprico e factual.
Utilizou-se tambm da investigao do tipo exploratria, pois abrangeu
levantamento bibliogrfico para anlise de exemplos de experincias e prticas, em relao
ao problema pesquisado (GIL, 1994), ampliando o conhecimento do proponente sobre o
tema estudado. Nessa explorao na literatura da rea, houve a busca por conceitos sobre
os temas discutidos, com o objetivo de obter informaes para realizar inferncias. Realizouse, ainda, anlise conceitual nos documentos do corpus e houve a identificao e descrio
das necessidades informacionais do usurio final, caracterizando-se tambm como uma
pesquisa de cunho qualitativo.
Alm disso, recorreu-se ao mtodo de pesquisa aplicada, visto que ofereceu a
criao de uma taxonomia facetada navegacional, com o propsito de permitir a navegao
por sua estrutura, com metadados embutidos.

2.2 O caminho metodolgico


Nesta seo, sero brevemente apresentados os mtodos e tcnicas utilizados,
com a fundamentao terico-metodolgica escolhida para a anlise, quando for o caso,
mas somente de forma sinttica. Houve a escolha pela exposio dos mtodos e das
tcnicas empregados no desenvolvimento da TAFNAVEGA ao longo do trabalho, na medida
em que muitas vezes os fundamentos tericos esto imbricados por fundamentos e

26

princpios metodolgicos. Assim, muitas dessas informaes esto apresentadas no


Captulo Quatro, da Fundamentao terico-metodolgica. Alm disso, optou-se pela
descrio detalhada dos procedimentos metodolgicos, inclusive das ferramentas utilizadas,
no Captulo Cinco, de Descrio dos procedimentos e anlise de resultados. Foi uma opo
consciente de estruturao textual da dissertao, uma vez que parte da metodologia
aplicada foi tambm composta por interpretao e anlise de resultados, inviabilizando
separar as duas sees. Acredita-se que a forma escolhida trar mais benefcios
compreenso do processo pelo leitor. Dessa forma, neste captulo esto indicadas
unicamente as bases da metodologia empregada nesta pesquisa.
Como primeiro passo, realizou-se pesquisa bibliogrfica15 (MARCONI;
LAKATOS, 2010), sistematizada, no Portal Capes, que abrangeu, mas no se restringiu, a
buscas por publicaes nas diferentes bases de dados (tal como Library and Information
Science Abstracts LISA, por exemplo), em especial nas Proceedings of the American
Society for Information Science and Technology, Information Technology & Libraries,
Computer Science Human Interface and the Management of Information, Computer Science
Flexible Query Answering Systems, Computer Science Research and Advanced Technology
for Digital Libraries, Proceedings of Annual International ACM e ACM SIGIR Workshop on
Faceted Search, Citeseer, Annual Review of Information Science and Technology ARIST
(artigos de reviso), entre outras. Em relao s publicaes nacionais, foram utilizadas as
Bibliotecas Digitais de Teses e Dissertaes de diferentes instituies 16 e as revistas
nacionais: Informao & Sociedade, Revista da Cincia da Informao (Instituto Brasileiro
em Informao em Cincia e Tecnologia - IBICT), Revista Encontros Bibli e DataGramaZero
Revista de Cincia da Informao.
Alm disso, utilizou-se o acervo da Biblioteca Professora Etelvina Lima, da
Escola de Cincia da Informao (ECI) da Universidade Federal de Minas Gerais (UFMG), e
buscas na Internet (Google Acadmico e Biblioteca Pblica de Nova Iorque e, tambm, uso
de acervo pessoal. Deve-se registrar, ainda, que essa atividade priorizou a anlise da
literatura sobre os fundamentos terico-metodolgicos e histricos dos temas abordados
nesta pesquisa, tais como bibliotecas digitais, hipertextos, vocabulrios controlados,
categorizao, anlise de contedo e mecanismos de navegao, de modo que os mesmos
pudessem ser articulados com os estudos sobre a criao de classificaes facetadas
navegacionais e com os estudos que abarcam as atividades de profissionais de indexao.
Ademais, para a reviso da literatura sobre o tema especfico desta pesquisa
taxonomia facetada navegacional foram utilizados os seguintes termos para busca: em
15

16

Pesquisa bibliogrfica uma tcnica que tem como finalidade explorar na literatura (livros, revistas, teses,
entre outros) material sobre determinado assunto de interesse da pesquisa (MARCONI; LAKATOS, 2010).
Sempre que o termo pesquisa bibliogrfica for utilizado neste documento, o sentido ser este.
Tais como as do IBICT, UFMG, Universidade de So Paulo e Domnio Pblico.

27

portugus: navegao, navegao facetada, busca, busca facetada, taxonomia


facetada e taxonomia facetada navegacional (e de navegao); em ingls: browsing,
navigation, faceted browsing, faceted navigation, search, faceted search, faceted
taxonomy, faceted navigation taxonomy, faceted browsing taxonomy.
Ainda cabe esclarecer, que durante todo o percurso da pesquisa, houve
pesquisa bibliogrfica sobre fundamentos que respaldassem ou refutassem os caminhos
escolhidos para solucionar os problemas encontrados, visando nortear e validar as decises
assumidas.
Salienta-se que o universo de investigao foram as teses e dissertaes
defendidas entre os anos 1998 e 2009, no Programa de Ps-Graduao em Cincia da
Informao (PPGCI), da Escola de Cincia da Informao (ECI), da Universidade Federal de
Minas Gerais (UFMG), at 31 de dezembro de 2009. De um total de 290 trabalhos
analisados, 62 so teses, e 228, dissertaes. importante explicar que a escolha desse
ambiente se deve a questes de ordem operacional, sobretudo aquelas relacionadas ao
acesso ao material disponibilizado no banco de dados da biblioteca digital, assim como
proximidade com a instituio em questo.
Ressalta-se que a determinao do corpus foi feita por amostragem, sendo este
um processo pelo qual se obtm informao sobre um todo (universo), examinando-se
apenas uma parte do mesmo (amostra ou corpus). Nessa circunstncia, h a amostragem
probabilstica (ou estatstica) e a no-probabilstica (ou subjetiva). A primeira fundamenta-se
na distribuio amostral e na seleo aleatria. J a outra no possui base estatstica,
sendo a amostra de tipo intencional (por julgamento), selecionada por critrios pessoais
decorrentes da experincia profissional e do conhecimento da rea de domnio (MARCONI;
LAKATOS, 1990). Sendo assim, acredita-se que a aplicao da amostra do tipo intencional,
neste estudo, aceitvel e, at mesmo, desejvel, pois a linha de pesquisa Organizao e
Uso da Informao (OUI) de familiaridade da proponente, sendo, ainda, a rea de
especialidade e de experincia profissional da sua orientadora, o que, certamente, confere
condio de confiabilidade ao trabalho.
Alm disso, a amostra por julgamento indicada, exatamente, para
investigaes de cunho exploratrio, principalmente se o universo homogneo
(MALHOTRA, 2001, p.316). Elucida-se que a proposta apresentada aqui atende a este
pressuposto, j que todos os documentos so trabalhos acadmicos, do tipo teses e
dissertaes, produzidos numa nica rea de conhecimento, a Cincia da Informao (CI).
Finalmente, avalia-se, tambm como forma de argumentao, que, em alguns
casos, a amostragem por julgamento pode ser mais fidedigna e representativa do que uma
amostra probabilstica (AAKER; KUMAR; DAY, 1995; HANSEN; HURWITZ; MADOW, 1996).

28

Tendo em vista essas colocaes, o corpus foi constitudo pelas teses e


dissertaes defendidas no PPGCI/ECI/UFMG, provenientes da linha de pesquisa OUI, no
perodo compreendido entre os anos 1998 e 2009, disponibilizadas no banco de dados da
biblioteca digital de teses e dissertaes da instituio (BDTD/ECI/UFMG), totalizando 41
documentos. Desse total, 12 so teses e 29 so dissertaes.
Quanto ao objeto emprico utilizado para a criao da taxonomia facetada
navegacional, este foi constitudo pelas categorias fundamentais temticas e pelos termos
procedentes da anlise conceitual nos documentos acadmicos, denominado como
processo de extrao de conceitos. Essa anlise foi realizada nos resumos informativos
disponveis em cada documento do corpus (41 documentos) da pesquisa.
A determinao das categorias fundamentais temticas (CAFTE) para o
desenvolvimento da taxonomia facetada navegacional, denominada de TAFNAVEGA, esto
apresentadas nos subcaptulos 5.3 e 5.3.1. Esses procedimentos se basearam na Teoria da
Anlise Facetada (TAF) e foram validadas utilizando o mtodo da Anlise de Contedo, com
a tcnica da anlise categorial temtica (ACT), descrito no subcaptulo 4.7. J para a anlise
conceitual nos resumos informativos, sistematizando o processo de extrao de conceitos
foi utilizado o algoritmo da matriz categorial para trabalhos acadmicos de documentos do
tipo teses e dissertaes, cuja frmula est expressa no subcaptulo 5.3.2. A matriz
contendo o algoritmo denominada Matriz Categorial para trabalhos acadmicos (MCTCA),
do tipo teses e dissertaes, e foi desenvolvida nesta pesquisa, com base no Modelo de
Leitura Documentria (MLD) de Fujita e Rubi (2006), criado para a indexao de artigos da
rea das cincias biolgicas. Essa metodologia est indicada no captulo da fundamentao
terico-metodolgica, no subcaptulo 4.8.
Para a atividade de traduo dos termos resultantes do processo de extrao
de conceitos, foi utilizado como instrumento a Taxonomia da Cincia da Informao,
desenvolvida por Oddone e Gomes (2004). O uso desse instrumento teve a exclusiva
finalidade de fazer o controle do vocabulrio na extrao17 de conceitos, visando a
compatibilizao da linguagem natural empregada nos diferentes textos, principalmente para
resolver problemas relacionados com sinonmias e ambiguidades.
Ademais, houve a necessidade da insero de novos termos na taxonomia de
Oddone e Gomes (2003). Essa prtica apoiada pela norma NISO AZ-39 (2005) quando
afirma que, em instrumentos criados ad hoc18, novos termos encontrados no contedo dos
documentos so potenciais candidatos incluso no vocabulrio controlado e, se admitidos,
so inseridos nas classes correspondentes. Isso mantm as caractersticas de uma
17

18

O termo extrao neste trabalho tem o sentido de retirar conceitos institudos no texto, a partir de uma
anlise conceitual no documento, e no deve ser confundido com o processo de indexao por extrao, que
geralmente realizada de forma automtica.
Para uma finalidade especfica.

29

taxonomia facetada de ser flexvel, dinmica e, constantemente, atualizada. A poltica


utilizada para a insero de novos termos foi a consulta literatura especializada sobre
metodologia, especialmente nas fontes selecionadas para respaldar este estudo, descritas
no Captulo 5, no subcaptulo 5.3.
Aps a anlise conceitual nos resumos informativos, os termos obtidos no
processo de extrao de conceitos alimentaram o conjunto de categorias fundamentais
temticas da TAFNAVEGA.
Resta esclarecer, ainda, que para a identificao do usurio da BDTD, assim
como de suas necessidades informacionais, foi utilizado o mtodo da teoria da anlise de
domnio (TAD), principalmente a partir dos estudos de Hjorland e da literatura especializada
sobre a comunidade cientfica.
Dentro desse percurso, a partir do prximo momento, prope-se uma breve
reviso de literatura, seguida pela fundamentao terico-metodolgica, os resultados e
discusses, at chegar s consideraes finais.

30

3 REVISO DA LITERATURA
Em um trabalho cientfico, a reviso de literatura busca obter informaes mais
atualizadas sobre o tema central da pesquisa, ainda que tenha sentido tambm histrico.
Ela parte integrante da reviso bibliogrfica que tem como objetivo orientar o pesquisador
durante todo o trajeto da investigao, desde o pr-projeto. A reviso bibliogrfica , assim,
mais ampla e guia o pesquisador, principalmente evitando que repita trabalhos j concludos
ou em fase adiantada de investigao.
Segundo Luna (2009), uma reviso de literatura pode atender a diferentes
objetivos: determinao do estado da arte, reviso terica, reviso histrica ou reviso
emprica. No caso desta pesquisa, optou-se pela reviso emprica19 na qual, segundo Luna
(2009), se espera demonstrar como o problema vem sendo pesquisado do ponto de vista
metodolgico, fornecendo
dados das pesquisas j analisadas, para responder a questes tais como:
quais os procedimentos normalmente empregados no estudo desse
problema? Que fatores vm afetando os resultados? que propostas tm
sido feitas para explic-los ou control-los? que procedimentos vm sendo
empregados para analisar os resultados? h relatos de manuteno e
generalizao dos resultados obtidos? do que elas dependem? (LUNA,
2009, p.91).

Seguindo tais orientaes, essas indagaes possibilitaram a observao de


como o objeto de estudo est factualmente sendo aplicado. Para proporcionar um recorte de
anlise, neste captulo tambm esto determinadas as variveis que sero estudadas,
esclarecendo o significado de cada uma delas dentro da pesquisa .
Os trabalhos pautados na utilizao de navegaes atravs de taxonomias
facetadas navegacionais, como instrumento facilitador para a explorao, busca e
recuperao de informaes em bibliotecas digitais ainda so incipientes no campo da
Cincia da Informao (CI) brasileira. A reviso de literatura demonstrou que esse tema
investigado na rea da Cincia da Computao (CC), e est presente tambm nas reas de
Engenharia de Software, Arquitetura da Informao e Informtica, com predominncia para
trabalhos estrangeiros.
No mbito da CI, muitos estudos enfatizam a elaborao de taxonomias
facetadas para uma rea do conhecimento, a partir dos princpios do mtodo da anlise
facetada (ARAJO, 2005; NOVO, 2007; COSTA; RAMOS, 2008). Alm disso, a literatura da
rea tambm indica aplicaes prticas do modelo da lgica analtico-sinttica de
organizao do conhecimento como ferramenta potencial para a descrio e recuperao de
contedos em SRIs, como observado na reviso de literatura de Caf e Bratfisch (2007).
19

A palavra emprica neste contexto tem o sentido de observao da realidade para identificar como o tema
estudado vem sendo aplicado factualmente, respaldando as argumentaes em relao escolha da
aplicao prtica da pesquisa.

31

Contudo, a presente reviso no incluir trabalhos dessa natureza, uma vez que o aspecto
predominante na criao da taxonomia facetada abordada nesta pesquisa o do acesso a
informaes contidas em sistemas de recuperao de informaes (SRI) especializados, em
ambientes digitais, nos quais possvel a navegao atravs da estrutura facetada da
taxonomia, facilitando a busca e a recuperao de informaes.
preciso esclarecer, ainda, que tambm no sero apresentados trabalhos que
versam sobre interfaces a partir de clustering (agrupamento), sintagmas nominais ou de
iniciativas do comrcio eletrnico (e-commerce), pois estes ltimos nem sempre podem ser
considerados como estruturas de navegao facetada (ver Captulo 4, item 4.4.1).
Devido abundncia do material encontrado, principalmente em trabalhos
estrangeiros, para a incluso dos estudos nesta reviso, foram considerados os seguintes
parmetros: (1) estudos que utilizam a tcnica da anlise facetada na criao de taxonomias
para navegao; (2) trabalhos que tratam especificamente de desenvolvimento de
taxonomias facetadas para navegao, independente de indicar, explicitamente, a tcnica
utilizada. Em qualquer dessas situaes, sero considerados trabalhos nacionais e
estrangeiros, dando prioridade aos trabalhos desenvolvidos nos ltimos dez anos, do mais
antigo aos mais novos. Entretanto, houve a preocupao em apresentar trabalhos que
podem ser considerados pioneiros na implantao da estratgia de navegao facetada,
como forma de mostrar a evoluo do tema de navegao e busca facetada, oferecendo
uma localizao temporal histrica do tema. Alm disso, apresenta-se o Relation Browser,
que um projeto que est fora do recorte temporal estipulado para esta reviso, pois foi
iniciado entre dezembro de 1998 e janeiro de 1999, mas que merece ser citado por ter sido
criado dentro da rea da CI e, tambm, porque est em evoluo desde ento.
Ressalta-se que no se pode afirmar, categoricamente, que no h qualquer
trabalho anterior aos que sero mencionados, mas so projetos que merecem ser citados
como pioneiros sobre o tema da navegao facetada: o trabalho de Ahlberg e Shneiderman
(1994), da Universidade de Maryland, e o de Pollitt et al. (1996), da Universidade de
Huddersfield.
No primeiro trabalho, da rea da Cincia da Computao e Informtica, foi criado
o prottipo FilmFinder (<http://www.film-finder.com/>), de Ahlberg e Shneiderman (1994),
que permite explorar uma base de dados de filmes por facetas. Os autores no utilizaram o
termo faceta, entretanto, a modelagem informacional era em facetas, mas com uma busca
por parmetros (parametric search). Nesse tipo de busca, o usurio tem de pr-definir as
variveis, as quais devem ser escolhidas em uma nica vez. Dessa maneira, o usurio pode
obter uma resposta vazia (resultado de busca vazio20) questo formulada. Procurando
20

Essa caracterstica significa que as categorias vazias no so apresentadas ao usurio, o que impossibilita
um resultado tambm vazio, pois s aparece, para escolha, aquilo que, efetivamente, existe.

32

solucionar esse problema, Doan, Plaisant e Shneiderman (1995) desenvolveram um


mecanismo que permitiu substituir a busca por parmetros por uma navegao facetada,
que foi implementado no portal da National Aeronautics and Space Administration (NASA),
eliminando a possibilidade de um resultado de busca vazio. A NASA, ainda hoje, dispe
dessa navegao facetada em seu portal, que vem sendo sempre aperfeioado, desde esse
primeiro mecanismo criado em 1995.
O segundo trabalho, tambm na rea da Cincia da Computao, desenvolvido
por Pollitt et al. (1996), foi um projeto de navegao facetada, denominado busca baseada
em visualizao21, chamado pelos autores de HIBROWSE (High resolution Interface for
BROWsing and SEarching). O mecanismo foi criado para dois diferentes bancos de dados:
para o EMBASE, que a mais importante base de dados bibliogrfica da rea mdica, e
para o EPOQUE, uma biblioteca digital do Parlamento Europeu. O sistema foi desenvolvido
tendo por base de conhecimento um tesauro, que pode-se denominar de tesauro facetado,
uma vez que foi criado a partir das recomendaes de Ranganathan e do Classification
Research Group (CRG). O tesauro facetado foi empregado para indexar o recurso
informacional e tambm como mecanismo de navegao. A deficincia desse projeto foi a
grande extenso da estrutura do mecanismo de busca, que mostrava os termos mais gerais,
os preferidos, os sinnimos, e os termos com relaes associativas. Como exemplo, podese citar uma busca no EMBASE em que, se o usurio buscasse por uma doena, ele
poderia indicar alz e o sistema responderia com uma lista para alzheimer. Nesse caso, o
usurio teria como resultado 1297 itens (POLLITT et al., 1996). A limitao apresentada pelo
sistema que ele no oferecia a possibilidade de iniciar a busca pela faceta doenas.
Dessa forma, o resultado de busca apresentava itens sobre remdios e tratamentos
alternativos, por exemplo. Para chegar resposta que o usurio procurava, nesse caso do
exemplo, era preciso fazer quatro operaes de refinamento (POLLITT et al., 1996). Apesar
de tudo isso, sem dvida, esse estudo representou um avano para a poca e facilitou
bastante a recuperao de informaes nessas bases de dados. Alm disso, indicou o
potencial das classificaes facetadas para a estruturao do contedo de documentos e
para melhorar a busca e a recuperao de informaes em base de dados.
Um trabalho desenvolvido na Escola de Biblioteconomia e Cincia da
Informao, da Universidade do Norte da Carolina, em Chapel Hill, com a participao do
Interaction Design Lab, o projeto denominado Relation Browser22 (RB) ou RAVE (CAPRA;
MARCHIONINI, 2008). Esse projeto foi iniciado em 1998-1999 e est em constante
desenvolvimento e, em 2008, estava na verso RB07. O objetivo dessa ferramenta

21
22

View-based searching systems.


Disponvel em: <http://idl89.ils.unc.edu/rb07>.

33

oferecer ao usurio do Fedstats23 o mapeamento dos tipos de informaes disponveis no


acervo de portais de diversas agncias federais americanas, oferecendo um mecanismo de
busca e navegao. Dessa maneira, h a possibilidade de o usurio visualizar as
interrelaes entre os diferentes itens do acervo, oferecendo a explorao de todo o
contedo informacional do banco de dados. Essa explorao obtida atravs de uma
interface dinmica, na qual as informaes esto estruturadas em facetas. A interface
permite que o usurio faa sua busca diretamente nas facetas ou pela busca por palavraschave. Esse projeto serve de laboratrio para o desenvolvimento de novas ferramentas e
para estudos de usabilidade, em relao ao sistema e aos usurios. O RB iniciou-se com a
estruturao das informaes em categorias e facetas, mas somente sob uma ou duas
dimenses da informao disponibilizada. Com isso, o usurio podia buscar apenas em uma
faceta por vez. Depois, o sistema passou a ser mais flexvel na indicao dos
relacionamentos entre categorias, com atribuio de maior quantidade de dimenses s
informaes disponibilizadas, mas ainda com navegao em apenas uma faceta por vez.
Em sua ltima verso, o RB07, foi adicionado um mecanismo de filtro dinmico, que suporta
a exibio de mltiplas facetas, nas quais o usurio pode navegar usando a tecla Tab do
teclado do computador. O usurio recebe o resultado de sua busca no formato de tabelas,
tanto o resultado direto quanto a lista de resultados similares (relaes associativas). Um
dispositivo interessante adicionado ao novo modelo foi a possibilidade de o usurio saber o
histrico de sua busca (facetas e termos escolhidos), por meio dos breadcrumb. Alm
disso, tambm houve o acrscimo da funcionalidade de busca no texto completo, que pode
ser combinada com a busca e navegao facetada.

Dessa forma, o usurio recebe o

resultado da questo formulada e vai, progressivamente, refinando sua busca, at chegar


informao que procura. As dificuldades encontradas no projeto RB, tais como a demora no
processamento da informao ou capacidade de armazenagem de informao, esto todas
relacionadas a solues tecnolgicas.
preciso ressaltar que o projeto mais conhecido no mbito de navegao e
busca facetada o Flexible information Access using Metadata in Novel Combinations
(<http://sourceforge.net/projects/flamenco>) (FLAMENCO 24), desenvolvido na Universidade
da Califrnia, em Berkeley (HEARST, 2000), com uma equipe interdisciplinar, mas,
basicamente, com membros da rea da Cincia da Computao. Durante o experimento,
segundo English (2002), a equipe desenvolveu duas interfaces: uma baseada em
metadados hierrquicos, denominada SingleTree, e outra em metadados facetados,
denominada MatrixView. O teste nas duas interfaces demonstrou a maior flexibilidade e

23
24

Portal governamental que prov informaes estatsticas de mais de 100 agncias americanas
(<http://www.fedstats.gov/>).
Acesso a um demo do projeto: Disponvel em: <http://flamenco.berkeley.edu/demos.html>.

34

tambm a preferncia dos usurios pela MatrixView. A importncia deste projeto, no mbito
desta pesquisa, que o contedo do recurso informacional foi estruturado em diferentes
categorias e em multi-hierarquias, isto , sob cada categoria, h uma taxonomia hierrquica.
Alm disso, os constantes testes realizados com usurios demonstram que eles se
satisfazem com a possibilidade de compor uma busca de forma fluida, com o refinamento
progressivo. O FLAMENCO est h mais de dez anos sendo aprimorado, atualizado e
mantido, desenvolvendo mecanismos de busca e navegao facetada, alm de servir como
laboratrio para estudos de usabilidade com usurios finais. importante, ainda, destacar
que os resultados apresentados aos usurios no so ranqueados (ranking). A razo disso
que os metadados facetados (data, autor, ttulo e qualificadores) permitem ao usurio
escolher sob qual dimenso quer recuperar um documento, no havendo a necessidade
desse tipo de interferncia do sistema. O usurio pode, tambm, combinar a busca simples
com a navegao facetada. Outro dado importante desse projeto, para o estudo realizado
nesta pesquisa, que as facetas e os metadados so organizados e determinados
manualmente, por um engenheiro de sistemas, no sendo um sistema automtico. Isso faz
com que se acredite que a proposta desta pesquisa exequvel, pois os idealizadores do
FLAMENCO afirmam que o modelo desenhado por eles, nessa etapa de desenvolvimento,
pode suportar uma coleo de at 100.000 artigos (ENGLISH, 2002).
Iniciado em 2000 e com trmico em abril de 2003 tem-se o Projeto FACET25,
coordenado por Douglas Tudhope, da Universidade de Glamorgan, que contou com o apoio
do National Museum of Science and Industry (NMSI), de J. Paul Getty Trust (vocabulrio),
do Museum Documentation Association (MDA) e do Canadian Heritage Information Network.
Neste projeto houve investigao sobre o uso de tesauros facetados na recuperao da
informao, atravs de tcnicas e interfaces de busca. O usurio no necessita formular sua
busca por termos idnticos aos utilizados na indexao, uma vez que o sistema apresenta
os resultados a partir de medidas de aproximao semntica, que so obtidos com base nos
relacionamentos existentes no tesauro. Dessa forma, o usurio automaticamente guiado
na explorao dos termos do tesauro, podendo refinar ou expandir sua busca. Atualmente,
os esforos deste projeto esto voltados para a digitalizao de colees para a Web,
abrindo o horizonte para uma escala mais ampla de usurios. Alm disso, estuda a
possibilidade de integrar o projeto FACET buscas em enciclopdias e s colees
multimdia.
Hyvnen et al. (2004), ainda na rea da Cincia da Computao e Engenharia
de Software, desenvolveram um portal semntico, o MuseumFinland, para publicar as
colees culturais, tais como artefatos txteis, peas de moblia e ferramentas, na Web.

25

Disponvel em: <http://www.comp.glam.ac.uk/~facet/>.

35

Para ajudar no projeto, foi criado o software OntoViews, que composto por trs
componentes: 1) o Ontogator, um motor de busca multifacetado, baseado em ontologias; 2)
Ontodella, um servidor lgico, que armazena dados Resource Description Framework (RDF)
apresentados no portal; 3) OntoViews-C, um sistema estruturado que transforma um RDF
em dados navegveis na pginas Web. Na verso piloto foram utilizadas as colees do
Museu Nacional26, do Museu da cidade de Espoo27 e do Museu da cidade de Lahti28. Esses
so museus de trs cidades, e usam trs distintos sistemas e bases de dados relacionais,
alm de utilizarem diferentes sistemas de gerenciamento de colees (Musketti, Escoll e
Antikvaria, respectivamente). Os metadados dos objetos das colees (data, texto
explicativo, etc.) foram atribudos a partir dos 15 elementos do padro Dublin Core29.
Sempre que possvel, foram atribudas aos contedos palavras-chave, selecionadas de um
vocabulrio controlado ou tesauro, mantendo a padronizao. Isso importante para uma
recuperao de informaes mais acurada e para dar consistncia coleo. Apesar de no
citarem Ranganathan em seus estudos sobre o mtodo da anlise facetada, o princpio de
funcionamento do sistema o mesmo. O contedo das colees sistematizado em
categorias conceituais, e sob cada uma delas h uma hierarquia taxonmica, cujo conjunto
denominado facetas ou vises (views). Contudo, houve problemas relacionados com a
transformao dos contedos das colees em dados RDF, principalmente pautados em
interpretaes semnticas. Algumas expresses so complexas e originadas de diferentes
campos de dados da coleo, podendo se referir a diferentes expresses sintticas,
dependendo do catlogo ou da anotao convencionada em uso. Esse problema pode ser
minimizado pelo uso de padres terminolgicos, mas, segundo os autores, na prtica, isso
impossvel, pois h grande variao de descries. Resta acrescentar, que, no
MuseumFinland, a interface desenvolvida para o usurio final similar a outro repositrio
qualquer na Web, pois possui um nico browser de busca e navegao. Os autores
conseguiram tornar as colees heterogneas e geograficamente distantes em um nico
sistema interopervel, atravs de um processo de merging. Cada museu pode acessar o
sistema do portal e publicar seus contedos de forma fcil e independente.
Em mbito governamental, de Sidoroff e Hyvnen (2005), na rea da Cincia da
Computao e Engenharia de Software, apresentaram um estudo de caso, no qual
implementaram uma busca semntica (ou busca multifacetada) em portais governamentais
da Finlndia, o Suomi.fi. No portal original, o contedo era apresentado em facetas, mas
apenas indexado sob uma nica dimenso, o que os autores denominaram abordagem
26
27
28
29

Disponvel em: <http://www.nba.fi>.


Disponvel em: <http://www.espoo.fi/museo/>.
Disponvel em: <http://www.lahti.fi/museot/>.
O padro de metadados Dublin Core descreve recursos de informao multi-domnios, provendo um conjunto
de convenes simples e padronizado para descrever objetos digitais, de modo a facilitar a sua localizao.

36

Yahoo!. Para os pesquisadores, a simples classificao taxonmica (hierrquica) d uma


viso unidimensional ao documento e no atende aos diferentes usos de que os cidados
necessitam. O objetivo com o projeto foi o de agregar valor s informaes disponibilizadas
aos cidados, de forma que a recuperao do contedo pudesse ser otimizada. Nesse
sentido, o projeto se baseou nos princpios da Web semntica, utilizando uma ontologia
como base de conhecimento, e usando padres Resource Description Framework (RDF) e
Web Ontology Language (OWL). Dessa forma, o recurso informacional foi classificado sob
diferentes dimenses ou categorias, e cada categoria ligada a um conjunto de objetos (do
recurso informacional). Com isso, ao formular uma busca, o usurio pode selecionar
qualquer faceta dentro de uma categoria e o resultado apresentado ser simplesmente a
interseo30 daquela faceta com as demais categorias disponveis. Essa interseo
atribuda a priori, isto , na entrada de dados j se especificou os relacionamentos entre os
objetos, a partir dos objetivos e dos critrios pr-determinados. No caso desse trabalho,
esclarece-se que os resultados apresentados ao usurio so links que direcionam para a
informao procurada, e no para documentos. Alm da navegao facetada, o portal
tambm oferece a busca por palavras-chave, permitindo a combinao das duas. Todo o
recurso informacional da Suomi.fi foi descrito usando um conjunto de ontologias, projetado
dentro de mltiplas taxonomias na interface do usurio. Nessas taxonomias que esto
atribudos os metadados que classificam o contedo do portal sob as distintas dimenses,
dando suporte s diferentes escolhas do cidado (usurio). A interface foi criada a partir do
OntoViews que, segundo Sidoroff e Hyvnen (2005), similar ao sistema utilizado no projeto
FLAMENCO, pois, no lado esquerdo, o menu oferece as facetas disponveis para a
navegao e, a parte central, reservada apresentao dos itens de informao que
combinam com a busca formulada. Finalmente, esse estudo concluiu que as facetas ajudam
o usurio a recuperar informaes de diferentes maneiras: oferece ampla viso de todo o
contedo disponvel no repositrio; guia o usurio na formulao de buscas, fazendo-o
utilizar os conceitos corretos; no admite problemas de homnimos; e nunca apresenta um
resultado de busca vazio.
Suominen, Viljanen e Hyvnen (2007) criaram um prottipo, o TerveSuomi.fi31
(ANEXO B), no qual h uma interface de busca (multifacetada), com uma equipe
interdisciplinar na rea de Cincia da Computao, Inteligncia Artificial e Engenharia de
Software. Nela, o usurio tem uma viso geral do contedo do portal e pode combinar um
ou mais valores (facetas) na navegao. O avano desse projeto, um esforo do grupo
Semantic Computing Research Group (SeCo), criou vrios portais, dentre os quais se

30
31

o mesmo princpio da lgica booleana and, pois apresenta os itens que, simultaneamente, pertencem a
duas ou mais categorias
Disponvel em: <http://demo.seco.tkk.fi/tervesuomi/home>.

37

destaca o portal HealthFinland, que um sistema semntico destinado a atender


populao em geral. Ele coordenado pelo National Public Health Institute, da Finlndia, e
est no ar desde agosto de 2008. Em linhas gerais, o portal apresenta ao usurio final uma
interface de busca facetada, oferecendo, atualmente, 21 categorias de contedo. Suominen
(2009) descreve o portal HealthFinland como um sistema que utiliza tecnologia semntica
para distribuir contedos e criar interoperabilidade, atribuindo valores (metadados) aos
contedos automaticamente, como forma de minimizar o custo de cuidar da manuteno
dos links e da atribuio de metadados referentes aos diferentes contedos. No portal
HealthFinland, o sistema foi programado para ser capaz de alocar um novo termo em seu
contexto correto no portal e fazer o link com o seu contedo especfico, automaticamente.
Ele utiliza um software colaborativo de criao de contedos sobre sade, com o objetivo de
evitar trabalhos replicados e redundantes dentro da prpria instituio e entre diferentes
instituies da rede. A interoperabilidade obtida com a atribuio de metadados
semnticos aos contedos, atravs de ontologias compartilhadas entre as instituies
participantes. O diferencial desse projeto que o vocabulrio usado na interface do usurio
final diferente e independente do utilizado para indexar o contedo informacional (este
ltimo indexado atravs de terminologia especializada). A ideia do prottipo foi
implementada a partir de trs elementos: 1) um vocabulrio do domnio usado para atribuir
diferentes dimenses ao contedo informacional (assunto, gnero), que so publicadas no
repositrio de ontologias (FinnONTO); 2) um sistema de produo de contedo, que possui
especificaes e ferramentas que permitem fazer anotaes, rastrear e verificar os
contedos; 3) um portal semntico, no qual esto disponibilizados os contedos para uso
humano, atravs da busca e navegao, e outro para as mquinas (ex: outras aplicaes da
Web). Deve-se acrescentar que outros estudos (STOICA; HEARST, 2004; STOICA;
HEARST; RICHARDSON, 2007), tambm desenvolveram algoritmos para a criao de
metadados facetados de forma automatizada como soluo para a Web.
No campo da rea de Sistemas e Cincia da Computao, no Brasil, Lachtim
(2008), desenvolveu um mecanismo para portais semnticos denominado Portal Semntico
Educacional (POSEDU). A finalidade desse projeto foi criar uma arquitetura capaz de gerar
instncias para a organizao, integrao e gesto dinmica de informaes advindas de
diferentes instituies acadmicas publicadas na Web, de forma a disponibiliz-las no portal.
Para a concluso do prottipo, foi utilizado como ferramenta de busca o Yahoo e o Swoogle,
e, para o clculo de similaridades, o CROSI Mapping System (CMS). Ademais, para a
instanciao das informaes, usou-se o gerador de portais Semantic Web Environmental
Directory (SWED), e, para a criao da base de conhecimento, o editor de ontologias
Proteg. O CMS foi estendido para atender a requisitos de eficincia que possibilitaram
fazer o cotejamento entre os conceitos das ontologias recuperadas e os da ontologia base

38

do portal. Isso facilitou a transferncia das informaes dos diferentes locais na Web para o
portal POSEDU. A partir dessas ferramentas, as informaes foram estruturadas em
facetas, e, por meio de regras formais estipuladas na ontologia, o sistema forneceu ao
usurio um mecanismo de busca e navegao facetada. A autora afirma em seu estudo que
essa estratgia de busca e navegao facetada vem sendo empregada pela rea de
recuperao da informao, cujos princpios esto baseados na ideia de busca
multifacetada proposta por Ranganathan. Segundo Lachtim (2008), o princpio de estruturas
facetadas para representar informaes adequado para a Web semntica, pois oferece
uma viso geral de todo o contedo do portal e guia o usurio em sua formulao de busca
entre os termos e conceitos disponibilizados. A particularidade encontrada no POSEDU
refere-se ao fato de que, para o sistema conseguir fazer a interseo entre as diferentes
categorias, o usurio deve selecionar (marcar) aquelas que so de seu interesse, situao
que no ocorre em outros exemplos apresentados (HEARST, 2000; HYVNEN et al., 2004;
SIDOROFF; HYVNEN, 2005).
Ainda no Brasil, na rea da Informtica, existe um prottipo para navegao
facetada, desenvolvido por Arajo (2009), denominado Explorator. Trata-se de um
mecanismo que permite a navegao e busca, construdo com base em linguagem RDF. O
autor criou um modelo de linguagem de especificao, denominado vocabulrio FACETO,
alm de um algoritmo de relevncia para a gerao automtica de facetas, com o objetivo
de possibilitar a criao de mecanismos de navegao facetada sobre dados Resource
Description Framework (RDF32). A linguagem de especificao para extrao das facetas
independente do modelo de navegao facetada, que aceita visualizar operaes em um
conjunto de triplas do tipo diferena, interseo e unio33. O arqutipo permite, ainda,
operaes Subject, Predicate, Object (SPO34) de consultas em uma base RDF, o que
fornece exemplos de solues para problemas, auxiliando o usurio a aprender sobre o
domnio de dados RDF. Assim, possvel definir as facetas a partir da combinao de
valores e propriedades do modelo RDF. Uma limitao do Explorator que a escolha
automtica das facetas para a taxonomia no leva em considerao as relaes definidas
na ontologia dos dados RDF. E a principal contribuio do Explorator para o usurio sua
capacidade de permitir que ele manipule os recursos e triplas diretamente na interface de
navegao facetada. Em ambientes complexos como os da Web, a determinao
automtica de facetas parece ser a nica soluo provvel, o que no se aplica ao ambiente
restrito da BDTD utilizado nesta pesquisa. Entretanto, interessante verificar o uso da

32
33
34

RDF uma linguagem para representar informao na Internet.


A interseo e unio se baseiam na lgica booleana and e or.
SPO consiste em trs elementos RDF: assunto, predicado e objeto. uma tripla simples de uma query
language (linguagem de computador para criar bancos de dados relacionais e manipular dados).

39

navegao a partir de taxonomias facetadas como soluo para a busca de informao


semi-estruturada.
Outro trabalho brasileiro que aborda o tema o de Heuseler (2010), no Ncleo
de Computao Eletrnica, no Instituto Militar, que desenvolveu um prottipo que foi
aplicado no domnio de clnicas mdicas. O autor criou diferentes mecanismos genricos
(baseados na leitura de arquivos Extensible Markup Language - XML), de domnio pblico,
que podem ser utilizados em distintos domnios de informao, usando taxonomias
facetadas como mecanismo exploratrio. Na criao do prottipo, Heuseler procurou
adaptar seu mecanismo, que trata informaes no-estruturadas, s dimenses de um Data
Warehouse (DW), que j so utilizadas em operaes analticas sobre dados de natureza
estruturada. O autor criou uma interface prpria com o DW, mas, segundo ele, adicionandose uma ferramenta adaptada da On-line Analytical Processing (OLAP), as lacunas
referentes a funcionalidades analticas mapeadas em seu estudo podem ser suprimidas. O
prottipo foi testado, e, como resultado de sua arquitetura, Heuseler (2010) conseguiu que o
usurio de sistemas analticos pudesse ter uma viso geral e conjunta de informaes
estruturadas e no-estruturadas, atravs da explorao pela navegao nos termos da
taxonomia facetada. Essa composio entre os dois tipos de informao (estruturada e no
estruturada) foi possvel com a utilizao de arquivos de configurao em XML e
mecanismos de leitura do modelo dimensional, que podem se adaptar a outros tipos de
domnio e, assim, para o domnio abordado nesta pesquisa. As informaes geradas pelo
processo de extrao dos termos dos documentos so armazenadas em um repositrio de
metadados, desenvolvido especificamente para a proposta do prottipo, sendo esses os
termos que alimentam a taxonomia facetada e nos quais o usurio pode explorar o recurso
informacional da base. Um problema que o autor no conseguiu resolver foi em relao aos
sinnimos, pois o mecanismo apresenta como resultado somente respostas idnticas ao
termo buscado. Entretanto, o uso de um vocabulrio controlado para o processo de extrao
de termos dos documentos e a implementao de uma base de conhecimento por trs do
banco de dados pode solucionar esse problema.
No cenrio de novas tecnologias, significativo constatar que, quando so
desenvolvidos mecanismos para ajudar o usurio em sua busca por informaes, preciso,
fundamentalmente, pensar em estudos de usurio, como o realizado por Fagan (2010), que
fez uma reviso de literatura que incluiu estudos sobre a avaliao de interface com
navegao facetada. Em um dos trabalhos, por exemplo, Pratt, Hearst e Fagan (1999)
realizaram um estudo de usurios com 50 pessoas, familiares e pacientes com cncer de
mama, buscando por informaes mdicas sobre a doena. Eles determinaram trs
perguntas sobre cncer de mama para serem buscadas na Web, a partir da utilizao de

40

trs ferramentas para visualizao de resultados de busca: por clustering (SONIA35) de


resultados, por rank36 de resultados e por navegao facetada (DynaCat37). O estudo
concluiu que h larga preferncia pela interface com navegao facetada, o que favorece a
ampliao desse campo de estudo na CI. Segundo o autor, todos os 50 participantes
afirmaram que a navegao facetada oferece uma viso geral do todo, dando sentido
semntico ao resultado e, ainda, que til, pois possui rtulos objetivos e claros. A partir da
anlise dos dados coletados no estudo de usabilidade dessa interface de busca, Fagan
(2010) demonstrou que a satisfao dos usurios no uso desse tipo de busca tem relao
com o seguinte: facetas so teis para estruturar a navegao; a categorizao em facetas
facilita e torna a recuperao de informaes mais eficiente; a navegao facetada elimina
resultados vazios; os usurios encontram a informao mais rapidamente quando usando
sistemas facetados; e os usurios preferem que os resultados de suas buscas sejam
organizados em hierarquias multidimensionais. O autor afirma, tambm, que sua reviso
indicou que muitas bibliotecas esto pensando em uma nova forma de apresentar seus
catlogos, em interfaces facetadas, para modernizar o visual dos catlogos e para melhorar
a recuperao de informaes (tais como as de artigos em suas bases de dados), o que
pode ser mais detalhadamente conhecido em Anderson e Hofmann (2006), Calhoun (2006),
Breeding (2007) e Olson (2007). Nas novas interfaces dos catlogos, denominadas novagerao de catlogos de bibliotecas, as facetas38 geralmente incluem campos para autor,
assuntos e formatos, alm de outros campos criados a partir do padro Machine Readable
Cataloging (MARC). Percebe-se assim, que h bastante espao para a implementao de
navegao facetada com vistas a aprimorar a busca e a recuperao de informaes.
Vale ainda destacar dois software para aplicaes na Web semntica, que
dispem de navegao facetada, permitindo a personalizao da interface pelo usurio
(definio do layout da pgina): o Simile39-Longwell e o FacetMap. O Longwell foi
desenvolvido pelo Massachusetts Institute of Technology (MIT) e um aplicativo para
navegao facetada e manipulao de dados RDF. O Longwell utiliza formato proprietrio
para armazenamento dos dados, com arquivos de entrada RDF, XML, N3 ou NT40. Ele foi
desenvolvido em linguagem de programao JAVA, e permite vrios nveis de
personalizao da interface com o usurio. Possui um modelo para definir as facetas
automaticamente, suportando a meta-linguagem Fresnel, que aceita a seleo e formatao
35
36
37
38

39
40

Ferramenta que cria um conjunto de grupos-padro de termos, em hierarquias, que so refinados por um
mtodo interativo.
Foi utilizado um algoritmo padro recomendado por Salton e Buckley (1988) para vocabulrios tcnicos.
Ferramenta para automatizar a categorizao de documentos atravs de critrios pr-determinados.
O termo facetas no mbito dos trabalhos com os catlogos de biblioteca tem o sentido de atributos do
documento, que incluem elementos referentes descrio fsica do documento (autor, ttulo, etc.) e tambm
elementos referentes ao assunto do documento, aludindo aos campos existentes no MARC e no padro
Dublin Core.
Semantic Interoperability of Metadata and Information in unLike Environments.
New Technology.

41

de um conjunto de triplas RDF. J o segundo, o FacetMap, foi desenvolvido por Travis


Wilson41, acerca de dez anos, e um programa para navegao em facetas, escrito em
linguagem Exchangeable Faceted Metadata Language (XFML), com especificaes prprias
para a gerao de facetas e armazenamento de dados, que permite visualizar como as
informaes esto conectadas. A personalizao obtida atravs de estilos Extensible
Stylesheet Language for Transformation (XSLT), e no suporta RDF. Em 2006, uma equipe
da Microsoft desenvolveu um software com o mesmo nome FacetMap, e a questo do uso
do nome, patenteado para Travis Wilson, est em litgio.
Por fim, tambm com certo destaque, podem-se citar trs livros que abordam o
tema em questo e que foram utilizados nesta pesquisa:
1)

Organising

Knowledge:

taxonomies,

knowledge

and

organisational

effectiveness, de Patrick Lambe (2007), um estudioso no tema taxonomia. O livro


dedicado, quase exclusivamente, s taxonomias, indicando conceitos e distintas formas de
apresentao. O autor apresenta a taxonomia como soluo em ambientes organizacionais,
provendo estruturao e gerenciamento de informaes, oferecendo diferentes estudos de
casos de aplicaes de taxonomias em ambiente institucional. Proporciona um guia
completo para a implementao de projetos de taxonomias em organizaes, relatando a
negociao com o alto escalo da empresa, os planos de abordagem e motivao dos
auxiliares, a coleta da terminologia de especialidade at a implantao, propriamente dita, e
sua integrao ao sistema geral da organizao. Ao final, discute outros temas adjacentes,
tais como ontologias e folksonomias.
2) Faceted Search, de Tunkelang (2009), apresenta a busca facetada sob o
aspecto histrico, terico e prtico, de forma bem didtica e sucinta, dando um panorama
geral de como o tema vem sendo abordado e utilizado, indicando uma extensa bibliografia
sobre cada ponto discutido. O autor discorre sobre os princpios de Ranganathan, incluindo
classificaes, facetas e ontologias, alm do sistema de recuperao da informao, com
conceitos de relevncia, preciso e revocao. Distingue os conceitos de busca por
parmetros, navegao facetada e busca facetada, mostrando alguns exemplos do uso de
buscas facetadas em distintas iniciativas. Ao final do livro, o autor apresenta prticas
tcnicas para a implementao de sistemas facetados, com discusses acerca de temas
como escala, eficincia, metadados, vocabulrio controlado, padres de modelagem,
mltiplas entidades, valores e ordenao de facetas.
3) Dynamic Taxonomies and Faceted Search: theory, practice and experience,
de Sacco e Tzitzikas (2009), um referencial para os estudos sobre os temas de
taxonomias dinmicas e as buscas facetadas sob o paradigma de taxonomias

41

Informao disponvel em: <http://facetmap.com/pub/>.

42

multidimensionais, geralmente organizadas atravs de facetas. Os autores abordam a


modelagem da informao, a interao do usurio, o desenho da taxonomia, a
implementao do mecanismo facetado e o seu desempenho. Inclui, ainda, comparaes
com outras tcnicas de recuperao de informao, tais como resultados por clustering,
taxonomias estticas e descries lgicas, principalmente em relao Web semntica.
Oferecem, tambm, instrues tcnicas e tecnolgicas para a criao de modelos, inclusive
exemplos de soluo para manter a integrao de diferentes fontes de informao. Alm
disso, proporcionam um manual para a construo automtica de taxonomias dinmicas, a
partir de textos, e analisam as reas nas quais a aplicao dessa soluo vem sendo
utilizadas, apresentando os desafios que devero ser enfrentados.
Tendo em vista o que foi exposto, no captulo seguinte discute-se a
fundamentao terico-metodolgica, o que, certamente, constitui o alicerce para as
anlises pretendidas nesta pesquisa.

43

4 FUNDAMENTAO TERICO-METODOLGICA
Neste captulo esto apresentadas a fundamentao terica e a metodolgica
utilizadas para o desenvolvimento desta pesquisa. Toda a fundamentao se baseou em
conhecimentos relacionados com a busca em sistemas de recuperao da informao
(SRI), iniciando com uma breve discusso sobre instrumentos de organizao e
representao da informao, aqui denominados de vocabulrios controlados. Aprofundase sobre o tema do vocabulrio controlado do tipo taxonomia, que o objeto de estudo
desta pesquisa. Nesse sentido, apresenta a sua forma mais tradicional, que a hierrquica,
passando forma facetada e, finalmente, facetada navegacional. preciso esclarecer
que, ao apresentar os fundamentos tericos da taxonomia facetada, indicam-se tambm os
alicerces metodolgicos de sua criao, uma vez que teoria e metodologia esto
intrinsecamente ligadas. Em seguida, abordado o assunto da recuperao da informao
em SRIs, sendo apresentado um breve relato sobre as opes de buscas, passando para as
bibliotecas digitais e focando o olhar sobre as bibliotecas de teses e dissertaes, que a
ambientao desta pesquisa. Depois, descreve-se a navegao hipertextual, mostrando a
navegao pela taxonomia facetada. Sero discutidos, ainda, os fundamentos da teoria da
anlise de domnio (TAD), indicando sua metodologia e finalizando com a identificao da
comunidade cientfica. Alm disso, houve a exposio do mtodo da anlise de contedo,
do mtodo utilizado para o desenvolvimento do Modelo de Leitura Documentria de Fujita e
Rubi (2006). E, por fim, foram caracterizados os documentos referentes a trabalhos
acadmicos do tipo teses e dissertaes, que so de interesse desta pesquisa,
demonstrando a sua estrutura textual.

4.1 Vocabulrio controlado: a taxonomia da hierrquica facetada


Na literatura da rea, encontram-se vrios sinnimos para o termo vocabulrio
controlado, que para alguns autores linguagem documentria (LD) (LIMA et al., 2006;
LIMA; BOCCATO, 2009). Uma LD, por sua vez, igualmente designada de linguagem
controlada (LOPES, 2002). Segundo Wanderley (1973, p.180), Melton (1964) denomina LD
de linguagens de indexao, B. Vickery (1970) de linguagens descritoras e Grolier (1962)
de codificaes documentrias. Alm disso, Soergel (1997) considera linguagem de
informao, linguagem de recuperao e linguagem descritora como termos sinnimos
de LD.
Um vocabulrio controlado (VC) uma linguagem artificialmente desenvolvida,
composto por termos que podem ser organizados em uma estrutura relacional ou
alfabeticamente. Currs (1995) declara que um VC uma lista de termos elaborada para

44

identificar o assunto ou os assuntos de um documento com especificidade bastante para


permitir sua recuperao rpida e eficaz. Com essa afirmao, entende-se que um VC, de
fato, permite controlar a terminologia de um domnio, instituindo regras para seu uso, seu
compartilhamento e sua expanso. Para Smit e Kobashi (2003, p.14), esse controle
possibilita organizar e recuperar informaes de forma consistente, atribuindo confiana ao
sistema de recuperao de informao (SRI).
Nesse contexto, observa-se que a norma ANSI Z39.19 (2005), Guidelines for the
construction, format, and management of monolingual thesauri, desenvolvida pela National
Information Standarts Organization (NISO), que sugere regras para a criao de padres de
contedos, apresentao, testes, manuteno e gerenciamento de VC, o descreve como
uma lista controlada de termos explicitamente listados, os quais devem ter uma definio
clara e inequvoca, dentro do propsito para o qual foram criados. Assim, o seu objetivo
primordial o de organizar a informao. Os regulamentos da Norma Z39.19

so

especialmente desenvolvidas para a criao de VCs para uso em ps-coordenao em


sistemas de recuperao da informao, mas podem tambm ser utilizadas para a criao
de VCs para compor sistemas de recuperao de informao (SRI) com pr-coordenao,
tais como para sistemas de navegao na web, mecanismos de busca ou taxonomias
navegveis.
Outro ponto importante a esclarecer, que os VCs devem ser constantemente
atualizados no intuito de adequar os termos utilizados e de acolher novos termos. Essa
prtica, segundo a norma ANSI/NISO Z39.19 (2005), compreende um mtodo emprico, que
tem abordagem indutiva, que so caractersticas de instrumentos criados ad hoc42. Nessa
abordagem, novos termos encontrados no contedo dos documentos so potenciais
candidatos incluso no vocabulrio controlado e, se admitidos, so inseridos nas classes
correspondentes. Essa uma operao constante nesse tipo de vocabulrio controlado
(ANSI/NISO Z39.19, 2005, p.92).
A fim de avanar neste debate, preciso lembrar que os VCs possuem cinco
funes, quais sejam: 1) Traduo: na etapa da indexao, a linguagem natural dos autores
convertida para a linguagem utilizada no sistema, fazendo a compatibilizao das duas
linguagens, o que favorece a recuperao de informaes; 2) Consistncia: promove a
padronizao entre o formato do termo e sua atribuio; 3) Indicao dos relacionamentos:
indica o relacionamento semntico entre os termos; 4) Campo e busca: fornece hierarquias
consistentes e claras para o sistema de navegao, ajudando o usurio a recuperar
informaes de sua necessidade; 5) Recuperao: usado como mecanismo de busca para
localizar contedos informacionais (ANSI/NISO Z39.19, 2005, p.11). Em sntese, pode-se

42

Para uma finalidade especfica.

45

entender que a principal funo do VC padronizar a entrada de dados em um sistema de


recuperao da informao (SRI), de forma a trazer maior eficcia e preciso sada do
sistema, isto , maior satisfao do usurio final.
Vale ressaltar que, segundo a norma ANSI/NISO Z39.19 (2005), h diferentes
tipos de VC, que so os seguintes: lista de assuntos, anel de sinnimos43, tesauro e
taxonomia, cujo grau de complexidade de controle e de representao pode ser observado
na FIG. 1.
FIGURA 1 Grau de complexibilidade em diferentes vocabulrios controlados

Fonte: Traduzido de ANSI/NISO Z39.19 (2005, p.17).

Observa-se que o VC de tipo taxonomia est, em nvel de complexidade, entre


uma simples lista de assuntos e uma ontologia. Este ltimo um instrumento de uso
exclusivo em ambiente digital, criado para ser legvel pela mquina, capaz de proporcionar
inferncias a partir das relaes atribudas entre seus diferentes elementos. Como j
antecipado, na presente pesquisa, toma-se como base o VC de tipo taxonomia que,
segundo definio na norma citada, uma coleo de termos de um vocabulrio
controlado, organizados em uma estrutura hierrquica [na qual] cada termo [...] est em uma
ou mais relaes tipo pai/filho (geral/especfico) em relao a outro termo nessa taxonomia
(p.9) ou um vocabulrio controlado que consiste em termos preferidos, conectados em
uma hierarquia ou poli-hierarquia (p.18).

43

Anel de sinnimos (synonym ring) um grupo de termos considerados sinnimos, que tm o propsito de
recuperao.

46

Quanto estrutura deste tipo de VC, a norma acrescenta que uma taxonomia
um vocabulrio controlado constitudo por termos preferidos, relacionados entre si, em
hierarquia ou poli-hierarquia (ANSI/NISO Z39.19, 2005, p.18). Acerca de seu uso, as
taxonomias, geralmente, so criadas e utilizadas em atividades de indexao e para
navegao na Web, porque sua estrutura, geralmente simples estruturas hierrquicas, so
eficientes em orientar o usurio, levando-o aos termos mais especficos em certo domnio
(p.136). Em linhas gerais, pode-se afirmar que uma taxonomia diz respeito a um conjunto de
termos estruturados, recorrentemente, de forma hierrquica, representando o domnio no
qual aplicada, atravs da estruturao do mesmo.
Atravs de um olhar etimolgico, a palavra taxonomia vem do verbo grego
tassein, que significa arranjos, e nomos, que se refere lei. Observa-se, ainda, que o
termo foi empregado pela primeira vez em 1778, por Augustin Pyrame de Candolle, um
bilogo suo, especializado em botnica. Nesta ocasio, Candolle classificou e ordenou
todas as espcies vegetais conhecidas, descrevendo mais de 80.000 espcies (BARQUN;
MOREIRO GONZLEZ; PINTO, 2006). Entretanto, segundo esses mesmos autores, a mais
conhecida taxonomia surgiu tambm no sculo XVIII, na rea da biologia, com Linnaeus
(Taxonomia de Lineu), para classificar organismos vivos. Seguindo tal propsito, Linnaeus
criou um sistema hierrquico com uma nomenclatura binominal dos seres vivos,
identificando, de forma unvoca, as espcies da seguinte maneira: filos, classes, ordens,
famlias, gneros e espcies. Por meio dessa classificao, Linnaeus resolveu os problemas
de comunicao produzidos pela variedade de nomes locais.
Contudo, Tunkelang (2009, p.3) considera Aristteles como o taxonomista
pioneiro, uma vez que esse filsofo grego tem significante papel na organizao do
conhecimento em hierarquias, pois criou um sistema de classificao que dividiu os
organismos vivos em dois grupos: plantas e animais; sendo que os animais foram
divididos em com sangue e sem sangue, os com sangue, em mamferos e ovparos
e, assim, sucessivamente.
Entende-se que uma das primeiras definies para taxonomia pode ser a de
Vickery, que a identifica como um instrumento para organizar todas as entidades de um
universo em uma simples hierarquia: uma grande rvore na qual cada entidade pertence
apenas a uma nica classe, cada espcie a um nico gnero, e assim por diante
(VICKERY, 1975, p.10). Desde essa primeira definio o conceito de taxonomia vem
sofrendo transformaes. Na contemporaneidade, o termo aplicado em sentido mais
abrangente, de modo que a taxonomia considerada como um instrumento de recuperao
de informao, com possibilidade de agregar dados (metadados) na estrutura:
a taxonomia, em um sentido amplo, a criao da estrutura (ordem) e dos
rtulos (nomes) que ajudam a localizar a informao relevante. Em um
sentido mais especfico, o ordenamento e rotulao de metadados, que

47

permite organizar sistematicamente a informao primria (MARTINEZ et


al., 2004, p.106).

Com base nisso, possvel a constatao de que a taxonomia tem apresentado


destaque no meio digital, exercendo importante papel na representao, com a concepo
de rtulos para os conceitos, e na organizao das informaes, a partir da criao de uma
estrutura que d ordenao aos rtulos. Essa caracterstica auxilia a recuperao das
informaes porque apresenta ao usurio todo o contedo de forma lgica.
No h mais como aceitar o termo taxonomia rigidamente relacionado a
estruturas puramente hierrquicas. Nesse sentido, Campos e Gomes (2008, on-line)
afirmam que
as taxonomias atualmente so estruturas classificatrias que tm por
finalidade servir de instrumento para a organizao e recuperao de
informao em empresas e instituies. Esto sendo vistas como meios de
acesso atuando como mapas conceituais dos tpicos explorados em um
servio de recuperao (CAMPOS; GOMES, 2008, on-line).

Dessa maneira, apesar de a literatura indicar, com mais frequncia, a taxonomia


hierrquica, possvel encontrar outros tipos de taxonomias sugeridos na literatura,
principalmente no meio corporativo. Patrick Lambe, por exemplo, um estudioso no tema
taxonomia e, em seu livro Organising Knowledge: taxonomies, knowledge and organisational
effetiveness, de 2007, apresenta alguns tipos de estruturas, alm da hierrquica, sendo
elas: listas, rvores, hierarquias, poli-hierarquias, matrizes, sistemas de mapas e facetas.
A partir dessa tipologia, neste trabalho ser utilizada a taxonomia facetada que,
segundo Lambe (2007), consiste na classificao expressa do contedo de um documento
sob diferentes dimenses, ou seja, em facetas. Nesse caso, cada faceta na taxonomia
uma dimenso diferente ou um campo de registro de metadado distinto, que pertence a uma
categoria especfica, pois elas tm a caracterstica de serem mutuamente exclusivas. Dessa
forma, o contedo de um documento no est restrito a uma nica dimenso, oferecendo
diferentes opes de busca ao usurio, o que facilita a recuperao de informaes. Em
sntese, uma taxonomia facetada composta por um conjunto de taxonomias e cada uma
dessas taxonomias descreve o domnio (documentos) sob um aspecto (dimenso) diferente
(TZITZIKAS et al., 2004).
Segundo Terra (2005), a taxonomia facetada particularmente til em: 1) reas
emergentes de conhecimento ou quando os relacionamentos entre os termos ainda no
podem ser completamente definidos; 2) reas interdisciplinares; 3) ambientes digitais
(TERRA, 2005). Em ambientes digitais, a estrutura da taxonomia facetada pode ser usada
para navegao, dando ao usurio uma viso geral do contedo do banco de dados, sendo
que cada faceta ou subfaceta pode ser escolhida para busca.
A possibilidade de ser navegvel torna a estrutura facetada da taxonomia uma
importante ferramenta para estruturar as informaes semi-estruturadas de documentos do

48

tipo teses e dissertaes. Isso pode ser explicado pelo fato de que, segundo Lambe (2007),
Ranganathan construiu um esquema de classificao facetado que capaz de expressar,
com preciso, o contedo dos documentos, por meio de blocos de facetas, que estruturam
suas partes e conceitos. Essa classificao um esquema analtico-sinttico, porque
envolve dois processos distintos: a anlise do assunto em facetas e a sntese dos elementos
que constituem o mesmo, decompondo os conceitos mais complexos em simples. A sntese,
em seu turno, a recombinao das partes para a classificao, de acordo com as
caractersticas do documento a ser descrito e representado (LAMBE, 2007). Alm disso,
essa abordagem permite ainda a incluso de novos conceitos, sem que seja necessrio
mudar toda a estrutura do sistema classificatrio.
Vale ressaltar que a literatura aponta que h, basicamente, dois importantes
estudos sobre o tema: 1) os estudos de Ranganathan, cuja teoria possui 46 cnones, 13

postulados e 22 princpios, e est apresentada, basicamente, em cinco obras: Five Laws of


Library Science, 1931, Colon Classification, 1933, Prolegomena to Library Classification,
1937, Philosophy of Book Classification, 1951, e Elements of Library Classification, 1962; 2)
os estudos do Classification Research Group (CRG), criado na dcada de 50, no Reino
Unido, incluindo catorze integrantes: D. J. Campell, E. J. Coates, J. E. L. Farradane, D. J.
Foskett, G. Jones, J. Milles, T. S. Morgan, B. I. Palmer, O. W. Pendleton, L. G. M. Roberts,
B. C. Vickery, A.J. Walford, K. E. Watkins e A. J. Wells (LIMA, 2004a).
No contexto desses estudos, sobre a anlise facetada, h conceitos que devem
ser entendidos, tais como: 1) isolado: cada componente (termo/indivduo) simples de um
assunto, obtido a partir da diviso de uma faceta, mas ainda apartado da estrutura; 2) foco:
um isolado j acomodado na estrutura facetada, porm, sem preocupao sobre a relao
que tem com outros componentes (termo/indivduo) da estrutura; 3) subfaceta (ou arrays):
grupos de termos coordenados, obtidos com a diviso de um assunto por meio de um
mesmo princpio, sendo, mutuamente, exclusivos; 4) faceta: qualquer componente
assunto bsico ou isolado de um assunto composto. [...] conjunto das subclasses obtidas
pela diviso de uma classe, de acordo com determinada caracterstica. Dentro da faceta, o
membro individual, ou subclasse, denomina-se foco (CUNHA; CAVALCANTI, 2008); faceta
pode, tambm, ser entendida como um ponto de vista, categoria ou atributo usado para
agrupar conceitos em uma rea de assunto (domnio); 5) categoria: classe mais geral do
sistema, as categorias fundamentais, usada para representar ideias fundamentais; 6)
diviso: o processo pelo qual uma faceta se decompe em diferentes focos, tal como a
decomposio de um gnero em espcie; 7) Renques: diviso feita a partir de apenas uma
caracterstica, em uma srie horizontal de conceitos; e 8) Cadeias: divises sucessivas de
um mesmo assunto, em uma srie vertical de conceitos.

49

Acerca da teoria da anlise facetada (TAF), Ranganathan prope que se analise


um dado domnio de conhecimento sob um princpio classificatrio que no mais se pauta
em uma metodologia dicotmico-binria, chamada de rvore de Porfrio, mas, sim, numa
policotomia44 ilimitada, a rvore Baniana.
Nessa direo, cabe acrescentar que Porfrio foi um filsofo neoplatnico, e, em
sua obra Introductio in Praedicamenta (ISAGOGE), realizou comentrios sobre a obra
Categorias, de Aristteles, quando desfaz o conceito de categorias, reduzindo-o, apenas, a
gnero/espcie. Assim, Porfrio sistematizou a noo de ideias gerais at alcanar as mais
especficas (gnero, espcie, diferena, prprio e acidente), o que originou a rvore de
Porfrio. De certo, essa rvore ilustra a classificao lgica da substncia e pode ser
considerada a precursora das classificaes taxonmicas.
De uma forma simplista, o esquema pode ser apresentado conforme FIG. 2.
FIGURA 2 Esquema da rvore de Porfrio

Fonte: Elaborada pela autora, baseado no esquema de Porfrio.

Ranganathan, por sua vez, usou a ideia da rvore Baniana (banyan tree), um
tipo de figueira indiana (FIG. 3), que se espalha por uma grande rea, enviando galhos para
o solo. Os galhos criam razes e formam vrios troncos. Essas razes so areas e crescem
do tronco principal, tornando-se novos troncos adicionais. importante destacar que, em
uma rvore baniana, no h apenas relacionamentos hierrquicos, pois essa rvore sugere
a ideia de que os assuntos (espcies de categorias) podem ser relacionados uns aos outros
de

diferentes,

complexas

imprevistas

formas,

gerando

novas

categorias

(RANGANATHAN, 1967, p.368), em um sentido multidimensional.


A fim de entender melhor o modelo baniano, verifica-se que ele configura uma
representao simblica para um conhecimento, como um organismo vivo, o qual est em
constante crescimento e, portanto, sofre ramificaes, transformaes e desenvolvimento
atravs do tempo.

44

Sujeito a um ilimitado nmero de divises das reas do conhecimento.

50

FIGURA 3 Ilustraes de rvore Baniana

Fonte: Banco de imagens Google. Disponvel em: <www.thefreedictionary.com/banians>.

Dessa forma, os mtodos de diviso para a organizao do conhecimento so


feitos a partir de categorias pensadas em sua abrangncia conceitual, a qual no est
relacionada somente a um ncleo, mas a diversos, dependendo da forma como as unidades
de conhecimento se relacionam. Assim, o conhecimento caracteriza-se como multidirecional
e multidimensional, pois pode se desenvolver em diferentes direes, com fertilizaes
cruzadas, multidisciplinares ou mesmo interdisciplinares. O sentido de multidirecional indica
que o conhecimento pode ser orientado a diferentes propsitos (lazer, atividade profissional,
credos), sejam eles convergentes ou divergentes. J o sentido de multidimensional, significa
que o conhecimento possui diferentes dimenses em relao espao-tempo, que permite
que um objeto possa ser observado sob mais de um aspecto, resultando em uma relao
entre dimenses (por exemplo: teorias ou processos) e fatos, possibilitando combinaes.
Ao desenvolver seu sistema facetado, Ranganathan adotou o sinal de dois
pontos (:) para inserir uma faceta em outra, permitindo, assim, a inter-relao entre
conceitos, o que desfez a abordagem, at ento adotada, de sistemas hierrquicos. Essa
opo se explica pelo fato de que o autor acreditava que o conhecimento no era esttico e,
sim, dinmico, podendo gerar novos assuntos, por meio de: a) laminao; b) reunio livre de
termos; c) desnudao; d) dissecao; e) interpolao. Para o arranjo de elementos nas
facetas, forneceu, ainda, 18 princpios chamados de princpios para sequncia til
(DAHLBERG, 1979). Essa mesma autora afirma que Ranganathan matematizou a
classificao, utilizando essa cincia exata de forma qualitativa. A partir da aplicao de sua
metodologia, Ranganathan criou a Colon Classification.

51

Com vistas ao trabalho de anlise para a classificao, Ranganathan introduziu


trs nveis distintos: 1) plano da ideia: nvel das ideias e conceitos; 2) plano verbal: nvel da
expresso verbal dos conceitos; 3) plano notacional: nvel da fixao dos conceitos em
formas tais como sinais, letras, etc. Para acomodar todo o conhecimento de um domnio,
Ranganathan concebeu um conjunto de categorias fundamentais, que denominado
PMEST: Personalidade, Matria, Energia, Espao e Tempo.
Entretanto, o CRG divergiu da teoria de Ranganathan nesse ponto, afirmando
que as categorias fundamentais deveriam ser identificadas e derivadas a partir do domnio a
ser classificado e no a priori. Para esse grupo de pesquisa, o PMEST muito restritivo, o
que prejudica a flexibilidade do sistema classificatrio e dificulta seu uso. Em contrapartida,
as categorias sugeridas pelo CRG so as seguintes: Tipo de Produto Final, Partes,
Materiais, Propriedade, Processo, Operao, Agente, Espao, Tempo e Forma de
Apresentao (LIMA, 2004b). No obstante, observa-se que as categorias indicadas pelo
CRG parecem se acomodar dentro das categorias indicadas por Ranganathan, sendo
apenas mais segmentadas e subdivididas. O QUADRO 1 apresenta a viso pessoal desta
pesquisa.
QUADRO 1 Comparao entre as categorias de Ranganathan e CRG
RANGANATHAN

CRG

Personalidade

Tipos de Produto Final

Matria

Partes
Materiais
Propriedades

Energia

Processos
Operaes
Agentes

Espao

Espao

Tempo

Tempo

Fonte: Elaborado pela autora.

Para analisar o QUADRO 1 partiu-se da considerao de que as categorias


fundamentais, tanto de Ranganathan quanto do CRG, esto a segmentar o contedo de um
documento, considerando-o como um domnio em particular. Pondera-se, nesse sentido,
que todo domnio possui, na viso de Ranganathan, as categorias: Personalidade, que o
assunto ou objeto; Matria, que a decomposio desse assunto ou objeto em diferentes
atributos ou caractersticas (materiais, propriedades, qualidade); Energia, que so as
aes, atividades ou processos em relao ao assunto ou objeto investigado; Espao, que
a ambientao do assunto ou objeto, tal como seu lugar geogrfico; e Tempo, que
geralmente a data ou perodo histrico-contextual do objeto estudado, ou mesmo o ano de

52

produo de tal conhecimento. As categorias Espao e Tempo so iguais e por isso no


causam polmica, porm, as outras merecem melhor esclarecimento. Traando um paralelo
com as demais categorias indicadas por Ranganathan e o CRG, conforme QUADRO 1,
consideram-se as categorias: Personalidade como Tipos de Produto Final, pois o tema
sobre o qual o autor ir investigar; Matria como Partes, Materiais, Propriedade, que a
segmentao do tema pesquisado; e Energia como Processos, Operaes, Agentes,
uma vez que indica as formas de execuo e as variveis analisadas na ao. Desse modo,
nota-se que mesmo ampliando o nmero de categorias, as mesmas podem ser
consideradas especificidades das categorias representadas pelo PMEST, idealizado por
Ranganathan.
Contudo, concorda-se que haver casos nos quais mais adequado que as
categorias sejam subdivididas e que essa deciso deve advir do objetivo ao qual a
classificao ir atender. Desmembrar um domnio categorias mais segmentadas ou em
mais especificidades pode facilitar a percepo do usurio em relao a esse domnio.
Porm, vale ressaltar que Ranganathan no determinou que as categorias fossem
designadas exatamente pelos termos utilizados no PMEST, mas que todo domnio pode ser
decomposto por esses cinco conceitos (categorias fundamentais). Um aspecto que merece
ser considerado refere-se ao fato de que o CRG no um grupo de pesquisa com propsito
nico, isto , de mtodo de tratamento da informao, porm, com pesquisas e iniciativas
realizadas separadamente, uma vez que os seus estudos encontram-se espalhados em
diferentes fontes individuais. Com isso, nota-se disperso de seus resultados, dificultando
uma avaliao mais acurada acerca dos mesmos. A dificuldade em reuni-los em um s
documento fez com que a pesquisadora Spiteri (1998) desenvolvesse um modelo
simplificado para a anlise facetada, que tinha como objetivo principal o ensino do mtodo,
oferecendo aos alunos uma forma mais fcil de aprender o processo classificatrio facetado.
Segundo Lima (2004a), Spiteri
buscou sintetizar os cnones e postulados (aqui tratados sob o mesmo
termo princpios) de Ranganathan e o plano das idias do CRG em
apenas dois grupos de princpios: (1) sete princpios do plano das idias
para escolha das facetas e dos focos, e (2) dois princpios para ordem de
citao das facetas e dos focos, subdivididos em (a) Princpios das
Sucesses Relevantes com oito subidvises e (b) Princpio da Sucesso
Consistente. Spiteri utiliza, ainda, quatro princpios do plano verbal e dois
princpios do plano notacional [...] (LIMA, 2004a, p.86).

Analisando o Prolegomena de Ranganathan (1967), percebe-se que a sntese


desse estudo, apresentada por Spiteri, no reduz o princpio e o sentido da anlise facetada,
como se pode observar pela explicao do seguinte raciocnio:

53

Plano das ideias:


1) Princpios do plano das ideias:
a) Diferenciao (Ranganathan): distino precisa do critrio utilizado para a
diviso, de forma que no haja forma de agrupar elementos diferentes;
b) Relevncia (Ranganathan e CRG): adequado ao objetivo proposto;
c) Verificao (Ranganathan e CRG): uso de facetas definitivas e que possam
ter seu uso validado na literatura ou pelos especialistas do domnio;
d) Permanncia (Ranganathan e CRG): a escolha das facetas deve obedecer ao
critrio de ter um sentido estvel dentro do domnio;
e) Homogeneidade (CRG): ser coeso, com facetas divididas apenas sob um
critrio (Ranganathan estabelece a excluso mtua, que parece reafirmar o carter de
homogeneidade);
f) Mtua excluso (Ranganathan e CRG): os focos de uma faceta, que
representam um dado conceito, no podem pertencer a mais de uma categoria, ou seja, no
podem se repetir;
g) Categorias fundamentais (CRG): as categorias emergem em relao ao
domnio e ao objetivo pretendido, e no por imposio de princpios rgidos de
determinao;
2) Princpios para a escolha da ordem das facetas e classes:
a) Sucesso relevante (CRG): a sequncia dos assuntos deve ser til e se
acomodar ao objetivo proposto, podendo ser: do

complexo ao simples, do simples ao

complexo, espacial ou geomtrica, cannica, cronolgica, em quantidade crescente ou


decrescente ou alfabtica.
b)

Sucesso

consistente

(Ranganathan):

para

classes

semelhantes,

preferencialmente, o uso de uma sequncia de assuntos.

Plano verbal
1) Contexto (Ranganathan): o significado de cada termo na classificao deve
ser determinado em razo da classe qual pertence, pois preciso que todos eles denotem
um s sentido, em completude.
2) Aceitabilidade ou terminologia usual (Ranganathan): cada termo usado para a
faceta ou para um foco deve ser aceito no contexto de uso. Caso o termo escolhido se torne
obsoleto, o mesmo deve ser trocado por outro mais adequado.

54

Plano notacional
1) Sinnimo (Ranganathan): se houver mais de um termo representando um
mesmo conceito (sinonmia), ainda assim haver, apenas, uma nica notao para indicar
esse conceito, sejam quantos forem os sinnimos;
2) Homnimo (Ranganathan): nenhum nmero poder representar mais de um
conceito, ainda que sejam homnimos (mesma grafia ou pronncia e significados
diferentes);
3) Hospitalidade (CRG): ser flexvel, sempre permitindo a incluso de novos
termos, pois o sistema notacional deve acomodar mudanas, atualizaes e adies de
novos termos;
4) Arquivamento (CRG): respeitar a ordem estabelecida pela tabela utilizada pelo
sistema.
Sabe-se que esse modelo simplificado de Spiteri facilitou bastante os estudos
sobre a anlise facetada, tendo servido de base para a elaborao de sistemas de
classificao facetada e de tesauros para recuperao da informao (LIMA, 2004a, p.87).
Nessa circunstncia, de acordo com Morville e Rosenfeld (2006, p. 221-222) a diferena
entre um sistema de classificao tradicional e uma classificao facetada que esta ltima
baseada no princpio de mltiplas taxonomias, que a caracterstica da taxonomia
facetada desenvolvida nesta pesquisa.
Alis, vale ressaltar que a caracterstica de mltiplas taxonomias est presente
nas ontologias, que vm sendo aplicadas na CI desde a dcada de 90, como instrumentos
de representao do conhecimento de um domnio, visando recuperao de informaes.
No restam dvidas de que a estruturao ontolgica de uma rea de conhecimento
complexa e gera sistemas robustos e mais precisos, implicando formalizao lgicamatemtica de conceitos, o que possibilita um amplo relacionamento entre eles. Isso
possvel porque uma ontologia constituda por classes (conceitos), sob as quais h uma
taxonomia, que sua espinha dorsal, e pelas relaes existentes entre as classes e os
elementos da taxonomia (GRUBER, 1996). Acredita-se, que essa forma de estruturar um
domnio, dividindo-o em classes que possuem uma hierarquia taxonmica, abriu
precedentes para a evoluo da taxonomia tradicional (hierrquica) para uma taxonomia
facetada, uma vez que, em relao sua estrutura, uma ontologia possui uma taxonomia
hierrquica sob cada uma de suas categorias mais gerais.
Contudo, as ontologias exigem especificaes formais e so capazes de realizar
inferncias sobre um domnio, mas elas ainda no apresentam uma interface muito
amigvel ao ser humano, sobretudo para o usurio final de uma biblioteca digital. Acredita-

55

se, entretanto, que, nesse nicho, as taxonomias facetadas so mais convenientes, uma vez
que so menos complexas e mais intuitivas. Dessa maneira, fcil entender a qual classe
determinado elemento pertence, principalmente em uma BDTD, com informaes
especializadas para a comunidade cientfica.
Corroborando essa ideia, Simon, Valdes-Perez e Sleeman (1997) afirmam que
nem sempre desenvolver um programa com algoritmos complexos o mais acertado, pois
os sistemas complexos podem s vezes ser necessrios, entretanto, a simplicidade,
quando atingvel, deve sempre ser preferida (ibidem, p.181). Os autores alegam que a Web
e grandes bancos de dados podem exigir complexidade, mas que simples solues podem
ser suficientes para que uma informao cientfica especializada esteja facilmente acessvel
para ser recuperada.
Dessa forma, interessante apontar que a taxonomia facetada navegacional,
desenvolvida nesta pesquisa, tem a caracterstica de ser uma ideia simples e exequvel,
capaz de facilitar o acesso a contedos especficos dos resultados de pesquisas
disponibilizados na BDTD, aprimorando, com isso, a recuperao de informao. Para
melhor entendimento do tema, apresenta-se, a seguir, sua conceituao.

4.2 A taxonomia facetada navegacional


Neste ponto da fundamentao, apresentam-se os conceitos que caracterizam o
objeto (tema) deste estudo, uma taxonomia facetada navegacional. Como j conceituado
anteriormente, tradicionalmente, uma taxonomia apresentada na forma de uma hierarquia,
representando um domnio. Uma taxonomia facetada, por sua vez, apresenta um domnio
segmentado em facetas, sendo que, em cada faceta, h uma hierarquia, e as possveis
relaes entre as facetas podem indicar a multidimensionalidade de um termo nesse mesmo
domnio.
J o termo navegao, em ambiente digital, refere-se tcnica interativa,
utilizada para acessar um conjunto de informaes. O verbete navegao do Dicionrio de
Biblioteconomia e Arquivologia explica essa noo apresentando a definio:
pesquisar (ou navegar) em um programa, procurar comandos, percorrer um
documento e buscar informaes [...] [que o] processo dos usurios
interagindo com um stio visando satisfazer suas necessidades de
informao [...], [navegando] em stios por meio de busca e folheio de
objetos com contedo (CUNHA; CAVALCANTI, 2008, p.257).

Dessa maneira, percebe-se que o sentido de navegao indica a possibilidade


de o usurio explorar o contedo de um banco de dados atravs da navegao. Nesse
sentido, Bonilla (2005, p.139) afirma que a navegao est baseada nas indexaes e
associaes de idias e conceitos, organizados sob a forma de links, os quais agem como
portas virtuais que abrem caminhos para outras informaes. Na literatura nota-se que a

56

classificao de documentos de um domnio, visando sua estruturao, empregada


como mecanismo para facilitar a recuperao de informaes. Essa abordagem vem sendo
denominada de paradigma de navegao facetada45 (BROUGTHON, 2006; TZITZIKAS;
ANALYTI, 2007; SACCO; TZITZIKAS, 2009).
Tendo isso em vista, correto pensar que uma navegao facetada o
procedimento que o usurio realiza, percorrendo, interativamente, um conjunto de
informaes que esto ordenadas em facetas, de tal forma que possibilitam combinaes
multidimensionais, visando encontrar um contedo. Isso corroborado por Tunkelang (2009,
p.23), quando afirma que a navegao facetada permite ao usurio elaborar uma busca
progressivamente, e lhe permite perceber o efeito que a escolha que faz por uma faceta
disponvel opera nas outras facetas. Alm disso, esse tipo de navegao, no qual o usurio
pode ir refinando sua busca a partir das opes que lhe so apresentadas, elimina a
possibilidade de resultados vazios, pois somente so apresentadas a ele as facetas nas
quais h contedos de informao.
Alguns autores fazem distino entre navegao facetada e busca facetada
(TUNKELAND, 2009), apontando que a busca facetada somente acontece quando
possvel a combinao da busca direta (por palavras-chave) com a navegao facetada.
Entretanto, a maior parte dos autores consultados usa ambos os termos como sinnimos
BROUGTHON, 2006; OLSON, 2007; BREEDING, 2007; SUOMINEN; VILJANEN;
HYVNEN, 2007; TVAROEK et al., 2008; TVAROEK; BIELIKOV, 2007), para indicar a
caracterstica e ter informaes estruturadas atravs de taxonomias facetadas, nas quais
possvel buscar informaes e explorar o contedo do banco de dados pela navegao por
elementos dispostos em facetas.
Sendo um tema relativamente novo, ainda h divergncia quanto ao melhor
termo para indicar esse novo paradigma. Em vista disso, neste estudo consideram-se os
termos busca facetada e navegao facetada como sinnimos, uma vez que so os
termos mais comumente aceitos pela maior parte dos autores e porque considera-se que
carregam um sentido mais adequado CI, pois fazem aluso aos princpios da teoria da
anlise facetada.
Partindo do exposto, preciso, ainda, apresentar um conceito para taxonomia
navegacional que, segundo Conway e Sligar (2002, on-line), criada para permitir que os
usurios encontrem informaes por meio da navegao. Para os autores, na criao da
taxonomia navegacional h a decomposio do contedo de um documento ou domnio em
categorias e facetas, com base em conceitos, a partir de uma lgica de organizao prestabelecida. Assim, tem-se o estabelecimento dos termos atravs de similaridades,

45

Faceted browsing paradigm.

57

semelhanas,

diferenas,

afinidades e

dependncias,

buscando

associaes.

Os

pesquisadores citam como exemplo de taxonomias navegacionais a pgina de busca da


Microsoft Network46 (MSN) e a HomeAdvisor47.
Conway e Sligar (2002) afirmam, ainda, que uma taxonomia navegacional ,
geralmente, criada para propsitos especficos de uso. Dessa forma, o reuso de suas
categorias por outros sistemas est condicionado queles que possurem idnticos
propsitos e tipos de contedo, como em qualquer outro tipo de estrutura de modelagem
informacional. Ademais, a estrutura da taxonomia navegacional expe e permite ao usurio
perceber o contedo do domnio, conforme demonstra a FIG. 4.
FIGURA 4 Exemplo de taxonomia navegacional

Fonte: Conway e Sligar (2002, on-line).

Observa-se, a partir da FIG. 4, que uma taxonomia navegacional consiste em um


conjunto de elementos passveis de serem navegados em um SRI, de forma progressiva,
restringindo a busca a um subconjunto de elementos que foi determinado com base nas
relaes existentes entre as facetas.
Partindo de tudo que foi exposto neste subcaptulo, pode-se chegar a uma
conceituao para taxonomia facetada navegacional: uma estrutura de organizao
46
47

Disponvel em: <http://search.msn.com/>.


Disponvel em: <http://homeadvisor.msn.com/>.

58

composta de um sistema de categorias, sendo que, dentro de cada uma (categoria) criada
uma hierarquia de facetas e subfacetas, obedecendo a critrios pr-estabelecidos para a
concepo das mesmas (categorias), o que permite atribuir diferentes dimenses
(multidimensional) a um objeto (documento48). , ainda, um sistema organizado sob a forma
de links, atravs dos quais o usurio tem a possibilidade de navegar, de forma interativa,
filtrando e restringindo sua busca em conformidade com sua escolha de facetas.
Por conseguinte, a busca realizada a partir de uma taxonomia facetada
navegacional permite aos usurios explorar uma grande quantidade de informaes, de
forma flexvel, atravs da navegao, de modo que a sobrecarga informacional possa ser
minimizada. Sendo assim, o papel fundamental de uma taxonomia facetada navegacional
guiar o usurio na busca, explicitando as informaes referentes ao contedo que realmente
est disponvel no banco de dados.
Dessa maneira, o usurio pode iniciar a formulao de sua questo a partir de
qualquer uma das dimenses, o que facilita a busca e auxilia a recuperao de informaes,
tema este que merece uma ateno maior atravs do prximo tpico.

4.3 Recuperao da informao


Discorrer sobre o aumento da produo e da quantidade de informao
disponibilizada nos dias atuais tema recorrente na sociedade cientfica desde a dcada de
40 e, desde ento, diferentes problemas recaram no processo de recuperao de
informaes.
No mbito da CI, o termo recuperao da informao tem usos distintos, pois
pode ser empregado: na operao de seleo de documentos em um acervo, a partir da
demanda de um usurio; no fornecimento de um tpico especfico de informao, a partir da
demanda de um usurio; para designar a elaborao de bibliografia ou notas de sntese
para atender ao pedido de um usurio; para indicar um campo mais amplo, que inclui o
tratamento dado informao; e tambm como uma rea de pesquisa (FERNEDA, 2003).
Diante dessa diversidade de usos, esclarece-se que esta dissertao destaca a rea de
pesquisa em recuperao da informao (RI), focalizando o processo de busca da
informao.
A rea de pesquisa de RI tem Calvin Mooers como precursor, pois esse
pesquisador cunhou o termo information retrieval ainda na dcada de 50, indicando que,
aliado a questes referentes ao tratamento na entrada de dados, o processo de RI envolve
48

Nesta dissertao, documento tem um sentido mais amplo de ser qualquer unidade informacional, impressa
ou no, passvel de catalogao ou indexao, seja qual for a sua natureza ou suporte (ver item 4.8).
Entretanto, neste estudo trata-se de manusear documento especificamente do tipo teses e dissertaes e a
esse tipo de objeto (documento) que nos referimos nesse exemplo.

59

as especificaes de busca, alm de os sistemas, tcnicas e equipamentos que so


aplicados para realizar o processo (SARACEVIC, 1999, p.1057 49).
Outro importante autor nessa rea G. Salton, principalmente em estudos sobre
indexao automtica para sistemas de recuperao de informaes (SRI) (SAYO, 2008),
na dcada de 60, com seu sistema System for the Mechanical Analysis and Retrieval of Text
(SMART). importante destacar, que a concepo de recuperao da informao nessa
poca estava centrada na construo de sistemas (abordagem centrada no sistema), fato
que parece ser explicado porque, nesse perodo, outros pesquisadores, alm de Calvin,
envolvidos nas questes relativas recuperao da informao advinham da rea da
computao: Mortimer Taube, James Perry, Allen Kent, Hans Peter Luhn, entre outros
(SARACEVIC, 1999).
Desde ento, abordagem centrada no sistema foram sendo agregadas outras
abordagens, com o desenvolvimento de estudos sobre os SRIs visando melhores solues
para permitir o acesso do usurio ao contedo de seus bancos de dados, centrando seus
esforos tambm nos modelos mentais do usurio (abordagem alternativa) na busca por
informaes. Nesse processo de busca da informao, o usurio est interessado em
identificar um conjunto de documentos em um SRI, que atendam sua necessidade de
informao. Esse usurio est, portanto, interessado em recuperar informao sobre
determinado assunto e no em recuperar dados50 que satisfazem sua expresso de busca,
e nem tampouco documentos, embora seja nestes que a informao est registrada
(FERNEDA, 2003, p.15). Entende-se, assim, que a recuperao de um documento que
contm

determinada

expresso

de

busca

utilizada

na

busca

do

usurio

no,

necessariamente, significa que esse item contenha informao considerada relevante. Pode
acontecer de este item apenas apresentar dados, isto , contedos sobre as palavras da
expresso de busca, talvez com a mesma construo sinttica, mas sem valor semntico
para que possa atender necessidade do usurio. Portanto, quanto mais especfica e
contextualizada for a resposta oferecida pelo SRI em relao necessidade informacional
do usurio, maior poder ser a satisfao dele.
Um SRI, na concepo de Lancaster (1993), um sistema de informao que
possui a propriedade de informar ao usurio quais documentos se referem ao tema
buscado. Ademais, Kuramoto (1995) reuniu diferentes pontos de vista sobre o conceito de
SRI:
49

Information retrieval embraces the intellectual aspects of the description of information and its specification for
search, and also whatever systems, techniques or machines that are employed to carry out the operation.
50
Dado necessariamente uma entidade matemtica e, desta forma, puramente sinttica. Isto significa que os
dados podem ser totalmente descritos atravs de representaes formais, estruturais. [...] Informao uma
abstrao informal (isto , no pode ser formalizada atravs de uma teoria lgica ou matemtica), que
representa algo significativo para algum atravs de textos, imagens, sons ou animao. (SETZER, 1999, online).

60

Harter define um sistema de recuperao de informao (SRI) como um


dispositivo que se interpe entre os usurios e a coleo de informao.
Strzalkowski complementa esta definio, afirmando que tais sistemas tm
como funo tpica a de selecionar documentos de uma base de dados, em
resposta a uma questo do usurio, apresentando-os em ordem de
pertinncia, enquanto Salton e Mcgill conceituam tecnicamente um SRI
como um sistema que trata da representao, do armazenamento, da
organizao e do acesso aos itens de informao (KURAMOTO, 1995, p.1,
grifos nossos).

Partindo dessas conceituaes, observa-se a importncia do tema sob dois


aspectos: a questo da necessidade do usurio e a questo do acesso informao.
preciso entender, que os SRIs lidam com informao textual51 e incorporam os problemas
existentes no uso da linguagem natural (sinonmia, polissemia). Esses problemas podem ser
minimizados na medida em que o SRI estabelece medidas de controle terminolgico
utilizando, por exemplo, vocabulrios controlados para a padronizao de seu vocabulrio
(FERNEDA, 2003).
Nesse cenrio, cabe mencionar que existem diversos modelos apropriados para
a representao da informao para a recuperao de contedos informacionais. Tais
modelos auxiliam na compreenso de um dado domnio e possibilitam a elaborao de
vocabulrios controlados. Segundo Currs (1995, p.37), qualquer vocabulrio controlado
uma linguagem controlada, normalizada, usada com fins classificatrios, onde a linguagem
natural transladada para uma linguagem terminolgica. Essas linguagens objetivam a
recuperao de informaes e a organizao dos contedos informacionais de
documentos (CAMPOS, M., 2004, p.24). Essa atividade, entretanto, est ligada,
geralmente, entrada de dados no sistema (SRI), com o processamento das informaes.
Entretanto, o processo completo de um SRI inclui basicamente uma entrada
(coleta de informaes), processamento (tratamento das informaes), sada (formas de
apresentar o resultado do processamento) e respostas (acesso s informaes). Assim,
esperado que a preocupao com a recuperao de informaes em relao sua forma de
sada tambm esteja presente nos estudos na rea de CI. A forma de sada abordada nesta
dissertao se refere possibilidade de navegao entre os documentos, a partir da
representao e organizao de seus contedos, formando sistemas de hipertexto 52.
Considera-se que bibliotecas digitais (BD) de assuntos especializados, como o caso das
BDs de teses e dissertaes, devem contar com interfaces que aliem a recuperao de
informaes com a possibilidade de navegao por links de contedos dos documentos.
Ainda pelos idos de 1895, Otlet, no Instituto Internacional de Bibliografia (IIB), no
campo da Documentao, desenvolveu metodologias para a organizao do contedo dos
51
52

Ainda que hoje haja sistemas de recuperao udio-visual (ou de quaisquer outros tipos), neste estudo sero
tratadas apenas questes relativas a informaes textuais.
Possibilidade de associar diferentes partes de um mesmo documento ou de distintos documentos, atravs de
links navegveis para acesso ao contedo.

61

documentos, a fim de obter melhor acesso a esses contedos, aprimorando a recuperao


de informaes, tendo sido, talvez, o pioneiro nessa rea em particular (ALVES, 2007).
Em seguida, pode-se destacar Bush que, em 1945, j tinha especial
preocupao com as questes de acesso e recuperao de informaes. Dessa maneira,
apesar de se tratar de uma poca marcada pelo fim da Segunda Guerra Mundial, focou seus
estudos, sobretudo, em questes acadmicas, pois
diagnosticou a dificuldade cada vez maior do desenvolvimento cientfico em
funo de ineficientes sistemas de produo, organizao, acesso,
recuperao e disseminao da informao devido ao crescimento do
conhecimento humano. Alertou para a perda de contedos importantssimos
em meio a uma imensidade de outros textos e consequente duplicao de
pesquisas. Mas o problema no se restringia ao quantitativo aumento de
informaes, e sim na maneira de process-la, na demanda de pesquisas e
experincias que pediam processamentos que fizessem circular
eficazmente um volume infinito de informao. Para gerenciar este
problema, havia a necessidade de novas tecnologias (novas metodologias,
instrumentos e mquinas) (ALVES, 2007, p.32).

Como se nota, desde aquela poca os estudos tm sido direcionados para as


questes de acesso a informaes estruturadas, tentando impedir a duplicao de
pesquisas e a perda de parte do conhecimento j descoberto. Com isso, Bush almejava o
acesso e a transferncia da informao e do conhecimento, a partir de seu sistema
hipertextual Memex.
Mais recentemente, com a ideia da Web semntica, desenvolvida por Tim
Berners-Lee, no mbito da World Wilde Web Consortium53 (W3C), os trabalhos em
recuperao da informao na CI tm adotado essa linha condutora, buscando dar
significado ao contedo disponibilizado, de forma a tornar o acesso mais facilitado e a
recuperao de informaes mais eficiente. Em face disso, Souza e Alvarenga (2004, p.140)
concluem que
o estudo das possibilidades que se abrem e a compreenso de que todo o
embasamento filosfico, metodolgico e conceitual da Web Semntica parte
do ncleo duro da cincia da informao nos impelem a demarcar e
arrebanhar os legtimos territrios do saber e a buscar ativamente uma
atuao no desenho destes novos panoramas informacionais. Precisamos
hoje trilhar um caminho rumo a uma nova e necessria valorizao da rea
de cincia da informao, que oferece teoria, metodologias e competncias
que compem a quintessncia daquilo que se espera dos trabalhadores e
pesquisadores de uma sociedade baseada em informao e conhecimento.
E a importncia da Web e das demais redes digitais de troca de
informaes no panorama mundial so amostras de como a atividade de
organizao da informao necessria para a evoluo dos indivduos,
organizaes e da sociedade em geral.

Sendo assim, nota-se constante preocupao com melhores prticas que


aprimorem a recuperao de informaes, desde para Bush, em 1945, com a preocupao
53

Consrcio internacional com cerca de 300 membros, que agrega empresas, rgos governamentais e
organizaes independentes. Busca desenvolver padres para a criao e a interpretao de contedos para
a Web.

62

voltada para o reuso de conhecimentos j desvendados, atravs do uso de tecnologias, at


para Souza e Alvarenga, em 2004, preocupados em encontrar solues tecnolgicas que
estejam respaldadas em teorias e metodologias de organizao da informao, propiciando
o acesso e a troca de informaes essenciais para o desenvolvimento da cincia e da
sociedade como um todo.
Portanto, chega-se ao contexto da proposta apresentada nesta dissertao, de
criar um mecanismo que se baseia em teorias e metodologias da rea da CI, que organiza e
estrutura o conhecimento contido nas teses e dissertaes, atravs de uma taxonomia
facetada navegacional. Dessa forma, pretende-se minimizar a possibilidade de duplicao
de pesquisas e evitar a perda de conhecimentos valiosos para a rea, usando, para isso,
solues tecnolgicas j conhecidas e disponveis, a fim de facilitar a busca e a recuperao
de informaes.
Neste contexto, significativo, ainda, indicar que a busca de informao54
retrata um processo que consiste em situar a informao numa tabela ou arquivo por
referncia a um campo especial de cada registro, denominado chave. O objetivo da busca
descobrir um registro com determinada chave (CUNHA; CAVALCANTI, 2008, p.59). Em
contrapartida, a recuperao de informao55 a restituio dos dados constantes do
sistema, para obteno de informaes especficas ou genricas. A restituio, ou
recuperao, abrange o processo total de identificao, busca, encontro e extrao da
informao armazenada (CUNHA; CAVALCANTI, 2008, p.307). Esse processo parte de
um processo mais amplo, que se denomina sistema de recuperao da informao (SRI),
que, para Lancaster e Warner (1993), refere-se interface entre o acervo da biblioteca,
tradicional ou no, e os usurios, e cujas funes incluem a aquisio, armazenamento,
organizao, distribuio e disseminao de documentos. Ademais, Baeza-Yates e RibeiroNeto (1999), indicam o SRI como um sistema que engloba funes de representao,
armazenamento, organizao e acesso s informaes. J Cunha e Cavalcanti (2008),
conceituam este sistema como aquele que
armazena e recupera informao, a qual pode estar em textos completos,
documentos substitutos (tais como resumos) ou referncias bibliogrficas.
Engloba os aspectos intelectuais da descrio de informaes e suas
especificidades para a busca, alm de quaisquer sistemas, tcnicas ou
meios eletrnicos empregados para o desempenho da operao
(ROWLEY, 1994, p.47 citado por CUNHA; CAVALCANTI, 2008, p.345).

Nesse sentido, v-se que descrever o recurso informacional, visando s


especificidades da busca, constitui uma tarefa esperada de um SRI, ainda que, para isso,
seja preciso empregar esforos humanos de indexao e no apenas meios automticos e
inovaes tecnolgicas.
54
55

Termo em ingls: information searching.


Termo em ingls: information retrieval.

63

Com as inovaes tecnolgicas, os servios de transferncia de informao se


expandiram e vm sendo redimensionados e arquitetados para se adequarem s
necessidades dos usurios. Nesses termos, as bibliotecas digitais podem ser consideradas
como inovao tecnolgica no gerenciamento de contedos digitais, justamente, e se
preocupam com a questo do acesso e com a comunicao da informao. Como
reconhecimento de sua importncia, projetos de implantao de bibliotecas digitais tm
crescido e j possvel verificar grandes variaes nas opes de buscas disponibilizadas.
A fim de um aprofundamento neste contexto, destaca-se que houve significativa
evoluo nas opes de busca em bibliotecas digitais em geral, estratgias que j estavam
presentes em alguns softwares de bibliotecas (como o CDS-ISIS, por exemplo, desenvolvido
pela UNESCO). Em meio digital, pode-se dizer que essas alternativas se iniciaram com os
catlogos eletrnicos on-line, conhecidos na Internet como OPACs (On-line Public Access
Catalogs), nos quais se faz consultas padres por palavra-chave, nome do autor ou ttulo da
obra. Atualmente, a biblioteca digital pode oferecer diversificadas opes que ultrapassam
essas consultas padro, dentre as quais, destacam-se:
Boolean Logic (busca booleana): busca por combinaes lgicas de mltiplos
termos, utilizando os operadores tpicos and, or e not, em que, usando o operador and, o
resultado dever conter, pelo menos, uma ocorrncia de cada palavra ou frase especificada;
usando o operador or, o resultado apresentar pelo menos uma ocorrncia de qualquer uma
das palavras ou frases especificadas; e, usando o operador not, o resultado no dever
apresentar qualquer ocorrncia do termo especificado para este operador.
Fuzzy Expansion (expanso Fuzzi): expande a busca por similaridade da
escrita ou da pronncia, para minimizar erros de grafia. Os operadores tpicos so: spelled
like (similaridade na escrita) e sounds like (similaridade na pronncia).
Wildcard: expande a busca de uma palavra, partindo de uma origem comum,
sem considerar se ela pertence ou no mesma origem lingustica. H alguns sistemas que
j embute esta propriedade como padro, expandindo a busca do usurio, sem que ele
especifique isso. Os operadores tpicos so: (*) encontra qualquer conjunto de 0 ou mais
caracteres, at um espao ou pontuao (h bibliotecas que utilizam o caractere (%); (?)
representa o nmero de caracteres que se deseja, aps a palavra origem.
Exactly like / stem expansion (busca exata / busca estendida): expande a
busca para variaes derivadas da palavra originria. A variao inclui nome, pronome,
adjetivo. Porm, todas as palavras derivadas tm a mesma origem lingustica.
Case Sensitivity: serve para ignorar ou no o uso da palavra escrita em
maiscula, minscula ou de ambas as formas. Geralmente uma configurao padro nos
SRIs, e no est disponvel para a escolha do usurio. Os operadores tpicos so:
upper/lower case no qual a palavra deve aparecer em maiscula ou minscula; e ignore

64

case differences, sendo aquele em que o sistema ignora o aparecimento de maiscula ou


minscula na frase.
Accent Sensitivity: consultas insensveis ou no ao uso de distino de sinais
diacrticos, que so sinais grficos que permitem distinguir modulao das vogais, tais como
a vrgula, acento agudo, ponto, etc.
Stopwords: h um conjunto de palavras que podem ser ignoradas nas buscas.
Geralmente, tambm aparecem embutidas por padro.
Proximidade: localiza documentos em que os termos especificados ocorram, no
mnimo, uma vez. Quanto mais prximos estiverem os termos dentro de um mesmo
documento, maior ser sua relevncia.
Nas BDTDs, de modo recorrente, empregam-se as seguintes formas de busca e
recuperao da informao: buscas por elementos como ttulo, autor e data, alm da busca
por assunto, que pode ser na forma simples ou avanada. Nas formas de busca por
assunto, seja simples ou avanada, h uma varredura nas palavras contidas nesses
elementos (ttulo, autor e data), no resumo e nas palavras-chave. Com relao busca
simples, em geral, o usurio submete um termo ou mais ao sistema, podendo ocorrer, na
recuperao de informaes, o aumento da revocao e a falta de preciso do sistema. A
ttulo de definio,
a revocao, ou recall ou mesmo abrangncia, a razo do nmero de
documentos atinentes recuperados sobre o total de documentos atinentes
disponveis na base de dados. A revocao mede o sucesso do SRI em
recuperar documentos pertinentes.
[a preciso a] razo do nmero de documentos atinentes recuperados
sobre o total de documentos recuperados. A preciso mede o sucesso do
SRI em no recuperar documentos que no sejam relevantes de acordo
com a necessidade de informao (SOUZA, R., 2006, p.163).

J na busca avanada, h vrios campos, com diferentes possibilidades de


busca, que podem permitir combinao. O tipo mais comum a busca booleana (j citada
anteriormente), que pesquisa combinaes lgicas de mltiplos termos. fato que so
muitos os usurios que no se sentem vontade nesse tipo de busca, geralmente, por falta
de conhecimento sobre como a combinao dos operadores booleanos (and, or e not) se
estabelece. Inclusive, isso confirmado pelo estudo de Baeza-Yates e Ribeiro-Neto (1999),
no qual os autores estabelecem as principais caractersticas dos usurios de bibliotecas
digitais, dentre as quais, destacam-se: 1) preferem buscas pautadas em respostas, em
detrimento a perguntas, pois tm dificuldades na formulao destas; 2) usam poucos termos
ao formular suas consultas; 3) dispersam-se com facilidade ao serem sobrecarregados com
informaes; 4) no tm pacincia em aguardar respostas de suas buscas; 5) acham as
buscas booleanas difceis de compreender.

65

Em vista disso, aponta-se que trs das cinco caractersticas acima deram
respaldo proposta desenvolvida nesta dissertao e representam os pressupostos, quais
sejam: 1) buscas pautadas em resposta; 2) sobrecarga de informaes; 3) buscas
booleanas so difceis de compreender. Pretende-se que a taxonomia facetada
navegacional ordene o contedo dos documentos, de forma que as perguntas estejam
formuladas implicitamente, atravs de combinaes do tipo das buscas booleanas, gerando
respostas pr-estabelecidas, evitando sobrecarga de informaes.
No se pode esquecer que Kwasnick (1999, p.40-42) enumera algumas
vantagens das classificaes (taxonomias) facetadas: 1) no exigem que o classificador
conhea todas as entidades ou as relaes entre elas; 2) so flexveis; 3) so hospitaleiras,
uma vez que permitem a insero de novas entidades; 4) so expressivas; 5) podem ser ad
hoc, isto , elaboradas para um objetivo especfico; e 6) permitem diferentes perspectivas e
abordagens dos objetos representados.
Portanto, uma taxonomia facetada pode ser construda sob mltiplos critrios,
facilitando a recuperao da informao, pois cada documento pode ser etiquetado
(atribuies) sob diferentes categorias. Em uma biblioteca digital, um mesmo item pode ser
segmentado por categorias, por exemplo, pela cor, pela idade, pelo gnero, pelo tamanho,
entre outros. Assim, cada faceta, na taxonomia, pode ser incorporada separadamente, na
forma de metadados, e cada uma dessas facetas oferece condies de ser buscada. Lambe
(2007) afirma que taxonomias facetadas evitam a ambiguidade, assegurando que cada
faceta seja nica e obviamente diferente de qualquer outra (ibidem, p.37, traduo nossa).
Essa caracterstica facilita a comunicao entre os pares, fornece visibilidade ao
conhecimento acumulado e permite a transferncia de informao, preocupaes ainda
poca de Bush.
J naquela poca Bush abordou preocupaes atuais da comunidade
cientfica e da humanidade como um todo: Qual a maneira eficiente de
armazenar e recuperar o conhecimento humano? Como fazer uso
apropriado do crescente volume de informaes? Como impedir que uma
informao relevante passe despercebida em meio a uma abundante
gerao de conhecimento? (ALVES, 2007, p.33).

Nesse sentido, a taxonomia facetada navegacional proposta nesta dissertao


pretende atuar como um mapeamento do conhecimento acumulado e registrado, facilitando
a comunicao entre os membros da comunidade cientfica, fortalecendo os vnculos entre
os diferentes atores e a rea em geral, atravs do ambiente de uma biblioteca digital.
Refletindo sobre essas questes, a seguir passa-se a uma breve apresentao do ambiente
digital de uma biblioteca.

66

4.4 Bibliotecas digitais


As bibliotecas digitais tm sua origem na dcada de 90, juntamente com a
expanso comercial do uso da Internet. Com a facilidade no armazenamento e publicaes
digitais, houve a necessidade de que as bibliotecas, antes tradicionalmente em ambientes
fsicos, estabelecessem uma nova estrutura de servios de informao. Dessa forma, a
partir de ento, o ponto central de preocupao dessas instituies deixou de ser somente o
acervo fsico e seu armazenamento, que cedeu espao para as questes tambm
relacionadas ao acesso s informaes (ZAFALON, 2008).
Notou-se uma evoluo nos servios oferecidos pelas bibliotecas digitais, que
passaram pelo acesso a apontadores, a obras digitalizadas, a catlogos e a informaes
institucionais (SILVA; MRDERO; CLAUDIO, 1997). Contudo, pode-se observar que o
momento de transio e adaptao, pois os servios de informao oferecidos pelas
bibliotecas digitais ainda no esto aplicando todo o conhecimento j acumulado sobre a
organizao para documentos em acervos fsicos. Em ambiente digital h diferentes
perspectivas para o gerenciamento do recurso informacional disponibilizado que podem ser
melhor exploradas, utilizando produtos de representaes documentrias j amplamente
conhecidas, de forma que se antecipe s necessidades de diferentes comunidades de
usurios.
Destaca-se que, at h pouco tempo, era tema de debate entre os
pesquisadores o conceito de biblioteca digital, e, ainda hoje, percebe-se alguma polmica
entre os autores. Porm, na contemporaneidade, parece haver mais pontos semelhantes do
que divergentes entre eles, apesar de denominaes diversificadas tais como biblioteca
virtual, biblioteca digital, biblioteca eletrnica e biblioteca sem paredes, termos que muitas
vezes so empregados como sinnimos. Em um artigo publicado em 2002, Ohira e Prado
levantaram a evoluo dos conceitos de biblioteca digital e biblioteca virtual contidos em
artigos entre os anos de 1995 e 2000. Nesse estudo, foram analisados 33 artigos de
peridicos nacionais especializados em Biblioteconomia e Cincia da Informao. Como o
intuito da presente pesquisa no adentrar na polmica de uso dos diferentes termos para
biblioteca digital, sero fornecidos alguns conceitos elencados por Ohira e Prado (2002, online), com o objetivo de situar o leitor no tema de biblioteca digital:
Biblioteca digital difere das demais, porque a informao que ela contm
existe apenas na forma digital, podendo residir em meios diferentes de
armazenagem, como as memrias eletrnicas (discos magnticos e ticos).
Desta forma, a biblioteca digital no contm livros na forma convencional, e
a informao pode ser acessada, em locais especficos e remotamente, por
meio de computadores (MARCHIORI, 1997, on-line).
a biblioteca digital tambm conhecida como biblioteca eletrnica (termo
preferido pelos britnicos), biblioteca virtual (quando utiliza os recursos da

67

realidade virtual), biblioteca sem paredes e biblioteca conectada a uma rede


(CUNHA, 1999, p.258).
[a biblioteca digital] no contempla materiais convencionais impressos como
livros, j que estes seriam convertidos/digitalizados para o formato digital
(MACEDO; MODESTO, 1999, p.64).
a biblioteca digital seria aquela que teria, alm de seu catlogo, os textos
dos documentos de seu acervo armazenados de forma digital, permitindo
sua leitura na tela do monitor ou sua importao (download) para o disco
rgido do computador [...] (LEMOS, 1998, p.358 citado por PEREIRA;
RUTINA, 1999, p.14).
a biblioteca digital tem como caracterstica uma coleo de documentos
eminentemente digitais, independendo se forem criados na forma digital ou
digitalizados a partir de documentos impressos, e permite, por meio do uso
de redes de computadores, compartilhar a informao instantnea e
facilmente (MOREIRA, 1998, p.31 citado por MACHADO et al., 1999,
p.218).
bibliotecas digitais so simplesmente um conjunto de mecanismos
eletrnicos que facilitam a localizao da demanda informacional,
interligando recursos e usurios (CUNHA, 2000, p.78).

Como se pode observar, a despeito de alguma polmica sobre o tema, o ponto


recorrente nas caractersticas descritas sobre biblioteca digital que ela possui recursos
informacionais na forma digital para acesso remoto. Portanto, nesta dissertao, uma
biblioteca digital considerada assim.
A ttulo de maiores esclarecimentos, sabe-se que toda biblioteca, seja
tradicional56 ou digital, tem como funes primordiais: selecionar, armazenar, disponibilizar,
preservar e dar acesso a documentos em qualquer tipo de mdia e suporte. Sendo assim,
h, nos acervos de uma biblioteca, ou no banco de dados de uma biblioteca digital (BD), um
patrimnio cultural e intelectual que devem ser representados, organizados e difundidos de
forma que, efetivamente, possam ser aplicados pela sociedade.
Para atender a esse propsito, os estudos sobre o tema de bibliotecas digitais
so feitos sob diferentes aspectos, que podem ser assim sintetizados:
a) arquiteturas, sistemas, ferramentas, e tecnologias b) contedos e
colees digitais; c) metadados; d) interoperabilidade; e) normas e padres;
f) organizao do conhecimento; g) usurios e usabilidade; h) aspecto legal,
organizacional, econmico e social (SAYO, 2007, p.18).

Em vista dessa amplitude, atualmente, muitos so os autores que se interessam


pelo tema de bibliotecas digitais no Brasil. Contudo, em qualquer que seja o aspecto
investigado, as pesquisas sempre tm em comum a caracterstica de abordar a questo do
acesso, com preocupao focada em uma recuperao de informao mais relevante e
eficaz para o usurio. Nesse sentido, a partir do incio do sculo XXI, nota-se um aumento
nos projetos de implantao de bibliotecas digitais de teses e dissertaes (BDTD), tanto
nacionais quanto estrangeiras, conforme afirma Rosetto (2008):
56

Considera-se biblioteca tradicional aquela na qual a maior parte de seus itens do acervo composto por
documentos impressos, ainda que muitas delas, hoje em dia, estejam cada vez mais possibilitando acesso
digital ao acervo.

68

Nesses primeiros anos do sculo XXI, muitos projetos para a construo de


bibliotecas digitais foram implementados, criando variados tipos de
estruturas e acumulando experincias. As melhores prticas vm se
transformando em metodologias que podem subsidiar o desenvolvimento de
implementaes similares, como alguns exemplos de projetos de carter
internacional, regional e nacional (ROSETTO, 2008, p.109)

No artigo citado, a autora discorre sobre as diferentes iniciativas, de


implementao de bibliotecas digitais, dentre as quais foram salientadas algumas iniciativas
brasileiras: o Portal Prossiga, o projeto da Biblioteca Digital Brasileira de Teses e
Dissertaes (BDTD), do Instituto Brasileiro em Informao em Cincia e Tecnologia
(IBICT), a Biblioteca Digital Portal da CAPES e a Biblioteca de Teses e Dissertaes da
Universidade de So Paulo. So iniciativas que visam dar acesso aos textos das pesquisas
e aprimorar a recuperao das informaes, uma vez que o meio digital facilita indicar
outros pontos de acesso alm daqueles j utilizados em bibliotecas tradicionais (ex. ttulo,
autor, cabealho de assunto).
Nessa perspectiva, alguns estudos tm se preocupado com a criao de
modelos de bibliotecas digitais que visam o aprimoramento da recuperao da informao
contida nos documentos, a partir de elementos semnticos, como o caso do prottipo
apresentado na tese defendida por Lima (2004a), que prope uma busca a partir da
navegao em contexto. Nessa pesquisa, a autora prope uma forma de recuperao de
informao em contexto, com a construo de um modelo hipertextual, para a organizao
de documentos acadmicos do tipo teses e dissertaes e, ainda, a sua implantao
tecnolgica. Com relao ao arqutipo, trata-se de um instrumento gerado a partir de uma
modelagem conceitual, capaz de auxiliar o usurio em suas buscas, tendo em vista que o
conhecimento est estruturado conceitualmente. preciso ressaltar que essa estrutura
feita atravs da categorizao dos conceitos, a qual possibilita organizar, semanticamente, o
contedo dos documentos, contribuindo para que o usurio perceba, atravs da navegao
nos mapas conceituais57, as relaes existentes entre os conceitos (LIMA, 2004a). Essa
navegao feita, atualmente, de modo individual, atravs dos mapas conceituais dos
documentos.
Diante das ressalvas descritas, percebe-se que o referido prottipo no se trata,
apenas, de uma biblioteca digital. Pode-se entender que ele est prximo daquilo que se
espera de uma biblioteca digital semntica. importante, porm, esclarecer que h
diferenas conceituais entre biblioteca digital (BD) e biblioteca digital semntica (BDS).
Segundo Kruk, Decker e Zieborak (2005), a BDS possui as seguintes caractersticas: a)
permite compartilhar diversificados padres de metadados, com comentrios/anotaes de
usurios; b) estabelece interoperabilidade com quaisquer tipos de sistemas de informaes,
57

Os mapas conceituais assemelham-se a diagramas, nos quais so indicadas relaes entre conceitos, em
uma estrutura que perpassa os conceitos mais abrangentes at abarcar os conceitos mais especficos.

69

incluindo os que possuem metadados de diferentes origens; c) propicia o desenvolvimento


de interfaces mais amigveis, baseando as buscas e a navegao em elementos
semnticos.
Alm disso, tambm existe o conceito de biblioteca hbrida, o qual, de modo
inovador, parece englobar os conceitos de biblioteca tradicional, biblioteca digital e biblioteca
digital semntica, como se observa abaixo:
no desenvolvimento e aplicao de uma biblioteca hbrida, [...] [ preciso
estabelecer] metodologias para que seja desenvolvido um conjunto de
padres para identificar, armazenar e disponibilizar e [sic] gerenciar as
informaes em diversas mdias que compe [sic] seu acervo num ambiente
digital, possibilitando a busca e a recuperao deste tipo de material,
resultando na interoperabilidade entre interfaces abertas e protocolos de
comunicao de dados, onde os usurios podero realizar suas consultas
de forma unificada em uma nica interface e possibilitando a
disponibilizao dos textos para download (FIGUEIREDO et al., 2004, online).

Nota-se, ento, que a biblioteca hbrida procura integrar todos os servios das
bibliotecas tradicionais e das digitais, ampliando seu alcance, ao oferecer seus servios e
acervo no formato digital e, organizados semanticamente. Por essa viso, verifica-se que o
conceito de biblioteca hbrida ultrapassa, em larga escala, o conceito de automao de
bibliotecas tradicionais, na medida em que o primeiro permite acesso ao catlogo do acervo
e a alguns servios ou ao seu acervo digitalizado. De forma ainda mais reluzente, na
biblioteca hbrida, h o interesse em manter a interoperabilidade entre os diferentes
sistemas, o que expande, consideravelmente, as possibilidades de compartilhamento de
informaes.
Em face do que foi exposto acima, nesta dissertao entende-se que a
construo de bibliotecas digitais de teses e dissertaes (BDTD) deve levar em
considerao a busca documental a partir de elementos semnticos, constituindo, para
tanto, seu eixo conceitual. Nesse contexto, a web semntica58 abre novas perspectivas
para a criao de bibliotecas digitais semnticas, nas quais se pode melhorar o sistema de
informao, principalmente nas atividades de busca e navegao. Assim sendo, o
desenvolvimento e uso de instrumentos semnticos podero resultar em uma recuperao
de informaes mais relevante ao usurio.
Como reflexo dos estudos realizados at o momento, esta pesquisa aponta para
a ideia de que uma taxonomia facetada para navegao, usada como interface de busca,
pode ser mecanismo facilitador para a recuperao de informaes relevantes aos usurios.
Em vista disso, o princpio de navegao utilizado correspondente navegao em
hipertexto, o que ser desenvolvido a seguir.
58

A web semntica pretende fornecer meios para que se possa estruturar o conhecimento, dando significado
(semntica) aos contedos disponibilizados em ambiente digital, de forma que esse conhecimento seja
processado (entendido) pela mquina.

70

4.5 Navegao hipertextual


O hipertexto (ou hipermdia) um sistema para visualizao de informaes,
construdo pelos usurios em meios digitais. Pode conter alguns itens, tais como textos,
udio, vdeos ou imagens, e por ligaes (links), de forma a facilitar a busca de informao.
Quanto ao princpio de ligao, possvel que seja unidirecional ou multidirecional, numa
rede interligada de informaes. O n de origem, por sua vez, denominado referncia e o
de destino, ncora.
Para Conklin (1988, p.424), o conceito de hipertexto muito simples, pois so
janelas que, atravs de links, representados graficamente por seus rtulos, remetem a
contedos que esto associadas em um banco de dados. Assim, segundo o autor, essa
nova tecnologia proporcionou diversificadas possibilidades, sobretudo em relao
comunicao e navegao atravs de links.
Nesse aspecto, os sistemas de hipertextos permitem aos usurios que
naveguem por nodos de informao, obtendo acesso a informaes contidas em bancos de
dados, a partir de mecanismos de navegao (browsers). Alis, possuir a caracterstica de
navegao fundamental para que um sistema seja considerado, realmente, hipertextual.
A partir de um resgate histrico, compreende-se que a ideia de hipertexto teve
origem na proposta de Vannevar Bush, datada de 1945. Nessa ocasio, o autor idealizou
uma biblioteca que tinha por finalidade armazenar o conhecimento acadmico registrado,
designada por ele por Memex. Dessa maneira, o foco principal do projeto de Bush era a
organizao da grande quantidade de informao dispersa nas diferentes bibliotecas,
especialmente, aquela relativa aos interesses de pesquisa dos estudantes, de modo que
facilitasse o acesso e a recuperao de informaes.
Entretanto, somente em 1965 o termo hipertexto foi cunhado por Theodor
Nelson, com o Projeto Xanadu (NELSON, 1999), projetado para ser um software capaz de
criar, hospedar e gerir um banco de dados hipertextuais. Porm, considera-se, como o
primeiro sistema operacional, detentor de funcionalidades hipertextuais, o sistema de
hipertexto oN-Line System (NLS), que foi desenvolvido para facilitar a criao de bibliotecas
digitais, armazenar e recuperar documentos eletrnicos e apresentado ao pblico em 1968.
Desde ento, existem duas vertentes sobre o conceito de hipertexto: uma de
associao de ideias e outra relacionada conexo de ideias. Para Bush, o hipertexto
uma associao de ideias, quase casual, tal como acontece na mente humana, cuja
possibilidade de leitura no linear se assemelha com o tipo de rede associativa que um
indivduo faz (FURTADO, 2010). Por outro lado, o conceito de conexo se apresenta como
um tipo de associao controlada, pois est estreitamente ligada necessidade de
comunicao de ideias, conforme pontua o terico citado a seguir:

71

Um dos critrios necessrios da conexo reside em ser inteligvel para os


outros, do mesmo modo que a singularidade do sujeito tem de ser limitada
na sua tendncia para a livre associao, j que a sua parte substancial se
exerce ao nvel do conjunto de concepes comuns maioria das pessoas
(WHORF, 1956 citado por FURTADO, 2010, p.37).

Segundo essa premissa, por maior que seja a liberdade do usurio em traar
seu caminho hipertextual, ele est limitado s possveis associaes existentes no sistema,
sendo ela controlada pelo nmero e tipos de conexes imputadas pelo designer. Dessa
forma, o usurio est restrito inteno de comunicao do autor da mensagem, ainda que
tenha certa autonomia para escolher um entre os admissveis caminhos.
Se o que realmente define hipertexto a existncia de links organizando a
informao, independentemente do processo pelo qual esses links foram
criados, [...] ento a associao apenas um tipo de conexo e, na
verdade, o menos desejvel quando o objetivo a comunicao
(FURTADO, 2010, p.37).

Nesse sentido, no h como imaginar que a tecnologia, sozinha, seja capaz de


transformar um texto em hipermdia. Ento, haver, sempre, um propsito de comunicao
por trs de todo o esforo em fornecer nodos e links. Mesmo porque, todo sistema
hipertextual oferece a possibilidade de navegao por esses nodos, atravs dos links.
Assim, o hipertexto, como sistema de navegao, consolida o bnus de possuir uma
estrutura no sequencial, permitindo distintos caminhos e em diferentes ordens, dentro do
que foi projetado para o sistema.
Nessa linha de pensamento, o hiperdocumento, segundo Marchionini (1994),
deve ter seus ns indexados (metadados) para possibilitar acesso ao contedo, sugerindo
oito regras para a criao de hipertexto: 1) identificao das facetas mais relevantes; 2) lista
exaustiva de termos e frases; 3) mapeamento e reviso de termos para facetas; 4) criao
de termos preferidos; 5) introduo de ns de informao, com remissivas; 6) reviso do
conjunto de ns, de acordo com certos critrios (gramaticais, estilo); 7) manuteno e
atualizao do sistema de hipertexto; 8) edio e teste do hiperdocumento final.
Partindo disso, percebe-se a caracterstica de uma navegao por facetas (j
pr-estabelecidos), na qual um usurio tem capacidade de filtrar a informao desejada,
dentre um conjunto de itens possveis, atravs da seleo gradual. Esta seleo progressiva
possvel a partir das facetas com metadados (valores) atribudos, pois o sistema somente
apresenta os itens, efetivamente, existentes no hiperdocumento e, consequentemente, no
banco de dados.
Se os links proporcionam a interligao dos nodos (metadados), formando um
conjunto coeso com a ideia concebida, esse sistema hipertextual ter caracterstica
semntica, na qual
os ns so os conceitos ou categorias relativos a um determinado
conhecimento e os arcos explicitam as relaes entre os ns. Nesta

72

representao as classes herdam atributos e comportamentos das


superclasses que as contm (PINHO; KUX; ALMEIDA, 2007, p. 638)

Dessa forma, a apresentao do contedo de um banco de dados na forma de


um sistema hipertextual permite que as informaes sejam organizadas de acordo com o
objetivo do arranjo, facilitando o acesso e a recuperao das mesmas. Alm disso, o
conjunto de facetas possibilita a visualizao do todo, evidenciando esses mesmos
contedos e oferecendo a navegao pelos links.
De modo a fixar, cada vez mais, a anlise no objetivo central proposto, tem-se a
oportunidade, agora, de refletir, especificamente, sobre a navegao realizada por
circunstncia da taxonomia facetada.

4.5.1 Navegao por meio da taxonomia facetada


A navegao por facetas j vem sendo usada em alguns projetos de bibliotecas
digitais, como demonstrado na reviso de literatura. Nesse sentido, o sistema FLAMENCO
destaca-se como um dos primeiros e o mais citado exemplo de navegao desse tipo. Em
funo dessa importncia, cabe salientar que a busca e navegao facetada disponibilizada
neste site permitem organizar grandes colees de dados, ajudando o usurio a no se
sentir deslocado do sistema de busca. Para tanto, o FLAMENCO compe-se de um conjunto
de textos e, na entrada de dados desses textos, usa um modelo de representao em
facetas que foi pr-determinado. Dessa forma, os arquivos dos textos so processados
medida que o modelo e os dados so inseridos em tabelas localizadas num banco
relacional, o que permite definir termos e criar hierarquias entre eles. No se pode deixar
escapar, tambm, que, neste site, a busca facetada pode ser combinada com a busca livre,
sendo esta uma ao que facilita, ainda mais, a busca.
Outro exemplo de navegao por facetas o sistema da biblioteca temtica
disponvel no site da National Aeronautics and Space Administration59 (NASA). Nela,
possvel fazer uma busca facetada, em razo de o contedo estar dividido em categorias e
subcategorias. Com esse mecanismo, pode-se refinar a busca, que se inicia por um escopo
mais abrangente at alcanar informaes especficas.
Com o intuito de ampliar as ideias em trnsito, deve-se esclarecer que um
sistema de recuperao da informao (SRI), em ambiente digital, somente pode ser
considerado facetado quando for constitudo por um nmero mnimo de operaes, alm de
um conjunto de elementos nos quais o usurio possa navegar de forma arbitrria60 para
fazer sua busca, tendo possibilidade de, aos poucos, restringi-la, at um subconjunto
mnimo de elementos, o qual definido a partir de relaes (intersees) previamente
59
60

Disponvel em: <http://www.nasa.gov/home/index.html>.


Aqui, de forma arbitrria significa conforme o desejo do usurio.

73

determinadas entre as facetas (SUOMINEN; VILJANEN; HYVNEN, 2007). Dessa forma, a


navegao facetada permite que o usurio elabore uma pergunta progressivamente, e que
v observando o efeito que sua escolha por uma faceta disponvel causa nas outras facetas
(TUNKELANG, 2009, p.23).
importante detectar, ainda, que, no contexto de um sistema navegacional
relacional, uma faceta constitui um conjunto de termos (valores), que representa uma
propriedade (caracterstica) desse conjunto, e seus valores, por sua vez, representam os
possveis valores que essa propriedade pode possuir. Por exemplo, uma faceta de alunos
pode ser dividida em caractersticas de homens e mulheres, que, em seu turno, podem
incluir valores como: homens Marco / Moiss / Paulo e mulheres Paula / Ana / Carla.
Ademais, cada um desses valores pode manter relaes com outras facetas, por exemplo,
com a faceta professores.
Nesse sentido, o uso da taxonomia facetada navegacional permite nomear e
organizar entidades em grupos que compartilham caractersticas similares, atravs de
determinados procedimentos, tais como correlacionar diferentes linguagens usadas num
ambiente (compatibilizar), criar mecanismos de acesso (links), normalizar informaes
disponibilizadas (vocabulrio controlado) ou criar palavras-chave (termos) e conceitos que
categorizam os contedos em ramos.
Cabe ressaltar, que essa forma de estruturao de informaes, atravs de
taxonomias facetadas, vem sendo comparada com as interfaces de busca disponibilizadas
em sites, principalmente em sites comerciais (e-commerce). Contudo, sob o ponto de vista
terico da rea de Cincia da Informao (CI), nem sempre o que h nesses portais pode
ser denominado navegao facetada. Na CI, uma taxonomia facetada uma cadeia de
relaes, na qual cada item de uma faceta, sob determinada categoria, est conectada a
outros itens das facetas de diferentes categorias, com interligaes sob diferentes tipos de
relaes. Dessa forma, perde-se a noo de ordem hierrquica, porque no h mais como
indicar que uma faceta mais importante ou mais complexa hierarquicamente, surgindo,
assim, o sentido de cadeia de relaes multidimensional e multidirecional.
Navegando em sites comerciais, o que se percebe que muitas vezes as
informaes (ou produtos) esto estruturadas sob um nico aspecto (atributo), ou sob at no
mximo trs aspectos, engessando a viso do contedo do portal, de modo a impedir a
viso multidimensional do objeto em questo. preciso esclarecer, que permitir as vises
multidimensional e multidirecional de um objeto necessrio para que uma navegao
possa ser considerada facetada, dentro dos princpios das teorias na CI.
Partindo

dessa

declarao,

explica-se

que

no

desenvolvimento

desta

dissertao cada documento foi indexado sob diferentes aspectos, permitindo uma viso
multidimensional do seu contedo, atravs da estrutura da taxonomia facetada. Essa

74

estruturao foi realizada obedecendo estrutura textual desse tipo de documento,


possibilitando a navegao (browsing61) pelos itens sob cada categoria da estrutura. Assim,
o usurio pode navegar pela taxonomia facetada, escolher um aspecto sob o qual
pretende efetuar sua busca e localizar a informao desejada, sem que, em tempo algum,
encontre um resultado vazio.
Tunkelang (2009, p.24) tambm participa dessa discusso e salienta que a
abordagem da navegao facetada indicada para textos semi-estruturados62 [caso das
teses e dissertaes], nos quais se supe que seja possvel representar seus assuntos em
um sistema de classificao facetado (traduo livre). Nesse caso, o documento pode ser
segmentado por suas partes estruturais, pelo atributo de cada parte, formando um conjunto
de categorias. Sob cada categoria, insere-se uma taxonomia hierrquica (as facetas e
subfacetas), que interliga os assuntos semelhantes naquele atributo especfico, sendo que
cada um deles um metadado. Corroborando e acrescentado dados, Tunkelang (2009,
p.24) afirma, ainda, que o metadado de um documento consiste nos atributos da estrutura
do prprio tipo de documento que, logicamente, segue a estrutura de produo do prprio
texto (traduo livre).
Um mecanismo de navegao facetada com essas caractersticas pode indicar,
ao usurio final, as ocorrncias do tipo de informao especfica para cada categoria,
facilitando as buscas do usurio final. Nessa diretriz, Tunkelang (2009) aponta algumas
vantagens da navegao facetada em relao s buscas tradicionais: oferece orientao ao
usurio, a formulao de questes de busca pode ser feita progressivamente, permite a
explorao e a recuperao do recurso informacional atravs dos elementos em sua
estrutura de forma fcil.
Pelo exposto, v-se que as vantagens da navegao facetada esto,
basicamente, ligadas explorao do conjunto de informaes disponveis em cada
categoria, que reflete o que est, efetivamente, disponvel no banco de dados. Dessa
maneira, faz-se necessrio conhecer a natureza (domnio) desse tipo de informao
disponibilizada e a quem ela se destina. Nesse momento, mostra-se oportuno apresentar
teoria da anlise de domnio, na qual se apia essa averiguao.

61

62

No jargo da biblioteca, o termo browsing consiste na explorao dos itens do acervo (livros, peridicos,
folhetos), que esto dispostos nas prateleiras, examinando-os quase ao acaso, usando a intuio e os
sentidos.
Entende-se como texto semi-estruturado aquele que apresenta elementos estruturados (autor, data, ttulo da
obra, ttulos das sees) e elementos sem estrutura (resumo, contedo).

75

4.6 Definindo o domnio: a teoria da anlise de domnio


Sabe-se que o autor Hjorland foi o pioneiro na formulao explcita da teoria da
anlise de domnio63 (TAD). Porm, Jesse H. Shera, no incio da dcada de 70, j pensava a
informao como originada e dependente do contexto social e cultural.
De modo a alinhar o eixo de discusso, salienta-se que, para Hjorland e
Albrechtsen (1995), a TAD configura-se a forma mais adequada para identificar um domnio.
Nessa perspectiva, o conhecimento um produto histrico, cultural e socialmente
desenvolvido, portanto, focado nos domnios de conhecimento (HJORLAND, 2002a).
necessrio esclarecer que o termo domnio polissmico, sendo, ento,
empregado em diversas disciplinas e em distintas situaes, dentre as quais se podem citar:
- na disciplina Biologia: aplicado para identificar a categoria mais alta da
taxonomia de classificao dos seres vivos;
- na rea do Direito: refere-se ao poder, como por exemplo, o domnio pblico,
que significa estar sob o poder/direito de todos;
- no campo da Matemtica: usado no estudo de funes, sendo o conjunto de
todos os possveis valores de um conjunto A que a funo leva at um elemento do
conjunto B.
- em Computao, o termo domnio representa um grupo de computadores na
web, os quais compartilham um mesmo endereo de comunicao;
- no campo da Engenharia de Software: empregado para abrigar um conjunto
de sistemas que possuem funo semelhante, dentro de outro sistema, ou usado como
denominao a um conjunto de caractersticas que se referem a um problema, cuja soluo
ser fornecida por uma determinada aplicao.
No The American Heritage Dictionary of the English Language, o termo domnio
definido como um espao (sphere) de atividade, de negcio ou de funo (ex.: o domnio
da Histria). Alm disso, possui sinnimos como area (rea), arena (rea de atividade), field
(campo) e sphere (um espao social particular; um extrato social; um campo especfico de
conhecimento; uma comunidade discursiva).
Entretanto, no campo disciplinar da CI, o entendimento e uso do termo domnio
so explicitados por Hjorland e Albrechtsen (1995), quando afirmam que o domnio pode ser
uma rea de conhecimento (especialidade), um conjunto literrio ou, ainda, a tarefa de um
grupo de pessoas trabalhando em conjunto em um projeto ou em uma organizao. Nessa
mesma linha de pensamento, Llorns (2004, p.846) acrescenta que um domnio pode ser
63

A anlise de domnio no deve ser confundida com a anlise de assunto. Esta se refere a uma das etapas da
indexao, no tratamento temtico da informao documental, que visa identificar termos que melhor
representem os assuntos tratados no documento, para posterior recuperao no sistema de informao. J a
anlise de domnio, caracteriza-se como uma abordagem que pretende entender as funes implcitas e
explcitas da informao, para a comunicao, dentro de uma comunidade discursiva.

76

uma rea de conhecimento, uma atividade (projeto, manuteno, etc.), um interesse


especfico qualquer ou uma aplicao com fronteiras definidas. Alm desses, Thellefsen e
Thellefsen (2004, p.179) determinam que os domnios de conhecimento so uma
demarcao de um determinado conhecimento, seja ele fixado num contexto profissional ou
no.
possvel perceber a pluralidade de significaes e conceitos atribudos ao
termo domnio. No entanto, na presente dissertao, o emprego do termo tem em vista o
sentido adotado pela CI, o qual, em sntese, entende que o domnio pode compor desde
uma disciplina, no todo ou em parte, ou apenas representar uma especfica atividade
profissional ou de lazer, sendo preciso, portanto, estabelecer e delimitar seu mbito de
abrangncia para efeito de identificao.
De modo a verificar essas consideraes, aponta-se que, segundo Hjorland
(2002a), cada domnio do conhecimento possui uma estrutura conceitual prpria, o que o
difere de outro domnio. Para tanto, conforme esse autor, a abordagem da TAD alia teoria e
prtica, uma vez que o que busca um mtodo funcional, visando compreenso das
funes explcitas e implcitas da informao e as razes subjacentes aos fluxos de
comunicao. Alm disso, um mtodo filosfico que se contrape ao paradigma cognitivo,
por este ter como objetivo encontrar elementos externos percepo subjetiva do usurio.
Para Capurro (2003, p.9), uma consequncia prtica do paradigma scio-cognitivo o de
desistir da busca por uma linguagem ou algoritmo universal para a modelagem
informacional nos sistemas de recuperao da informao, e pensar em solues prticas
para uma comunidade de usurios.
Nesse cenrio, deve-se perceber que, dentro da organizao e representao
do conhecimento, Hjorland (2002b) sugeriu modos especficos de estudar os domnios:
produo de classificaes especiais, pesquisa especializada em indexao e recuperao,
estudos da histria da transferncia de informaes, estudos terminolgicos, linguagens
para objetivos especiais (LSP), estudos do discurso, entre outros. Apresentou, ainda, quatro
mtodos gerais para adquirir o conhecimento sobre o domnio: 1) mtodos racionalistas
(Ranganathan e a anlise facetada); 2) mtodos empricos (bibliometria, co-citao); 3)
mtodos histricos; e 4) mtodos pragmticos (concentrando-se em objetivos, metas e
utilidade).
Com propsito argumentativo, destaca-se a seguinte asseverao de Hjorland:
Um ponto central em minha abordagem a alegao de que as
ferramentas, conceitos, significados, estruturas de informao, necessidade
de informao e critrios de relevncia so moldados em comunidades de
discurso, por exemplo, em disciplinas cientficas, que so partes da diviso
do trabalho feita pela sociedade. Uma comunidade de discurso sendo uma
comunidade na qual ocorre um processo de comunicao ordenado e
delimitado (HJORLAND, 2002a, p. 258, traduo nossa).

77

A partir dessa citao, possvel o entendimento de que a abordagem da TAD


leva em considerao a comunidade de discurso na qual a informao produzida, uma vez
que toda prtica social est tambm inserida em prticas informacionais. Comunidades
discursivas, para Hjorland e Albrechtsen (1995, p.400), so distintos grupos sociais
sincronizados em pensamento, linguagem e conhecimento, constituintes da sociedade
moderna. Em vista disso, o ponto central da TAD consiste em estudar suas atividades e
produtos, pois os instrumentos, conceitos, significados, estruturas de informao,
necessidades informacionais e critrios relevantes esto refletidos nas comunidades
discursivas (HJORLAND, 2002b, p.258).
Nesse contexto, nota-se que a TAD configura-se como uma proposta nova para
a CI, pois sua essncia de anlise est no seio da comunidade de discurso, na qual o fluxo
da informao busca um sentido prtico de produo, de comunicao e de uso. A
propsito, esse modo de perceber a realidade se aproxima do pragmatismo, que acolhe a
ideia de que a verdade reside no sentido de utilidade, na concepo prtica das coisas, ou
seja, qualquer ato, objeto ou proposio deve ser til ou gerar um efeito prtico.
Por conseguinte, vem tona a ideia de que, em qualquer nvel, as interaes
humanas compreendem a gerao (produo), recepo (uso) e transferncia de
informao (comunicao). Esse cenrio de discusso pode ser retratado pela FIG. 5.
FIGURA 5 O sujeito na Anlise de Domnio

Fonte: Elaborada pela autora.

Nesse percurso, cabvel o registro de que, no momento da gerao, as


condies de produo da informao, sejam elas em relao aos temas escolhidos, aos
objetos utilizados, aos valores ou aos seus significados, esto intensamente envolvidas na
dimenso social do espao/lugar de produo e de uso. Portanto, nas prticas

78

informacionais, preciso ter em vista o domnio de discurso e as interaes sociais nas


quais essas prticas acontecem.
A partir disso, pode-se entender que os conceitos passam a ser considerados
como construdos socialmente, apesar de cada usurio vivenciar situaes e circunstncias
prprias. Nesse sentido, o foco so os paradigmas (suposies e ideias sobre o que
significante e como o conhecimento deve ser produzido) e no os modelos mentais. Essa
ideia corroborada atravs do pensamento de Hjorland (2002b), que afirma que os
indivduos no processam a informao segundo um sistema de regras individualistas e
pessoais, mas, ao contrrio, essas regras so fundadas na/pela sociedade e na cultura.
Assim, o autor afirma que os conceitos so formados dentro das comunidades de discurso,
isto , dentro de cada domnio.
Para identificar as necessidades especficas de cada comunidade discursiva,
nem sempre preciso recorrer a estudos com os usurios, pois, segundo Hjorland (2002b)
os usurios so incapazes de exprimir suas necessidades e critrios de relevncia de forma
real. Para o mesmo autor, relevante no somente aquilo que apontado pelos usurios,
pois os critrios de relevncia deles podem se modificar ao receberem uma nova
informao. por essa razo que Hjorland (2002b) acredita que, ao oferecer um servio de
informao e prescrever critrios de indexao e recuperao da informao, o profissional
de informao deve cri-los a partir dos paradigmas, das normas metodolgicas e
epistemolgicas. No entanto, afirma que a epistemologia permite a fundamentao terica
geral sobre a organizao do conhecimento, mas no pode substituir o conhecimento do
assunto, do domnio. Ento, sugere que a rea de CI deve estar aberta a diferentes vises
de organizao e representao da informao, de modo a auxiliar os usurios, oferecendolhes essa diversidade de vises nos sistemas de informao.
Ademais, os princpios da TAD entendem o indivduo como um ser coletivo,
inserido em relaes intersubjetivas (entre diferentes sujeitos), e no um ser individual. Essa
premissa sugere que as relaes do ser humano com o mundo (realidade) esto sempre
mediadas por informaes produzidas, armazenadas, transferidas e compartilhadas no meio
social, as quais ordenam e fornecem sentido a essa relao. , basicamente, um sentido de
alimentao e retroalimentao, em uma acepo cclica de comunicao.
Deste modo, encontrar a comunidade discursiva pressupe responder a
questes relativas a quem produziu, em qual contexto social produziu, que finalidade
tem a produo e quem usa o produto. Entende-se que para criar um servio de
informao, em SRIs de bibliotecas digitais de teses e dissertaes, preciso responder a
esses pontos, identificando o usurio e suas necessidades de informao. Considera-se que
um servio de informao tem como funo bsica [...] fornecer informaes relativas aos

79

respectivos acervos, bem como torn-los acessveis aos usurios (CUNHA; CAVALCANTI,
2008, p.333-334).
preciso explicar que no h, na CI, a explicitao metodolgica (um passo a
passo) para ser utilizada na aplicao da TAD. Usualmente, quando se aplica essa
metodologia, emprega-se a metodologia de anlise de domnio referente rea de
engenharia de software, como pode ser visto nos trabalhos de Guizzardi (2005) e de Dias
(2010). Em vista disso, esta metodologia (da anlise de domnio da engenharia de software)
foi adaptada para a rea da CI e composta por quatro etapas, apresentadas a seguir.
a) Identificao do domnio
Nesta etapa deve-se caracterizar o domnio a ser analisado, a partir das
seguintes indagaes: qual o domnio? o domnio conhecido? que tipo de informaes
esse domnio produz?
b) Anlise de dados
Nesta etapa, identificam-se os pontos centrais que caracterizam o domnio,
estabelecendo relaes e funes entre as informaes, a partir dos seguintes
questionamentos: quem produz as informaes identificadas na etapa anterior? com qual
propsito a informao produzida? a quem interessa o uso das informaes produzidas? A
anlise para responder a essas questes deve se basear nos princpios da TAD que afirma
que o fluxo de informao determinado no seio da comunidade de discurso, a partir do
estudo de quem a produz, comunica e usa.
c) Modelagem do domnio
Nesta etapa, selecionam-se os tipos de informaes consideradas importantes
para o servio de informao a ser criado, que estejam alinhados ao objetivo proposto, a
partir dos dados coletados na anlise anterior.
d) Coleta e seleo de dados e validao
Nesta etapa, h a identificao, na literatura especializada, tais como literatura
tcnica, histrico do domnio, questionrio com especialistas do domnio ou outro
procedimento capaz de respaldar a fase anterior, da escolha das informaes mais
importantes. A pergunta que norteia esta etapa a seguinte: Quem este no-usurio
total a quem o contedo dos trabalhos acadmicos, do tipo teses e dissertaes, pode

80

interessar?. preciso esclarecer, que o termo no-usurio total tem um sentido especfico
que o daquele usurio que no usa um servio porque acredita que tem outros meios de
conseguir a informao ou porque no est ciente de que h aquele tipo de servio
disponvel para ele.
No escopo desse levantamento, e no contexto desta dissertao, revela-se que
a criao da taxonomia facetada navegacional, como mecanismo de busca na BDTD, da
ECI-UFMG, tem como comunidade discursiva a comunidade cientfica, que apresentada
a seguir.

4.6.1 Identificando o usurio: a comunidade cientfica


A comunidade cientfica tambm pode ser denominada comunidade acadmica.
Segundo Kuhn (2006), uma comunidade cientfica possui, entre os seus integrantes,
interesses cientficos semelhantes, uma bibliografia similar, vocabulrio prprio (ainda que
divergente em alguns pontos), compartilha modelos e abordagens metodolgicos, partindo,
geralmente, do resultado de pesquisas j realizadas. Para esse autor, ainda, a comunidade
fortalecida na medida em que o conhecimento produzido pode ser transferido e utilizado
em novas abordagens de investigao dentro dela, intensificando o uso de suas prprias
teorias, mtodos e tcnicas.
Nesse campo de anlise, h dois termos com conceitos distintos
comunicao e difuso cientfica que devem ser ressaltados. Ainda que, s vezes,
sejam usados como sinnimos, h diferena entre eles: a comunicao cientfica [...]
processo especfico de produo, consumo e transferncia de informao no campo
cientfico (CUNHA; CAVALCANTI, 2008, p.97), enquanto a difuso a disseminao da
informao (CUNHA; CAVALCANTI, 2008, p.125), sendo que essa disseminao pode ser
entendida como documentos distribudos a pessoas ou entidades, a partir de um ponto
central de armazenamento (ibidem, p.130). Esse armazenamento, por sua vez, pode ser o
acervo de uma biblioteca tradicional ou o banco de dados de uma biblioteca digital.
Nessa linha de raciocnio, tem-se que, com a implantao de bibliotecas digitais,
de repositrios institucionais e de iniciativas de open archives64, a disseminao da
informao cientfica vem sendo ampliada em nveis nacional e internacional, permitindo
divulgar as publicaes e resultados de pesquisas sociedade em geral.
Resgatando a ideia de comunicao cientfica, Targino (2000, p.54) anuncia que
a comunicao cientfica que favorece ao produto (produo cientfica) e aos produtores
(pesquisadores) a necessria visibilidade e possvel credibilidade no meio social em que
64

Open Archives (arquivos abertos) so, geralmente, criados a partir de software open source, usando padres
de interoperabilidade, que possibilitam a disseminao da informao cientfica com acesso livre ao contedo
que foi disponibilizado.

81

produto e produtores se inserem. Em outros termos, entende-se que essa comunicao, ao


indicar a credibilidade ou a refutao de um conhecimento desenvolvido em determinada
comunidade discursiva, promove a consolidao dessa mesma rea ou atividade e, por
consequncia, concede-lhe visibilidade.
Com finalidade didtica, expe-se o que pode ser encontrado no Dicionrio de
Biblioteconomia e Arquivologia, em que Cunha e Cavalcanti (2008) conceituam a
comunidade cientfica como
grupo social formado por indivduos que tm como profisso a pesquisa
cientfica e tecnolgica [...] as comunidades cientficas so, sobretudo,
redes de organizaes e relaes sociais formais e informais que
desempenham vrias funes. Uma das funes dominantes a de
comunicao. O papel da comunicao consiste em assegurar o
intercmbio de informaes sobre os trabalhos em andamento,
colocando os cientistas em contato entre si (ibidem, p.98-99, grifos nossos).

Percebe-se, assim, uma ideia semelhante discutida no subcaptulo anterior,


referente teoria da anlise de domnio, pois indica a comunidade cientfica como um grupo
social, no qual os cientistas esto ligados por redes organizacionais e sociais, o que
demonstra um carter interativo entre a instituio e a sociedade. Ademais, a citao acima
estabelece que a funo primordial dos pesquisadores, em sentido strictu senso, produzir
e usar informaes dentro do grupo (seus pares), ou seja, comunicando e intercambiando
informaes concernentes a trabalhos em andamento ou j concludos. Nesse sentido,
reafirma-se o pensamento de que o produto das pesquisas tem especial importncia e
relevncia dentro da prpria comunidade acadmica (domnio).
necessrio acrescentar que a comunidade cientfica constituda e
representada por cientistas, sendo que um cientista configura
pessoa que possui treinamento, habilidade e desejo de procurar novos
conhecimentos, novos princpios e novos materiais em algum campo da
65
cincia (DICTIONARY OF SCIENTIFIC AND TECNICAL TERMS, 1984 ). E
entendo tambm como aqueles que fazem pesquisa para tentar entender e
ampliar o conhecimento cientfico j conhecido. So aqueles que fazem
trabalho criativo na cincia e tratam de alguma maneira de ampliar o
conhecimento ou de melhorar as teorias cientficas existentes
(STEVENSON; BYERLY, 1995) (ALVARADO; OLIVEIRA, 2008, p.14).

Por meio disso, verifica-se a natureza investigativa do trabalho dos cientistas,


que so movidos muito mais pelas formulaes de questes, perguntas e interlocues, do
que pelas respostas obtidas. Para atender a esse propsito, em geral, os cientistas,
independentemente de seu campo de conhecimento, tm necessidades de diferentes
espcies de informao, a cada estgio da pesquisa, no processo de gerar, disseminar e
usar a informao (FIGUEIRA NETTO, 1994, p.29). Nessa busca por informaes, esse
pesquisador muitas vezes se depara com o problema de filtrar, das diferentes bases de
dados disponveis, as informaes que lhe so convenientes.
65

th

DICTIONARY OF SCIENTIFIC AND TECHNICAL TERMS. 6 ed. New York: McGraw-Hill, 1984.

82

Ainda tendo em vista a citao de Alvarado e Oliveira (2008), o pesquisador


necessita de trs informaes bsicas, em distintos momentos de sua pesquisa: sobre
temas j pesquisados anteriormente; 2) sobre mtodos e tcnicas utilizados em pesquisas;
3) resultados alcanados de pesquisas j concludas. Analisando essas necessidades
bsicas, pode-se concluir que elas tm relao estreita com a atividade profissional
(ocupao) desses cientistas. Segundo Case (2002), pesquisas sobre o comportamento

informacional por ocupao indicam que as buscas por informao para o exerccio da
profisso (pesquisador) so investigaes orientadas s tarefas e as buscas por
solues para estruturar (organizar) essas informaes conforme a demanda do
profissional so investigaes orientadas aos sistemas.
Na perspectiva da busca por informao para o pesquisador, a informao,
insumo para toda atividade humana, pessoal, tcnica e para a comunidade cientfica,
essencial. No podendo ser de outra maneira, dentro da sua comunidade discursiva, os
cientistas geram, comunicam e usam informao. Sendo assim, no momento de produo
das teses e dissertaes, preciso saber acerca de quem e por que produziu
determinado contedo, pois, segundo Franco (2008),
1. Toda mensagem [...] contm, potencialmente, uma grande quantidade de
informaes sobre o autor: suas filiaes tericas, concepes de mundo,
interesses de classe, [...] representaes sociais, motivaes, expectativas,
etc. 2. O produtor/autor antes de tudo um selecionador e essa seleo
no arbitrria. Da multiplicidade de manifestaes [...], seleciona o que
considera mais importante para dar o seu recado e as interpreta de acordo
com seu quadro de referncia. Obviamente, essa seleo preconcebida.
Sendo o produtor, ele prprio, um produto social, est condicionado pelos
interesses de sua poca, ou da classe a que pertence. E, principalmente,
ele formado no esprito de uma teoria da qual passa a ser o expositor. 3. A
teoria da qual o autor o expositor orienta sua concepo da realidade. Tal
concepo (consciente ou ideologizada) filtrada mediante seu discurso e
resulta em implicaes extremamente importantes (FRANCO, 2008, p.2526).

Ento, os resultados das pesquisas expem as filiaes tericas do autor,


assim como seus interesses dentro da comunidade discursiva (interesses de classe). Por
essa razo, preciso descobrir o contedo manifesto (explcito) do texto produzido, de
forma que ele possa ser acessado, quando, ento, poder ter seu contedo latente
(implcito) desvendado pelo uso. Entretanto, para a apreenso do contedo manifesto das
teses e dissertaes, deve-se recorrer ao mtodo de Anlise de Contedo (AC), usando a
tcnica da anlise categorial temtica, a qual ser discutida a partir deste momento.

4.7 Mtodo de anlise de contedo: a tcnica categorial temtica


A Anlise de Contedo (AC) um mtodo bastante utilizado na investigao
emprica realizada nas cincias humanas e sociais. Consiste na anlise textual, com ilaes

83

qualitativas e

dados quantitativos,

para

investigao

histrica

ou

para

estudos

bibliomtricos, por exemplo.


Esse mtodo se destacou, a partir do sculo XX, como forma de validao da
anlise realizada em textos, utilizando a sistematizao para tornar o diagnstico
interpretativo mais objetivo (ROCHA; DEUSDAR, 2005).
Avanando nesta reflexo, verifica-se que, segundo Campos C. (2004), Bernard
Berelson, um cientista comportamental americano, na dcada de 40, entendia a AC como
baseada no modelo cartesiano de pesquisa, conceituando-a como uma descrio do
contedo manifesto dos textos, de maneira objetiva, sistemtica e quantitativa. Atualmente,
essa viso vem sofrendo crticas, pela rigidez do mtodo, o que levou Bardin a acrescentar
um sentido qualitativo na anlise de contedo:
um conjunto de tcnicas de anlise das comunicaes visando obter por
procedimentos sistemticos e objectivos [sic] de descrio do contedo das
mensagens, indicadores (quantitativos ou no) que permitam a inferncia de
conhecimentos relativos s condies de produo/recepo (variveis
inferidas) destas mensagens (BARDIN, 2009, p.44).

Assim, a AC se mostra como um conjunto sistemtico de tcnicas que visam a


analisar o contedo de documentos, com o objetivo de identificar o uso de determinadas
palavras ou conceitos e as relaes existentes entre eles, atravs de anlise de dados
qualitativos, quantitativos ou um misto de ambos. Com relao s condies de
produo/recepo, so denominadas por Bardin variveis inferidas, pois podem advir da
inferncia de variadas formas, tais como variveis psicolgicas do indivduo emissor,
variveis sociolgicas e culturais, variveis relativas situao de comunicao ou do
contexto de produo da mensagem (BARDIN, 2009, p.42).
O mtodo da AC abriga diferentes tcnicas de anlise: anlise de avaliao (de
atitudes), anlise da anunciao (processo de comunicao), anlise proposicional do
discurso (significado dos enunciados), anlise lxica (vocabulrio/ideias), anlise da
expresso (indicadores formais), anlise das relaes (intratextual) e anlise categorial
(temtica/semntica).
Em virtude disso, observa-se que a AC pode ser adequada para distintas
aplicaes, pois
a anlise de contedo um instrumento de pesquisa cientfica com
mltiplas aplicaes. Os procedimentos utilizados podem variar em funo
dos objetivos da pesquisa, entretanto, sejam quais forem suas finalidades,
preciso que ela se submeta, para que tenha valor cientfico, a algumas
regras precisas que a diferenciem de anlises meramente intuitivas
(OLIVEIRA, 2008, p.569-570).

Oliveira (2008) ressalta, assim, o carter verstil desse mtodo e, tambm, o


rigor de sua metodologia, o que confere confiabilidade aos resultados obtidos por sua
utilizao. Dessa maneira, na presente dissertao, a aplicao do mtodo foi efetuada a

84

partir da abordagem da tcnica de anlise categorial temtica (semntica) (ACT), que


funciona por operaes de desmembramento do texto em unidades, em categorias
segundo reagrupamentos analgicos [agrupar objetos diferentes por sua semelhana, por
sua similaridade] (BARDIN, 2009, p.199), por ser considerada a mais adequada para
analisar o contedo manifesto (explcito) dos textos. Em linhas gerais, o que se pretende
determinar as categorias temticas que so capazes de revelar o contedo de um texto por
completo, e no as ideias contidas nos documentos. Nesse sentido, entende-se que uma
categoria, representada por um termo, carrega um sentido semntico que a torna nica em
dado contexto.
Atendendo a essa expectativa, na anlise categorial temtica, o discurso (textos
em geral, como respostas a questionrios, documentos, cartas) fragmentado em
categorias, por ocasio de critrios, objetivos e recorte de pesquisa. Assim sendo, a anlise
categorial temtica (ACT) consiste em desmembrar e categorizar o texto, a partir de
agrupamentos por temas, para anlises temticas ou para outra propriedade qualquer que
se queira estudar.
Antes de passar s etapas da aplicao desta tcnica, necessrio apresentar
alguns conceitos relevantes no contexto da AC, segundo alguns autores que abordam o
assunto (MORAES, 1999; OLIVEIRA, 2008; BARDIN, 2009).
Objetividade: as categorias devem ser definidas de tal forma que seja possvel a
outro pesquisador chegar, a partir dos mesmos critrios, ao mesmo desmembramento,
sendo que o conceito em questo pode ser verificado e replicado.
Sistematicidade: a anlise deve ater-se ao objetivo proposto e ao contedo do
texto, a fim de minimizar a influncia dos pressupostos pessoais do pesquisador, evitandose a ocorrncia de escolha arbitrria de categorias, ainda que sejam determinadas a priori.
Contedo Manifesto: a anlise deve limitar-se ao que est explicitado no texto,
efetivamente expresso, e no ao contedo latente (implcito) do documento. Mesmo que, no
tipo de anlise aplicada, se levem em considerao os contedos latentes, estes devem
estar baseados no contedo real do texto.
Unidades de Registro (UR): a menor parte do contedo, sendo a que ser
selecionada de acordo com as categorias levantadas. Consiste na unidade de fragmento de
texto que ser classificado, podendo ser uma palavra, um termo, um pargrafo do texto ou
parte de uma frase. Essas unidades, por sua vez, devem ter sentido completo em si
mesmas. A UR tambm pode ser denominada unidade de anlise ou unidade de significado.
Unidades de Contexto (UC): contextualizam as unidades de registro, dando
significado a elas e limitando sua interpretao. Cada unidade de contexto pode ter diversas
unidades de registro.

85

Construo de Categorias (CC): atividade de classificao de acordo com


critrios pr-estabelecidos que busquem atender ao objetivo pretendido. Esses critrios
podem ser semnticos (temticos), lxicos (as palavras e seus sentidos), expressivos
(problemas de linguagem) ou, ainda, construdos a partir de verbos, adjetivos, substantivos,
entre outros. Entretanto, o conjunto de categorias deve obedecer somente a um critrio. Isso
significa impor uma organizao intencional ao contedo do texto, determinando um
discurso diferente do original.
Ainda na categorizao, segundo Bardin (2009), h a classificao dos
elementos do texto em agrupamentos segundo suas semelhanas e diferenas, em um
processo estruturalista de classes reunidas sob um termo genrico. Por meio desse arranjo,
a autora salienta que as categorias tm a funo de condensar o texto completo,
constituindo uma representao do mesmo. Alm disso, atravs das relaes entre as
diferentes categorias possvel que se criem inferncias e interpretaes. A propsito disso,
Bardin afirma que a AC se assenta implicitamente na crena de que a categorizao
(passagem de dados brutos a dados organizados) no introduz desvios (por excesso ou por
recusa) no material, mas que d a conhecer ndices invisveis, ao nvel dos dados em bruto
(ibidem, p.147). Contudo, para atenderem a esse postulado, as categorias devem ter como
caractersticas a adequao (vlidas e pertinentes), exaustividade, homogeneidade,
exclusividade e objetividade, as quais sero explicadas a seguir.
Adequao (vlidas e pertinentes): todas as categorias devem ter um significado
til para o objetivo pretendido, adequando-se ao problema e fundamentao terica da
pesquisa realizada. Do mesmo modo, todo o contedo do texto precisa estar expresso nas
categorias, as quais devem permanecer na fronteira de dois extremos: criar novas
categorias at que seja o suficiente para representar todo o texto e, ao mesmo tempo,
manter um nmero mnimo possvel de categorias. Se criadas a priori, as categorias devem
estar baseadas em uma fundamentao terica, com critrios de classificao prestabelecidos.
Exaustividade (ou inclusividade): as categorias devem ser capazes de abrigar
todas as unidades de registro (UR) selecionadas no texto, permitindo a incluso de todo
dado significativo, de acordo com o objetivo pretendido.
Homogeneidade: necessrio que o conjunto de categorias obedea a apenas
um critrio de categorizao, em uma dimenso nica de fragmentao do texto, ou seja,
satisfaa a somente uma varivel.
Exclusividade (ou excluso mtua): cada unidade de registro (UR) somente
poder pertencer a uma categoria, a partir de regras precisas e claras. Dessa forma, no h
dvidas quanto ao pertencimento de cada UR a uma determinada categoria.

86

Objetividade (ou consistncia e fidedignidade): diferentes pesquisadores tm de


chegar a resultados semelhantes, com base nos mesmos critrios de anlise estabelecidos,
os quais, efetivamente, devem ser explicitados. Ainda que outro pesquisador nomeie as
categorias com termos diferentes, a fragmentao do contedo (do todo) ser o mesmo.
preciso destacar, ainda, que na construo das categorias os itens elencados
anteriormente devem ser continuamente revistos durante a anlise, visando ao ajustamento
contnuo das categorias.
Feitas essas necessrias explicaes, indica-se, no QUADRO 2, uma sntese
das metodologias para a anlise categorial temtica apresentadas pelos autores Moraes
(1999), Oliveira (2008) e Bardin (2009).
QUADRO 2 Sntese das metodologias da anlise categorial temtica
MORAES (1999)

OLIVEIRA (2008)

BARDIN (2009)

Etapa 1: Preparao das


informaes
Etapa 2: Unitarizao ou
transformao do contedo em
unidades
Etapa 3: Categorizao ou
classificao das unidades em
categorias
Etapa 4: Descrio
Etapa 5: Interpretao

Etapa 1: Pr-anlise

Etapa 1: Pr-anlise

Etapa 2: Explorao do
material ou codificao

Etapa 2: Codificao

Etapa 3: Tratamento dos


resultados, inferncia e
interpretao

Etapa 3: Categorizao

Etapa 4: Inferncia

Fonte: Baseado em Moraes (1999), Oliveira (2008) e Bardin (2009).

Observa-se pelo QUADRO 2 que as trs metodologias so similares,


diferenciando-se apenas na apresentao de suas subdivises e, em geral, abarcam as
seguintes etapas: 1) pr-anlise; 2) explorao do material; 3) tratamento dos resultados; 4)
inferncia; e 5) interpretao. Essas etapas sero, abaixo, vistas de modo mais detalhado.
1) Pr-anlise: consiste, basicamente, em trs elementos: escolher os
documentos para a anlise, cuja escolha pode ser a priori, determinar o objetivo pretendido
e formular as hipteses ou pressupostos. Esses procedimentos no so lineares, mas so
interdependentes;
2) Explorao do material: analisar e conhecer os documentos (o corpus)
escolhidos para a anlise, decidindo se eles, realmente, enquadram-se no objetivo
pretendido e, ainda, se cobrem o domnio investigado;

87

3) Tratamento dos resultados: inclui a codificao (ou unitarizao) dos


documentos, a identificao das unidades de registro (UR), definio das unidades de
contexto e a categorizao. De maneira conceitual tm-se os seguintes procedimentos:
- codificao: estabelecer cdigos que identifiquem cada texto (documento);
- identificao das unidades de registro (UR): retirar do texto suas URs,
estabelecendo cdigos para cada uma delas. O tipo de UR utilizado ser determinado pelo
objetivo pretendido, com a condio de que tenha um significado em si mesmo, pois ser
empregado fora do contexto do documento, conservando, naturalmente, o sentido original;
- definio das unidades de contexto (UC): definir (conceituar) cada uma das
unidades de contexto, a fim de fornecer uma referncia de significado s URs, limitando sua
interpretao. Essa a unidade de compreenso para codificar as UR, pois cada UC ter
diferentes URs;
- categorizao: agrupar os dados, segundo suas similaridades, seguindo um
nico critrio de diviso, previamente determinado. Nessa etapa o conjunto de categorias
temticas adequado continuamente, pois primeiramente h o conjunto de categorias
iniciais, depois o conjunto de categorias intermedirias e, finalmente, o conjunto de
categorias finais. Alm disso, deve-se obedecer s caractersticas j discriminadas e
explicadas anteriormente (adequao, exaustividade, homogeneidade, exclusividade e
objetividade). Explica-se, tambm, que a categorizao um esforo contnuo de
formulao e reformulao, em um processo cclico. Nesse sentido, as categorias devem
ser, sempre, analisadas e revisadas, o que ultrapassa a etapa trs, de tratamento dos
resultados. Geralmente, somente se chega ao conjunto das categorias finais ao trmino da
etapa seguinte, de inferncia (ou descrio).
4) Inferncia (ou descrio): descrever os resultados obtidos atravs de grficos
ou tabelas, seja para anlises quantitativas (frequncias e percentuais) ou qualitativas
(definies para as categorias, de preferncia com citaes diretas). Sobre a anlise
qualitativa, sabe-se que ela funciona bem em corpus reduzidos, quando se lida com
categorias mais especficas, nas quais o contexto (de produo e de uso) tem importncia
capital. A inferncia pode ocorrer em relao mensagem (significado e cdigo) ou no que
se refere ao emissor/receptor. Em relao ao emissor (produtor da mensagem), que pode
ser um indivduo ou um grupo de indivduos, a funo expressiva de comunicao, pois a
mensagem representa o emissor. J quando se trata do receptor, que tambm pode ser um
indivduo ou um grupo de indivduos, restritos ou no, a funo de instrumentao (dar
condio de ao) ou de adaptao (de aceitao pelo indivduo ou grupo).
5) Interpretao: ultrapassa a descrio e analisa se os resultados alcanados
so passveis de generalizao. Est presente com mais vigor na pesquisa qualitativa do
que na quantitativa, uma vez que na primeira a ACT recomenda que se analise o contedo

88

manifesto (explcito; de produo) e o latente (implcito; de uso). Finalmente, esta etapa


pode ser realizada, basicamente, por duas vias: 1) fundamentao terica claramente
explicitada a priori, com a anlise comparativa entre o resultado e a literatura; 2) nos dados
e nas categorias da anlise: a construo da teoria, a partir da anlise dos documentos, o
que tambm j constitui a interpretao.
Ainda preciso esclarecer, que as categorias podem ser estabelecidas a priori,
desde que obedeam aos critrios j aventados anteriormente
Entretanto, seja com categorias definidas a priori, seja com uma
categorizao a partir dos dados, o estabelecimento de categorias necessita
obedecer a um conjunto de critrios [...] ser vlidas, exaustivas e
homogneas [...] ser mutuamente exclusiva [...] ser consistente (grifos do
autor) (MORAES, 1999, p.15).

Dessa forma, desde que atendam aos critrios prescritos, o conjunto de


categorias utilizado pode ser determinado a priori. Corroborando com essa afirmativa,
Rocha e Deusdar (2005, p.321), afirmam que a ACT pode ser a reproduo e
disseminao de uma realidade a priori e que, como concepo de cincia, um
instrumento neutro de verificao de uma determinada realidade. Portanto, a prtica de
conceber o conjunto de categorias a priori possvel e aceitvel.
Ressalta-se o fato de que o mtodo AC e a anlise documentria (AD) ou
documental (BARDIN, 2009, p.47) so, em algumas situaes, tratados de modo indistinto
e, portanto, como sinnimas. Contudo, mesmo havendo semelhanas entre essas duas
tcnicas, sobretudo nos processos intelectuais empregados em ambas, tais como os
recortes de informao, analogias ou na representao condensada das informaes
(BARDIN, 2009, p.47), as duas tcnicas apresentam diferenas que devem ser
consideradas.
Nesse sentido, aponta-se como primeira diferena bsica o fato de que,
enquanto a AC se ocupa do contedo da mensagem, a fim de demonstrar os indicadores
que deixam perceber outra realidade que no a da mensagem em si, a AD trabalha
documentos e sua representao, visando recuperao de informaes pelo usurio
(BARDIN, 2009, p.47).
Com esse mesmo olhar investigativo, Bardin (2009, p.47) sugere que o propsito
da anlise documentria obter o mximo de informao (aspecto quantitativo), com o
mximo de pertinncia (aspecto qualitativo). Em seu turno, Tlamo et al. (1992, on-line),
afirma que a AD tem como objetivo propor princpios para a elaborao de informaes
documentrias, definidas como mltiplas representaes de textos para fins de recuperao
face s diferentes demandas de informao. De acordo com essa definio, entende-se
que a anlise documentria realizada para a indexao de documentos com objetivos

89

especficos que se voltam para a prtica de atender s demandas informacionais de um


usurio, facilitando acesso e recuperao de informao.
No processo de indexao de documentos, destaca-se o importante papel
desempenhado pelos vocabulrios controlados, no sentido de controlar os significados
dentro de um domnio e, assim, padronizar a entrada de dados no SRI, melhorando a
qualidade da recuperao da informao.
Voltando a ateno ao tema desta pesquisa, que a criao de uma taxonomia
facetada, sente-se a necessidade de destacar as similaridades existentes entre a tcnica da
anlise categorial temtica (ACT), do mtodo da anlise de contedo (AC), com o mtodo
da anlise facetada, da teoria da anlise facetada desenvolvida por Ranganathan. Essa
necessidade advm do fato de que a ACT foi utilizada para a atribuio e validao do
conjunto de categorias fundamentais criado para compor a taxonomia. Passa-se, assim, a
apresentar essas similaridades.

4.7.1 Anlise categorial temtica e anlise facetada: similaridades


De antemo, vlido registrar que toda anlise textual pressupe a
decomposio ou fragmentao de um texto em suas partes constitutivas, buscando seus
elementos essenciais, assim como a identificao das relaes existentes entre os mesmos.
Com isso, pretende-se interpretar e apreender o texto como um todo, determinar seus
temas, seu enredo, suas argumentaes, explicaes, descries e concluses, que, juntos,
compem a base de sustentao do texto.
Em face disso, ao estudar as etapas da anlise categorial temtica (ACT),
percebeu-se similaridades com a anlise facetada, princpio que norteia o desenvolvimento
de taxonomias facetadas. Ento, esse foi o principal motivo para a escolha do mtodo da
Anlise de Contedo, utilizando a tcnica da ACT, como metodologia de validao do
conjunto de categorias fundamentais temticas, determinado a partir de levantamento de
normas e da literatura especializada da rea.
Dessa maneira, j se verifica o fato de que tanto a Anlise Facetada (AF) quanto
a Anlise de Contedo (AC), com sua tcnica de anlise categorial temtica (ACT)
possibilitam a anlise de um mesmo conjunto documental sob diferentes aspectos e
distintos objetivos. Com o objetivo de estender esta constatao, apresenta-se, a seguir,
uma breve comparao, com apontamentos mais precisos referentes aos elementos
similares entre essas duas formas de anlise.
Primeiramente, preciso ressaltar que, na atividade de AF, Ranganathan (1967)
indicou trs nveis distintos: o plano das ideias, para a anlise conceitual; o plano verbal,
concernente expresso verbal (termos) dos conceitos; e o plano notacional, determinando

90

cdigos para a localizao dos termos e sinais que pudessem sugerir as relaes entre os
conceitos tratados nos documentos. Da mesma maneira, na ACT, podem ser ressaltados
esses trs planos, ainda que no sejam discriminados dessa forma. Para tal entendimento,
basta refletir que o plano das ideias, na ACT, representado pelas regras estabelecidas
como critrios para a escolha das categorias, das unidades de registro e unidades de
contexto, que devem, sempre, estar atreladas ao objetivo e finalidade pretendidos. No
plano verbal, tambm na ACT, tem-se a escolha do termo mais adequado, pertinente e
vlido, para representar um conceito. E, no plano notacional, mesmo que no se enquadre
no sentido de armazenamento, a ACT determina critrios para a codificao do material a
ser analisado, facilitando sua identificao e localizao.
Para atender a esses trs planos, necessita-se de trs etapas para a AF e para a
ACT, que so indicadas na sequncia, fazendo-se consideraes sobre suas similaridades.
Primeira etapa
Anlise facetada: identificao do documento para anlise.
Anlise categorial temtica: pr-anlise com a escolha dos documentos, que
sejam representativos em relao ao objetivo proposto. Essa escolha pode ser a priori.
Consideraes: A anlise facetada sempre ser realizada para um domnio j
definido a priori, pois se pressupe que a anlise seja efetuada em documentos de um
domnio especfico e para um objetivo pr-definido. Do mesmo modo, a anlise categorial
temtica tambm almeja a anlise de um domnio especfico, com um objetivo pr-definido e
formulao de hipteses (ou pressupostos), mas difere quanto seleo dos documentos
que poder acontecer a priori ou em uma seleo por amostragem. Isso, no entanto, feito
simultaneamente com a determinao dos objetivos. Como afirma Bardin (2009, p.121), a
escolha dos documentos depende dos objetivos, ou, inversamente, o objetivo s possvel
em funo dos documentos disponveis. Assim, essa particularidade no as torna diferentes
sob esse aspecto.
Segunda etapa
Anlise facetada: leitura do documento.
Anlise categorial temtica: leitura flutuante, para conhecer o texto.
Consideraes: Na anlise facetada, durante a leitura do documento, h o
processo constitudo pela identificao do assunto e sua constituio, que seguem
orientaes do tipo: dissecao, para segmentar o domnio em termos de mesmo nvel;
laminao, para combinar termos isolados, formando termos compostos; desnudao, para
segmentar, ainda mais, o domnio e, assim, obter maior especificidade nos assuntos;

91

reunio livre de termos, para permitir a formao de assuntos complexos (isolado +


composto);

interpolao,

que

possibilidade

de

reunio

de

ideias isoladas

(multidimensionalidade). Nota-se que algumas dessas orientaes somente sero


evidenciadas durante o uso da classificao facetada, tais como a laminao, reunio livre
dos termos e a interpolao. Assim, tem-se, nesta fase, a dissecao e a desnudao, que
so atividades de leitura do documento, que buscam a segmentao do domnio de forma
que atenda ao objetivo proposto. Com relao anlise categorial temtica, a leitura
flutuante consiste em analisar e conhecer o documento, identificando e desmembrando o
texto em unidades de registro UR, quando decidido se estas sero representadas por
frases, expresses, palavras ou por categorias de palavras (substantivo, verbos, adjetivos),
descobrindo os ncleos de sentido. Isso remete dissecao e desnudao, da anlise
facetada, pois decide-se o grau de especificidade da representao, a partir do objetivo
pretendido. Alm disso, nesta anlise, as outras orientaes (laminao, reunio e
interpolao) tambm podem ser evidenciadas ao final da atividade classificatria, pois a
representao referente a um texto completo, no qual as partes se combinam, juntam-se e
interpem.
Terceira etapa
Anlise facetada: seleo de termos relevantes e categorias (facetas e
subfacetas), ordenao das facetas, subfacetas e focos, e organizao final.
Anlise

categorial

temtica:

tratamento

dos

resultados,

inferncia

interpretao.
Consideraes: Nas duas anlises, este o momento da atividade de
categorizao, na qual o mtodo da anlise facetada desenvolvido at que se obtenha a
estruturao final.
Na anlise categorial temtica (ACT), o tratamento dos resultados h a
identificao das unidades de registro (UR), que so os conceitos relevantes dentro do
domnio, que representado pelas unidades de contexto (UC), e as UCs so as categorias
mais gerais que contextualizam e do significado s URs. elaborada uma definio para
as categorias de forma que o sentido das URs fique restrito demarcao de cada UC, uma
vez que uma UC (categoria) pode possuir diferentes URs (facetas, subfacetas e focos). H,
ainda, a categorizao, realizada em um processo cclico de anlise, validao e
reformulao. Essa a atividade de agrupar as URs conforme suas semelhanas, a partir
de critrio nico de diviso, obedecendo s caractersticas de adequao, exaustividade,
homogeneidade, exclusividade e objetividade, em um contnuo que ultrapassa esta etapa
trs.

92

Em Ranganathan e CRG, a seleo de termos relevantes e categorias a


atividade de aplicar o mtodo da anlise facetada que fornece os princpios para a
categorizao de dado domnio, com o agrupamento de conceitos semelhantes (facetas e
subfacetas) em classes mais gerais (categorias). Nesse processo de agrupar, ou de
categorizar, so realizadas anlises do domnio de maneira que se possa identificar os
conceitos mais gerais (categorias) e os mais especficos (facetas e subfacetas). Para
Ranganathan, todo o conhecimento humano, representado pelos assuntos (ideias,
conceitos) tratados nos registros de documentos, em qualquer domnio a ser investigado,
pode ser acomodado, e estruturado em cinco categorias fundamentais, o PMEST:
Personalidade, Matria, Energia, Espao e Tempo. As facetas e subfacetas, que alimentam
as categorias fundamentais, so os assuntos (ou conceitos) inscritos nos documentos, que
esto representados por seus termos.
Em relao ordem dentro de cada categoria (das facetas, subfacetas, cadeias,
focos e renques), que recomendada nos princpios do Ranganathan e do CRG, os
procedimentos da tcnica da anlise categorial temtica (ACT) a desconsidera. Entretanto,
essa diferena no apresenta gravidade no contexto desta dissertao, pois em ambiente
digital a ordem de apresentao no se mostra de grande importncia. Houve a escolha por
apresentar as facetas, subfacetas e focos na ordem alfabtica.
Em seus estudos, Ranganathan (1967) ressalta que h liberdade para a criao
de um maior nmero de categorias, desde que o uso delas seja empiricamente avaliado
com a categorizao de documentos utilizando tais categorias e que o resultado seja
satisfatrio (critrio de utilidade). Para atender a essa recomendao, a tcnica da ACT foi
empregada para essa validao do conjunto de categorias estabelecidas a priori, assim
como houve uma experincia utilizando esse conjunto na indexao dos documentos do
corpus. Adicionalmente, a ACT indica que seja realizada a inferncia e interpretao na
qual se deve re-validar o conjunto de categorias a partir de um respaldo terico ou sustentar
uma nova teoria ou modelo desenvolvido.
De modo a ampliar o campo de discusso aqui proposto, resgatam-se os
cnones do Plano das Ideias e do Plano Verbal de Ranganathan e do CRG, referentes s
caractersticas e ao nmero de facetas, em relao s condies exigidas para as
categorias na anlise categorial temtica (ACT), os quais podem ser considerados conforme
o que se segue:
Plano das ideias
a) Diferenciao (Ranganathan): equivale Sistematicidade e Categorizao
da ACT;

93

b) Relevncia (Ranganathan e CRG): equivale Objetividade da ACT;


c) Verificao (Ranganathan e CRG): equivale Adequao (vlidas e
pertinentes) da ACT;
d) Permanncia (Ranganathan e CRG): equivale Adequao (vlidas e
pertinentes) e Objetividade (ou consistncia e fidedignidade) da ACT;
e) Homogeneidade (CRG): equivale Homogeneidade da ACT;
f) Mtua excluso (Ranganathan e CRG): equivale Exclusividade da ACT.
Plano verbal
a) Contexto (Ranganathan): equivale Unidade de Contexto e Adequao
(vlidas e pertinentes) da ACT;
b) Enumerao (Ranganathan): equivale Codificao da ACT;
c) Aceitabilidade ou terminologia usual (Ranganathan): equivale Adequao
(vlidas e pertinentes) e Objetividade (ou consistncia e fidedignidade) da ACT;
d) Restrio (Ranganathan): equivale Objetividade (ou consistncia e
fidedignidade) da ACT.
Outro aspecto a ser considerado diz respeito Exaustividade. Neste contexto,
entende-se que as classes, as cadeias de classes e a lista de isolados nas cadeias devem
ser totalmente exaustivos em relao a seus respectivos universos em comum
(RANGANATHAN,

1967,

p.158).

Isso

remete

Exaustividade

(ou

inclusividade)

estabelecida pela ACT que determina que as categorias devem ser capazes de abrigar
todas as unidades de registro (UR) selecionadas no texto, permitindo a incluso de todo
dado significativo, de acordo com o objetivo pretendido. Alm disso, a Exaustividade,
segundo Ranganathan, no que tange ao significado de ser exaustivo em relao aos
universos em comum, alude ao sentido de Contedo Manifesto da ACT, quando esta
ltima afirma que a anlise deve limitar-se ao contedo explicitado no texto.
Finalmente, preciso ressaltar que Ranganathan desenvolveu sua teoria em
meio aos problemas de classificao de registros do conhecimento, elaborando melhores
prticas para a indexao do contedo temtico dos documentos, com a finalidade de
destacar as ideias explicitadas no texto. Nesse sentido, h estudos que criam modelos para
orientar os indexadores na anlise documentria, tema que ser apresentado no subcaptulo
a seguir.

94

4.8 Modelo de Leitura Documentria de Fujita e Rubi


A anlise documentria66 atividade essencial de um bibliotecrio-indexador,
que consiste em estabelecer os assuntos que representam o contedo de um determinado
documento, atravs de uma leitura tcnica. Nessa leitura tcnica o indexador examina o
texto sistematicamente, atravs dos elementos que o compem (tais como o sumrio, a
folha de rosto, a orelha, o resumo ou a apresentao), com o objetivo de entender como o
todo foi organizado e quais as ideias principais do texto. Nesse processo, a ateno do
bibliotecrio tem em vista a recuperao das informaes pelos usurios da biblioteca, seja
ela tradicional ou digital. Da, a importncia da disciplina de estratgias de anlise
documentria na formao profissional dos bibliotecrios.
No mbito da CI, Tlamo et al. (1992, on-line) afirmam que a anlise
documentria tem como objetivo propor princpios para a elaborao de informaes
documentrias, definidas, por sua vez, como mltiplas representaes de textos para fins de
recuperao face s diferentes demandas de informao. Em face dessa assero,
entende-se que a CI busca por mtodos e tcnicas para representar o contedo dos
documentos visando aprimorar a recuperao de informaes.
preciso destacar que em toda anlise documentria esto embutidos o objetivo
pretendido e as necessidades informacionais dos usurios. Nesse sentido, Albrechtsen
(1993, p.220) indica que h trs formas para a anlise de um documento: forma simplista,
forma orientada ao contedo ou forma orientada demanda. Na forma simplista, os
conceitos so atribudos estatisticamente, podendo ser uma tarefa completamente
automatizada. J na anlise orientada ao contedo, atenta para a interpretao temtica
implcita e explcita contida no texto. E, finalmente, na anlise orientada demanda, regida
pelo objetivo e necessidade ad hoc, isto , para um fim especfico, que visa transferncia
de informao e conhecimento.
Vale lembrar neste momento, que a anlise de assunto (ou conceitual) uma
das etapas da indexao, constituda basicamente por duas fases: a anlise conceitual e a
traduo. Na anlise de assunto (ou conceitual) h a identificao e seleo dos conceitos
que representam os assuntos tratados no documento. J a traduo consiste em transmutar
a linguagem natural utilizada para apresentar nos conceitos do texto para uma
representao de uma linguagem controlada, preferencialmente, de um vocabulrio
controlado empregado pelo sistema. Esse controle terminolgico permite melhorar a
recuperao das informaes, atravs dos termos indexadores que padronizam,
66

H certa polmica sobre o uso da expresso anlise documentria (AD) que, na corrente francesa,
considerada como um campo mais amplo no qual o processo de indexao est inserido. A corrente
espanhola, por sua vez, considera a AD como composta de forma (descritivo) e contedo (temtico). J na
corrente inglesa considera a AD e a indexao como processos idnticos (SILVA; FUJITA, 2004).

95

principalmente, problemas relacionados com a sinonmia e ambiguidades. Segundo Dodebei


(2002, p.79), a unidade informacional o conceito, embora claro, ela deva estar expressa
por termos, simbolicamente representados por palavras. Nesse sentido, o termo uma
representao conceitual, controlada, do contedo de um texto.
A atividade de indexao uma prtica sujeita subjetividade, pois envolve o
discernimento e conhecimento do profissional indexador, o que pode gerar certa
inconsistncia. Na literatura h relatos desse tipo problema, tais como a inconsistncia
intraindexador e inconsistncia interindexador. A inconsistncia intraindexador, acontece
quando um mesmo profissional indexa um documento de diferentes formas, em distintas
ocasies temporais, e a inconsistncia interindexador acontece quando distintos
profissionais indexam um mesmo documento de maneiras diferentes (BORKO, 1977).
Como pode ser percebido nos ltimos pargrafos, h distintas maneiras para a
anlise documentria, sendo imprescindvel que o indexador esteja preparado para
enfrentar as dificuldades e subjetividades envolvidas na atividade de leitura e interpretao
de textos. Na literatura da rea da CI, encontram-se propostas de metodologias que tm por
finalidade orientar a leitura tcnica dos indexadores. Como exemplo, h a metodologia de
Kobashi (1994), que sugere formas de identificao do tema do documento, a partir da
leitura do texto. Alm dessa, h a proposta metodolgica de Tlamo (1994), que consiste
em determinar a estrutura temtica a partir de categorias temticas, que ofeream
respostas s perguntas: Quem (ser), O qu (tema), Como (modo), Onde (lugar), e Quando
(tempo). Segundo a autora, a estrutura temtica de um texto consiste na distino do

objetivo principal do texto, daquilo que acessrio ou secundrio (TLAMO, 1994,


p.24).
Outra importante metodologia foi apresentada por Fujita e Rubi (2006), que
desenvolveram um Modelo de Leitura Documentria (MLD) que teve como ponto de partida
o aperfeioamento da formao de indexadores. As autoras tiveram como objetivo criar um
instrumento capaz de orientar e sistematizar a leitura tcnica de textos pelos indexadores,
profissionais ou em formao. Assim, o MLD uma metodologia para a anlise de assunto
nos documentos, de forma a facilitar a identificao e seleo de conceitos, sobretudo em
textos cientficos. preciso salientar, que esse modelo foi elaborado para a anlise de
artigos cientficos, especificamente, da rea biolgica, e
consiste, fundamentalmente, da combinao das sistemticas de
identificao de conceitos anlise conceitual (primeira coluna) e abordagem
sistemtica da Norma 12.676 (segunda coluna) com a localizao dos
conceitos em parte da estrutura textual (terceira coluna) (FUJITA; RUBI,
2006, on-line).

96

Com esse instrumento, as autoras oferecem uma forma de operacionalizar o


processo de indexao, conectando a representao do documento com o sistema de
recuperao de informao, o que ilustrado atravs do QUADRO 3.
QUADRO 3 Modelo de leitura Documentria de Fujita e Rubi (2006)
CONCEITO
(ANLISE CONCEITUAL)

QUESTIONAMENTO
(NORMA 12.676)

PARTE DA ESTRUTURA
TEXTUAL

OBJETO

O documento possui em seu


contexto um objeto sob efeito de
uma atividade?

INTRODUO (OBJETIVOS)

AO

O assunto contm um conceito


ativo (por exemplo, uma ao, uma
operao, um processo etc.)?

INTRODUO (OBJETIVOS)

AGENTE

O documento possui um agente


que praticou esta ao?

INTRODUO (OBJETIVOS)

MTODOS DO AGENTE

Este agente refere-se a modos


especficos para realizar a ao
(por exemplo, instrumentos
especiais, tcnicas ou mtodos)?

LOCAL OU AMBINCIA

Todos estes fatores so


considerados no contexto de um
lugar especfico ou ambiente?

CAUSA E EFEITO

So identificadas algumas variveis


dependentes ou independentes?

RESULTADOS; DISCUSSO
DE RESULTADOS

PONTO DE VISTA DO
AUTOR; PERSPECTIVA

O assunto foi considerado de um


ponto de vista, normalmente no
associado com o campo de estudo
(por exemplo, um estudo
sociolgico ou religioso)?

CONCLUSES

METODOLOGIA

METODOLOGIA

Fonte: Fujita e Rubi (2006, on-line). Disponvel em: <http://www.dgz.org.br/jun06/Art_04.htm>.

Com base em teorias da rea da biblioteconomia, esse modelo de leitura foi


desenvolvido para a indexao de artigos cientficos da rea de biologia, apoiado na
combinao da explorao da estrutura textual para identificao de conceitos por meio de
questionamento (FUJITA; RUBI, 2006, on-line). Sua metodologia apresentada por Fujita e
Rubi (2006, on-line), em dois aspectos (combinao da estrutura textual com a identificao
de conceitos e sistemtica de identificao de conceitos) e segue os seguintes passos:
1) Identificao da estrutura textual de conceitos na literatura: conhecer a
estrutura textual do documento auxilia na identificao dos conceitos na atividade de
indexao. A ttulo de argumentao,

97

no que diz respeito estrutura do texto, afirma-se estar associada ao modo


com o qual as idias so organizadas com relao ao contedo, ao tema e
aos conceitos tratados no texto. Como a estrutura do texto se articula ao
seu contedo, o autor de um texto escolhe determinada estrutura textual
que venha coincidir com o contedo que quer transmitir (FUJITA; RUBI
2006, on-line).

Assim, constata-se que as autoras partiram da concepo de estrutura e


superestrutura, relacionando com a metodologia de indexao (KOBASHI, 1994) e a
metodologia de Tlamo (1994), j citada anteriormente.
2) Identificao dos conceitos na leitura documentria (a abordagem sistemtica
e a anlise conceitual): a abordagem sistemtica consiste em usar as regras da Norma
NBR-12.676, que sugerem questionamentos ao texto como forma de extrair conceitos dele,
tais como:
QUADRO 4 Sugestes de perguntas da Norma NBR-12.676
PERGUNTAS
a) O documento possui em seu contexto um objeto sob efeito de uma atividade?
b) O assunto contm um conceito ativo (por exemplo, uma ao, uma operao, um processo,
etc.)?
c) O objeto influenciado pela atividade identificada?
d) O documento possui um agente que praticou esta ao?
e) Este agente refere-se a modos especficos para realizar a ao (por exemplo, instrumentos
especiais, tcnicas ou mtodos)?
f) Todos estes fatores so considerados no contexto de um lugar especfico ou ambiente?
g) So identificadas algumas variveis dependentes ou independentes?
h) O assunto foi considerado de um ponto de vista, normalmente no associado com o campo
de estudo (por exemplo, um estudo sociolgico ou religioso)?
Fonte: Norma NBR-12.676 (1992, p.2).

Em vista dessas colocaes, possvel o entendimento de que, para cada item


da primeira coluna, referente ao modelo apresentado no QUADRO 3, haver um
questionamento (QUADRO 4 e segunda coluna do QUADRO 3) e uma resposta apropriada.
No que diz respeito anlise conceitual, Fujita e Rubi (2006) trabalharam com
as recomendaes para a anlise conceitual utilizados pelos princpios de indexao do
sistema PRECIS (FUJITA, 2003). Segundo essa autora, esse sistema foi idealizado por
Derek Austin, em 1964 (SILVA; FUJITA, 2004), para automatizar a indexao de
documentos, cuja atividade visa preservar o contexto do servio de informao. Alm disso,
alia o contexto de produo e de uso da informao, em uma abordagem sinttica e

98

semntica, para a elaborao de ndices de assunto. Esse sistema permite compatibilizar a


linguagem natural dos textos e a linguagem natural do usurio com um vocabulrio
controlado que pode ser, e prefervel que seja assim, adaptado para o contexto, isto , ele
no pr-determinado ou padronizado. No intuito de atender a esse critrio, o sistema
PRECIS indica o questionamento ao texto, buscando, justamente, identificar os conceitos,
pois, para cada pergunta haver um conceito em resposta:
- o que aconteceu? (ao)
- a que ou a quem isto aconteceu? (objeto da ao - sistema chave)
- o que ou quem fez isto? (agente da ao)
- onde aconteceu? (local)
A partir disso, os conceitos so identificados a partir da estrutura profunda do
texto, ou seja, com a determinao dos conceitos nos quais ocorrem os significados mais
generalizveis. Em outras palavras, pode-se afirmar que esses conceitos mais gerais so as
categorias (primeira coluna), que representam a estrutura textual do documento.
Ao trmino desses procedimentos, possvel indexar os documentos com
completude e clareza, facilitando a tarefa do indexador. Entretanto, cabe salientar que
diferentes tipos de textos podem possuir distintas estruturas de produo, o que impe a
adaptao do modelo proposto por Fujita e Rubi (2006).
Diante do exposto, verifica-se a necessidade de se identificar a estrutura dos
documentos do corpus da presente dissertao, que so trabalhos acadmicos do tipo teses
e dissertaes, de forma a estabelecer a adequao ou no do modelo de Fujita e Rubi.
Dessa forma, esse o tpico que se apresenta a seguir.

4.9 Documentos acadmicos: teses e dissertaes


Um documento, desde a concepo de Otlet, pode ser praticamente qualquer
objeto de informao.
Para Paul Otlet, documento o livro, a revista, o jornal; a pea de arquivo,
a estampa, a fotografia, a medalha, a msica; tambm, o filme, o disco e
toda a parte documental que precede e sucede a emisso radiofnica. Ao
lado dos textos e das imagens, existem objetos documentais por si mesmos
(relia). So as amostras, os espcimes, modelos, fac-smiles e, de maneira
geral, tudo que tenha carter representativo em trs dimenses e,
eventualmente, em movimento (CUNHA; CAVALCANTI, 2008, p.132).

Para Rabello (2009, p.12), o documento


faz parte do quadro conceitual da CI. Ele apresenta a materialidade e a
susceptibilidade [sic] de inscrio ou registro informacional como
caractersticas principais e apresenta, igualmente, uma estrutura e uma
disposio que facilita e/ou propicia a identificao e a apreenso das
informaes nele registradas.

99

Esses dois conceitos de documento traduzem o que est expresso na norma


NBR-12676:1992, que trata das regras para a prtica normalizada da anlise de
documentos. A referida norma determina que documento qualquer unidade, impressa ou
no, passvel de catalogao ou indexao e, ainda, acrescenta que:
Esta definio se refere no apenas a materiais escritos ou impressos em
papel ou suas verses em microforma (p. ex.: livros, jornais, diagramas,
mapas), mas tambm a suportes no-impressos (p. ex.: registros legveis
por mquinas, filmes, gravaes sonoras), objetos tridimensionais e realia
usadas como espcimens (NBR-12676, 1992, p.2).

Nesta dissertao, adotada a concepo de documento como qualquer


unidade informacional, impressa ou no, passvel de catalogao ou indexao, seja qual
for a sua natureza ou suporte. Alm disso, a unidade informacional (informao)
considerada tangvel, pois, segundo Buckland (1991), pode ser tratada e disseminada em
SRIs, por meio de trs usos: 1) informao como processo, com a transmisso e
comunicao de uma informao; 2) informao enquanto conhecimento, capaz de reduzir
incertezas atravs do uso da informao pelo indivduo; 3) informao na perspectiva de
objeto, que pode ser atribudo a qualquer unidade informacional, a qualquer coisa.
Partindo-se desses preceitos de documento, pode-se afirmar que os
documentos acadmicos constituem o conjunto de produes que formam a literatura
cientfica. Entretanto, o escopo deste trabalho trata, exclusivamente, dos documentos
acadmicos do tipo teses e dissertaes. Sendo assim, convm explicar que uma tese um
documento acadmico que representa o resultado de pesquisa com tema nico e escopo
bem delimitado, responsvel por contribuio real para a questo levantada, com alto grau
de profundidade de estudo. Nesses termos, a tese deve ser elaborada sob a superviso de
um orientador que possua a titulao de doutor. Com relao a isso, o Conselho Federal de
Educao (Parecer 977/65) afirma que
a elaborao de uma tese constitui exigncia para obteno do grau de
Doutor [...] dever ser elaborada com base em investigao original
devendo representar trabalho de real contribuio para o tema escolhido.

A propsito da NBR 14724:2005, a tese definida como


documento que representa o resultado de um trabalho experimental ou
exposio de um estudo cientfico de tema nico e bem delimitado. Deve
ser elaborado com base em investigao original, constituindo-se em real
contribuio para o especialista em questo. feito sob a coordenao de
um orientador (doutor) e visa obteno do ttulo de doutor, ou similar.

Com relao dissertao, ela configura um documento acadmico de tema


nico, com um escopo bem delimitado. Seu objetivo estudar e reunir subsdios para
analisar e interpretar informaes coletadas. Desse modo, dever testar a capacidade e
habilidade de sistematizao do aluno, sob a superviso de um orientador que tambm deve
possuir a titulao de doutor. Sobre a dissertao, o Conselho Federal de Educao
(Parecer 977/65) salienta que:

100

o preparo de uma dissertao ser exigido para obteno do grau de


Mestre [...] dever evidenciar conhecimento da literatura existente e a
capacidade de investigao do candidato, podendo ser baseada em
trabalho experimental, projeto especial ou contribuio tcnica [...].

A NBR 14724:2005, por sua vez, caracteriza a dissertao como um


documento que representa o resultado de um trabalho experimental ou
exposio de um estudo cientfico retrospectivo, de tema nico e bem
delimitado em sua extenso, com objetivo de reunir, analisar e interpretar
informaes. Deve evidenciar o conhecimento de literatura existente sobre o
assunto e a capacidade de sistematizao do candidato. feito sob a
coordenao de um orientador (doutor), visando obteno do ttulo de
mestre.

Nesse cenrio, a pesquisa acadmica, inscrita nas teses e dissertaes,


demanda conhecimento cientfico e metodolgico, trazendo contribuies do autor ao tema
escolhido, ainda que seja um pequeno aporte de conhecimento. Alm disso, deve respeitar
regras e normas tcnicas para a normalizao dos textos, de modo a possibilitar a
comunicao e o compartilhamento da informao.
No Brasil, a Associao Brasileira de Normas Tcnicas (ABNT67), o rgo
responsvel pela normalizao tcnica e representa o pas em entidades internacionais tais
como a International Organization for Standardization (ISO) e International Elecrotechnical
Commission (IEC). Assim, a ABNT possui particular importncia no mbito de normalizao
de documentao, sobretudo na apresentao de documentos acadmicos. Isso
confirmado pelo fato de que as diretrizes da Norma ABNT-NBR 14724:2011 so as que
prevalecem, desde 17 de abril de 2011, para padronizar a elaborao e apresentao de
documentos acadmicos, dentre eles as teses e dissertaes. No obstante, outras normas
complementam-na, quais sejam: 6023:2002 (Informao e documentao Referncia
Elaborao), NBR 6024:2003 (Numerao progressiva das sees de um documento
escrito), NBR 6027:2003 (Sumrio), NBR 6034:2004 (ndice), NBR 10520:2002 (Citaes),
NBR 12225:2004 (Ttulos de lombada), NBR 6028:2003 (Resumo).
A respeito desta ltima norma, sobre os resumos, preciso esclarecer que
parte constitutiva das teses e dissertaes e, como tal, deve ser composto por uma
descrio de todo o contedo textual do documento. Mesmo porque, a norma NBR-6028
(2003), recomenda que os trabalhos acadmicos precisam, obrigatoriamente, apresentar um
resumo informativo, como elemento pr-textual, com as seguintes caractersticas:
Resumo informativo: informa ao leitor finalidades, metodologia, resultados e
concluses do documento, de tal forma que este possa, inclusive, dispensar
a consulta ao original. [...]
O resumo deve ressaltar o objetivo, o mtodo, os resultados e as
concluses do documento. A ordem e a extenso destes itens dependem do
tipo de resumo (informativo ou indicativo) e do tratamento que cada item
recebe no documento original. [...]

67

Disponvel em: <http://www.abnt.org.br/>. Acesso em: 2 out. 2010.

101

A primeira frase deve ser significativa, explicando o tema principal do


documento. A seguir, deve-se indicar a informao sobre a categoria do
tratamento (memria, estudo de caso, anlise da situao etc.).
Quanto a sua extenso os resumos devem ter: a) de 150 a 500 palavras os
de trabalhos acadmicos (teses, dissertaes e outros) (NBR-6028, 2003,
p.1-2).

Nota-se a completude exigida para os resumos informativos, o que estabelece a


importncia desse componente que revelou-se a partir do sculo XIX, quando a
comunicao cientfica passou a ser essencialmente obtida a partir de resumos, os quais
podiam substituir os artigos (resumos informativos) ou ser guias para eles (indicativos)
(MENDES, 2010, p.136). Infelizmente, problemas identificados na elaborao de resumos
ainda so recorrentes nos trabalhos acadmicos.
Retornando estrutura dos documentos do tipo teses e dissertaes, pode-se
afirmar que h trs partes fundamentais:
Parte textual: o texto composto por uma parte introdutria, que apresenta
os objetivos do trabalho e as razes de sua elaborao; o desenvolvimento,
que detalha a pesquisa ou estudo realizado; e uma parte conclusiva (ABNT
NBR 14724:2011, p.8).

Na parte de desenvolvimento da pesquisa, apresentar a investigao de forma


detalhada pressupe apresentar quatro elementos principais:
Elemento 1

Reviso de literatura: contm uma explanao sobre os estudos

realizados por outros autores acerca do tema da pesquisa. Restringe-se, geralmente, s


contribuies mais contundentes, situando a evoluo do assunto.
Elemento 2

Metodologia: descreve, detalhadamente, os mtodos, tcnicas e

processos seguidos na pesquisa, explicando as hipteses ou pressupostos, populao ou


amostra, os instrumentos e a coleta de dados. Em especial, os mtodos inditos
desenvolvidos pelo autor devem ser justificados, e devem ser apontadas suas vantagens em
relao a outros autores.
Elemento 3

Resultados:

apresenta

os

dados

obtidos

durante

desenvolvimento da pesquisa, os quais podem ser oferecidos por meio de tabelas, quadros
e figuras. Os diversos resultados alcanados devem ser agrupados e ordenados, sendo que,
para maior clareza, podem ser acompanhados por grficos com valores estatsticos.
Elemento 4

Discusso: pode expor uma comparao dos resultados

alcanados na pesquisa com aqueles estudos e j mencionados na reviso de literatura,


ressaltando os aspectos que confirmem ou modifiquem, de modo significativo, as teorias
estabelecidas.
Diante dessas verificaes, percebe-se que o documento textual das teses e
dissertaes pode ser considerado padronizado em relao sua estruturao. Ento, de
modo sinttico, possvel a seguinte enumerao acerca da sua constituio: 1) seo
inicial com a introduo, as justificativas e os objetivos; 2) desenvolvimento geralmente,

102

com a reviso da literatura, a metodologia, uma discusso (argumentao terica, conceitual


ou analtica), descrio dos dados, apresentao dos resultados; e 3) ltima seo parte
em que so apresentadas as concluses.
Quanto ao tipo de contedo, as teses e dissertaes tm carter didtico,
apresentando metodologia e resultados oriundos da anlise de dados de pesquisa cientfica
(MARCONI; LAKATOS, 1990). Para tanto, utilizam linguagem formal e especfica para a
rea ou domnio, atravs de uma terminologia prpria. Entretanto, o documento textual das
teses e dissertaes produzido em linguagem natural, que permite o uso de diferentes
termos para um mesmo conceito (sinonmia68). Esse fato acaba por ocasionar uma
dificuldade para a comunicao e compartilhamento do conhecimento registrado nesses
documentos.
preciso salientar, finalmente, que a estrutura textual das teses e dissertaes
foi utilizada para a criao da matriz categorial referente aos trabalhos acadmicos, assim
como para a criao da taxonomia facetada navegacional.
Agora, sugere-se o momento de descrever e analisar os resultados encontrados.
Para isso, o prximo captulo se apresenta.

68

Palavra ou expresso que tem o mesmo significado ou conceito de outra.

103

5 DESCRIO DOS PROCEDIMENTOS E ANLISE DOS RESULTADOS


Neste captulo, so apresentadas as etapas de desenvolvimento da taxonomia
facetada navegacional, bem como as etapas da aplicao dos mtodos e tcnicas, as
decises tomadas durante as diferentes fases desta pesquisa, e a apresentao dos
resultados. A taxonomia facetada navegacional, denominada de TAFNAVEGA, consiste em
uma ferramenta que tem por objetivo auxiliar o usurio na busca por informaes de sua
necessidade, no banco de dados da BDTD do Programa de Ps-Graduao em Cincia da
Informao da UFMG. Para tal, prope estruturar esta taxonomia com base nas
caractersticas especficas de seus usurios, evidenciando, no momento da busca,
elementos tais como os temas, mtodos, teorias e os resultados das pesquisas. Dessa
forma, o usurio poder acessar com maior facilidade no somente o ttulo, autor e ano do
documento, mas tambm essas outras informaes que complementam e caracterizam a
pesquisa acadmica.
Na elaborao da TAFNAVEGA, primeiramente, considerou-se a delimitao
temporal e o estudo do material emprico e, depois, fez-se um estudo dos documentos
selecionados referentes ao corpus, com sua codificao. Posteriormente, houve a
identificao do domnio, do usurio e de suas necessidades de informao, utilizando a
teoria da anlise de domnio. Na etapa seguinte, passou-se a determinar as categorias
fundamentais temticas da TAFNAVEGA, atravs do mtodo da anlise de contedo, com a
tcnica da anlise categorial temtica. Em sntese, a TAFNAVEGA composta por dez
categorias fundamentais temticas e pelo algoritmo desenvolvido para o processo de
extrao de conceitos. Estes procedimentos sero detalhados a seguir.

5.1 Recorte temporal e levantamento do material emprico


A delimitao temporal desta pesquisa o perodo compreendido entre 1998 e
2009. A escolha da data inicial teve estreita relao com a histria do PPGCI da UFMG, pois
esse programa foi criado em 1976, oferecendo mestrado em Administrao de Bibliotecas,
direcionado para a qualificao de docentes oriundos dos cursos de Biblioteconomia. Em
1990, houve uma reformulao do programa. Porm, somente em 1997, juntamente com a
implantao do doutorado, o programa passou a se denominar Programa de PsGraduao em Cincia da Informao (PPGCI). Por esse motivo, foram computados apenas
os trabalhos defendidos a partir de 1998, quando o Programa passou a acolher estudantes
de mestrado e de doutorado, tendo seu foco direcionado a estudos na rea da Cincia da
Informao. Ademais, essa a data mais antiga em que as teses e dissertaes passaram
a ser inseridas no banco de dados da BDTD da ECI. Em relao data final, 2009, sua

104

escolha justificou-se pela necessidade de se estabelecer um limite para o corpus, uma vez
que, a cada dia, novos trabalhos so defendidos, e novos documentos so inseridos na
BDTD da ECI.
Em seguida, na etapa do levantamento do material emprico, houve consulta aos
registros documentais da secretaria do PPGCI, ao catlogo disponibilizado pelo Sistema
Pergamum, da Biblioteca Professora Etelvina Lima, da ECI e da Biblioteca Universitria (BU)
da UFMG, alm de busca fsica, nas prateleiras dessas duas bibliotecas.
Nesse arrolamento, contou-se com o apoio e a colaborao da secretria do
PPGCI-UFMG, dando acesso aos registros dos trabalhos acadmicos e linhas de pesquisa,
e com a cooperao da chefia da biblioteca da ECI-UFMG para o cruzamento e validao
dos dados levantados na secretaria do PPGCI-UFMG.
Entretanto, algumas dificuldades foram encontradas, como, por exemplo,
trabalhos acadmicos sem a identificao da linha de pesquisa qual pertenciam; itens no
registrados no catlogo da biblioteca; itens cuja catalogao apresentava pequenos erros,
tais como grafia incorreta do nome dos autores; itens dispostos em locais errados nas
prateleiras da biblioteca, o que demandou mais tempo de busca; e alguns links quebrados
na BDTD, ocorrncias que delongaram a coleta de dados.
Como resultado desse levantamento foram identificados 290 documentos, sendo
62 teses e 228 dissertaes, referentes s linhas de pesquisa Gesto da Informao e do
Conhecimento (GIC), Informao, Cultura e Sociedade (ICS) e Organizao e Uso da
Informao (OUI). Desse total, 62 trabalhos referiam-se linha de pesquisa OUI.
Em seguida, com autorizao da coordenao do PPGCI-UFMG, foi solicitado
ao Sistema OPUS, que o sistema oficial para disponibilizao da produo intelectual da
UFMG, a liberao dos registros do banco de dados referentes ao acervo da ECI-UFMG,
para que fosse possvel fazer o cruzamento de dados entre a lista dos 62 documentos e a
lista do que efetivamente estava disponvel no banco de dados.
A partir da anlise dos registros dos dados, liberados em 7 de julho de 2010,
constatou-se que, do total dos 290 documentos (universo), somente 146 documentos
estavam disponibilizados no banco de dados, isto , pouco mais de 50%.
Dentre os 146 documentos disponveis, identificaram-se 41 documentos relativos
linha de pesquisa OUI, o que equivale a pouco mais de 66% do total. Esses 41
documentos representam o corpus desta pesquisa e so apresentados no QUADRO 5.

105

QUADRO 5 Relao de documentos do corpus (por ano)*


ANO
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
TOTAL

DOCUMENTOS
T
D
Total
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
1
2
1
3
4
7
11
0
6
6
1
5
6
3
5
8
2
3
5
12
29
41

* Disponveis no banco de dados da BDTD/ECI em julho/2010.


Fonte: Elaborado pela autora.

Com a listagem do corpus pronta, passou-se sua codificao.

5.1.1 Codificao do corpus da pesquisa


Para cada um dos documentos do corpus estabeleceu-se uma codificao, cuja
listagem est disposta no APNDICE A. Os documentos foram identificados pela tipologia,
sendo utilizada a letra t para as teses e a letra d para as dissertaes. Junto s letras,
foram atribudos algarismos arbicos, de forma sequencial, iniciando em 001, at o ltimo
item, acompanhados do ano de defesa do documento, sendo apresentadas em ordem
decrescente de defesa. Como exemplo, tem-se t001-2009, t002-2009 e d001-2009, d0022009, e assim, sucessivamente.
Aps a determinao do recorte temporal e do levantamento do material
emprico (corpus), passou-se identificao do domnio, do usurio e de suas
necessidades, uma vez que antes de modelar um servio de informao necessrio fazer
essa identificao.

5.2 Identificao do domnio, do usurio e de suas necessidades


Nesta etapa houve a anlise do corpus da pesquisa com a finalidade de
identificar a qual domnio ele pertence, qual sua funo dentro desse ambiente e as razes
subjacentes para os fluxos de informao nesse campo (HJORLAND, 2002a). Alm disso,
identificou-se o usurio da BDTD, em relao ao tipo de informao contida no corpus,
assim como de suas necessidades de informao. Para isso, foi utilizado o mtodo da teoria
da anlise de domnio (TAD), com procedimentos realizados a partir das quatro etapas que
se encontram descritas na fundamentao, no Captulo Quatro, itens 4.5 e 4.5.1.

106

a) Identificao do domnio: a partir das indagaes propostas para esta etapa


da TAD, determinou-se que o domnio o programa de ps-graduao stricto sensu da ECIUFMG, limitado linha de pesquisa OUI, cujos trabalhos acadmicos do tipo teses e
dissertaes tm como caracterstica comum apresentar resultados de pesquisa com tema
nico e escopo definido, analisando-o de forma sistemtica e cientfica, por meio de
fundamentos terico-metodolgicos.
b) Anlise de dados: a caracterizao do domnio foi obtida por meio dos
questionamentos propostos para esta etapa, que indicou que o produtor do tipo de
informao contido nas teses e dissertaes sempre um pesquisador de carreira ou de
circunstncia. Determinou, ainda, que todo pesquisador um cientista e, como tal,
membro da comunidade cientfica. A finalidade dessa produo ser aprovado perante uma
banca de doutores, tambm da rea acadmica, buscando a aprovao de seus pares,
dentro de uma mesma rea de conhecimento ou entre reas interdisciplinares. Em sentido
stricto sensu, todo pesquisador tem como objetivo de ao empregar uma sistemtica
metodolgica, apresentando seu tema, o problema de pesquisa, a proposta de soluo, a
fundamentao terico-metodolgica e os resultados alcanados. Essa sistemtica faz parte
da atividade profissional do pesquisador, e exigida a sua observncia para que a produo
seja considerada e aceita como conhecimento cientfico. Para avanar em seu
conhecimento, um pesquisador precisa saber o que j foi estudado sobre seu tema de
pesquisa e sob quais condies, tericas e metodolgicas, esse tema foi abordado.
c) Modelagem do domnio: acolhendo ao recomendado para esta etapa e em
atendimento ao objetivo proposto, considera-se que, em atividade profissional, o
pesquisador necessita de informaes sobre ideias, abordagens, teorias, mtodos e
tcnicas que possam ser empregadas em sua prpria produo, de modo que possa
avanar a partir de resultados j atingidos. Seguindo a lgica indicada no mtodo da TAD,
tem-se: a) quem produz: a comunidade cientfica; b) quem comunica: as instituies
(quando disponibilizam digitalmente); c) quem usa: a prpria comunidade acadmica. A
BDTD disponibilizada pela instituio (ECI-UFMG) e o servio de informao atender
prioritariamente aos pesquisadores da OUI.
d) Coleta e seleo de dados e validao: atendendo ao prescrito nesta etapa,
foi realizada uma pesquisa especializada para encontrar fontes de informao que dessem
respaldo execuo da etapa anterior (modelagem de domnio). Dessa maneira, para
identificar e fundamentar a escolha do tipo de informao que seria disponibilizado ao
usurio, foram utilizadas as fontes: 1) o estudo de Targino (2000); 2) as ideias de Kuhn
(2006); 3) o dicionrio da rea de Biblioteconomia e Arquivologia de Cunha e Cavalcanti

107

(2008); 4) Alvarado e Oliveira (2008)69; 5) os trs livros utilizados na etapa de


desenvolvimento da TAFNAVEGA (descrita no item 5.3 deste captulo), que so: Severino
(2007), Marconi e Lakatos (2010) e Silva (2010). Nessas fontes, foram identificadas as
seguintes necessidades de informao do pesquisador, em sua atividade profissional: a)
temas que j foram investigados, com o intuito de entender o que j foi feito e para avanar
em seu conhecimento; b) mtodos e teorias utilizados nas pesquisas, com a finalidade de
ampliar o conhecimento e aprimorar teorias e mtodos cientficos existentes; c) resultados
alcanados nas pesquisas, para entender, ampliar e aplicar o conhecimento cientfico j
conhecido, sem incorrer em retrabalhos. Alm disso, para dar respaldo identificao do
produtor (autor) dos trabalhos acadmicos do tipo teses e dissertaes e dos responsveis
pela comunicao do conhecimento acumulado nesses documentos foram utilizadas as
seguintes fontes: 1) a legislao brasileira70 sobre programas de ps-graduao stricto
sensu, incluindo seus decretos; 2) as resolues e portarias do Ministrio da Educao 71
(MEC); 3) as normas e resolues da Coordenao de Aperfeioamento de Pessoal de
Nvel Superior72 (CAPES); 4) as resolues internas do PPGCI-UFMG73. Todas essas quatro
fontes estabelecem diretrizes para os programas de mestrado e doutorado, identificando
quem pode ser produtor de teses e dissertaes e sob quais condies, alm de determinar
as instituies que tm permisso para oferecer tais programas stricto sensu.
Tendo sido identificados o domnio, o usurio e suas necessidades de
informao,

passa-se

ao

desenvolvimento

da

taxonomia

facetada

navegacional

(TAFNAVEGA), iniciando pela determinao das categorias fundamentais temticas e


depois passando apresentao do algoritmo utilizado para a extrao de conceitos dos
documentos do corpus desta pesquisa.

5.3 Criao da taxonomia facetada navegacional


Para a criao de uma taxonomia facetada navegacional (TAFNAVEGA),
visando uma representao sistematizada e semntica do contedo de teses e dissertaes
capaz de facilitar a busca e a recuperao das informaes, primeiramente concebeu-se a
modelagem das informaes tendo em mente o usurio e suas necessidades de
informao, obtidos a partir da etapa anterior, no subcaptulo 5.2, o que pode ser sintetizado
conforme os dados a seguir:
69

70
71
72
73

Estudo que discorre sobre A Comunidade cientfica da Biblioteconomia e Cincia da Informao brasileira
apresentando
suas
caractersticas
e
necessidades
de
informao.
Disponvel
em:
<http://revista.ibict.br/pbcib/index.php/pbcib/article/view/1051>.
Disponvel em: < http://www4.planalto.gov.br/legislacao>.
Disponvel
em:
<http://portal.mec.gov.br/index.php?option=com_content&view=article&id=12899:posgraduacao-normativos&catid=323:orgaos-vinculados>.
Disponvel em: <http://www.capes.gov.br/sobre-a-capes/legislacao/2341-resolucoes>.
Disponvel em: <http://ppgci.eci.ufmg.br/?O_Programa:Resolu%E7%F5es>.

108

Usurio: pesquisadores
Necessidades de informao: temas, mtodos, teorias e resultados das
pesquisas.
Em seguida, no subcaptulo 5.3.1, apresenta-se o desenvolvimento das
categorias fundamentais temticas da TAFNAVEGA e, posteriormente, no subcaptulo 5.3.2,
descreve-se e aponta-se o algoritmo para o processo de extrao de conceitos dos
documentos.

5.3.1 Desenvolvimento das categorias fundamentais temticas


Nesta etapa de desenvolvimento das categorias fundamentais temticas para a
TAFNAVEGA foi utilizado o mtodo da anlise de contedo, a partir da tcnica da anlise
categorial temtica (ACT), com uma abordagem orientada demanda (ALBRECHTSEN,
1993).
A tcnica da anlise categorial temtica (ACT) est descrita no Captulo Quatro,
no subcaptulo 4.6, cujos procedimentos foram aplicados conforme descrito a seguir.
Tendo em vista a equivalncia das metodologias dos autores Moraes (1999),
Oliveira (2008) e Bardin (2009) para a aplicao da ACT, que foram apresentadas na
fundamentao (subcaptulo 4.6), utilizou-se a proposta de Moraes, porque ela possui
etapas mais subdivididas, facilitando seu emprego. Dessa maneira, na metodologia proposta
por Moraes, primeiramente identifica-se o objetivo pretendido com a anlise e, em seguida,
aplicam-se os procedimentos em cinco etapas distintas: 1) preparao das informaes; 2)
unitarizao ou transformao do contedo em unidades; 3) categorizao ou classificao
das unidades em categorias; 4) descrio; 5) interpretao.
A seguir, apresenta-se a descrio do objetivo pretendido:
Objetivo pretendido: verificar qual conjunto de conceitos necessrio para
representar a estrutura textual das teses e dissertaes, de forma que possa ser utilizado
como categorias fundamentais temticas na TAFNAVEGA criada no escopo desta pesquisa.
Partindo disso, apresentam-se as cinco etapas de Moraes (1999), que
possibilitou aplicar a metodologia da ACT.
Etapa 1: preparao das informaes
O corpus de anlise o conjunto com as 41 teses e dissertaes, apresentado
no Captulo 2, que foram formalmente analisados. A representatividade da amostra foi
garantida porque houve a anlise de todos os documentos disponveis na base de dados da
BDTD da ECI-UFMG, dentro do recorte temporal e da limitao do objeto emprico desta

109

pesquisa. Partiu-se da validade da estrutura textual para a representao do contedo dos


documentos do corpus da pesquisa.
Etapa 2: unitarizao ou transformao do contedo em unidades
A codificao dos documentos do corpus da pesquisa est apresentada no
subcaptulo 5.1.1. Esclarece-se que o procedimento de codificao contnuo, pois sempre
que houve novas unidades para anlise, as mesmas foram codificadas.
A transformao do contedo em unidades de contedo (UC) e em unidades de
registro (UR) foi obtida a partir da estrutura textual dos trabalhos acadmicos do tipo teses e
dissertaes, que se baseou na fundamentao terica do subcaptulo 4.8 desta pesquisa,
na norma ABNT-14724:1992 e na consulta literatura especializada sobre metodologias de
pesquisa, que se baseou nas seguintes fontes: Severino (2007), Marconi e Lakatos (2010) e
Silva (2010).
A escolha dessas trs obras seguiu os seguintes critrios: uma obra sobre
desenvolvimento de trabalhos acadmicos para professores e discentes, uma obra tendo
como autor um profissional respeitado e versado na rea de metodologia de pesquisa, e
uma obra sobre metodologia de pesquisa com foco na rea das cincias humanas
aplicadas. A qualificao dos autores e das obras est descrita no APNDICE B e a
compilao da anlise est apresentada no QUADRO 6.
QUADRO 6 Consolidao da estrutura textual de documentos acadmicos
PARTE TEXTUAL
(unidade de contexto)

SUBPARTES
(unidade de registro)

Introduo

Tema
Tempo e espao
Problema
Objetivos
Justificativa
Metodologia
Referencial terico

Desenvolvimento

Reviso literatura
Hipteses e variveis
Fundamentao terica
Mtodos e tcnicas
Anlise e interpretao

Concluso

Concluso (em relao s hipteses e objetivos)

Fonte: Baseado na ABNT-14724:1992, Severino (2007), Marconi e Lakatos (2010) e Silva (2010).

110

A partir dessa consolidao, identificaram-se as unidades de contexto (UC) e as


unidades de registro (UR), conforme descrito e codificado a seguir.
Unidades de Contexto e codificao: para esta codificao foram utilizadas as
iniciais UC, que significa unidade de contexto, seguida da numerao sequencial, iniciada
em um. Dessa forma, temos a seguinte codificao:
UC1: Introduo, UC2: Desenvolvimento e UC3: Concluso.
Como exemplo de leitura, tem-se o cdigo UC1, que significa unidade de
contexto referente introduo.
Unidades de Registro e codificao: para esta codificao foram adicionadas
s unidades de contexto (UC), as iniciais de UR, para representar as unidades de
registro, seguidas das letras do alfabeto, em ordem sequencial, iniciada com a letra a.
Dessa forma, tem-se a seguinte codificao:
UC1.ura: Tema;

UC2.urh: Reviso literatura;

UC1.urb: Tempo e espao;

UC2.uri: Hipteses e variveis;

UC1.urc: Problema;

UC2.urj. : Fundamentao terica;

UC1.urd: Objetivos;

UC2.urk: Mtodos e tcnicas;

UC1.ure: Justificativa;

UC2.url: Anlise e interpretao;

UC1.urf: Metodologia;

UC3.urm: Concluso.

UC1.urg: Referncia terica;


Como exemplo de leitura, tem-se o cdigo UC1.ura, que significa unidade de
contexto referente introduo, com a unidade de registro representada pelo tema.
Etapa 3: categorizao ou classificao das unidades em categorias
Nesta etapa, adotou-se o procedimento indicado pela tcnica da anlise
categorial temtica (ACT), que consiste em determinar o conjunto de categorias a partir da
anlise dos documentos do corpus, das unidades de registro e das fontes indicadas na
etapa 2 anterior. Seguindo o sugerido pela ACT para esta etapa, a determinao das
categorias foi realizada a priori, em uma anlise com abordagem semntica e dedutiva,
resultando em um conjunto de categorias que denominada pela ACT de categorias
iniciais. Esse conjunto de categorias iniciais apresentado no QUADRO 7.

111

QUADRO 7 Etapa da categorizao (Anlise de Contedo)


UNIDADE DE REGISTRO

CATEGORIAS INICIAIS
TEMA

Tema

DIMENSO

Tempo e espao
Problema
Objetivos

AO

Justificativa
Metodologia
Referncia terica
Reviso literatura
Hipteses e variveis
Fundamentao terica
Mtodos e tcnicas
Anlise e interpretao
Concluso (em relao s
hipteses e objetivos)

CAUSA E EFEITO
FUNDAMENTO TERICO
MTODOS / COLETA DE DADOS
PONTO DE VISTA DO AUTOR

PRINCIPAIS RESULTADOS ALCANADOS

Fonte: Baseado na ABNT-14724:1992, Severino (2007), Marconi e Lakatos (2010) e Silva


(2010), nas unidades de registro e na anlise nos documentos do corpus.

Para codificao do conjunto das categorias iniciais utilizou-se o seguinte


esquema: a letra C para identificar todos os elementos como categoria e, em seguida, foi
inserida uma numerao sequencial, iniciada em um. Dessa forma, tem-se a seguinte
codificao:
Conjunto de categorias iniciais: C1.Tema; C2.Dimenso; C3.Ao; C4.Causa
e efeito; C5.Fundamento terico; C6.Mtodos; C7.Coleta de dados; C8.Ponto de vista do
autor/perspectiva; C9.Principais resultados alcanados.
Ainda nesta etapa (da categorizao), passou-se para o procedimento de
validao do conjunto de categorias iniciais. Essa validao corresponde, segundo os
critrios da ACT, que as categorias devem atender s seguintes caractersticas: vlidas,
exaustivas e homogneas; mutuamente exclusivas; consistentes. Essa validao
demonstrada no QUADRO 8.

112

QUADRO 8 - Validao das "categorias iniciais"


CRITRIOS

VALIDAO
O conjunto de categorias significativo em relao estrutura
textual dos trabalhos acadmicos do tipo teses e dissertaes e
adequado ao objetivo proposto de atender s necessidades de
informao da comunidade cientfica.

Vlidas

Exaustivas
Homogneas

Cobre todo o contedo significativo da estrutura textual dos


trabalhos acadmicos. Ao completar os campos, nenhuma parte
textual deixar de ser contemplada.
O conjunto de categorias tem como nico critrio representar a
estrutura textual dos trabalhos acadmicos do tipo teses e
dissertaes.

Mutuamente exclusivas

Todas as unidades de contedo se encaixam nica e


exclusivamente em uma categoria. A regra de classificao
acatar a estrutura textual dos trabalhos acadmicos do tipo teses e
dissertaes. O critrio utilizado o semntico (se atende ao
critrio vlida). O critrio de ordenao das unidades de registro
o alfabtico.

Consistentes

Na classificao do mesmo contedo, visando ao mesmo objetivo


proposto, outros pesquisadores chegaro a resultados
semelhantes, ainda que estabeleam conjuntos diferentes de
categorias, pois os trabalhos acadmicos possuem estrutura textual
estvel e persistente.

Fonte: Elaborado pela autora.

importante salientar que a ACT sugere que seja efetuada a validao das
categorias no percurso da aplicao da tcnica at o trmino da etapa 4 (descrio), que
ser apresentada a seguir. O primeiro passo da etapa de descrio a validao do
conjunto de categorias iniciais, atravs das descries destas, numa abordagem
qualitativa, chegando-se ao conjunto de categorias intermedirias. Aps essa anlise, para
validao dos critrios e adequao semntica e terminolgica, foi feita tambm uma
reformulao da ordem lgica das categorias, resultando no conjunto de categorias finais.
Ressalta-se que, em todos os momentos nos quais houve o procedimento de
validao do conjunto de categorias, essa validao foi sempre com base nos critrios
indicados no QUADRO 8 (anterior).
Passa-se, a seguir, etapa 4, de descrio, na qual ser apresentada a
formulao do conjunto das categorias intermedirias e, depois, do conjunto das
categorias finais, que ser empregado na TAFNAVEGA.

113

Etapa 4: descrio
Nesta etapa, adotou-se uma abordagem qualitativa para a descrio das
categorias, cujo detalhamento est apresentado no APNDICE C.
A seguir, apresenta-se uma sntese dessa descrio:
C1 Tema
o assunto que a pesquisa investiga, sendo seu objeto de estudo.
C2 Dimenso
a descrio do onde a pesquisa ser desenvolvida, ou seja, o ambiente no
qual determinado objeto ou ao ocorre.
C3 Ao
So os objetivos pretendidos pela pesquisa, incluindo os objetivos geral e os
especficos.
C4 Causa e efeito
So enunciadas hipteses ou pressuposies do tipo se-ento (se varivel
independente, ento varivel dependente), advindas, geralmente, de uma teoria.
C5 Fundamento terico
So os principais conceitos tericos necessrios ao desenvolvimento da
pesquisa, provendo apoio terico para os estudos, anlise e reflexes sobre os dados e
informaes coletadas.
C6 Mtodos
a indicao do tipo de mtodos e tcnicas utilizados nos procedimentos
metodolgicos.
C7 Coleta de dados
constituda pelos instrumentos utilizados como meio para coletar os dados
para anlise de resultados.

114

C8 Ponto de vista do autor/perspectiva


Representa o olhar particular do pesquisador sobre o problema ou objeto
estudado.
C9 Principais resultados alcanados
a apresentao da anlise dos dados coletados durante o desenvolvimento da
pesquisa, muitas vezes resultando na criao de um mtodo, modelo ou na formulao de
uma teoria.
Aps a descrio das categorias, observou-se a necessidade de adequao
semntica de alguns dos termos. Dessa forma, foram substitudos:
a) O termo da categoria C2, dimenso, foi substitudo pelo termo
ambientao, atendendo ao critrio semntico, conforme verificado na literatura:
Dimensionar: [calcular a dimenso]: calcular ou preestabelecer as
dimenses ou propores (FERREIRA, 1988, p.222).
Dimenso: sentido em que se mede a extenso para avali-la. Tamanho
(ibidem).
Ambientar: [ambientao o ato de ambientar-se]: adaptar-se a um
ambiente (ibidem, p.36).
Ambiente: [...] lugar, stio, espao, recinto (ibidem).

Nota-se que o significado de ambientao direciona para o entendimento de


lugar, enquanto dimenso indica uma noo de tamanho, o que justificou a substituio,
que torna o termo mais adequado na nomeao da categoria.
b) O termo da categoria C3, ao, foi substitudo pelo termo escopo,
atendendo ao critrio semntico, conforme verificado na literatura:
Escopo: alvo, mira, intuito; inteno (FERREIRA, 1988, p.263).
Ao: ato ou efeito de atuar; atuao, ato, feito, obra (ibidem, p.8).

Nota-se que o significado da palavra ao denota como fazer? e que o


significado da palavra escopo denota para que?, qual a inteno?, que mais
adequado categoria dos objetivos;
c) O termo da categoria C9, principais resultados alcanados, foi substitudo
pelo termo resultados, pois qualquer pesquisa somente descreve os principais resultados
alcanados e o uso do termo resultados j denota esse sentido completo.

115

Aps as descries apresentadas anteriormente, numa abordagem qualitativa, e


adequaes necessrias, chegou-se ao conjunto de categorias intermedirias, mantendose o mesmo esquema de codificao indicado na etapa anterior, descritos a seguir.
Conjunto

de

categorias

intermedirias:

C1.Tema;

C2.Ambientao;

C3.Escopo; C4.Causa e efeito; C5.Fundamento terico; C6.Mtodos; C7.Coleta de dados;


C8.Ponto de vista do autor/perspectiva; C9.Resultados.
Em seguida, o conjunto das categorias intermedirias foi avaliado e analisado
conforme os critrios indicados na etapa 2, descritos no QUADRO 8, resultando nas
seguintes reformulaes, que indicar o conjunto de categorias finais:
a) Categorias excludas:
a1) a categoria C4, causa e efeito, foi excluda, porque esse tipo de elemento
geralmente est relacionado a estudos muito especficos, muitas vezes sobre o
comportamento de grupos sociais, em uma viso mais sociolgica. Exige conhecimento
profundo do texto, dificultando a identificao do seu contedo, no atendendo ao critrio de
caractersticas vlidas.
a2) a categoria C8, ponto de vista do autor/perspectiva, foi excluda, porque
exige anlise profunda do texto do documento e geralmente refere-se a pesquisas de
carter terico, em que se correlacionam conceitos e se formulam representaes da
realidade estudada. No pertinente manter uma categoria que raramente ser preenchida
e que no est alinhada s necessidades do usurio. No atendeu ao critrio de
caractersticas vlidas.
b) Categorias adicionadas (percebeu-se a carncia de algumas categorias para
atender aos critrios de caractersticas vlidas, exaustivas e mutuamente exclusivas):
b1) Categoria tipo de pesquisa, para indicar a qualificao da pesquisa. A
categoria sinteticamente descrita da seguinte forma:
Categoria Tipo de pesquisa
So tipos de caracterizao de pesquisa, tais como: natureza (bsica, aplicada),
abordagem (quantitativa, qualitativa), objetivos (exploratria, descritiva, explicativa) e
procedimentos (bibliogrfica, experimental, documental, estudo de caso, pesquisa-ao,
levantamento, expost-facto, participante).

116

b2) Categoria fundamento histrico/contextual, para indicar a reviso de


literatura que no esteja relacionada a teorias e mtodos. A categoria sinteticamente
descrita da seguinte forma:
Categoria Fundamento histrico/contextual
a apresentao das ideias presentes na literatura estudada, mostrando a
relao que possuem com o tema pesquisado, de modo a construir e reconstruir os
conceitos abrangidos na pesquisa.
b3) Categoria objeto emprico, para indicar o objeto utilizado para a anlise
e/ou coleta de dados. A categoria sinteticamente descrita da seguinte forma:
Categoria Objeto Emprico
o objeto de anlise utilizado para investigar o tema (objeto de estudo),
geralmente delimitado pelo corpus da pesquisa.
Aps as validaes fizeram-se reformulaes na ordem lgica das categorias,
respeitando a estrutura textual dos documentos do tipo teses e dissertaes, resultando no
conjunto de categorias finais, mantendo-se o mesmo esquema de codificao utilizado nas
etapas anteriores, conforme segue:
Conjunto de categorias finais: C1.Tema; C2.Objeto emprico; C3.Escopo;
C4.Ambientao; C5.Tipo de pesquisa; C6.Coleta de dados; C7.Mtodos; C8.Fundamento
terico; C9.Fundamento histrico/contextual C10.Resultados.
Dando prosseguimento, a ACT determina que se faa a anlise interpretativa de
acordo com o objetivo pretendido ao aplicar a tcnica, que apresentada a seguir.
Etapa 5: interpretao
Neste procedimento a ACT recomenda que seja realizada uma anlise
interpretativa do resultado alcanado, com uma abordagem qualitativa, comparando esse
resultado com a literatura especializada da rea consultada. Em atendimento a esse
preceito da ACT, as fontes utilizadas nesta etapa foram as mesmas da etapa 2, ou seja, a
norma ABNT-14724:1992, Severino (2007), Marconi e Lakatos (2010), Silva (2010) e a
estrutura textual dos documentos do tipo teses e dissertaes.

117

Partindo da anlise desse material, e comparando-a com o conjunto das


categorias finais, percebe-se que esse conjunto de categorias a representao
simplificada do contedo dos documentos do corpus da pesquisa, tal como apresentado por
Marconi e Lakatos (2010, p.93).
Neste cenrio, notou-se que o uso da estrutura textual do corpus da pesquisa
como parmetro para a criao do conjunto das categorias finais, transformou esse
conjunto em um modelo do documento. Percebeu-se, com isso, que o modelo reflete as
partes mais estveis do documento, pois as partes da estrutura textual mantm relaes
consistentes com o conjunto de categorias finais.
Apresentar o contedo dos trabalhos acadmicos a partir de sua representao
simplificada faz prevalecer a ideia do todo do documento, deixando claro o contedo
manifesto (explcito) da pesquisa realizada. Esse contedo importante para o pesquisador
em sua atividade profissional, como foi atestado pelas fontes da literatura especializada da
rea consultada.
Toda pesquisa cientfica necessita de aportes tericos e do conhecimento sobre
o estado da arte do tema que deseja investigar, alm de ser importante conhecer os
mtodos e tcnicas que so aplicveis ao seu problema de pesquisa. Isso confirmado pela
ideia de que uma pesquisa cientfica um processo contnuo e cclico, o que remete forma
de operao de um sistema de informao, pois o pesquisador produz informao e tambm
consome informao, alimentando e retro-alimentando esse sistema informacional.
Sendo assim, entende-se que a pesquisa cientfica um processo sistmico, no
qual a pesquisa o todo, composto pelas diferentes fases que so representadas por partes
tais como a identificao do problema, a soluo proposta e os mtodos empregados para
alcanar o resultado final. Mas, essas partes, ao se juntarem, extrapolam sua funo
primria. Assim, a pesquisa (objeto) no percebida isoladamente, mas no seu contexto de
origem (produo), de uso (demanda do usurio) e das relaes que estabelecem entre si.
Essa ideia de processo sistmico tambm remete ao pensamento de Dahlberg
(1978), que, discursando sobre as relaes paradigmticas funcionais entre os conceitos de
um sistema de classificao, aponta que elas ocorrem nos conceitos de relao do todo e
suas partes (todo/parte), por exemplo. Nesse sentido, essas relaes produzem a ideia de
conexo entre as partes do texto, de produo (significado), com o uso (funcional) dos
documentos acadmicos pelos pesquisadores. Observa-se, assim, a relao funcional entre
as partes da estrutura textual, pois, para o desenvolvimento de uma pesquisa, uma parte
dependente funcional de outra. Essa dependncia pode ser percebida na literatura
especializada da rea, quando esta indica que, para alcanar o objetivo da pesquisa,
devem-se levar em considerao os fundamentos tericos e metodolgicos, para manter
consistncia nos procedimentos adotados. Alm disso, considera-se que, como ressaltado

118

pela ACT, se outro pesquisador utilizar os mesmos critrios de avaliao aqui propostos e
tendo em vista os mesmos objetivos dessa anlise, chegar a resultados similares aos
encontrados por esta pesquisa.
No prximo item, passa-se a descrever o desenvolvimento do algoritmo74 para
ser utilizado no processo de extrao de conceitos do contedo de trabalhos acadmicos do
tipo teses e dissertaes, para a criao da TAFNAVEGA. Segundo Dias e Naves (2007,
p.69), para definir em termos adequados o assunto de um texto necessrio que,
primeiramente, se extraiam os conceitos que nele esto contidos (grifo nosso). Nesse
sentido, o algoritmo indica as instrues metodolgicas a serem respeitadas no processo do
tratamento temtico documental75 (anlise conceitual) deste tipo de documento (corpus). Ao
final, os termos representativos dos conceitos extrados iro alimentar o conjunto de
categorias fundamentais temticas da TAFNAVEGA.

5.3.2 O algoritmo para o processo de extrao de conceitos


Para a anlise conceitual nos trabalhos acadmicos, prope-se uma sequncia
de tarefas com instrues bem definidas, com o objetivo de extrair os conceitos que esto
constitudos nos textos, que iro alimentar as categorias fundamentais temticas da
TAFNAVEGA. Para isso, foi desenvolvido um algoritmo composto de uma tabela, com base
no Modelo de Leitura Documentria (MLD) elaborado por Fujita e Rubi (2006), cujos
procedimentos esto descritos no Captulo 4, item 4.7 desta pesquisa. O MLD dessas
autoras foi criado para a anlise de artigos da rea de cincias biolgicas e, neste trabalho,
ele foi adaptado para a anlise de trabalhos acadmicos do tipo teses e dissertaes,
especialmente para a rea da CI.
Na adaptao da tabela, denominada Matriz Categorial para trabalhos
acadmicos (MCTCA), aplicou-se a mesma metodologia empregada no MLD, que consiste
no desenvolvimento de trs colunas: 1) a primeira coluna composta pelos conceitos que
representam a estrutura textual dos documentos; 2) a segunda coluna indica a abordagem
sistemtica, que realizada atravs de questionamentos, a partir das recomendaes da
norma 12.676 (1992) e do sistema de indexao PRECIS; 3) a terceira coluna determina as
partes da estrutura textual dos documentos, nas quais os conceitos da primeira coluna
devem ser buscados.
74

75

Um algoritmo mostra os procedimentos (passo a passo) necessrios para completar uma tarefa, respondendo
pergunta como fazer?. Ele uma sequncia lgica, finita e bem definida de instrues para executar uma
tarefa. Nem sempre um algoritmo representa um programa de computador, pois ele pode determinar tambm
as aes de um ser humano.
O tratamento temtico documental a aplicao de mtodos e tcnicas funcionais, contextualizada na
necessidade informacional do usurio, com vistas ao acesso informao, potencializando o desenvolvimento
do conhecimento e aprimorando a recuperao da informao. a nfase dada a o que tratar, para quem
tratar e como tratar (GUIMARES, 2001).

119

Em seguida, passa-se a descrever os procedimentos adotados para o


desenvolvimento de cada uma das trs colunas do MCTCA.
Primeira coluna conceitos da estrutura textual de trabalhos acadmicos
Esta primeira coluna foi composta pelos conceitos que representam a estrutura
textual dos trabalhos acadmicos do tipo teses e dissertaes. Esses conceitos se referem
ao conjunto de categorias fundamentais temticas (CAFTE), da taxonomia facetada
navegacional (TAFNAVEGA), j apontado na etapa anterior, no subcaptulo 5.3.1, que so
apresentados a seguir e expostos no QUADRO 9.
Conjunto de categorias fundamentais temticas: C1.Tema; C2.Objeto
emprico; C3.Escopo; C4.Ambientao; C5.Coleta de dados; C6.Tipo de pesquisa;
C7.Mtodos; C8.Fundamento terico; C9.Fundamento histrico/contextual; C10.Resultados.
QUADRO 9 Primeira coluna do MCTCA
TERMOS CAFTE
C1. TEMA
C2. OBJETO EMPRICO
C3. ESCOPO
C4. AMBIENTAO
C5. TIPO DE PESQUISA
C6. COLETA DE DADOS
C7. MTODOS
C8. FUNDAMENTO TERICO
C9. FUNDAMENTO HISTRICO/ CONTEXTUAL
C10. RESULTADOS
Fonte: Elaborado pela autora.

Com a apresentao do conjunto de termos (representando os conceitos) que


compem a primeira coluna do MCTCA (QUADRO 9), passou-se aos procedimentos
adotados no desenvolvimento da segunda coluna.
Segunda coluna abordagem sistemtica
Esta segunda coluna do MCTCA foi composta pelos questionamentos
sugeridos na norma ABNT-12.676:1992 e pelos princpios de anlise do sistema de
indexao PRECIS (FUJITA; RUBI, 2006). Alm disso, como recomendado pela mesma

120

norma, foram acrescentados outros questionamentos aos j sugeridos, tendo como objetivo
tornar a abordagem sistemtica mais detalhada.
Seguindo as indicaes descritas acima, foram definidos os questionamentos
para cada termo do conjunto de termos/categorias da primeira coluna, que esto descritos a
seguir e apresentados no QUADRO 10.
C1. Tema
Qual o assunto de que trata o documento?.
C2. Objeto emprico
Qual o objeto emprico do estudo em questo? Qual objeto foi analisado e/ou
utilizado na pesquisa?.
C3. Escopo
O que pretende a pesquisa, de forma geral e especfica, que seja relevante
determinar? A que objetivos a pesquisa tem inteno de atender (aprimorar, avaliar,
analisar, identificar, contribuir, etc.)?.
C4. Ambientao
O tema, o objeto emprico e/ou a ao so considerados no contexto de um
lugar especfico ou ambiente?.
C5. Tipo de pesquisa
Tendo em vista a natureza (bsica, aplicada), a abordagem (quantitativa,
qualitativa), os objetivos (exploratria, descritiva, explicativa) e os procedimentos
(bibliogrfica, experimental, documental, estudo de caso, pesquisa-ao, levantamento,
expost-facto, participante), quais classificaes podem tipificar a pesquisa realizada?.
C6. Coleta de dados
Quais instrumentos especficos (questionrios, entrevistas, registros udiosvisuais, coleta de documentos, etc.) foram utilizados para realizar a ao?.
C7. Mtodos
Quais modos especficos foram utilizados para realizar a ao (por exemplo,
tcnicas ou mtodos para tratamento dos dados, que podem ser do tipo: modelagem

121

estatstica, anlise estrutural, codificao, anlise de contedo, indexao, anlise


semitica, retrica ou de discurso)?.
C8. Fundamento terico
Houve alguma corrente ou abordagem terica especfica (teorias, hipteses,
pressupostos, etc.) utilizada em funo da natureza do objeto a ser pesquisado e dos
objetivos pretendidos, que foram descritos na pesquisa?.
C9. Fundamento histrico/contextual
Quais

temas foram tratados e revisados, a partir de pesquisa bibliogrfica, para

contextualizar o tema pesquisado de forma profunda e consistente?.


C10. Resultados
Quais pontos a pesquisa alcanou, levando em considerao os objetivos
propostos? Houve formulao ou reformulao de teoria, criao de um mtodo ou de um
produto?.
QUADRO 10 Primeira e segunda coluna do MCTCA
TERMOS CAFTE
C1.
TEMA
C2.
OBJETO EMPRICO
C3.
ESCOPO
C4.
AMBIENTAO

C5.
TIPO DE PESQUISA

C6.
COLETA DE DADOS
C7.
MTODOS

QUESTIONAMENTOS
(NORMA 12.676 e PRECIS)
Qual o assunto de que trata o documento?
Qual o objeto emprico do estudo em questo? Qual objeto foi utilizado
e/ou analisado na pesquisa?
O que pretende a pesquisa, de forma geral e especfica, que seja
relevante determinar? A que objetos a pesquisa tem inteno de
atender (aprimorar, avaliar, analisar, identificar, contribuir, etc.)?
O tema, objeto emprico e/ou ao so considerados no contexto de
um lugar especfico ou ambiente?
Tendo em vista a natureza (bsica, aplicada), a abordagem
(quantitativa, qualitativa), os objetivos (exploratria, descritiva,
explicativa) ou os procedimentos (bibliogrfica, experimental,
documental, estudo de caso, pesquisa-ao, levantamento, expostfacto, participante), quais as classificaes podem tipificar a pesquisa
realizada?
Quais instrumentos especficos (questionrios, entrevistas, registros
udios-visuais, coleta de documentos, etc.) foram utilizados para
realizar a ao?
Quais modos especficos foram utilizados para realizar a ao (por
exemplo, tcnicas ou mtodos para tratamento dos dados, que podem
ser do tipo: modelagem estatstica, anlise estrutural, codificao,

122

QUESTIONAMENTOS
(NORMA 12.676 e PRECIS)

TERMOS CAFTE

anlise de contedo, indexao, anlise semitica, retrica ou de


discurso)?

C8.
FUNDAMENTO
TERICO
C9.
FUNDAMENTO
HISTRICO/
CONTEXTUAL
C10.
RESULTADOS

Houve alguma corrente ou abordagem terica especfica (teorias,


hipteses, pressupostos, etc.) utilizada em funo da natureza do
objeto a ser pesquisado e dos objetivos pretendidos, que foram
descritos na pesquisa?
Quais temas foram tratados e revisados, a partir de pesquisa
bibliogrfica, para contextualizar o tema pesquisado de forma profunda
e consistente?
Quais pontos a pesquisa alcanou, levando em considerao os
objetivos propostos? Houve formulao ou reformulao de teoria,
criao de um mtodo ou de um produto?

Fonte: Adaptado do MLD de Fujita e Rubi (2006).

Com a determinao da primeira e segunda colunas do MCTCA, passou-se ao


procedimento do desenvolvimento da terceira coluna.
Terceira coluna partes da estrutura textual dos documentos
Esta coluna do MCTCA foi composta com a indicao das partes da estrutura
textual dos trabalhos acadmicos, nas quais se devem procurar as respostas aos
questionamentos da segunda coluna. Esse procedimento foi realizado com base na norma
NBR-14724:2011 e nas fontes da literatura especializada da rea, as mesmas utilizadas na
etapa 2, do subcaptulo 5.3.1.
Partindo dessas premissas, a seguir indicam-se as partes da estrutura textual
dos documentos, nas quais se encontram as informaes referentes a cada conceito da
primeira coluna.
C1. Tema
Resumo / Introduo (problema, justificativa, objetivos).
C2. Objeto emprico
Resumo / Introduo (problema, justificativa, objetivos) / Metodologia.
C3. Escopo

123

Resumo / Introduo (problema, justificativa, objetivos).


C4. Ambientao
Resumo / Introduo (problema, justificativa, objetivos) / Metodologia.
C5. Tipo de pesquisa
Resumo / Metodologia / Resultados / Discusso de resultados.
C6. Coleta de dados
Resumo / Metodologia / Resultados / Discusso de resultados.
C7. Mtodos
Resumo / Metodologia / Resultados / Discusso de resultados.
C8. Fundamento terico
Resumo / Reviso de literatura / Fundamentao.
C9. Fundamento histrico/contextual
Resumo / Reviso de literatura / Fundamentao.
C10. Resultados
Resumo / Resultados / Discusso de resultados / Concluso.
Finalizado o desenvolvimento da terceira coluna, apresenta-se o algoritmo do
modelo MCTCA completo, conforme o QUADRO 11.
QUADRO 11 Matriz categorial para trabalhos acadmicos (teses e dissertaes)
TERMOS CAFTE

C1.
TEMA

C2.
OBJETO
EMPRICO

QUESTIONAMENTOS
(NORMA 12.676) e PRECIS

Qual o assunto de que trata o documento?

Qual o objeto emprico do estudo em questo? Qual


objeto foi utilizado e/ou analisado na pesquisa?

PARTE DA
ESTRUTURA TEXTUAL
RESUMO /
INTRODUO
(problema, justificativa,
objetivos)
RESUMO /
INTRODUO
(problema, justificativa,
objetivos) /
METODOLOGIA

124

QUESTIONAMENTOS
(NORMA 12.676) e PRECIS

PARTE DA
ESTRUTURA TEXTUAL

O que pretende a pesquisa, de forma geral e especfica,


que seja relevante determinar? A que objetos a
pesquisa tem inteno de atender (aprimorar, avaliar,
analisar, identificar, contribuir, etc.)?

RESUMO /
INTRODUO
(problema, justificativa,
objetivos)

C4.
AMBIENTAO

O tema, objeto emprico e/ou ao so considerados no


contexto de um lugar especfico ou ambiente?

RESUMO /
INTRODUO
(problema, justificativa,
objetivos) /
METODOLOGIA

C5.
TIPO DE
PESQUISA

Tendo em vista a natureza (bsica, aplicada), a


abordagem (quantitativa, qualitativa), os objetivos
(exploratria, descritiva, explicativa) ou os
procedimentos (bibliogrfica, experimental,
documental, estudo de caso, pesquisa-ao,
levantamento, expost-facto, participante), quais as
classificaes podem tipificar a pesquisa realizada?

RESUMO /
METODOLOGIA /
RESULTADOS /
DISCUSSO DE
RESULTADOS

C6.
COLETA DE
DADOS

Quais instrumentos especficos (questionrios,


entrevistas, registros udios-visuais, coleta de
documentos, etc.) foram utilizados para realizar a ao?

RESUMO /
METODOLOGIA /
RESULTADOS /
DISCUSSO DE
RESULTADOS

C7.
MTODOS

Quais modos especficos foram utilizados para


realizar a ao (por exemplo, tcnicas ou mtodos
para tratamento dos dados, que podem ser do tipo:
modelagem estatstica, anlise estrutural,
codificao, anlise de contedo, indexao,
anlise semitica, retrica ou de discurso)?

RESUMO /
METODOLOGIA /
RESULTADOS /
DISCUSSO DE
RESULTADOS

C8.
FUNDAMENTO
TERICO

Houve alguma corrente ou abordagem terica


especfica (teorias, hipteses, pressupostos, etc.)
utilizada em funo da natureza do objeto a ser
pesquisado e dos objetivos pretendidos, que foram
descritos na pesquisa?

RESUMO / REVISO
DE LITERATURA /
FUNDAMENTAO

C9.
FUNDAMENTO
HISTRICO/
CONTEXTUAL

Quais temas foram tratados e revisados, a partir de


pesquisa bibliogrfica, para contextualizar o tema
pesquisado de forma profunda e consistente?

RESUMO / REVISO
DE LITERATURA /
FUNDAMENTAO

C10.
RESULTADOS

Quais pontos a pesquisa alcanou, levando em


considerao os objetivos propostos? Houve
formulao ou reformulao de teoria, criao de
um mtodo ou de um produto?

TERMOS CAFTE

C3.
ESCOPO

RESUMO /
RESULTADOS /
DISCUSSO DE
RESULTADOS /
CONCLUSES

Fonte: Adaptado do MLD de Fujita e Rubi (2006).

O objetivo do modelo MCTCA orientar e sistematizar a anlise conceitual nos


documentos do tipo teses e dissertaes, que, ao mesmo tempo, facilita a extrao de
conceitos e alimenta a estrutura da TAFNAVEGA, tornando-a um mecanismo para a
navegao facetada.

125

Para demonstrar a utilizao desse algoritmo na extrao de conceitos, e a


funcionalidade da TAFNAVEGA, foi preparada uma experincia76 composta por duas
etapas: 1) na primeira etapa, no subcaptulo 5.4, a seguir, apresenta-se o uso do MCTCA na
extrao dos conceitos, com a anlise nos resumos informativos dos documentos do corpus
desta pesquisa; 2) na segunda etapa, descrita no subcaptulo 5.5, foi realizado uma
apresentao da implementao tecnolgica, com o objetivo de demonstrar a visualizao
da navegao pela taxonomia facetada navegacional (TAFNAVEGA), em meio digital.
Passa-se, ento, a apresentar os procedimentos da primeira etapa.

5.4 O experincia do MCTCA na anlise do corpus da pesquisa


Nesta etapa da experincia, foi realizada uma anlise conceitual, utilizando o
MCTCA, para a extrao dos conceitos referentes aos resumos informativos dos
documentos do corpus (41 documentos) desta pesquisa.
Na aplicao do MCTCA, sentiu-se a necessidade de acrescentar uma quarta
coluna tabela, com a finalidade de registrar os termos (representando os conceitos)
extrados do documento, referentes aos termos/categorias da primeira coluna, conforme o
QUADRO 12.
QUADRO 12 Matriz categorial para extrao de conceitos
Primeira coluna

Segunda coluna

Terceira
coluna

Quarta coluna

TERMOS
CAFTE

QUESTIONAMENTOS
(NORMA 12.676) e
PRECIS

PARTE DA
ESTRUTURA
TEXTUAL

TERMOS DE
INDEXAO

Fonte: Adaptado do modelo MCTCA.

Descreve-se, a seguir, a sequncia dos procedimentos da aplicao do algoritmo


do MCTCA nos resumos informativos do corpus desta pesquisa: 1) selecione um conceito
CAFTE na primeira coluna; 2) procure, no resumo informativo do documento analisado, as
partes da estrutura textual indicadas na terceira coluna; 3) analise o resumo informativo do
documento, fazendo os questionamentos indicados na segunda coluna; 4) extraia e
selecione os conceitos dos resumos informativos.
Contudo, para concluir a experincia da extrao de conceitos e registrar os
conceitos extrados atravs do algoritmo, foi preciso adicionar, aos procedimentos

76

Na presente pesquisa, o vocbulo experincia significa o ato ou efeito de conhecer a aplicao de um


instrumento ou objeto, verificando a sua qualidade de uso (FERREIRA, 1988).

126

anteriores, a seguinte instruo: 5) faa a traduo77 dos conceitos, utilizando um


vocabulrio controlado, e o insira na quarta coluna.
Para essa traduo dos conceitos selecionados, foi utilizado o vocabulrio
controlado Taxonomia da Cincia da Informao, desenvolvido por Oddone e Gomes
(2003). importante novamente esclarecer que o escopo desta pesquisa no inclui a
avaliao de vocabulrios controlados quando empregados na atividade de traduo.
Contudo, salienta-se que essa validao necessria e pretende-se investig-la em um
trabalho posterior. A escolha pelo uso do vocabulrio controlado (VC) de Oddone e Gomes,
nessa experincia, deve-se preferncia pela utilizao de um instrumento (a taxonomia)
que, originalmente, fosse de mesmo tipo e princpio do mecanismo proposto nesta pesquisa.
Prosseguindo-se na anlise conceitual, cada resumo informativo do corpus desta
pesquisa foi indexado pelo conjunto de termos (representando os conceitos) da primeira
coluna do MCTCA, conforme a FIG. 6.
FIGURA 6 Processo de extrao de conceitos dos resumos informativos do corpus

Fonte: Elaborado pela autora.

Ao final do procedimento de anlise conceitual, foi coletado um total de 407


termos indexadores. Esses termos foram refinados somente pelo critrio de excluso de
termos idnticos, uma vez que, com o uso do vocabulrio controlado na traduo, no
houve problema de sinonmia. Aps esse refinamento, totalizaram 168 termos indexadores
(APNDICE H).

77

A traduo uma das etapas da indexao na qual a linguagem natural dos autores convertida para a
linguagem controlada utilizada no sistema, fazendo a compatibilizao das duas linguagens.

127

Como resultado dessa etapa, apresenta-se o percentual de preenchimento do


conjunto dos termos CAFTE no GRF. 1.
GRFICO 1 Percentual de preenchimento das CAFTE (resumos do corpus)

Fonte: Sntese dos dados do APNDICE G.

Observando o GRF. 1, nota-se, principalmente, o baixo percentual da categoria


C10 (resultados). Entretanto, esse percentual pode representar a totalidade de trabalhos
que tiveram como resultado de pesquisa um produto (prottipo), modelo, mtodo ou teoria
desenvolvida. Porm, ao longo desse procedimento, alguns problemas foram detectados, e
o primeiro deles a incompletude dos resumos informativos do corpus analisado. Esse
problema tambm pode explicar o baixo percentual do resultado da categoria C10, pois nem
sempre esses resumos incluram todos os resultados alcanados pelas pesquisas, conforme
apresentado no resultado da anlise, que so descritos a seguir:
a) Resumos incompletos: quase 95% do total, pois apenas dois documentos
(d021-2006; d023-2006) apresentaram informaes suficientes para o preenchimento de
todos os campos do MCTCA;
b) Inexistncia de palavras-chave: quase 25% do total dos resumos informativos
no possuam palavras-chave (d037-2003; d025-2005; d020-2006; d036-2004; d030-2005;
t012-2005; d017-2007; t009-2007; d013-2008; t002-2009);
c) Palavras-chave insuficientes para representar o contedo do documento:
100% dos resumos informativos no contm palavras-chave suficientes para representar
todo o contedo das pesquisas.
Esse resultado est tabulado no GRF. 2.

128

GRFICO 2 Problemas em resumos informativos do corpus da pesquisa

Fonte: Dados extrados da anlise conceitual nos resumos do corpus.

Observa-se que o problema mais grave mesmo o de resumos incompletos,


pois esse problema traz prejuzos qualidade da recuperao do contedo dos
documentos. Decerto, um pesquisador geralmente recorre aos resumos informativos dos
trabalhos acadmicos quando busca por uma informao sobre pesquisas j concludas,
uma vez que a consulta aos textos completos demandaria um tempo demasiado, e poderia
no ser vivel. Dessa forma, a qualidade dos resumos informativos das teses e dissertaes
tem influncia direta na melhora da recuperao de informaes.
Outros problemas foram verificados nos resumos informativos, tais como:
sinonmia na atribuio de palavras-chave (ex. d023-2006), falta de objetividade (ex. d0292005) e itens pr-textuais inseridos aps o sumrio (ex. d014-2007).
Prosseguindo com a experincia do uso do MCTCA na anlise dos resumos
informativos do corpus da pesquisa, foram selecionadas cinco, das dez categorias
possveis, como amostra para a demonstrao e anlise dos resultados. A escolha da
amostra foi obtida aplicando-se o critrio de amostra probabilstica78, com uma seleo
aleatria simples (por sorteio), chegando-se seguinte lista de categorias: C1. Tema, C2.
Objeto emprico, C5. Tipo de pesquisa, C6. Coleta de dados e C7. Mtodos.
O objetivo dessa demonstrao e anlise dos resultados foi indicar que,
utilizando a TAFNAVEGA em uma situao emprica, quais dados podem ser coletados e, a
partir dos resultados encontrados, quais tipos de anlises podem ser realizados.
Dessa maneira, em seguida apresentam-se os resultados da anlise nas
categorias da amostra (grficos no APNDICE I), respeitando-se a ordem decrescente do

78

Quando a populao finita e pequena pode-se aplicar a amostra probabilstica simples escrevendo cada
elemento da populao em um carto, misturando-os em uma urna e sorteando tantos cartes quantos se
deseja na amostra.

129

percentual de preenchimento das mesmas (GRF. 1), que ser a seguinte: C1. Tema, C2.
Objeto emprico, C7. Mtodos, C5. Tipo de pesquisa e C6. Coleta de dados.
Categoria C1 Tema: houve 100% de preenchimento dessa categoria.
Observou-se que h, basicamente, duas vertentes na linha de pesquisa OUI da ECI-UFMG:
uma vertente organizao da informao e outra vertente estudos de uso. A vertente
organizao totalizou 66% dos temas pesquisados, e a vertente uso totalizou 34%. Esse
resultado demonstra que as pesquisas na linha OUI priorizam as questes relacionadas com
a organizao da informao. Entretanto, ressalta-se que outra linha de pesquisa da ECIUFMG, Informao, Cultura e Sociedade (ICS), tambm investiga o uso de informaes,
o que pode explicar a diferena percentual. Entretanto, o escopo desta pesquisa no
abarcou a anlise das outras linhas de pesquisas, e essa informao representa somente
um indcio para futuras anlises que envolvam as trs linhas de pesquisa do PPGCI-UFMG.
Categoria C2 Objeto emprico: houve 100% de preenchimento dessa
categoria. Percebeu-se bastante heterogeneidade nesse item. Uma particularidade
observada foi em relao ao uso de pronturios mdicos (trs trabalhos, quase 8% do total).
Esse resultado indica um interesse especial das pesquisas na linha OUI com a organizao
e o acesso de informaes mdicas, provavelmente devido ampliao no nmero de
hospitais e clnicas que esto adotando os pronturios eletrnicos, nos ltimos anos.
Categoria C7 Mtodos: houve 68% de preenchimento dessa categoria,
totalizando 28 documentos do corpus da pesquisa. Observou-se que um mesmo
documento, muitas vezes, indicou a utilizao de mais de um mtodo de pesquisa, o que
uma caracterstica comum. Verificou-se que os mtodos mais utilizados na vertente
organizao da informao foram os mtodos da anlise documentria, da classificao
(anlise facetada) e do analtico-sinttico, revelando a recorrncia do uso dos princpios dos
estudos de Ranganathan na linha de pesquisa OUI. J na vertente uso da informao, os
mtodos mais utilizados foram os de estatstica (bibliometria), geralmente combinando a
abordagem quantitativa com uma anlise qualitativa dos dados, e o mtodo da anlise de
citaes. Esse resultado indica uma viso mais positivista da vertente uso da informao.
Categoria C5 Tipo de pesquisa: houve 46% de preenchimento dessa
categoria, totalizando 19 documentos do corpus da pesquisa. Da mesma forma como na
categoria C7 (Mtodos), nessa categoria houve a indicao de mais de um tipo de
qualificao para uma pesquisa, caracterstica tambm comum. Os resultados revelaram
que prevalecem as pesquisas qualitativas e comparativas, o que parece indicar o interesse
em investigar melhores formas de organizao de informaes para atender s
necessidades do usurio final. Alm disso, prevalecem tambm as pesquisas do tipo
estudos de caso, dificultando as generalizaes dos resultados encontrados nessas
pesquisas.

130

Categoria C6 Coleta de dados: houve 39% de preenchimento dessa


categoria, totalizando 16 documentos do corpus da pesquisa. As entrevistas e os
questionrios so os instrumentos de coleta de dados mais utilizados. Isso demonstra o
grau de envolvimento dos pesquisadores com os respondentes, conforme FIG. 7.
FIGURA 7 Envolvimento do pesquisador com respondentes

Fonte: Cao (2008)79

Observa-se que o pesquisador da linha de pesquisa OUI, geralmente, tem um


grau de envolvimento com seus respondentes que fica entre mdio e baixo, denotando uma
abordagem mais positivista, ainda que haja uma anlise qualitativa dos dados coletados.
Refletindo sobre os dados coletados, principalmente, das ltimas categorias
analisadas acima (C5 e C6), que tiveram um percentual de preenchimento considerado
baixo, percebe-se que o problema da incompletude dos resumos informativos atrapalha a
recuperao de importantes informaes das pesquisas.
Ademais, verificou-se que o MCTCA pode, tambm, ser utilizado para auxiliar na
sistematizao de resumos informativos para trabalhos acadmicos (teses e dissertaes).
Para isso, necessrio acrescentar uma coluna ao MCTCA, para que as informaes
referentes ao documento sejam inseridas, conforme mostra a FIG. 8.

79

CAO, Rosrio. Anlise Qualitativa de Dados com o NVIVO. 31 de out. 2008. Disponvel em:
<http://slidesha.re/11XyZq>. Acesso em: 12 mar. 2011.

131

FIGURA 8 Tabela para elaborao de resumo informativo

Fonte: Adaptada do MCTCA.

132

A partir das informaes inseridas na coluna informaes do documento,


elabora-se um texto corrido (texto sem tpicos e em pargrafo nico), de acordo com as
regras para redao de resumos informativos da norma NBR-6028:2003. Dessa forma,
apesar de no fazer parte dos objetivos desta pesquisa, essa tabela , tambm, um
resultado obtido por esta pesquisa. Vislumbra-se que ela poder auxiliar os autores e/ou
indexadores na preparao dos resumos informativos, tornando-os mais completos e
objetivos, podendo, ainda, impactar positivamente a recuperao de informaes.
Anlise geral
O contedo textual dos documentos do tipo teses e dissertaes semiestruturado e, dessa maneira, muitas vezes no facilmente recuperado pelo pesquisador.
A partir do exposto nesta pesquisa sobre as necessidades informacionais de um
pesquisador, verificou-se que, em atividade profissional, ele precisa obter informaes sobre
os resultados de pesquisa, tais como teorias, mtodos, instrumentos de coleta de dados e
tipos de pesquisa. Dessa maneira, percebeu-se que essas informaes esto armazenadas
e disponibilizadas, mas no, necessariamente, acessveis ao usurio.
Acredita-se que o pesquisador somente conseguir obter facilmente uma
informao, sobre o mtodo utilizado em uma pesquisa, por exemplo, se ele souber
exatamente onde essa informao necessitada est. Ou seja, ser fcil recuperar a
informao se o pesquisador souber o ttulo ou o autor do documento. Ou, talvez, se essa
informao estiver descrita no resumo informativo e, ainda, se o usurio for hbil no uso das
expresses de busca booleanas. Caso contrrio, recuperar a informao de que necessita
ser mais difcil para o usurio.
Ao realizar a implantao de bibliotecas digitais de teses e dissertaes nas
instituies de ensino superior, com o objetivo de evidenciar o conhecimento acumulado nas
pesquisas concludas, no basta disponibiliz-las digitalmente. preciso agregar valor
informao disponibilizada e criar condies para que esse conhecimento possa ser
acessado, possibilitando a sua recuperao. Atualmente, ao utilizar a BDTD, o usurio se
depara com grande quantidade de informaes que podem dar subsdio para sua pesquisa,
porm, elas nem sempre so fceis de explorar, localizar e recuperar. Prope-se a
TAFNAVEGA como mecanismo para a estruturao das informaes contidas nos trabalhos
acadmicos, capaz de permitir a explorao do recurso informacional da BDTD, atravs da
navegao por suas categorias e facetas, facilitando a busca e, consequentemente,
aprimorando a recuperao da informao.
A TAFNAVEGA foi criada a partir da ordenao lgica da estrutura textual de
trabalhos acadmicos, permitindo mapear e organizar o contedo considerado relevante

133

para o pesquisador, em sua atividade profissional. O mecanismo possui um conjunto de


categorias fundamentais temticas, que agrupam e interrelacionam os diferentes contedos
dos documentos. Cada categoria pode ser composta por uma hierarquia (taxonomia) de
facetas e subfacetas, que descreve os documentos sob essa dimenso especfica. Essa
caracterstica d, ao instrumento, alto grau de flexibilidade e, ao usurio, a possibilidade de
combinar diferentes aspectos e documentos.
Com o algoritmo proposto para a extrao dos conceitos contidos nos
documentos, cujos termos representativos que iro alimentar as categorias fundamentais
temticas da TAFNAVEGA, a atividade de anlise conceitual do processo de indexao do
recurso informacional ser objetivado. Isto , a atividade ser sistematizada, minimizando a
subjetividade envolvida pois usa parmetros objetivos relativos anlise conceitual.
Neste subcaptulo 5.4, foi descrita e analisada a primeira etapa da experincia,
composta por duas etapas, para demonstrar (1) a utilizao do algoritmo na extrao de
conceitos e (2) a funcionalidade da TAFNAVEGA.
Dando prosseguimento, os conceitos obtidos nessa primeira etapa (407 termos
indexadores) foram utilizados para realizar a segunda parte dessa experincia, que ser
descrita no subcaptulo 5.5.

5.5 Apresentao da implementao tecnolgica da TAFNAVEGA


O desenvolvimento desta segunda etapa da experincia tecnolgica teve por
objetivo a visualizao da interface de navegao (digital) pela estrutura facetada da
TAFNAVEGA, criada para a BDTD da ECI-UFMG. Essa segunda etapa foi desenvolvida a
partir dos 407 termos indexadores, obtidos na primeira etapa que est descrita no
subcaptulo 5.4, anterior.
Esse foi um trabalho conjunto com Pontes80, tambm integrante do grupo de
pesquisa

Prottipo

Mapa

Hipertextual

(MHTX),

realizado

dentro

do

laboratrio

experimental do prottipo de mesmo nome (LIMA, 2004a), buscando desenvolver novos


mecanismos a fim de melhorar a recuperao da informao na biblioteca digital
experimental. Esse grupo de pesquisa coordenado pela professora Gercina Lima,
orientadora desta pesquisa.
Esta etapa da experincia foi desenvolvida em uma base de dados relacional, o
Microsoft Office Access, tambm conhecido por MSAccess, foi criado pelo fabricante
80

Flvio Pontes estudante de doutorado do PPGCI-ECI/UFMG e desenvolveu, em seu projeto de qualificao


intitulado Organizao do conhecimento em bibliotecas digitais de teses e dissertaes: uma abordagem
baseada na classificao facetada, um aplicativo para apresentar sua proposta que tem por objetivo
implementar e avaliar mecanismos para a representao e organizao do acervo de uma biblioteca digital de
teses e dissertaes, e a criao de um prottipo, com base na taxonomia facetada criada nesta presente
pesquisa.

134

Microsoft. Ele um software de gerenciamento de banco de dados, que est includo no


pacote do Microsoft Office Professional. importante destacar que essa experincia se
baseia no princpio de sistemas facetados apresentados por Sacco e Tzitzicas (2009), cujo
modelo se fundamenta em um padro genrico de conhecimento e em uma classificao
multidimensional de objetos (itens de informao), usado para a navegao em bases de
dados, com foco no acesso e nas necessidades do usurio. Dessa maneira, poderia ter sido
desenvolvida em qualquer outra ferramenta ou software que permite criar uma base
relacional.
O MSAccess um programa que oferece um modelo relacional bastante
simples, que consiste em diferentes tabelas, estruturadas por campos (colunas), e, em cada
tabela, h distintos registros (linhas) de informao, que podem relacionar-se, atravs de
campos-chave, com as diferentes tabelas.
No desenvolvimento dessa experincia, foram criadas tabelas diferentes para
cada tipo de informao, para armazenar os dados. Os procedimentos para a estruturao
do banco de dados seguiram as recomendaes do fabricante, com as seguintes etapas:
1) Determinao das tabelas: foi criada uma tabela para cada uma das dez
categorias fundamentais temticas (FIG. 9);
FIGURA 9 Tabela de categorias fundamentais

Fonte: Tela da implementao tecnolgica no MSAccess.

2) Determinao dos campos necessrios: foram atribudos diferentes campos,


independentes, para cada faceta encontrada (setas verdes na FIG. 10);
3) Determinao dos relacionamentos: para efeito desta experincia, todos os
relacionamentos se basearam no relacionamento do tipo um (setas vermelhas na FIG.

135

10), uma vez que, no escopo desta pesquisa, esse tipo de atribuio foi suficiente para
demonstrar a experincia.
FIGURA 10 Campos e relacionamentos entre facetas

Fonte: Tela da implementao tecnolgica no MSAccess.

4) Refinamento da estrutura do banco de dados: os dados das tabelas foram


inseridos aos poucos, possibilitando verificar a estabilidade e o funcionamento da estrutura
que estava sendo desenvolvida, com constantes averiguaes. Esse refinamento tambm
foi conseguido a partir da extrao de relatrios, que permitiram verificar a condio de cada
tabela e de cada elemento dentro dela.
Em seguida, descreve-se a modelagem informacional criada e, logo depois, a
visualizao de uma busca atravs da TAFNAVEGA, por uma sequncia de figuras.

136

FIGURA 11 Relaes entre documentos do corpus

Fonte: Adaptado de Sacco e Tzitzicas (2009, p. 22 e 32).

Observando a FIG. 11, esquerda (n.1) tem-se a relao isolada do documento


t001-2009. Isto , o documento foi representado sob a categoria C7. J direita (2), tem-se
a relao do documento t001-2009 com os diferentes documentos na BDTD que tambm
foram representados sob a categoria C7 em diferentes facetas (C7.1, C7.2 e C7.3). Dessa
forma, ao escolher a categoria C7, o usurio ter disposio todos os documentos
representados sob essa categoria.
Com a utilizao da taxonomia facetada para a representao do teor dos
documentos do corpus (listados no APNDICE A, p.172), esses contedos tornam-se
interrelacionados dentro da estrutura facetada, de forma multidimensional. A FIG. 12 mostra
uma interrelao hipottica entre diferentes categorias.
FIGURA 12 Relao entre categorias

Fonte: Adaptado de Sacco e Tzitzicas (2009, p. 22 e 32).

137

Conforme a FIG. 12, atravs da navegao na taxonomia facetada, o usurio


pode explorar todo o conjunto de categorias. Em uma situao, por exemplo, em que o
usurio selecione a categoria C3 para a busca, a FIG. 13 mostra o que o sistema apresenta
como resultado para essa busca.
FIGURA 13 Relao direta entre categorias e documentos

Fonte: Adaptado de Sacco e Tzitzicas (2009, p. 22 e 32).

A FIG. 13 mostra que a categoria C3 possui duas facetas, que esto diretamente
relacionadas com os documentos t002-2009, t003-2008 e t004-2008. Entretanto, como os
documentos so representados sob todas as categorias da taxonomia facetada, o resultado
para o usurio expandido, permitindo que esse usurio possa explorar um conjunto maior
de temas relacionados com os documentos recuperados, como mostrado na FIG. 14.

138

FIGURA 14 Relao expandida entre categorias e documentos

Fonte: Adaptado de Sacco e Tzitzicas (2009, p. 22 e 32).

Observando a FIG. 14, nota-se que a taxonomia facetada permite que o usurio
explore todas as categorias e facetas sob as quais os documentos (t002-2009, t003-2008 e
t004-2008) foram representados. A FIG. 15 mostra como apresentado o resultado ao
usurio.
FIGURA 15 Resultado das interrelaes disponveis para recuperao

Fonte: Adaptado de Sacco e Tzitzicas (2009, p. 22 e 32).

139

Nota-se que somente apresentado ao usurio o que efetivamente est


interrelacionado e disponibilizado no banco de dados. Com isso, o usurio tem sua
disposio a possibilidade de combinar suas buscas, sem encontrar como resultado uma
resposta vazia, pois somente so apresentadas a ele as opes que esto disponveis na
BDTD.
Concluda a demonstrao da modelagem informacional criada, a seguir
apresenta-se a visualizao de uma busca atravs da TAFNAVEGA.
Demonstrao emprica da implementao tecnolgica
Abaixo se apresenta um exemplo hipottico de busca a partir da taxonomia
facetada navegacional (TAFNAVEGA).
FIGURA 16 Busca usando a TAFNAVEGA (1)

Fonte: Tela da implementao tecnolgica no MSAccess.

Nessa busca, conforme FIG. 16, o pesquisador tem 41 documentos disponveis,


que so todo o universo referente ao corpus (1). O universo est classificado sob as 10
categorias da TAFNAVEGA (2), estabelecidas a partir da estrutura textual dos trabalhos

140

acadmicos do tipo teses e dissertaes. Dentre as diferentes opes, o pesquisador


escolhe a categoria tipo de pesquisa, que lhe oferece 10 qualificaes diferentes para
escolha. Se o pesquisador optar pela faceta comparativa, o resultado ser como mostra a
FIG.17.
FIGURA 17 Busca usando a TAFNAVEGA (2)

Fonte: Tela da implementao tecnolgica no MSAccess.

Conforme se observa na FIG. 17, o universo (seta verde) agora so os cinco


documentos que foram classificados sob a faceta comparativa (seta vermelha). O sistema
recupera e apresenta os cinco documentos disponveis (resultado da busca) e o
pesquisador ainda pode associar sua busca a outros tipos de pesquisa (descritiva,
qualitativa e quantitativa). Alm disso, h ainda a possibilidade de escolher entre todas as
opes de busca dentro da chave.
Vale ressaltar, que todas as 10 categorias deveriam oferecer pelo menos cinco
opes de documentos, uma vez que o nmero de documentos disponvel. Entretanto,

141

algumas categorias apresentam opes menores (ex. ambientao, coleta de dados e


mtodos) devido incompletude dos resumos informativos utilizados na extrao de
conceitos nesta experincia (mencionada no item 5.3.4). Contudo, numa situao real de
uso deste prottipo, todos os documentos so classificados sob as 10 categorias. Com isso,
possvel buscar os contedos dos documentos atravs da navegao, facilitando o acesso
aos resultados detalhados das pesquisas.
Ainda no caso hipottico da busca acima, se o pesquisador quiser recuperar
apenas os documentos classificados sob a faceta comparativa, mas somente aqueles nos
quais a pesquisa tenha sido realizada em uma abordagem qualitativa, isso seria facilmente
recuperado, como mostra a FIG. 18.
FIGURA 18 Busca usando a TAFNAVEGA (3)

Fonte: Tela da implementao tecnolgica no MSAccess.

Nota-se que o universo, agora, possui somente dois documentos (seta verde).
Analisando o conjunto percebe-se, por exemplo, que esses dois documentos (resultado da
busca) possuem tipo de pesquisa comparativa, que tambm so qualitativa (seta
vermelha). Nota-se que, novamente, que o pesquisador tem sua disposio outras opes

142

de busca (dentro da chave), podendo restringir sua busca (selecionando a faceta descritiva
ou quantitativa) ou, ainda, associ-la com as outras categorias disponveis.

No presente captulo foi relatado o desenvolvimento da taxonomia facetada


navegacional (TAFNAVEGA), criada com base na estrutura textual de documentos do tipo
teses e dissertaes. Esse relato incluiu a identificao do domnio, do usurio e de suas
necessidades de informao, assim como as descries dos procedimentos utilizados, a
apresentao e a anlise dos resultados, que demonstraram como esse mecanismo auxilia
o usurio na busca por informaes sobre os resultados das pesquisas disponibilizadas na
BDTD do PPGCI-UFMG.
A seguir, ser apresentado um breve relato sobre o resultado encontrado na
comparao entre a aplicao da tcnica da anlise categorial temtica (ACT) e a anlise
facetada (AF), discutida no Captulo 4, subcaptulo 4.6.1, mostrando a relao existente
entre as categorias fundamentais de Ranganathan, do CRG e as dez categorias
fundamentais temticas (CAFTE) determinadas pela aplicao da ACT neste Captulo5.

5.6 Paridade entre as categorias fundamentais de Ranganathan, CRG e


da TAFNAVEGA
Neste subcaptulo analisam-se as similaridades e correspondncias ressaltadas
entre as categorias fundamentais temticas (CAFTE) da taxonomia facetada navegacional
(TAFNAVEGA), encontradas com a aplicao da tcnica de anlise categorial temtica e as
categorias fundamentais de Ranganathan e do CRG. Adverte-se, entretanto, que esta uma
viso particular da preponente, conforme QUADRO 13.
QUADRO 13 Paridade entre as categorias de Ranganathan, CRG e CAFTE
RANGANATHAN

CRG

ACT (CAFTE)

Personalidade

Tipos de Produto Final

Objeto
Resultados
Tema

Matria

Partes
Materiais
Propriedades

Escopo
Fundamento
histrico/contextual
Tipo de pesquisa

Energia

Processos
Operaes
Agentes

Coleta de dados
Fundamento terico
Mtodos

Espao

Espao

Ambientao

Tempo

Tempo

(j h busca por data na


BDTD)

Fonte: Elaborado pela autora.

143

Em seus estudos, Ranganathan descreve que a categoria mais difcil de


identificar a categoria Personalidade. No QUADRO 13, nota-se que as CAFTE Objeto,
Resultados e Tema podem ser considerados Personalidade, pois a primeira configura o
objeto emprico utilizado, a segunda, o assunto tratado e, a terceira, um produto final criado
a partir dos procedimentos oriundos do campo Energia. possvel perceber, ainda, que o
Objeto e o Tema podem ser considerados tipos de produtos final, pois exercem influncia
no modo de conduzir a pesquisa, e o item Resultados refere-se a um produto obtido em
decorrncia de tudo que foi desenvolvido na investigao, tornando-se uma Personalidade
do estudo. Quanto aos outros, no difcil acomodar, porque no item Matria so inseridos
os elementos que caracterizam a pesquisa e o campo Energia composto por tudo que
utilizado como aes no decorrer da pesquisa. O Espao (lugar), pela sua obviedade,
dispensa explicaes e o Tempo est coberto pelas opes de busca j existentes na
BDTD.
Por ocasio desses apontamentos, concebvel a afirmao de que as
categorias no surgem por encanto, pois so consequncia de um olhar especfico do
pesquisador e pela abordagem ao texto. Assim, determinar o objetivo (o que) e a finalidade
(para quem) essencial em um trabalho de categorizao de um domnio, assim como para
o fornecimento de um servio de informao. Por esse motivo, acredita-se que o
entendimento do texto, o que o texto fala, est induzido pelo olhar lanado a ele. Nesse
sentido, o olhar desta pesquisa recaiu sobre a estrutura textual dos trabalhos acadmicos do
tipo teses e dissertaes.
Nesse percurso, ainda significativo destacar que a sequncia dos termos
dentro de cada categoria respeitar a ordem alfabtica, uma vez que a ordem no tem
qualquer influncia nos resultados da recuperao da informao em ambiente digital. A
listagem alfabtica facilitar a busca e a navegao pelo usurio, pois padroniza a ordem de
entrada e, assim, a forma apresentada na estrutura. Alm disso, auxiliar aquele usurio
que tenha menor conhecimento sobre o tema buscado. Com isso, atende-se ao requisito de
sequncia relevante e til do CRG e de Ranganathan. Alm disso, obedece tambm lei da
imparcialidade (RANGANATHAN, 1967, p.125), no beneficiando, arbitrariamente, qualquer
outra ordem de importncia.
Finalizando este captulo de descrio de procedimentos e de anlise dos
resultados, passa-se apresentao das consideraes finais desta pesquisa e as

sugestes de trabalhos futuros.

144

6 CONSIDERAES FINAIS
A presente pesquisa iniciou-se com a perspectiva de priorizar o atendimento s
necessidades de informao do usurio da biblioteca digital de teses e dissertaes (BDTD),
com recorte nos trabalhos defendidos na linha de pesquisa de Organizao e Uso da
Informao (OUI), no Programa de Ps-Graduao em Cincia da Informao da Escola de
Cincia da Informao (ECI) da UFMG. Para tanto, foi necessrio identificar as
caractersticas do domnio, do usurio e do que precisa em termos informacionais. Nesse
sentido, o uso da teoria da anlise de domnio (TAD) mostrou-se adequado para indicar a
comunidade de discurso que produz e usa o tipo de informao contida nesses trabalhos
acadmicos. A abordagem scio-cognitiva da TAD, tambm utilizada para expor o usurio e
suas necessidades de informao, levou ao entendimento pragmtico de que o fluxo da
informao produzida nessa comunidade de discurso, que a comunidade cientfica, tem
um sentido prtico de produo e de uso. A partir da aplicao da TAD, definiu-se que o
produtor e o usurio da BDTD so os pesquisadores (ou cientistas) em exerccio de
atividade profissional.
Dentro desse contexto, entende-se que todo pesquisador membro da
comunidade cientfica. Ele busca a aprovao de seus pares e segue procedimentos
metodolgicos ordenados e sistemticos na produo de seus trabalhos acadmicos. Toda
pesquisa construda a partir de um conhecimento anterior e, como consequncia, a
facilidade de acesso, a disponibilidade e a visibilidade desse conhecimento anterior torna a
produo cientfica mais eficiente e menos redundante. Acredita-se que a cincia avana na
medida em que h um processo de construo de conhecimento, maximizado pela
comunicao do conhecimento j edificado. Sendo assim, o texto produzido pelo cientista
expressa um significado e um objetivo comunicativo dentro de sua comunidade discursiva,
que, por sua vez, exerce certo controle sobre os procedimentos que so seguidos por esse
cientista na produo do seu texto cientfico.
A reviso de literatura realizada neste estudo demonstrou que a abordagem da
navegao facetada empregada desde o final da dcada de 90, como soluo de
explorao, busca e recuperao de informaes na Web utilizando, principalmente, a
determinao de categorias de forma automatizada. Essa caracterstica muitas vezes se
deve ao fato de serem projetos oriundos de reas como a Cincia da Computao,
Engenharia de Software e Informtica, campos nos quais h forte apelo para solues
tecnolgicas automticas. Entretanto, encontram-se propostas, como a do FLAMENCO,
cujos metadados categoriais so atribudos de forma no automtica (manual), uma vez que
uma iniciativa para navegao em ambiente Web, porm, para colees mais restritas.

145

No mbito da Cincia da Informao (CI) brasileira, a literatura especializada


aborda a taxonomia como instrumento de representao para mapear uma rea de
conhecimento, geralmente empregado na entrada de dados nos sistemas de informao,
para a organizao e a classificao de registros do conhecimento. A reviso de literatura
indicou que os estudos realizados a partir dos princpios do mtodo da anlise facetada, na
elaborao de taxonomias ou classificaes facetadas, enfatizam seu uso mais como
modelo da lgica analtico-sinttica para a descrio dos contedos, visando recuperao
da informao, do que como um mecanismo de busca. Ademais, a taxonomia facetada pode
ser considerada uma cadeia de relaes conceituais, que tem tambm potencial valor para
uso na sada dos sistemas de informao, como um mecanismo para navegao, facilitando
a busca e a recuperao de informaes em bibliotecas digitais
Desde a dcada de 90 nota-se o avano nos servios oferecidos pelas
bibliotecas digitais e nas formas de gerenciamento do recurso informacional, tentando se
antecipar s necessidades dos usurios. Nas instituies de ensino superior, o aumento no
nmero de bibliotecas digitais de teses e dissertaes (BDTD) contribuiu para a
disponibilizao e o acesso a informaes acadmicas em formato digital. Como
consequncia dessas implementaes, espera-se a divulgao de resultados de pesquisas
j concludas, evitando-se esforos replicados e a perda de recursos intelectuais. Todavia,
no Brasil ainda no se notam esforos no sentido de fazer com que a busca e a recuperao
de informaes em BDTDs extrapolem as opes oferecidas por uma biblioteca tradicional.
Geralmente, as BDTDs oferecem dois tipos de opo de buscas: a busca
simples e a busca avanada. A opo da busca simples apresenta problemas relativos a
resultados com ambiguidades. Por outro lado, na opo de busca avanada os usurios se
deparam com barreiras tecnolgicas e psicolgicas, pois consideram esse tipo de busca de
difcil compreenso. Alm disso, o texto completo das teses e dissertaes disponibilizado
em formato Portable Document Format (PDF), o que impede que o sistema varra o seu
contedo durante as buscas e recupere seu contedo.
Ademais, a literatura especializada e os resultados da presente pesquisa
indicam problemas na atribuio insuficiente de palavras-chave em trabalhos acadmicos e
da elaborao incompleta de resumos informativos. Isso acarreta perda de informaes,
prejudicando a qualidade da recuperao de informaes.
Partindo dos problemas verificados nos resumos, o primeiro resultado
computado na presente pesquisa no fazia parte do escopo de objetivos propostos. Trata-se
de uma tabela para elaborao de resumos informativos, que pode ser utilizada para
orientar e auxiliar os autores e/ou indexadores na preparao desses resumos. Para isso,
basta que se extraiam as informaes a partir das instrues da tabela e, depois, constroi-se
um texto sem tpicos e em pargrafo nico, como exigido para um resumo informativo. O

146

uso dessa tabela pode vir a melhorar a qualidade dos resumos disponibilizados na BDTD e,
consequentemente, aprimorar a recuperao das informaes referentes aos documentos.
Para o desenvolvimento desta dissertao partiu-se do pressuposto de que era
possvel oferecer ao usurio da BDTD uma opo de busca fcil de usar e interpretar, com
informaes organizadas. Alm disso, a expectativa recaiu sobre o objetivo de dar maior
visibilidade ao conhecimento cientfico acumulado nas teses e dissertaes, oferecendo a
possibilidade de refinamento da busca do usurio, sem que ele fosse sobrecarregado com
informaes.
A taxonomia facetada para navegao (TAFNAVEGA) apresentada aqui
constituda por um conjunto de dez categorias fundamentais temticas (CAFTE) e pelos
conceitos (representados pelos termos) extrados pela anlise conceitual nos documentos
do corpus desta pesquisa, que compuseram as facetas da estrutura facetada da taxonomia.
A TAFNAVEGA foi desenvolvida dentro dos princpios da teoria da anlise facetada (TAF)
dos estudos de Ranganathan (1957) e das recomendaes do Classification Research
Group (CRG), que esto indicadas na simplificao apresentada por Spiteri (1998). A
validao do conjunto CAFTE foi realizada a partir do mtodo da Anlise de Contedo, com
a aplicao da tcnica da anlise categorial temtica (ACT). O uso da ACT mostrou-se
apropriada nesse procedimento, uma vez que o confrontamento realizado entre essa tcnica
e os fundamentos da TAF determinou o alto grau de similaridade entre elas. Essa
similaridade o que se denomina de similaridade funcional e de execuo. Na similaridade
funcional a TAF e a ACT comungam a funo de potencializar a estruturao e ordenao
das informaes do contedo das teses e dissertaes. J a similaridade de execuo est
relacionada aos processos metodolgicos lgicos executados para se chegar s categorias
fundamentais, conforme indicado no QUADRO 13.
As teses e dissertaes so produzidas em linguagem natural e de forma
semiestruturada, o que dificulta sua anlise conceitual. A representao desse tipo de
documento por meio do conjunto das CAFTE organizou e ordenou o contedo textual dos
trabalhos acadmicos, uma vez que estruturou esse tipo de documento em categorias,
respeitando-se a sua estrutura textual de produo. Dessa maneira, o conjunto das CAFTE
mostrou-se adequada, pois possibilitou o acesso a resultados detalhados das pesquisas tais
como temas, mtodos, instrumentos de coleta de dados e fundamentos tericometodolgicos. A estrutura facetada taxonmica agrupou os termos indexadores (extrados
dos documentos atravs do algoritmo) que compartilham caractersticas semelhantes,
transformando-os em facetas e subfacetas navegveis. Com isso, alcanou-se o objetivo de
oferecer informaes organizadas, pois elas foram arranjadas de uma forma fcil de
apreender.

147

Alm disso, o uso do vocabulrio controlado para a traduo dos termos


extrados dos documentos, ainda que no tenha sido criado especificamente para o contexto
desta pesquisa, permitiu compatibilizar as distintas linguagens naturais (o vocabulrio de
cada autor) utilizadas nos documentos do corpus da pesquisa. Essa compatibilidade
importante para oferecer uma estrutura temtica nica para o domnio, o que permitiu
interligar os diferentes documentos no sistema.
A visibilidade do contedo dos documentos foi obtida atravs do mapeamento do
contedo dos trabalhos acadmicos, o que foi demonstrado pela experincia realizada com
a TAFNAVEGA, no processo de extrao de conceitos dos documentos. Nessa experincia,
pela anlise dos resultados, foi possvel inferir, ainda que parcialmente, que as pesquisas na
linha OUI priorizam os temas relacionados com a organizao da informao, em
detrimento aos temas referentes ao uso da informao. Foi possvel, tambm, descobrir
que a maior parte das investigaes, nessa linha de pesquisa, baseia-se no mtodo
analtico-sinttico e na classificao facetada. Esses apontamentos evidenciaram, dentro
dos limites estabelecidos neste estudo, o estado da arte dos trabalhos acadmicos da
linha de pesquisa OUI. Acredita-se que o uso da TAFNAVEGA pode ser estendido a outras
linhas de pesquisas e a outras reas do conhecimento, ampliando o campo de aplicao
desse mecanismo.
A matriz categorial para trabalhos acadmicos (MCTCA) um produto que foi
desenvolvido neste estudo, a partir do Modelo de Leitura Documentria de Fujita e Rubi
(2006). O MCTCA um algoritmo de alto nvel, para uso humano, composto pelo conjunto
das CAFTE (primeira coluna) e por uma sequncia lgica e sistemtica de procedimentos. A
aplicao desse algoritmo culmina na obteno de metadados, que so os termos
indexadores obtidos pela anlise conceitual nos documentos, cujos termos alimentam a
TAFNAVEGA. Com sua utilizao na anlise dos documentos, o usurio ter acesso ao
documento que efetivamente possui o contedo que o termo indexado representa e no
simplesmente a um documento que contm (cita) tal termo.
A abordagem da navegao facetada criada na presente pesquisa segue o
princpio da rvore baniana, como um organismo vivo, pois tem uma perspectiva
multidimensional, quando atribui a um mesmo documento mais de uma dimenso (por ex.:
tema, ambientao, tipo de pesquisa), e outro sentido multidimensional, quando um mesmo
termo na estrutura leva a mais de um documento (por ex.: o termo comparativa leva a
todos os documentos que utilizaram esse tipo de pesquisa). Essa caracterstica torna a
busca facetada dinmica, com uma interface interativa, na qual o usurio pode visualizar e
explorar recursos informacionais, descobrindo o universo do contedo em questo e
refinando sua busca progressivamente, podendo, ainda, combinar uma ou mais dimenses.
Desse modo, o usurio sabe, exatamente, quais informaes esto disponveis no banco de

148

dados, e isso evita um resultado de busca vazio, minimiza a sobrecarga de informao e,


sobretudo, melhora a recuperao de informaes. Essa melhora obtida, porque o usurio
aproveitar os recursos de uma busca avanada, sem a necessidade de indicar as
combinaes lgicas, pois isso j se apresenta, semanticamente, implcito na estrutura
facetada.
Ainda importante destacar que esse mecanismo suporta novos termos sem
que perca a caracterstica de ser uma estrutura consistente, pois o sistema facetado
hospitaleiro e pode, e deve, ser sempre atualizado.
Ao longo desta pesquisa de mestrado, algumas questes enfrentadas mostraram
que h possibilidade de estudos futuros, tal como a realizao de cruzamento de dados
entre metodologias e teorias utilizadas nas pesquisas, incluindo-se, tambm, as outras duas
linhas de pesquisa da ECI-UFMG, enriquecendo a percepo sobre a natureza das prticas
de pesquisa realizadas nessa Escola. Outro ponto sugerido o estudo do uso de um
vocabulrio controlado na indexao de documentos acadmicos, visando determinar se
sua aplicao pode minimizar o problema de ambiguidade terminolgica percebida entre o
sistema e os diferentes atores, produtores de informao. Evidenciou-se, ainda, a
necessidade da criao de uma poltica de indexao que possa determinar o grau de
exaustividade e especificidade para a indexao de documentos do tipo teses e
dissertaes, como forma de padronizar os termos indexadores utilizados em sua descrio
temtica. Alm disso, indica-se verificar a viabilidade da criao de um aplicativo tecnolgico
capaz de padronizar a entrada de dados (metadados) conforme a matriz categorial temtica
para trabalhos acadmicos desenvolvida nesta pesquisa.
Finalmente, conclui-se que os pressupostos foram validados e os objetivos
alcanados, ao mesmo tempo que considera-se importante trazer o tema da abordagem da
navegao facetada, que ancorada nos princpios da classificao facetada, para o seio
da Cincia da Informao brasileira, especificamente para o campo da Organizao e Uso
da Informao (OUI), tendo em vista que o objeto j bastante investigado na literatura
estrangeira. Na sociedade contempornea, a informao primordial para a criao de
novos conhecimentos, e para isso preciso estabelecer a transferncia dessa informao
para a comunidade de usurios que a busca. Ao propor o mecanismo de acesso a
taxonomia facetada navegacional auxilia-se nessa busca e recuperao, pois agrega-se
valor informao ao oferec-la de forma estruturada e ordenada. Avalia-se que essa a
maior contribuio da presente pesquisa: a demonstrao do papel da taxonomia facetada
para a visualizao, explorao e obteno de informaes relevantes dos resultados das
pesquisas comunidade acadmica. Nesse sentido, o recurso informacional que est
obscuro e pulverizado no contedo textual dos documentos, tais como teorias, ferramentas,
mtodos e tcnicas, pode ser mais facilmente comunicado, o que permitir um avano na

149

rea da Cincia da Informao, sobretudo no sentido de ajudar a perceber o estado da


arte de um domnio investigado. Atualmente, as teses e dissertaes j so inseridas no
sistema de forma manual, e acoplar o aplicativo ao sistema no representa problema, pois
ele est sendo desenvolvido em linguagem compatvel com a linguagem empregada pela
BDTD. Dessa forma, ao inserir os documentos na base de dados, todos os campos do
conjunto das dez categorias da TAFNAVEGA podem ser preenchidos, o que permitir
interrelacionar documentos e informaes, auxiliando o acesso, a recuperao e a
reutilizao dos resultados detalhados das pesquisas.
luz dessas consideraes, entende-se que os resultados encontrados neste
estudo podem impactar positivamente o processo de comunicao cientfica a partir do
acesso s informaes contidas nas teses e dissertaes e disponibilizadas na BDTD.

150

REFERNCIAS
AAKER, D.; KUMAR, V.; DAY, G. S. Marketing research. Hoboken, NJ: Wiley, 1995.
AHLBERG, C.; SHNEIDERMAN, B. Visual information seeking: tight coupling of dynamic
query filters with starfield displays. In: SIGCHI CONFERENCE ON HUMAN FACTORS IN
COMPUTING SYSTEMS: Celebrating Interdependence, Boston, MA, USA, Apr. 24-28,
1994. Proceedings New York: ACM, 1994. p. 313-317. Disponvel em:
<http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.123.805>. Acesso em: 12 mar.
2011.
ALBRETCHTSEN, H. Subject analysis and indexing: from automated indexing to domain
analysis. The Indexer, London, v.18, n. 4, p. 219-24, 1993.
ALVARADO, Rubn U.; OLIVEIRA, Marlene. A Comunidade cientfica da Biblioteconomia e
Cincia da Informao brasileira. Pesquisa Brasileira em Cincia da Informao e
Biblioteconomia, v. 3, n. 2, 2008. Disponvel em:
<http://revista.ibict.br/pbcib/index.php/pbcib/article/view/1051>. Acesso em: 12 jan. 2011.
ALVES, Rachel C. V. et al. Cincia da Informao, Cincia da Computao e Recuperao
da Informao: algumas consideraes sobre os mtodos e tecnologias da informao
utilizados ao longo do tempo. Revista Eletrnica Informao e Cognio, Marlia, SP, v.6,
n.1, p.28-40, 2007.
ANDERSON, J. D.; HOFMANN, M. A. A fully faceted syntax for Library of Congress subject
headings. Cataloging & Classification Quarterly, v. 43, n. 1, p. 7-38, 2006.
ARAJO, Carlos Alberto vila. Anlise temtica da produo cientfica em comunicao no
Brasil baseada em um sistema classificatrio facetado. 2005. 427f. Tese (Doutorado em
Cincia da Informao) Escola de Cincia da Informao, Universidade Federal de Minas
Gerais, Belo Horizonte, 2005.
ARAJO, Samur F. C. de. Explorator: ferramenta para explorao de dados RDF baseado
em uma interface de manipulao direta. 2009. 127f. Dissertao (Mestrado em Informtica)
Departamento de Informtica, Pontifcia Universidade Catlica do Rio de Janeiro, Rio de
Janeiro, 2009. Disponvel em: <http://www.maxwell.lambda.ele.pucrio.br/Busca_etds.php?strSecao=resultado&nrSeq=13792@1>. Acesso em: 12 mar. 2011.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 12676. Mtodos para anlise
de documentos: determinao de seus assuntos e seleo de termos de indexao. Rio de
Janeiro, 1992.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR10520. Informao e
documentao: citaes em documentos: apresentao. Rio de Janeiro, 2002.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR12225. Informao e
documentao: lombada: apresentao. Rio de Janeiro, 2004.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR14724. Informao e
documentao: trabalhos acadmicos: apresentao. Rio de Janeiro, 1992.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR14724. Informao e
documentao: trabalhos acadmicos: apresentao. Rio de Janeiro, 2005.

151

ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR14724. Informao e


documentao: trabalhos acadmicos: apresentao. Rio de Janeiro, 2011.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR6023. Informao e
documentao: referncias: elaborao. Rio de Janeiro, 2002.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR6024. Informao e
documentao: numerao progressiva das sees de um documento escrito:
apresentao. Rio de Janeiro, 2003.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR6027. Informao e
documentao: sumrio: apresentao. Rio de Janeiro, 2003.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR6028. Informao e
documentao: resumo: apresentao. Rio de Janeiro, 2003.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR6034. Informao e
documentao: ndice: apresentao. Rio de Janeiro, 2004.
BAEZA-YATES, Ricardo; RIBEIRO-NETO, Berthier Modern Information retrieval. New York:
Addison-Wesley, 1999.
BARDIN, Laurence. Anlise de contedo. 4. ed. rev. e atual. Lisboa: Edies 70, 2009.
BARQUN, Beatriz A. R.; MOREIRO GONZLEZ, Jos Antonio; PINTO Adilson L.
Construo de uma ontologia para sistemas de informao empresarial para a rea de
telecomunicaes. DataGramaZero Rev. Ci. Inf. Rio de Janeiro, v. 7, n. 2, abr. 2006.
BONILLA, Maeia Helena Silveira. Escola aprendente: para alm da sociedade da
informao. Rio de Janeiro: Quartet, 2005. p. 139.
BORKO, H. Toward a theory of indexing. Information Processing and Management, v. 13, p.
355-365, 1977.
BORKO, H.; CHATMAN, S. Criteria for acceptable abstracts: a survey of abstractors
instructions. American Documentation, v.14, p.149-160, 1963.
BORKO, Harold. Information science: what is it? American Documentation, Washington, v.
19, n. 1, p. 3-5, jan. 1968. Disponvel em: <http://www.cas.usf.edu/lis/lis6260/
lectures/infosci.htm>. Acesso em: 2 jul. 2007.
BRASIL. Ministrio da Educao. CAPES. Portaria 13. 2006. Disponvel em:
<http://www.abmes.org.br/legislacao/2006/portarias.asp>. Acesso em: 22 mar. 2010.
BREEDING, Marshall. The birth of a new generation of library interfaces. Computers in
Libraries, v. 27, n. 9, p. 34-37, Oct. 2007.
BROUGHTON, Vanda. The need for a faceted classification as the basis of all methods of
information retrieval. Aslib Proceedings: New Information Perspectives, v. 58, n. 1-2, p. 4972, 2006.
BUCKLAND, Michel. Information as thing. Journal of American Society of Information
Science, v. 42, n. 5, p. 351-360, 1991.
CAO, Rosrio. Anlise Qualitativa de Dados com o NVIVO. 31 de out. 2008. Disponvel
em: <http://slidesha.re/11XyZq>. Acesso em: 12 mar. 2011.

152

CAF, Lgia Maria A.; BRATFISCH, Aline. Classificao analtico-sinttica: reflexes


tericas e aplicaes. TransInformao, Campinas, v. 19, n. 3, p. 237-250, set./dez. 2007.
CALHOUN, K. The changing nature of the catalog and its integration with other discovery
tools. 2006. Disponvel em: <www.loc.gov/catdir/calhoun-report-final.pdf>. Acesso em: 12
mar. 2011.
CAMPOS, Claudinei Jos G. Mtodo de anlise de contedo: ferramenta para a anlise de
dados qualitativos no campo da sade. Rev. Bras. Enferm., Braslia, DF, v. 57, n. 5, p. 611614, set./out. 2004.
CAMPOS, Maria Luiza de A. Modelizao de domnios de conhecimento: uma investigao
de princpios fundamentais. Ci. Inf. Braslia, DF, v. 33, n. 1, 2004. Disponvel em:
<http://revista.ibict.br/index.php/ciinf/article/view/56/52>. Acesso em: 22 abr. 2010.
CAMPOS, Maria Luiza de A.; GOMES, Hagar Espanha. Taxonomia e classificao: o
princpio de categorizao. DataGramaZero Rev. Ci. Inf. Rio de Janeiro, v. 9, n. 4, ago.
2008. Disponvel em: <http://www.datagramazero.org.br/ago08/Art_01.htm>. Acesso em: 21
jun. 2009.
CAPRA, R.; MARCHIONINI, G. The relation browser tool for faceted exploratory search. In:
CONFERENCE ON DIGITAL LIBRARIES JCDL08, Pittsburgrgh, Pennsylvannia, 2008.
Proceedings Pittsburgrgh, Pennsylvannia, jun. 2008. p. 16-20. Disponvel em:
<http://portal.acm.org/citation.cfm?id=1378967>. Acesso em: 15 mar. 2011.
CAPURRO, R. Epistemologia e Cincia da informao. In: ENCONTRO NACIONAL DE
PESQUISA EM CINCIA DA INFORMAO, 5., Belo Horizonte, 2003. Anais... Belo
Horizonte: Escola de Cincia da Informao da UFMG, 2003.
CASE, D. O. Looking for information: a survey of research on information seeking, needs
and behavior. San Diego, CA: Elsevier Academic, 2002. Disponvel em:
<http://books.google.com.br/>. Acesso em: 18 mar. 2011.
CONKLIN, Jeff. Hipertext: an introduction and survey. In: GREIF, Irene (Ed.). Computersupported cooperative work: a book of reading. San Mateo, CA: Morgan Kaufmann, 1988. p.
423-476. Disponvel em:
<http://books.google.com.br/books?id=4oVMJ1vi8lkC&printsec=frontcover#v=onepage&q&f=
false>. Acesso em: 14 mar. 2011.
CONWAY, Susan; SLIGAR, Char. Building taxonomies. In: ______. Unlocking knowledge
assets. Redmont: Microsoft Press, 2002. cap. 6.
COSTA, Fernanda C. da; RAMOS, Luciene B. Anlise facetada: em busca de uma
classificao para o teatro. Ponto de Acesso, Salvador, v. 2, n. 3, p. 30-42, dez. 2008.
CUNHA, M. B. da; CAVALCANTI, Cordlia R. de O. Dicionrio de Biblioteconomia e
Arquivologia. Braslia, DF: Briquet de Lemos, 2008.
CUNHA, Murilo Bastos. Desafios na construo de uma biblioteca digital. Ci. Inf., Braslia, v.
28, n. 3, p. 255-266, set./dez 1999.
CURRS, Emilia. Tesauros: linguagens terminolgicas. Braslia: IBICT, 1995.
DAHLBERG, I. Teoria da classificao: ontem e hoje. In: CONFERNCIA BRASILEIRA DE
CLASSIFICAO BIBLIOGRFICA, Rio de Janeiro, 12-17 de setembro de 1972, Braslia.
Anais... Braslia: IBICT/ABDF, v. 1, 1979. Disponvel em:

153

<http://www.conexaorio.com/biti/dahlbergteoria/dahlberg_teoria.htm>. Acesso em: 12 abr.


2010.
DAHLBERG, Ingetraut. Fundamentos terico-conceituais da classificao. R. Bibliotecon.,
Braslia, v. 6, n. 1, jan./jun. 1978. Disponvel em:
<http://www.tempusactas.unb.br/index.php/RBB/article/viewFile/206/187>. Acesso em: 22
mar. 2010.
DEMO, Pedro. Metodologia do conhecimento cientfico. So Paulo: Atlas, 2000.
DIAS, Clia da Consolao. Anlise do domnio organizacional na perspectiva arquivstica:
potencialidade no uso da Metodologia DIRKS Designing and Implementing Redordkeeping
Systems. 2010. 333f. Tese (Doutorado em Cincia da Informao) Escola de Cincia da
Informao, Universidade Federal de Minas Gerais, Belo Horizonte, 2010.
DIAS, Eduardo W; NAVES, Madalena M. L. Anlise de assunto: teoria e prtica. Braslia:
Thesaurus, 2007.
DOAN, K.; PLAISANT, C.; SHNEIDERMAN, B. Query previous in networked information
systems. In: INTERNATIONAL FORUM ON RESEARCH AND TECHNOLOGY ADVANCES
IN DIGITAL LIBRARIES, 3., 1995, Washington. Proceedings Washington, DC: IEEE
Computer Society, 1995. Disponvel em:
<http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.28.9728>. Acesso em: 12 mar.
2011.
DODEBEI, Vera Lcia D. Tesauro: linguagem de representao da memria documentria.
Niteri: Intertexto, 2002.
ELIEL, Regiane Alcntara. Institucionalizao da cincia da informao no Brasil: estudo da
convergncia entre a produo cientfica e os marcos regulatrios da rea.
TransInformao, Campinas, v. 20, n. 3, p. 207-224, set./dez. 2008. Disponvel em:
<http://biblioteca.ricesu.com.br/art_link.php?art_cod=6347>. Acesso em: 12 abr. 2010.
ENGLISH, Jennifer et al. Flexible search and navigation using faceted metadata. The
Flamenco Search Interface Project, National Science Foundation. [Paper]. 2002. Disponvel
em: <flamenco.berkeley.edu/papers/flamenco02.pdf>. Acesso em: 12 mar. 2011.
FAGAN, Jody C. Usability studies of faceted browsing: a literature review. Information
Technology and Libraries, v. 29, n. 2, p. 558-66, Jun. 2010.
FERNEDA, Edberto. Recuperao da informao: anlise sobre a contribuio da Cincia
da Computao para a Cincia da Informao. 2003.147f. Tese (Doutorado em Cincia da
Comunicao) Escola de Comunicao e Artes, Universidade de So Paulo, So Paulo,
2003.
FERREIRA, Aurlio B. de H. Novo dicionrio Aurlio da lngua portuguesa. Rio de Janeiro:
Nova Fronteira, 1988.
FERREIRA, Aurlio B. de H. Novo dicionrio Aurlio da lngua portuguesa. 4. ed. Curitiba:
Positivo, 2009.
FIGUEIRA NETTO, Silvino C. A comunicao cientifica atravs de rede de computadores; a
experincia de pesquisadores brasileiros. 1994. 161f. Dissertao (Mestrado em Cincia da
Informao) Universidade Federal do Rio de janeiro. Rio de Janeiro, 1994.

154

FIGUEIREDO, Messias B. et al. Biblioteca hbrida especializada em gesto social: projeto


piloto. In: SIMPSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 2., Campinas, 2004.
Anais... Campinas: 2004. Disponvel em: <http://libdigi.unicamp.br/document/?view=8294>.
Acesso em: 14 abr. 2010.
FIGUEIREDO, N. M. Da necessidade de promover o uso da informao. Ci. Inf., v.6, n.1,
p.75-79, 1987.
FIGUEIREDO, Saulo. A taxonomia na gesto estratgicas das empresas. [S.l.]: Webinsider,
7 dez. 2006. Disponvel em: <http://webinsider.uol.com.br/index.php/2006/12/07/ataxonomia-na-gestao-estrategica-das-empresas/>. Acesso em: 19 abr. 2010.
FRANCO, Maria Laura P. B. Anlise de contedo. 3. ed. Braslia: Liber Livro, 2008. (Srie
Pesquisa, 6).
FUJITA Maringela S. L.; RUBI, Milena P. Um modelo de leitura documentria para a
indexao de artigos cientficos: princpios de elaborao e uso para a formao de
indexadores. DataGramaZero Rev Ci. Inf., Rio de Janeiro, v. 7, n. 3, jun. 2006. Disponvel
em: <http://www.dgz.org.br/jun06/Art_04.htm>. Acesso em: 22 abr. 2010.
FUJITA, Maringela S. L. A leitura documentria do indexador: aspectos cognitivos e
lingsticos influentes na formao do leitor profissional. 2003. 321f. Tese (Livre-Docncia
nas disciplinas Anlise Documentria e Linguagens Documentrias Alfabticas) Faculdade
de Filosofia e Cincias, Universidade Estadual Paulista, Marlia, SP, 2003.
FURTADO, Jos Afonso. Hipertexto revisited. Letras de Hoje, Porto Alegre, v. 45, n. 2, p.
31-55, abr./jun. 2010.
GIL LEIVA, Isidoro; FUJITA, Maringela S. L.; RUBI, Milena P. Consistncia na indexao
em bibliotecas universitrias. TransInformao, Campinas, v. 20, n. 3, p. 233-253, set./dez.
2008.
GIL, A. C. Mtodos e tcnicas de pesquisa social. 4. ed. So Paulo: Atlas, 1994. 207p.
GROLIER, Eric de. tude sur les catgories gnrales applicables aux classifications et
codifications documentaires. Paris: UNESCO, 1962.
GRUBER, T. R. What is an Ontology?. 1996. Disponvel em: <http://wwwksl.stanford.edu/kst/what-is-an-ontology.html>. Acesso em: 18 jun. 2010.
GUIMARAES, J. A. C. Perspectiva de ensino e pesquisa em organizao do conhecimento
em cursos de Biblioteconomia: uma reflexo. In: CARRARA, K. (Org.). Educao,
Universidade e Pesquisa. Marlia: UNESP Marlia, FAPESP, 2001, p. 61-74.
GUIZZARDI, G. Ontological foundations for structural conceptual models. Twente,
Netherlands: University of Twente, Netherlands, 2005.
HANSEN, M. H.; HURWITZ, W. N.; MADOW, W. G. Sample survey methods and theory.
New York; Chichester: Wiley, 1996. v.1.
HEARST, M. A, Next generation web search: setting our sites. IEEE Data Engeneering
Bulletim, v. 23, n. 3, p. 38-48, 2000. Disponvel em:
<http://people.ischool.berkeley.edu/~hearst/papers/data-engineering/>. Acesso em: 15 mar.
2011.

155

HEUSELER, Fbio M. Uma abordagem multifacetada para explorao integrada de dados


estruturados e no-estruturados em ambientes OLAP. 2010. 131f. Dissertao (Mestrado
em Informtica) Instituto de Matemtica, Ncleo de Computao Eletrnica, Universidade
Federal do Rio de Janeiro, Rio de janeiro, 2010.
HJORLAND, B. Domain analysis in information science: eleven approaches: traditional as
well as innovative. Journal of Documentation, v. 58, n. 4, p. 422-462, 2002a.
HJORLAND, B. Epistemology and the socio-cognitive perspective in information science.
Journal of the American Society for Information Science and Technology - JASIST, v. 53, n.
4, p. 257-270, 2002b.
HJORLAND, B.; ALBRECHTSEN, H. Toward a new horizon in information science: domain
analysis. Journal of the American Society for Information Science - JASIS, v. 46, n. 6, p. 400425, 1995.
HYVNEN, Eero et al. Finnish museums on the semantic web: the users perspective on
MuseumFinland. In: MUSEUMS AND THE WEB, 2004. Papers Helsinki, Institute for
Information Technology, University of Helsinki. Finland: HIIT, 2004. Disponvel em:
<http://www.archimuse.com/mw2004/papers/hyvonen/hyvonen.html#ixzz1Lp3Tut8V>.
Acesso em: 20 mar. 2011.
JUGEND, D.; SILVA, S. L. da. Gesto do processo de desenvolvimento de produto: um
estudo comparativo entre empresas de base tecnolgica do setor de automao industrial.
In: Encontro Nacional de Engenharia de Produo ENEGEP, 25., 2005, Porto Alegre.
Anais... Porto Alegre: ABEPRO, 2005.
KOBASHI, N. Y. A elaborao de informaes documentrias: em busca de uma
metodologia. 1994. 195f. Tese (Doutorado em Cincias da Comunicao) Escola de
Comunicaes e Artes, Universidade de So Paulo, So Paulo, 1994.
KRUK, S. R.; DECKER, S.; ZIEBORAK, L. JeromeDL: reconnecting digital libraries and the
semantic web. Chiba, Japan: [s. n.], 2005. Disponvel em:
<http://www.marcont.org/marcont/pdf/www2005_jeromedl.pdf>. Acesso em: 14 jan. 2010.
KUHN, Thomas S. A tenso essencial. 9. ed. Lisboa: Edies 70, 2006.
KURAMOTO, Hlio. Uma abordagem alternativa para o tratamento e a recuperao de
informao textual: os sintagmas nominais. Ci. Inf., Braslia, v. 25, n. 2, 1995.
KWASNICK, Barbara H. The role of classification in knowledge representation and
discovery. Library Trends, v. 48, n. 1, p. 22-47, 1999. Disponvel em:
http://findarticles.com/p/articles/mi_m1387/is_1_48/ai_57046525>. Acesso em: 16 ago.
2009.
LACHTIM, Fernanda Aparecida. Organizao e instanciao automtica de contedos em
portais Semnticos. 2008. 192f. Dissertao (Mestrado em Cincia da Computao)
Instituto Militar de Engenharia do Rio de Janeiro, Rio de Janeiro, 2008.
LAMBE, Patrick. Organising Knowledge: taxonomies, knowledge and organizational
effectiveness. Oxford, England: Chandos, 2007. 277p.
LANA, Sergio V. de. Planejamento de pesquisa: uma introduo elementos para uma
anlise metodolgica. 2. ed. So Paulo: EDUC, 2009.

156

LANCASTER, F. W. Princpios da indexao In: ______. Indexao e resumos: teoria e


prtica. Braslia: Briquet de Lemos, 1993, cap. 2.
LANCASTER, F. W.; WARNER, A. J. Information retrieval today. Arlington, Va: Information
Resources, 1993.
LEMOS, Antnio A. B. de. Bibliotecas. In: CAMPELLO, Bernadete S.; CALDEIRA, Paulo da
T.; MACEDO, Vera Amlia A.. Formas e expresses do conhecimento: introduo s fontes
de informao. Belo Horizonte: Escola de Biblioteconomia da UFMG, 1998. p. 345-366.
LIMA, G. A. B. O. Mapa hipertextual (MHTX) um modelo para a organizao hipertextual de
documentos. 2004. 199f. Tese (Doutorado em Cincia da Informao) Escola de Cincia
da Informao, Universidade Federal de Minas Gerais, Belo Horizonte, 2004a.
LIMA, Gercina ngela B. de O. O modelo simplificado para anlise facetada de Spiteri a
partir de Ranganathan e do Classification Research Group (CRG). Inf. Cult. Soc., Ciudad
Autnoma de Buenos Aires, n. 11, jul./dic. 2004b.
LIMA, Vnia Mara A. de et al. Estudos para implantao de ferramenta de apoio gesto de
linguagens documentrias: vocabulrio controlado da USP. TransInformao, Campinas, v.
18, n. 1, p. 17-25, jan./abr., 2006.
LIMA, Vnia Maria A.; BOCCATO, Vera Regina C. O desempenho terminolgico dos
descritores em Cincia da Informao do Vocabulrio Controlado do SIBi/USP nos
processos de indexao manual, automtica e semi-automtica. Perspect. Cinc. Inf., v. 14,
n. 1, p. 131-151, jan./abr. 2009.
LLORNS, Juan et al. Automatic generation of domain representations using thesaurus
structures. Journal of the American Society for Information Science and Technology, v. 55, n.
10, p. 846-858, 2004.
LOPES, Ilza Leite. Uso das linguagens controlada e natural em bases de dados: reviso da
literatura. Ci. Inf., v. 31, n. 1, 2002. Disponvel em:
<http://www.scielo.br/scielo.php?pid=S0100-19652002000100005&script=sci_arttext>.
Acesso em: 22 jun. 2010.
MACEDO, Neusa D. de; MODESTO, Fernando. Equivalncias: do servio de referncia
convencional a novos ambientes de redes digitais em bibliotecas. Revista Brasileira de
Biblioteconomia e Documentao: Nova Srie, So Paulo, v. 1, n. 1, p. 38-54, 1999.
MACHADO, Raymundo das Neves et al. Biblioteca do futuro na percepo de profissionais
da informao. TransInformao, v. 11, n. 3, p. 215-222, set./dez. 1999.
MALHOTRA, N. K. Pesquisa de Marketing: uma orientao aplicada. 3. ed. Porto Alegre:
Bookman, 2001.
MARCHIONINI, Gary. Designing hypertext; start with an index. In: FIDEL, Raya et al.
Challenges on indexing electronic text and images. Medford, NJ: ASIS, 1994. cap. 4, p. 7789.
MARCHIORI, Patrcia Zeni. Ciberteca ou biblioteca virtual: uma perspectiva de
gerenciamento de recursos de informao. Ci.Inf., Braslia, v. 26, n. 2, p. 115 - 124,
maio/ago. 1997.
MARCONI, M. A.; LAKATOS, Eva Maria. Fundamentos de metodologia cientfica. 7. ed. So
Paulo: Atlas, 2010.

157

MARCONI, M. A.; LAKATOS, Eva Maria. Tcnicas de pesquisa. 2. ed. So Paulo: Atlas,
1990.
MARTINEZ, A. et al. Las categoras o facetas fundamentales: una metodologa para el
diseo de taxonomas corporativas de sitios Web argentinos. Ci. Inf., Braslia, v. 33, n. 2, p.
106-111, maio/ago. 2004.
MELTON, Jessica. A use for the techniques of structural linguistics in documentation
research. Cleveland: Western Reserve University, 1964.
MENDES, Renata dos Santos. A importncia da adequada estruturao de resumo e
resenha. Revista Espao Acadmico, Maring, PR, n. 114, p. 135-140, nov. 2010.
Disponvel em: <http://periodicos.uem.br/ojs/index.php/EspacoAcademico/index>. Acesso
em: 2 fev. 2011.
MORAES, Roque. Anlise de Contedo. Revista Educao, Porto Alegre, v. 22, n. 37, p. 732, 1999.
MOREIRA, W. Biblioteca tradicional x biblioteca virtual: modelos de recuperao da
informao. 1998. 90f. Dissertao (Mestrado em Biblioteconomia), Pontifcia Universidade
Catlica de Campinas, Campinas, 1998.
MORVILLE, Peter; ROSENFELD, Louis. Information architecture for the World Wide Web.
3th ed. Sebastopol, CA: O'Reilly Media, 2006.
MUELLER, S. P. M. A cincia, o sistema de comunicao cientfica e a literatura cientfica.
In: CAMPELLO, Bernadete Santos; CENDN, Beatriz Valadares; KREMER, Jeanette
Marguerite. (Orgs.). Fontes de informao para pesquisadores e profissionais. Belo
Horizonte: Editora UFMG, 2000. p. 21-34.
NATIONAL INFORMATION STANDARDS ORGANIZATION. ANSI/NISO Z39.19-2005:
guidelines for the construction, format, and management of monolingual thesauri. 2005.
NELSON, Theodor Holm. Xanalogical structure, needed now more than ever: parallel
documents, deep links to content, deep versioning, and deep re-use. ACM Computing
Surveys, v. 31, n. 4, Dec. 1999. Disponvel em: <http://www.acm.org/surveys/
Formatting.html>. Acesso em: 4 mar. 2010.
NOGUEIRA, Maria do Carmo de C. Artigos de peridicos: produo de pesquisadores de
Cincia Espacial do INPE. 1997. 149f. Dissertao (Mestrado em Biblioteconomia
Planejamento e Administrao de Sistemas) Pontifcia Universidade Catlica de
Campinas, Campinas, 1997.
NONATO, R. dos S. et. al. Arquitetura da Informao em Bibliotecas Digitais: uma
abordagem da Cincia da Informao e da Biblioteconomia. Inf. Inf., Londrina, v. 13, n. 2, p.
125-141, jul./dez. 2008. Disponvel em:
<http://www.uel.br/revistas/uel/index.php/informacao/article/view/1812/1682> Acesso em: 7
fev. 2010.
NOVO, Hildenise Ferreira. A elaborao de taxonomia: princpios classificatrios para
domnios interdisciplinares. 2007. 172 f. Dissertao (Mestre em Cincia da Informao)
Universidade Federal Fluminense, Instituto de Arte e Comunicao Social, Niteri, Rio de
Janeiro, 2007.
ODDONE, N. E.; GOMES, M. Y. F. S. F. Os temas de pesquisa em Cincia da Informao e
suas implicaes poltico-epistemolgicas. In: ENCONTRO NACIONAL DE CINCIA DA

158

INFORMAO, 5., 2004, Salvador. Anais... Salvador: CINFORM, 2004. Disponvel em:
<http://dici.ibict.br/archive/00000558/01/temas_de_pesquisa.pdf> Acesso em: 13 mar. 2010.
ODDONE, Nanci; GOMES, Maria Yda F. S. de F. Uma nova taxonomia para a cincia da
informao. In: ENCONTRO NACIONAL DE PESQUISA EM CINCIA DA INFORMAO,
5., Belo Horizonte, 2003. Anais... Belo Horizonte: ECI/UFMG, 2003.
OHIRA, Maria Lourdes B.; PRADO, Nomia S. Bibliotecas virtuais e digitais: anlise de
artigos de peridicos brasileiros: 1995/2000. Ci. Inf., Braslia, v. 31, n.1, jan. 2002.
Disponvel em: <http://www.scielo.br/scielo.php?pid=S010019652002000100007&script=sci_arttext&tlng=es>. Acesso em: 12 abr. 2010.
OLIVEIRA, Denize Cristina de. Anlise de contedo temtico-categorial: uma proposta de
sistematizao. Rev. Enferm., Rio de Janeiro, v. 16, n. 4, p. 569-576, out./dez. 2008.
OLSON, Tod A. Utility of a faceted catalog for scholarly research. Library Hi Tech, v. 25, n. 4,
p. 550-561, 2007.
PEREIRA, Edmeire Cristina; RUTINA, Raquel. O sculo XXI e o sonho da biblioteca
universal: quase seis mil anos de evoluo na produo, registro e socializao do
conhecimento. Perspect. Cinc. Inf., Belo Horizonte, v. 4, n. 1, p. 5-19, jan./jun. 1999.
PINHO, Carolina M. D. de; KUX, Hermann H.; ALMEIDA, Cludia Maria. Elaborao de rede
semntica para classificao de cobertura do solo de ambientes intra-urbanos: o Caso de
So Jos dos Campos SP. In: SIMPOSIO BRASILEIRO DE SENSORIMANTO REMOTO,
13., Florianpolis, 21-26 abr. 2007. Anais... Florianpolis: SBSR, 2007. p. 637-644.
POLLITT, A. S. et al. View-bsed searching systems: progress towards effective
disintermediation. In: ONLINE INFORMATION, 96.; INTERNATIONAL ONLINE
INFORMATION MEETING, 20.,1996. London, England. Proceedings London, England:
[s.n], 1996. p. 433-441. Disponvel em:
<http://www.eric.ed.gov/ERICWebPortal/search/detailmini.jsp?_nfpb=true&_&ERICExtSearc
h_SearchValue_0=ED411866&ERICExtSearch_SearchType_0=no&accno=ED411866>.
Acesso em: 14 mar. 2011.
PRATT, Wanda; HEARST, Marti A.; FAGAN, Lawrence M. A knowledge-based approach to
organizing retrieved documents. In: NATIONAL CONFERENCE ON ARTIFICIAL
INTELLIGENCE, 16., July 18-22, 1999. Proceedings Orlando, Florida, 1999. p. 80-85.
PRAZERES, C. V. S. et al. Uma proposta de navegao na web utilizando facetas. In:
ERBD, 6.; ESCOLA REGIONAL DE BANCO DE DADOS, 2., 2006, Passo Fundo, RS.
Anais... Passo Fundo,RS: [s.n.], 2006. v. 1, p. 1-6.
RABELLO, Rodrigo. A face oculta do documento: tradio e inovao no limiar da Cincia
da Informao. 2009. 331f. Tese (Doutorado em Cincia da Informao) Faculdade de
Filosofia e Cincias, Universidade Federal Paulista, So Paulo, 2009.
RANGANATHAN, Shiyali R. Prolegomena to library classification. 3. ed. London: Asia
Publishing House, 1967. Disponvel em:
<http://dlist.sir.arizona.edu/arizona/handle/10150/106370>. Acesso em: 12 fev. 2011.
ROCHA, Dcio; DEUSDAR, Bruno. Anlise de Contedo e Anlise do Discurso:
aproximaes e afastamentos na (re)construo de uma trajetria. Alea, Rio de Janeiro, v.
7, n. 2, p. 305-322, jul./dez. 2005.

159

ROSETTO, Mrcia. Bibliotecas digitais: cenrios e perspectivas. Revista Brasileira de


Biblioteconomia e Documentao, So Paulo, v.4, n.1, p. 101-130, jan./jun. 2008.
ROWLEY, Jennifer. Informtica para bibliotecas. Braslia: Briquet de Lemos, 1994.
ROZENFELD, H. et al. Gesto de desenvolvimento de produtos: uma referncia para a
melhoria de processos. So Paulo: Saraiva, 2006.
SACCO, Giovanni Maria; TZITZIKAS, Yannis (Ed.). Dynamic taxonomies and faceted
search: theory, practice and experience. Berlin: Springer, 2009.
SALTON, G.; BUCKLEY, C. Term-weighting approaches in automatic text retrieval.
Information Processing and Management, v. 24, n. 5, p. 513-23, 1988.
SARACEVIC, T. Information science. Journal of the American Society for Information
Science, p. 1051-1063, 1999.
SAYO, Lus Fernando. Padres para bibliotecas digitais abertas e interoperveis. Enc.
Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianpolis, n. esp., 1. sem. 2007.
SAYO, Luiz Fernando. Bibliotecas digitais e suas utopias. Ponto de Acesso, Salvador, v.2,
n.2, p. 2-36, ago. /set. 2008.
SETZER, Valdemar W. Dado, Informao, Conhecimento e Competncia. DataGramaZero Revista de Cincia da Informao, n. zero, dez. 1999. Disponvel em:
<http://www.dgz.org.br/dez99/Art_01.htm>. Acesso em: 12 abr. 2011.
SEVERINO, Antnio Joaquim. Metodologia do trabalho cientfico. 23. ed. rev. atual. So
Paulo: Cortez, 2007.
SIDOROFF, T.; HYVNEN, E. Semantic e-goverment portals: a case study. 2005.
Disponvel em: <http://www.cs.helsinki.fi/u/eahyvone/publications/2005/suomifi.pdf>. Acesso
em: 12 abr. 2010.
SILVA, Antnio Carlos R. da. Metodologia da pesquisa aplicada contabilidade: orientaes
de estudos, projetos, artigos, relatrios, monografias, dissertaes, teses. 3. ed. So Paulo:
Atlas, 2010.
SILVA, Luiz Antnio G. da; MRDERO, Miguel .; CLAUDIO, Silvana. Acompanhamento
das bibliotecas brasileiras na Internet. Ci. Inf., Braslia, v. 26, n. 2, maio/ago. 1997.
SILVA, Maria dos Remdios da; FUJITA, Maringela S. L. A prtica de indexao: anlise
da evoluo de tendncias tericas e metodolgicas. TransInformao, Campinas, v. 16, n.
2, p. 133-161, maio/ago. 2004.
SIMON, H. A.; VALDES-PEREZ, R. E.; SLEEMAN, Derek H. Scientific discovery and
simplicity of method. Artificial Intelligence, v. 91, n. 2, p. 177-181, Apr. 1997.
SMIT, Johanna W.; KOBASHI, Nair Y. Como elaborar vocabulrio controlado para aplicao
em arquivos. So Paulo: Arquivo do Estado, Imprensa Oficial, 2003. (Projeto Como Fazer,
10).
SMITH, Greg et al. FacetMap: a scalable search and browse visualization. IEEE
Transactions on Visualization and Computer Graphics, v. 12, n.. 5, Sep./Oct. 2006.
Disponvel em: <http://research.microsoft.com/apps/pubs/default.aspx?id=64297>. Acesso
em: 11 abr. 2011.

160

SOERGEL, Dagobert. Functions of a thesaurus, classification, ontological knowledge base.


[S.l]: College of Library and Information Services, University of Maryland, 1997.
SOUZA, Allan Rocha de. A Portaria 13 de 2006 da CAPES e os direitos autorais. Revista da
Faculdade de Direito de Campos, ano 7, n. 8, 15 jun. 2006.
SOUZA, R. R.; ALVARENGA, L. A Web Semntica e suas contribuies para a cincia da
informao. Ci. Inf, Braslia, v. 33, n. 1, p. 132-141, jan./abr. 2004.
SOUZA, Renato R. Sistemas de Recuperao de Informaes e Mecanismos de Busca na
web: panorama atual e tendncias. Perspect. Cinc. Inf., Belo Horizonte, v. 11, n. 2, p. 161 173, maio/ago. 2006.
SOUZA, Vanessa I. de. Indexao: teorias e prticas do corpo indexador da Universidade
Federal do Rio Grande do Sul. 2009. 36f. Monografia (Especializao em Gesto de
Bibliotecas Universitrias) Faculdade de Biblioteconomia e Comunicao, Universidade
Federal do Rio Grande do Sul, Porto Alegre, 2009. Disponvel em:
<http://www.lume.ufrgs.br/bitstream/handle/10183/18885/000730118.pdf?sequence=>.
Acesso em: 22 abr. 2010.
SPITERI, Louise. A Simplified model for facet analysis: Ranganathan 101. Canadian Journal
of Information and Library Science, v. 23, p. 1-30, Apr./Jun. 1998. Disponvel em:
<http://iainstitute.org/en/learn/research/a_simplified_model_for_facet_analysis.php>. Acesso
em: 21 jun. 2010.
STEVENSON, Leslie; BYERLY, Henry. The many faces of science: and introduction to
scientists, values, and society. Boulder: Westview, 1995.
STOICA, E.; HEARST, M. Nearly-automed metadata hierarchy creation. 2004. Disponvel
em: <http://biotext.berkeley.edu/papers/hlt-naacl04.pdf>. Acesso em: 19 abr. 2010.
STOICA, E; HEARST, M.; RICHARDSON, M. Automating creation of hierarchical faceted
metadata structure. 2007. Disponvel em:
<http://flamenco.berkeley.edu/papers/castanet.pdf>. Acesso em: 29 mar. 2010.
SUOMINEN, O.; VILJANEN, K.; HYVNEN, E. User-centric faceted search for semantic
portals. In: EUROPEAN SEMANTIC WEB CONFERENCE ESWC, 4., 2007, Innsbruck,
Austria, Proceedings Innsbruck, Austria: [s.n], 2007. p. 356370, 2007. Disponvel em:
<http://www.seco.tkk.fi/publications/2007/suominen-et-al-user-centric-faceted-search2007.pdf>. Acesso em: 29 mar. 2010.
SUOMINEN, Osma et al. HealthFinland-a national semantic publishing network and portal for
health information. Journal of Web Semantics, v. 7, n. 4, p. 271-376, dec. 2009. Disponvel
em: <http://www.seco.tkk.fi/publications/2009/suominen-et-al-healthfinland-2009.pdf>.
Acesso em: 23 mar. 2011.
SWED. Semantic web environmental directory. Disponvel em:
<http://www.swed.org.uk/swed/index.html>. 2004.
TLAMO, M. F. G. M. Elaborao de resumos. Cadernos de anlise documentria, So
Paulo, n.1, p. 23-31, maio, 1994.
TLAMO, Maria de Ftima G. M. et al. A interface anlise documentria, lingstica
documental e terminologia. In: SIMPSIO DE TERMINOLOGIA, 3., 1992, Milln de la
Cogolla. Anais... San Milln de la Cogolla: RITerm, 1992. Disponvel em:
<http://www.riterm.net/actes/3simposio/talamo.htm>. Acesso em: 12 mar. 2011.

161

TARGINO, M. G. Comunicao cientfica: uma reviso de seus elementos bsicos. Revista


Informao & Sociedade: Estudos, Joo Pessoa, v. 10, n. 2, 2000.
TERRA, J. C. C. et al. Taxonomia: elemento fundamental para a gesto do conhecimento.
2005. Disponvel em: <http://www.terraforum.com.br>. Acesso em: 12 ago. 2008.
THELLEFSEN, Torkild L.; THELLEFSEN, Martin M. Pragmatic semiotics and knowledge
organization. Knowledge Organization, v. 31, n. 3, p. 177-187, 2004.
TUNKELANG, Daniel. Faceted search. North Carolina: Morgan e Claypool, 2009.
TVAROEK, Michal et al. Improving semantic search via integrated personalized faceted
and visual graph navigation. In: 34TH CONFERENCE ON CURRENT TRENDS IN THEORY
AND PRACTICE OF COMPUTER SCIENCE, 34., Jan. 19-25 2008, Berlin. Proceedings
Berlin: Springer, 2008. p. 778-789.
TVAROEK, Michal; BIELIKOV, Mria. Personalized faceted browsing for digital libraries.
In: 11th EUROPEAN CONFERENCE, 11., Sep. 16-21 2007, Budapest. Proceedings
Budapest, Hungary: ECDL, 2007. p. 485-488.
TZITZIKAS, Y et al. An algebraic approach for specifying compound terms in faceted
taxonomies. In: INFORMATION MODELLING AND KNOWLEDGE BASES, 15.;
EUROPEAN-JAPANESE CONFERENCE ON INFORMATION MODELLING AND
KNOWLEDGE BASES, 13., [2003], Kytakyushu. Proceedings Amsterdam: IOS Press,
2004.
TZITZIKAS, Y.; ANALYTI, A. Faceted taxonomy-based information management. In:
INTERNATIONAL CONFERENCE ON DATABASE AND EXPERT SYSTEMS
APPLICATIONS, 18., 2007, Regensburg. Proceedings Linz: DEXA Society, 2007.
VICKERY, Brian C. Classification and Indexing in Science. 3. ed. London: Butterworths,
1975.
VICKERY, Brian C. Technique of information retrieval. London, Butterworth, 1970.
VIEIRA, Simone B. Indexao automtica e manual: reviso de literatura. Ci. Inf, Braslia,
DF, v. 17, n. 1, 1988.
WANDERLEY, Manoel A. Linguagem documentria: acesso informao - aspectos do
problema. Ci. Inf., Braslia, v. 2, n. 2, p. 175-217, 1973. Disponvel em:
<http://revista.ibict.br/index.php/ciinf/article/view/1699/1302>. Acesso em: 22 jun. 2010.
WHORF, Benjamin L. On the connection of ideas. Letter to Horace B. English. In: ______.
Language, thought, and reality. Cambridge, MA: MIT, 1956. p. 35-39.
ZAFALON, Zaira Regina. Biblioteca em tempo real: o acesso em foco: proposta crtica do
modelo de organizao da informao na contemporaneidade. Revista Digital de
Biblioteconomia e Cincia da Informao, Campinas, v. 6, n. 1, p. 61-83, jul./dez. 2008.

BIBLIOGRAFIA COMPLEMENTAR
ALLEN, R. B. Retrieval from facet spaces. Electronic Publishing, v. 8, p. 247-257, 1996.
Disponvel em:

162

<http://www.ischool.drexel.edu/faculty/ballen/PAPERS/FACETS/facets.html>.Acesso em: 12
mar. 2011.
ALVARENGA, L. Representao do conhecimento em tempo e espao digitais. Enc. Bibli: R.
Eletr. Bibliotecon. Ci. Inf., Florianpolis, n.15, p.1-23, 2003.
ALVES, R. C. V. Web semntica: uma anlise focada no uso de metadados. 2005. 180f.
Dissertao (Mestrado em Cincia da Informao) Faculdade de Filosofia e Cincias,
Universidade Estadual Paulista, Marlia, SP, 2005.
ALVES, Renato M. B. Uma anlise emprica sobre o uso combinado de tcnicas de busca e
de navegao na recuperao de informao. 122f. 2010. Dissertao (Mestrado em
Informtica) Instituto de Matemtica, Ncleo de Computao Eletrnica, Universidade
Federal do Rio de Janeiro, Rio de Janeiro, 2010.
ANDER-EGG, Ezequiel. Introduccin a las tcnicas de investigacin social: para
trabajadores sociales. 7. ed. Buenos Aires: Humanitas, 1978.
AZEVEDO NETTO, C. X. de. A abordagem do conceito como uma estrutura semitica.
TransInformao, Campinas, v. 20, n. 1, p. 47-58, jan./abr. 2008.
BARBOSA, Alice. Teoria e prtica dos sistemas de classificao bibliogrfica. Rio de
Janeiro: Instituto Brasileiro de Bibliografia e Documentao, 1969.
BARDIN, Laurence. Anlise de contedo. 3. ed. Lisboa: Edies 70, 2004.
BARIT, Mario G. et al. Garantia literria: elementos para uma reviso crtica aps um
sculo. TransInformao, Campinas, v. 22, n. 2, p. 123-138, maio/ago. 2010.
BARIT, Mario G. The notion of category: its implications in subject analysis and in the
construction and evaluation of indexing languages. Knowledge Organization, v. 27, n. 1-2, p.
5-10, 2000.
BATISTA, Edinelson A. Uma Taxonomia facetada para tcnicas de elicitao de requisitos.
2003. 150 f. Dissertao (Mestrado em Cincia da Computao) Universidade de
Campinas, Instituto de Computao, Campinas, 2003.
BELLUZZO, Regina Clia B. et al. Indexao automtica de documentos com "PRECIS
software" no Servio de biblioteca e Documentao da Faculdade de Odontologia de Bauru
(USP). In: SIMPSIOS LATINO-AMERICANO DE TERMINOLOGIA TCNICO-CIENTFICA
(RITerm), 2., 1990, Braslia. Actas... Braslia: Secretaria da Cincia e Tecnologia da
Presidncia da Repblica/Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico /
Instituto Brasileiro de Informao em Cincia e Tecnologia (IBICT), 1990. Disponvel em:
<http://www.riterm.net/actes/2simposio/belluzzo.htm>. Acesso em: 12 mar. 2011.
BONINI, Adair. O conhecimento de jornalistas sobre gneros textuais: um estudo
introdutrio. Revista Linguagem em (Dis)curso, Palhoa, SC, v. 2, n. 1, jul./dez. 2001.
Disponvel em: <http://www3.unisul.br/paginas/ensino/pos/linguagem/0201/01.htm>. Acesso
em: 12 mar. 2010.
BORBINHA, Jos. Bibliotecas, arquivos e outras coisas digitais. In: CONGRESSO
NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 9., 2007,
Aores. Anais... Universidade dos Aores de Ponta Delgada. Aores, Lisboa: Congresso
BAD, 2007. Disponvel em: <http://badinfo.apbad.pt/congresso9/COM68.pdf>. Acesso em: 2
abr. 2010.

163

BRASIL, Maria Irene et al. Vocabulrio sistematizado: a experincia da Fundao Casa de


Rui Barbosa. So Paulo: INTEGRAR. So Paulo, 2002. Disponvel em:
<http://www.casaruibarbosa.gov.br/dados/DOC/artigos/aj/FCRB_Vocabulario_sistematizado_a_experiencia_da_Fundacao_Casa_de_Rui_Barbosa.p
df>. Acesso em: 23 mar. 2010.
BRIGHT, M.; HURSON, A.; PAKZAD, S. A taxonomy and current issues in multidatabase
systems. Computer, v. 25, n. 3, p. 50-60, 1992.
BUSH, V. As we may think. The Atlantic Monthly, Boston, v. 176, n. 1, p. 101-108, 1945.
Disponvel em: <http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm>. Acesso
em: 28 fev. 2010.
CAMARGO, A. C. O desafio da informao: no marketing da comunicao. Rio de Janeiro:
Expresso e Cultura, 1983.
CAMPOS, C. M. S.; BATAIERO, M. O. Necessidades de sade: uma anlise da produo
cientfica brasileira de 1990 a 2004. Interface - Comunic., Sade, Educ., v.11, n. 23, p. 60518, set./dez. 2007.
CAMPOS, M. L. de A. Linguagem documentria: teorias que fundamentam sua elaborao.
Niteri: EDUFF, 2001.
CAREGNATO, Rita Catalina A.; MUTTI, Regina. Pesquisa qualitativa: anlise de discurso
versus anlise de contedo. Texto Contexto Enferm., Florianpolis, v. 15, n. 4, p. 679-84,
out./dez. 2006.
CASTELLS, Manuel. A sociedade em rede. So Paulo: Paz e Terra, 1999. (A era da
informao: economia, sociedade e cultura, 1).
CASTRO, Fabiano F. de; SANTOS, Plcida L. V. A. da C. Os metadados como instrumentos
tecnolgicos na padronizao e potencializao dos recursos informacionais no mbito das
bibliotecas digitais na era da web semntica. Inf. & Soc.: Est., Joo Pessoa, v. 17, n. 2, p.1319, maio/ago. 2007. Disponvel em: <http://www.ies.ufpb.br/ojs2/index.php/ies/article/
view/840/1442>. Acesso em: 22 mar. 2010.
CHANG, Shan-Ju, RICE, R. E. Browsing: a multidimensional framework. ARIST, v. 28, p.
231-276, 1993.
COELHO, Maria de Ftima P. et al. A aprendizagem organizacional e gesto estratgica da
informao na UFMG: a implantao da Biblioteca Digital de Teses e Dissertaes. In:
SEMINRIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS BRASIL SIBDB, 2007, So
Paulo. Anais... So Paulo: UNICAMP, 2007. Disponvel em:
<http://libdigi.unicamp.br/document/?code=23462>. Acesso em: 24 mar. 2010.
CONWAY, Susan; SLIGAR, Char. Unlocking knowledge assets. Redmon: Microsoft, 2002.
cap. 6. [on-line]. Disponvel em:
<http://www.microsoft.com/mspress/books/sampchap/5516a.aspx#104>. Acesso em: 13
mar. 2011.
CUNHA, I. M. R. F. (Coord.). Anlise documentria: consideraes tericas e
experimentaes. So Paulo: FEBAB, 1989.
CUNHA, Murilo B. da. Biblioteca digital: bibliografia internacional anotada. Ci. Inf., Braslia, v.
26, n. 2, p. 195-213, 1997.

164

CUNHA, Murilo B. da. Construindo o futuro: a biblioteca universitria brasileira em 2010. Ci.
Inf., Braslia, v. 29, n. 1, p. 71-89, jan./abr. 2000.
CUNHA, Murilo Bastos da. Das bibliotecas convencionais s digitais: diferenas e
convergncias. Perspect. Cinc. Inf., Belo Horizonte, v. 13, n. 1, p. 2-17, jan./abr. 2008.
DAHLBERG, Ingetraut. Knowledge organization and terminology: philosophical and linguistic
bases. Int. Classif., v. 19, n. 2, p. 65-71, 1992.
DAHLBERG, Ingetraut. Knowledge organization: a new science?. Knowledge Organization,
v. 33, n. 1, 2006.
DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Braslia, DF, v. 7, n. 2, 1978. Disponvel
em: <http://revista.ibict.br/index.php/ciinf/article/viewArticle/1680>. Acesso em: 14 ago. 2009.
DAHLBERG, Ingetraut. Uma teoria para o interconcept: teoria analtica do conceito voltada
para o referente. Ttulo original: A referent-oriented analytical concept theory of interconcept.
[Publicado originalmente na revista] International Classification, v. 5, n. 3, p. 142-151, 1978.
[Traduzido por Vnia Teixeira Gonalves, Bolsista do CNPq, da equipe de Hagar. E. Gomes,
Rio de Janeiro, 1990. 34p.].
DENTON, William. How to make a faceted classification and put it on the web. Disponvel
em: <http://www.miskatonic.org/library/facet-web-howto.html>. Acesso em: 10 jan. 2010.
DIAS, Aldo A.; NARVAI, Paulo C.; REGO, Delane Maria. Tendncias da produo cientfica
em odontologia no Brasil. Ver. Panam. Salud. Publica [on-line], v. 24, n. 1, p. 54-60, 2008.
Disponvel em: <http://www.scielosp.org/>. Acesso em: 12 mar. 2011.
DIAS, C. A. Portal corporativo: conceitos e caractersticas. Ci. Inf. Braslia, DF, v. 30, p. 5060, 2001.
DIAS, Eduardo W. Contexto digital e tratamento da informao. DataGramaZero - Rev Ci.
Inf. , Rio de Janeiro, v. 2, n. 5, out. 2001. Disponvel em:
<http://www.dgz.org.br/out01/Art_01.htm>. Acesso em: 20 out. 2009.
DIAS, S. A. Integrao semntica de dados atravs de federao de ontologias. 2006. 83f.
Dissertao (Mestrado em Informtica) Departamento de Informtica, Pontifcia
Universidade Catlica do Rio de Janeiro, Rio de Janeiro, 2006.
DOSI, G. Sources, procedures and microeconomic effects of innovation. Journal of
Economic Literature, v. 27, p. 1126-1171, 1988.
DUARTE Elizabeth A.; CERQUEIRA, Roberto F. P. de. Anlise facetada: um olhar face a
modelagem conceitual. Revista Digital de Biblioteconomia e Cincia da Informao,
Campinas, v. 4, n. 2, p. 39-52, jan./jun. 2007.
ENGELMANN, Jaqueline. Teoria da definio: das definies reais s definies
predicativas. 2006. 140f. Tese (Doutorado em Filosofia) Departamento de Filosofia,
Pontifcia Universidade Catlica do Rio de Janeiro, Rio de Janeiro, 2006. Disponvel em:
<http://www.maxwell.lambda.ele.puc-rio.br/Busca_etds.php?%20strSecao=
resultado&nrSeq=9106@1>. Acesso em: 12 dez. 2009.
ESTEBAN NAVARRO, Miguel A. El marco disciplinar de los lenguajes documentales: la
Organizacin del Conocimiento y las ciencias sociales. Scire, Zaragoza, v. 2, n. 1, p. 93-107,
ene./jun. 1996.

165

FAULSTICH, Enilde. A socioterminologia na comunicao cientfica e tcnica. Cienc. Cult.,


v. 58, n. 2, p. 27-31, jun. 2006. Disponvel em:
<http://cienciaecultura.bvs.br/pdf/cic/v58n2/a12v58n2.pdf>. Acesso em: 18 fev. 2010.
FAZENDA, Ivani. Integrao e interdisciplinaridade no ensino brasileiro: efetividade ou
ideologia?. So Paulo: Loyola, 1979.
FELBER, H. Terminology manual. Paris: UNESCO, 1984.
FERREIRA, Aloizio S.; ABREU, Mrvio L. T. Desconstruindo um artigo cientfico. Revista
Brasileira de Zootecnia, Piau, v. 36, 2007.
FERREIRA, Luiz G. R. Redao Cientfica: como escrever artigos, monografias,
dissertaes e teses. Fortaleza: UFC, 1994.
FINATTO, Maria Jos B. Definio terminolgica: fundamentos terico-metodolgicos para
sua descrio e explicao. 2001. 395f. Tese (Doutorado em Estudos da Estudos da
Linguagem) Instituto de Letras, Universidade Federal do Rio Grande do Sul, Rio Grande
do Sul, 2001.
FOSKETT, A.C. The subject approach to information. London: C. Bingley, 1996.
FOUCAULT, M. A arqueologia do saber. Rio de Janeiro: Forense Universitria, 1987.
FREEMAN, C.; SOETE, L. The economics of industrial innovation. London: Pinter, 1994.
FUJITA, Maringela S. L.. Organizao do conhecimento: algumas consideraes para o
tratamento temtico da informao. In: CARRARA, Kester. (Org.). Educao, Universidade e
Pesquisa. Marlia: Unesp-Marlia-Publicaes; So Paulo: FAPESP, 2001. p. 29-34.
FURGERI, Srgio. Representao de informao e conhecimento: estudo das diferentes
abordagens entre a Cincia da Informao e a Cincia da Computao. 2006. 161f.
Dissertao (Mestre em Cincia da Informao) Centro de Cincias Sociais Aplicadas,
Pontifcia Universidade Catlica de Campinas, Campinas, 2006.
GILLILAND-SWETLAND, Anne J.; KAFAI, Yasmin; LANDIS, William E. Metadata
applications in the creation and description of digital primary sources for elementary school
classrooms. Journal of the American Society for Information Science, v. 50, n. 14, p. 193201, 1999.
GINEZ DE LARA, M. L. A representao documentria: em jogo a significao. So Paulo,
1993. 133f. Dissertao (Mestrado em Cincia da Informao) Escola de Comunicao e
Artes, Universidade de So Paulo, So Paulo, 1993.
GRCIO, Jos Carlos Abbud. Metadados para a descrio de recursos da Internet: o padro
Dublin Core, aplicaes e a questo da interoperabilidade. 2002. 127f. Dissertao
(Mestrado em Cincia da Informao) Faculdade de Filosofia e Cincias, Universidade
Estadual Paulista, Marlia, 2002.
GRUBER, T. R., A translation approach to portable ontology specifications. Knowledge
Acquisition, v. 5, p. 199-220, 1993.
GUIMARES, Jos Augusto Chaves. A anlise documentria no mbito do tratamento da
informao: elementos histricos e conceituais. In: RODRIGUES, Georgete Medleg; LOPES,
Ilza Leite. Organizao e representao do conhecimento na perspectiva da Cincia da

166

Informao. Braslia: Thesaurus, 2003. p. 100-117. (Estudos avanados em Cincia da


informao, 2).
GUINCHAT, C.; MENOU, M. Introduo geral s cincias e tcnicas da informao e
documentao. Braslia: IBICT, 1994.
HEARST, M. A. Design recommendations for hierarchical faceted search interfaces. 2007.
Disponvel em: <flamenco.berkeley.edu/papers/faceted-workshop06.pdf>. Acesso em: 12
mar. 2011.
HEARST, M. A. Clustering versus faceted categories for information exploration.
Communications of the ACM, v. 40, n. 4, p. 56-61, 2006.
HINTAKU, Milton; BRSCHER, Marisa. DSpace verso 1.4: uma anlise das facilidades
relacionadas ao assunto. In: SEMINRIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS
BRASIL, 2007, So Paulo. Anais... So Paulo: SIBDB, 2007. Disponvel em:
<libdigi.unicamp.br/document/?down=23471>.Acesso em: 23 mar. 2010.
HJORLAND, B. Documents, memory institutions, and information science. Journal of
Documentation, v. 56, p. 27-41, 2000.
HOUAISS, Antnio et al. Dicionrio Houaiss da lngua portuguesa. Rio de Janeiro: Objetiva,
2001.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Classification of information
in the construction industry. Geneva, 1994. 1 v. (ISO techical report, 14177).
JACOB, Elin K.; ALBRECHTSEN, Hanne. When essence becomes function: poststructuralist implications for an ecological theory of organizational classification systems
source. In: MCCASKIE, Russell. Exploring the contexts of information behavior. London, UK:
Taylor Graham Publishing, 1999. p. 519-534.
JAPIASSU, H. A. Interdisciplinaridade: algumas concluses. Rio de Janeiro: Ed. PUC/RJ,
1998.
JESUS, Leandro Martins de. Interdisciplinaridade. [S.l.]: Recanto das Letras, 18 nov. 2006.
[On-line]. Disponvel em: <http://recantodasletras.uol.com.br/artigos/294810>. Acesso em: 5
ago. 2008.
KLEIN, Julie. Ensino interdisciplinar: didtica e teoria. In: FAZENDA, Ivani (Org.). Didtica e
interdisciplinaridade. Campinas: Papirus, 1998. p. 109-132.
KOBASHI, N. Y. Anlise documentria e representao da informao. Informare, So
Paulo, v. 2, n. 2, p. 5-27, 1996.
KOBASHI, N. Y. Terminologia e operaes documentrias. In: SIMPOSIOS
IBEROAMERICANO DE TERMINOLOGIA: RITerm 1988-2002, 4., 1994, Buenos Aires.
Atas... Buenos Aires: RITERM, 1994. Disponvel em:
<http://www.riterm.net/actes/4simposio/kobashi.htm>. Acesso em: 12 abr. 2010.
KUHN, Thomas S. Estrutura das revolues cientficas. 3. ed. So Paulo: Perspectiva, 1989.
LAKATOS, Eva Maria; MARCONI, Marina de A. Metodologia do trabalho cientfico:
procedimentos bsicos, pesquisa bibliogrfica, projeto e relatrio, publicaes e trabalhos
cientficos. 6. ed. So Paulo: Atlas, 2001.

167

LANCASTER, F. W. Indexao e resumos: teoria e prtica. Braslia: Briquet de Lemos,


2004.
LAUSEN, H. et al. Semantic web portals: state-of-the-art survey. Journal of Knowledge
Management, v. 9, n. 5, p. 40-49, may 2005. Disponvel em:
<http://dx.doi.org/10.1108/13673270510622447>. Acesso em: 18 mar. 2011.
LAZZAROTO, Juliana F.; SANTIAGO, Leilah B.; FAUSTINO, Rene G. Junior. Proposta de
metodologia para a recuperao da produo cientfica em cincia da informao na base
BRAPCI. Ponto de Acesso, Salvador, v. 4, n.3, p. 45-67, 2011. Disponvel em:
<http://www.portalseer.ufba.br/index.php/revistaici/article/view/4629/3564>. Acesso em: 20
mar. 2011
LEI, Y., UREN, V.; MOTTA, E. Semsearch: a search engine for the semantic web. In:
INTERNATIONAL CONFERENCE ON KNOWLEDGE ENGINEERING AND KNOWLEDGE
MANAGEMENT MANAGING KNOWLEDGE IN A WORLD OF NETWORKS, 5., 2006,
Podebrady. Proceedings Podebrady, Czech Republic: EKAW-2006, 2006. p. 238-245.
LEITE, Fernando C. L.; MRDERO-ARELLANO, Miguel .; MORENO, Fernanda P. Acesso
livre a publicaes e repositrios digitais em cincia da informao no Brasil. Perspect.
Cinc. Inf., Belo Horizonte, v.11, n.1, p. 82-94, jan./abr. 2006.
LI, Y.; BELKIN, N. J. A faceted approach to conceptualizing tasks in information seeking.
Information Processing & Management, Elmsford, v. 44, n. 6, p. 1822-1837, nov. 2008.
LITWIN, W.; MARK, L.; ROUSSOPOULOS, N. Interoperability of multiple autonomous
databases. ACM Computing Surveys (CSUR), v. 22, n. 3, p. 267-293, 1990.
LOPES, Ilza Leite. Estratgia de busca na recuperao da informao: reviso da literatura.
Ci. Inf., Braslia, v. 31, n. 2, p. 60-71, maio/ago. 2002.
LOPES, Jorge Expedito de G. et al. Procedimentos metodolgicos para elaborao de
projetos pesquisa relacionados a dissertaes de mestrado em cincias contbeis. Revista
Contabilidade & Finanas, So Paulo, v. 4, n. 36, p. 97-104, set.-dez./2004.
LYRA, Tania Maria de Paula; GUIMARES, Jorge A. Produo cientfica brasileira em
comparao com o desempenho mundial em cincias agrrias. Planejamento e Polticas
Pblicas, Braslia, n. 30, 2007.
MAHEU, Cristina dvila. Interdisciplinaridade e mediao pedaggica. [Salvador]:
UNIFACS: NUPPEAD/NPP, UFBA (FACED) e UNEB, 2000. Disponvel em:
<www.nuppead.unifacs.br/artigos/Interdisciplinaridade.pdf>. Acesso em: 15 ago. 2009.
MKEL, E. View-based search interfaces for the semantic web. 2006. 86f. Dissertation
(Doctor of Science in Technology) Faculty of Science, University of Helsinki, Department of
Computer Science, 2006.
MKEL, E; HYVNEN .E.; SIDOROFF. View-based user interfaces for information retrieval
on the semantic web. 2005. Disponvel em:
<http://www.seco.tkk.fi/publications/2005/makela-hyvonen-et-al-view-based-user-2005.pdf>.
Acesso em: 20 jun. 2010.
MARCHIONINI, G.; BRUNK, B. Towards a general relation browser: a GUI for information
architects. Jounal of Digital Information, v. 4, n. 1, 2003.

168

MARCONDES, C. H. Representao e economia da informao. Ci. Inf., Braslia, v. 30, n. 1,


p. 61-70, jan./abr. 2001.
MAYVILLE, W. V. Interdisciplinarity: The mutable paradigm. Education Research Report,
AAHE/ERIC, San Francisco, CA, v. 7, n. 9, 1978.
MCGARRY, K. O contexto dinmico da informao. Braslia: Briquet de Lemos, 1999.
MICHAELIS Lngua Portuguesa. Dicionrio escolar: nova ortografia. So Paulo:
Melhoramentos, 2009.
MORAES, Roque. Uma tempestade de luz... Cinc. educ. (Bauru), Bauru, v. 9, n. 2, p. 191211, 2003.
MOTTA, Dilza Fonseca da. Mtodo relacional como nova abordagem para a construo de
tesauros. 1987. 89 f. Dissertao (Mestrado em Cincia da Informao) Centro de
Cincias Jurdicas e Econmicas, Universidade Federal do Rio de Janeiro, Rio de Janeiro,
1987.
MUELLER, Suzana. O crescimento da cincia, o comportamento cientfico e a comunicao
cientfica: algumas reflexes. Revista da Escola de Biblioteconomia da UFMG, v. 24, n. 1, p.
63-84, jan./jun. 1995.
MURRAY, B. Weaving an interdisciplinary education. APA Monitor, v. 30, n. 5, 1999.
Disponvel em: <www.apa.org>. Acesso em: 20 out. 2009.
NAVES, Madalena M. L. Estudo dos fatores interferentes no processo de anlise de
assunto. Perspect. Cinc. Inf., Belo Horizonte, v. 6, n. 2, p. 189-203, jul./dez. 2001.
NAVES, Madalena M. L. Fatores intervenientes no processo de anlise de assunto: estudo
de caso de indexadores. Belo Horizonte, 200. 253f. Tese (Doutorado em Cincia da
Informao) Escola de Cincia da Informao, Universidade Federal de Minas Gerais,
Belo Horizonte, 2000.
NISSANI, M. Ten cheers for interdisciplinarity: the case for interdisciplinary knowledge and
research. Social Science Journal, v. 34, n. 2, p. 202-217, 1997.
NORONHA, Ana Paula P.; FERNANDES, Dario Ceclio. Estresse laboral: anlise da
produo cientfica brasileira na Scielo e BVS-PSI. Fractal, Rev. Psicol., Niteri, RJ, v. 20, n.
2, p. 491-502, jul./dez. 2008.
NORONHA, Daisy Pires; FUJINO, Asa. Teses e dissertaes em cincias da informao: a
multidisciplinaridade no revelada na avaliao da produo cientfica. TransInformao,
Campinas, v. 21, n. 2, p. 123-132, maio/ago. 2009. Disponvel em: <http://revistas.puccampinas.edu.br/transinfo/viewarticle.php?id=283&locale=>. Acesso em: 12 mar. 2011.
OLIVEIRA, Marcos B. de; OLIVERIA, Marta Kohl. Investigaes cognitivas: conceitos,
linguagem e cultura. Porto Alegre: Artmed, 1999.
OREN , E.; , BRESLIN J. G.; DECKER, S.. How semantics make better wikis. In:
INTERNATIONAL WORLD-WIDE WEB CONFERENCE, 15., 2006, Edinburgh, Scotland.
Proceedings New York : ACM Press, 2006. p. 10711072
OREN, E. An overview of information management and knowledge work studies: lessons for
the semantic desktop. In: INTERNATIONAL WORLD-WIDE WEB CONFERENCE, 5.;

169

Workshop on the Semantic Desktop, 2006, Athens. Proceedings Athens, GA, USA: ISWC,
2006.
PANSANATO, Luciano T. E. Um modelo de navegao exploratria para a infra-estrutura da
web semntica. 2007.166f. Tese (Doutorado em Cincias da Computao e Matemtica
Computacional) Instituto de Cincias Matemticas e de Computao, So Carlos, 2007
PASSARELLI, Brasilina. Do Mundaneum web semntica: discusso sobre a revoluo nos
conceitos de autor e autoridade das fontes de informao. DataGramaZero - Rev Ci. Inf., Rio
de Janeiro, v. 9, n. 5, out. 2008.
PIEDADE, Maria Antonietta. Introduo teoria da classificao. Rio de Janeiro:
Intercincia, 1977.
PINHEIRO, Lna Vnia Ribeiro. Processo evolutivo e tendncias contemporneas da
cincia da informao. Inf. & Soc.: Est., Joo Pessoa, v. 15, n. 1, p. 13-48, jan./jun. 2005.
PINHEIRO, W. A. Busca em portais semnticos: uma abordagem baseada em ontologias.
2004. 170f. Dissertao (Mestrado em Sistemas e Computao) Instituto Militar de
Engenharia, Rio de Janeiro, 2004.
PINTO, Maria; DOUCET, Anne-Vinciane; FERNNDEZ-RAMOS, Andrs. The role of
information competencies and skills in learning to abstract. Journal of Information Science, v.
34, n. 6, p.799-815, 2008. Disponvel em: <http://jis.sagepub.com/content/34/6/799>. Acesso
em: 12 fev. 2011.
PRESTES, Maria Luci de Mesquita. A pesquisa e a construo do conhecimento cientfico:
do planejamento aos textos, da escola academia. So Paulo: Rspel, 2002.
RAFFERTY, Pauline; HIDDERLEY, Rob. Flickr and democratic indexing: dialogic
approaches to indexing. Aslib Proceedings, v. 59, n. 4-5, p. 397-410, 2007. Disponvel em:
<http://www.emeraldinsight.com/Insight/viewPDF.jsp?Filename=html/Output/Published/Emer
aldFullTextArticle/Pdf/2760590407.pdf>. Acesso em: 22 mar. 2010.
ROCKMORE, Marlene. The 5 types of taxonomies: from lists to ontologies. The taxonomy
blog, 26 jun. 2009. Disponvel em: <http://thetaxonomyblog.wordpress.com/2009/06/26/5types-of-taxonomies-from-lists-to-ontologies/>. Acesso em: 12 mar. 2011.
ROSA , Malvina Vianna. O papel da classificao na recuperao da informao:
classificao facetada. R. Bibliotecon., Braslia, v. 1, n. 2, p. 207-210, jul./dez. 1973.
Disponvel em: <http://www.tempusactas.unb.br/index.php/RBB/article/viewFile/33/25>.
Acesso em: 2 abr. 2010.
ROSAS, P. Introdues redatoriais e a indexao em publicao peridica. In:
GOLDENBERG, S; GUIMARES C, A; Castro A, A. Elaborao e apresentao de
comunicao cientfica. So Paulo: Metodologia.org, 2001. Disponvel em: <www.
metodologia.org>. Acesso em: 2 ago. 2010.
RUSSO, Ida C. P. Editorial II: a relevncia da pesquisa cientfica na audiologia brasileira.
Revista CEFAC, So Paulo, 2011. Disponvel em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S151618462009000500002&lng=en&nrm=iso>. Acesso em: 11 abr. 2011.
SACCO, Giovanni Maria. Research results in dynamic taxonomy and faceted search
systems. In: INTERNATIONAL CONFERENCE ON DATABASE AND EXPERT SYSTEMS

170

APPLICATIONS; Database and Expert Systems Applications, International Workshop, 18.,


2007, Regensburg. Proceedings... Regensburg, Germany: [s.n], 2007. p. 201-206.
SALES, Rodrigo de. Teoria comunicativa da terminologia (TCT) como aporte terico para a
representao do conhecimento especializado. In: ENANCIB Encontro Nacional 2007 de
Pesquisa em Cincia da Informao, 7., 2007, Salvador. Anais... Salvador: ENANCIB, 2007.
Disponvel em: <http://www.enancib.ppgci.ufba.br/artigos/GT2--036.pdf>. Acesso em: jun.
2009.
SAYO, Luis Fernando; MARCONDES, Carlos Henrique. O desafio da interoperabilidade e
as novas perspectivas para as bibliotecas digitais. TransInformao, Campinas, v. 20, n. 2,
p. 133-148, maio/ago., 2008. Disponvel em: <http://revistas.puccampinas.edu.br/transinfo/viewarticle.php?id=215>. Acesso em 12 ago. 2009.
SHETH, A.; LARSON, J. A. Federated database systems for managing distributed,
heterogeneous, and autonomous databases. ACM Comput. Surv., v. 22, n. 3, p. 183-236,
1990.
SHNEIDERMAN, Ben. Clarifying search: a user-interface framework for text searches. DLIB
Magazine, [on-line]. Disponvel em:
<http://www.dlib.org/dlib/january97/retrieval/01shneiderman.html>. Acesso em: 12 abr. 2010.
SILVA, Antnio Carlos R. de. Metodologia da pesquisa aplicada contabilidade: orientaes
de estudos, projetos, relatrios, monografias, dissertaes, teses. So Paulo: Atlas, 2003.
SILVEIRA, Jos Maria J. da. Kenneth J. Arrow: economic welfare and the allocation of
resources for invention. Revista Brasileira de Inovao, Rio de Janeiro, v. 7, n. 2, p. 268-285,
jul./dez. 2008. Disponvel em:
<http://www.finep.gov.br/revista_brasileira_inovacao/decima_quarta_edicao/Ideias%20Fund
adoras.pdf>. Acesso em: 20 mar. 2010.
SILVEIRA, Murilo A. A. da; SILVA, Fbio M. e; CORRA, Renato F. Os peridicos em
Cincia da Informao no Brasil: estudo cienciomtrico da frente de pesquisa. In:
ENCONTRO NACIONAL DE PESQUISA EM CIENCIA DA INFORMAO, 11., 2010, Rio de
Janeiro. Anais... Rio de Janeiro: ENANCIB, 2010.
SMIT, J. W. (Coord.). Anlise documentria: a anlise da sntese. 2. ed. Braslia: IBICT,
1987.
SOERGEL, Dagobert. The rise of ontologies or the reinvention of classification. Journal of
the American Society of Information Science, v. 50, n. 12, p. 1119-1120, 1999.
SWANSON, Don R.; SMALHEISER, Neil R. An interactive system for finding complementary
literatures: a stimulus to scientific discovery. Artificial Intelligence, v. 91, n. 2, p. 183-203,
Apr. 1997.
TLAMO, M. F. G. M. A compreenso literal de textos. Cadernos de anlise documentria,
So Paulo, n. 1, p. 13-22, maio 1994.
TAMMARO, Anna Maria; SALARELLI, Alberto. A biblioteca digital. Braslia: Briquet de
Lemos, 2008.
TANG, M. Browsing and searching in a faceted information space: a longitudinal study of
PubMed users interactions with a novel display tool. New Brunswick, NJ: Rutgers, The State
University of New Jersey, 2005.

171

TOLEDO, A. M. Portais corporativos: uma ferramenta estratgica de apoio a gesto do


conhecimento. 2002. 126f. Monografia (Especializao em Sistemas de Negcios
Integrados) Escola de Engenharia, Universidade do Rio de Janeiro, Rio de Janeiro, 2002.
TRISTO, Ana Maria D.; FACHIN, Gleisy Regina B.; ALARCON, Orestes E. Sistema de
classificao facetada e tesauros: instrumentos para organizao do conhecimento. Ci.
Inf., Braslia, v. 33, n. 2, maio/ago. 2004. Disponvel em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-19652004000200017>.
Acesso em: 12 mar. 2010.
TUDHOPE, Douglas; CUNLIFFE, Daniel. Semantically indexed hypermedia: linking
information disciplines. ACM Computing Surveys, v. 31, n. 4, dez. 1999.
UDDIN, M. N.; JANECEK, P. Faceted classification in web information architecture. The
Electronic Library, v. 25, n.2, p. 219 - 233, 2007.
UNESCO. Guidelines for the establishment and development of monolingual thesauri. Paris:
The Organization, [1973]. 37p.
VAN DIJCK, Peter. Introduction to XFML: core exchangeable faceted metadata language.
O'Reilly Media., 22 jan. 2003. Disponvel em:
<http://www.xml.com/pub/a/2003/01/22/xfml.html>. Acesso em: 20 nov. 2009.
VASCONCELOS, Celso dos S. Construo do conhecimento em sala de aula. So Paulo:
Salesiana Dom Bosco, 1993.
VICKERY, Brian C. Faceted classification: a guide to construction and use of special
schemes. London: Aslib, 1960.
VILJANEN, K.; et al. Ontodella: a projection and linking service for semantic web
applications. In: International Conference on Database and Expert Systems Applications,
17., 2006, Krakow. Proceedings... Krakow, Poland: IEEE. p. 370376.
VITAL, Luciane Paula. Recomendaes para construo de taxonomia em portais
corporativos. 2007. 113 f. Dissertao (Mestrado em Cincia da Informao) Centro de
Cincias da Educao, Universidade Federal de Santa Catarina, Florianpolis, SC, 2007.
Disponvel em: <http://www.cin.ufsc.br/pgcin/Vital,%20Luciane.pdf>. Acesso em: 16 ago.
2008.
WSTER, E. L'tude scientifique qnrale de la terminologie, zone frontalire entre la
linguistique, la logique, l' ontologie, L' informatique et les sciences des chose. In: RONDEAU,
G.; FELBER, E. (Org.). Textes choisis de terminologie. Qubec: GIRSTERM, 1981.

172

APNDICES
APNDICE A Lista do corpus da pesquisa
CODIGO
DOCUMENTO
t001-2009
t002-2009

CDIGO
DO
TTULO DO DOCUMENTO
DADO
Registro de informao no Sistema de Informao em Sade: um estudo das bases
3454
SINASC, SIAB e SIM no Estado de Alagoas
4856 As relaes interdisciplinares refletidas na Cincia da Informao

t003-2008

3962

t004-2008

4857

t006-2008

2134

t009-2007

2095

t010-2005

79

t011-2005

550

t012-2005

1265

t013-2005

48

t014-2004

695

t015-2004

1261

d004-2009

4054

d007-2009

3773

d008-2009

3844

d009-2008

3446

d010-2008

2112

d011-2008

4333

d012-2008

4342

d013-2008

4520

d014-2007

4059

d015-2007

1282

d016-2007

2101

d017-2007

1492

d018-2007

747

d019-2006
d020-2006

3483
144

Uso de sintagmas nominais na classificao automtica de documentos eletrnicos


Fatores de influncia no uso de sistemas de informao via internet: proposta de um
modelo integrativo
Estudo das caractersticas de software e implementao de um software livre para o
sistema de gerenciamento de Bibliotecas Universitrias Federais Brasileiras
Gesto arquivstica na era do cinema digital: formao de acervos de documentos
digitais provindos da prtica cinematogrfica
Ambiente para gerao e manuteno semiautomtica de tesauros
Anlise do padro brasileiro de metadados de teses e dissertaes segundo o
modelo entidade-relacionamento
Anlise temtica da produo cientfica em Comunicao no Brasil baseada em um
sistema classificatrio facetado
Uma proposta de metodologia para escolha automtica de descritores utilizando
sintagmas nominais
Aspectos metacognitivos na leitura do indexador
Mapa Hipertextual (MHTX): um modelo para organizao hipertextual de
documentos
Teoria do conceito e hipertextos: uma proposta para determinao de
relacionamentos em links conceituais
Anlise conceitual sobre as relaes semnticas em cincia da informao:
contribuies para o desenvolvimento de ontologias
Uso de bibliotecas digitais de peridicos: um estudo comparativo no Portal de
Peridicos CAPES entre as reas do conhecimento
Anlise de citaes de teses como apoio tomada de deciso no desenvolvimento
de colees de bibliotecas universitrias
A interao dos usurios da UFMG com o catlogo on-line do Sistema Pergamum
A utilizao de mapas de tpicos na compatibilizao de contedos hipertextuais
semanticamente estruturados
Uma proposta metodolgica para construo de ontologias: uma perspectiva
interdisciplinar entre as Cincias da Informao e da Computao
Padres de disciplinaridade no campo de pesquisa sobre a AIDS: uma prospeco a
partir de publicaes peridicas e pesquisadores
O uso da internet como instrumento na prestao de servios pblicos na Prefeitura
Municipal de Belo Horizonte atravs do Sistema de Atendimento ao Cidado
Estudo comparativo entre interfaces hipertextuais de softwares para a
representao do conhecimento
Comparao entre termos de indexao e palavras dos ttulos dos artigos do
peridico "Cadernos de Sade Pblica (2000/2005)"
Centrais de Help-Desk: avaliao do servio de atendimento ao cliente de Empresas
Desenvolvedoras de Sistemas de Gesto Empresarial
Sistemas eletrnicos de gerenciamento de documentos arquivsticos: um
questionrio para escolha, aplicao e avaliao
A utilizao do pronturio eletrnico do paciente pelos hospitais de Belo Horizonte
Estudo de uso de informao externa para tomada de deciso: panorama geral das

173

CODIGO
DOCUMENTO

CDIGO
DO
TTULO DO DOCUMENTO
DADO
empresas de informtica

d021-2006

118

d022-2006

116

d023-2006

119

d024-2006

2199

d025-2005

64

d026-2005

78

d027-2005

4424

d028-2005

955

d029-2005

90

d030-2005

952

d031-2005

694

d036-2004

949

d037-2003

18

d038-2002

901

Metadados para descrio de documentos remanescentes de fundo eclesistico:


uma proposta de metadados e biblioteca digital para os assentos de batismo,
casamento e bito da Matriz do Pilar de Ouro Preto
Educao Fsica no PPGMH/UFRGS: uma viso a partir da anlise de citaes e perfil
dos pesquisadores
Organizao e uso das bases de informao para o atendimento a clientes em call
centers
A anlise de assunto na literatura ficcional infantil: categorias para ler o que voc
tem
Uma metodologia para avaliao automtica de sites e sua aplicao em sites do
Governo do Estado de Minas Gerais
Anlise de citaes da produo cientfica de uma comunidade: a construo de uma
ferramenta e sua aplicao em um acervo de teses e dissertaes do PPGCI-UFMG
Um estudo sobre o uso de peridicos eletrnicos: O Portal De Peridicos CAPES na
Universidade Federal de Minas Gerais
Mtodo para produo de representaes conceituais a partir de literatura
especializada utilizando a abordagem Analtico-Sinttica
Estratgias de produo e organizao de informaes na WWW: uma anlise de
sites tursticos
Pronturio Eletrnico do Paciente: estudo de uso pela equipe de sade do Centro de
Sade Vista Alegre
A indexao temtica de recursos fundamentada por estrutura profunda e
abordagem objeto-relacionamento
O uso de sistemas de informaes gerenciais em empresas: estudo de caso na
Andrade Gutierrez Concesses - AGC
Tesauros e ontologias: estudo de definies presentes na literatura das reas das
cincias da computao e da informao, utilizando-se mtodo analtico-sinttico
O usurio do sistema de informao hospitalar: necessidades e usos no contexto da
informao

174

APNDICE B Qualificao dos autores das fontes especializadas


a) Severino (2007): atualmente professor titular de Filosofia da Educao na
Faculdade de Educao da USP; sendo bacharel em Filosofia pela Universidade Catlica de
Louvain, Blgica, em 1964; doutor pela Pontifcia Universidade Catlica de So Paulo, em
1972. Suas publicaes e interesses cientficos atuais tm foco em questes de
epistemologia da educao. O livro em questo versa sobre subsdios tericos e
metodolgicos para a prtica do desenvolvimento de trabalho cientfico, tanto para discentes
quanto para docentes.
b) Marconi e Lakatos (2010): Marconi conhecida na rea da metodologia
cientfica, sendo doutora pela UNESP/Franca; Ps-graduada pela Escola de Sociologia e
Poltica; graduada em Histria pela UNESP/Franca, em Pedagogia pelas Faculdades
Claretianas de Batatais, e em Estudos Sociais pela Faculdade de Pedagogia de Ituverava;
em. Entre outras atuaes, foi professora de Antropologia da UNESP de Franca, por 16
anos, e professora de Sociologia das Faculdades Claretianas de Batatais, por 10 anos.
Lakatos reconhecida na rea por sua especialidade no campo disciplinar da
metodologia cientfica, sendo bacharel em Jornalismo pela Faculdade de Comunicao
Social Csper Libero, em So Paulo; mestre e doutora em Cincias pela Escola de
Sociologia e Poltica de So Paulo; doutora em Filosofia (Metodologia Cientfica) pela Escola
de Sociologia e Poltica de So Paulo; Livre-Docente em Sociologia, pela Escola de
Sociologia e Poltica de So Paulo; e Ps-graduada em Cincias Sociais pela Escola de
Sociologia e Poltica de So Paulo.
c) Silva (2010): professor da Fundao Visconde de Cairu e Professor Adjunto
da Universidade Federal da Bahia, sendo graduado em Cincias Contbeis pela Fundao
Visconde de Cairu; em Pedagogia pela Faculdade de Educao da Bahia; licenciado em
Tcnicas

Comerciais

pela

Universidade

do

Estado

da

Bahia;

Especialista

em

Psicopedagogia Escolar e Clnica (FEBA), em Contabilidade Gerencial (UFBA); e em


Educao Distncia (UCB); mestrado em Contabilidade pela Fundao Visconde de Cairu;
e doutorado em Desenvolvimento Curricular pela Universidade do Minho/Portugal. Silva atua
na rea de metodologia de pesquisa e este livro apresenta uma metodologia voltada,
especificamente, para a disciplina da rea das Cincias Humanas Aplicadas.

175

APNDICE C Conjunto de categorias iniciais


Categorias iniciais do Modelo Categorial para trabalhos acadmicos (teses e dissertaes).
CONCEITO
(ANLISE CONCEITUAL)
C1. TEMA (o que trata a pesquisa)
C2. DIMENSO (lugar, tempo, objeto
emprico ou ambiente)

C3. AO (os objetivos do estudo)

C4. CAUSA (razo ou motivo) E EFEITO


(produto de uma causa)

C5. FUNDAMENTO TERICO

C6. MTODOS
C7. COLETA DE DADOS
C8. PONTO DE VISTA DO AUTOR;
PERSPECTIVA
C9. PRINCIPAIS RESULTADOS
ALCANADOS

176

APNDICE D Conjunto de categorias intermedirias


CONCEITO
(ANLISE CONCEITUAL)
C1. TEMA (o que trata a pesquisa)
C2. AMBIENTAO (lugar, tempo,
objeto emprico ou ambiente)

C3. ESCOPO (os objetivos do estudo)

C4. CAUSA (razo ou motivo) E EFEITO


(produto de uma causa)

C5. FUNDAMENTO TERICO

C6. MTODOS
C7. COLETA DE DADOS
C8. PONTO DE VISTA DO AUTOR;
PERSPECTIVA
C9. PRINCIPAIS RESULTADOS
ALCANADOS

177

APNDICE E Definies para o conjunto de categorias finais


Conjunto de categorias finais: C1.Tema; C2.Objeto emprico; C3.Escopo;
C4.Ambientao; C5.Tipo de pesquisa; C6.Coleta de dados; C7.Mtodos; C8.Fundamento
terico; C9.Fundamento histrico/contextual; C10.Resultados.
C1.Tema
Assunto, ideia ou proposio que se desenvolve em um discurso, em uma obra didtica ou
literria (CUNHA; CAVALCANTI, 2008, p.358).
o assunto escolhido sobre o qual versar o Trabalho; um assunto que se deseja
estudar profundamente, pois no interessa somente saber o tema de modo vago, indefinido,
ele deve ser conciso, com limites bem definidos, facilitando o encaminhamento da pesquisa
(SILVA, 2010, p.43).
O tema de uma pesquisa o assunto que se deseja provar ou desenvolver [...] uma
proposio at certo ponto abrangente (MARCONI; LAKATOS, 2010, p.112).
o assunto que se deseja estudar e pesquisar [...] significa: selecionar um assunto de
acordo com as inclinaes, as possibilidades, as aptides e as tendncias de quem se
prope a elaborar um trabalho cientfico; encontrar um objeto que merea ser investigado
cientificamente e tenha condies de ser formulado e delimitado em funo da pesquisa
(MARCONI; LAKATOS, 2010, p.142).
C2.Objeto emprico
Unidade documentria; arquivo, imagem, pgina web, base de dados ou qualquer item de
um sistema informtico; em hipertexto, um boto que representa informao; artefato
tridimensional ou rplica de uma entidade; conjunto de bits que so vistos como entidades
prprias (p. ex.> documento de texto completo) ou, como parte de outro objeto digital (como
uma imagem que faz parte de um livro), geralmente associados com metadados e, algumas
vezes, com condies especiais para acesso (CUNHA; CAVALCANTI, 2008, p.265).
Que se distinga [...] o objeto de uma questo (SILVA, 2010, p.44).
uma poro ou parcela, convenientemente selecionada do universo (populao); um
subconjunto do universo (SILVA, 2010, p.73).
Explorao de documentos fontes do objeto pesquisado e registro das informaes
retiradas nessas fontes e que sero utilizadas no desenvolvimento do trabalho; [...] fonte
dirvel de informao sobre os fenmenos pesquisados (SEVERINO, 2007, p.124).
Conjunto de informaes que lhe permitir a escolha da amostra, que deve ser
representativa ou significativa (MARCONI; LAKATOS, 2010, p.146).
C3.Escopo
Intuito, inteno (FERREIRA, 1988, p.263).
Determinar a profundidade, abrangncia e extenso do assunto; o que se quer saber ou o
que se quer fazer a respeito do sujeito [tema] (SILVA, 2010, p.44).
So os fins tericos e prticos que se prope alcanar com a pesquisa (SILVA, 2010,
p.50).
Toda pesquisa deve ter um objetivo determinado para saber o que vai procurar e que se
pretende alcanar. [...] o objetivo torna explcito o problema, aumentando os conhecimentos
sobre determinado assunto. Para Ackoff (1975, p.27) o objetivo da cincia no somente
aumentar o conhecimento, mas o de aumentar as nossas possibilidades de continuar
aumentando o conhecimento [...] os objetivos podem definir a natureza do trabalho, o tipo
de problema a ser selecionado, o material a coletar (Cervo, 1978, p.49). Podem ser
intrnsecos ou extrnsecos, tericos ou prticos, gerais ou especficos, a curto ou a longo
prazo (MARCONI; LAKATOS, 2010, p.141).

178

C4.Ambientao
Ambientar: [ambientao o ato de ambientar-se]: adaptar-se a um ambiente (FERREIRA,
1988, p.36). Ambiente: [...] lugar, stio, espao, recinto (FERREIRA, 1988, p.36).
Tanto nos trabalhos tericos quanto nos que se voltam para atividades prticas
importante que o pesquisador estabelea limites no tempo e no espao. Isso porque se
torna impossvel conhecer e analisar dados referentes a um perodo muito longo ou rea
muito extensa. O espao fsico deve precisa ser decididamente considerado (MARCONI;
LAKATOS, 2010, p.230).
C5.Tipo de pesquisa
Atividades de pesquisa e desenvolvimento, isto , de investigao cientfica e tecnolgica;
construo e desenvolvimento de prottipos; execuo de projetos cientficos e
tecnolgicos; combinao das atividades de investigao e desenvolvimento de novos
produtos e processos (CUNHA; CAVALCANTI, 2008, p.281).
vrias so as modalidades de pesquisa que se podem praticar, o que implica coerncia
epistemolgica, metodolgica e tcnica, para seu adequado desenvolvimento. Pesquisa
quantitativa, pesquisa qualitativa [...]; etcnogrfica [...]; participante [...]; pesquisa-ao [...];
estudo de caso [...]; anlise de contedo [...]; bibliogrfica, pesquisa documental, pesquisa
experimental, pesquisa de campo [...]; exploratria, pesquisa explicativa (SEVERINO, 2007,
p.104-124).
C6.Coleta de dados
Dados que sero processados; dados que sero submetidos a qualquer das funes
bsicas de processamento, como sejam: codificao, registro, clculo, resumo e relatrio,
gravao e comunicao (CUNHA; CAVALCANTI, 2008, p.113).
Dentre os instrumentos utilizados de coleta de dados, podemos citar questionrio,
entrevista, formulrio e painel (SILVA, 2010, p.60).
Tcnica de coleta de informao: entrevista [...]; histria de vida [...]; observao [...];
questionrio (SEVERINO, 2007, p.124-125).
Etapa da pesquisa em que se inicia a aplicao dos instrumentos elaborados e das
tcnicas selecionadas, a fim de se efetuar a coleta de dados previstos; [...] so vrios os
procedimentos para a realizao da coleta de dados, que variam de acordo com as
circunstncias ou com o tipo de investigao. Em linhas gerais, as tcnicas de pesquisa so:
coleta documental; observao; entrevista; questionrio; formulrio; medidas de opinio ou
de atitudes; tcnicas mercadolgicas; testes; sociometria; anlise de contedo; histria de
vida; [...] tabela [...] quadro [...] grficos (MARCONI; LAKATOS, 2010, p.149).
C7.Mtodos
Ordem que se deve impor aos diferentes passos necessrios para chegar a um fim
determinado. No conhecimento, o caminho que o caminho que se deve seguir para chegar
verdade nas cincias (Descartes). Conjunto ordenado de procedimentos que servem para
descobrir o que se ignora ou para provar o que j se conhece. Processo sistemtico de
aquisio de conhecimento que segue uma srie de passos interdependentes (CUNHA;
CAVALCANTI, 2008, p.248).
Fazem-se necessrios os seguintes questionamentos: como, com o que ou com quem,
onde?; usa-se mais de um mtodo e mais de uma tcnica na realizao da pesquisa
(SILVA, 2010, p.53).
[Podem ser do tipo:] pesquisa bibliogrfica [...]; documental [...]; experimental ou de
laboratrio [...]; ex-post-facto [...]; pesquisa-levantamento [...]; de campo [...]; estudo de caso
[...]; pesquisa-ao [...]; participante [...]; exploratria [...]; descritiva [...]; explicativa [...];
tcnica (SILVA, 2010, p.53-60).

179

o conjunto das atividades sistemticas e racionais que, com maior segurana e


economia, permite alcanar o objetivo conhecimentos vlidos e verdadeiros traando o
caminho a ser seguido, detectando erros e auxiliando as decises do cientista (MARCONI;
LAKATOS, 2010, p.65).
Mtodos de procedimento seriam etapas mais concretas da investigao, com finalidade
mais restrita em termos de explicao geral dos fenmenos e menos abstratas [...] mtodo
histrico [...]; comparativo [...]; monogrfico [...]; estatstico [...]; tipolgico [...]; funcionalista
[...]; estruturalista [...]; etcnogrfico [...]; clnico [...]; quadro de referncia (MARCONI;
LAKATOS, 2010, p.88-95).
C8.Fundamento terico
Conjunto de regras e leis sistematicamente organizadas, que servem de base a uma
cincia e que explicam os fatos (CUNHA; CAVALCANTI, 2008, p.359).
Sntese geral que se prope a explicar um conjunto de fatos cujos subconjuntos foram
explicados pelas leis (SEVERINO, 2007, p.104).
Expor os referenciais terico-metodolgicos, ou seja, os instrumentos lgico-categoriais nos
quais se apoia para conduzir o trabalho investigativo e o raciocnio (SEVERINO, 2007,
p.131).
A teoria serve como orientao para restringir a amplitude dos fatos a serem estudados a
quantidade de dados que podem ser estudados em determinada rea da realidade finita;
[...] serve como sistema de conceptualizao e de classificao dos fatos; [...] resumir
sinteticamente o que j se sabe sobre o objeto de estudo, atravs das generalizaes
empricas e das inter-relaes entre afirmaes comprovadas [...] o cientista est
anunciando uma lei ao propor as regularidades que se apresentam uniformemente com as
manifestaes de uma classe de fenmenos; portanto, o universo de uma lei limitado,
abrangendo apenas determinada classe de fenmenos (MARCONI; LAKATOS, 2010, p.99107).
C9.Fundamento histrico/contextual
Contexto onde acontece o ciclo informacional e que influencia no seu fluxo e nas suas
caractersticas, gerando diferenas nos tipos de informao: informao tecnolgica,
informao para negcios, informao cientfica, etc. (CUNHA; CAVALCANTI, 2008, p.105).
Documento que descreve fatos, ou a evoluo de um fato e seus detalhes, em ordem
cronolgica (CUNHA; CAVALCANTI, 2008, p.187).
O mtodo histrico consiste em investigar acontecimentos, processos e instituies do
passado para verificar a sua influncia na sociedade (MARCONI; LAKATOS, 2010, p.89).
C10.Resultados
Consequncia, efeito, seguimento(FERREIRA, 1988, p. ).
Evidncias para a comprovao ou a refutao das hipteses [...] segundo a relevncia dos
dados [...] evidenciar as conquistas alcanadas com o estudo; indicar as limitaes e as
reconsideraes (MARCONI; LAKATOS, 2010, p.215).
O desenvolvimento de produtos pode ser visto como um processo, o que significa realizar
diversas atividades desde a gerao do conceito at a descontinuidade do produto
(JUGEND; SILVA, 2005).
Rozenfeld et al. (2006): um conjunto de atividades que so realizadas em uma seqncia
lgica com o objetivo de produzir um bem ou servio que tenha valor para um grupo
especfico de clientes.

180

APNDICE F Dados estatsticos do processo de extrao de conceitos

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

C8
C9
X

ITEM

C1

C2

C3

C4

C5

C6

C7

d037-2003
t013-2005
d025-2005
d026-2005
t010-2005
d029-2005
d022-2006
d021-2006
d023-2006
d020-2006
t011-2005
d031-2005
t014-2004
d018-2007
d038-2002
d036-2004
d030-2005
d028-2005
t015-2004
t012-2005
d015-2007
d017-2007
t009-2007
d016-2007
d010-2008
t006-2008
d024-2006
d009-2008
t001-2009
d019-2006
d007-2009
d008-2009
t003-2008
d004-2009
d014-2007
d011-2008
d012-2008
d027-2005
d013-2008
t002-2009
t004-2008

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

X
X
X
X
X
X
X
X
X

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

X
X

X
X

X
X

X
X
X

X
X
X

X
X
X

TOTAIS
%

41
100%

41
100%

39
95%

40
98%

19
46%

16
39%

28
68%

24
59%

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

C10

X
X
X

X
X

X
X
X
X

X
X
X
X

X
X
X

X
X

X
X
X
X

X
X
X

X
X
X

X
X
X
X

X
X

X
X
X

X
X
X
X
X

X
X
X
X

X
X
X

X
X
X

X
X
X
X
X
X
X

X
X
X
X

X
X

X
X

X
X

X
X

10
25%

181

APNDICE G Termos de indexao dos resumos


1

AACR

45

Documentao cientfica

AIDS

46

Documentos arquivsticos

Anlise de assunto

47

Dspace

Anlise de citaes

48

Educao fsica

Anlise de clusters

49

Empresas de informtica

Anlise documentria

50

Entrevistas

Anlise facetada

51

Estatstica, mensurao

Anlise fatorial

52

Estrutura profunda DEPAm

Arquitetura da informao

53

Estudo de caso

10

Arquivos

54

Estudos bibliomtricos, cienciomtricos e infomtricos

11

Atendimento ao cliente

55

Estudos da produo e da produtividade cientfica

12

Atendimento em call centers

56

13

Automao de unidades de informao

57

Estudos de autoria
Estudos de canais, veculos, ciclos e modelos de
comunicao

14

Avaliao de bases de dados

58

Estudos de citao

15

Avaliao de peridicos

59

Estudos de usurio

16

Avaliao de servios e de unidades de informao

60

17

Avaliao de sites

18

Avaliao e desenvolvimento de colees

61

Estudos sobre fontes de informao


Estudos sobre outros servios e unidades de
informao

19

Balco de informaes (Help-Desk)

62

Ferramenta de anlise de citaes

20

Base de dados Qualis

63

Ferramenta de avaliao

21

Bases de dados

64

Fundamentao epistemolgica

65

Gerncia de recursos informacionais (GRI)

66

Gerncia organizacional

67

Gesto documental

68

Grficos e planilhas

69

22

Bibliometria, cienciometria, infometria

23

Biblioteca (digital, virtual e eletrnica)

24

Bibliotecas tradicionais

25

Cabealhos de assunto

26

Campo cientfico

27

Caracterizao e comportamento do usurio

70

Hipertexto e hipermdia
Histria da arquivologia, da biblioteconomia, da
documentao e da cincia da informao

28

Catalogao/catalogao cooperativa

71

Incidente crtico

29

Catlogos on-line

72

Indexao (automtica e manual)

30

Centros populares de documentao e comunicao

73

Informao cientfica e tecnolgica

31

Cincia da Computao

74

Informao textual (impresso e digital)

32

Cincias fsicas

75

Informtica

33

Cincias sociais

76

Instituio bancria

34

Classificao

77

Instituies de sade

35

Classificao facetada

78

Interao homem-computador

36

Compatibilidade (linguagens, vocabulrios, contedos)

79

Interdisciplinaridade

37

Competncia Informacional

80

Interfaces hipertextuais

38

Construo civil

81

Leis bibliomtricas

39

Descrio Bibliogrfica (FRBR)

82

Linguagens documentrias

40

Desenvolvimento de colees

83

Literatura (literatura infantil)

41

Divulgao cientfica

84

Mapa Conceitual

42

Divulgao cientfica - Bordieu

85

Mapa Hipertextual MHTX

43

Divulgao cientfica - Knorr-Cetina

86

Mapas de tpicos

44

Divulgao cientfica - Kuhn

87

Mecanismos de busca (search engines)

182

88

Metacognio

129

Produo audiovisual

89

Metadados

130

Pronturio eletrnico

90

131

Pronturio mdico

91

Metadados (Modelo metadados - novo)


Metadados Padro Brasileiro de Metadados para
Teses e Dissertaes - MTD-BR

132

Protocolo verbal

92

Metadados Padres Dublin Core

133

Publicaes oficiais

93

Metadados Padres MARC

134

Questionrio

135

Recuperao da informao

136

Redes eletrnicas de informao

137

Relaes semnticas

138

Representao temtica

139

Requisitos da especificao MoReq

140

Scripts de atendimento

141

Servios de extenso bibliotecria

142

Servios de sade

143

Setor privado

144

Setor pblico

145

Setor turstico

146

Sintagmas nominais

147

Sistema de Bibliotecas da UFMG Pergamum

148

Sistema de informao

149

Sistema de informao gerencial

150

94

Mtodo analtico-sinttico

95

Mtodo de anlise de contedo

96

Mtodo indicirio

97

Mtodo Pejtersen (indexao)

98

Metodologia de modelagem de dados

99

Metodologia de pesquisa

100

Metodologia OGMA

101

Metodologia WEKA

102

Microfilmes

103

Modelagem conceitual

104

Modelagem de dados

105

Modelo entidade-relacionamento (MER)

106

Multidisciplinaridade

107

Norma ISO 2788

108

Norma ISO 704

109

Norma tcnica (vigente e proposta)

110

Ontologia

151

Sistema de informao hospitalar


Sistemas de gerenciamento eletrnico de documentos
(GED)

111

Organizao do conhecimento

152

Sistemas de recuperao da informao

112

153

Sistemas para automao de unidades de informao

113

Outras questes tericas


Outros sistemas e tecnologias de comunicao e
informao

154

Sites

114

Pesquisa bibliogrfica

155

Sociologia do conhecimento e da cincia

156

Software livre (OpenLibris)

157

Tecnologias da informao

158

Tecnologias da informao arquivstica

159

Telecomunicao

160

Teoria da comunicao

161

Teoria do conceito

162

Teorias e conceitos de Informao

163

Terminologia

164

Tesauro

165

Universidade (pblica)

166

Usabilidade

167

Uso da informao e de unidade de informao


Uso e impacto das novas tecnologias de comunicao
e informao

115

Pesquisa cientfica

116

Pesquisa comparativa

117

Pesquisa descritiva

118

Pesquisa documental

119

Pesquisa emprica

120

Pesquisa experimental

121

Pesquisa exploratria

122

Pesquisa qualitativa

123
124

Pesquisa terica
Planejamento, organizao e gerncia de servios e de
unidades de informao.

125

Portal de Peridicos Capes

126

Prefeituras

127

Prestadora de servios de sade

128

Prestadoras de servio

168

183

APNDICE H Metodologias de anlise categorial temtica


Apresentao de propostas de mtodos de Anlise de Contedo.
MORAES (1999)
Etapa 1: Preparao das informaes:
identificao das amostras de informao
para a anlise compatveis com o objetivo
pretendido, e estabelecer um cdigo para
identificar os diferentes documentos
analisados;
Etapa 2: Unitarizao ou transformao
do contedo em unidades: definio das
unidades de anlise para cada contedo
significativo para atender ao objetivo
proposto, que deve ser representado por
um termo-isolado, e codificao
sequencial, a partir do cdigo de origem,
isto , dos diferentes documentos
analisados;
Etapa 3: Categorizao ou classificao
das unidades em categorias: agrupar os
dados, segundo o objetivo proposto, a
partir de critrios semnticos (temticos),
sintticos (verbos, adjetivos etc.), lxicos
ou expressivos (problemas de linguagem).
A categorizao pode ser feita a priori ou
a partir dos dados, devendo o conjunto
obedecer s caractersticas de vlidas,
exaustivas e homogneas, mutuamente
exclusivas e consistente;
Etapa 4: Descrio: para pesquisa
quantitativa, a descrio ser feita atravs
de tabelas e quadros, com freqncias e
percentuais. Para abordagem qualitativa,
produzir um texto sntese para indicar o
conjunto de significados,
preferencialmente a partir de citaes
diretas dos dados originais;
Etapa 5: Interpretao: inferir (pesquisa
quantitativa) se os resultados permitem
generalizaes a partir da amostra
analisada, e interpretar (pesquisa
qualitativa) por meio da compreenso dos
resultados, atravs da fundamentao
terica a priori ou da criao da teoria a
partir dos documentos analisados.
Fonte: Elaborado pela autora.

OLIVEIRA (2008)

Etapa 1: Pr-anlise: escolha dos


documentos ou definio do corpus
de anlise, com a formulao das
hipteses e dos objetivos da anlise,
alm da elaborao dos indicadores
que fundamentam a interpretao
final;

Etapa 2: Explorao do material ou


codificao: os dados so
transformados sistematicamente e
agrupados em unidades que
permitem uma descrio exata das
caractersticas pertinentes ao
contedo dos documentos
analisados;

Etapa 3: Tratamento dos resultados,


inferncia e interpretao: explicitar
as informaes obtidas na anlise,
atravs de quantificao simples
(freqncia) ou mais complexas, tal
como a anlise fatorial, de forma a
apresentar os dados em diagramas,
figuras, modelos etc. Outra forma,
uma descrio cursiva de cada
categoria, seguidas de
exemplificaes de unidades de
registros significativas, em forma de
tabelas e grficos, quadros com
descries cursivas ou outros.

184

APNDICE I Outros resultados da anlise do corpus da pesquisa


Para uma demonstrao mais detalhada, a seguir so apresentados os grficos da
tabulao realizada em algumas categorias: C1. Tema, C2. Objeto, C7. Mtodos, C5. Tipo
de pesquisa, e C6. Coleta de dados, nessa ordem.
Categoria C1: Tema
A categoria C1 representa 100% dos temas que so abordados nos estudos na linha de
pesquisa OUI, que fazem parte do corpus desta pesquisa. Para a anlise do GRFICO 3, a
seguir, preciso considerar que h duas vertentes na linha de pesquisa denominada
Organizao e Uso da Informao (OUI): uma vertente organizao da informao e outra
vertente estudos de uso.
GRFICO 3 Relao dos temas abordados no corpus

Fonte: Elaborado pela autora.


Primeiramente, apresenta-se que em outros temas esto includos 11 temas, com uma
ocorrncia cada, que podem ser assim classificados: anlise de assunto (organizao),
arquitetura da informao (organizao), arquivos (organizao), compatibilidade de
linguagens (organizao), desenvolvimento de colees (uso), interdisciplinaridade
(organizao), linguagens documentrias (organizao), sistemas de recuperao da
informao (organizao), tecnologias da informao (organizao), outros sistemas de
informao (organizao) e metadados (organizao).
Na vertente organizao ainda esto includos os temas: representao da informao,
indexao, bases de dados, recuperao da informao, organizao do conhecimento e
organizao da informao. Na vertente de uso esto includos ainda os temas: estudos
de usurio e estatstica e mensurao.

185

QUADRO 14 Sntese estatstica dos temas


VERTENTE ORGANIZAO
Anlise de assunto, Arquitetura da informao,
Arquivos, Compatibilidade de linguagens,
Interdisciplinaridade, Linguagens documentrias,
Sistemas de recuperao da informao,
Tecnologias da informao, outros sistemas de
informao e metadados

VERTENTE DE USO

25

Representao da informao

14

Indexao

Estudos de usurio

27

Bases de dados

Estatstica e mensurao

Recuperao da informao

Desenvolvimento de colees

Organizao do conhecimento

Organizao da informao

TOTAL

66%

TOTAL

34%

Fonte: Elaborado pela autora.

Assim, a vertente organizao totaliza 66% dos temas das pesquisas e a vertente uso
totaliza 44% dos temas. Isso sinaliza que, na linha OUI, os temas da vertente organizao
so mais numerosos, o que pode ser compreendido pelo fato de que somente um, entre os
nove docentes desta linha de pesquisa, se dedica, especialmente, aos estudos de uso da
informao. Mas preciso esclarecer que na linha de pesquisa Informao, Cultura e
Sociedade (ICS) h investigaes cujos temas abordam o uso de informao,
principalmente em estudos de comportamento do usurio. Entretanto, o escopo desta
pesquisa no abarcou resultados das outras linhas de pesquisa, ficando somente essa
explanao como uma pressuposio, para, talvez, um estudo futuro.
Categoria C2: Objeto emprico
A categoria C2 representa 100% dos objetos empricos utilizados para investigao nos
estudos na linha de pesquisa OUI que fazem parte do corpus desta pesquisa, apresentados
no GRF. 4.

186

GRFICO 4 Relao dos objetos empricos utilizados no corpus

Objetos Empricos
Software de biblioteca
Sites (setor turstico)
Scripts de atendimento
Relaes semnticas
Redes eletrnicas
Produo audiovisual
MTD-BR
Outros sistemas de informao
Microfilmes
Mapas de tpicos
Literatura infantil
Interfaces hipertextuais
Informaes gerencial
Help-desk
Estudos da produo cinetfica
Documentos arquivsticos
Catlogos online
Cabealhos de assunto
Avaliao de sites
Sintagmas nominais
Inform. cientfica e tecnolgica
Hipertexto
Portal Capes
Pronturio mdico
Informao textual (impresso e digital)
Documentao cientfica
0

Fonte: Elaborado pela autora.

Observa-se bastante heterogeneidade de objetos empricos, ainda que documentao


cientfica e informao textual (impresso e digital) tenham alcanado o percentual de 27%
do total. Entretanto, nesses dois itens esto includos as definies retiradas da literatura,
referncias bibliogrficas, informaes estratgicas, literatura especializada, termos de
indexao de artigos cientficos. Um ponto interessante a ser destacado o fato de trs
trabalhos utilizarem os pronturios mdicos para os estudos na linha de pesquisa OUI.
Parece haver, atualmente, uma preocupao especial com o fluxo de informaes mdicas,
principalmente aps os hospitais e clnicas iniciarem a implantao de pronturios
eletrnicos.
Categoria C7: Mtodos
A categoria C7 teve preenchimento para 28 documentos do corpus, o que equivale a 68%
do total. importante salientar que um mesmo documento muitas vezes indicou a utilizao
de mais de um mtodo de pesquisa, conforme o GRFICO 5, a seguir.

187

GRFICO 5 Mtodos utilizados nas pesquisas do corpus

Mtodos

40%

20%

0%

Anlise documentria

Estatstica - Bibliometria

Classificao/Anlise facetada

Anlise de citaes

Anlise de contedo

Avaliao de servios

Mtodo analtico-sinttico

Protocolo verbal

Outros mtodos (1 ocorrncia)

Nenhum mtodo apresentado

Fonte: Elaborado pela autora.

No item outros mtodos h dez diferentes mtodos, com uma ocorrncia cada. Os
mtodos so: indicirio (citaes), estrutura profunda DEPAm (anlise de contedo), gesto
documental (para arquivos), incidente crtico (uso/usurios), modelagem de dados
(organizao), modelagem conceitual (organizao), OGMA (anlise de texto), WEKA
(minerao de dados), entidade-relacionamento (modelagem de dados) e requisitos MoReq
(gesto de arquivos eletrnicos). O mtodo da anlise documentria e o mtodo da
classificao/anlise facetada, que aparecem em primeiro e terceiro lugar de uso,
respectivamente, so geralmente aplicados quando a pesquisa aborda a organizao de
informaes. O segundo mtodo mais utilizado o de estatstica/bibliometria, que
geralmente utilizado nas pesquisas de estudo de usurio, numa abordagem quantitativa,
mas geralmente houve uma anlise qualitativa a partir dos nmeros encontrados. Foi
interessante notar, que o mtodo estatstica/bibliometria foi utilizado em cinco trabalhos,
mas nenhum dos resumos caracterizou a pesquisa como quantitativa. Parece haver um
movimento no sentido de entender que pesquisas qualitativas trazem resultados mais
interessantes do que os estudos quantitativos. Entretanto, acredita-se que a combinao de
abordagens enriquece bastante os resultados de uma pesquisa, a quantitativa para
validao dos dados e a qualitativa para a interpretao dos mesmos.
Categoria C5 e C6: Tipo de pesquisa e Coleta de dados
Apesar de o preenchimento das categorias C5 e C6 ter sido possvel em menos de 50% dos
documentos, considerou-se interessante ter uma viso parcial dos tipos e dos instrumentos
utilizados nas pesquisas. Por essa razo, esses dois grficos esto apresentados por ltimo
e sero considerados como resultados parciais da anlise.
O GRFICO 6 mostra o resultado referente ao preenchimento do campo C5 de 19
documentos do corpus, que so 46% do total, indicando, na primeira linha, o nmero de
resumos que no incluram o tipo de pesquisa.

188

GRFICO 6 Tipos das pesquisas referentes ao corpus


25

22

20
15
10

No apresentaram

Qualitativa

Comparativa

Estudos de caso

Experimental

Exploratria

Emprica

Quantitativa

Terica

Levantamento bibliogrfico

Descritiva

Documental

Fonte: Elaborado pela autora.

Esclarece-se que uma mesma pesquisa s vezes indica mais de um tipo de pesquisa, o que
bastante comum em estudos na rea da CI. De acordo com o grfico, prevalecem mesmo
as pesquisas de cunho qualitativo de anlise de dados, sobretudo quando trata de estudos
de usurio. Outro dado interessante refere-se s pesquisas comparativas, pois nota-se que
elas so utilizadas para indicar melhores formas de organizao da informao, pois
geralmente se recorre s comparaes entre dois tipos de organizaes diferentes, em um
mesmo tipo de ambientao, para provar um ponto/fato qualquer. A alta incidncia de
estudos de caso parece indicar que as pesquisas de campo tm sido utilizadas para
conhecer as conjunturas da sociedade. Entretanto, parece haver certa resistncia da
comunidade acadmica a esse tipo de pesquisa, sobretudo porque geralmente so anlises
minuciosas sobre um nico caso, prejudicando as generalizaes to desejadas pela maior
parte dos pesquisadores.
E, finalmente, o GRF. 7 mostra o resultado parcial referente ao preenchimento do campo
C6 de 16 documentos do corpus, que representam 39% do total.
GRFICO 7 Tipos de instrumentos de coleta de dados

Instrumentos de coleta de dados


Entrevista
Incidente crtico
Levantamento bibliogrfico

Questionrio
Grficos e planilhas

10
8
6
4

2
0

Fonte: Elaborado pela autora.

6
3

189

Por este resultado (parcial), nota-se que as entrevistas e os questionrios so os


instrumentos de coleta de dados mais utilizados. Alm disso, preciso esclarecer que em
uma mesma pesquisa houve o uso concomitante de distintos instrumentos de coleta de
dados.
Isso demonstra que o grau de envolvimento dos pesquisadores com os respondentes,
conforme FIG. 19.
FIGURA 19 Envolvimento do pesquisador com respondentes

Fonte: Cao (2008)81

Partindo da FIG. 19, observa-se que o pesquisador, geralmente, tem um grau de


envolvimento com seus respondentes que fica entre mdio a baixo, em uma abordagem
mais positivista, ainda que haja uma anlise qualitativa dos dados coletados.
Esse resultado, ainda que considerado parcial, indica que conhecer as particularidades das
pesquisas pode ser muito importante para orientar futuras pesquisas na rea da CI. Permite
minimizar os retrabalhos, por exemplo, o que acontece na elaborao de questionrios. Se
for possvel localizar facilmente os questionrios utilizados nas pesquisas, isso pode evitar
que se comece a elaborao de um questionrio do zero.

81

CAO, Rosrio. Anlise qualitativa de dados com o NVIVO. 31 de out. 2008. Disponvel em:
<http://slidesha.re/11XyZq>. Acesso em: 12 mar. 2011.

190

ANEXOS
ANEXO A Modelo de busca facetada: prottipo TerveSuomi.fi

Disponvel em: <http://demo.seco.tkk.fi/tervesuomi/home>.

191

ANEXO B Modelo de busca facetada: Relation Browser Demo

Fonte: Disponvel em: <http://idl89.ils.unc.edu/rb07/ebailey818/>.

S-ar putea să vă placă și