Documente Academic
Documente Profesional
Documente Cultură
Belo Horizonte
Junho, 2011
Belo Horizonte
Junho, 2011
ngela
Borm
de
M175t
2011
Dedico, ainda,
a meu pai (in memoriam)
em quem sempre me espelhei.
AGRADECIMENTO ESPECIAL
Agradeo especialmente professora Gercina A. B. de O. Lima, que inicialmente foi
orientadora, depois amiga, e, hoje, um gostoso misto disso tudo.
Sou sua orientada desde 2007, ainda na iniciao cientfica, e, desde ento, venho
aprendendo muito com ela, minha eterna Mestre.
Em um dado momento, tornamo-nos amigas...
Como amiga, sentiu minhas dores... Tambm riu de minhas bobagens!
E nos divertimos bastante...
E trabalhamos muito!
Ento, meu agradecimento para a amiga e para a orientadora...
Como amiga esteve sempre por perto, efetiva e afetivamente entendendo o que passei no
mestrado, e sendo solidria em todos os momentos.
J como orientadora, se manteve firme nas exigncias, mas constantemente paciente,
encorajadora e generosa.
E sempre disposta a tirar o melhor de mim.
Nossa convivncia composta de liberdade, empatia e comprometimento.
Obrigada Gessy, pois voc especial para mim e abenoada pelos Anjos!
Obrigada, por me ensinar!
AGRADECIMENTOS
No me dem um espao para escrever livremente... eu aproveito!
Deus Superior, que me conforta, ilumina e a quem sou grata pelo muito que tenho, ainda
que, s vezes, no entenda seus desgnios. Agradeo a Ele por me fazer otimista!
Aos meus pais, de quem me orgulho e dos quais aprendi importantes lies (e ainda
aprendo!).
Ao meu filho Sandro, com quem tenho muitas afinidades e admiro a inteligncia, lealdade e
companheirismo. Se chegar a um impasse, sei que posso contar com ele e com sua clareza
de ideias. Sua contribuio neste estudo foi inestimvel, principalmente nos ltimos
momentos. Obrigada, filhinho!
Patrcia, querida mediadora, e Serginho, meus filhos por afeio. E ao Xande, por toda a
ateno e considerao, o que no tem preo.
Tininha, mais que uma estimada e querida irm, uma filha por afeto. E ao Wagner, pela
amizade e carinho sem medida.
Libria, meu anjo da guarda, que cuida de mim, principalmente nos ltimos seis anos.
minha famlia, to numerosa que seria impossvel citar: irmos, irms, cunhados e
cunhadas, com os quais festejo e decomponho tristezas.
minha irm Isabel, especialmente, que tambm leu este trabalho.
Aos sobrinhos e sobrinhas, suas namoradas e namorados, e queridos agregados! Adoro a
todos vocs, ao que compartilhamos e a nossas sadas juntos!
Aos amigos de infncia, dos tempos memorveis em Monl.
turma de amigos do Sandro, aos quais verdadeiramente estimo, valorizo e aprecio. Adoro
a companhia e convvio!
Noca, amiga que sempre cuida de mim.
Ao marco ECI em minha vida, na graduao em Biblioteconomia, em 2005, que me fez
renascer. Encontrei amigos, desafios e um mundo acadmico desconhecido, que me salvou!
Na trajetria at aqui, muitas pessoas foram importantes: obrigada! Esto todos guardados
em meu corao.
profa. Marlene, primeira incentivadora, acertando-me com palavras animadoras.
profa. Beatriz, primeira orientadora: fui sua monitora e ela me incentivou a querer mais.
profa. Adriana Bogliolo que estimulou-me a escrever o primeiro artigo.
Aos professores que instigaram-me em sala de aula: Adriana, Alcenir, Antnio, Bax, Beatriz,
Bernadete, Casal, Cludia, Devanir, Eduardo, Gercina, Guiomar, Helena, Leandro, Ldia,
Mrcia Milton, Marlene, Marta Arajo, Marta Aun, Maurcio, Mnica, Oswaldo, Paulo da
Terra, Renato, Ricardo, Vander e Vera.
Aos professores de fora de sala de aula, dos quais me orgulho: Ana Maria, Cida Moura,
Conceio, Cristina, Jorge Tadeu, Jlia, Marlia, Marta Pinheiro, Lgia e Rose.
Aos professores Alcenir, Bernadete, Casal, Cristina, Guiomar, Mnica e Paulo da Terra, pelo
carinho especial.
Aos funcionrios e colaboradores da ECI, sobretudo a Claudinha, Lucimeire, Luiz Henrique,
Roberto, Snia, Walisson.
Aos eternos amigos da sala dos bolsistas, com os quais aprendi demais, especialmente
Aline, Aninha e Lorena.
Carol Cota, estimada amiga, que esteve comigo toda a graduao e que sempre
generosa comigo. Que leu, palpitou e normalizou este trabalho. Que me aceita, implica, s
vezes, e a quem abuso com meus pedidos de ltima hora: e ela nunca falha! Vale ouro!
Aos colegas de graduao, pela cumplicidade desse tempo inesquecvel, em especial ao
Diplofundo, Cris, Ju, Michella e Raquel.
Aos colegas de ps-graduao, pelo conhecimento compartilhado.
Graciane, querida amiga, to determinada e disciplinada! Alma boa!
Fernanda, valiosa amiga, de todas as horas, pelos momentos divididos e pelas alegrias
multiplicadas. Ta-ta-de-mais!
rica Sarsur, pelas correes, pontuaes e melhoras lingusticas neste texto.
Aos colegas do MHTX, entre bolsistas e orientandos, pelo enriquecimento advindo das
calorosas discusses, pela ajuda dos bolsistas e, tambm, pela saudosa MHTXroska.
ajuda inestimvel de Patrcia Penido.
Ao Flvio Pontes, por sua grande contribuio nesta pesquisa, pelas figurinhas trocadas, por
sua seriedade, dedicao e comprometimento.
s professoras Cristina, Ldia e Madalena, pelas valiosas contribuies na etapa de
qualificao.
Aos amigos da secretaria do PPGCI, Clio, Gisele e Nely, pela competncia do trabalho e
pelo constante apoio administrativo e no atendimento de excelncia. Vocs so demais!
Aos amigos da Biblioteca Etelvina Lima, especialmente Elaine e Eliane, pelo suporte,
sobretudo no momento de levantamento de dados deste trabalho.
CAPES, pela contribuio financeira durante o desenvolvimento deste estudo.
Aos professores, Eduardo Wense, Cristina Ortega, Ldia Alvarenga e Maurcio Almeida, que
me honraram ao aceitar meu convite para compor a Banca de Defesa desta Dissertao.
RESUMO
Esse trabalho investigou o uso da taxonomia facetada como instrumento de organizao da
informao, para dar consistncia e padronizao aos contedos informacionais de
trabalhos acadmicos. A finalidade foi facilitar o acesso s informaes, apresentando ao
usurio a opo de uma navegao pelos termos da estrutura facetada, apresentados em
uma interface de busca. O ambiente de pesquisa foi a biblioteca digital de teses e
dissertaes (BDTD), da Escola de Cincia da Informao (ECI), da Universidade Federal
de Minas Gerais (UFMG), tendo como insumo as teses e dissertaes oriundas da linha de
pesquisa Organizao e Uso da Informao. O objeto emprico foram as dez categorias
fundamentais temticas e os termos que as alimentaram, procedentes da anlise conceitual
realizada nos resumos informativos dos trabalhos acadmicos do corpus. O objetivo
norteador deste estudo foi criar uma taxonomia facetada navegacional, denominada
TAFNAVEGA, a partir de uma matriz categorial desenvolvida para trabalhos acadmicos,
visando demonstrar a sua adequao para a representao sistematizada e semntica do
contedo de teses e dissertaes. Pretendeu, ainda, contribuir para maior visibilidade do
contedo das pesquisas cientficas e facilitar a busca e a recuperao dessas informaes.
A metodologia envolveu procedimentos de natureza emprica, exploratria, com uma
abordagem qualitativa em relao anlise da literatura especializada da rea. Alm disso,
recorreu ao mtodo de pesquisa aplicada, visto que ofereceu a criao de um mecanismo
para ser empregado na navegao facetada. Esse percurso metodolgico incluiu o uso da
teoria da anlise de domnio para a identificao do domnio, do usurio da BDTD e de suas
necessidades informacionais, assim como do Modelo de Leitura Documentria, de Fujita e
Rubi (2006), para o desenvolvimento da matriz categorial para trabalhos acadmicos. Para a
criao das categorias fundamentais temticas foi utilizado o mtodo da anlise de
contedo, com a tcnica da anlise categorial temtica, juntamente com os princpios da
teoria da anlise facetada de Ranganathan. A reviso de literatura foi pautada em trabalhos
sobre navegaes facetadas atravs de taxonomias tambm facetadas, utilizadas como
instrumento facilitador da explorao, busca e recuperao de informaes em diferentes
bibliotecas digitais. Ademais, a fundamentao se baseou em conhecimentos relacionados
com a busca e a recuperao em sistemas de recuperao da informao. Abordou, ainda,
o vocabulrio controlado do tipo taxonomia, as bibliotecas digitais, focando a ateno em
bibliotecas de teses e dissertaes, e a navegao hipertextual, mostrando a navegao
pela taxonomia facetada. Os resultados demonstraram que o mecanismo TAFNAVEGA
facilitou a tarefa de explorao, busca e recuperao de contedos dos documentos, dando
acesso a dados tais como teorias, mtodos e instrumentos de coleta de dados,
possibilitando combinar essas diferentes informaes. Conclui-se que a possibilidade de
refinamento da busca atravs da estrutura da taxonomia facetada navegacional auxilia o
usurio a explorar os resultados das pesquisas concludas, uma vez que d maior
visibilidade ao contedo disponvel na biblioteca digital de teses e dissertaes, sem
sobrecarreg-lo de informaes.
Palavras-chave: Taxonomia facetada navegacional. Navegao facetada. Busca e
recuperao da informao. Biblioteca digital de teses e dissertaes. Matriz categorial para
trabalhos acadmicos. Teoria da anlise de domnio. Anlise categorial temtica.
ABSTRACT
This dissertation studies the use of faceted taxonomy as an instrument of organization of
information in order to give consistency and standardization to informational contents of
university papers. Its aim was to facilitate the access to information, offering to users the
possibility to navigate through the terms of the faceted structure, presented in a search
interface. We had as input thesis and dissertations which followed the line of research
Organization and Use of Information of the digital library of thesis and dissertations (BDTD)
of the Information Science College (ECI) of the Federal University of Minas Gerais (UFMG).
The empirical object were the ten fundamental thematic categories and the terms which fed
them, coming from the conceptual analysis carried out in the information summaries of the
university papers of the corpus. The objective of this study was also to make up a navigating
faceted taxonomy, called TAFNAVEGA, from a category matrix developed for university
works, aiming to demonstrate its adequacy to the systematized and semantic representation
of the content of thesis and dissertations. In addition to that, this work intends to contribute
for more visibility of the content of scientific researches, and to facilitate the search and
retrieval of this information. The methodology encompasses procedures of exploratory and
empirical nature, with a qualitative approach in relation to the analysis of the literature of that
field. Besides, it made use of the method of applied research, inasmuch as it showed a
mechanism to be used in faceted navigation. This methodological route included the use of
the theory of domain analysis to identify the domain, the BDTD user, and his information
needs, as well as the Model of Documentary Reading, by Fujita and Rubi (2006) for the
development of the category matrix for university works. For the creation of the fundamental
thematic categories were used the method of content analysis, the technique of the thematic
category analysis, together with the principles of the theory of faceted analysis of
Ranganathan. The literature review was based on papers about faceted navigation through
faceted taxonomies, used as instrument to explore, search and retrieve information in
different digital libraries. The grounding based itself on knowledge related to search and
retrieval in information retrieval systems, approaching the vocabulary of the taxonomy type,
the digital libraries, focusing on thesis and dissertation libraries, and the hypertextual
navigation, showing this through faceted taxonomy. The results demonstrated that the
mechanism TAFNAVEGA facilitated the task of exploration, search and retrieval of content of
documents, giving access to data such as theories, methods and instruments of data
gathering, enabling the combination of these different pieces of information. We conclude
that the possibility of search improvement through the structure of the navigating faceted
taxonomy helps the user to explore the results of finished researches, inasmuch as it
provides more visibility to the content available in the digital library of thesis and
dissertations, without overloading it with information.
Keywords: Navigating faceted taxonomy. Faceted navigation. Search and retrieval of
information. Digital library of thesis and dissertations. Category matrix for university papers.
Theory of domain analysis. Thematic category analysis.
LISTA DE FIGURAS
FIGURA 1 Grau de complexibilidade em diferentes vocabulrios controlados .................. 45
FIGURA 2 Esquema da rvore de Porfrio ..................................................................... 49
FIGURA 3 Ilustraes de rvore Baniana ......................................................................... 50
FIGURA 4 Exemplo de taxonomia navegacional............................................................... 57
FIGURA 5 O sujeito na Anlise de Domnio ...................................................................... 77
FIGURA 6 Processo de extrao de conceitos dos resumos informativos do corpus...... 126
FIGURA 7 Envolvimento do pesquisador com respondentes .......................................... 130
FIGURA 8 Tabela para elaborao de resumo informativo ............................................. 131
FIGURA 9 Tabela de categorias fundamentais ............................................................... 134
FIGURA 10 Campos e relacionamentos entre facetas .................................................... 135
FIGURA 11 Relaes entre documentos do corpus ........................................................ 136
FIGURA 12 Relao entre categorias ............................................................................. 136
FIGURA 13 Relao direta entre categorias e documentos ............................................ 137
FIGURA 14 Relao expandida entre categorias e documentos ..................................... 138
FIGURA 15 Resultado das interrelaes disponveis para recuperao ......................... 138
FIGURA 16 Busca usando a TAFNAVEGA (1) ............................................................... 139
FIGURA 17 Busca usando a TAFNAVEGA (2) ............................................................... 140
FIGURA 18 Busca usando a TAFNAVEGA (3) ............................................................... 141
FIGURA 19 Envolvimento do pesquisador com respondentes ........................................ 189
LISTA DE GRFICOS
GRFICO 1 Percentual de preenchimento das CAFTE (resumos do corpus) ................. 127
GRFICO 2 Problemas em resumos informativos do corpus da pesquisa ...................... 128
GRFICO 3 Relao dos temas abordados no corpus ................................................... 184
GRFICO 4 Relao dos objetos empricos utilizados no corpus ................................... 186
GRFICO 5 Mtodos utilizados nas pesquisas do corpus .............................................. 187
GRFICO 6 Tipos das pesquisas referentes ao corpus .................................................. 188
GRFICO 7 Tipos de instrumentos de coleta de dados .................................................. 188
LISTA DE QUADROS
QUADRO 1 Comparao entre as categorias de Ranganathan e CRG ............................ 51
QUADRO 2 Sntese das metodologias da anlise categorial temtica .............................. 86
QUADRO 3 Modelo de leitura Documentria de Fujita e Rubi (2006) ............................... 96
QUADRO 4 Sugestes de perguntas da Norma NBR-12.676 ........................................... 97
QUADRO 5 Relao de documentos do corpus (por ano)* ............................................. 105
QUADRO 6 Consolidao da estrutura textual de documentos acadmicos ................... 109
QUADRO 7 Etapa da categorizao (Anlise de Contedo) ........................................... 111
QUADRO 8 Validao das "categorias iniciais"............................................................... 112
QUADRO 9 Primeira coluna do MCTCA ......................................................................... 119
QUADRO 10 Primeira e segunda coluna do MCTCA ...................................................... 121
QUADRO 11 Matriz categorial para trabalhos acadmicos (teses e dissertaes) ......... 123
QUADRO 12 Matriz categorial para extrao de conceitos ............................................. 125
QUADRO 13 Paridade entre as categorias de Ranganathan, CRG e CAFTE ................. 142
QUADRO 14 Sntese estatstica dos temas .................................................................... 185
LISTA DE SIGLAS
ABNT
AC
Anlise de Contedo
ACT
AD
Anlise documentria
AF
Anlise Facetada
BD
Biblioteca digital
BDS
BDTD
BU
Biblioteca Universitria
CAFTE
CAPES
CC
Construo de Categorias
CC
Cincia da Computao
CI
Cincia da Informao
CMS
CRG
DW
Data Warehouse
ECI
GIC
GUI
HIBROWSE
IBICT
ICS
IEC
IIB
ISAGOGE
Introductio in Praedicamenta
ISO
LD
Linguagem documentria
LSP
MARC
MCTCA
MEC
Ministrio da Educao
MHTX
MIT
MLD
MSN
Microsoft Network
NASA
NLS
On-Line System
NT
New Technology
OLAP
OPACs
OUI
OWL
PMEST
POSEDU
PPGCI
RAVE
Relation Browser
RB
Relation Browser
RDF
SeCo
SIMILE
SMART
SPO
SRI
SWED
TAD
TAF
TAFNAVEGA
UC
Unidades de Contexto
UFMG
UNESCO
UR
Unidades de Registro
USP
Universidade de So Paulo
VC
Vocabulrio controlado
W3C
XFML
XML
XSLT
SUMRIO
1
INTRODUO ....................................................................................................... 16
1.1
1.2
1.3
1.4
METODOLOGIA .................................................................................................... 25
2.1
2.2
FUNDAMENTAO TERICO-METODOLGICA............................................... 43
4.1
4.2
4.3
4.4
4.5
4.5.1
4.6
4.6.1
4.7
4.7.1
4.8
4.9
5.1
5.1.1
5.2
5.3
5.3.1
5.3.2
5.4
5.5
5.6
16
1 INTRODUO
Nesta introduo, so apresentados o tema, o problema e as
justificativas deste trabalho, assim como os objetivos e a descrio da
estrutura desta dissertao.
O saber cientfico dinmico e primordial no desenvolvimento do conhecimento
humano, num ciclo aberto de reconstruo. A evoluo da cincia acontece com a
possibilidade de replicao, quando um novo conhecimento emerge a partir de algo j
descoberto. Para obter o conhecimento desvendado, o conjunto de saberes deve ser
registrado, com informaes expressas em uma linguagem de comunicao que possa ser
acessada e recuperada.
A cincia passa sempre por revises em suas teorias, seja porque no se
adaptam mais realidade emprica existente ou devido descoberta de novos fenmenos.
Sendo assim, as teorias cientficas so falveis e esto, continuamente, sendo substitudas
ou recondicionadas, principalmente para se ajustarem poca histrica ou cientfica. Assim,
o conhecimento humano est em constante fluxo, sempre se transformando, aperfeioando
e ampliando.
A comunicao cientfica permite perceber as diferentes abordagens tericas,
epistemolgicas e prticas que caracterizam uma rea do conhecimento. Dessa maneira, na
academia so recorrentes as discusses acerca das formas de disponibilizao,
comunicao e difuso desse conhecimento, visando uma maior visibilidade institucional,
que possa legitimar e promover maior prestgio do conhecimento produzido nesse meio.
A Cincia da Informao (CI) disciplina especialmente voltada para entender
os fluxos de informao em diferentes ambientes, a fim de facilitar seu acesso e uso
(BORKO, 1968), promovendo a transferncia da informao. Acredita-se que o ser humano
primordialmente social, ligado a grupos de interesses, tradicionalmente transmitindo seu
conhecimento a outro, e quem o recebe soma-o aos seus prprios saberes. Assim acontece
a evoluo humana, e tambm dessa forma se desenvolve a cincia e tecnologia.
Nesse contexto, o tema da recuperao da informao importante, pois
percebe-se que a sociedade tem a informao como insumo essencial, e as funcionalidades
oferecidas pelas tecnologias de comunicao expandiram as formas de compartilhamento e
busca dessas informaes, movimento intensificado com a expanso da Internet.
O compartilhamento de informaes intermediado por sistemas de informao,
que tm origem, pode-se declarar, ainda com a biblioteca de Alexandria, que reuniu fontes
de informao e as armazenou e organizou, visando a sua preservao e recuperao.
Desde ento, esses sistemas se desenvolvem e procuram se adaptar s necessidades e
demandas informacionais de uma comunidade de usurios. Nesse sentido, os sistemas de
17
informao esto cada vez mais focados na flexibilidade1 e na integrao, o que permite
diferentes interaes entre usurios e sistemas. Nessa trajetria, de Alexandria
contemporaneidade, os sistemas de informao mudaram seu foco da organizao do
documento para a disponibilidade de informao, o que mudou a forma de gerenciamento
do recurso informacional.
Em vista disso, afirma-se que o desenvolvimento de sistemas automatizados de
armazenamento, de busca e de recuperao de informao, acontecimento percebido a
partir dos anos 1950, tem envolvido profissionais de diferentes reas (Cincia da
Computao, Web Design, Arquitetura da Informao, Cincia da Informao, entre outras)
em pesquisas que abordam o assunto sob diferentes aspectos.
A ttulo de resgate histrico, interessante observar que, j no incio do sculo
XX, Paul Otlet, com sua ideia de mesa mvel, recomendava o desenvolvimento de
ferramentas que possibilitassem o acesso s informaes, de modo a permitir sua
transferncia. Otlet imaginou uma espcie de carteira escolar com rodas, com a qual os
usurios poderiam buscar, ler e anotar informaes, retiradas das bases de dados,
armazenadas em fichas de papel. Assim, pode-se afirmar que Otlet criou o primeiro esboo
de um sistema de recuperao da informao (SRI) semiautomatizado.
Um SRI ocupa-se de parte significativa do processo que envolve os fluxos de
informao: seleo, representao, organizao, armazenamento, busca e acesso aos
recursos informacionais. Nesse contexto, so preocupao constante dos pesquisadores as
questes que envolvem a criao de mecanismos para acesso remoto s informaes
disponibilizadas, principalmente em ambiente de bibliotecas digitais, onde a organizao da
informao deve garantir ao usurio facilidade de acesso s informaes de sua
necessidade.
importante mencionar tambm que a organizao da informao pode ser feita
a partir de diferentes abordagens metodolgicas, com vistas a imprimir consistncia e
padronizao aos contedos informacionais, facilitando sua organizao e posterior
recuperao. Nesse sentido, os vocabulrios controlados, tais como os tesauros e as
taxonomias, podem ser utilizados para estruturar certo domnio2, aprimorando a recuperao
de informaes.
Esse termo tem sido muitas vezes utilizado como atributo dos SRI. Flexibilidade pode ser entendida como a
qualidade de algo que tem maleabilidade, que fcil de manejar, e que est apto para variadas coisas ou
aplicaes (FERREIRA, 2009). Assim, um sistema de informao flexvel aquele capaz de absorver
mudanas em suas estruturas de informao, seja permitindo incluso de novos termos ou substituindo
termos obsoletos.
Domnio pode ser entendido como uma rea de conhecimento (especialidade), um conjunto literrio ou, ainda,
a tarefa de um grupo de pessoas trabalhando juntas em um projeto ou em uma organizao (HJORLAND;
ALBRECHTSEN, 1995). Esse tema ser tratado mais detalhadamente no Captulo Quatro, subcaptulo 4.5
deste documento.
18
Com relao s taxonomias, seu uso tem sido ampliado em ambiente digital,
para a estruturao de informaes organizacionais, com o objetivo de organizar as
informaes, orientar o usurio (cliente) e facilitar a busca por produtos e servios,
propiciando sua recuperao.
Para uma melhor compreenso, oportuna uma definio para o termo
taxonomia, trata-se de um conjunto de termos estruturados de forma hierrquica, que so
utilizados para representar o domnio no qual a taxonomia aplicada. Essa forma de
organizao a adotada tradicionalmente. Contudo, nos dias atuais, verificam-se mudanas
no conceito de taxonomia, e na sua forma de organizao: elas podem, tambm, ser
apresentadas em forma de listas, rvores, poli-hierarquias, matrizes, facetas ou sistemas de
mapas (LAMBE, 2007). Sobre essa ltima forma (taxonomia por facetas), alm das
propriedades de representar e organizar um domnio, ela pode, ainda, correlacionar
diferentes linguagens usadas em um ambiente e criar mecanismos de acesso, com
agregao de metadados que podem possibilitar a localizao de contedos informacionais.
Sabe-se que, em uma biblioteca digital, a taxonomia facetada atua como um
mapa conceitual, j que cada tpico da estrutura se interrelaciona com outro e pode ser
explorado atravs da navegao. Assim, essa forma de apresentao contribui para a
comunicao e o compartilhamento de conhecimento.
Ainda sobre as bibliotecas digitais, tem-se constatado um desenvolvimento no
sentido de aprimorar as formas de armazenamento, disponibilizao e acesso s
informaes contidas em seus bancos de dados. Historicamente, esses esforos perpassam
Paul Otlet, com suas ideias revolucionrias, o Memex3 (Vannevar Bush), o projeto Xanadu 4
(Theodore Nelson), culminando com o desenvolvimento da Internet, sendo esta constituda
por um conjunto de tecnologias que permite o compartilhamento e a disponibilizao de
informaes.
importante destacar tambm que, nas instituies de ensino, as facilidades
tecnolgicas tm contribudo para a disponibilizao de informaes acadmicas em
bibliotecas digitais. Ademais, observa-se a crescente migrao de peridicos cientficos para
o meio digital. Ento, verificado um crescimento quantitativo da implantao de bibliotecas
digitais de teses e dissertaes (BDTD) em instituies de ensino superior, visando
divulgao de resultados detalhados de pesquisas j concludas. Como consequncia
dessas iniciativas, evitam-se esforos replicados em pesquisa similares e a perda de
energia intelectual com o uso de metodologias e teorias, talvez, j obsoletas.
3
4
Bush imaginou uma espcie de mquina que facilitasse o armazenamento de informaes, para posterior
recuperao e uso.
O projeto Xanadu refere-se idealizao de uma ampla rede de informaes, sendo considerado o primeiro
passo para o desenvolvimento daquilo que, atualmente, conhecido como hipertexto.
19
1.1
Problema e justificativa
A partir do incio do sculo XXI, possvel notar um aumento nos projetos de
sentido,
de
fato,
ferramentas
tecnolgicas
sofisticadas
20
que, geralmente, permitem o acesso apenas a elementos descritivos (autor e data, por
exemplo), ao resumo, s palavras-chave e ao texto completo dos documentos. Nesse ltimo
caso, inclusive, o texto, em geral, apresentado no formato Portable Document Format
(PDF), que aberto em aplicativo independente da biblioteca digital, impedindo que o
sistema possa varrer seu contedo durante as buscas. Nesse caso, estando os outros
elementos (descritivos, resumo e palavras-chave) incompletos, haver perda de
informaes.
importante destacar tambm, que h o problema de palavras-chave e ttulos
que no so representativos do contedo dos documentos, alm do entrave provocado por
resumos incompletos, observados na literatura por diferentes estudos (BORKO; CHATMAN,
1963; VIEIRA, 1988; NOGUEIRA, 1997; GIL LEIVA; FUJITA; RUBI, 2008; ELIEL, 2008;
SOUZA, 2009).
Ademais, mostra-se pertinente apontar que, nas buscas por assunto, comum
as bibliotecas digitais oferecerem a busca simples e a busca avanada. Nessas duas
formas, o sistema faz uma varredura nos elementos descritivos (ttulo, autor e data), no
resumo e nas palavras-chave. Entretanto, em ambas, h problemas para o usurio: na
busca simples, geralmente, o usurio submete, no mnimo, uma palavra ao sistema, sendo
que o resultado de sua busca pode apresentar problemas de ambiguidade, envolvendo
questes de falta de preciso8 e de revocao9. Com relao busca avanada, h a
possibilidade de buscas combinadas, visando a refinamento dos resultados, normalmente,
atravs da busca booleana10 (or, and e not). Porm, o maior problema nesta forma de
busca, refere-se ao fato de que o usurio, recorrentemente, est inapto para utiliz-la, seja
porque no consegue acompanhar as mudanas tecnolgicas (barreira tecnolgica), seja
por comodismo (barreira psicolgica) (FIGUEIREDO, 1987), ou mesmo pelo motivo de
considerar que as buscas booleanas so de difcil compreenso (BAEZA-YATES; RIBEIRONETO, 1999).
Tendo isso em vista, acredita-se que possvel oferecer ao usurio,
principalmente em uma biblioteca digital especializada, informaes j estruturadas
(organizadas), com resultados j refinados, sob a perspectiva das necessidades de
informao desse usurio, que seja uma estrutura fcil de usar e interpretar, como forma de
minimizar os problemas apontados na busca simples (ambiguidade) e na busca booleana
(inaptido do usurio em utiliz-la). Para tanto, a caracterstica textual semiestruturada das
teses e dissertaes exige a criao de mecanismos que orientem a estruturao do recurso
8
9
10
21
11
12
13
14
um tipo de interface que permite a interao do usurio com os recursos digitais a partir de elementos
visuais. Essas representaes so conhecidas como Graphical User Interface (GUI).
Entende-se aqui, que as categorias vazias no so apresentadas ao usurio, o que impede a obteno de
um resultado vazio, pois s aparece para escolha aquilo que, efetivamente, existe.
Disponvel em: <http://simile.mit.edu/wiki/ Faceted_Browser>.
Como a utilizada pela busca booleana, considerada difcil pelo usurio.
22
23
terico-metodolgica
que
respaldo
aos
procedimentos.
Essas
24
25
2 METODOLOGIA
O mtodo cientfico envolve um conjunto de procedimentos sistemticos e
racionais, utilizados no intuito de alcanar o objetivo proposto, traando um caminho mais
seguro e econmico, capaz de permitir detectar erros e facilitar as decises sobre a postura
do investigador (MARCONI; LAKATOS, 2010, p.65). Nessa perspectiva, a pesquisa, para
esses autores, um procedimento formal, com mtodo de pensamento reflexivo, que
requer um tratamento cientfico e se constituiu no caminho para conhecer a realidade ou
para descobrir verdades parciais (ibidem, p.139).
Nessa direo, o percurso metodolgico, com a aplicao dos procedimentos
necessrios para a concluso deste estudo, informado a partir de agora.
26
16
Pesquisa bibliogrfica uma tcnica que tem como finalidade explorar na literatura (livros, revistas, teses,
entre outros) material sobre determinado assunto de interesse da pesquisa (MARCONI; LAKATOS, 2010).
Sempre que o termo pesquisa bibliogrfica for utilizado neste documento, o sentido ser este.
Tais como as do IBICT, UFMG, Universidade de So Paulo e Domnio Pblico.
27
28
18
O termo extrao neste trabalho tem o sentido de retirar conceitos institudos no texto, a partir de uma
anlise conceitual no documento, e no deve ser confundido com o processo de indexao por extrao, que
geralmente realizada de forma automtica.
Para uma finalidade especfica.
29
30
3 REVISO DA LITERATURA
Em um trabalho cientfico, a reviso de literatura busca obter informaes mais
atualizadas sobre o tema central da pesquisa, ainda que tenha sentido tambm histrico.
Ela parte integrante da reviso bibliogrfica que tem como objetivo orientar o pesquisador
durante todo o trajeto da investigao, desde o pr-projeto. A reviso bibliogrfica , assim,
mais ampla e guia o pesquisador, principalmente evitando que repita trabalhos j concludos
ou em fase adiantada de investigao.
Segundo Luna (2009), uma reviso de literatura pode atender a diferentes
objetivos: determinao do estado da arte, reviso terica, reviso histrica ou reviso
emprica. No caso desta pesquisa, optou-se pela reviso emprica19 na qual, segundo Luna
(2009), se espera demonstrar como o problema vem sendo pesquisado do ponto de vista
metodolgico, fornecendo
dados das pesquisas j analisadas, para responder a questes tais como:
quais os procedimentos normalmente empregados no estudo desse
problema? Que fatores vm afetando os resultados? que propostas tm
sido feitas para explic-los ou control-los? que procedimentos vm sendo
empregados para analisar os resultados? h relatos de manuteno e
generalizao dos resultados obtidos? do que elas dependem? (LUNA,
2009, p.91).
A palavra emprica neste contexto tem o sentido de observao da realidade para identificar como o tema
estudado vem sendo aplicado factualmente, respaldando as argumentaes em relao escolha da
aplicao prtica da pesquisa.
31
Contudo, a presente reviso no incluir trabalhos dessa natureza, uma vez que o aspecto
predominante na criao da taxonomia facetada abordada nesta pesquisa o do acesso a
informaes contidas em sistemas de recuperao de informaes (SRI) especializados, em
ambientes digitais, nos quais possvel a navegao atravs da estrutura facetada da
taxonomia, facilitando a busca e a recuperao de informaes.
preciso esclarecer, ainda, que tambm no sero apresentados trabalhos que
versam sobre interfaces a partir de clustering (agrupamento), sintagmas nominais ou de
iniciativas do comrcio eletrnico (e-commerce), pois estes ltimos nem sempre podem ser
considerados como estruturas de navegao facetada (ver Captulo 4, item 4.4.1).
Devido abundncia do material encontrado, principalmente em trabalhos
estrangeiros, para a incluso dos estudos nesta reviso, foram considerados os seguintes
parmetros: (1) estudos que utilizam a tcnica da anlise facetada na criao de taxonomias
para navegao; (2) trabalhos que tratam especificamente de desenvolvimento de
taxonomias facetadas para navegao, independente de indicar, explicitamente, a tcnica
utilizada. Em qualquer dessas situaes, sero considerados trabalhos nacionais e
estrangeiros, dando prioridade aos trabalhos desenvolvidos nos ltimos dez anos, do mais
antigo aos mais novos. Entretanto, houve a preocupao em apresentar trabalhos que
podem ser considerados pioneiros na implantao da estratgia de navegao facetada,
como forma de mostrar a evoluo do tema de navegao e busca facetada, oferecendo
uma localizao temporal histrica do tema. Alm disso, apresenta-se o Relation Browser,
que um projeto que est fora do recorte temporal estipulado para esta reviso, pois foi
iniciado entre dezembro de 1998 e janeiro de 1999, mas que merece ser citado por ter sido
criado dentro da rea da CI e, tambm, porque est em evoluo desde ento.
Ressalta-se que no se pode afirmar, categoricamente, que no h qualquer
trabalho anterior aos que sero mencionados, mas so projetos que merecem ser citados
como pioneiros sobre o tema da navegao facetada: o trabalho de Ahlberg e Shneiderman
(1994), da Universidade de Maryland, e o de Pollitt et al. (1996), da Universidade de
Huddersfield.
No primeiro trabalho, da rea da Cincia da Computao e Informtica, foi criado
o prottipo FilmFinder (<http://www.film-finder.com/>), de Ahlberg e Shneiderman (1994),
que permite explorar uma base de dados de filmes por facetas. Os autores no utilizaram o
termo faceta, entretanto, a modelagem informacional era em facetas, mas com uma busca
por parmetros (parametric search). Nesse tipo de busca, o usurio tem de pr-definir as
variveis, as quais devem ser escolhidas em uma nica vez. Dessa maneira, o usurio pode
obter uma resposta vazia (resultado de busca vazio20) questo formulada. Procurando
20
Essa caracterstica significa que as categorias vazias no so apresentadas ao usurio, o que impossibilita
um resultado tambm vazio, pois s aparece, para escolha, aquilo que, efetivamente, existe.
32
21
22
33
23
24
Portal governamental que prov informaes estatsticas de mais de 100 agncias americanas
(<http://www.fedstats.gov/>).
Acesso a um demo do projeto: Disponvel em: <http://flamenco.berkeley.edu/demos.html>.
34
tambm a preferncia dos usurios pela MatrixView. A importncia deste projeto, no mbito
desta pesquisa, que o contedo do recurso informacional foi estruturado em diferentes
categorias e em multi-hierarquias, isto , sob cada categoria, h uma taxonomia hierrquica.
Alm disso, os constantes testes realizados com usurios demonstram que eles se
satisfazem com a possibilidade de compor uma busca de forma fluida, com o refinamento
progressivo. O FLAMENCO est h mais de dez anos sendo aprimorado, atualizado e
mantido, desenvolvendo mecanismos de busca e navegao facetada, alm de servir como
laboratrio para estudos de usabilidade com usurios finais. importante, ainda, destacar
que os resultados apresentados aos usurios no so ranqueados (ranking). A razo disso
que os metadados facetados (data, autor, ttulo e qualificadores) permitem ao usurio
escolher sob qual dimenso quer recuperar um documento, no havendo a necessidade
desse tipo de interferncia do sistema. O usurio pode, tambm, combinar a busca simples
com a navegao facetada. Outro dado importante desse projeto, para o estudo realizado
nesta pesquisa, que as facetas e os metadados so organizados e determinados
manualmente, por um engenheiro de sistemas, no sendo um sistema automtico. Isso faz
com que se acredite que a proposta desta pesquisa exequvel, pois os idealizadores do
FLAMENCO afirmam que o modelo desenhado por eles, nessa etapa de desenvolvimento,
pode suportar uma coleo de at 100.000 artigos (ENGLISH, 2002).
Iniciado em 2000 e com trmico em abril de 2003 tem-se o Projeto FACET25,
coordenado por Douglas Tudhope, da Universidade de Glamorgan, que contou com o apoio
do National Museum of Science and Industry (NMSI), de J. Paul Getty Trust (vocabulrio),
do Museum Documentation Association (MDA) e do Canadian Heritage Information Network.
Neste projeto houve investigao sobre o uso de tesauros facetados na recuperao da
informao, atravs de tcnicas e interfaces de busca. O usurio no necessita formular sua
busca por termos idnticos aos utilizados na indexao, uma vez que o sistema apresenta
os resultados a partir de medidas de aproximao semntica, que so obtidos com base nos
relacionamentos existentes no tesauro. Dessa forma, o usurio automaticamente guiado
na explorao dos termos do tesauro, podendo refinar ou expandir sua busca. Atualmente,
os esforos deste projeto esto voltados para a digitalizao de colees para a Web,
abrindo o horizonte para uma escala mais ampla de usurios. Alm disso, estuda a
possibilidade de integrar o projeto FACET buscas em enciclopdias e s colees
multimdia.
Hyvnen et al. (2004), ainda na rea da Cincia da Computao e Engenharia
de Software, desenvolveram um portal semntico, o MuseumFinland, para publicar as
colees culturais, tais como artefatos txteis, peas de moblia e ferramentas, na Web.
25
35
Para ajudar no projeto, foi criado o software OntoViews, que composto por trs
componentes: 1) o Ontogator, um motor de busca multifacetado, baseado em ontologias; 2)
Ontodella, um servidor lgico, que armazena dados Resource Description Framework (RDF)
apresentados no portal; 3) OntoViews-C, um sistema estruturado que transforma um RDF
em dados navegveis na pginas Web. Na verso piloto foram utilizadas as colees do
Museu Nacional26, do Museu da cidade de Espoo27 e do Museu da cidade de Lahti28. Esses
so museus de trs cidades, e usam trs distintos sistemas e bases de dados relacionais,
alm de utilizarem diferentes sistemas de gerenciamento de colees (Musketti, Escoll e
Antikvaria, respectivamente). Os metadados dos objetos das colees (data, texto
explicativo, etc.) foram atribudos a partir dos 15 elementos do padro Dublin Core29.
Sempre que possvel, foram atribudas aos contedos palavras-chave, selecionadas de um
vocabulrio controlado ou tesauro, mantendo a padronizao. Isso importante para uma
recuperao de informaes mais acurada e para dar consistncia coleo. Apesar de no
citarem Ranganathan em seus estudos sobre o mtodo da anlise facetada, o princpio de
funcionamento do sistema o mesmo. O contedo das colees sistematizado em
categorias conceituais, e sob cada uma delas h uma hierarquia taxonmica, cujo conjunto
denominado facetas ou vises (views). Contudo, houve problemas relacionados com a
transformao dos contedos das colees em dados RDF, principalmente pautados em
interpretaes semnticas. Algumas expresses so complexas e originadas de diferentes
campos de dados da coleo, podendo se referir a diferentes expresses sintticas,
dependendo do catlogo ou da anotao convencionada em uso. Esse problema pode ser
minimizado pelo uso de padres terminolgicos, mas, segundo os autores, na prtica, isso
impossvel, pois h grande variao de descries. Resta acrescentar, que, no
MuseumFinland, a interface desenvolvida para o usurio final similar a outro repositrio
qualquer na Web, pois possui um nico browser de busca e navegao. Os autores
conseguiram tornar as colees heterogneas e geograficamente distantes em um nico
sistema interopervel, atravs de um processo de merging. Cada museu pode acessar o
sistema do portal e publicar seus contedos de forma fcil e independente.
Em mbito governamental, de Sidoroff e Hyvnen (2005), na rea da Cincia da
Computao e Engenharia de Software, apresentaram um estudo de caso, no qual
implementaram uma busca semntica (ou busca multifacetada) em portais governamentais
da Finlndia, o Suomi.fi. No portal original, o contedo era apresentado em facetas, mas
apenas indexado sob uma nica dimenso, o que os autores denominaram abordagem
26
27
28
29
36
30
31
o mesmo princpio da lgica booleana and, pois apresenta os itens que, simultaneamente, pertencem a
duas ou mais categorias
Disponvel em: <http://demo.seco.tkk.fi/tervesuomi/home>.
37
38
do portal. Isso facilitou a transferncia das informaes dos diferentes locais na Web para o
portal POSEDU. A partir dessas ferramentas, as informaes foram estruturadas em
facetas, e, por meio de regras formais estipuladas na ontologia, o sistema forneceu ao
usurio um mecanismo de busca e navegao facetada. A autora afirma em seu estudo que
essa estratgia de busca e navegao facetada vem sendo empregada pela rea de
recuperao da informao, cujos princpios esto baseados na ideia de busca
multifacetada proposta por Ranganathan. Segundo Lachtim (2008), o princpio de estruturas
facetadas para representar informaes adequado para a Web semntica, pois oferece
uma viso geral de todo o contedo do portal e guia o usurio em sua formulao de busca
entre os termos e conceitos disponibilizados. A particularidade encontrada no POSEDU
refere-se ao fato de que, para o sistema conseguir fazer a interseo entre as diferentes
categorias, o usurio deve selecionar (marcar) aquelas que so de seu interesse, situao
que no ocorre em outros exemplos apresentados (HEARST, 2000; HYVNEN et al., 2004;
SIDOROFF; HYVNEN, 2005).
Ainda no Brasil, na rea da Informtica, existe um prottipo para navegao
facetada, desenvolvido por Arajo (2009), denominado Explorator. Trata-se de um
mecanismo que permite a navegao e busca, construdo com base em linguagem RDF. O
autor criou um modelo de linguagem de especificao, denominado vocabulrio FACETO,
alm de um algoritmo de relevncia para a gerao automtica de facetas, com o objetivo
de possibilitar a criao de mecanismos de navegao facetada sobre dados Resource
Description Framework (RDF32). A linguagem de especificao para extrao das facetas
independente do modelo de navegao facetada, que aceita visualizar operaes em um
conjunto de triplas do tipo diferena, interseo e unio33. O arqutipo permite, ainda,
operaes Subject, Predicate, Object (SPO34) de consultas em uma base RDF, o que
fornece exemplos de solues para problemas, auxiliando o usurio a aprender sobre o
domnio de dados RDF. Assim, possvel definir as facetas a partir da combinao de
valores e propriedades do modelo RDF. Uma limitao do Explorator que a escolha
automtica das facetas para a taxonomia no leva em considerao as relaes definidas
na ontologia dos dados RDF. E a principal contribuio do Explorator para o usurio sua
capacidade de permitir que ele manipule os recursos e triplas diretamente na interface de
navegao facetada. Em ambientes complexos como os da Web, a determinao
automtica de facetas parece ser a nica soluo provvel, o que no se aplica ao ambiente
restrito da BDTD utilizado nesta pesquisa. Entretanto, interessante verificar o uso da
32
33
34
39
40
39
40
Ferramenta que cria um conjunto de grupos-padro de termos, em hierarquias, que so refinados por um
mtodo interativo.
Foi utilizado um algoritmo padro recomendado por Salton e Buckley (1988) para vocabulrios tcnicos.
Ferramenta para automatizar a categorizao de documentos atravs de critrios pr-determinados.
O termo facetas no mbito dos trabalhos com os catlogos de biblioteca tem o sentido de atributos do
documento, que incluem elementos referentes descrio fsica do documento (autor, ttulo, etc.) e tambm
elementos referentes ao assunto do documento, aludindo aos campos existentes no MARC e no padro
Dublin Core.
Semantic Interoperability of Metadata and Information in unLike Environments.
New Technology.
41
Organising
Knowledge:
taxonomies,
knowledge
and
organisational
41
42
43
4 FUNDAMENTAO TERICO-METODOLGICA
Neste captulo esto apresentadas a fundamentao terica e a metodolgica
utilizadas para o desenvolvimento desta pesquisa. Toda a fundamentao se baseou em
conhecimentos relacionados com a busca em sistemas de recuperao da informao
(SRI), iniciando com uma breve discusso sobre instrumentos de organizao e
representao da informao, aqui denominados de vocabulrios controlados. Aprofundase sobre o tema do vocabulrio controlado do tipo taxonomia, que o objeto de estudo
desta pesquisa. Nesse sentido, apresenta a sua forma mais tradicional, que a hierrquica,
passando forma facetada e, finalmente, facetada navegacional. preciso esclarecer
que, ao apresentar os fundamentos tericos da taxonomia facetada, indicam-se tambm os
alicerces metodolgicos de sua criao, uma vez que teoria e metodologia esto
intrinsecamente ligadas. Em seguida, abordado o assunto da recuperao da informao
em SRIs, sendo apresentado um breve relato sobre as opes de buscas, passando para as
bibliotecas digitais e focando o olhar sobre as bibliotecas de teses e dissertaes, que a
ambientao desta pesquisa. Depois, descreve-se a navegao hipertextual, mostrando a
navegao pela taxonomia facetada. Sero discutidos, ainda, os fundamentos da teoria da
anlise de domnio (TAD), indicando sua metodologia e finalizando com a identificao da
comunidade cientfica. Alm disso, houve a exposio do mtodo da anlise de contedo,
do mtodo utilizado para o desenvolvimento do Modelo de Leitura Documentria de Fujita e
Rubi (2006). E, por fim, foram caracterizados os documentos referentes a trabalhos
acadmicos do tipo teses e dissertaes, que so de interesse desta pesquisa,
demonstrando a sua estrutura textual.
44
so
42
45
43
Anel de sinnimos (synonym ring) um grupo de termos considerados sinnimos, que tm o propsito de
recuperao.
46
Quanto estrutura deste tipo de VC, a norma acrescenta que uma taxonomia
um vocabulrio controlado constitudo por termos preferidos, relacionados entre si, em
hierarquia ou poli-hierarquia (ANSI/NISO Z39.19, 2005, p.18). Acerca de seu uso, as
taxonomias, geralmente, so criadas e utilizadas em atividades de indexao e para
navegao na Web, porque sua estrutura, geralmente simples estruturas hierrquicas, so
eficientes em orientar o usurio, levando-o aos termos mais especficos em certo domnio
(p.136). Em linhas gerais, pode-se afirmar que uma taxonomia diz respeito a um conjunto de
termos estruturados, recorrentemente, de forma hierrquica, representando o domnio no
qual aplicada, atravs da estruturao do mesmo.
Atravs de um olhar etimolgico, a palavra taxonomia vem do verbo grego
tassein, que significa arranjos, e nomos, que se refere lei. Observa-se, ainda, que o
termo foi empregado pela primeira vez em 1778, por Augustin Pyrame de Candolle, um
bilogo suo, especializado em botnica. Nesta ocasio, Candolle classificou e ordenou
todas as espcies vegetais conhecidas, descrevendo mais de 80.000 espcies (BARQUN;
MOREIRO GONZLEZ; PINTO, 2006). Entretanto, segundo esses mesmos autores, a mais
conhecida taxonomia surgiu tambm no sculo XVIII, na rea da biologia, com Linnaeus
(Taxonomia de Lineu), para classificar organismos vivos. Seguindo tal propsito, Linnaeus
criou um sistema hierrquico com uma nomenclatura binominal dos seres vivos,
identificando, de forma unvoca, as espcies da seguinte maneira: filos, classes, ordens,
famlias, gneros e espcies. Por meio dessa classificao, Linnaeus resolveu os problemas
de comunicao produzidos pela variedade de nomes locais.
Contudo, Tunkelang (2009, p.3) considera Aristteles como o taxonomista
pioneiro, uma vez que esse filsofo grego tem significante papel na organizao do
conhecimento em hierarquias, pois criou um sistema de classificao que dividiu os
organismos vivos em dois grupos: plantas e animais; sendo que os animais foram
divididos em com sangue e sem sangue, os com sangue, em mamferos e ovparos
e, assim, sucessivamente.
Entende-se que uma das primeiras definies para taxonomia pode ser a de
Vickery, que a identifica como um instrumento para organizar todas as entidades de um
universo em uma simples hierarquia: uma grande rvore na qual cada entidade pertence
apenas a uma nica classe, cada espcie a um nico gnero, e assim por diante
(VICKERY, 1975, p.10). Desde essa primeira definio o conceito de taxonomia vem
sofrendo transformaes. Na contemporaneidade, o termo aplicado em sentido mais
abrangente, de modo que a taxonomia considerada como um instrumento de recuperao
de informao, com possibilidade de agregar dados (metadados) na estrutura:
a taxonomia, em um sentido amplo, a criao da estrutura (ordem) e dos
rtulos (nomes) que ajudam a localizar a informao relevante. Em um
sentido mais especfico, o ordenamento e rotulao de metadados, que
47
48
tipo teses e dissertaes. Isso pode ser explicado pelo fato de que, segundo Lambe (2007),
Ranganathan construiu um esquema de classificao facetado que capaz de expressar,
com preciso, o contedo dos documentos, por meio de blocos de facetas, que estruturam
suas partes e conceitos. Essa classificao um esquema analtico-sinttico, porque
envolve dois processos distintos: a anlise do assunto em facetas e a sntese dos elementos
que constituem o mesmo, decompondo os conceitos mais complexos em simples. A sntese,
em seu turno, a recombinao das partes para a classificao, de acordo com as
caractersticas do documento a ser descrito e representado (LAMBE, 2007). Alm disso,
essa abordagem permite ainda a incluso de novos conceitos, sem que seja necessrio
mudar toda a estrutura do sistema classificatrio.
Vale ressaltar que a literatura aponta que h, basicamente, dois importantes
estudos sobre o tema: 1) os estudos de Ranganathan, cuja teoria possui 46 cnones, 13
49
Ranganathan, por sua vez, usou a ideia da rvore Baniana (banyan tree), um
tipo de figueira indiana (FIG. 3), que se espalha por uma grande rea, enviando galhos para
o solo. Os galhos criam razes e formam vrios troncos. Essas razes so areas e crescem
do tronco principal, tornando-se novos troncos adicionais. importante destacar que, em
uma rvore baniana, no h apenas relacionamentos hierrquicos, pois essa rvore sugere
a ideia de que os assuntos (espcies de categorias) podem ser relacionados uns aos outros
de
diferentes,
complexas
imprevistas
formas,
gerando
novas
categorias
44
50
51
CRG
Personalidade
Matria
Partes
Materiais
Propriedades
Energia
Processos
Operaes
Agentes
Espao
Espao
Tempo
Tempo
52
53
Sucesso
consistente
(Ranganathan):
para
classes
semelhantes,
Plano verbal
1) Contexto (Ranganathan): o significado de cada termo na classificao deve
ser determinado em razo da classe qual pertence, pois preciso que todos eles denotem
um s sentido, em completude.
2) Aceitabilidade ou terminologia usual (Ranganathan): cada termo usado para a
faceta ou para um foco deve ser aceito no contexto de uso. Caso o termo escolhido se torne
obsoleto, o mesmo deve ser trocado por outro mais adequado.
54
Plano notacional
1) Sinnimo (Ranganathan): se houver mais de um termo representando um
mesmo conceito (sinonmia), ainda assim haver, apenas, uma nica notao para indicar
esse conceito, sejam quantos forem os sinnimos;
2) Homnimo (Ranganathan): nenhum nmero poder representar mais de um
conceito, ainda que sejam homnimos (mesma grafia ou pronncia e significados
diferentes);
3) Hospitalidade (CRG): ser flexvel, sempre permitindo a incluso de novos
termos, pois o sistema notacional deve acomodar mudanas, atualizaes e adies de
novos termos;
4) Arquivamento (CRG): respeitar a ordem estabelecida pela tabela utilizada pelo
sistema.
Sabe-se que esse modelo simplificado de Spiteri facilitou bastante os estudos
sobre a anlise facetada, tendo servido de base para a elaborao de sistemas de
classificao facetada e de tesauros para recuperao da informao (LIMA, 2004a, p.87).
Nessa circunstncia, de acordo com Morville e Rosenfeld (2006, p. 221-222) a diferena
entre um sistema de classificao tradicional e uma classificao facetada que esta ltima
baseada no princpio de mltiplas taxonomias, que a caracterstica da taxonomia
facetada desenvolvida nesta pesquisa.
Alis, vale ressaltar que a caracterstica de mltiplas taxonomias est presente
nas ontologias, que vm sendo aplicadas na CI desde a dcada de 90, como instrumentos
de representao do conhecimento de um domnio, visando recuperao de informaes.
No restam dvidas de que a estruturao ontolgica de uma rea de conhecimento
complexa e gera sistemas robustos e mais precisos, implicando formalizao lgicamatemtica de conceitos, o que possibilita um amplo relacionamento entre eles. Isso
possvel porque uma ontologia constituda por classes (conceitos), sob as quais h uma
taxonomia, que sua espinha dorsal, e pelas relaes existentes entre as classes e os
elementos da taxonomia (GRUBER, 1996). Acredita-se, que essa forma de estruturar um
domnio, dividindo-o em classes que possuem uma hierarquia taxonmica, abriu
precedentes para a evoluo da taxonomia tradicional (hierrquica) para uma taxonomia
facetada, uma vez que, em relao sua estrutura, uma ontologia possui uma taxonomia
hierrquica sob cada uma de suas categorias mais gerais.
Contudo, as ontologias exigem especificaes formais e so capazes de realizar
inferncias sobre um domnio, mas elas ainda no apresentam uma interface muito
amigvel ao ser humano, sobretudo para o usurio final de uma biblioteca digital. Acredita-
55
se, entretanto, que, nesse nicho, as taxonomias facetadas so mais convenientes, uma vez
que so menos complexas e mais intuitivas. Dessa maneira, fcil entender a qual classe
determinado elemento pertence, principalmente em uma BDTD, com informaes
especializadas para a comunidade cientfica.
Corroborando essa ideia, Simon, Valdes-Perez e Sleeman (1997) afirmam que
nem sempre desenvolver um programa com algoritmos complexos o mais acertado, pois
os sistemas complexos podem s vezes ser necessrios, entretanto, a simplicidade,
quando atingvel, deve sempre ser preferida (ibidem, p.181). Os autores alegam que a Web
e grandes bancos de dados podem exigir complexidade, mas que simples solues podem
ser suficientes para que uma informao cientfica especializada esteja facilmente acessvel
para ser recuperada.
Dessa forma, interessante apontar que a taxonomia facetada navegacional,
desenvolvida nesta pesquisa, tem a caracterstica de ser uma ideia simples e exequvel,
capaz de facilitar o acesso a contedos especficos dos resultados de pesquisas
disponibilizados na BDTD, aprimorando, com isso, a recuperao de informao. Para
melhor entendimento do tema, apresenta-se, a seguir, sua conceituao.
56
45
57
semelhanas,
diferenas,
afinidades e
dependncias,
buscando
associaes.
Os
58
composta de um sistema de categorias, sendo que, dentro de cada uma (categoria) criada
uma hierarquia de facetas e subfacetas, obedecendo a critrios pr-estabelecidos para a
concepo das mesmas (categorias), o que permite atribuir diferentes dimenses
(multidimensional) a um objeto (documento48). , ainda, um sistema organizado sob a forma
de links, atravs dos quais o usurio tem a possibilidade de navegar, de forma interativa,
filtrando e restringindo sua busca em conformidade com sua escolha de facetas.
Por conseguinte, a busca realizada a partir de uma taxonomia facetada
navegacional permite aos usurios explorar uma grande quantidade de informaes, de
forma flexvel, atravs da navegao, de modo que a sobrecarga informacional possa ser
minimizada. Sendo assim, o papel fundamental de uma taxonomia facetada navegacional
guiar o usurio na busca, explicitando as informaes referentes ao contedo que realmente
est disponvel no banco de dados.
Dessa maneira, o usurio pode iniciar a formulao de sua questo a partir de
qualquer uma das dimenses, o que facilita a busca e auxilia a recuperao de informaes,
tema este que merece uma ateno maior atravs do prximo tpico.
Nesta dissertao, documento tem um sentido mais amplo de ser qualquer unidade informacional, impressa
ou no, passvel de catalogao ou indexao, seja qual for a sua natureza ou suporte (ver item 4.8).
Entretanto, neste estudo trata-se de manusear documento especificamente do tipo teses e dissertaes e a
esse tipo de objeto (documento) que nos referimos nesse exemplo.
59
determinada
expresso
de
busca
utilizada
na
busca
do
usurio
no,
necessariamente, significa que esse item contenha informao considerada relevante. Pode
acontecer de este item apenas apresentar dados, isto , contedos sobre as palavras da
expresso de busca, talvez com a mesma construo sinttica, mas sem valor semntico
para que possa atender necessidade do usurio. Portanto, quanto mais especfica e
contextualizada for a resposta oferecida pelo SRI em relao necessidade informacional
do usurio, maior poder ser a satisfao dele.
Um SRI, na concepo de Lancaster (1993), um sistema de informao que
possui a propriedade de informar ao usurio quais documentos se referem ao tema
buscado. Ademais, Kuramoto (1995) reuniu diferentes pontos de vista sobre o conceito de
SRI:
49
Information retrieval embraces the intellectual aspects of the description of information and its specification for
search, and also whatever systems, techniques or machines that are employed to carry out the operation.
50
Dado necessariamente uma entidade matemtica e, desta forma, puramente sinttica. Isto significa que os
dados podem ser totalmente descritos atravs de representaes formais, estruturais. [...] Informao uma
abstrao informal (isto , no pode ser formalizada atravs de uma teoria lgica ou matemtica), que
representa algo significativo para algum atravs de textos, imagens, sons ou animao. (SETZER, 1999, online).
60
Ainda que hoje haja sistemas de recuperao udio-visual (ou de quaisquer outros tipos), neste estudo sero
tratadas apenas questes relativas a informaes textuais.
Possibilidade de associar diferentes partes de um mesmo documento ou de distintos documentos, atravs de
links navegveis para acesso ao contedo.
61
Consrcio internacional com cerca de 300 membros, que agrega empresas, rgos governamentais e
organizaes independentes. Busca desenvolver padres para a criao e a interpretao de contedos para
a Web.
62
63
64
65
Em vista disso, aponta-se que trs das cinco caractersticas acima deram
respaldo proposta desenvolvida nesta dissertao e representam os pressupostos, quais
sejam: 1) buscas pautadas em resposta; 2) sobrecarga de informaes; 3) buscas
booleanas so difceis de compreender. Pretende-se que a taxonomia facetada
navegacional ordene o contedo dos documentos, de forma que as perguntas estejam
formuladas implicitamente, atravs de combinaes do tipo das buscas booleanas, gerando
respostas pr-estabelecidas, evitando sobrecarga de informaes.
No se pode esquecer que Kwasnick (1999, p.40-42) enumera algumas
vantagens das classificaes (taxonomias) facetadas: 1) no exigem que o classificador
conhea todas as entidades ou as relaes entre elas; 2) so flexveis; 3) so hospitaleiras,
uma vez que permitem a insero de novas entidades; 4) so expressivas; 5) podem ser ad
hoc, isto , elaboradas para um objetivo especfico; e 6) permitem diferentes perspectivas e
abordagens dos objetos representados.
Portanto, uma taxonomia facetada pode ser construda sob mltiplos critrios,
facilitando a recuperao da informao, pois cada documento pode ser etiquetado
(atribuies) sob diferentes categorias. Em uma biblioteca digital, um mesmo item pode ser
segmentado por categorias, por exemplo, pela cor, pela idade, pelo gnero, pelo tamanho,
entre outros. Assim, cada faceta, na taxonomia, pode ser incorporada separadamente, na
forma de metadados, e cada uma dessas facetas oferece condies de ser buscada. Lambe
(2007) afirma que taxonomias facetadas evitam a ambiguidade, assegurando que cada
faceta seja nica e obviamente diferente de qualquer outra (ibidem, p.37, traduo nossa).
Essa caracterstica facilita a comunicao entre os pares, fornece visibilidade ao
conhecimento acumulado e permite a transferncia de informao, preocupaes ainda
poca de Bush.
J naquela poca Bush abordou preocupaes atuais da comunidade
cientfica e da humanidade como um todo: Qual a maneira eficiente de
armazenar e recuperar o conhecimento humano? Como fazer uso
apropriado do crescente volume de informaes? Como impedir que uma
informao relevante passe despercebida em meio a uma abundante
gerao de conhecimento? (ALVES, 2007, p.33).
66
67
Considera-se biblioteca tradicional aquela na qual a maior parte de seus itens do acervo composto por
documentos impressos, ainda que muitas delas, hoje em dia, estejam cada vez mais possibilitando acesso
digital ao acervo.
68
Os mapas conceituais assemelham-se a diagramas, nos quais so indicadas relaes entre conceitos, em
uma estrutura que perpassa os conceitos mais abrangentes at abarcar os conceitos mais especficos.
69
Nota-se, ento, que a biblioteca hbrida procura integrar todos os servios das
bibliotecas tradicionais e das digitais, ampliando seu alcance, ao oferecer seus servios e
acervo no formato digital e, organizados semanticamente. Por essa viso, verifica-se que o
conceito de biblioteca hbrida ultrapassa, em larga escala, o conceito de automao de
bibliotecas tradicionais, na medida em que o primeiro permite acesso ao catlogo do acervo
e a alguns servios ou ao seu acervo digitalizado. De forma ainda mais reluzente, na
biblioteca hbrida, h o interesse em manter a interoperabilidade entre os diferentes
sistemas, o que expande, consideravelmente, as possibilidades de compartilhamento de
informaes.
Em face do que foi exposto acima, nesta dissertao entende-se que a
construo de bibliotecas digitais de teses e dissertaes (BDTD) deve levar em
considerao a busca documental a partir de elementos semnticos, constituindo, para
tanto, seu eixo conceitual. Nesse contexto, a web semntica58 abre novas perspectivas
para a criao de bibliotecas digitais semnticas, nas quais se pode melhorar o sistema de
informao, principalmente nas atividades de busca e navegao. Assim sendo, o
desenvolvimento e uso de instrumentos semnticos podero resultar em uma recuperao
de informaes mais relevante ao usurio.
Como reflexo dos estudos realizados at o momento, esta pesquisa aponta para
a ideia de que uma taxonomia facetada para navegao, usada como interface de busca,
pode ser mecanismo facilitador para a recuperao de informaes relevantes aos usurios.
Em vista disso, o princpio de navegao utilizado correspondente navegao em
hipertexto, o que ser desenvolvido a seguir.
58
A web semntica pretende fornecer meios para que se possa estruturar o conhecimento, dando significado
(semntica) aos contedos disponibilizados em ambiente digital, de forma que esse conhecimento seja
processado (entendido) pela mquina.
70
71
Segundo essa premissa, por maior que seja a liberdade do usurio em traar
seu caminho hipertextual, ele est limitado s possveis associaes existentes no sistema,
sendo ela controlada pelo nmero e tipos de conexes imputadas pelo designer. Dessa
forma, o usurio est restrito inteno de comunicao do autor da mensagem, ainda que
tenha certa autonomia para escolher um entre os admissveis caminhos.
Se o que realmente define hipertexto a existncia de links organizando a
informao, independentemente do processo pelo qual esses links foram
criados, [...] ento a associao apenas um tipo de conexo e, na
verdade, o menos desejvel quando o objetivo a comunicao
(FURTADO, 2010, p.37).
72
73
dessa
declarao,
explica-se
que
no
desenvolvimento
desta
dissertao cada documento foi indexado sob diferentes aspectos, permitindo uma viso
multidimensional do seu contedo, atravs da estrutura da taxonomia facetada. Essa
74
61
62
No jargo da biblioteca, o termo browsing consiste na explorao dos itens do acervo (livros, peridicos,
folhetos), que esto dispostos nas prateleiras, examinando-os quase ao acaso, usando a intuio e os
sentidos.
Entende-se como texto semi-estruturado aquele que apresenta elementos estruturados (autor, data, ttulo da
obra, ttulos das sees) e elementos sem estrutura (resumo, contedo).
75
A anlise de domnio no deve ser confundida com a anlise de assunto. Esta se refere a uma das etapas da
indexao, no tratamento temtico da informao documental, que visa identificar termos que melhor
representem os assuntos tratados no documento, para posterior recuperao no sistema de informao. J a
anlise de domnio, caracteriza-se como uma abordagem que pretende entender as funes implcitas e
explcitas da informao, para a comunicao, dentro de uma comunidade discursiva.
76
77
78
79
respectivos acervos, bem como torn-los acessveis aos usurios (CUNHA; CAVALCANTI,
2008, p.333-334).
preciso explicar que no h, na CI, a explicitao metodolgica (um passo a
passo) para ser utilizada na aplicao da TAD. Usualmente, quando se aplica essa
metodologia, emprega-se a metodologia de anlise de domnio referente rea de
engenharia de software, como pode ser visto nos trabalhos de Guizzardi (2005) e de Dias
(2010). Em vista disso, esta metodologia (da anlise de domnio da engenharia de software)
foi adaptada para a rea da CI e composta por quatro etapas, apresentadas a seguir.
a) Identificao do domnio
Nesta etapa deve-se caracterizar o domnio a ser analisado, a partir das
seguintes indagaes: qual o domnio? o domnio conhecido? que tipo de informaes
esse domnio produz?
b) Anlise de dados
Nesta etapa, identificam-se os pontos centrais que caracterizam o domnio,
estabelecendo relaes e funes entre as informaes, a partir dos seguintes
questionamentos: quem produz as informaes identificadas na etapa anterior? com qual
propsito a informao produzida? a quem interessa o uso das informaes produzidas? A
anlise para responder a essas questes deve se basear nos princpios da TAD que afirma
que o fluxo de informao determinado no seio da comunidade de discurso, a partir do
estudo de quem a produz, comunica e usa.
c) Modelagem do domnio
Nesta etapa, selecionam-se os tipos de informaes consideradas importantes
para o servio de informao a ser criado, que estejam alinhados ao objetivo proposto, a
partir dos dados coletados na anlise anterior.
d) Coleta e seleo de dados e validao
Nesta etapa, h a identificao, na literatura especializada, tais como literatura
tcnica, histrico do domnio, questionrio com especialistas do domnio ou outro
procedimento capaz de respaldar a fase anterior, da escolha das informaes mais
importantes. A pergunta que norteia esta etapa a seguinte: Quem este no-usurio
total a quem o contedo dos trabalhos acadmicos, do tipo teses e dissertaes, pode
80
interessar?. preciso esclarecer, que o termo no-usurio total tem um sentido especfico
que o daquele usurio que no usa um servio porque acredita que tem outros meios de
conseguir a informao ou porque no est ciente de que h aquele tipo de servio
disponvel para ele.
No escopo desse levantamento, e no contexto desta dissertao, revela-se que
a criao da taxonomia facetada navegacional, como mecanismo de busca na BDTD, da
ECI-UFMG, tem como comunidade discursiva a comunidade cientfica, que apresentada
a seguir.
Open Archives (arquivos abertos) so, geralmente, criados a partir de software open source, usando padres
de interoperabilidade, que possibilitam a disseminao da informao cientfica com acesso livre ao contedo
que foi disponibilizado.
81
th
DICTIONARY OF SCIENTIFIC AND TECHNICAL TERMS. 6 ed. New York: McGraw-Hill, 1984.
82
informacional por ocupao indicam que as buscas por informao para o exerccio da
profisso (pesquisador) so investigaes orientadas s tarefas e as buscas por
solues para estruturar (organizar) essas informaes conforme a demanda do
profissional so investigaes orientadas aos sistemas.
Na perspectiva da busca por informao para o pesquisador, a informao,
insumo para toda atividade humana, pessoal, tcnica e para a comunidade cientfica,
essencial. No podendo ser de outra maneira, dentro da sua comunidade discursiva, os
cientistas geram, comunicam e usam informao. Sendo assim, no momento de produo
das teses e dissertaes, preciso saber acerca de quem e por que produziu
determinado contedo, pois, segundo Franco (2008),
1. Toda mensagem [...] contm, potencialmente, uma grande quantidade de
informaes sobre o autor: suas filiaes tericas, concepes de mundo,
interesses de classe, [...] representaes sociais, motivaes, expectativas,
etc. 2. O produtor/autor antes de tudo um selecionador e essa seleo
no arbitrria. Da multiplicidade de manifestaes [...], seleciona o que
considera mais importante para dar o seu recado e as interpreta de acordo
com seu quadro de referncia. Obviamente, essa seleo preconcebida.
Sendo o produtor, ele prprio, um produto social, est condicionado pelos
interesses de sua poca, ou da classe a que pertence. E, principalmente,
ele formado no esprito de uma teoria da qual passa a ser o expositor. 3. A
teoria da qual o autor o expositor orienta sua concepo da realidade. Tal
concepo (consciente ou ideologizada) filtrada mediante seu discurso e
resulta em implicaes extremamente importantes (FRANCO, 2008, p.2526).
83
qualitativas e
dados quantitativos,
para
investigao
histrica
ou
para
estudos
84
85
86
OLIVEIRA (2008)
BARDIN (2009)
Etapa 1: Pr-anlise
Etapa 1: Pr-anlise
Etapa 2: Explorao do
material ou codificao
Etapa 2: Codificao
Etapa 3: Categorizao
Etapa 4: Inferncia
87
88
89
90
cdigos para a localizao dos termos e sinais que pudessem sugerir as relaes entre os
conceitos tratados nos documentos. Da mesma maneira, na ACT, podem ser ressaltados
esses trs planos, ainda que no sejam discriminados dessa forma. Para tal entendimento,
basta refletir que o plano das ideias, na ACT, representado pelas regras estabelecidas
como critrios para a escolha das categorias, das unidades de registro e unidades de
contexto, que devem, sempre, estar atreladas ao objetivo e finalidade pretendidos. No
plano verbal, tambm na ACT, tem-se a escolha do termo mais adequado, pertinente e
vlido, para representar um conceito. E, no plano notacional, mesmo que no se enquadre
no sentido de armazenamento, a ACT determina critrios para a codificao do material a
ser analisado, facilitando sua identificao e localizao.
Para atender a esses trs planos, necessita-se de trs etapas para a AF e para a
ACT, que so indicadas na sequncia, fazendo-se consideraes sobre suas similaridades.
Primeira etapa
Anlise facetada: identificao do documento para anlise.
Anlise categorial temtica: pr-anlise com a escolha dos documentos, que
sejam representativos em relao ao objetivo proposto. Essa escolha pode ser a priori.
Consideraes: A anlise facetada sempre ser realizada para um domnio j
definido a priori, pois se pressupe que a anlise seja efetuada em documentos de um
domnio especfico e para um objetivo pr-definido. Do mesmo modo, a anlise categorial
temtica tambm almeja a anlise de um domnio especfico, com um objetivo pr-definido e
formulao de hipteses (ou pressupostos), mas difere quanto seleo dos documentos
que poder acontecer a priori ou em uma seleo por amostragem. Isso, no entanto, feito
simultaneamente com a determinao dos objetivos. Como afirma Bardin (2009, p.121), a
escolha dos documentos depende dos objetivos, ou, inversamente, o objetivo s possvel
em funo dos documentos disponveis. Assim, essa particularidade no as torna diferentes
sob esse aspecto.
Segunda etapa
Anlise facetada: leitura do documento.
Anlise categorial temtica: leitura flutuante, para conhecer o texto.
Consideraes: Na anlise facetada, durante a leitura do documento, h o
processo constitudo pela identificao do assunto e sua constituio, que seguem
orientaes do tipo: dissecao, para segmentar o domnio em termos de mesmo nvel;
laminao, para combinar termos isolados, formando termos compostos; desnudao, para
segmentar, ainda mais, o domnio e, assim, obter maior especificidade nos assuntos;
91
interpolao,
que
possibilidade
de
reunio
de
ideias isoladas
categorial
temtica:
tratamento
dos
resultados,
inferncia
interpretao.
Consideraes: Nas duas anlises, este o momento da atividade de
categorizao, na qual o mtodo da anlise facetada desenvolvido at que se obtenha a
estruturao final.
Na anlise categorial temtica (ACT), o tratamento dos resultados h a
identificao das unidades de registro (UR), que so os conceitos relevantes dentro do
domnio, que representado pelas unidades de contexto (UC), e as UCs so as categorias
mais gerais que contextualizam e do significado s URs. elaborada uma definio para
as categorias de forma que o sentido das URs fique restrito demarcao de cada UC, uma
vez que uma UC (categoria) pode possuir diferentes URs (facetas, subfacetas e focos). H,
ainda, a categorizao, realizada em um processo cclico de anlise, validao e
reformulao. Essa a atividade de agrupar as URs conforme suas semelhanas, a partir
de critrio nico de diviso, obedecendo s caractersticas de adequao, exaustividade,
homogeneidade, exclusividade e objetividade, em um contnuo que ultrapassa esta etapa
trs.
92
93
1967,
p.158).
Isso
remete
Exaustividade
(ou
inclusividade)
estabelecida pela ACT que determina que as categorias devem ser capazes de abrigar
todas as unidades de registro (UR) selecionadas no texto, permitindo a incluso de todo
dado significativo, de acordo com o objetivo pretendido. Alm disso, a Exaustividade,
segundo Ranganathan, no que tange ao significado de ser exaustivo em relao aos
universos em comum, alude ao sentido de Contedo Manifesto da ACT, quando esta
ltima afirma que a anlise deve limitar-se ao contedo explicitado no texto.
Finalmente, preciso ressaltar que Ranganathan desenvolveu sua teoria em
meio aos problemas de classificao de registros do conhecimento, elaborando melhores
prticas para a indexao do contedo temtico dos documentos, com a finalidade de
destacar as ideias explicitadas no texto. Nesse sentido, h estudos que criam modelos para
orientar os indexadores na anlise documentria, tema que ser apresentado no subcaptulo
a seguir.
94
H certa polmica sobre o uso da expresso anlise documentria (AD) que, na corrente francesa,
considerada como um campo mais amplo no qual o processo de indexao est inserido. A corrente
espanhola, por sua vez, considera a AD como composta de forma (descritivo) e contedo (temtico). J na
corrente inglesa considera a AD e a indexao como processos idnticos (SILVA; FUJITA, 2004).
95
96
QUESTIONAMENTO
(NORMA 12.676)
PARTE DA ESTRUTURA
TEXTUAL
OBJETO
INTRODUO (OBJETIVOS)
AO
INTRODUO (OBJETIVOS)
AGENTE
INTRODUO (OBJETIVOS)
MTODOS DO AGENTE
LOCAL OU AMBINCIA
CAUSA E EFEITO
RESULTADOS; DISCUSSO
DE RESULTADOS
PONTO DE VISTA DO
AUTOR; PERSPECTIVA
CONCLUSES
METODOLOGIA
METODOLOGIA
97
98
99
100
67
101
Resultados:
apresenta
os
dados
obtidos
durante
desenvolvimento da pesquisa, os quais podem ser oferecidos por meio de tabelas, quadros
e figuras. Os diversos resultados alcanados devem ser agrupados e ordenados, sendo que,
para maior clareza, podem ser acompanhados por grficos com valores estatsticos.
Elemento 4
102
68
103
104
escolha justificou-se pela necessidade de se estabelecer um limite para o corpus, uma vez
que, a cada dia, novos trabalhos so defendidos, e novos documentos so inseridos na
BDTD da ECI.
Em seguida, na etapa do levantamento do material emprico, houve consulta aos
registros documentais da secretaria do PPGCI, ao catlogo disponibilizado pelo Sistema
Pergamum, da Biblioteca Professora Etelvina Lima, da ECI e da Biblioteca Universitria (BU)
da UFMG, alm de busca fsica, nas prateleiras dessas duas bibliotecas.
Nesse arrolamento, contou-se com o apoio e a colaborao da secretria do
PPGCI-UFMG, dando acesso aos registros dos trabalhos acadmicos e linhas de pesquisa,
e com a cooperao da chefia da biblioteca da ECI-UFMG para o cruzamento e validao
dos dados levantados na secretaria do PPGCI-UFMG.
Entretanto, algumas dificuldades foram encontradas, como, por exemplo,
trabalhos acadmicos sem a identificao da linha de pesquisa qual pertenciam; itens no
registrados no catlogo da biblioteca; itens cuja catalogao apresentava pequenos erros,
tais como grafia incorreta do nome dos autores; itens dispostos em locais errados nas
prateleiras da biblioteca, o que demandou mais tempo de busca; e alguns links quebrados
na BDTD, ocorrncias que delongaram a coleta de dados.
Como resultado desse levantamento foram identificados 290 documentos, sendo
62 teses e 228 dissertaes, referentes s linhas de pesquisa Gesto da Informao e do
Conhecimento (GIC), Informao, Cultura e Sociedade (ICS) e Organizao e Uso da
Informao (OUI). Desse total, 62 trabalhos referiam-se linha de pesquisa OUI.
Em seguida, com autorizao da coordenao do PPGCI-UFMG, foi solicitado
ao Sistema OPUS, que o sistema oficial para disponibilizao da produo intelectual da
UFMG, a liberao dos registros do banco de dados referentes ao acervo da ECI-UFMG,
para que fosse possvel fazer o cruzamento de dados entre a lista dos 62 documentos e a
lista do que efetivamente estava disponvel no banco de dados.
A partir da anlise dos registros dos dados, liberados em 7 de julho de 2010,
constatou-se que, do total dos 290 documentos (universo), somente 146 documentos
estavam disponibilizados no banco de dados, isto , pouco mais de 50%.
Dentre os 146 documentos disponveis, identificaram-se 41 documentos relativos
linha de pesquisa OUI, o que equivale a pouco mais de 66% do total. Esses 41
documentos representam o corpus desta pesquisa e so apresentados no QUADRO 5.
105
DOCUMENTOS
T
D
Total
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
1
2
1
3
4
7
11
0
6
6
1
5
6
3
5
8
2
3
5
12
29
41
106
107
passa-se
ao
desenvolvimento
da
taxonomia
facetada
navegacional
70
71
72
73
Estudo que discorre sobre A Comunidade cientfica da Biblioteconomia e Cincia da Informao brasileira
apresentando
suas
caractersticas
e
necessidades
de
informao.
Disponvel
em:
<http://revista.ibict.br/pbcib/index.php/pbcib/article/view/1051>.
Disponvel em: < http://www4.planalto.gov.br/legislacao>.
Disponvel
em:
<http://portal.mec.gov.br/index.php?option=com_content&view=article&id=12899:posgraduacao-normativos&catid=323:orgaos-vinculados>.
Disponvel em: <http://www.capes.gov.br/sobre-a-capes/legislacao/2341-resolucoes>.
Disponvel em: <http://ppgci.eci.ufmg.br/?O_Programa:Resolu%E7%F5es>.
108
Usurio: pesquisadores
Necessidades de informao: temas, mtodos, teorias e resultados das
pesquisas.
Em seguida, no subcaptulo 5.3.1, apresenta-se o desenvolvimento das
categorias fundamentais temticas da TAFNAVEGA e, posteriormente, no subcaptulo 5.3.2,
descreve-se e aponta-se o algoritmo para o processo de extrao de conceitos dos
documentos.
109
SUBPARTES
(unidade de registro)
Introduo
Tema
Tempo e espao
Problema
Objetivos
Justificativa
Metodologia
Referencial terico
Desenvolvimento
Reviso literatura
Hipteses e variveis
Fundamentao terica
Mtodos e tcnicas
Anlise e interpretao
Concluso
Fonte: Baseado na ABNT-14724:1992, Severino (2007), Marconi e Lakatos (2010) e Silva (2010).
110
UC1.urc: Problema;
UC1.urd: Objetivos;
UC1.ure: Justificativa;
UC1.urf: Metodologia;
UC3.urm: Concluso.
111
CATEGORIAS INICIAIS
TEMA
Tema
DIMENSO
Tempo e espao
Problema
Objetivos
AO
Justificativa
Metodologia
Referncia terica
Reviso literatura
Hipteses e variveis
Fundamentao terica
Mtodos e tcnicas
Anlise e interpretao
Concluso (em relao s
hipteses e objetivos)
CAUSA E EFEITO
FUNDAMENTO TERICO
MTODOS / COLETA DE DADOS
PONTO DE VISTA DO AUTOR
112
VALIDAO
O conjunto de categorias significativo em relao estrutura
textual dos trabalhos acadmicos do tipo teses e dissertaes e
adequado ao objetivo proposto de atender s necessidades de
informao da comunidade cientfica.
Vlidas
Exaustivas
Homogneas
Mutuamente exclusivas
Consistentes
importante salientar que a ACT sugere que seja efetuada a validao das
categorias no percurso da aplicao da tcnica at o trmino da etapa 4 (descrio), que
ser apresentada a seguir. O primeiro passo da etapa de descrio a validao do
conjunto de categorias iniciais, atravs das descries destas, numa abordagem
qualitativa, chegando-se ao conjunto de categorias intermedirias. Aps essa anlise, para
validao dos critrios e adequao semntica e terminolgica, foi feita tambm uma
reformulao da ordem lgica das categorias, resultando no conjunto de categorias finais.
Ressalta-se que, em todos os momentos nos quais houve o procedimento de
validao do conjunto de categorias, essa validao foi sempre com base nos critrios
indicados no QUADRO 8 (anterior).
Passa-se, a seguir, etapa 4, de descrio, na qual ser apresentada a
formulao do conjunto das categorias intermedirias e, depois, do conjunto das
categorias finais, que ser empregado na TAFNAVEGA.
113
Etapa 4: descrio
Nesta etapa, adotou-se uma abordagem qualitativa para a descrio das
categorias, cujo detalhamento est apresentado no APNDICE C.
A seguir, apresenta-se uma sntese dessa descrio:
C1 Tema
o assunto que a pesquisa investiga, sendo seu objeto de estudo.
C2 Dimenso
a descrio do onde a pesquisa ser desenvolvida, ou seja, o ambiente no
qual determinado objeto ou ao ocorre.
C3 Ao
So os objetivos pretendidos pela pesquisa, incluindo os objetivos geral e os
especficos.
C4 Causa e efeito
So enunciadas hipteses ou pressuposies do tipo se-ento (se varivel
independente, ento varivel dependente), advindas, geralmente, de uma teoria.
C5 Fundamento terico
So os principais conceitos tericos necessrios ao desenvolvimento da
pesquisa, provendo apoio terico para os estudos, anlise e reflexes sobre os dados e
informaes coletadas.
C6 Mtodos
a indicao do tipo de mtodos e tcnicas utilizados nos procedimentos
metodolgicos.
C7 Coleta de dados
constituda pelos instrumentos utilizados como meio para coletar os dados
para anlise de resultados.
114
115
de
categorias
intermedirias:
C1.Tema;
C2.Ambientao;
116
117
118
pela ACT, se outro pesquisador utilizar os mesmos critrios de avaliao aqui propostos e
tendo em vista os mesmos objetivos dessa anlise, chegar a resultados similares aos
encontrados por esta pesquisa.
No prximo item, passa-se a descrever o desenvolvimento do algoritmo74 para
ser utilizado no processo de extrao de conceitos do contedo de trabalhos acadmicos do
tipo teses e dissertaes, para a criao da TAFNAVEGA. Segundo Dias e Naves (2007,
p.69), para definir em termos adequados o assunto de um texto necessrio que,
primeiramente, se extraiam os conceitos que nele esto contidos (grifo nosso). Nesse
sentido, o algoritmo indica as instrues metodolgicas a serem respeitadas no processo do
tratamento temtico documental75 (anlise conceitual) deste tipo de documento (corpus). Ao
final, os termos representativos dos conceitos extrados iro alimentar o conjunto de
categorias fundamentais temticas da TAFNAVEGA.
75
Um algoritmo mostra os procedimentos (passo a passo) necessrios para completar uma tarefa, respondendo
pergunta como fazer?. Ele uma sequncia lgica, finita e bem definida de instrues para executar uma
tarefa. Nem sempre um algoritmo representa um programa de computador, pois ele pode determinar tambm
as aes de um ser humano.
O tratamento temtico documental a aplicao de mtodos e tcnicas funcionais, contextualizada na
necessidade informacional do usurio, com vistas ao acesso informao, potencializando o desenvolvimento
do conhecimento e aprimorando a recuperao da informao. a nfase dada a o que tratar, para quem
tratar e como tratar (GUIMARES, 2001).
119
120
norma, foram acrescentados outros questionamentos aos j sugeridos, tendo como objetivo
tornar a abordagem sistemtica mais detalhada.
Seguindo as indicaes descritas acima, foram definidos os questionamentos
para cada termo do conjunto de termos/categorias da primeira coluna, que esto descritos a
seguir e apresentados no QUADRO 10.
C1. Tema
Qual o assunto de que trata o documento?.
C2. Objeto emprico
Qual o objeto emprico do estudo em questo? Qual objeto foi analisado e/ou
utilizado na pesquisa?.
C3. Escopo
O que pretende a pesquisa, de forma geral e especfica, que seja relevante
determinar? A que objetivos a pesquisa tem inteno de atender (aprimorar, avaliar,
analisar, identificar, contribuir, etc.)?.
C4. Ambientao
O tema, o objeto emprico e/ou a ao so considerados no contexto de um
lugar especfico ou ambiente?.
C5. Tipo de pesquisa
Tendo em vista a natureza (bsica, aplicada), a abordagem (quantitativa,
qualitativa), os objetivos (exploratria, descritiva, explicativa) e os procedimentos
(bibliogrfica, experimental, documental, estudo de caso, pesquisa-ao, levantamento,
expost-facto, participante), quais classificaes podem tipificar a pesquisa realizada?.
C6. Coleta de dados
Quais instrumentos especficos (questionrios, entrevistas, registros udiosvisuais, coleta de documentos, etc.) foram utilizados para realizar a ao?.
C7. Mtodos
Quais modos especficos foram utilizados para realizar a ao (por exemplo,
tcnicas ou mtodos para tratamento dos dados, que podem ser do tipo: modelagem
121
C5.
TIPO DE PESQUISA
C6.
COLETA DE DADOS
C7.
MTODOS
QUESTIONAMENTOS
(NORMA 12.676 e PRECIS)
Qual o assunto de que trata o documento?
Qual o objeto emprico do estudo em questo? Qual objeto foi utilizado
e/ou analisado na pesquisa?
O que pretende a pesquisa, de forma geral e especfica, que seja
relevante determinar? A que objetos a pesquisa tem inteno de
atender (aprimorar, avaliar, analisar, identificar, contribuir, etc.)?
O tema, objeto emprico e/ou ao so considerados no contexto de
um lugar especfico ou ambiente?
Tendo em vista a natureza (bsica, aplicada), a abordagem
(quantitativa, qualitativa), os objetivos (exploratria, descritiva,
explicativa) ou os procedimentos (bibliogrfica, experimental,
documental, estudo de caso, pesquisa-ao, levantamento, expostfacto, participante), quais as classificaes podem tipificar a pesquisa
realizada?
Quais instrumentos especficos (questionrios, entrevistas, registros
udios-visuais, coleta de documentos, etc.) foram utilizados para
realizar a ao?
Quais modos especficos foram utilizados para realizar a ao (por
exemplo, tcnicas ou mtodos para tratamento dos dados, que podem
ser do tipo: modelagem estatstica, anlise estrutural, codificao,
122
QUESTIONAMENTOS
(NORMA 12.676 e PRECIS)
TERMOS CAFTE
C8.
FUNDAMENTO
TERICO
C9.
FUNDAMENTO
HISTRICO/
CONTEXTUAL
C10.
RESULTADOS
123
C1.
TEMA
C2.
OBJETO
EMPRICO
QUESTIONAMENTOS
(NORMA 12.676) e PRECIS
PARTE DA
ESTRUTURA TEXTUAL
RESUMO /
INTRODUO
(problema, justificativa,
objetivos)
RESUMO /
INTRODUO
(problema, justificativa,
objetivos) /
METODOLOGIA
124
QUESTIONAMENTOS
(NORMA 12.676) e PRECIS
PARTE DA
ESTRUTURA TEXTUAL
RESUMO /
INTRODUO
(problema, justificativa,
objetivos)
C4.
AMBIENTAO
RESUMO /
INTRODUO
(problema, justificativa,
objetivos) /
METODOLOGIA
C5.
TIPO DE
PESQUISA
RESUMO /
METODOLOGIA /
RESULTADOS /
DISCUSSO DE
RESULTADOS
C6.
COLETA DE
DADOS
RESUMO /
METODOLOGIA /
RESULTADOS /
DISCUSSO DE
RESULTADOS
C7.
MTODOS
RESUMO /
METODOLOGIA /
RESULTADOS /
DISCUSSO DE
RESULTADOS
C8.
FUNDAMENTO
TERICO
RESUMO / REVISO
DE LITERATURA /
FUNDAMENTAO
C9.
FUNDAMENTO
HISTRICO/
CONTEXTUAL
RESUMO / REVISO
DE LITERATURA /
FUNDAMENTAO
C10.
RESULTADOS
TERMOS CAFTE
C3.
ESCOPO
RESUMO /
RESULTADOS /
DISCUSSO DE
RESULTADOS /
CONCLUSES
125
Segunda coluna
Terceira
coluna
Quarta coluna
TERMOS
CAFTE
QUESTIONAMENTOS
(NORMA 12.676) e
PRECIS
PARTE DA
ESTRUTURA
TEXTUAL
TERMOS DE
INDEXAO
76
126
77
A traduo uma das etapas da indexao na qual a linguagem natural dos autores convertida para a
linguagem controlada utilizada no sistema, fazendo a compatibilizao das duas linguagens.
127
128
78
Quando a populao finita e pequena pode-se aplicar a amostra probabilstica simples escrevendo cada
elemento da populao em um carto, misturando-os em uma urna e sorteando tantos cartes quantos se
deseja na amostra.
129
percentual de preenchimento das mesmas (GRF. 1), que ser a seguinte: C1. Tema, C2.
Objeto emprico, C7. Mtodos, C5. Tipo de pesquisa e C6. Coleta de dados.
Categoria C1 Tema: houve 100% de preenchimento dessa categoria.
Observou-se que h, basicamente, duas vertentes na linha de pesquisa OUI da ECI-UFMG:
uma vertente organizao da informao e outra vertente estudos de uso. A vertente
organizao totalizou 66% dos temas pesquisados, e a vertente uso totalizou 34%. Esse
resultado demonstra que as pesquisas na linha OUI priorizam as questes relacionadas com
a organizao da informao. Entretanto, ressalta-se que outra linha de pesquisa da ECIUFMG, Informao, Cultura e Sociedade (ICS), tambm investiga o uso de informaes,
o que pode explicar a diferena percentual. Entretanto, o escopo desta pesquisa no
abarcou a anlise das outras linhas de pesquisas, e essa informao representa somente
um indcio para futuras anlises que envolvam as trs linhas de pesquisa do PPGCI-UFMG.
Categoria C2 Objeto emprico: houve 100% de preenchimento dessa
categoria. Percebeu-se bastante heterogeneidade nesse item. Uma particularidade
observada foi em relao ao uso de pronturios mdicos (trs trabalhos, quase 8% do total).
Esse resultado indica um interesse especial das pesquisas na linha OUI com a organizao
e o acesso de informaes mdicas, provavelmente devido ampliao no nmero de
hospitais e clnicas que esto adotando os pronturios eletrnicos, nos ltimos anos.
Categoria C7 Mtodos: houve 68% de preenchimento dessa categoria,
totalizando 28 documentos do corpus da pesquisa. Observou-se que um mesmo
documento, muitas vezes, indicou a utilizao de mais de um mtodo de pesquisa, o que
uma caracterstica comum. Verificou-se que os mtodos mais utilizados na vertente
organizao da informao foram os mtodos da anlise documentria, da classificao
(anlise facetada) e do analtico-sinttico, revelando a recorrncia do uso dos princpios dos
estudos de Ranganathan na linha de pesquisa OUI. J na vertente uso da informao, os
mtodos mais utilizados foram os de estatstica (bibliometria), geralmente combinando a
abordagem quantitativa com uma anlise qualitativa dos dados, e o mtodo da anlise de
citaes. Esse resultado indica uma viso mais positivista da vertente uso da informao.
Categoria C5 Tipo de pesquisa: houve 46% de preenchimento dessa
categoria, totalizando 19 documentos do corpus da pesquisa. Da mesma forma como na
categoria C7 (Mtodos), nessa categoria houve a indicao de mais de um tipo de
qualificao para uma pesquisa, caracterstica tambm comum. Os resultados revelaram
que prevalecem as pesquisas qualitativas e comparativas, o que parece indicar o interesse
em investigar melhores formas de organizao de informaes para atender s
necessidades do usurio final. Alm disso, prevalecem tambm as pesquisas do tipo
estudos de caso, dificultando as generalizaes dos resultados encontrados nessas
pesquisas.
130
79
CAO, Rosrio. Anlise Qualitativa de Dados com o NVIVO. 31 de out. 2008. Disponvel em:
<http://slidesha.re/11XyZq>. Acesso em: 12 mar. 2011.
131
132
133
Prottipo
Mapa
Hipertextual
(MHTX),
realizado
dentro
do
laboratrio
134
135
10), uma vez que, no escopo desta pesquisa, esse tipo de atribuio foi suficiente para
demonstrar a experincia.
FIGURA 10 Campos e relacionamentos entre facetas
136
137
A FIG. 13 mostra que a categoria C3 possui duas facetas, que esto diretamente
relacionadas com os documentos t002-2009, t003-2008 e t004-2008. Entretanto, como os
documentos so representados sob todas as categorias da taxonomia facetada, o resultado
para o usurio expandido, permitindo que esse usurio possa explorar um conjunto maior
de temas relacionados com os documentos recuperados, como mostrado na FIG. 14.
138
Observando a FIG. 14, nota-se que a taxonomia facetada permite que o usurio
explore todas as categorias e facetas sob as quais os documentos (t002-2009, t003-2008 e
t004-2008) foram representados. A FIG. 15 mostra como apresentado o resultado ao
usurio.
FIGURA 15 Resultado das interrelaes disponveis para recuperao
139
140
141
Nota-se que o universo, agora, possui somente dois documentos (seta verde).
Analisando o conjunto percebe-se, por exemplo, que esses dois documentos (resultado da
busca) possuem tipo de pesquisa comparativa, que tambm so qualitativa (seta
vermelha). Nota-se que, novamente, que o pesquisador tem sua disposio outras opes
142
de busca (dentro da chave), podendo restringir sua busca (selecionando a faceta descritiva
ou quantitativa) ou, ainda, associ-la com as outras categorias disponveis.
CRG
ACT (CAFTE)
Personalidade
Objeto
Resultados
Tema
Matria
Partes
Materiais
Propriedades
Escopo
Fundamento
histrico/contextual
Tipo de pesquisa
Energia
Processos
Operaes
Agentes
Coleta de dados
Fundamento terico
Mtodos
Espao
Espao
Ambientao
Tempo
Tempo
143
144
6 CONSIDERAES FINAIS
A presente pesquisa iniciou-se com a perspectiva de priorizar o atendimento s
necessidades de informao do usurio da biblioteca digital de teses e dissertaes (BDTD),
com recorte nos trabalhos defendidos na linha de pesquisa de Organizao e Uso da
Informao (OUI), no Programa de Ps-Graduao em Cincia da Informao da Escola de
Cincia da Informao (ECI) da UFMG. Para tanto, foi necessrio identificar as
caractersticas do domnio, do usurio e do que precisa em termos informacionais. Nesse
sentido, o uso da teoria da anlise de domnio (TAD) mostrou-se adequado para indicar a
comunidade de discurso que produz e usa o tipo de informao contida nesses trabalhos
acadmicos. A abordagem scio-cognitiva da TAD, tambm utilizada para expor o usurio e
suas necessidades de informao, levou ao entendimento pragmtico de que o fluxo da
informao produzida nessa comunidade de discurso, que a comunidade cientfica, tem
um sentido prtico de produo e de uso. A partir da aplicao da TAD, definiu-se que o
produtor e o usurio da BDTD so os pesquisadores (ou cientistas) em exerccio de
atividade profissional.
Dentro desse contexto, entende-se que todo pesquisador membro da
comunidade cientfica. Ele busca a aprovao de seus pares e segue procedimentos
metodolgicos ordenados e sistemticos na produo de seus trabalhos acadmicos. Toda
pesquisa construda a partir de um conhecimento anterior e, como consequncia, a
facilidade de acesso, a disponibilidade e a visibilidade desse conhecimento anterior torna a
produo cientfica mais eficiente e menos redundante. Acredita-se que a cincia avana na
medida em que h um processo de construo de conhecimento, maximizado pela
comunicao do conhecimento j edificado. Sendo assim, o texto produzido pelo cientista
expressa um significado e um objetivo comunicativo dentro de sua comunidade discursiva,
que, por sua vez, exerce certo controle sobre os procedimentos que so seguidos por esse
cientista na produo do seu texto cientfico.
A reviso de literatura realizada neste estudo demonstrou que a abordagem da
navegao facetada empregada desde o final da dcada de 90, como soluo de
explorao, busca e recuperao de informaes na Web utilizando, principalmente, a
determinao de categorias de forma automatizada. Essa caracterstica muitas vezes se
deve ao fato de serem projetos oriundos de reas como a Cincia da Computao,
Engenharia de Software e Informtica, campos nos quais h forte apelo para solues
tecnolgicas automticas. Entretanto, encontram-se propostas, como a do FLAMENCO,
cujos metadados categoriais so atribudos de forma no automtica (manual), uma vez que
uma iniciativa para navegao em ambiente Web, porm, para colees mais restritas.
145
146
uso dessa tabela pode vir a melhorar a qualidade dos resumos disponibilizados na BDTD e,
consequentemente, aprimorar a recuperao das informaes referentes aos documentos.
Para o desenvolvimento desta dissertao partiu-se do pressuposto de que era
possvel oferecer ao usurio da BDTD uma opo de busca fcil de usar e interpretar, com
informaes organizadas. Alm disso, a expectativa recaiu sobre o objetivo de dar maior
visibilidade ao conhecimento cientfico acumulado nas teses e dissertaes, oferecendo a
possibilidade de refinamento da busca do usurio, sem que ele fosse sobrecarregado com
informaes.
A taxonomia facetada para navegao (TAFNAVEGA) apresentada aqui
constituda por um conjunto de dez categorias fundamentais temticas (CAFTE) e pelos
conceitos (representados pelos termos) extrados pela anlise conceitual nos documentos
do corpus desta pesquisa, que compuseram as facetas da estrutura facetada da taxonomia.
A TAFNAVEGA foi desenvolvida dentro dos princpios da teoria da anlise facetada (TAF)
dos estudos de Ranganathan (1957) e das recomendaes do Classification Research
Group (CRG), que esto indicadas na simplificao apresentada por Spiteri (1998). A
validao do conjunto CAFTE foi realizada a partir do mtodo da Anlise de Contedo, com
a aplicao da tcnica da anlise categorial temtica (ACT). O uso da ACT mostrou-se
apropriada nesse procedimento, uma vez que o confrontamento realizado entre essa tcnica
e os fundamentos da TAF determinou o alto grau de similaridade entre elas. Essa
similaridade o que se denomina de similaridade funcional e de execuo. Na similaridade
funcional a TAF e a ACT comungam a funo de potencializar a estruturao e ordenao
das informaes do contedo das teses e dissertaes. J a similaridade de execuo est
relacionada aos processos metodolgicos lgicos executados para se chegar s categorias
fundamentais, conforme indicado no QUADRO 13.
As teses e dissertaes so produzidas em linguagem natural e de forma
semiestruturada, o que dificulta sua anlise conceitual. A representao desse tipo de
documento por meio do conjunto das CAFTE organizou e ordenou o contedo textual dos
trabalhos acadmicos, uma vez que estruturou esse tipo de documento em categorias,
respeitando-se a sua estrutura textual de produo. Dessa maneira, o conjunto das CAFTE
mostrou-se adequada, pois possibilitou o acesso a resultados detalhados das pesquisas tais
como temas, mtodos, instrumentos de coleta de dados e fundamentos tericometodolgicos. A estrutura facetada taxonmica agrupou os termos indexadores (extrados
dos documentos atravs do algoritmo) que compartilham caractersticas semelhantes,
transformando-os em facetas e subfacetas navegveis. Com isso, alcanou-se o objetivo de
oferecer informaes organizadas, pois elas foram arranjadas de uma forma fcil de
apreender.
147
148
149
150
REFERNCIAS
AAKER, D.; KUMAR, V.; DAY, G. S. Marketing research. Hoboken, NJ: Wiley, 1995.
AHLBERG, C.; SHNEIDERMAN, B. Visual information seeking: tight coupling of dynamic
query filters with starfield displays. In: SIGCHI CONFERENCE ON HUMAN FACTORS IN
COMPUTING SYSTEMS: Celebrating Interdependence, Boston, MA, USA, Apr. 24-28,
1994. Proceedings New York: ACM, 1994. p. 313-317. Disponvel em:
<http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.123.805>. Acesso em: 12 mar.
2011.
ALBRETCHTSEN, H. Subject analysis and indexing: from automated indexing to domain
analysis. The Indexer, London, v.18, n. 4, p. 219-24, 1993.
ALVARADO, Rubn U.; OLIVEIRA, Marlene. A Comunidade cientfica da Biblioteconomia e
Cincia da Informao brasileira. Pesquisa Brasileira em Cincia da Informao e
Biblioteconomia, v. 3, n. 2, 2008. Disponvel em:
<http://revista.ibict.br/pbcib/index.php/pbcib/article/view/1051>. Acesso em: 12 jan. 2011.
ALVES, Rachel C. V. et al. Cincia da Informao, Cincia da Computao e Recuperao
da Informao: algumas consideraes sobre os mtodos e tecnologias da informao
utilizados ao longo do tempo. Revista Eletrnica Informao e Cognio, Marlia, SP, v.6,
n.1, p.28-40, 2007.
ANDERSON, J. D.; HOFMANN, M. A. A fully faceted syntax for Library of Congress subject
headings. Cataloging & Classification Quarterly, v. 43, n. 1, p. 7-38, 2006.
ARAJO, Carlos Alberto vila. Anlise temtica da produo cientfica em comunicao no
Brasil baseada em um sistema classificatrio facetado. 2005. 427f. Tese (Doutorado em
Cincia da Informao) Escola de Cincia da Informao, Universidade Federal de Minas
Gerais, Belo Horizonte, 2005.
ARAJO, Samur F. C. de. Explorator: ferramenta para explorao de dados RDF baseado
em uma interface de manipulao direta. 2009. 127f. Dissertao (Mestrado em Informtica)
Departamento de Informtica, Pontifcia Universidade Catlica do Rio de Janeiro, Rio de
Janeiro, 2009. Disponvel em: <http://www.maxwell.lambda.ele.pucrio.br/Busca_etds.php?strSecao=resultado&nrSeq=13792@1>. Acesso em: 12 mar. 2011.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 12676. Mtodos para anlise
de documentos: determinao de seus assuntos e seleo de termos de indexao. Rio de
Janeiro, 1992.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR10520. Informao e
documentao: citaes em documentos: apresentao. Rio de Janeiro, 2002.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR12225. Informao e
documentao: lombada: apresentao. Rio de Janeiro, 2004.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR14724. Informao e
documentao: trabalhos acadmicos: apresentao. Rio de Janeiro, 1992.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR14724. Informao e
documentao: trabalhos acadmicos: apresentao. Rio de Janeiro, 2005.
151
152
153
154
155
156
157
MARCONI, M. A.; LAKATOS, Eva Maria. Tcnicas de pesquisa. 2. ed. So Paulo: Atlas,
1990.
MARTINEZ, A. et al. Las categoras o facetas fundamentales: una metodologa para el
diseo de taxonomas corporativas de sitios Web argentinos. Ci. Inf., Braslia, v. 33, n. 2, p.
106-111, maio/ago. 2004.
MELTON, Jessica. A use for the techniques of structural linguistics in documentation
research. Cleveland: Western Reserve University, 1964.
MENDES, Renata dos Santos. A importncia da adequada estruturao de resumo e
resenha. Revista Espao Acadmico, Maring, PR, n. 114, p. 135-140, nov. 2010.
Disponvel em: <http://periodicos.uem.br/ojs/index.php/EspacoAcademico/index>. Acesso
em: 2 fev. 2011.
MORAES, Roque. Anlise de Contedo. Revista Educao, Porto Alegre, v. 22, n. 37, p. 732, 1999.
MOREIRA, W. Biblioteca tradicional x biblioteca virtual: modelos de recuperao da
informao. 1998. 90f. Dissertao (Mestrado em Biblioteconomia), Pontifcia Universidade
Catlica de Campinas, Campinas, 1998.
MORVILLE, Peter; ROSENFELD, Louis. Information architecture for the World Wide Web.
3th ed. Sebastopol, CA: O'Reilly Media, 2006.
MUELLER, S. P. M. A cincia, o sistema de comunicao cientfica e a literatura cientfica.
In: CAMPELLO, Bernadete Santos; CENDN, Beatriz Valadares; KREMER, Jeanette
Marguerite. (Orgs.). Fontes de informao para pesquisadores e profissionais. Belo
Horizonte: Editora UFMG, 2000. p. 21-34.
NATIONAL INFORMATION STANDARDS ORGANIZATION. ANSI/NISO Z39.19-2005:
guidelines for the construction, format, and management of monolingual thesauri. 2005.
NELSON, Theodor Holm. Xanalogical structure, needed now more than ever: parallel
documents, deep links to content, deep versioning, and deep re-use. ACM Computing
Surveys, v. 31, n. 4, Dec. 1999. Disponvel em: <http://www.acm.org/surveys/
Formatting.html>. Acesso em: 4 mar. 2010.
NOGUEIRA, Maria do Carmo de C. Artigos de peridicos: produo de pesquisadores de
Cincia Espacial do INPE. 1997. 149f. Dissertao (Mestrado em Biblioteconomia
Planejamento e Administrao de Sistemas) Pontifcia Universidade Catlica de
Campinas, Campinas, 1997.
NONATO, R. dos S. et. al. Arquitetura da Informao em Bibliotecas Digitais: uma
abordagem da Cincia da Informao e da Biblioteconomia. Inf. Inf., Londrina, v. 13, n. 2, p.
125-141, jul./dez. 2008. Disponvel em:
<http://www.uel.br/revistas/uel/index.php/informacao/article/view/1812/1682> Acesso em: 7
fev. 2010.
NOVO, Hildenise Ferreira. A elaborao de taxonomia: princpios classificatrios para
domnios interdisciplinares. 2007. 172 f. Dissertao (Mestre em Cincia da Informao)
Universidade Federal Fluminense, Instituto de Arte e Comunicao Social, Niteri, Rio de
Janeiro, 2007.
ODDONE, N. E.; GOMES, M. Y. F. S. F. Os temas de pesquisa em Cincia da Informao e
suas implicaes poltico-epistemolgicas. In: ENCONTRO NACIONAL DE CINCIA DA
158
INFORMAO, 5., 2004, Salvador. Anais... Salvador: CINFORM, 2004. Disponvel em:
<http://dici.ibict.br/archive/00000558/01/temas_de_pesquisa.pdf> Acesso em: 13 mar. 2010.
ODDONE, Nanci; GOMES, Maria Yda F. S. de F. Uma nova taxonomia para a cincia da
informao. In: ENCONTRO NACIONAL DE PESQUISA EM CINCIA DA INFORMAO,
5., Belo Horizonte, 2003. Anais... Belo Horizonte: ECI/UFMG, 2003.
OHIRA, Maria Lourdes B.; PRADO, Nomia S. Bibliotecas virtuais e digitais: anlise de
artigos de peridicos brasileiros: 1995/2000. Ci. Inf., Braslia, v. 31, n.1, jan. 2002.
Disponvel em: <http://www.scielo.br/scielo.php?pid=S010019652002000100007&script=sci_arttext&tlng=es>. Acesso em: 12 abr. 2010.
OLIVEIRA, Denize Cristina de. Anlise de contedo temtico-categorial: uma proposta de
sistematizao. Rev. Enferm., Rio de Janeiro, v. 16, n. 4, p. 569-576, out./dez. 2008.
OLSON, Tod A. Utility of a faceted catalog for scholarly research. Library Hi Tech, v. 25, n. 4,
p. 550-561, 2007.
PEREIRA, Edmeire Cristina; RUTINA, Raquel. O sculo XXI e o sonho da biblioteca
universal: quase seis mil anos de evoluo na produo, registro e socializao do
conhecimento. Perspect. Cinc. Inf., Belo Horizonte, v. 4, n. 1, p. 5-19, jan./jun. 1999.
PINHO, Carolina M. D. de; KUX, Hermann H.; ALMEIDA, Cludia Maria. Elaborao de rede
semntica para classificao de cobertura do solo de ambientes intra-urbanos: o Caso de
So Jos dos Campos SP. In: SIMPOSIO BRASILEIRO DE SENSORIMANTO REMOTO,
13., Florianpolis, 21-26 abr. 2007. Anais... Florianpolis: SBSR, 2007. p. 637-644.
POLLITT, A. S. et al. View-bsed searching systems: progress towards effective
disintermediation. In: ONLINE INFORMATION, 96.; INTERNATIONAL ONLINE
INFORMATION MEETING, 20.,1996. London, England. Proceedings London, England:
[s.n], 1996. p. 433-441. Disponvel em:
<http://www.eric.ed.gov/ERICWebPortal/search/detailmini.jsp?_nfpb=true&_&ERICExtSearc
h_SearchValue_0=ED411866&ERICExtSearch_SearchType_0=no&accno=ED411866>.
Acesso em: 14 mar. 2011.
PRATT, Wanda; HEARST, Marti A.; FAGAN, Lawrence M. A knowledge-based approach to
organizing retrieved documents. In: NATIONAL CONFERENCE ON ARTIFICIAL
INTELLIGENCE, 16., July 18-22, 1999. Proceedings Orlando, Florida, 1999. p. 80-85.
PRAZERES, C. V. S. et al. Uma proposta de navegao na web utilizando facetas. In:
ERBD, 6.; ESCOLA REGIONAL DE BANCO DE DADOS, 2., 2006, Passo Fundo, RS.
Anais... Passo Fundo,RS: [s.n.], 2006. v. 1, p. 1-6.
RABELLO, Rodrigo. A face oculta do documento: tradio e inovao no limiar da Cincia
da Informao. 2009. 331f. Tese (Doutorado em Cincia da Informao) Faculdade de
Filosofia e Cincias, Universidade Federal Paulista, So Paulo, 2009.
RANGANATHAN, Shiyali R. Prolegomena to library classification. 3. ed. London: Asia
Publishing House, 1967. Disponvel em:
<http://dlist.sir.arizona.edu/arizona/handle/10150/106370>. Acesso em: 12 fev. 2011.
ROCHA, Dcio; DEUSDAR, Bruno. Anlise de Contedo e Anlise do Discurso:
aproximaes e afastamentos na (re)construo de uma trajetria. Alea, Rio de Janeiro, v.
7, n. 2, p. 305-322, jul./dez. 2005.
159
160
161
BIBLIOGRAFIA COMPLEMENTAR
ALLEN, R. B. Retrieval from facet spaces. Electronic Publishing, v. 8, p. 247-257, 1996.
Disponvel em:
162
<http://www.ischool.drexel.edu/faculty/ballen/PAPERS/FACETS/facets.html>.Acesso em: 12
mar. 2011.
ALVARENGA, L. Representao do conhecimento em tempo e espao digitais. Enc. Bibli: R.
Eletr. Bibliotecon. Ci. Inf., Florianpolis, n.15, p.1-23, 2003.
ALVES, R. C. V. Web semntica: uma anlise focada no uso de metadados. 2005. 180f.
Dissertao (Mestrado em Cincia da Informao) Faculdade de Filosofia e Cincias,
Universidade Estadual Paulista, Marlia, SP, 2005.
ALVES, Renato M. B. Uma anlise emprica sobre o uso combinado de tcnicas de busca e
de navegao na recuperao de informao. 122f. 2010. Dissertao (Mestrado em
Informtica) Instituto de Matemtica, Ncleo de Computao Eletrnica, Universidade
Federal do Rio de Janeiro, Rio de Janeiro, 2010.
ANDER-EGG, Ezequiel. Introduccin a las tcnicas de investigacin social: para
trabajadores sociales. 7. ed. Buenos Aires: Humanitas, 1978.
AZEVEDO NETTO, C. X. de. A abordagem do conceito como uma estrutura semitica.
TransInformao, Campinas, v. 20, n. 1, p. 47-58, jan./abr. 2008.
BARBOSA, Alice. Teoria e prtica dos sistemas de classificao bibliogrfica. Rio de
Janeiro: Instituto Brasileiro de Bibliografia e Documentao, 1969.
BARDIN, Laurence. Anlise de contedo. 3. ed. Lisboa: Edies 70, 2004.
BARIT, Mario G. et al. Garantia literria: elementos para uma reviso crtica aps um
sculo. TransInformao, Campinas, v. 22, n. 2, p. 123-138, maio/ago. 2010.
BARIT, Mario G. The notion of category: its implications in subject analysis and in the
construction and evaluation of indexing languages. Knowledge Organization, v. 27, n. 1-2, p.
5-10, 2000.
BATISTA, Edinelson A. Uma Taxonomia facetada para tcnicas de elicitao de requisitos.
2003. 150 f. Dissertao (Mestrado em Cincia da Computao) Universidade de
Campinas, Instituto de Computao, Campinas, 2003.
BELLUZZO, Regina Clia B. et al. Indexao automtica de documentos com "PRECIS
software" no Servio de biblioteca e Documentao da Faculdade de Odontologia de Bauru
(USP). In: SIMPSIOS LATINO-AMERICANO DE TERMINOLOGIA TCNICO-CIENTFICA
(RITerm), 2., 1990, Braslia. Actas... Braslia: Secretaria da Cincia e Tecnologia da
Presidncia da Repblica/Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico /
Instituto Brasileiro de Informao em Cincia e Tecnologia (IBICT), 1990. Disponvel em:
<http://www.riterm.net/actes/2simposio/belluzzo.htm>. Acesso em: 12 mar. 2011.
BONINI, Adair. O conhecimento de jornalistas sobre gneros textuais: um estudo
introdutrio. Revista Linguagem em (Dis)curso, Palhoa, SC, v. 2, n. 1, jul./dez. 2001.
Disponvel em: <http://www3.unisul.br/paginas/ensino/pos/linguagem/0201/01.htm>. Acesso
em: 12 mar. 2010.
BORBINHA, Jos. Bibliotecas, arquivos e outras coisas digitais. In: CONGRESSO
NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 9., 2007,
Aores. Anais... Universidade dos Aores de Ponta Delgada. Aores, Lisboa: Congresso
BAD, 2007. Disponvel em: <http://badinfo.apbad.pt/congresso9/COM68.pdf>. Acesso em: 2
abr. 2010.
163
164
CUNHA, Murilo B. da. Construindo o futuro: a biblioteca universitria brasileira em 2010. Ci.
Inf., Braslia, v. 29, n. 1, p. 71-89, jan./abr. 2000.
CUNHA, Murilo Bastos da. Das bibliotecas convencionais s digitais: diferenas e
convergncias. Perspect. Cinc. Inf., Belo Horizonte, v. 13, n. 1, p. 2-17, jan./abr. 2008.
DAHLBERG, Ingetraut. Knowledge organization and terminology: philosophical and linguistic
bases. Int. Classif., v. 19, n. 2, p. 65-71, 1992.
DAHLBERG, Ingetraut. Knowledge organization: a new science?. Knowledge Organization,
v. 33, n. 1, 2006.
DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Braslia, DF, v. 7, n. 2, 1978. Disponvel
em: <http://revista.ibict.br/index.php/ciinf/article/viewArticle/1680>. Acesso em: 14 ago. 2009.
DAHLBERG, Ingetraut. Uma teoria para o interconcept: teoria analtica do conceito voltada
para o referente. Ttulo original: A referent-oriented analytical concept theory of interconcept.
[Publicado originalmente na revista] International Classification, v. 5, n. 3, p. 142-151, 1978.
[Traduzido por Vnia Teixeira Gonalves, Bolsista do CNPq, da equipe de Hagar. E. Gomes,
Rio de Janeiro, 1990. 34p.].
DENTON, William. How to make a faceted classification and put it on the web. Disponvel
em: <http://www.miskatonic.org/library/facet-web-howto.html>. Acesso em: 10 jan. 2010.
DIAS, Aldo A.; NARVAI, Paulo C.; REGO, Delane Maria. Tendncias da produo cientfica
em odontologia no Brasil. Ver. Panam. Salud. Publica [on-line], v. 24, n. 1, p. 54-60, 2008.
Disponvel em: <http://www.scielosp.org/>. Acesso em: 12 mar. 2011.
DIAS, C. A. Portal corporativo: conceitos e caractersticas. Ci. Inf. Braslia, DF, v. 30, p. 5060, 2001.
DIAS, Eduardo W. Contexto digital e tratamento da informao. DataGramaZero - Rev Ci.
Inf. , Rio de Janeiro, v. 2, n. 5, out. 2001. Disponvel em:
<http://www.dgz.org.br/out01/Art_01.htm>. Acesso em: 20 out. 2009.
DIAS, S. A. Integrao semntica de dados atravs de federao de ontologias. 2006. 83f.
Dissertao (Mestrado em Informtica) Departamento de Informtica, Pontifcia
Universidade Catlica do Rio de Janeiro, Rio de Janeiro, 2006.
DOSI, G. Sources, procedures and microeconomic effects of innovation. Journal of
Economic Literature, v. 27, p. 1126-1171, 1988.
DUARTE Elizabeth A.; CERQUEIRA, Roberto F. P. de. Anlise facetada: um olhar face a
modelagem conceitual. Revista Digital de Biblioteconomia e Cincia da Informao,
Campinas, v. 4, n. 2, p. 39-52, jan./jun. 2007.
ENGELMANN, Jaqueline. Teoria da definio: das definies reais s definies
predicativas. 2006. 140f. Tese (Doutorado em Filosofia) Departamento de Filosofia,
Pontifcia Universidade Catlica do Rio de Janeiro, Rio de Janeiro, 2006. Disponvel em:
<http://www.maxwell.lambda.ele.puc-rio.br/Busca_etds.php?%20strSecao=
resultado&nrSeq=9106@1>. Acesso em: 12 dez. 2009.
ESTEBAN NAVARRO, Miguel A. El marco disciplinar de los lenguajes documentales: la
Organizacin del Conocimiento y las ciencias sociales. Scire, Zaragoza, v. 2, n. 1, p. 93-107,
ene./jun. 1996.
165
166
167
168
169
Workshop on the Semantic Desktop, 2006, Athens. Proceedings Athens, GA, USA: ISWC,
2006.
PANSANATO, Luciano T. E. Um modelo de navegao exploratria para a infra-estrutura da
web semntica. 2007.166f. Tese (Doutorado em Cincias da Computao e Matemtica
Computacional) Instituto de Cincias Matemticas e de Computao, So Carlos, 2007
PASSARELLI, Brasilina. Do Mundaneum web semntica: discusso sobre a revoluo nos
conceitos de autor e autoridade das fontes de informao. DataGramaZero - Rev Ci. Inf., Rio
de Janeiro, v. 9, n. 5, out. 2008.
PIEDADE, Maria Antonietta. Introduo teoria da classificao. Rio de Janeiro:
Intercincia, 1977.
PINHEIRO, Lna Vnia Ribeiro. Processo evolutivo e tendncias contemporneas da
cincia da informao. Inf. & Soc.: Est., Joo Pessoa, v. 15, n. 1, p. 13-48, jan./jun. 2005.
PINHEIRO, W. A. Busca em portais semnticos: uma abordagem baseada em ontologias.
2004. 170f. Dissertao (Mestrado em Sistemas e Computao) Instituto Militar de
Engenharia, Rio de Janeiro, 2004.
PINTO, Maria; DOUCET, Anne-Vinciane; FERNNDEZ-RAMOS, Andrs. The role of
information competencies and skills in learning to abstract. Journal of Information Science, v.
34, n. 6, p.799-815, 2008. Disponvel em: <http://jis.sagepub.com/content/34/6/799>. Acesso
em: 12 fev. 2011.
PRESTES, Maria Luci de Mesquita. A pesquisa e a construo do conhecimento cientfico:
do planejamento aos textos, da escola academia. So Paulo: Rspel, 2002.
RAFFERTY, Pauline; HIDDERLEY, Rob. Flickr and democratic indexing: dialogic
approaches to indexing. Aslib Proceedings, v. 59, n. 4-5, p. 397-410, 2007. Disponvel em:
<http://www.emeraldinsight.com/Insight/viewPDF.jsp?Filename=html/Output/Published/Emer
aldFullTextArticle/Pdf/2760590407.pdf>. Acesso em: 22 mar. 2010.
ROCKMORE, Marlene. The 5 types of taxonomies: from lists to ontologies. The taxonomy
blog, 26 jun. 2009. Disponvel em: <http://thetaxonomyblog.wordpress.com/2009/06/26/5types-of-taxonomies-from-lists-to-ontologies/>. Acesso em: 12 mar. 2011.
ROSA , Malvina Vianna. O papel da classificao na recuperao da informao:
classificao facetada. R. Bibliotecon., Braslia, v. 1, n. 2, p. 207-210, jul./dez. 1973.
Disponvel em: <http://www.tempusactas.unb.br/index.php/RBB/article/viewFile/33/25>.
Acesso em: 2 abr. 2010.
ROSAS, P. Introdues redatoriais e a indexao em publicao peridica. In:
GOLDENBERG, S; GUIMARES C, A; Castro A, A. Elaborao e apresentao de
comunicao cientfica. So Paulo: Metodologia.org, 2001. Disponvel em: <www.
metodologia.org>. Acesso em: 2 ago. 2010.
RUSSO, Ida C. P. Editorial II: a relevncia da pesquisa cientfica na audiologia brasileira.
Revista CEFAC, So Paulo, 2011. Disponvel em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S151618462009000500002&lng=en&nrm=iso>. Acesso em: 11 abr. 2011.
SACCO, Giovanni Maria. Research results in dynamic taxonomy and faceted search
systems. In: INTERNATIONAL CONFERENCE ON DATABASE AND EXPERT SYSTEMS
170
171
172
APNDICES
APNDICE A Lista do corpus da pesquisa
CODIGO
DOCUMENTO
t001-2009
t002-2009
CDIGO
DO
TTULO DO DOCUMENTO
DADO
Registro de informao no Sistema de Informao em Sade: um estudo das bases
3454
SINASC, SIAB e SIM no Estado de Alagoas
4856 As relaes interdisciplinares refletidas na Cincia da Informao
t003-2008
3962
t004-2008
4857
t006-2008
2134
t009-2007
2095
t010-2005
79
t011-2005
550
t012-2005
1265
t013-2005
48
t014-2004
695
t015-2004
1261
d004-2009
4054
d007-2009
3773
d008-2009
3844
d009-2008
3446
d010-2008
2112
d011-2008
4333
d012-2008
4342
d013-2008
4520
d014-2007
4059
d015-2007
1282
d016-2007
2101
d017-2007
1492
d018-2007
747
d019-2006
d020-2006
3483
144
173
CODIGO
DOCUMENTO
CDIGO
DO
TTULO DO DOCUMENTO
DADO
empresas de informtica
d021-2006
118
d022-2006
116
d023-2006
119
d024-2006
2199
d025-2005
64
d026-2005
78
d027-2005
4424
d028-2005
955
d029-2005
90
d030-2005
952
d031-2005
694
d036-2004
949
d037-2003
18
d038-2002
901
174
Comerciais
pela
Universidade
do
Estado
da
Bahia;
Especialista
em
175
C6. MTODOS
C7. COLETA DE DADOS
C8. PONTO DE VISTA DO AUTOR;
PERSPECTIVA
C9. PRINCIPAIS RESULTADOS
ALCANADOS
176
C6. MTODOS
C7. COLETA DE DADOS
C8. PONTO DE VISTA DO AUTOR;
PERSPECTIVA
C9. PRINCIPAIS RESULTADOS
ALCANADOS
177
178
C4.Ambientao
Ambientar: [ambientao o ato de ambientar-se]: adaptar-se a um ambiente (FERREIRA,
1988, p.36). Ambiente: [...] lugar, stio, espao, recinto (FERREIRA, 1988, p.36).
Tanto nos trabalhos tericos quanto nos que se voltam para atividades prticas
importante que o pesquisador estabelea limites no tempo e no espao. Isso porque se
torna impossvel conhecer e analisar dados referentes a um perodo muito longo ou rea
muito extensa. O espao fsico deve precisa ser decididamente considerado (MARCONI;
LAKATOS, 2010, p.230).
C5.Tipo de pesquisa
Atividades de pesquisa e desenvolvimento, isto , de investigao cientfica e tecnolgica;
construo e desenvolvimento de prottipos; execuo de projetos cientficos e
tecnolgicos; combinao das atividades de investigao e desenvolvimento de novos
produtos e processos (CUNHA; CAVALCANTI, 2008, p.281).
vrias so as modalidades de pesquisa que se podem praticar, o que implica coerncia
epistemolgica, metodolgica e tcnica, para seu adequado desenvolvimento. Pesquisa
quantitativa, pesquisa qualitativa [...]; etcnogrfica [...]; participante [...]; pesquisa-ao [...];
estudo de caso [...]; anlise de contedo [...]; bibliogrfica, pesquisa documental, pesquisa
experimental, pesquisa de campo [...]; exploratria, pesquisa explicativa (SEVERINO, 2007,
p.104-124).
C6.Coleta de dados
Dados que sero processados; dados que sero submetidos a qualquer das funes
bsicas de processamento, como sejam: codificao, registro, clculo, resumo e relatrio,
gravao e comunicao (CUNHA; CAVALCANTI, 2008, p.113).
Dentre os instrumentos utilizados de coleta de dados, podemos citar questionrio,
entrevista, formulrio e painel (SILVA, 2010, p.60).
Tcnica de coleta de informao: entrevista [...]; histria de vida [...]; observao [...];
questionrio (SEVERINO, 2007, p.124-125).
Etapa da pesquisa em que se inicia a aplicao dos instrumentos elaborados e das
tcnicas selecionadas, a fim de se efetuar a coleta de dados previstos; [...] so vrios os
procedimentos para a realizao da coleta de dados, que variam de acordo com as
circunstncias ou com o tipo de investigao. Em linhas gerais, as tcnicas de pesquisa so:
coleta documental; observao; entrevista; questionrio; formulrio; medidas de opinio ou
de atitudes; tcnicas mercadolgicas; testes; sociometria; anlise de contedo; histria de
vida; [...] tabela [...] quadro [...] grficos (MARCONI; LAKATOS, 2010, p.149).
C7.Mtodos
Ordem que se deve impor aos diferentes passos necessrios para chegar a um fim
determinado. No conhecimento, o caminho que o caminho que se deve seguir para chegar
verdade nas cincias (Descartes). Conjunto ordenado de procedimentos que servem para
descobrir o que se ignora ou para provar o que j se conhece. Processo sistemtico de
aquisio de conhecimento que segue uma srie de passos interdependentes (CUNHA;
CAVALCANTI, 2008, p.248).
Fazem-se necessrios os seguintes questionamentos: como, com o que ou com quem,
onde?; usa-se mais de um mtodo e mais de uma tcnica na realizao da pesquisa
(SILVA, 2010, p.53).
[Podem ser do tipo:] pesquisa bibliogrfica [...]; documental [...]; experimental ou de
laboratrio [...]; ex-post-facto [...]; pesquisa-levantamento [...]; de campo [...]; estudo de caso
[...]; pesquisa-ao [...]; participante [...]; exploratria [...]; descritiva [...]; explicativa [...];
tcnica (SILVA, 2010, p.53-60).
179
180
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
C8
C9
X
ITEM
C1
C2
C3
C4
C5
C6
C7
d037-2003
t013-2005
d025-2005
d026-2005
t010-2005
d029-2005
d022-2006
d021-2006
d023-2006
d020-2006
t011-2005
d031-2005
t014-2004
d018-2007
d038-2002
d036-2004
d030-2005
d028-2005
t015-2004
t012-2005
d015-2007
d017-2007
t009-2007
d016-2007
d010-2008
t006-2008
d024-2006
d009-2008
t001-2009
d019-2006
d007-2009
d008-2009
t003-2008
d004-2009
d014-2007
d011-2008
d012-2008
d027-2005
d013-2008
t002-2009
t004-2008
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
TOTAIS
%
41
100%
41
100%
39
95%
40
98%
19
46%
16
39%
28
68%
24
59%
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
C10
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
10
25%
181
AACR
45
Documentao cientfica
AIDS
46
Documentos arquivsticos
Anlise de assunto
47
Dspace
Anlise de citaes
48
Educao fsica
Anlise de clusters
49
Empresas de informtica
Anlise documentria
50
Entrevistas
Anlise facetada
51
Estatstica, mensurao
Anlise fatorial
52
Arquitetura da informao
53
Estudo de caso
10
Arquivos
54
11
Atendimento ao cliente
55
12
56
13
57
Estudos de autoria
Estudos de canais, veculos, ciclos e modelos de
comunicao
14
58
Estudos de citao
15
Avaliao de peridicos
59
Estudos de usurio
16
60
17
Avaliao de sites
18
61
19
62
20
63
Ferramenta de avaliao
21
Bases de dados
64
Fundamentao epistemolgica
65
66
Gerncia organizacional
67
Gesto documental
68
Grficos e planilhas
69
22
23
24
Bibliotecas tradicionais
25
Cabealhos de assunto
26
Campo cientfico
27
70
Hipertexto e hipermdia
Histria da arquivologia, da biblioteconomia, da
documentao e da cincia da informao
28
Catalogao/catalogao cooperativa
71
Incidente crtico
29
Catlogos on-line
72
30
73
31
Cincia da Computao
74
32
Cincias fsicas
75
Informtica
33
Cincias sociais
76
Instituio bancria
34
Classificao
77
Instituies de sade
35
Classificao facetada
78
Interao homem-computador
36
79
Interdisciplinaridade
37
Competncia Informacional
80
Interfaces hipertextuais
38
Construo civil
81
Leis bibliomtricas
39
82
Linguagens documentrias
40
Desenvolvimento de colees
83
41
Divulgao cientfica
84
Mapa Conceitual
42
85
43
86
Mapas de tpicos
44
87
182
88
Metacognio
129
Produo audiovisual
89
Metadados
130
Pronturio eletrnico
90
131
Pronturio mdico
91
132
Protocolo verbal
92
133
Publicaes oficiais
93
134
Questionrio
135
Recuperao da informao
136
137
Relaes semnticas
138
Representao temtica
139
140
Scripts de atendimento
141
142
Servios de sade
143
Setor privado
144
Setor pblico
145
Setor turstico
146
Sintagmas nominais
147
148
Sistema de informao
149
150
94
Mtodo analtico-sinttico
95
96
Mtodo indicirio
97
98
99
Metodologia de pesquisa
100
Metodologia OGMA
101
Metodologia WEKA
102
Microfilmes
103
Modelagem conceitual
104
Modelagem de dados
105
106
Multidisciplinaridade
107
108
109
110
Ontologia
151
111
Organizao do conhecimento
152
112
153
113
154
Sites
114
Pesquisa bibliogrfica
155
156
157
Tecnologias da informao
158
159
Telecomunicao
160
Teoria da comunicao
161
Teoria do conceito
162
163
Terminologia
164
Tesauro
165
Universidade (pblica)
166
Usabilidade
167
115
Pesquisa cientfica
116
Pesquisa comparativa
117
Pesquisa descritiva
118
Pesquisa documental
119
Pesquisa emprica
120
Pesquisa experimental
121
Pesquisa exploratria
122
Pesquisa qualitativa
123
124
Pesquisa terica
Planejamento, organizao e gerncia de servios e de
unidades de informao.
125
126
Prefeituras
127
128
Prestadoras de servio
168
183
OLIVEIRA (2008)
184
185
VERTENTE DE USO
25
Representao da informao
14
Indexao
Estudos de usurio
27
Bases de dados
Estatstica e mensurao
Recuperao da informao
Desenvolvimento de colees
Organizao do conhecimento
Organizao da informao
TOTAL
66%
TOTAL
34%
Assim, a vertente organizao totaliza 66% dos temas das pesquisas e a vertente uso
totaliza 44% dos temas. Isso sinaliza que, na linha OUI, os temas da vertente organizao
so mais numerosos, o que pode ser compreendido pelo fato de que somente um, entre os
nove docentes desta linha de pesquisa, se dedica, especialmente, aos estudos de uso da
informao. Mas preciso esclarecer que na linha de pesquisa Informao, Cultura e
Sociedade (ICS) h investigaes cujos temas abordam o uso de informao,
principalmente em estudos de comportamento do usurio. Entretanto, o escopo desta
pesquisa no abarcou resultados das outras linhas de pesquisa, ficando somente essa
explanao como uma pressuposio, para, talvez, um estudo futuro.
Categoria C2: Objeto emprico
A categoria C2 representa 100% dos objetos empricos utilizados para investigao nos
estudos na linha de pesquisa OUI que fazem parte do corpus desta pesquisa, apresentados
no GRF. 4.
186
Objetos Empricos
Software de biblioteca
Sites (setor turstico)
Scripts de atendimento
Relaes semnticas
Redes eletrnicas
Produo audiovisual
MTD-BR
Outros sistemas de informao
Microfilmes
Mapas de tpicos
Literatura infantil
Interfaces hipertextuais
Informaes gerencial
Help-desk
Estudos da produo cinetfica
Documentos arquivsticos
Catlogos online
Cabealhos de assunto
Avaliao de sites
Sintagmas nominais
Inform. cientfica e tecnolgica
Hipertexto
Portal Capes
Pronturio mdico
Informao textual (impresso e digital)
Documentao cientfica
0
187
Mtodos
40%
20%
0%
Anlise documentria
Estatstica - Bibliometria
Classificao/Anlise facetada
Anlise de citaes
Anlise de contedo
Avaliao de servios
Mtodo analtico-sinttico
Protocolo verbal
No item outros mtodos h dez diferentes mtodos, com uma ocorrncia cada. Os
mtodos so: indicirio (citaes), estrutura profunda DEPAm (anlise de contedo), gesto
documental (para arquivos), incidente crtico (uso/usurios), modelagem de dados
(organizao), modelagem conceitual (organizao), OGMA (anlise de texto), WEKA
(minerao de dados), entidade-relacionamento (modelagem de dados) e requisitos MoReq
(gesto de arquivos eletrnicos). O mtodo da anlise documentria e o mtodo da
classificao/anlise facetada, que aparecem em primeiro e terceiro lugar de uso,
respectivamente, so geralmente aplicados quando a pesquisa aborda a organizao de
informaes. O segundo mtodo mais utilizado o de estatstica/bibliometria, que
geralmente utilizado nas pesquisas de estudo de usurio, numa abordagem quantitativa,
mas geralmente houve uma anlise qualitativa a partir dos nmeros encontrados. Foi
interessante notar, que o mtodo estatstica/bibliometria foi utilizado em cinco trabalhos,
mas nenhum dos resumos caracterizou a pesquisa como quantitativa. Parece haver um
movimento no sentido de entender que pesquisas qualitativas trazem resultados mais
interessantes do que os estudos quantitativos. Entretanto, acredita-se que a combinao de
abordagens enriquece bastante os resultados de uma pesquisa, a quantitativa para
validao dos dados e a qualitativa para a interpretao dos mesmos.
Categoria C5 e C6: Tipo de pesquisa e Coleta de dados
Apesar de o preenchimento das categorias C5 e C6 ter sido possvel em menos de 50% dos
documentos, considerou-se interessante ter uma viso parcial dos tipos e dos instrumentos
utilizados nas pesquisas. Por essa razo, esses dois grficos esto apresentados por ltimo
e sero considerados como resultados parciais da anlise.
O GRFICO 6 mostra o resultado referente ao preenchimento do campo C5 de 19
documentos do corpus, que so 46% do total, indicando, na primeira linha, o nmero de
resumos que no incluram o tipo de pesquisa.
188
22
20
15
10
No apresentaram
Qualitativa
Comparativa
Estudos de caso
Experimental
Exploratria
Emprica
Quantitativa
Terica
Levantamento bibliogrfico
Descritiva
Documental
Esclarece-se que uma mesma pesquisa s vezes indica mais de um tipo de pesquisa, o que
bastante comum em estudos na rea da CI. De acordo com o grfico, prevalecem mesmo
as pesquisas de cunho qualitativo de anlise de dados, sobretudo quando trata de estudos
de usurio. Outro dado interessante refere-se s pesquisas comparativas, pois nota-se que
elas so utilizadas para indicar melhores formas de organizao da informao, pois
geralmente se recorre s comparaes entre dois tipos de organizaes diferentes, em um
mesmo tipo de ambientao, para provar um ponto/fato qualquer. A alta incidncia de
estudos de caso parece indicar que as pesquisas de campo tm sido utilizadas para
conhecer as conjunturas da sociedade. Entretanto, parece haver certa resistncia da
comunidade acadmica a esse tipo de pesquisa, sobretudo porque geralmente so anlises
minuciosas sobre um nico caso, prejudicando as generalizaes to desejadas pela maior
parte dos pesquisadores.
E, finalmente, o GRF. 7 mostra o resultado parcial referente ao preenchimento do campo
C6 de 16 documentos do corpus, que representam 39% do total.
GRFICO 7 Tipos de instrumentos de coleta de dados
Questionrio
Grficos e planilhas
10
8
6
4
2
0
6
3
189
81
CAO, Rosrio. Anlise qualitativa de dados com o NVIVO. 31 de out. 2008. Disponvel em:
<http://slidesha.re/11XyZq>. Acesso em: 12 mar. 2011.
190
ANEXOS
ANEXO A Modelo de busca facetada: prottipo TerveSuomi.fi
191