Documente Academic
Documente Profesional
Documente Cultură
coletiva.
saude
Hernane Borges de Barros Pereira1,2,3 , Marcos Grilo Rosa2,4 ,
1
Programa de Modelagem Computacional, SENAI Cimatec, Salvador, BA, Brasil
2
Programa de Doutorado Multiinstitucional e Multidisciplinar em
Difusao do Conhecimento - Universidade Federal da Bahia (Sede),
Salvador, Bahia - Brasil
3
Universidade do Estado da Bahia (UNEB), Salvador, BA, Brasil
4
Universidade Estadual de Feira de Santana, Feira de Santana, BA.
hbbpereira@gmail.com, grilo@uefs.br
1. RESUMO ESTENDIDO
Redes semanticas podem ser usadas para representar ou inferir sobre conhecimento. No
caso de um periodico, pode-se construir uma rede semantica baseada nos ttulos dos arti-
gos publicados (RST ), onde os vertices sao palavras e duas palavras conectam-se se am-
bas pertencerem a um mesmo ttulo. Desta forma, obtem-se redes semanticas de cliques,
as quais poderao ser importantes ferramentas no processo de difusao do conhecimento.
Neste trabalho, propomos um metodo para obtenca o de redes semanticas uniformes a par-
tir de uma dada RST, o que podera auxiliar pesquisadores na busca de temas relacionados
ao seu objeto de estudo de forma mais eficiente.
Para realizar esta pesquisa, investigou-se o periodico Sociology of Health and Ill-
ness (SHI). Os criterios de escolha do periodico foram: fator de impacto maior do que
1; disponibilidade dos artigos na Internet; o periodico possui classificaca o na a rea de
saude coletiva pelo Qualis CAPES. Os dados coletados do periodico SHI compreendem
desde o primeiro volume publicado ate o ano de 2008. A construca o da RST obedeceu,
resumidamente, os seguintes passos:
1) Os ttulos do periodico passaram por um pre-tratamento que consistiu em apli-
car uma serie de regras tais como nomes proprios devem formar uma u nica palavra, as
sequencias de palavras que tem um significado proprio, devem formar uma u nica pala-
vra, etc.
2) Os ttulos do periodico passaram por um tratamento computacional que consiste
basicamente em eliminar palavras sem significados intrnsecos e em seguida, alterar as
palavras restantes para a sua forma canonica.
Apos o tratamento, todas as palavras em um mesmo ttulo estao conectadas entre
si, formando um subgrafo completo ou uma clique. Assim, cada ttulo gera uma cli-
que. Duas cliques estarao conectadas se uma palavra ou mais pertencer(em) a dois ttulos
(cliques). Para cada periodico, formou-se uma rede semantica de cliques. Em seguida,
aplicou-se a estrategia de remoca o uniforme e aleatoria de vertices. Realizaram-se 1000
retiradas para cada valor de fraca o de vertices removidos (f ) listados a seguir: 0, 05;
0, 1; 0, 15; ...; 0, 65; 0, 7;0, 71; 0, 72; ...; 0, 98; 0, 99. Portanto, obtiveram-se 43.000 redes
semanticas.
Na etapa seguinte, observou-se o comportamento do tamanho da maior compo-
nente, o caminho mnimo medio e o diametro em funca o da fraca o de vertices removidos,
o que permitiu apontar a existencia de um ponto crtico em f = 0, 7. Neste ponto crtico,
obtiveram-se redes semanticas uniformes nas quais identificaram-se os ttulos que conti-
nham pelo menos uma palavra presente em cada rede. As palavras que nao foram remo-
vidas estao presentes em media, em pelo menos 25% dos ttulos enquanto que a retirada
de 10% dos vertices implica que as palavras que nao foram removidas estao presentes
em media, em pelo menos 46% dos ttulos. Desta forma, esta pesquisa tambem aponta
evidencias sobre o modo como autores lidam com a escolha das palavras dos ttulos dos
seus artigos considerando o escopo do periodico.
2. REFERENCIAS
BIBLIOGRAFICAS