Sunteți pe pagina 1din 182

XI Simpsio Brasileiro de

Sistemas Colaborativos

Anais

XI SIMPSIO BRASILEIRO DE SISTEMAS COLABORATIVOS


06 a 09 de outubro de 2014
Curitiba, Paran, Brasil

ANAIS
Editora
Sociedade Brasileira de Computao SBC

Organizadores
Adriana Santarosa Vivacqua
Thais Helena Chaves de Castro

Realizao
Universidade Tecnolgica Federal do Paran UTFPR

Promoo
Sociedade Brasileira de Computao SBC

Sociedade Brasileira de Computao


Anais do XI Simpsio Brasileiro de Sistemas Colaborativos SBSC 2014

2014 Direitos desta edio reservados Sociedade Brasileira de Computao


ISSN: 2318-4132

Organizadores
Adriana Santarosa Vivacqua
Thais Helena Chaves de Castro

Para cpias adicionais destes anais, enviar pedido para:


Sociedade Brasileira de Computao
Av. Bento Gonalves, 9500 Setor 4 Prdio 43424 Sala 116
Bairro Agronomia CEP 91.509-900 Porto Alegre RS
Fone/fax: (51)3316-6835/(51)3316-7142
http://www.sbc.org.br

Simpsio Brasileiro de Sistemas Colaborativos (11: 2014: Curitiba, PR).


S612a

Anais / XI Simpsio Brasileiro de Sistemas Colaborativos;


organizado por Adriana Santarosa Vivacqua, Thais Helena Chaves de Castro
Curitiba: SBC, 2014.
v, 171 p.: il.

SBSC 2014
Realizao: Universidade Tecnolgica Federal do Paran UTFPR

ISSN: 2318-4132

1. Computao Congressos. 2. Sistemas Colaborativos


Congressos. I. Vivacqua, Adriana Santarosa. II. Castro, Thais
Helena Chaves. III. Sociedade Brasileira de Computao. IV. Ttulo.

Sumrio
Apresentao.......................................................................................................................iii
Organizao SBSC 2014..................................................................................................iv
Trabalhos Finalizados
Um modelo de interao como estratgia para o aumento de popularidade de marcas em
redes sociais...............................................................................................................................1
Rosimar Sobrinho, Bruno Gadelha
Analisando o uso de Jogos Srios em Mundos Virtuais Colaborativos: o estudo de caso do JETS Jogo da Equipe de Teste de Software........................................................................................10
Giliane Bernardi, Andre Zanki Cordenonsi, Tarcila Gesteira da Silva, Felipe Martins Mller
Sobre as Redes de Coautoria atravs das edies do SBSC.........................................................20
Helena Araujo, Jussara Rodrigues, Vnia Maria Flix Dias
Prototipao de Sistemas Colaborativos Mveis com Base na Arquitetura de Referncia
CReAMA: Um Estudo de Caso da Plataforma Conecte Ideias.....................................................28
Maison Melotti, Roberta Lima Gomes, Victor Raft Oliveira Nunes, Marco Aurlio Gerosa
Modelo de Recomendao de Especialistas em Ambientes Sociais Vituais................................37
Diego Oliveira Rodrigues, Edeilson Milhomem da Silva, Jackson Gomes de Souza, Parcilene
Fernandes de Brito, Ana Carolina Salgado, Silvio Romero Lemos Meira
TidalTrust Versus. T-SWEETS: uma Anlise da Eficcia no Processo de Inferncia de Confiana
em Ambientes Virtuais Sociais..................................................................................................48
Edeilson Milhomem Silva, Diego Oliveira Rodrigues, Jackson Gomes de Souza, Parcilene
Fernandes de Brito, Ana Carolina Salgado, Silvio Romero Lemos Meira
Um Mtodo para Recomendao de Relacionamentos em Redes Sociais Cientficas
Heterogneas............................................................................................................................55
Patrcia Zudio de Lima, Luziane Ferreira de Mendona, Jonice Oliveira
A relao entre o tamanho do grupo e a produo de mensagens de bate-papo.......................65
Edmilson Rocha, Mariano Pimentel, Morganna Carmem Diniz
A Influncia da Diversidade de Conhecimento no Processo de Aprendizagem Colaborativa......75
Edmar Welington Oliveira, Marcos Roberto da Silva Borges

Avaliao de Comunicabilidade em Ambientes Colaborativos Tridimensionais: Estudo de Caso


no Sloodle.................................................................................................................................85
Adriana Dantas, David Lima, Thais Castro, Lucilene Maciel, Isomar Lima, Antnio Neto

Trabalhos em Andamento
CollabCumulus: Uma Ferramenta de Apoio Anlise Colaborativa de Provenincia em Workflows
Cientficos.....................................................................................................................................94
Guilherme Miranda, Joo A. de Souza, Vanessa Braganholo, Daniel de Oliveira
Caixas de Interesses: um Novo Mecanismo para a Colaborao atravs de Nuvem de
Armazenamento de Dados..........................................................................................................102
Felipe Leite da Silva, Roberto Arajo, Lucas Melo Silva, Nelson Neto Sampaio
Usando Pesquisa-ao no Desenvolvimento de um Sistema Colaborativo para Tratamento
Multidisciplinar na Rede do SUS..................................................................................................111
Luciana Pereira de Arajo, Carla Diacui Medeiros Berkenbrock, Mauro Marcelo Mattos
AGORA-PL: Uma Proposta para Desenvolvimento de Famlias de Sistemas Colaborativos baseados
em VGI para a Gesto do Risco de Inundao..............................................................................118
Roberto dos Santos Rocha, Lvia Castro Degrossi, Flvio E. A. Horita, Joo Porto de
Albuquerque
Filtragem colaborativa de rotas de nibus usando dados sobre a acessibilidade das vias
urbanas.......................................................................................................................................126
Marlon Fernandes Antonio, Filipe Roseiro Cgo, Igor Steinmacher, Ana Paula Chaves
Folksonomias Representam Conceitualizaes Compartilhadas de Domnio?..............................134
Josiane M. Pinheiro, Cesar Augusto Tacla
MoodleGroups: Um Aplicativo para Identificar as Relaes Sociais entre Alunos em Ambientes
Virtuais de Aprendizagem...........................................................................................................142
Dhanielly Lima, Bruno Gadelha, Jos Francisco Netto, Vitor Bremgartner
Uma anlise de assortatividade e similaridade para Artigos Cientficos.......................................149
Leonardo Maia Barbosa, Romis Attux, Alan Godoy
Uma Abordagem para Seleo e Visualizao Colaborativa de Informaes em Situaes de
Emergncia.................................................................................................................................157
Bruno S. Nascimento, Marcos R. S. Borges, Adriana S. Vivacqua
Desafios para colaborao no atendimento pr-hospitalar em acidentes de mltiplas vtimas....165
Rodrigo C. Andrade, Bruno S. Nascimento, Marcos R. S. Borges, Adriana S. Vivacqua

ii

Apresentao
O SBSC discute o desenvolvimento e uso de ferramentas para dar suporte colaborao entre
pessoas. Alguns exemplos atuais de sistemas colaborativos de sucesso incluem redes sociais,
ambientes de desenvolvimento distribudo de software, sistemas de compartilhamento de arquivos,
mundos virtuais, editores cooperativos, wikis, sistemas de gesto de conhecimento e ferramentas de
comunicao, como videoconferncia e blog.
Com a popularizao de mecanismos de colaborao na Web, cresce ainda mais a importncia de
estudos tericos e empricos sobre tcnicas, tecnologias e modelos relevantes para desenvolvimento
e uso de sistemas colaborativos, envolvendo aspectos sociais e tcnicos.
Diversas subreas da Computao possuem contribuies para a pesquisa em Sistemas
Colaborativos: Engenharia de Software, Banco de Dados, Inteligncia Artificial, Sistemas de
Informao, Computao Grfica, Interao Humano-Computador, Sistemas Multimdia, Sistemas
Distribudos entre outras. Para abordar as questes no tcnicas desta rea, subreas da Sociologia,
Antropologia, Psicologia, Educao, Lingustica etc. tambm encontram aqui espao para
contribuies.
Em seu 11 ano, o SBSC se tornou um importante frum para pesquisadores, estudantes e
profissionais discutirem sobre esta rea multidisciplinar.

Adriana Santarosa Vivacqua e Thais Helena Chaves de Castro


Coordenadoras de Programa do SBSC 2014
Outubro, 2014

iii

Organizao SBSC 2014


Coordenao do Comit de Programa
Adriana S Vivacqua (UFRJ)
Thais Castro (UFAM)

Coordenao do Workshop de Teses e Dissertaes


Jos Maria David (UFJF)

Coordenao Geral
Cesar Tacla (UTFPR)
Leonelo Dell Anhol Almeida (UTFPR)

Comit de Programa
Adriana Vivacqua (UFRJ)
Alberto Castro (UFAM)
Alberto Raposo (PUC-Rio)
Ana Cristina Garcia (UFF)
Bruno Gadelha (UFAM)
Carla Berkenbrock (UDESC)
Carlos Ferraz (UFPE)
Celso Hirata (ITA)
Cesar Tacla (UTFPR)
Claudia Cappelli (UNIRIO)
Claudia Motta (UFRJ)
Cleidson de Souza (UFPA)
Clever Farias (USP)
Clovis Fernandes (ITA)
Credin de Menezes (UFES)
Daniel Paiva (UTFPR)
Denise Filippo (UERJ)
Edeilson Milhomem Silva (ULBRA)
Flavia Bernardini (UFF)
Flavia Santoro (UNIRIO)
Geraldo Xexo (UFRJ)
Hugo Fuks (PUC-Rio)
Inhama Ferraz (UFF)
Ivan Ricarte (UNICAMP)
Jauvane Oliveira (LNCC)
Jonice Oliveira (UFRJ)
iv

Jos Maria David (UFJF)


Jos Viterbo (UFF)
Kate Revoredo (UERJ)
Marco Mangan (PUCRS)
Marco Aurelio Gerosa (USP)
Mariano Pimentel (UNIRIO)
Melise Paula (UNIFEI)
Patrcia Tedesco (UFPE)
Pedro Porfirio Farias (UNIFOR)
Rafael Prikladnicki (PUCRS)
Raquel Prates (UFMG)
Renata Araujo (UNIRIO)
Rita Suzana Pitangueira Maciel (UFBA)
Roberto Willrich (UFSC)
Tayana Conte (UFAM)
Thais Castro (UFAM)
Vagner Santana (IBM Research)
Vaninha Vieira (UFBA)

Apoio Edio dos Anais


Alberto Castro (UFAM)
Natacsha Raposo (UFAM)

Sociedade Brasileira de Computao


Presidncia
Presidente: Paulo Roberto Freire Cunha (UFPE)
Vice-Presidente: Lisandro Zambenedetti Granville (UFRGS)

Diretorias
Administrativa: Renata de Matos Galante (UFRGS)
Finanas: Carlos Andr Guimares Ferraz (UFPE)
Eventos e Comisses Especiais: Altigran Soares da Silva (UFAM)
Educao: Mirella M. Moro (UFMG)
Publicaes: Jos Viterbo Filho (UFF)
Planejamento e Programas Especiais: Claudia Lage Rebello da Motta (UFRJ)
Secretarias Regionais: Marcelo Duduchi Feitosa (CEETEPS)
Divulgao e Marketing: Edson Norberto Cceres (UFMS)

Diretorias Extraordinrias
Relaes Profissionais: Roberto da Silva Bigonha (UFMG)
Competies Cientficas: Ricardo de Oliveira Anido (UNICAMP)
Cooperao com Sociedades Cientficas: Raimundo Jos de Arajo Macdo (UFBA)
Articulao com Empresas: Avelino Francisco Zorzo (PUC-RS)

Comit Diretivo da Comisso Especial de Sistemas Colaborativos


Coordenadora: Denise Del Re Filippo (UERJ)
Vice-Coordenadora: Raquel Oliveira Prates (UFMG)
Carla Diacui Medeiros Berkendrock (UDESC)
Cesar Tacla (UTFPR)
Cleidson de Souza (UFPA)
Hugo Fuks (PUC-Rio)
Rita Maciel (UFBA)

vi

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Um modelo de interao como estratgia para o aumento


de popularidade de marcas em redes sociais
Rosimar Sobrinho

Bruno Gadelha

Universidade do Estado do
Amazonas
Faculdade de Tecnologia
Av. Darcy Vargas, 1200 Manaus
AM
+55 92 81124817

Universidade Federal do
Amazonas
Instituto de Computao
Av. Rodrigo Otvio, n 6.200,
Campus Universitrio
+55 92 8113-7967

rosesobrinho@gmail.com

bruno@icomp.ufam.edu.br

ABSTRACT
This paper presents an interaction model as a strategy to increase
the popularity of brands in social networks. The research aims to
provide an alternative to companies that have little or none
financial resources to publicize their products and actions on
social networks, obtaining significant interaction results in an
organically way. A case study where the interaction model is
applied in the context of a regional restaurant in Manaus-AM in
the social network Facebook is also presented.

1. INTRODUO
A Web 2.0 aumentou a possibilidade de expresso e socializao
e uma das formas mais significativas so as redes sociais, que so
ambientes compostos por pessoas ou entidades em torno de algo
comum [1]. Define-se uma rede social como um sistema baseado
na Web em que (a) os usurios possam construir um perfil pblico
ou semipblico dentro de um sistema limitado, (b) adicionar uma
lista de outros usurios com quem eles compartilhem uma
conexo, (c) visualizar e percorrer suas listas de conexes, assim
como outras listas criadas por outros usurios [2].

RESUMO
Este artigo apresenta a um modelo de interao como estratgia
para aumento da popularidade de marcas em redes sociais. O
objetivo da pesquisa oferecer uma alternativa s empresas que
possuam pouco ou nenhum recurso financeiro para divulgao de
seus produtos ou aes nas rede sociais, obtendo resultados
significativos de interao de forma orgnica. apresentado um
estudo de caso onde o modelo apresentado aplicado no contexto
do perfil de um restaurante regional na cidade de Manaus-AM na
rede social Facebook.

Existem vrios tipos de redes sociais disponveis na Internet, que


variam de acordo com seus objetivos primrios. H redes sociais
genricas, baseadas principalmente em fazer novas amizades, que
apresentam diversos tipos de contedos textuais ou multimdia e
provm vrias funcionalidades para que os usurios possam
interagir com seu contedo. Pode-se dizer que o foco dos
contedos e das funcionalidades encontradas est orientado a um
contexto ldico, pois promovem nas pessoas uma interao
informal e recreativa. Algumas redes sociais dessa categoria so o
Facebook, Orkut e Twitter. H tambm a categoria de redes
sociais especializadas, que fornecem ferramentas para um trabalho
especfico, tratando uma temtica em particular e cobrindo
necessidades de um determinado tipo de usurio [3,4]. Como
exemplo dessas redes pode-se citar o LinkedIn e Xing que so
voltadas a adquirir contatos profissionais [5]. As redes sociais
esto cada dia mais presentes no dia a dia das pessoas e as
empresas precisam estar preparadas para atender a essa crescente
demanda no sentido de se aproximar do cliente.

Palavras-Chave
Redes Sociais, Mdias Sociais, Web2.0.

Categories and Subject Descriptors


H.5.3 [Group and Organization Interfaces]: Organizational
design, Web-based interaction. H.1.2 [Information Systems]:
User/Machine Systems human factors, human information
processing.

Giardelli [1] afirma que as empresas do sculo XXI esto


perdendo lucros ou quebrando, os sistemas de educao passam
por uma crise, por estarem obsoletos, o comrcio que despreza
novos canais digitais est ficando para trs, a comunicao que
no considera o coletivo e as redes sociais j ineficiente. A era
do consumismo de contedo digital acabou. Agora todos podem
gerar contedo. O que antes era feito de forma, quase ditadora,
onde as empresas produziam e a populao somente recebia em
sua tela sem ter como responder, questionar ou discordar, agora
toma nova direo medida que qualquer usurio pode gerar
contedo e faz-lo propagar pelo mundo. Destroem-se os muros,
antes reforados pela burocracia e propaga-se ambientes de
conversao direta onde o dolo se mostra como na vida real, a
empresa est sujeita a interferncia imediata, fazendo com que, em
muitos casos, mudem de estratgia aps uma repercusso
negativa, por exemplo. No caso do poder pblico, novas atitudes

General Terms
Management, Documentation, Experimentation, Human Factors.

Keywords
Social Networks, Social Media, Web 2.0.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee. SBSC 2014 Brazilian Symposium on
Collaborative Systems. October 6-9, 2014. Curitiba, PR, Brazil. Copyright
2014 SBC. ISSN 2318-4132 (pendrive).

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

surgem devido a casos de viralizao. Uma foto mostrando algo


irregular ou ruim pode fazer com que autoridades percam cargos,
polticos tenham suas imagens machadas etc. tudo isso devido a
repercusso nas mdias sociais.

2.1 Pgina de fs
O site trata as empresas e pessoas de forma distintas em sua
plataforma. muito claro, inclusive cobrado pela ferramenta,
atravs do seu contrato de utilizao e diversos avisos no FAQ,
que as empresas devem criar pgina de fs e as pessoas, perfis
pessoais. As contas pessoas so otimizadas para funcionar com
pessoas individualmente, em vez de empresas, marcas e
organizaes. As pginas do Facebook permitem que artistas,
empresas e marcas mostrem seus trabalhos e interajam com os fs.
Essas pginas so pr-instaladas com a funcionalidade
personalizada desenvolvida para cada categoria. Desenvolvedores
tambm criaro uma srie de aplicativos para que os
administradores de pginas insiram em suas pginas. Diferente de
amigos de contas pessoas, no h limite quanto ao nmero de
pessoas que podem curtir uma pgina [9].

Hoje j est acontecendo tudo coletivamente: as pessoas


organizam festas, protestos, revolues, fazem cincia, descobrem
curas e remdios, leem, estudam, compram, vendem, discutem,
fazem negcios, falamos com os amigos, trocam ideias e opinies
etc. preciso se adaptar e aproveitar as inmeras oportunidades
que tudo isso traz. Alm disso, os modelos precisam ser revistos
nessa era de economia em rede: o direito privacidade, os direitos
autorais, a distribuio de lucros, a inovao, as relaes sociais
etc [1]. Nesse sentido, primordial o papel das empresas no que
diz respeito sua participao ativa nas redes sociais visando
maior interao com seus clientes, ampliando sua rea de atuao
e fortalecendo a imagem da empresa. Tal participao pode se dar
na forma de enquetes, servio de atendimento ao consumidor
(sac), apresentao de novos produtos ou servios, promoes
dentre outras. Isso leva a um maior engajamento das pessoas
envolvidas com a empresa, tanto funcionrios quanto clientes e
prestadores de servios, e tambm a uma reduo nos
investimentos em publicidade.

2.2 Facebook Insights


Facebook Insights um relatrio do Facebook que fornece
informaes sobre o seu contedo, que ir retratar o resultado do
trabalho aplicado. Informaes sobre os dados demogrficos, bem
como o consumo de contedo so alguns exemplos. Para obter
melhores resultados e gerar bons relatrios necessrio
determinar as mtricas a serem analisadas [9]. O prprio
Facebook fornece uma srie de dados que permitem realizar um
estudo detalhado. Alguns fatores podem influenciar na avaliao
das mtricas utilizadas no processo de monitoramento, que
costumam variar de acordo com o objetivo da campanha e a
plataforma utilizada. No Facebook, as mais comuns so: a)
nmero de visitantes; b) de seguidores; c) de comentrios; d) de
curtidas; e) de compartilhamentos. Esses dados so importantes e
devem ser elencados no planejamento da campanha para
mensurao do resultado do trabalho realizado. Abaixo algumas
imagens do relatrio gerado pelo Facebook Insights, a anlise
desses dados permite que os administradores possam criar
melhores experincias, mudar estratgia etc.

Considerando o cenrio exposto, este trabalho apresenta um


modelo de interao que visa aumentar o engajamento das
empresas com seu pblico-alvo, medido pelos ndices de
popularidade como visibilidade, curtidas, comentrios e
compartilhamentos. Um estudo de caso apresentado onde o
modelo proposto aplicado a uma empresa do setor
gastronmico, o Restaurante Vitrine Amaznica.

2. FACEBOOK
Facebook um site e servio de rede social que foi lanado em 04
de fevereiro de 2004, operado e de propriedade privada da
Facebook Inc. Em 04 de outubro de 2012 o Facebook atingiu a
marca de 1 bilho de usurios ativos. Em mdia 316.455 pessoas
se cadastram, por dia, desde sua criao. O site faz distino entre
perfis pessoais e perfis para empresas, as chamadas pginas de fs,
que so direcionadas a empresas, organizaes e marcas com o
objetivo de compartilharem suas histrias e se conectarem as
pessoas. O Facebook procura oferecer um espao de interao e
compartilhamento entre pessoas que possuem algum tipo de
relao entre si e os usurios buscam nessa rede social um local
para se interagir com amigos e compartilhar contedo [6].

3. O MARKETING NA ERA DIGITAL


O trabalho profissional nas redes sociais online desenvolvido
sob as premissas do marketing, uma vez que explorada a
imagem da instituio, empresa ou pessoa pblica, com o objetivo
de criar um relacionamento com o cliente, cidado ou f, a fim de
que se tenha o retorno comercial, prestao de contas etc.
O marketing vem sofrendo alteraes na sua definio ao longo
do tempo. O autor, Philip Kotler, considerado o Pai do Marketing
j publicou diversas definies sobre o tema. A mais recente diz
que Marketing a atividade humana dirigida para satisfazer
necessidades e desejos por meio de troca.

O Brasil o pas que mais cresceu no Facebook em 2012, com


adeso de aproximadamente 30 milhes de novos usurios [7].
Com o resultado, o Brasil passa a ocupar a segunda posio na
lista de naes com mais adeptos do servio, atrs apenas dos
Estados Unidos [8]. Os nmeros atuais do conta de 72 milhes
de brasileiros conectados ao site, o Amazonas est presente com
quase um milho e duzentas mil pessoas. Manaus a cidade com
maior nmero de contas ativas, cerca de 960 mil pessoas [9].

Gabriel [10], afirma que o marketing dirigido para satisfazer


necessidades e desejos humanos e, dessa forma, precisa levar em
considerao o pblico-alvo antes de tudo, conhecendo-o para
poder satisfaz-lo., ou seja, o pblico-alvo o fator mais
importante no desenvolvimento de uma ao de marketing.
Ressalta, tambm, que o marketing no cria necessidades, mas
influencia e/ou cria os desejos de produtos para satisfazer as
necessidades.. Mas, para que isso acontea necessrio
conhecer, entender e dialogar com pblico-alvo.

Para mensurao dos dados estudados foram utilizados os


relatrios do prprio site de relacionamento, o Facebook Insight,
que tem como base a interao e/ou engajamento. preciso
destacar que, o relacionamento entre o usurio e a ferramenta
determina o sucesso da conta estudada. O Facebook trabalha com
ndices prprios de mensurao, que permite extrair diversos
relatrios para estudos dos perfis analisados. A riqueza das
informaes, aliada aos nmeros expressivos de usurios foram
determinantes para que este trabalho fosse desenvolvido com o
estudo desta plataforma.

Em 1960, E. Jerome McCarthy [11] props o modelo dos 4Ps,


que compe a base de qualquer planejamento de marketing, o
chamado composto de Marketing. So eles: Produto, Promoo,
Preo e Praa (Ponto de Venda). Apesar da era digital oferecer

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

facilidades em relao ao off-line, necessrio atender as


premissas do marketing tradicional (4Ps) para aes online. A
gerao atual altamente conectada, exigente, crtica e
participativa e possui oferta crescente de produtos digitais, fator
complicador quando se trata de chamar a ateno para alguma
marca ou entidade. H pouco tempo, as mdias eram segmentadas,
cada uma tinha um papel claramente definido. A TV atingia
determinado pblico, assim como o jornal, o rdio e os impressos.
Essas mdias possuam contedo gerado por profissionais e a
interao era mnima.

pblico online. necessrio estar presente na internet


adequadamente, para evitar situaes adversas para suas marcas e,
caso acontea, agir em tempo hbil evitando assim, maiores danos
e prejuzos.
O trabalho nas mdias sociais visa conquistar a ateno do usurio
atravs do relacionamento com a marca atravs da interao que
gera o engajamento necessrio para propagao do contedo de
determinada marca. Para isso necessrio seguir alguns princpios
de atuao nas redes e identificar o modelo que mais se adeque ao
tipo de negcio a ser trabalhado.

O digital apresenta-se como uma convergncia das chamadas


mdias tradicionais: tv, rdio, revista e jornais. A tecnologia
unificou as plataformas, no se pode esquec-las e, as mesmas,
esto longe de acabar. preciso tratar cada uma delas com suas
particularidades respeitando suas caractersticas originais, porm,
entendendo que o digital as supera em velocidade, interatividade e
praticidade.

4. MODELO PROPOSTO
Na rea das mdias sociais, h um manual de conduta informal
que descreve as boas prticas da presena online de pessoas e
organizaes. No caso das pessoas, comum ver manuais de
etiqueta na internet que tentam educar as pessoas a usar com
responsabilidade e compartilhar contedo com segurana,
evitando assim exposio desnecessria e problemas judiciais
relacionados a danos morais, dentre outros [1]. Com relao s
organizaes, tambm possvel encontrar manuais de conduta
nas mdias sociais que apresentam como os funcionrios dessas
organizaes devem se comportar a fim de no prejudicar a
imagem da empresa publicamente e no determinam como as
empresas devem gerir sua presena online. Essa presena online
no deve apenas visar divulgao de suas atividades, uma vez
que isso pode ser feito em um site institucional, mas deve focar no
aumento da visibilidade e da popularidade, atravs de um maior
relacionamento com seus parceiros e clientes. Esse tpico
comumente abordado por profissionais e instituies especialistas
em mdias digitais, porm, a sua abordagem ad-hoc, baseadas
nas premissas do marketing tradicional e mercado publicitrio. As
boas prticas adotadas por esses profissionais levaram a uma
sistematizao do trabalho de gerncia da presena virtual das
marcas concretizado no modelo de interao aqui descrito.

Nas mdias sociais no h controle em relao ao contedo, o


usurio quem decide o que vai consumir ou produzir. So
bilhes de pessoas com acesso internet em todo o mundo ou
conectadas por meio de celulares e que esto produzindo
contedo. E as pessoas escrevem: em blogs, sites, enquetes, SMS,
comentrios, listas de discusso, redes sociais... Nesse grande
palco, o arquiteto vira um autor, o advogado se torna um
jornalista e o cliente, um contador de histrias e experincias [1].
Esses ambientes virtuais permitem o contato imediato, as coisas
so muito rpidas, uma crise na internet pode fazer cair a cotao
de grandes empresas em bilhes, demitir executivos etc.. Para
tentar evitar esse tipo de situao necessrio cuidar da marca
(instituio, pessoa pblica). Criar sentimentos, o que pode
permitir a criao de relacionamento com o cliente no caso de
marcas comerciais ou cidados para instituies pblicas.
As relaes entre as partes interessadas (quem vende e quem
compra) seja um produto ou um servio, tambm sofreram
modificaes. Aonde, h algum tempo, o determinante para
finalizar a transao era, entre outras coisas, a necessidade,
qualidade do produto ou preo, agora a indicao de um parente,
amigo ou conhecido passa a ter mais peso na hora da deciso.

O modelo em questo foi desenvolvido a partir do estudo de caso


realizado na Fundao Municipal de Cultura, Turismo e Eventos,
rgo vinculado Prefeitura de Manaus, entre o ano de 2010 e
2013 [12] e abrange todo o ciclo de vida da presena online da
organizao em uma rede social. Isso significa que a partir do
momento em que se decide aumentar os indicadores de
visibilidade e popularidade de uma marca, seja ela qual for, os
objetivos dessa presena online devem ser claramente pontuados.
Uma vez definidos os objetivos da presena online da
organizao, passa-se ento primeira atividade do modelo que
consiste na construo do perfil institucional na rede social de
interesse. Que deve seguir alguns critrios como: identidade
visual que facilite a identificao da empresa e do individuo com
a mesma; a foto do perfil deve ser legvel e estar relacionada com
a marca; descrio clara e completa sobre a empresa, das
atividades desenvolvidas por ela e, por fim, destacar qual o
objetivo da empresa na referida rede social.

Redes sociais tm enorme poder formador de opinio, pois o


consumidor deixou de aguardar a informao, tendo em vista que
ele mesmo produz o contedo. Pesquisas e enquetes mostram que
mais da metade dos consumidores nas redes sociais j interagiram
com marcas nesses ambientes e 92% das pessoas confiam nas
recomendaes dos amigos e no mais em propaganda. [1]
Segundo o portal Socialbakers [7], de estatsticas em redes
sociais, mais de 82 milhes de brasileiros tiveram acesso web
em 2012, conectados em mdia 60 horas por ms, e 99% desses
brasileiros conectados j participaram de pelo menos uma rede
social [1].
As mdias sociais facilitaram a propagao da informao. O boca
a boca tradicional agora traduzido pela quantidade de curtir
ou compartilhar que aquela informao tem nas mdias digitais.
o que chamam de viralizao, o que pode contribuir tanto
positiva quanto negativamente para a marca/produto. Nasce a
tendncia do cliente ter preferncia de algo indicado por algum
do seu grupo de relacionamento. Esse comportamento faz com
que, a opinio de um indivduo da sua confiana tenha peso maior
na deciso. Fortalecendo assim, o poder das redes de
relacionamento, que vem se propagando de forma avassaladora.
As instituies precisam estar preparadas para atender a esse

Construdo o perfil, deve-se identificar o pblico-alvo. Isso


permitir entender o que a audincia quer ouvir, permeando o
qu, como e quando a empresa vai falar, gerando maior
aproveitamento e eficincia da presena online. Definido o
pblico-alvo, surge o desafio de elaborar o contedo que cause
alguma reao desse pblico. Para isso necessrio planejamento,
que ir traar a estratgia de contedo, ou seja, definir o tipo,
horrio, temas, quantidades entre outras caractersticas que a
postagem deve ter para que facilite a interao do usurio. Com a
estratgia definida, realizam-se os primeiros posts, propriamente

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

ditos, e passa-se a observar o comportamento dos seguidores.


Atravs dessa observao, avalia-se a efetividade das postagens e
se o objetivo da presena online, determinado pelo nvel de
interao, foi alcanado. Vale ressaltar que, encontrar o modelo
ideal para desenvolver o trabalho de determinada marca nas
mdias sociais requer observao e experimentao diria das
aes dos usurios conectados. preciso descobrir qual o
contedo que os usurios querem receber e que os faam interagir
e divulgar a marca.

4.1.2 Gesto de crise


Manter uma equipe de profissionais competentes para a gesto de
crises essencial no processo de utilizao das mdias para
divulgao de marcas. Essas pessoas precisam ter um perfil
diferenciado, pois iro lidar com situaes complicadas
diariamente que podero comprometer a reputao da empresa ou
at mesmo implicar em grandes perdas financeiras. Esses so
exemplos de algumas das consequncias para uma empresa no
momento de uma crise na internet e a maneira mais eficaz de
proteger-se de uma crise planejamento prvio. importante
traar procedimentos para cada situao que possa gerar uma crise
e a alta gerncia deve ter envolvimento desde o incio visando
garantir o sucesso da operao diminuindo os riscos que podem
afetar sua reputao e seus resultados.

A figura 1 ilustra uma viso geral do modelo de interao


utilizado nesta pesquisa. Cada uma das fases explicada mais
detalhadamente nas sesses seguintes.

4.1.3 Criao
A pgina deve ser criada de forma que seja facilmente associada
marca em questo, deve apresentar informaes completas e um
visual amigvel, que ir permitir maior identificao do usurio
com a marca e causar boa impresso aos novos seguidores. Deve,
tambm, possuir uma capa atrativa e foto do perfil legvel e
relacionada com a marca.

Figura 1 - Viso geral do modelo


As sees a seguir apresentam o detalhamento do modelo de
interao.

4.1.4 Customizao

4.1 Preparao

A pgina de f no Facebook um carto de visitas e, em muitos


casos, o primeiro contato do cliente com a empresa ou marca, o
que torna esse tpico um dos mais importantes, pois pode
determinar a permanncia ou no do usurio visitando a pgina e
para deix-la mais atrativa preciso se preocupar com alguns
pontos, so eles: a) investir em aplicativos e integrao com
outras plataformas; b) escolher um nome adequado; c) descrever a
empresa e as atividades as quais ela executa claramente; d) deixar
claro qual o objetivo da presena da empresa na rede social. Esses
pontos podem ser considerados para trabalhos desenvolvidos em
qualquer mdia social.

Aps decidir realizar o trabalho nas redes sociais necessrio


tomar algumas medidas antes de iniciar o projeto. A figura 2
apresenta o fluxo do processo de preparao para iniciar o
trabalho na rede social.

Cada ferramenta possui caractersticas especficas e devem ser


levadas em considerao durante o planejamento. Os tpicos a
seguir destacam pontos a serem trabalhados no Facebook:
Nome: O nome da pgina de fs deve refletir claramente a marca
da empresa. Como a ferramenta global, muitas vezes no
possvel utilizar o nome desejado e resta a criatividade para
contornar, mas nunca deixar um nome que seja diferente do
original da empresa;

Figura 2 - Fluxo do processo de preparao

4.1.1 Definir Profissionais

Fotos: As fotos do avatar e da capa devem ser cuidadosamente


selecionadas, a descrio importante para que chame a ateno
do usurio e deve passar a ideia clara do tipo de contedo que o
mesmo ir encontrar nas postagens, alm de informaes precisas
sobre a empresa como os contatos online e off-line, endereo,
misso etc;

Para a realizao do trabalho desejvel que uma equipe seja


estruturada com profissionais especializados para que se possa
oferecer um melhor desempenho. So eles: a) Gerente de Mdias
Sociais, responsvel pelo planejamento, criao de estratgias,
definio de metas e anlise de relatrios; b) Analista de Mdias
Sociais, profissional que analisa os dados do monitoramento,
identifica tendncias e identifica o pblico-alvo; c) Gestor de
Contedo (curador), responsvel pela produo e gesto do
contedo; d) Gestor de Relacionamento: responsvel por interagir
com os usurios, respondendo aos questionamentos e dvidas; e)
Gestor de Monitoramento: responsvel por monitorar o contedo
e gerar relatrios; f) Designer: responsvel pela parte visual das
aes.

Aplicativos: Os aplicativos so recursos complementares de


interatividade com a pgina de fs. Com eles possvel executar
vdeos, sorteios, enquetes etc;
Integrar com outros servios: o Facebook permite, tambm,
acessar outras redes e sites como Youtube, Twitter, Flickr etc.
Esses critrios so utilizados pela maioria dos estudiosos do
assunto e disparam nas listas das consideraes mais relevantes

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Definio do tipo das postagens: que devem conter textos curtos e


claros, fotos atrativas e vdeos de curta durao. Cada um desses
tipos de postagens deve gerar um nvel de engajamento para a
ferramenta, que pode ser menos ou mais atrativo para o pblico.
Geralmente as imagens tem mais apelo junto ao usurio, ou seja,
consegue chamar mais a sua ateno. Em seguida, os vdeos so
mais atrativos, depois os textos e finalmente postagens com links;
b) Quantidade das postagens: Pequenas quantidades de postagens
dirias podem comprometer a interao e o inverso tambm.
preciso avaliar, de acordo com o tipo de negcio da empresa, qual
a quantidade ideal, por exemplo, canais de notcias necessitam
fazer um nmero maior de postagens, pois o seu contedo muito
mais dinmico do que de um artista que divulga a sua agenda ou
de um restaurante que ir divulgar o seu cardpio dirio; 3)
Horrio das postagens: Existem horrios onde um nmero maior
de pessoas esto conectadas e mais favorveis interao,
preciso que seja mapeado para melhor explorao. No caso dos
restaurantes, uma postagem com a foto colorida de uma refeio,
com um pequeno texto de chamada prximo da hora do almoo
ir gerar maior interao do que se for feito aps o mesmo. Na
figura 4 possvel ver o fluxo desse processo.

para o sucesso no desenvolvimento desse tipo de trabalho. As


experincias que servem como base para este estudo reforam o
fato de que cada perfil/pgina de fs exige linguagem e estratgias
prprias, porm, necessrio identificar a forma mais adequada,
facilitando o planejamento das aes para aumentar a audincia e
relevncia na rede, alcanando assim, um dos maiores objetivos
da presena digital que aumentar o engajamento dos fs fazendo
com que haja maior divulgao da marca em questo.

4.2 Definio do pblico-alvo


Conhecer o pblico-alvo atividade determinante para o sucesso
da presena virtual de uma marca. Um dos pontos que determina a
identificao do pblico com a empresa o chamado
engajamento, mtrica que os sites de relacionamento utilizam
para mensurar o quanto os seguidores de determinado perfil est
envolvido com o contedo gerado pela empresa na internet. A
forma de conhecer o pblico-alvo de uma marca consiste em
avaliar o interesse representado pelas suas interaes com o
contedo disponibilizado nas redes sociais. Uma estratgia
observar os perfis semelhantes e como os mesmos se comportam.
Realizar postagens similares aos concorrentes e observar o
comportamento dos seguidores possibilita a identificao do perfil
dessas pessoas. Caso a interao no apresente um nvel
satisfatrio, o post deve ser refeito para que nova anlise seja
realizada. Essa etapa ir contribuir diretamente para o
desenvolvimento da estratgia de contedo, prxima atividade do
modelo. Na figura 3 possvel ver o fluxo desse processo.

Figura 4 - Estratgia de Contedo

4.2.2 Efetuar postagem


Antes de cada postagem, deve-se definir os objetivos que se
deseja alcanar com relao ao envolvimento dos usurios com a
postagem. Tal envolvimento traduz-se em curtidas,
comentrios ou compartilhamentos. Definidos os objetivos de
uma postagem, passa-se fase de preparao que compreende as
seguintes etapas: a) Levantamento de contedo, muitas vezes
chamado de curadoria de contedo, que como o prprio nome
fala, consiste em estabelecer o que ser publicado, o tema, o
assunto. Por exemplo, o assunto ser Desejar um bom dia aos
seguidores; b) Preparao das mdias de apoio que podem ser
banners, uma fotos, uma mensagem especfica, um vdeo etc. A
preparao da postagem o passo seguinte, onde essas
informaes so ordenadas e a seguir a publicao efetuada. A
Figura 4 representa o fluxo do processo efetuar postagem; c)
Elaborar postagem que consiste em definir qual o tipo de
postagem (imagem, vdeo, texto etc), se vai ter texto ou no, em
caso positivo, qual ser o texto, entre outros detalhes; d) Efetuar a
postagem consiste no ato de publicar a postagem. Na sequencia
so preparadas as mdias de apoio que podem ser um banner, uma
foto, uma mensagem especfica, um vdeo etc. A preparao da
postagem o passo seguinte, onde essas informaes so
ordenadas e a seguir a publicao efetuada. Na figura 5, o
fluxo do processo efetuar postagem.

Figura 3 - Definio do pblico-alvo


muito comum encontrar empresas que esto presentes nas redes
sociais e pecam na publicidade dessas aes, fator importante e,
que ir influenciar diretamente nos resultados trata da divulgao
da pgina de fs, que deve ser realizada com bastante ateno para
que um nmero crescente de pessoas a conheam facilitando
assim o crescimento de fs e consequente interao. A divulgao
da pgina de fs deve ser implantada em vrios momentos e locais
como, por exemplo, documentos oficiais, assinaturas de e-mails,
peas publicitrias, cartes de visita, fardamentos etc.
importante, tambm, que os funcionrios de todos os setores que
estejam presentes na rede social interajam com a pgina de fs
para que os membros de sua rede possam conhec-la fazendo
disso um facilitador para conseguir novas interaes, uma vez,
que o Facebook possui o mecanismo de visualizao das
atividades executadas por seus amigos, muitas vezes induzindo
que faam o mesmo servindo de incentivadores de novas
curtidas para a pgina de fs. Caso a empresa esteja presente em
outras redes aconselhvel que o endereo da pgina de fs seja
divulgado nas mesmas, pois pode-se tratar de pblicos diferentes
e que tenham interesse de fazer parte dos seguidores da marca em
outras plataformas.

4.2.1 Estratgia de contedo


Aps a identificao do pblico necessrio produzir contedos
especficos para esse pblico levando em considerao: a)

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

auxiliar em vrios fatores, por exemplo, identificar tendncias,


desejo dos fs, detratores de marcas, concorrentes, incio de crises
entre outras coisas. Em todos os casos possvel se antever ou at
mesmo corrigir situaes que possam causar algum prejuzo para
a marca, seja financeiro ou de outra natureza. Como forma de
facilitar o sucesso dos resultados, o ideal que cada tarefa
pontuada aqui seja executada por um profissional distinto e
qualificado. Infelizmente no o que costuma acontecer nas
pequenas e, at mesmo, nas mdias empresas, foco principal desse
modelo. Existem, ainda, recursos de gerenciamento da pgina de
fs que devem ser definidos antes do processo iniciar como, por
exemplo, configuraes de privacidade e segurana entre outros,
mas no sero abordados nesse estudo. Vale ressaltar que,
encontrar o modelo ideal para desenvolver o trabalho de
determinada marca nas mdias sociais requer observao e
experimentao diria das aes dos usurios conectados.

Figura 5 - Efetuar Postagem

4.2.3 Avaliao da efetividade da postagem


Antes de cada postagem importante definir os objetivos que se
deseja alcanar com relao ao envolvimento dos usurios com a
postagem que pode ser obter mais curtidas, comentrios ou
compartilhamentos. Aps a realizao das publicaes
necessrio verificar se o objetivo das postagens est sendo
alcanado. Os objetivos so analisados de acordo com a interao
do pblico com o contedo publicado. Assim, durante a etapa de
avaliao da efetividade da postagem identifica-se se houve algum
tipo interao. Caso no haja, necessrio voltar o fluxo do
processo para que nova estratgia de contedo seja realizada. A
figura 6 representa o fluxo do processo Avaliar a Efetividade da
Postagem.

5. O MODELO NA PRTICA
Esta seo documenta a experincia prtica e aplicao do modelo
sugerido na pgina de fs do restaurante Vitrine Amaznia,
sediado na cidade de Manaus.

5.1.1 Preparao
Apesar do modelo sugerir a utilizao de uma equipe completa
para a realizao do trabalho, neste caso somente dois
profissionais tiveram participao efetiva na operao, onde se
revezavam para atender as necessidades das aes realizadas a)
Gerente de Mdias Sociais, responsvel pelo planejamento,
criao de estratgias, definio de metas e anlise de relatrios;
b) Analista de Mdias Sociais, profissional que analisa os dados
do monitoramento, identifica tendncias e identifica o pblicoalvo; c) Gestor de Contedo (curador), responsvel pela produo
e gesto do contedo; d) Gestor de Relacionamento: responsvel
por interagir com os usurios, respondendo aos questionamentos e
dvidas; e) Gestor de Monitoramento: responsvel por monitorar
o contedo e gerar relatrios; f) Designer: responsvel pela parte
visual das aes.

Figura 6 - Avaliar a Efetividade da Postagem


Havendo interao, parte-se para a ltima etapa que visa avaliar o
objetivo da interao onde deve-se observar o tipo de
envolvimento. Caso o objetivo tenha sido alcanado, o fluxo
fechado. Do contrrio, novas postagens devem ser realizadas at
que se consiga obter o resultado satisfatrio. Todo o trabalho
desenvolvido at o momento visa aumentar o nmero de
curtidores na pgina de fs e para isso foi preciso gerar contedo
relevante e fazer com que o usurio chegasse at a pgina de fs e,
de preferncia, interagisse com ela atravs de curtidas,
comentrios ou compartilhamento. Com o objetivo alcanado
hora de se relacionar com esse usurio como forma de
recompensa pela sua interao e visando manter essa pessoa
presente na pgina recebendo assim o contedo referente marca
ou produto. Em hiptese alguma, essa interao deve ser
ignorada. Todas as interaes dos fs com a pgina devem ser
retribudas.

5.1.2 Gesto de crise


Toda empresa, no importa o segmento ou tamanho, est sujeita a
crises envolvendo sua imagem. Aps anlise do perfil da empresa
estudada, foram levantadas alguns possveis questes com relao
empresa e na sequncia foi criado um manual de atuao. Todos
os funcionrios, inclusive aqueles que no faziam parte do
atendimento ao cliente, foram orientados e nenhum deles estava
autorizado a responder questionamentos em caso de uma crise na
rede social, somente os profissionais autorizados que deveriam
seguir o manual. Felizmente, at o momento, nenhuma situao
adversa envolvendo o restaurante foi registrada at o momento.

5.1.3 Criao e Customizao


Seguindo a orientao do modelo de interao a pgina foi criada
e customizada com informaes completas e um layout adequado
ao perfil do restaurante.

Finalmente, aps a realizao de todo o trabalho fundamental


que se saiba o que est sendo falado sobre a marca na rede social
fora da pgina de fs. Isso feito por meio do Monitoramento,
para isso necessrio escolher palavras-chaves que tenham
relao com a marca ou instituio, para que se possa encontrar
facilmente o contedo de interesse. O monitoramento pode

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

alm de fotos que expressam as belezas do estado do Amazonas,


que interagem muito bem pelo fato de se tratar de um restaurante
regional. Nas imagens possvel ver modelos dessas peas e o
envolvimento gerado por elas. Por se tratar de um restaurante,
umas das estratgias adotadas foi explorar ao mximo as imagens
dos pratos. O prximo prato foi identificar qual desses pratos
causava maior engajamento. No caso trata-se do Tacac, caldo
servido na cuia como uma tradicional iguaria da regio. Na figura
9 um dos exemplos da postagem citada. J a figura 10 mostra
outro tipo de contedo bastante utilizado, que so as imagens da
fauna e da flora amaznica. Ambas causam bastante engajamento.

Figura 7 - Criao e customizao


A capa atrativa, avatar contendo a marca e informaes detalhadas
sobre o restaurante foram colocadas no perfil (Figura 7). Alm
disso, o Instagram foi outras integrado por meio de uma aba de
aplicativos, que continha, tambm, o cardpio completo
facilitando o entendimento e escolha de produto da preferncia do
cliente na rede sociais.

5.1.4 Definio do pblico-alvo


Aps a criao da pgina e uma postagem piloto foi realizada. A
partir da foram feitos convites s pessoas do circulo de amigos e
familiares dos proprietrios, que foram incentivados a fazer o
mesmo. Assim foi-se formando o pblico. A figura 8 ilustra a
primeira postagem piloto da pgina.

Figura 9 - Explorao das imagens dos pratos servidos no


restaurante

Figura 8 - Postagem Piloto

5.1.5 Estratgia de contedo


Trabalhar a linguagem diferenciada das peas foi fundamental
para o inicio do aumento do engajamento. As postagens contam
com imagens interessantes dos pratos servidos no restaurante,

Figura 10 - Postagem com fotos da natureza

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

envolvimento dos fs. Como se trata de um restaurante, chamadas


para jogos de futebol foram utilizadas como pode ser visto na
figura 13.

Outro recurso utilizado como estratgia de contedo o


incentivar os fs a enviarem suas fotos para que sejam exibidas na
pgina. Esse tipo de posta gera dois tipos de situaes que
contribuem para melhores resultados, o primeiro que gera
identificao do f com a pgina, pois ele passa a fazer parte do
processo e, principalmente, gera maior engajamento pelo fato
deles prprios colaborarem com o compartilhamento de suas
imagens. A figura 11 mostra uma das fotos recebidas e
publicadas. No quadro abaixo da imagem possvel verificar que
a mesma alcanou 27 compartilhamentos.

Figura 13 - Associao com situaes do cotidiano de interesse


de uma classe, no caso o futebol.
O modelo incentiva, ainda, a integrao entre pginas por meio de
compartilhamentos de contedos correlatos. Essa prtica
indicada pelo fato de que ao compartilhar o contedo de outra
pgina favorece no sentido de que o pblico da pgina que
compartilhou passa a conhecer o contedo da compartilhada e
vice-versa, fazendo com que ambas possam aumentar o nmero de
seguidores de pessoas que possuem interesse comum. Na imagem
14 um exemplo dessa integrao.

Figura 11 - Integrao com os fs, por meio de publicao das


suas fotos
Postagens de contedo relacionado a causas tambm foram
utilizados e apresentaram um nvel de interao desejado. Na
figura 12 mostra um banner falando sobre uma campanha
nacional de alerta ao cncer de mama no Brasil.

Figura 12 - Associao com causas de interesse pblico


Figura 14 - Integrao com outras pginas por meio de
compartilhamentos

Associar as postagens situaes do cotidiano de interesse de


uma classe, tambm fazem parte das postagens que geram bastante

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

6. CONCLUSO

7. REFERNCIAS

Este artigo apresentou uma sugesto de Modelo de Interao para


o aumento dos indicativos de visibilidade de marcas na rede
social, o Facebook. Tal estudo ocorreu durante o ano de 2013 e
teve como base a presena online de um restaurante regional na
cidade de Manaus. Vale ressaltar que o modelo de interao
utilizado no estudo de caso apresentado limita-se a uma rede
social especfica e deve ser modificado para a aplicao em outros
cenrios.

[1] Giardelli, Gil. Voc o que voc compartilha: e-agora:


como aproveitar as oportunidades de vida e trabalho na
sociedade em rede. Editora Gente, 2012. So Paulo
[2] Recuero, R. Redes Sociais na Internet. 2. ed. Porto Alegre:
Sulina, 2011.
[3] Figuerdo, V. D. S. et al. Redes Sociais Online: Desafios e
Possibilidades para o Contexto Brasileiro. XXIX
Congresso da Sociedade Brasileira de Computao,
Campinas, 2009.

Avaliar modelos como o proposto neste trabalho no tarefa


trivial visto que diferentes variveis esto diretamente
relacionadas com os resultados obtidos na execuo deste, tais
como: rede social utilizada, rea de atuao e objetivos
institucionais das organizaes nas redes sociais, a regio onde o
estudo conduzido, os hbitos de uso pela populao, a qualidade
da conexo de internet, dentre outros. Apesar desses fatores, tmse resultados positivos na aplicao deste modelo como, por
exemplo, no contexto de uma organizao pblica [12], e no
contexto de uma empresa do setor gastronmico, conforme
apresentado neste trabalho. Outros cenrios de uso esto em
estudo como: utilizao das redes sociais em campanhas polticas,
perfis de personalidades artsticas e empresas de outros
segmentos.

[4] Efimova, L. What is "beneath your current threshold"?


Social visibility in persistent conversations. Persistent
Conversations Workshop, HICSS TUTORIAL DAY, 03
Janeiro
2005.
https://doc.telin.nl/dscgi/ds.py/ViewProps/File-47362.
[5] Alves, L. P. S.; Chaves, A. P.; Steinmacher, I. Um
aplicativo baseado em inteligncia coletiva para
compartilhamento de rotas em redes sociais. VIII Simpsio
Brasileiro de Sistemas Colaborativos, Campo Mouro,
2011.
[6] Glvia A. R. Barbosa, Geanderson E. dos Santos e Victor
M. de O. Pereira, Caracterizao Qualitativa da
Sociabilidade no Facebook, IHC 13, XI Simpsio
Brasileiro sobre Fatores Humanos em Sistemas
Computacionais, 2013.

No era pretendido com esse estudo de caso ensinar um modo de


realizar a interao nas redes sociais, mas sim, demonstrar a
aplicabilidade do modelo proposto. Tambm no est afirmado
que a utilizao de publicidade paga na internet inadequada e/ou
no deve ser utilizada. A principal contribuio deste trabalho dse pelo fato de oferecer uma alternativa s instituies que no
pretendem utilizar ou no possuem recursos financeiros para
investir na divulgao de suas marcas nas redes sociais, apesar do
crescente apelo desses sites no incentivo de gastos visando esse
fim.

[7] Socialbakers. Site especializado no monitoramento de


redes sociais. Disponivel em: <www.socialbakers.com>.
Acesso em: 26 Janeiro 2014.
[8] Revista Veja. Redes Sociais: Brasil o pas que mais
cresceu no Facebook em 2012. Disponivel em:
<http://veja.abril.com.br/noticia/vida-digital/brasil-e-paisque-mais-cresceu-no-facebook-em-2012>. Acesso em: 13
Fevereiro 2014.

Para atingir este objetivo foi necessrio investigar mecanismos de


identificao do pblico alvo da instituio, que ocorreu por meio
da avaliao constante dos usurios que interagiram com pgina
de fs e a partir da desenvolveu-se um mtodo de comunicao
com linguagem adequada ao pblico em questo.

[9] Facebook. Central de anncios do Facebook. Disponivel


em:
<https://www.facebook.com/ads/manage/home/?account_i
d=250977969>. Acesso em: 25 Maio 2014.

Como futuros trabalhos, sugere-se a aplicao do modelo


proposto em outras redes sociais, o que permitir a extrao das
similaridades e diferenas entre as redes podendo oferecer
elementos que aprimorem o modelo.

[10] Gabriel, M. Marketing na Era Digital Conceitos,


plataformas e estratgias. Novatec Editora, 2010. So
Paulo

Outro tpico interessante para ser desenvolvido em futuros


trabalhos aplica-lo em cenrios distintos para testar a sua
aplicabilidade. Seria interessante aplicar em empresas privadas
que possuem dinmica de contedo diferente e, tambm, em
cidades com caractersticas distintas da que foi pesquisada, para
que se possa avaliar outra problemtica.

[11] McCarthy, E J. Basic Marketing, a managerial approach.


Homewood, Ill., R.D. Irwin, 1960.
[12] Sobrinho, R.; Gadelha, B. Um modelo de interao em
redes sociais para o aumento de visibilidade de marcas. X
Simpsio Brasileiro de Sistemas Colaborativos. Manaus,
2013.

Por fim, outro possvel trabalho consiste em verificar a


possibilidade de intervir no site do Facebook de forma que
possibilite a interao automtica da ferramenta com o usurio.
Um dos gargalos relatados na pesquisa se refere ao tempo de
resposta ao usurio. Automatizar esse processo ofereceria a
soluo para empresas que possuem equipes de trabalho
reduzidas.

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Analisando o uso de Jogos Srios em Mundos Virtuais


Colaborativos: o estudo de caso do JETS
Jogo da Equipe de Teste de Software
Giliane Bernardi
UFSM Dep. Comp. Aplicada
Av. Roraima 1000
giliane@inf.ufsm.br

Andre Zanki Cordenonsi

Tarcila Gesteira da Silva

UFSM Dep. Documentao


Av. Roraima 1000
andrezc@inf.ufsm.br

UFSM Dep. Ling. Sist. Comp.


Av. Roraima 1000
tarcila@inf.ufsm.br

Felipe Martins Mller


UFSM Dep. Comp. Aplicada
Av. Roraima 1000
felipe@inf.ufsm.br

ABSTRACT

Categories and Subject Descriptors

Serious games have increasingly been inserted in the higher


education scenario because, while minimize demotivation classes
considered "traditional", bring along a more formal connotation;
after all, games is not only for fun. This paper presents the
application of a serious game developed to support the teaching
and learning process of software testing in order to analyze the
collaboration among students during implementation. The main
difference in the game is that it was developed immersed in a
three-dimensional collaborative virtual environment. The results
are discussed in the paper along with a proposal for improvement
of the game towards collaborative aspects.

K.3.1 [Computers and Education]: Computer Uses in Education


collaborative learning

General Terms
Experimentation, Human Factors
1.

INTRODUO

Teste de Software uma atividade realizada para avaliar e


melhorar a qualidade de um software, buscando identificar
defeitos e problemas, sendo considerada uma etapa crtica para
garantia de qualidade de software [1]. Atualmente, softwares
atingem potencialmente milhes de pessoas, possibilitando o
desempenho de suas funes com eficcia e com eficincia ou
causando frustrao e perdas de trabalho e de negcios [2]. Sem
dvida, o impacto causado pela utilizao de softwares no dia a
dia dos usurios muito alto, o que torna fundamental que os
mesmos possuam aderncia aos fatores de qualidade de software.
Segundo [2], em um tpico projeto de software, aproximadamente,
cinquenta por cento do tempo e mais de cinquenta por cento do
custo total do projeto so gastos unicamente com Teste de
Software. J [3] estima que uma organizao gaste entre trinta e
quarenta por cento do esforo de projeto total em testes.

Keywords
Serious Games, Collaborative Virtual Environments, Software
Test

RESUMO
Jogos Srios tm sido cada vez mais inseridos no cenrio do
ensino superior, pois, ao mesmo tempo em que buscam minimizar
a desmotivao com as aulas consideradas tradicionais, trazem
consigo uma conotao mais formal, no sendo associados apenas
diverso. Este artigo apresenta a aplicao de um jogo srio
desenvolvido como apoio ao processo de ensino e aprendizagem
de teste de software com o objetivo de analisar a colaborao
entre os estudantes durante a execuo do mesmo. O jogo traz
como diferencial ter sido desenvolvido imerso em um ambiente
virtual colaborativo tridimensional. Os resultados obtidos so
discutidos no artigo juntamente com uma proposta de
aprimoramento do jogo em relao aos aspectos colaborativos.

Nesse contexto, as exigncias da indstria de software esto


crescendo, assim como os softwares esto se tornando cada vez
mais complexos e com isso o nmero potencial de falhas cresce,
bem como os custos para corrigi-las [4]. Os servios de teste esto
sendo terceirizados para empresas especializadas e a maioria dos
grandes projetos de desenvolvimento de software j envolve o uso
de testadores especializados, de modo que a performance e os
ganhos financeiros dessas empresas dependem do desempenho
dos profissionais de teste [5]. Considerando esta importncia,
fundamental que os profissionais formados em cursos de
graduao em Computao e reas afins estejam preparados para
atender s exigncias do mercado.

Palavras-chave
Jogos Srios, Ambientes Virtuais Colaborativos, Teste de
Software

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee. SBSC 2014 Brazilian Symposium on
Collaborative Systems. October 6-9, 2014. Curitiba, PR, Brazil. Copyright
2014 SBC. ISSN 2318-4132 (pendrive).

No entanto, a pesquisa de [6] afirma que os profissionais,


bacharis da rea de Computao aprendem mais sobre tpicos de
Engenharia de Software (ES) depois da graduao, ou seja, as

10

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

desenvolvedores de jogos, pesquisadores e estudantes em todas as


fases do processo de concepo e de implementao da
abordagem [15].

competncias de ES podem no estar sendo adequadamente


abordadas no decorrer do curso. Em [7] so discutidas as
contradies dos currculos em relao s necessidades da
indstria. Muitos graduados ingressam no mercado de trabalho
com habilidades de desenvolvimento excepcionais, mas com
deficincias em teste e depurao [8]. Outro problema, destacado
em [9], a insero tardia do contedo de teste de software no
currculo dos cursos, no permitindo que o estudante, ao longo do
curso, associe teste de software s demais etapas de
desenvolvimento vistas nas demais disciplinas. Por fim, os autores
ainda apresentam como uma fragilidade no ensino de teste de
software a falta ou inexpressiva ocorrncia de atividades prticas,
necessrias para uma eficaz compreenso dos conceitos
estudados.

O modelo de aprendizagem proposto por [16] apresentado na


Figura 1, ilustra como ocorre o processo de aprendizagem baseada
em jogos. O incio desse processo ocorre com a entrada de um
sistema que combina contedo instrucional com caracterstica de
jogo, desencadeando um ciclo que inclui decises ou reaes do
usurio (como diverso ou interesse), o comportamento do
usurio (como maior persistncia ou tempo na tarefa) e o feedback
do sistema. Com o engajamento do usurio no jogo, ele alcana os
objetivos educacionais e o ciclo termina com resultados de
aprendizagem.

Outro aspecto que pode ser destacado no que se refere ao


processo de engenharia de software a colaborao entre os
envolvidos no decorrer de suas etapas, como por exemplo, a fase
de testes. Para [10], indivduos que trabalham em grupo podem
produzir resultados melhores, em decorrncia da integrao de
conhecimentos e habilidades e de seus esforos individuais.
Ainda, a interao entre o grupo pode enriquecer a resoluo de
atividades, atravs de diferentes pontos de vista.
Diante deste cenrio, muitas propostas tm sido apresentadas,
buscando dinamizar as aulas, motivar os estudantes e aproximar
atividades prticas junto aos conhecimentos tericos, tais como
palestras acompanhadas de tutorial com exerccios, projetos com
elaborao de casos de testes e aulas em laboratrio com usos de
ferramentas de teste [9]. Outra tendncia cada vez mais observada
o uso de jogos no ensino de Engenharia de Software. Segundo
[11], a aprendizagem baseada em jogos digitais uma abordagem
inovadora no domnio das universidades e est se tornando uma
nova forma de contedo interativo, que merece ser explorada. No
contexto educacional, os jogos podem ser denominados jogos
srios (serious games), que so jogos que possuem a finalidade
instrucional explcita. O trabalho de [12] discute a questo de que
as fronteiras entre a aprendizagem e trabalho e diverso e jogo
precisam ser desfeitas e que possvel existir aprendizagem com
diverso atravs de jogos. Neste contexto, jogos srios so uma
abordagem diferente para tratar a diverso na educao.

Figura 1 Modelo de Aprendizagem


Ao utilizar jogos de computador ou jogos em geral para fins
educacionais, vrios aspectos do processo de aprendizagem so
apoiados: os estudantes so estimulados a combinar o
conhecimento de diferentes reas para tomar uma deciso ou
escolher uma soluo entre vrias; os estudantes podem testar
como o resultado do jogo muda com base em suas decises e
aes; e, por fim, os mesmos so incentivados a interagir com
outros membros da equipe, discutir e negociar as etapas
subsequentes, melhorando assim, entre outras coisas, suas
habilidades sociais [17].
Em [18], destaca-se que o uso de jogos pode favorecer a
aprendizagem tangencial. Essa aprendizagem est relacionada ao
conhecimento adquirido pelo indivduo quando exposto s
atividades em um contexto no qual est envolvido e no ao
conhecimento que est sendo diretamente ensinado. Ou seja, na
atividade de jogar, o indivduo desenvolve habilidades e aprende
coisas como, por exemplo, uma lngua estrangeira, mesmo que
esse no seja o objetivo do jogo.

Considerando todas as colocaes apresentadas, este artigo tem


como objetivo apresentar a anlise de um jogo srio desenvolvido
como apoio ao processo de ensino e aprendizagem de teste de
software, focando nas questes de colaborao entre os estudantes
envolvidos na sua utilizao.

Ainda, segundo [18], outra questo relevante em relao aos jogos


a forma de lidar com o erro, pois o fracasso na educao
tradicional muito diferente do que ocorre nos videogames, no
qual o custo do fracasso normalmente mnimo, tendo em vista
que, quando os jogadores fracassam, tm a possibilidade imediata
de recomear. Essas caractersticas do fracasso nos jogos
permitem que os jogadores se arrisquem e experimentem
hipteses que seriam muito difceis de serem testadas em
situaes reais, em que o custo do fracasso maior [18]. Portanto,
possvel concluir que os jogos possibilitam o aprendizado
atravs dos erros cometidos, sem que esse tipo de experincia gere
frustrao nos estudantes, estimulando novas tentativas.

2.
APRENDIZAGEM BASEADA EM
JOGOS
A aprendizagem baseada em jogos uma abordagem que utiliza o
jogo como uma ferramenta para que os alunos se engajem no
aprendizado enquanto jogam [13]. Segundo [14], a aprendizagem
baseada em jogos Digitais tem como base duas premissas. A
primeira a de que os estudantes mudaram em alguns aspectos de
fundamental importncia. A segunda premissa a de que esses
indivduos so de uma gerao que, pela primeira vez na histria,
cresceu experimentando uma forma radicalmente nova de jogos
(jogos de computador e de videogame). Essa nova forma de
entretenimento moldou as preferncias e as habilidades, e
ofereceu um enorme potencial para a aprendizagem, tanto a das
crianas, como a dos adultos. A aprendizagem baseada em jogos
impulsiona a inovao atravs da educao, por isso a importncia
de envolver todos os interessados como educadores, designers e

De modo geral, os jogos podem ser classificados quanto ao


gnero, aos grficos, ao nmero de participantes e ao tipo de
interao. Jogos na educao (digitais ou no) so discutidos h
dcadas e so amplamente utilizados na educao infantil [19].
No entanto, ao se tratar do ensino de jovens e adultos, a utilizao

11

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

aprendizagem em escolas e em universidades [23]. O trabalho em


[15] afirma que o potencial dos jogos srios ir provocar uma
mudana de paradigma na forma como a educao e o treinamento
so realizados. Esse novo paradigma denominado aprendizagem
baseado em jogos.

de jogos ainda um assunto controverso. No contexto deste


artigo, os jogos so chamados de jogos srios, apresentados na
prxima seo, por terem o objetivo srio de ensinar, vinculado
ao ldico dos jogos.

3.

JOGOS SRIOS

No que concerne rea da computao, tm-se comprovado que a


utilizao de jogos auxilia o estudante a absorver melhor os
conceitos estudados e compreender as consequncias das decises
tomadas atravs da simulao da realidade que enferentar no diaa-dia- profissional trabalhando em projetos [25].

Apesar do termo serious games (jogos srios) ser utilizado desde


1970 [20], apenas na ltima dcada esse termo adquiriu maior
visibilidade. Um dos responsveis foi a Serious Games Initiative
(SGI) fundada em 2002 pelo Woodrow Wilson International
Center for Scholars. Essa iniciativa visa a estabelecer uma
colaborao entre as indstrias de jogos eletrnicos e de projetos
envolvendo o uso de jogos na educao, treinamento, sade e
polticas pblicas.

Alm destes elementos, para [26], a ambientao do jogo


fundamental para potencializar as interaes e jogabilidade dentro
do mesmo. Considerando o jogo apresentado neste artigo, optouse por desenvolver o mesmo ambientado em um mundo virtual
tridimensional, devido ao seu carter inovador no mbito
educacional e suas caractersticas intrnsecas de colaborao,
interatividade, sensao de imerso e proximidade com a
realidade, caractersticas estas consideradas fundamentais para o
propsito do jogo aqui apresentado. A prxima seo destaca
mundos virtuais e seu potencial no mbito educacional.

A expresso jogos srios une a seriedade do pensamento e da


resoluo de problemas com o experimental e com a liberdade
emocional do jogo. Portanto, os jogos srios combinam as
concentraes analtica e questionadora, do ponto de vista
cientfico, com a liberdade intuitiva e com a recompensa
construtiva dos atos artsticos [20].
A principal caracterstica do Jogo Srio sua finalidade
educacional explcita e cuidadosamente pensada, no tendo como
inteno principal ser utilizado por diverso, mas o que no
significa que o jogo srio no deva ser divertido [21]. Os jogos
srios possibilitam representaes dramticas de um assunto ou de
um problema que est sendo estudado, e permite que os jogadores
assumam papis realsticos, encarem problemas, formulem
estratgias, tomem decises e tenham rpido feedback das
consequncias de suas aes. Tudo isso sem o custo das
consequncias dos erros do mundo real [21].

MUNDOS VIRTUAIS
COLABORATIVOS
4.

Mundos Virtuais podem ser considerados ambientes virtuais


colaborativos que disponibilizam um espao comum onde seus
participantes podem se encontrar, coexistir e colaborar enquanto
interagem com o ambiente tridimensional, compartilhando
informaes e manipulando artefatos em tempo real [27]. Esta
possibilidade de imerso em ambientes como Second Life e
OpenSimulator tm sido utilizada para o desenvolvimento de
ambientes de realidade virtual para uso educacional. A criao de
mundos virtuais tridimensionais onde os diversos avatares podem
comunicar-se entre si gera as condies bsicas para a troca de
experincias entre os estudantes.

Jogos srios possuem inmeras aplicaes e podem ser utilizados


na educao (bsica e superior), em corporaes, organizaes
governamentais e no governamentais. O Departamento de Defesa
dos Estados Unidos da Amrica uma das instituies que
utilizam jogos srios, tendo iniciado em 1997 [22]. Nesse
contexto, os jogos srios oferecem um novo mecanismo para
ensino e para treinamento, combinando jogos digitais com
educao. Logo, jogos srios podem ir alm das vdeo-aulas e dos
livros, permitindo aos jogadores no apenas o aprendizado, mas
tambm a demonstrao e a aplicao dos conhecimentos
aprendidos [21]. No entanto, a utilizao de jogos srios, assim
como de qualquer outro tipo de jogo, requer planejamento, pois
nenhum jogo pode ser bem sucedido se os jogadores no
entenderem as regras, seus objetivos no jogo e as consequncias
de suas aes.

De acordo com [28], mundos virtuais colaborativos esto sendo


cada vez mais explorados para que novas estratgias de
aprendizagem sejam aplicadas, visando permitir que os estudantes
se expressem, interajam, explorem, aprendam e construam o
conhecimento, alm de contriburem para a prtica do trabalho em
grupo.
Diferentes abordagens de ensino podem ser adotadas em mundos
virtuais, como palestras, seminrios, demonstraes, exibio de
vdeos, simulaes, performances virtuais, debates, podcasts e
interaes com chatbots. Atividades educacionais em mundos
virtuais podem apoiar a aprendizagem distncia, flexvel e
blended learning, apoiando a criatividade e a diverso em
aprender e encorajando a explorao da emoo na aprendizagem
[29].

Nos ltimos anos, o desenvolvimento de jogos srios est


crescendo rapidamente [23]. Esse crescimento pode ser observado
no estado da arte de jogos srios para empresas e indstrias
apresentado por [24] e, ainda, nos anais de eventos como o
International Conference on Games and Virtual Worlds for
Serious, International Conference on Fun and Games e Serious
Play Conference. O crescimento dos jogos srios impulsionado
no apenas pelos ganhos obtidos no design de jogos, alcance de
audincia e de tecnologia de jogos, mas tambm pelos avanos
nas principais tecnologias, como a Internet e as redes sociais [22].
Percebe-se, ainda, a valorizao das ideias, habilidades,
tecnologias e tcnicas utilizadas em jogos de entretenimento, pois
vrios jogos comerciais como SimCity, Civilization e Hiddem
Agenda tm sido utilizados como ferramentas de ensino-

Segundo [30], essas ferramentas computacionais proporcionam


aos usurios novas formas de aprendizagem permitindo a
construo de cenrios e recursos que recriam/simulam com mais
fidedignidade o mundo real. Ainda, para [31], o paradigma 3D
oferece a possibilidade de representar a informao de um modo
realstico, organizando-a de uma maneira espacial e tornando sua
visualizao mais intuitiva por ser mais natural ao ser humano.
Analisando as potencialidades descritas sobre mundos virtuais 3D
em mbito educacional, observa-se que tal recurso pode ser
utilizado para potencializar a interao dos estudantes com os
contedos educacionais, tornando os mesmos mais atrativos e

12

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

A prxima seo apresenta o JETS, jogo analisado neste artigo.

motivacionais sob o ponto de vista pedaggico. No que concerne


ao desenvolvimento de jogos imersos em mundos virtuais,
possvel observar sua aplicabilidade, considerando que jogos
usualmente so imersos em um mundo sinttico (tridimensional
ou no), estruturado por regras, permeado por desafios e
explorao.

6.
JETS - JOGO DA EQUIPE DE
TESTE DE SOFTWARE
O JETS Jogo da Equipe de Teste de Software um Jogo
Srio, desenvolvido em um mundo virtual, que simula o setor de
Teste de Software de uma empresa fictcia de desenvolvimento de
software, apresentada na figura 2. Nesse contexto, o JETS pode
ser identificado como um jogo, mais especificamente, uma
simulao educacional inserida em um mundo virtual
colaborativo.

Para o desenvolvimento do JETS, foi escolhido o OpenSimulator,


por se tratar de uma ferramenta de cdigo aberto, livre e gratuita.
O jogo ser tratado na seo 6.

5.

TRABALHOS CORRELATOS

Existem vrios trabalhos na literatura sobre jogos digitais voltados


para o ensino-aprendizagem de Engenharia de Software. Em [32]
apresentado o SimulES-W, um jogo de cartas web para ensino
de Engenharia de Software, no qual os estudantes assumem
diferentes papis em um projeto de construo de software. O
jogo SimSE [33] simula processos de Engenharia de Software em
diferentes metodologias de desenvolvimento. O trabalho de [34]
apresentam o SE- RPG, um jogo de RPG que proporciona a
experincia de gerenciamento e de desenvolvimento de um
projeto de software.
O jogo Elicit@o apresentado por [35], ambiente no qual o
estudante assume o papel de analista e simula a elicitao de
requisitos de software, atravs da tcnica de entrevista. No jogo,
tem-se simulao de um ambiente virtual, representando uma
empresa fictcia que deseja encomendar um produto de software.
Neste caso, chatterbots desempenham o papel de funcionrios
desta empresa, sendo que o estudante precisa entrevistar os
mesmos, de forma a elicitar os requisitos para desenvolver o
software desejado. Ainda podem ser citados os trabalhos de [36],
que descreve o Sparse, jogo desenvolvido para auxiliar no ensino
e na aprendizagem de Engenharia de Software; [6], com o jogo
XMED, que aborda o assunto de Medio de Software e o jogo A
Ilha dos Requisitos [37], que tem como objetivo auxiliar no
ensino dos principais conceitos relacionados Engenharia de
Requisitos de Software;
Como exemplos de jogos voltados especificamente para teste de
software possvel citar o InspectorX [38], jogo para treinamento
e aprendizado de Inspeo de Software; TEST [39], um jogo para
o ensino de teste de unidade com a aplicao de tcnicas e de
prticas relacionadas seleo de dados de entrada; e Jogo das 7
Falhas [9], jogo que aborda a tcnica de teste de caixa preta.

Figura 2 A Empresa do jogo JETS


Considerando esta assertiva, o JETS pode ser considerado um
jogo colaborativo, medida que encontra-se imerso em um
ambiente que promove a comunicao e interao entre os
participantes, possibilita a conscincia ou percepo dos
indivduos, e envolve atividades onde os participantes jogam uns
com os outros e, no, uns contra os outros [43]. Assim, o
ambiente promove uma interao onde todos podem ser
ganhadores.
Para [44], no que tange interao em jogos colaborativos, podese destacar a interao social, o espao visual compartilhado, a
colaborao atravs de papeis e o engajamento mtuo. O JETS
potencializa a interao social no espao virtual simulado atravs
da ferramenta de comunicao do OpenSimulator e pelos artefatos
construdos para o jogo, tais como, os relatrios a serem
desenvolvidos pelos prprios estudantes.
O JETS tem como objetivo aprimorar o conhecimento de
Estratgias de Teste de Software do estudante e fornecer uma
viso geral de como o Teste de Software pode ser implementado
em uma empresa, indo ao encontro das recomendaes das
Diretrizes Curriculares para Cursos de Graduao na rea de
Computao [45] As recomendaes e a respectiva relao com o
jogo so apresentadas a seguir:

Com relao a jogos imersos em mundos virtuais, algumas


iniciativas podem ser destacadas. Em [40] , com apoio da
Faculdade de Medicina do Imperial College London, prope
atividades de aprendizagem baseada em jogos, que apresentam
pacientes virtuais, permitindo a conduo de experincias,
diagnsticos e atividades de role-play learning que apiam
diagnsticos, investigaes e tratamento de pacientes. J o artigo
de [41] apresenta um jogo multiplayer para Engenharia de
Software, baseado no SimSE [33], que tem como objetivo o
ensino de conceitos relacionados a processos de Engenharia de
Software. No entanto, esse jogo s suporta o Modelo de
Prototipagem Rpida. Por fim, [42] apresentam a verso para
mundo virtual do laboratrio virtual IEEE 802.11, chamado
WiFiVL. O laboratrio foi estendido para o Second Life com o
objetivo de melhorar a interao com o usurio e dar suporte
aprendizagem exploratria.

13

Mostrar as aplicaes dos contedos tericos: o estudante


aplica os conhecimentos, adquiridos em aula, na simulao
de uma empresa e ainda pode exportar os casos de teste para
ferramenta TestLink (ferramenta para suporte a projetos de
teste de software, suportando vrios documentos, como
planos de teste, casos de teste, entre outros);

O professor atuar como um mediador: no jogo, o professor


assume o cargo de Gerente de Projetos e pode auxiliar os
estudantes nos desafios;

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Desenvolver a habilidade de trabalhar em equipe: os


estudantes podem ajudar uns aos outros durante o jogo,
podendo assim trabalhar de forma colaborativa;

Conflitos: eles podem surgir na interao entre os jogadores;


podem tanto auxiliar, quanto atrapalhar os participantes do
jogo;

Motivar os estudos e orientar o raciocnio: vrios autores


indicam que o uso de jogos pode ser um fator motivacional;

Desenvolver as capacidades de comunicao e de


negociao: os estudantes podem auxiliar uns aos outros a
resolver os desafios, logo, eles devem se comunicar e
negociar com os colegas, propiciando um ambiente
colaborativo melhor;

Limites: o domnio do jogo se restringe a um prdio em uma


ilha dentro de um mundo virtual e tambm a uma aplicao
web, na qual o usurio cria os casos de teste; ele pode, ainda,
acessar a internet para pesquisar outras fontes, de modo a
auxili-lo na resoluo dos desafios; e

Resultado: o jogador alcana seus objetivos quando conclui


com sucesso a fase de Lder da Equipe de Teste; caso queira,
ele pode comparar seus resultados em relao ao de outros
jogadores, por meio de um ranking.

Desenvolver uma viso sistmica para resoluo de


problemas: a viso sistmica consiste em examinar as mais
diferentes solues e escolher aquela que, em princpio, pode
proporcionar uma soluo tima, com a maior eficincia e
com um custo mnimo (Martinelli e Ventura, 2006), logo, a
atividade de resoluo dos desafios do jogo pode favorecer
essa habilidade.

Os elementos dramticos do JETS so os seguintes:

Cabe destacar que a proposta de um jogo de apoio ao ensinoaprendizagem, pois, como destaca [46], a disciplina de
Engenharia de Software deve fornecer uma base terica
consistente, portanto, o jogo no deve excluir a necessidade de um
professor. O Design Instrucional dessa abordagem segue o
modelo proposto por [47]. Os elementos desse modelo so os
seguintes: contexto, prcondies, ementa, objetivos gerais de
aprendizagem, contedos, objetivos gerais, estratgias de ensino,
avaliao e referncias. O contexto apresenta o pblico alvo e os
objetivos a serem alcanados. As pr-condies definem os
requisitos para aplicao da abordagem de ensinoaprendizagem. A
ementa apresenta de forma sucinta os assuntos que sero
abordados. Os objetivos gerais de aprendizagem descrevem os
resultados pretendidos da instruo. Os contedos detalham os
assuntos abordados, que podem ser organizados em unidades.
Cada contedo deve ter um objetivo de aprendizagem e de
estratgia de ensino especficos. A avaliao descreve de que
forma a abordagem ser aferida. Por fim, as referncias
apresentam a bibliografia utilizada na elaborao do Design
Instrucional.

Jogadores: estudantes de graduao da rea de computao;

Objetivos: responder os desafios de forma correta, de modo a


passar de fase at chegar ao ltimo estgio do jogo;

Procedimentos: os jogadores devem se dirigir sala


correspondente a cada fase, escolher uma mesa de trabalho e
sentar na cadeira para responder os desafios;

Regras: o jogo possui quatro fases, que correspondem a


quatro cargos de uma equipe de teste: (1) Testador de
Software, (2) Analista de Teste de Software, (3) Arquiteto de
Teste de Software e (4) Lder de Equipe de Teste. Essas fases
so sequenciais e para passar de fase, o jogador deve atingir
uma determinada pontuao, que obtida com base nos erros
e nos acertos dos desafios;

Desafio: o jogador deve responder as questes de Estratgias


de Teste de Software relacionadas a cada fase (cargo na
equipe de teste);

Play: os jogadores assumem o papel de funcionrios de uma


grande empresa de desenvolvimento de software, atuando e
interagindo uns com os outros de modo a atingir o cargo de
nvel mais alto na Diviso de Teste de Software;

Premissa: o jogador um profissional apto a ingressar como


Testador de Software em uma empresa de desenvolvimento
de software;

Personagem: o personagem o prprio jogador que


contratado para Diviso de Teste de Software de uma
emprefsa de desenvolvimento. O jogador pode customizar
seu avatar de modo a criar uma maior identificao e
envolvimento com o jogo; e

Histria: a DevInfoData uma empresa (fictcia) de


desenvolvimento de software e est recrutando funcionrios
para sua Diviso de Teste de Software.

Ao ingressar na empresa, o funcionrio ocupa o cargo de Testador


de Software e, conforme seu desempenho, promovido at chegar
ao cargo de Lder da Equipe de Teste. As figuras 3 e 4 apresentam
duas das salas disponibilizadas no ambiente, respectivamente, as

Os elementos formais do JETS so os seguintes:

salas de testadores de software e dos lderes da equipe de teste.


Figura 3 Sala dos testadores de software

Recursos: na sala de reunies, ficam disponveis os recursos


educacionais de aula e caso o professor esteja on-line no
jogo, tambm pode ser considerado um recurso, no sentido
de auxiliar o jogador;

14

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

contempla diversos documentos. No JETS, apenas trabalhado o


documento Caso de Teste, que desenvolvido no jogo imerso no
mundo virtual e, aps, exportado para a ferramenta TestLink, de
modo que isso pode incentivar os estudantes a explorarem mais a
ferramenta, potencializando seus conhecimentos relacionados a
Teste de Software e proporcionando uma maior experincia com
uma ferramenta profissional. Por ser um software de cdigo
aberto, os professores podem adaptar o JETS para suportar outras
ferramentas relacionadas a Teste de Software, de forma a
familiarizar melhor os estudantes com esses tipos de ferramentas.
Aps a realizao das aulas tericas e de utilizao da ferramenta
TestLink, o grupo de controle realizou uma atividade
tradicional, que foi uma lista de exerccios disponibilizada no
ambiente Moodle. O grupo experimental realizou a atividade
alternativa, que foi jogar o JETS, sendo que os estudantes
pertencentes ao mesmo iniciaram as atividades de utilizao do
jogo no laboratrio de informtica. Os primeiros 30 minutos de
aula foram destinados a orientaes e sobre o mundo virtual e o
jogo, e os 60 minutos restantes para os estudantes jogarem. Aps
este primeiro momento, os estudantes poderiam continuar
simulando as atividades do jogo fora do horrio escolar.

Figura 4 Sala dos lderes da equipe de teste


Convm salientar que o jogo no estabelece nenhum tipo de
ranqueamento entre os estudantes; ou seja, o primeiro aluno a
alcanar o cargo de Lder da Equipe no representa o fim do jogo
para os demais alunos. O objetivo principal era estabelecer uma
prtica onde todos os jogadores/alunos pudessem alcanar este
patamar. medida que os alunos se tornavam lderes de equipe,
eles podiam colaborar com os seus colegas, utilizando-se das
ferramentas de comunicao do OpenSimulator.

7.
APLICAO, ANLISE E
PROPOSTA DE MELHORIAS

Durante a aplicao do jogo, foi observado grande interesse por


parte do grupo. Inicialmente, foi exibido um vdeo do jogo e, em
seguida, foi explicado o funcionamento de uma ferramenta
visualizadora de mundos virtuais. Os estudantes foram instrudos
sobre as formas de visualizao e sobre como andar, voar, se
comunicar e editar seu avatar (personagem) no jogo. No incio, os
estudantes se dispersaram um pouco (e se divertiram bastante)
com as diversas possibilidades de edio do avatar, a
possibilidade de voar e de interagir com os colegas de uma
maneira diferente daquela que ocorre no dia a dia. A inteno aqui
era criar um ambiente coeso, para que os alunos se sentissem
vontade em usar o jogo e colaborar com os seus colegas, sem
imposio de regras rgidas.

Nesta seo, apresenta-se a aplicao e anlise do JETS,


indicando, ainda, os pontos importantes que esto sendo
propostos para a melhoria do jogo em sua segunda verso.
A aplicao do JETS foi realizada em uma turma do curso de
Engenharia da Computao de uma universidade, na Disciplina de
Engenharia de Software. A disciplina de Engenharia de Software
ofertada no quinto semestre do curso, sendo a nica no currculo
que aborda conceitos relacionados rea de Engenharia de
Software. A turma avaliada foi de quinze estudantes.
A avaliao seguiu o framework proposto por [47], para apoiar a
construo de experimentos na avaliao emprica de jogos
educacionais na rea de Engenharia de Software. A turma foi
dividida em dois grupos, seguindo a ordem alfabtica do dirio de
classe da disciplina, fazendo da primeira metade da turma o grupo
de controle e da segunda metade o grupo experimental.

Mas, aps algum tempo, passaram a se concentrar nas atividades


do jogo. Algumas dvidas sobre os desafios surgiram, mas os
estudantes preferiram fazer as perguntas diretamente ao professor,
apesar de estarem online no jogo, sendo que a maior parte da
comunicao com os colegas tambm ocorreu fora do mundo
virtual. Isso pode ser explicado pelo fato do jogo ter sido aplicado
em um laboratrio, onde os estudantes e o professor estavam
praticamente lado a lado. No entanto, frisou-se que qualquer
dvida relativa ao contedo do jogo em si deveria ser discutida
dentro do JETS, de tal modo que os aspectos interativos da
aplicao no ficassem prejudicados.

Todo o processo de aplicao do experimento foi realizado em um


perodo de vinte e dois dias. Inicialmente, os contedos foram
trabalhados em sala de aula de forma expositiva no decorrer de
duas aulas. Aps, os estudantes tiveram contato com o jogo.
Como j descrito, o objetivo do jogo passar pelas vrias fases,
que so representadas como os cargos que um engenheiro de
testes pode ocupar numa empresa at chegar liderana. O jogo
no competitivo: todos podem alcanar a liderana e o tempo
individual de cada um no computado para anlise. Desta forma,
estimula-se a colaborao entre os jogadores dentro do jogo em
detrimento de um comportamento mais individualista, caso o jogo
tivesse o carter eliminatrio.

importante observar que a aplicao do jogo se estenderia


durante vrias aulas; alm disso, era permitido e, at mesmo,
incentivado, que os estudantes acessassem o ambiente fora do
horrio escolar. Neste momento, verificou-se a seguinte situao:
quando os estudantes acessavam sincronicamente, a cooperao
entre eles era realizada atravs de conversas online,
principalmente em relao a dvidas ou questionamentos. No
entanto, no havia um mecanismo que permitisse uma forma de
cooperao ou colaborao assncrona, tal como definida por
[48]. A economia da colaborao (Collaboration Economy)
define uma situao de troca de presentes como uma
transferncia de servios inalienveis (como, por exemplo, uma
dica para ultrapassar uma determinada fase do jogo) entre os
negociantes envolvendo uma difusa, e geralmente subentendida,
necessidade de retribuio em algum momento do futuro.

At o incio do experimento, o tema de Teste de Software no


havia sido abordado na disciplina. Na primeira aula, por ser
unicamente expositiva, foi observado um pouco de disperso por
parte dos estudantes, em alguns momentos. A aula foi dividida em
um momento expositivo e outro momento em que os estudantes
realizaram um trabalho em grupo. J na segunda aula foi realizada
uma atividade prtica com a ferramenta TestLink, que possui
inmeras funcionalidades de gerenciamento de processo de teste e

15

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

equilbrio entre as exigncias do design do jogo e dos requisitos


educacionais, de modo que ambos so importantes e devem se
relacionar afim de que culminem em um jogo divertido e que
tambm permita resultados de aprendizagem [26] [50].

Este tipo de ferramenta pode fomentar uma memria de grupo,


que pode armazenar o conhecimento necessrio e compartilhado
para o desempenho das atividades do grupo, fornecendo acesso
rpido a informaes internas e pertinentes ao grupo; capturando,
armazenando e integrando conhecimento; e provendo uma forma
de conhecimento que posso evitar a paralisao de uma atividade
por causa da perda deste. No caso especfico do jogo, caso um
estudante estivesse paralisado em uma parte do jogo, ele poderia
consultar a memria do grupo para encontrar alguma dica ou
informao que lhe impulsionasse para a prxima fase.

Em relao questo 5 (O jogo forneceu informao suficiente


sobre o assunto?) houve duas respostas negativas e apenas um
sim. Isso pode indicar que apenas os slides da aula disponveis
na sala de reunies do ambiente de jogo e a presena do
professor no sejam suficientes para alguns estudantes. A partir
dos comentrios registrados na avaliao, observou-se que os
estudantes, quando orientados pelo professor sentiram-se mais
aptos a realizarem as tarefas. No entanto, quando atuando
sozinhos no ambiente, argumentaram faltar comunicao e
interao com uma espcie de moderador do ambiente. Uma
possibilidade para minimizar esta carncia o uso de chatterbots,
que um tipo de agente que simula conversas inteligentes com
um ou mais usurios humanos [51]. Esses agentes podem ser
usados para auxiliar os estudantes, fornecendo informaes sobre
o contedo pedaggico. Ainda, segundo [51], o uso de agentes
pode auxiliar os professores no monitoramento de atividades e
tambm aumentar a satisfao e a eficincia didtica dos
estudantes no contexto de e-learning.

Desta forma, est sendo criado, no JETS 2.0, duas ferramentas


para sanar estas questes: (a) um mural compartilhado e de
preenchimento automtico, indicando a situao, dentro do jogo,
de cada um dos participantes este mural, alm de servir como
estmulo para que todos sintam-se engajados em alcanar os
mesmos objetivos dos demais, tambm tem a funo de informar
quem j cumpriu cada objetivo, o que importante para que um
estudante saiba a quem recorrer; (b) e um frum de perguntas e
respostas, onde possvel discutir e deliberar, de forma
assncrona, os problemas apresentados em cada fase do jogo.
Em geral, os estudantes demonstraram motivao e envolvimento
com o jogo. Alguns, inclusive, perguntaram sobre a
disponibilizao do jogo fora do perodo de avaliao, sendo que
um dos estudantes comentou que gostaria de jog-lo nas frias.
Com base nesses relatos, as expectativas da experincia foram
excedidas, pois os estudantes mostraram interesse em jogar o
JETS tambm fora do contexto de aula.

Considerando esta fragilidade, encontra-se em desenvolvimento


para a verso JETS 2.0, avatares inteligentes, que atuaro como
agentes companheiros, seguindo a arquitetura de agente
companion de Vygostsky [52], que constri o conhecimento
atravs de um relacionamento com as pessoas, fazendo com que
se envolvam em interaes mais ricas e gratificantes. Para a
integrao dos agentes com o ambiente OpenSimulator, optou-se
por utilizar o visualizador Radegast, que implementado na
Linguagem de programao C# e possui uma base de
conhecimento em AIML (Artificial Intelligence Markup
Language).

Ao final do perodo estabelecido para que pudessem passar por


todas as etapas, os estudantes do grupo experimental foram
convidados a responder um questionrio sobre suas percepes
em relao ao mesmo. Como proposto no framework citado, os
estudantes responderam a essas perguntas com nmeros de 1 a 4,
sendo 1 equivalente a sim e 4 equivalendo a no.

Na questo 6 (O grau de dificuldade do jogo foi adequado para o


aprendizado?) a maioria dos estudantes apresentou respostas
positivas, mas houve uma resposta mais para no e uma
absteno. De qualquer forma, essa uma questo que pode ser
facilmente resolvida, pois o jogo permite a edio dos desafios,
portanto, o nvel de dificuldade pode ser alterado de acordo com a
turma. Com relao questo 7 (A durao do jogo foi
adequada?), apenas um estudante achou a durao do jogo
inadequada, mas isso tambm pode ser ajustado pelo professor,
criando ou removendo desafios nas fases. Alguns estudos
destacados por [53] indicam que alguns estudantes perdem o
interesse no jogo quando ele muito complexo ou muito longo. O
JETS est em conformidade com essas questes.

Sobre a questo 1 (Voc gostou do jogo?) pode-se perceber que a


maioria dos estudantes respondeu que gostou do JETS e apenas
um respondeu mais para no. Os trabalhos correlatos de [9],
[37], [39] e [49] apresentam experimentos que mostram que a
maioria dos estudantes tambm gostou de jogar os respectivos
jogos, o que confirma o potencial educacional dos jogos na
educao.
Todos os jogos possuem objetivos e no caso dos jogos srios
tambm so includos os objetivos de aprendizagem. Com relao
questo 2 (Os objetivos de aprendizagem foram atingidos com o
jogo?), todos os estudantes deram respostas positivas, sim ou
mais para sim, logo, conclui-se que todos os estudantes
aprenderam sobre Estratgias de Teste de Software com a
utilizao do jogo. Ainda, resultados positivos em relao aos
objetivos de aprendizagem tambm foram obtidos por [37]. Isso
importante, pois os estudantes no gostam de atividades nas quais
acham que nunca tero sucesso, logo, eles devem se sentir aptos a
alcanar os objetivos do jogo [26].

Sobre a questo 8 (O mtodo de ensino do jogo foi adequado?),


observa-se que a maioria dos estudantes respondeu sim para a
pergunta, o que confirma o uso da abordagem de aprendizagem
baseada em jogos como positiva. Segundo [11], nos ltimos anos,
observam-se mudanas no meio educacional, como o emergente
mtodo de ensino utilizando jogos, o que indica vontade e a
necessidade de mudar o processo e o ambiente de ensinoaprendizagem.

A questo 3 (O contedo do jogo foi relevante para o


aprendizado?) teve, em sua maioria, respostas positivas apenas
um estudante respondeu mais para no. J a questo 4 (A
sequncia de tpicos do jogo foi adequada?) obteve apenas
respostas positivas, o que indica que a distribuio das fases do
jogo foi acertada. Logo, possvel afirmar que o design
instrucional foi bem definido e que o design do jogo foi bem
elaborado. No desenvolvimento de jogos srios, fundamental o

A questo 9 (A contextualizao apresentada pelo jogo foi


adequada?) apresentou somente respostas positivas por parte dos
estudantes, o que indica que a narrativa e o ambiente realstico do
jogo fornecem uma contextualizao adequada entre o contedo
de Teste de Software e o jogo. O que muito relevante, pois a
narrativa permite que o jogador deixe de ser um agente passivo e

16

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

aprendizagem baseada em jogos por meio da plataforma de um


mundo virtual.

passe a ser um participante da trama. Os recursos grficos e


computacionais possibilitam, ainda, o enriquecimento do enredo,
criando uma atmosfera de imerso no jogo [54]. Assim, a
contextualizao do jogo tem um papel fundamental no
envolvimento do estudante. Alm disso, ao se perceber como
elementos de um grupo funcionrios de uma mesma empresa ,
os jogadores/usurios eram incentivados, mesmo que
indiretamente, a colaborarem uns com os outros para que todos
pudessem alcanar o objetivo final.

Apesar do JETS ter sido concebido de forma que possa ser jogado
individualmente por um estudante, este no era seu propsito
original. A partir da primeira utilizao do mesmo em sala de
aula, foi buscado uma abordagem de avaliao que reforasse os
aspectos de colaborao entre os estudantes, ao integrarem uma
equipe de testadores de software na resoluo de problemas e
promoo de cargos dentro de uma empresa fictcia.

Na questo 10 (Voc gostou de jogar o JETS?), apenas dois


estudantes deram respostas negativas (no e mais para no).
Apenas um respondeu mais para sim e todos os demais
responderam sim. Logo, a maioria gostou de jogar o JETS, o
que indica que uma atividade atrativa e divertida, podendo
representar um fator motivacional no processo de ensinoaprendizagem. Esse resultado corrobora as afirmaes de [18],
[25], [55] e [16] em relao motivao adquirida pelos
estudantes ao realizar atividades de jogos.

Aps a anlise, verificou-se que seria possvel potencializar os


aspectos colaborativos do jogo atravs da implantao de um
mecanismo de cooperao assncrona (frum de perguntas e
respostas) e elementos de percepo sobre o estado dos demais
participantes da equipe (mural). Ainda, conforme [56], a interao
considerada caracterstica essencial para a eficcia da
aprendizagem colaborativa. Para os autores, ela deve ser
estimulada pelo professor, para que os estudantes possam se sentir
vontade para colaborarem, com suas opinies e conhecimento,
construindo, desta forma, relaes sociais e, desenvolvendo uma
comunicao saudvel entre o grupo. A partir dos relatos dos
estudantes avaliados, foi possvel observar que a falta da presena
do professor (ou de um moderador) durante as interaes a
distncia, ocasionou certa fragilidade no desenvolver das
atividades. Espera-se suprir esta carncia atravs dos agentes de
software (avatares inteligentes) que encontram-se em
desenvolvimento.

Com relao questo 11 (Voc preferiria realizar uma atividade


tradicional, como uma lista de exerccios, ao invs de jogar o
JETS?) a grande maioria respondeu que no preferiria realizar
uma atividade tradicional ao invs de realizar uma atividade com
o jogo srio JETS. Cabe destacar que apenas um nico estudante
que respondeu sim a pergunta 11, forneceu respostas positivas na
maioria das outras questes. Isso indica que, apesar de ele ter
gostado do jogo e ter atingido os objetivos de aprendizagem,
provavelmente, possui um estilo de aprendizagem que se adapta
melhor abordagem tradicional.
8.

9.
REFERNCIAS
[1] Institute Of Electrical And Electronic Engineers Computer
Society; Association For Computing Machinery. Curriculum
guidelines for undergraduate degree programs in Computer
Engineering, 2004.

CONSIDERAES FINAIS

Este artigo teve como objetivo principal apresentar o


desenvolvimento e avaliao de um jogo srio imerso em um
ambiente virtual colaborativo tridimensional, como apoio ao
ensino e aprendizagem de teste de software. O jogo, denominado,
JETS Jogo da Equipe de Teste de Software abrange o contedo
de estratgias de teste de software, no entanto, pela possibilidade
de integrao do Moodle ao jogo, o professor pode adaptar os
desafios, contemplando diferentes contedos do currculo, com
nveis de dificuldade desejados para mudana de fase.

[2] Myers, G. J. et al. The art of software testing. New Jersey:


John Wiley & Sons, 2.ed. 2004.
[3] Pressman, R. S. Engenharia de software: uma abordagem
profissional. Porto Alegre: AMGH, 7.ed. 2011.
[4] Hass, A. M. J. Guide to advanced software testing. Boston:
Artech House, 2008.
[5] Kanij, T.; Merkel, R.; Grundy, J. A preliminary study on
factors affecting software testing team performance. In:
International Symposium On Empirical Software
Engineering And Measurement, 5., 2011, Banff.

Outro grande diferencial do JETS a possibilidade de exportao


dos Casos de Teste desenvolvidos no jogo para a ferramenta
TestLink, que uma aplicao web de cdigo aberto para
gerenciamento de atividades de Teste de Software, o que permite
a experincia do estudante com uma ferramenta utilizada por
profissionais no mercado de trabalho.

[6] Wangenheim, C. G.; Silva, D. A. Qual conhecimento de


engenharia de software importante para um profissional de
software? In: Frum De Educao Em Engenharia De
Software, 2.,2009, Fortaleza.

O JETS, por utilizar um ambiente 3D, proporcionado pelo mundo


virtual OpenSim, permitiu a construo de cenrios realsticos e
simulao do setor de Teste de Software de uma grande empresa,
dando uma noo ao estudante sobre o ambiente profissional e
possibilitando aplicao dos conhecimentos de Teste de Software
em um ambiente controlado, de modo que se pode cometer erros
sem o custo que haveria no mundo real.

[7] Stroustrup, B. What should we teach new software


developers? Why?. Communications of the ACM, v.53, n.1,
jan. 2010.
[8] Astigarraga, T. et al. The emerging role of software testing in
curricula. In: Transforming Engineering Education: Creating
Interdisciplinary Skills For Complex Global Environments,
1., 2010, Dublin.

Destaca-se como contribuio deste trabalho, a apresentao de


uma abordagem que pode agregar diferentes estratgias de ensinoaprendizagem, de modo que se adaptem a diferentes cursos de
graduao na rea de computao. Nesse contexto, esta
abordagem vai ao encontro das recomendaes relacionadas ao
ensino, descritas nas Diretrizes Curriculares para Cursos de
Graduao na rea de Computao [45], utilizando conceitos de

[9] Diniz, L. L.; Dazzi, R. L. S. Jogo para o apoio ao ensino do


teste de caixa-preta. In: Simpsio Brasileiro De Informtica
Na Educao, Aracaju, SE, 2011.
[10] Fuks, H; Raposo, A; Gerosa, M. A. Engenharia de
Groupware: Desenvolvimento de Aplicaes Colaborativas,

17

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

o paradigma educacional construtivista. Revista Hfen, Vol.


30, n. 58, II semestre, PUC-RS.

In: XXI Jornada de Atualizao em Informtica, V2, Cap. 3,


ISBN 85-88442-24-8, p 89- 128, 2002, Rio de Janeiro. Anais
do XXII Congresso da Sociedade Brasileira de Computao.
Florianpolis, 2002.

[29] Savin-Baden, M. A practical guide to using Second Life in


higher education. New York: McGraw-Hill, 2010.

[11] Pivec, M. Play and learn: potentials of game-based learning.


British Journal of Educational Technology, v. 38, n. 3, p.
387-393, 2007.

[30] Azevedo, E. et. al. Desenvolvimento de jogos 3D e


aplicaes em realidade virtual. Elsevier: Rio de Janeiro,
2005.

[12] Scaico, Pasqueline Dantas, et al. "Combinando Diverso e


Educao: Castelo dos Enigmas, um Jogo Srio para o
Ensino de Algoritmos." XXII SBIE-XVII WIE (2011).

[31] Osrio, F. S.; Musse, S. R.; Santos, C. T.; Heinen, F.; Braun,
A. e Silva, A.T. S. (2004). Ambientes Virtuais Interativos e
Inteligentes: Fundamentos, Implementao e Aplicaes
Prticas. XXIV Congresso da SBC JAI 2004. Tutorial.
Salvador, Bahia.

[13] Sidhu, M. S. Technology-assisted problem solving for


engineering education: interactive multimedia applications.
Hershey: Engineering Science Reference, 2010.
[14] Prensky, M. Digital game-based learning. New York:
McGraw-Hill, 2001.

[32] Monsalve, E. S. et al. Teaching software engineering with


SimulES-W. In: Ieee-Cs Conference On Software
Engineering Education And Training, 24., 2011, Honolulu.

[15] Freitas, S.; Liarokapis, F. Serious games: a new paradigm for


education? Serious games and edutainment applications.
London: Springer, 2011.

[33] Navarro, E.; Hoek, A. Multi-site evaluation of SimSE. In:


Technical Symposium On Computer Science Education, 40.,
2009, New York.

[16] Garris, R.; Ahlers, R., Driskell, J. E. Games, motivation, and


learning: a research and practice model. Simulation &
Gaming, v. 33, n. 4, p. 441-467, dez. 2002.

[34] Benitti, F. B. V.; Mollri, J. S. Utilizao de um RPG no


ensino de gerenciamento e processo de desenvolvimento de
software. In: Workshop Sobre Educao Em Computao,
16., 2008, Belm do Par.

[17] Pivec, M.; Dziabenko, O. Game-based learning in


universities and lifelong learning: UniGame: social skills
and knowledge training game concept. Journal of Universal
Computer Science, n. 1, v. 10, p.14-26, 2004.

[35] Vargas et. al. Desenvolvimento de um jogo de empresa


baseado em agentes de software e instituies eletrnicas
para simulao de elicitao de requisitos de software. In:
Workshop Sobre Educao Em Computao, 18., 2010,
Minas Gerais.

[18] Mattar, J. Games em educao: como nativos digitais


aprendem. So Paulo: Person, 2010.

[36] Resende, R. et al. SPARSE: um ambiente de ensino e


aprendizado de engenharia de software baseado em jogos e
simulao. In: Simpsio Brasileiro De Informtica Na
Educao, 21., 2010, Joo Pessoa, PB

[19] Kishimoto, T. M. O jogo e a educao infantil. So Paulo:


Thonson, 2008.
[20] Abt, C. C. Serious games. Boston: University Press of
America, 1987.
[21] Michael D.; Chen, S. Serious games: games that educate,
train and inform. Boston: Thomson Course Technology,
2006.

[37] Gonalves, R. Q.; M. Thiry; A. Zoucas. Avaliao da


aprendizagem em experimentos com jogo educativo de
engenharia de requisitos. In: Simpsio Brasileiro De
Qualidade De Software, 10., 2011, Curitiba, PR

[22] National Research Concil. The rise of games and highperformance computing for modeling and simulation.
Washington: The National Academies Press, 2010.

[38] Ptter, H.; Schots, M. InspectorX: um jogo para o


aprendizado em inspeo de software. Frum De Educao
Em Engenharia De Software, 4., 2011, So Paulo

[23] Serious Games Initiative. Website. Disponvel em: <


http://www.seriousgames.org>

[39] Silva, A. C. Jogo educacional para apoiar o ensino de


tcnicas para elaborao de testes de unidade. 2010. 179f.
Dissertao (Mestrado em Computao Aplicada)
Universidade do Vale do Itaja, So Jos, 2010.

[24] Riedel, J. C. K. H.; Hauge, J. B. State of the art of serious


games for business and industry. In: International
Conference On Concurrent Enterprising, 17., 2011, Aachen.

[40] Toro-Troconis, M. et. al. Design and delivery of game-based


learning for virtual patients in Second Life: initial findings.
In: Peachey, A. et al. (Ed.). Researching learning in virtual
worlds. London: Springer, 2010.

[25] Papastergiou, M. Digital Game-Based Learning in high


school computer science education: impact on educational
effectiveness and student motivation. Computers &
Education, v. 52, n. 1, p.1-12, 2009.

[41] Wang, T.; Zhu, Q. A Software engineering education game


in a 3-D online virtual environment. In: Interna Tional
Workshop On Educa Tion Technology And Computer
Science, 1., 2009, Wuhan.

[26] Bachen, C. M.; Rapahel, C. Social flow and learning in


digital games: a conceptual model and research agenda. In:
Serious games and edutainment applications. London:
Springer, 2011.

[42] Sturgeon, T.; Allison, C.; Miller, A. Exploring 802.11: real


learning in a virtual world. In: Frontiers In Education
Conference, 39., 2009, San Antonio. Anais... San Antonio,
2009.

[27] Raposo, A. B. Ambientes Virtuais Colaborativos. In:


Sistemas Colaborativos (Org. Pimentel, M; Fuks, H). Rio de
Janeiro: Elsevier, 2011.

[43] Soares, Gabriel Cndido, Joo Batista Mossmann, and Marta


Rosecler Bez. HIT CO-OPUm Jogo Colaborativo

[28] Guimares, M. P.; Mota, T.; Oliveira, O. (2006) Lego


Cooperativo: construindo modelos LEGO de forma
colaborativa em um ambiente virtual imersivo, interativo sob

18

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Utilizando Kinect.Proceedings of SBGames 2013, So


Paulo.
[44] F. M. Silva, Concepo e Realizao de Um Modelo
Computacional de Jogos Interativos no Contexto de
Aprendizagem Colaborativa, Dissertao (Ps-Graduao em
Modelagem Computacional de Conhecimento), Universidade
Federal de Alagoas, Macei, AL, 2008,
[45] Brasil. Diretrizes Curriculares dos cursos de Bacharelado em
Cincia da Computao, Engenharia de Computao,
Engenharia de Software e Sistemas de Informao e dos
cursos de Licenciatura em Computao. 2003.
[46] Comisso De Especialistas De Ensino De Computao E
Informtica. Diretrizes Curriculares de Cursos da rea de
Computao e Informtica. 1999.
[47] Kochanski, D. Um framework para apoiar a construo de
experimentos na avaliao emprica de jogos educacionais.
2009. 224f. Dissertao (Mestrado em Computao
Aplicada) Universidade do Vale do Itaja, So Jos, 2009.
[48] Kollock, P. The economies of online cooperation: Gifts and
public goods in cyberspace. In: Marc Smith e Peter Kollock
(org.), Communities in Cyberspace, Londres: Routledge.
2005.
[49] Wangenheim, C. G. et al. Desenvolvimento de um jogo para
ensino de medio de software. VIII SIMPSIO
BRASILEIRO DE QUALIDADE DE SOFTWARE, 8.,
2009, Minas Gerais.
[50] Klopfer, E. et al. Moving learning games forward: obstacles,
opportunities e openness. 2009. Disponvel em:
<http://education.mit.edu/papers/MovingLearningGamesFor
ward EdArcade.pdf>. Acesso em: 4 jan. 2012.
[51] Orlando, P; Giovanni, F. An integrated system, with natural
language management, for the monitoring activities in elearning environments. In: International Conference On
Complex, Intelligent And Software Intensive Systems, 2.,
2008, Catalonia
[52] Benyon, David. Interao Humano-Computador. So Paulo:
Pearson Brasil, 2011.
[53] Wangenheim, C. G.; Shull, F. To Game or Not to Game?
IEEE Software, v.26, n.2, p. 92-94, mar./abr. 2009.
[54] Beatriz, I.; Martins, J.; Alves, L. A crescente presena da
narrativa nos jogos eletrnicos. In: Brazilian Symposium On
Games And Digital Entertainment, 8., 2009, Rio de Janeiro
[55] Mnz, U. et al. Motivation and learning progress through
educational games. IEEE Transactions on Industrial
Electronics, n. 6, v. 54 dez. 2007.
[56] Nascimento, Karla Anglica Silva do, and Jos Aires de
Castro Filho. "Desafios para utilizao de Atividades
Colaborativas em Sala de Aula: um exemplo com o Google
Maps." Jornada de Atualizao em Informtica na Educao
1.1 (2013): 121-141.

19

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Sobre as Redes de Coautoria atravs das edies do


SBSC
Helena Araujo

Departamento de Informtica
Aplicada
Universidade Federal do Estado
do Rio de Janeiro (UNIRIO)
Rio de Janeiro RJ Brasil

helena.araujo@uniriotec.br

Jussara Rodrigues

Departamento de Informtica
Aplicada
Universidade Federal do Estado
do Rio de Janeiro (UNIRIO)
Rio de Janeiro RJ Brasil

jussara.rodrigues@uniriotec.br

ABSTRACT

Vnia Maria Flix Dias

Departamento de Informtica
Aplicada
Universidade Federal do Estado
do Rio de Janeiro (UNIRIO)
Rio de Janeiro RJ Brasil

vania@uniriotec.br

publicados em coautoria demonstrado em estudos, pela


importncia deste tipo de colaborao no desenvolvimento de
pesquisas e pesquisadores e pelo apoio que a anlise destas
redes pode fornecer, entendemos ser de grande importncia
compreender melhor como estas redes se formam e atuam para
verificar e proporcionar solues adequadas em tecnologia de
maneira que se desenvolvam cada vez mais.

This paper aims to analyze the collaboration inside part of a


relevant academic community that has among its objectives of
research, the collaborative systems. For this study, we analyzed
some scientific collaboration networks, more precisely, that
ones generated from the 2004 to 2013 editions of the Brazilian
Symposium on Collaborative Systems (SBSC). The specific
objectives were: to identify nodes with main roles regarding to
the collaboration aspects inside this community and analyze the
system evolution to verify the trajectory of authors and
institutions during the ten years of the event. After these
analyses, we do a comparison between data found to SBSC and
data found to Brazilian Symposium on Information Systems
(SBSI).

O presente trabalho busca analisar a evoluo da colaborao


entre parte da comunidade acadmica da rea de informtica e
foi inspirado em trabalhos anteriores [5, 6, 7]. Especificamente,
nosso objeto de estudo foram as redes de colaborao
subjacentes s edies do Simpsio Brasileiro de Sistemas
Colaborativos (SBSC) ocorridas entre 2004 e 2013. Estudamos
a evoluo da colaborao em nvel de coautoria de
pesquisadores que participaram das edies do SBSC citadas, e,
tambm, a colaborao em nvel de instituies. Aps a anlise
dos dados para o SBSC, comparamos estes com os dados
encontrados para o Simpsio Brasileiro de Sistemas de
Informao (SBSI) [5].

Palavras-chave
Redes sociais, colaborao cientfica, SBSC, coautoria, grafos.

O restante deste artigo est organizado da seguinte forma: Na


seo 2 so definidos os conceitos bsicos necessrios para a
compreenso da metodologia que adotamos nas anlises das
redes apresentadas. A seo 3 mostra a evoluo das redes de
coautoria do SBSC atravs de suas edies. Na seo 4 fazemos
uma anlise comparativa entre as redes acumuladas do SBSC e
do SBSI. Por fim, apresentamos as consideraes que julgamos
mais relevantes dentro do escopo deste trabalho.

1. INTRODUO
A interpretao das trajetrias de evoluo de um determinado
campo cientfico passa pela compreenso das relaes que
ocorrem entre os atores desse campo [1]. A anlise de redes de
colaborao atravs de coautoria em artigos publicados em
peridicos ou em anais de simpsios, congressos e outros
eventos acadmicos uma das formas de mensurar a
produtividade e o grau de colaborao entre docentes e/ou
pesquisadores de uma determinada rea ou linha de pesquisa
[2]. Por outro lado, a atuao em redes de colaborao um
meio de alavancar e aplicar a produo cientfica [3]. A
integrao de conhecimentos e competncias acelera a gerao
de inovaes medida que amplia o horizonte dos envolvidos
pela troca de experincias e pela mtua motivao para alcanar
novos patamares de saber e realizao. Conforme resultados de
pesquisas em relao colaborao no campo da cincia da
informao, percebe-se que cada vez mais a quantidade de
artigos publicados em coautoria vem crescendo, isto em
diversas reas do conhecimento, tornando a colaborao em
coautoria cada vez mais formal [4]. Pelo crescimento de artigos

2. FUNDAMENTOS TERICOS
O objetivo desta seo revisar brevemente algumas definies
e propriedades de grafos [8] e mtricas utilizadas para anlise
de redes sociais [9, 10, 11] a fim de estabelecer a terminologia e
as notaes presentes ao longo do artigo, facilitando assim o
entendimento dos resultados apresentados nas sees seguintes.
As redes sociais tm sua organizao comumente representada
por grafos. Um grafo, denotado por G=(V,E), consiste em um
conjunto finito e no vazio V de elementos chamados vrtices e
em um conjunto finito E de pares no ordenados de elementos
distintos de V, chamados arestas. Usualmente, |V|=n e |E|=m.
Um multigrafo um grafo que pode possuir arestas mltiplas,
ou seja, uma ou mais arestas entre o mesmo par de vrtices.
Arestas mltiplas podem ser substitudas por uma aresta nica
com peso, sem prejuzo do seu significado. Neste caso, o peso
de uma aresta corresponde ao total de arestas substitudas.
Usamos arestas mltiplas neste trabalho para representar mais
de um artigo publicado por dois autores em parceria ou mais de
um relacionamento entre duas instituies, de acordo com a

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

20

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

quantidade de autores de uma instituio publicando artigos em


parceria com autores de outra instituio.

disseminao de informao no componente da rede em que


atuam. A centralidade de proximidade de um vrtice vi
calculada pela equao 4 a seguir:

O grau de um vrtice igual ao nmero de arestas incidentes


sobre ele. Um n dito isolado quando no h arestas
incidentes sobre o mesmo, sendo o valor do seu grau igual a
zero. Uma sequncia de vrtices v1,...,vk tal que (vj, v j+1)
pertence a E, 1<=j<k, denominado caminho de v1,...,vk. O
valor k-1 corresponde ao comprimento do caminho. Denominase distncia d(v,w) entre dois vrtices v e w como sendo o
comprimento do menor caminho entre v e w. Um grafo conexo
se existe caminho entre qualquer par de vrtices do mesmo.
Caso contrrio, o grafo denominado desconexo. Um
componente conexo de um grafo G um subgrafo conexo
maximal de G. Neste trabalho, chamamos de maior componente
conexo de um grafo G, o componente conexo que possui a
maior quantidade de vrtices, e, caso existam dois componentes
conexos com a mesma quantidade, foi utilizada a soma dos
pesos das arestas de cada componente como critrio de
desempate.

( ) = =1 ( , )

( ) = ( 1) . ( )

n1

D(G) =

Cb (vi )

((n1)(n2)/2)

(6)

O dimetro de uma rede igual maior distncia entre dois


vrtices quaisquer da rede, isto , o dimetro da rede o maior
caminho mais curto de G [9].
A incluso representa o percentual de conectividade de uma
rede e calculada pela equao 7 a seguir. O parmetro s
corresponde quantidade de ns isolados na rede:
l=

(1)

n s
n

100

(7)

3. SOBRE AS REDES DO SBSC


A fim de tentar avaliar sistematicamente o comportamento da
comunidade em questo, foram coletados os dados dos anais do
SBSC para as edies de 2004 a 2013 e cadastradas
manualmente em um banco de dados. Utilizamos a ferramenta
apresentada e descrita em [5] para gerar cada uma das redes
analisadas. Para cada edio do SBSC foram construdas duas
redes: uma para autores e outra para instituies. Alm disso,
geramos dois grafos evolutivos (i.e. unio): um deles condensa
todas as redes de autores e, o outro, as redes de instituies.
Na rede de autores, cada vrtice representa um autor e existe
uma aresta entre dois vrtices, caso eles tenham escrito um
artigo em conjunto. O peso de uma aresta representa o total de
artigos publicados pelos autores extremos da aresta, em
parceria. Um pesquisador que publicou um trabalho sem
nenhum coautor representado por um vrtice isolado na rede.
Na rede de instituies, cada vrtice representa uma instituio
e existe uma aresta entre dois vrtices caso estes contenham
autores que escreveram um artigo em conjunto. O peso de uma
aresta representa o total de artigos publicados pelas instituies
extremas da aresta por autor envolvido, em parceria. Uma
instituio onde seus autores publicaram um trabalho sem
nenhum coautor de outra instituio representada por um
vrtice isolado na rede.

(2)

A medida relativa ao tamanho da rede dada pela equao 3:


Cb (vi ) =

((n(n1)/2)

Teoricamente, em um grafo mais denso, a disseminao da


informao dentro da rede ocorre de forma mais acelerada e
eficiente.

A centralidade (grau) de intermediao de um ator v definida


com base na quantidade de caminhos mais curtos entre pares de
vrtices do grafo que passam por ele. Se o ator v no for parte
do caminho mais curto de pelo menos um par de vrtices, ento
o valor do seu grau de intermediao zero [9]. Esta medida
nos permite identificar atores com papel decisivo na facilitao
da disseminao de informao na rede (grafo) em que atuam.
Seja gjk a quantidade de caminhos mais curtos entre os vrtices j
e k, e seja gjk(vi) a quantidade de caminhos mais curtos entre os
vrtices j e k que passam pelo vrtice v, a equao 2 a seguir
calcula a centralidade de intermediao de um vrtice v:
( ) = < ( )/

(5)

A densidade D(G) de um grafo G dada pela equao 6:

A centralidade de grau de um vrtice v, denotada por Cd(v),


igual ao grau do vrtice v. Segundo este critrio, o vrtice mais
central ser aquele com maior grau na rede. O grau normalizado
de um vrtice v, denotado por Cd(v) pode ser obtido atravs da
equao 1 apresentada a seguir:
Cd (v)

(4)

A medida relativa ao tamanho da rede pode ser obtida com a


equao 5:

Uma rede social pode ser representada atravs de grafos, onde


os atores so representados por vrtices e as relaes entre os
mesmos so expressas por arestas. A fim de identificar a
influncia de determinados atores nas redes sociais, diversas
medidas foram propostas at o momento. As mtricas utilizadas
aqui so descritas a seguir.

Cd (v) =

(3)

Tambm podemos calcular o grau mdio da rede. A soma dos


graus de todos os vrtices de um grafo vale 2m. Portanto,
o grau mdio do grafo 2m/n [9].

Por simplicidade e tambm por questo de estilo, utilizaremos a


expresso participao no evento como sinnimo de
publicao nos anais do simpsio. Isto , ao dizermos que um
pesquisador participou de uma edio do SBSC, estamos
afirmando apenas que o mesmo teve ao menos uma publicao
nos anais do evento correspondente.

A centralidade (grau) de proximidade de um n est baseada na


distncia entre ele e todos os outros ns do subgrafo do qual faz
parte. Quanto maior o papel de intermediao de um vrtice no
grafo, menor ser seu grau de proximidade no subgrafo em que
atua. Proximidade pode ser considerada como uma medida de
rapidez, para determinar a velocidade que ser necessria para
difundir informaes de um vrtice a todos os outros ns
sequencialmente [10]. O grau de proximidade nos permite
identificar atores com papel decisivo na facilitao da

21

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

3.1 Rede de Autores


A rede (acumulada) de autores das edies do SBSC estudadas
composta por 484 autores, 1036 arestas e 231 artigos
publicados. Num total de 55 componentes, o grau de incluso
foi de 98% e apenas sete autores publicaram isoladamente. Isso
demonstra que de uma forma geral, a rede de autores do SBSC
publica em parceria. O grafo desta rede apresentado na figura
1. O peso das arestas no est apresentado nos grafos aqui
representados por uma questo de visualizao, mas est sendo
considerado em todas as anlises.

Figura 2: Detalhe para o vrtice 234 (em cor vermelha) de


maior centralidade de grau na rede

Figura 3: Detalhe para o vrtice 158 que possui a segunda


maior centralidade de grau na rede (vrtice em cor vermelha
com arestas lilases)
O maior componente conexo da rede tem 222 vrtices
representando 45,7% dos autores. O segundo maior
componente tem apenas 23 vrtices, sendo apenas 4,7% do
total de autores. Os nove primeiros autores de maior
centralidade de grau Cd(v) so todos do maior componente. A
densidade D(G) da rede no geral foi relativamente baixa, sendo
de apenas 0,01. O maior grau da rede foi 73, mas a mdia de
centralidade de grau foi de 4,7. Podemos observar que apenas
29% dos autores esto acima do grau mdio, o que pode ser
explicado pela participao apenas pontual no evento de alguns
membros como alunos de graduao ou ps-graduao que ao
terminarem seus cursos muitas vezes no prosseguem com as
pesquisas das quais faziam parte. A mdia de autores por artigo
dois e podemos perceber, atravs dos anais do evento, que
estas
relaes
so
representadas
pelos
pares
orientador/estudante.

Figura 1: Grafo da rede acumulada de autores do SBSC 2004


a 2013
Nas figuras 2 e 3 a seguir, apresentamos o detalhe para os
vrtices com maior grau de centralidade no grafo.

Na Tabela 1, apresentamos os resultados das principais medidas


para as redes de autores de cada edio do SBSC.

22

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Tabela 1: Evoluo da rede de autores do SBSC

Ainda sobre a constncia na participao do evento, 75% dos


autores participaram apenas de uma edio. O autor que
apresentou maior grau de centralidade Cd(v) na comunidade,
representado pelo vrtice 234, publicou em oito edies do
evento. O segundo autor de maior grau de centralidade na rede,
o vrtice 158, participou de nove edies do evento, estando
ausente somente em 2013. Nenhum autor publicou em todas as
edies, embora trs autores tenham publicado em quase todas
as edies - nove no total. Entre eles encontra-se o prprio
vrtice 158 e os autores representados pelos vrtices 240
(Mariano Pimentel) e 237 (Marcos Roberto da Silva
Borges). Os autores 158 e 237 participaram dos eventos sempre
pela mesma instituio, USP e UFRJ respectivamente, e o
autor 240 pela PUC-RJ (2004 a 2006) e UNIRIO (2007 em
diante). Vale destacar o vrtice 237 pelo comportamento em
que na rede cumulativa teve centralidade de grau igual a 34,
mas nas edies isoladas esta medida esteve dentro da mdia
das redes; e o vrtice 186 que apresentou na rede cumulativa
centralidade de grau alta tendo participado apenas de metade
das edies, e, como j citado anteriormente, participou por
quatro instituies diferentes, todas elas de baixa expressividade
nos eventos quanto s medidas analisadas.
Para a medida de intermediao Cb(vi), temos na rede
cumulativa alguns dos autores que se destacaram tambm
quanto coautoria entre as edies do evento e em quantidade
de participaes. Os autores representados pelos vrtices 234,
136, 237, 11 e 186 aparecem nesta ordem com os valores mais
expressivos para a centralidade de intermediao, comprovando
a influncia que estes possuem na rede de coautoria do SBSC.
Entre estes autores, temos um representante da USP com o grau
mais elevado e em segundo, um representante da UNIRIO.

Observando-se a tabela, podemos notar que, apesar da


densidade da rede cumulativa ter sido relativamente baixa, no
geral a densidade entre os eventos manteve-se num valor
mediano, 0,05. O grau de incluso I se mostra alto entre as
edies do evento. Apenas 2004 e 2010 tiveram um valor
relativamente menor. 2010 foi a edio que teve o maior
nmero de artigos, porm, deteve ndices menores relacionados
coautoria. J 2004 foi a edio que teve o menor nmero de
artigos publicados e ainda assim teve um grau de incluso maior
que 2010. Tal observao nos mostra que o volume de artigos
publicados em um determinado evento nem sempre pode servir
como nica mtrica para avaliar o grau de colaborao em uma
comunidade acadmica.

Analisando a medida de centralidade de proximidade Cc(vi),


avaliamos os vrtices que possuem grau mximo. So 117 ao
todo. Os autores que se destacaram para o grau de centralidade
na rede cumulativa tiveram a centralidade de proximidade
baixa. Seu papel de intermediao reduz as distncias dos
outros vrtices, fazendo reduzir o grau de proximidade.

O autor que mais publicou, considerando-se todas as edies,


tambm o mesmo que manteve a maior centralidade de grau
Cd(v) em todos os eventos em que participou como autor.
representado pelo vrtice 234 e Marco Aurlio Gerosa que
faz parte da instituio USP. Possui tambm a maior
centralidade de grau na rede cumulativa, sendo o valor deste
grau igual a 73, como j citado. Este autor publicou nas edies
de 2004 a 2007 e 2010 a 2013, sempre com papel de relevncia
no grau de centralidade Cd(v) e na quantidade destas
publicaes. Alm disso, o mesmo faz parte do maior
componente conexo da rede cumulativa, onde possui ligao
direta com 15% dos autores da rede. O segundo autor com
maior centralidade de grau Cd(v) na rede cumulativa participa
nas edies de 2004 a 2012 com destaque para a medida de
centralidade de grau e quantidade de artigos dos quais participa
e Hugo Fuks, representado pelo vrtice 158. Ele faz parte da
PUC-RJ. Os autores mencionados mostraram relevncia
constante na maioria das edies. Vemos tambm que a maioria
dos autores com grau de centralidade elevada na rede
cumulativa faz parceria sempre com os mesmos autores e
instituies. Geralmente, quando os autores mudam de
instituio fazendo parceria com outras devido ao fato de
deixarem de ser parte do corpo discente de uma instituio para
fazer parte do corpo docente de outra, como j identificado em
trabalho anterior sobre o SBSC [6]. Mas h excees. Uma
delas o autor representado pelo vrtice 186 (Jos Maria
David Nazar). Este autor publicou em seis edies do SBSC.
Na rede cumulativa obteve centralidade de grau igual a 30, o
quarto maior valor. Ao observar por quais instituies este autor
esteve vinculado, vemos que ele colaborou com quatro
instituies diferentes, fazendo parceria com diversos autores na
rede em edies distintas.

interessante notar que o uso de mtricas distintas, muitas


vezes conduz a diferentes autores. Isto refora a necessidade de
usar mais de uma mtrica para avaliar a relevncia dos autores
em redes de coautoria.

3.2

Rede de Instituies

A rede (acumulada) de instituies das dez edies do SBSC


estudada no presente trabalho composta por 83 instituies e
365 arestas colaborando em 231 artigos. O grfico desta rede
acumulada est representado na figura 4 a seguir com destaque
para as instituies que possuem a maior (em vermelho) e a
segunda maior (em verde) centralidade de grau. O peso das
arestas no est representado nesta figura, mas est sendo
considerado em todas as anlises.

23

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

6%
20%
4%
36%

19%
Figura 5: Distribuio da participao de instituies por
regio
H algumas instituies estrangeiras na rede, principalmente de
Portugal e outras instituies para as quais no foi possvel
determinar a regio, por existirem em mais de uma regio e no
termos conseguido a identificao do local estas instituies
representam 15% do total. Apesar da predominncia das
instituies do Sudeste em relao quantidade de
participantes, as instituies do Nordeste e do Sul do Brasil
apresentam papel de relevncia em diversas medidas para vrias
edies estudadas.
No SBSC de 2004 a 2013, 57% das instituies participantes
so pblicas e h poucas instituies comerciais, sendo os
participantes do evento majoritariamente pertencentes a
instituies de ensino.

Figura 4: Grafo cumulativo da rede acumulada de instituies


do SBSC com os vrtices de maior centralidade de grau
destacados (USP em vermelho e PUC-RJ em verde)
Nesta rede acumulada, em um total de 6 componentes conexos,
o grau de incluso I foi de 86,7%, com 11 instituies
publicando isoladamente. O maior componente conexo da rede
tem 58 vrtices, ou seja, praticamente 70% das instituies
esto relacionadas direta ou indiretamente no mesmo subgrafo.
O segundo maior componente tem apenas 6 vrtices,
representando apenas 7% do total de instituies. Das dez
instituies de maior centralidade de grau, todas so do maior
componente. A densidade D(G) da rede de 0,1, demonstrando
que a relao entre as instituies intensa. Podemos
depreender tambm, baseados na organizao do grafo e no
valor de densidade do mesmo, que a maior parte das instituies
possui parceria entre si dentro do mesmo grupo, direta ou
indiretamente.

Para as principais medidas aplicadas, seguem os valores para


cada edio estudada do SBSC, na Tabela 2.
Tabela 2: Medidas para as instituies nas edies do SBSC
estudadas

O maior grau de centralidade Cd(v) da rede de 91 e o grau


mdio da rede de 8,7. H 18 instituies na rede acumulada
que esto acima do grau mdio.

Em cada uma das edies estudadas a quantidade de instituies


participantes variou em no mximo 30%, ou seja,
aparentemente h uma constncia no nmero de participantes.
Tambm percebemos que apesar da edio de 2010 apresentar a
segunda maior quantidade de instituies participando do
evento foi aquela onde a Incluso e Densidade foram as
menores de todas as edies analisadas, repetindo a tendncia
da rede de autores para esta edio.

Observando o grafo cumulativo da rede de instituies podemos


notar a presena predominante das instituies do Sudeste
brasileiro somando 30 instituies, o que representa 36% da
rede. Segue-se aps, a regio Nordeste, com praticamente
metade do nmero de instituies da primeira regio (17
instituies). A regio Sul apresenta participao prxima da
regio Nordeste com 16 instituies, mas comparando o
tamanho destas duas regies, a participao da regio Sul
mais macia. As regies Norte e Centro-Oeste tem participao
baixa na rede. Na figura 5 a seguir, temos a distribuio da
participao em publicaes das regies brasileiras nesta
comunidade.

A regio onde o evento ocorre no tem tanta influncia no


nmero de instituies participantes na publicao de artigos.
As nicas instituies que participaram de todos os eventos
foram a UNIRIO e a PUC-RJ. Aproximadamente 50% das
instituies participaram de somente um evento.

24

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

A USP apresenta o maior grau de centralidade Cd(v) na rede


acumulada (91), seguida da PUC-RJ com 82. interessante
notar que temos uma instituio pblica e outra privada entre as
de maior grau. Entre as dez instituies com maior centralidade
na rede, o Nordeste tem cinco instituies representantes contra
quatro do Sudeste, uma do Sul e outra do Norte (UFAM),
demonstrando que no somente nas edies isoladas do evento
como tambm na rede acumulada, o Nordeste est presente com
relevncia. Importante tambm notar o destaque da UFAM
como representante da regio Norte entre as instituies de
destaque nesta medida uma vez que a regio Norte a segunda
regio do Brasil com menor quantidade de instituies presentes
ao evento. Vemos instituies mais jovens como a UNIRIO j
aparecendo nesta lista (em quinto lugar), o que representa o
esforo e dedicao para o desenvolvimento e aprimoramento
de pesquisas na instituio. Mas vemos que, para praticamente
todas as instituies, este papel de destaque no grau de
centralidade e/ou a intensidade deste grau no se repete nas
edies seguintes. Aqui j reparamos que o local do evento
influencia um pouco esta condio. Por exemplo, em 2009 o
evento foi realizado em Fortaleza/CE e vemos que duas
instituies do Nordeste (CESAR e UFPE) tm destaque nesta
edio. Em 2011, o evento foi em Parati/RJ e temos trs
instituies do Rio de Janeiro (UFRJ, PUC-RJ e JBRJ) com
destaque na edio. No entanto, encontramos excees. A
UFAM (Universidade Federal do Amazonas) que aparece com
destaque em 2008 e 2010, ainda que tmido, no aparece em
2013 com destaque, justamente o ano em que o evento
realizado em Manaus. Todas as instituies com destaque nesta
medida so instituies de ensino sendo 60% pblicas,
observando-se um relativo equilbrio entre instituies pblicas
e privadas para este grau.

ainda que, como as duas comunidades apresentam uma


proximidade considervel, seria interessante identificar as
semelhanas e as diferenas entre as mesmas, com respeito aos
simpsios realizados at aqui.
Para a rede de autores, uma das caractersticas que se mostrou
similar nas duas redes foi o grau de incluso (parceria entre
autores), sempre acima de 80%, e na maioria, prximo a 100%.
Para a medida de grau de centralidade Cd(v) e intermediao
Cb(vi) percebemos o mesmo comportamento onde com os
passar dos anos estas medidas vm aumentando
significativamente. J a densidade das duas redes mostra um
comportamento de valores relativamente baixos e sem alterao
expressiva entre as comunidades.
Como caractersticas contrastantes, vemos que na comunidade
do SBSC os autores que mais se destacam mantm este
comportamento durante todas as edies do evento,
solidificando seus papis de centralizao e hubs de
informao. J no SBSI este comportamento no foi observado,
tendo autores diferentes se destacado em cada edio.
Outra caracterstica que difere que apesar da quantidade de
autores no SBSC ser menor que no SBSI e as duas comunidades
terem uma densidade relativamente baixa, o SBSC uma rede
mais densa que a segunda, mostrando que existe uma mdia
maior de relaes entre autores, mesmo tendo uma
representao menor quantitativamente.
Para a rede de instituies, o SBSI apresenta mais
instituies participantes do que o SBSC da mesma forma
que a rede autores. Para a quantidade de artigos publicados,
o mesmo ocorre apesar da edio de 2010 do SBSC
apresentar uma quantidade de artigos jamais encontrada no
SBSI para as edies que temos ndices disponveis.
Entretanto, a incluso na comunidade do SBSC superior
do SBSI em praticamente todos os anos analisados. Ainda
em relao incluso, h instituies que se comportam de
maneira diferente nas duas comunidades, com maior
relevncia em uma do que em outra. Como exemplo,
aparentemente a PUC-RJ tem presena e relevncia mais
marcantes no SBSC do que no SBSI. Mas h semelhanas
tambm. A UFRJ, por exemplo, geralmente publica em
parceria no SBSC e no SBSI, e reparamos que na edio em
que ela publicou isoladamente em 2010 para o SBSC,
procedeu da mesma forma para o SBSI.

A USP, a PUC-RJ e a UFRJ so as protagonistas da


intermediao da rede. J para a disseminao de informao
dentro do componente do qual fazem parte, a UNIRIO e a
PUC-RS lideram a lista. Percebemos tambm a presena de
instituies com um grau de centralidade menor como a PUCRS, mas que possuem um papel de intermediao importante
nos grafos e subgrafos em que atuam.
Podemos sugerir que a distribuio das regies em relao
publicao nos eventos do SBSC seja um reflexo da
distribuio econmica do prprio pas, e, consequentemente,
da ainda alta concentrao de universidades na regio sudeste.
Acreditamos que polticas pblicas como a expanso das UFs,
bem como parcerias entre as instituies de destaque no SBSC
com o objetivo de promover maior participao das instituies
j existentes nas regies que apresentam menor destaque nas
redes de colaborao, venham a auxiliar o desenvolvimento da
comunidade brasileira de pesquisadores da rea como um todo,
fortalecendo assim o estado da arte em linhas de pesquisa que
tangem o tema Sistemas Colaborativos.

Com relao ao tipo de instituio, tanto o SBSC quanto o


SBSI apresentam majoritariamente instituies do Sudeste
embora o SBSI aparente ter um equilbrio maior neste
aspecto.
Nas duas comunidades h predominncia de instituies
pblicas de ensino. Entretanto o SBSI apresenta um maior
nmero de instituies comerciais do que o SBSC.
Para a anlise comparativa entre o SBSC e o SBSI em relao
ao grau de centralidade da rede acumulada, verificamos as cinco
instituies de maior grau nas duas comunidades. As Tabela 3 e
4 contm estes valores.

4. ANLISE COMPARATIVA ENTRE AS


REDES SBSC E SBSI
Este tpico destina-se a fazer um estudo comparativo entre as
redes de autores e instituies do SBSC analisadas no presente
trabalho e as mesmas redes do SBSI analisadas em [5], visando
ajudar a verificar se h um padro de comportamento nestas
duas redes da rea de tecnologia.
As redes do SBSI foram escolhidas para estudo comparativo
devido existncia de um trabalho similar para a rea de
Sistemas de Informao [5]. Alm disso, ambos, SBSC e SBSI
apresentam um retrospecto bastante parecido em termos de
periodicidade e quantidade de eventos realizados. Observamos

25

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

5. CONCLUSO

Tabela 3: Grau de Centralidade SBSC

Este trabalho teve como proposta a anlise da colaborao na


comunidade de sistemas de informao do Brasil. Para isso,
apresentamos as redes de coautoria para autores e instituies
correspondentes s edies do Simpsio Brasileiro de Sistemas
Colaborativos (SBSC) de 2004 a 2013, com o objetivo de
prover uma viso analtica de como os atores nesta comunidade
interagem entre si. Para este estudo, utilizamos as mtricas
clssicas de anlise de redes.
Percebemos que para a rede de autores, quase a totalidade
publica em parceria. O valor da densidade dentro da rede no
se mostrou alto, o que normal neste tipo de rede. Notamos
tambm que h uma constncia dos atores de destaque em
relao participao nas edies do evento estudadas. O
mesmo ocorre quanto intermediao nas edies. No geral, h
uma participao at certo ponto homognea de
docentes/pesquisadores de universidades e do corpo discente.
Porm, os papis de destaque nas redes so majoritariamente de
membros do corpo docente/pesquisadores. O corpo discente que
participa dos eventos em geral de alunos de ps-graduao.
Caractersticas quanto ao comportamento do grau de
centralidade, incluso e densidade se mostram padro entre as
comunidades SBSC e SBSI enquanto caractersticas quanto
constncia de autores nestas medidas diferem entre as duas. Isso
pode sugerir que alguns comportamentos podem ser tidos como
um padro para redes de coautoria.

Tabela 4: Grau de Centralidade SBSI

Para as instituies, no SBSC vimos uma predominncia da


regio Sudeste do Brasil tanto na participao dos eventos
quanto no papel de destaque para a centralidade de grau e na
intermediao entre instituies. O total de instituies desta
regio que participam das diversas edies do evento chega a
quase 36%. Depois, aparece a regio Nordeste, seguida da
regio Sul, que apesar de contriburem com um nmero menor
de instituies nos eventos, aparecem com representao de
destaque em todos em pelo menos uma das medidas estudadas.
Por ltimo, temos a regio Norte, seguida da regio CentroOeste, que apresentam participao pequena nos eventos,
embora tenham conseguido se destacar em algumas edies.
Possivelmente, caso sejam implementadas eficientemente ao
longo dos anos, polticas pblicas como o REUNI, que tem
entre os seus objetivos ampliar o alcance da educao superior
no Brasil, possam vir a modificar este quadro futuramente, de
modo que a diferena na distribuio da participao das
instituies nos eventos se torne menos acentuada.

Atravs do grau de centralidade, percebemos que a regio


Sudeste se sobressai mais no SBSC do que no SBSI. Este
ltimo contm somente a UFRJ como representante do Sudeste
entre os mais altos graus de centralidade. A UFRJ est presente
nas duas listas sendo que possui graus de valor ligeiramente
diferente nas duas comunidades. No SBSI, a regio Sul
apresenta maior papel de relevncia.
Percebemos, entretanto, que os graus de centralidade da rede
acumulada do SBSC so mais elevados que os do SBSI.
Podemos denotar atravs destes dados que as instituies do
SBSC apresentam uma intensidade maior em suas relaes,
com diversas arestas envolvendo seus atores de maior destaque.
A diferena na incluso das duas redes tambm pode ter um
papel decisrio nestes valores discrepantes.
Na lista do SBSI aparece uma instituio sem fins lucrativos, a
LSITEC, entre as de maior grau na rede. Ainda que esta
instituio esteja ligada USP, ela possui objetivos diferentes
das outras instituies que aparecem no topo do grau de
centralidade, por oferecer servios a empresas privadas
utilizando instituies cientficas.

A instituio com o maior grau de centralidade na rede


cumulativa foi a USP com grau 91 e a segunda foi a PUC-RJ
com 82. Em relao ao grau de intermediao, temos tambm
em primeiro lugar a USP e em segundo lugar a UFRJ. No geral,
observamos que a intensidade de participaes maior para as
instituies pblicas, mas temos algumas instituies privadas
com um papel decisivo na rede em algumas edies. As redes
do SBSC so formadas majoritariamente de instituies de
ensino embora haja participao em algumas edies, de
instituies comerciais como a IBM Brasil, que em alguns
eventos teve um papel de relevncia na rede onde atuou. No
geral, houve constncia na participao das instituies embora
os atores de destaque variassem um pouco entre as edies do
SBSC. Comparando-se as comunidades do SBSC e do SBSI,
esta ltima possui uma participao mais homognea das
diversas regies do Brasil e maior relevncia nas medidas
estudadas para a regio Sul. O SBSI apresenta tambm, maior
participao de instituies comerciais que o SBSC.

Na comparao entre o SBSC e o SBSI em relao ao grau de


intermediao, os valores so mais altos para a rede cumulativa
do SBSC do que para a do SBSI. Para o SBSI, todos os
integrantes da lista so do Sul do Brasil, com exceo da UFRJ.
E esta instituio a nica presente na lista dos dois eventos,
confirmando que seu papel de intermediadora e difusora de
informao, no se restringe a uma nica comunidade. O SBSC
parece contar com maior presena e relevncia de instituies
que contm cursos tecnolgicos mais jovens como a UNIRIO.
Para esta medida, todos os papis de relevncia nas duas redes
so ocupados por instituies de ensino, pblicas e privadas,
mostrando o papel da educao como disseminadora de
tecnologia.

Em relao s medidas utilizadas, notamos que o grau de


proximidade se mostrou mais eficaz para a anlise das redes de
instituies, onde temos um nmero menor de componentes do
que para a anlise das redes de autores.

26

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Durante a elaborao deste trabalho, vislumbramos propostas de


continuidade desta pesquisa como: aprofundar o estudo das
redes do SBSC, incluindo o estudo de corte de vrtices para esta
comunidade de forma a identificar as consequncias da retirada
de autores chaves dos grafos; continuar acompanhando a
evoluo do SBSC, do ponto de vista da colaborao entre
autores, entre instituies e entre regies do pas, fazer um
estudo comparativo das redes do SBSC com as redes
subjacentes aos eventos anuais correlatos que ocorrem em
outros pases.

REFERNCIAS BIBLIOGRFICAS
[1] T.A. Guimares, A.O. Gomes, C.C. Odelius, C. Zancan, e
A.A. Corradi. A rede de programas de ps-graduao em
Administrao no Brasil: anlise de relaes acadmicas e
atributos de programas. Revista de Administrao
Contempornea, 13(4):564-582, 2009.
[2] M.E.J. Newman. Who is the best connected scientist? A
study of scientific coauthorship networks. Lecture Notes in
Physics, 650:337370, 2004.
[3] A.M. Pinto, R.R. Grangeiro, F.D. Vinhas, e T.H.
Andrade. Redes de Colaborao Cientfica: Uma Anlise
das Publicaes do Encontro Nacional de Pesquisadores em
Gesto Social. IV Simpsio Nacional de Pesquisadores em
Gesto Social, 4:163-180, 2013.
[4] A.K.A. Silva, R.R. Barbosa, e E.N. Duarte. Rede Social de
Coautoria em Cincia da Informao: estudo sobre a rea
temtica de Organizao e Representao do
Conhecimento. Inf. & Soc.:Est., 22(2):63-79, 2012.
[5] E. Artmann, V.M.F. Dias. Redes sociais do SBSI e o corte
de vrtices como base para identicar atores importantes na
coeso de grupos de pesquisa. VIII Simpsio Brasileiro de
Sistemas de Informao, 1:174-185, 2012.
[6] M.A. Gerosa, I. Steinmacher, M.A.G. Silva, F.R. Cgo, A.P.
Chaves. Tpicos de pesquisa e rede de coautoria no
Simpsio Brasileiro de Sistemas Colaborativos. X Simpsio
Brasileiro de Sistemas Colaborativos, Manaus, 2013.
[7] A. Balestrin, J.R. Vershoore, E. Reyes Junior, O Campo de
Estudo sobre Redes de Cooperao Interorganizacional no
Brasil. Revista de Administrao Contempornea,
14(3):458-477, 2010.
[8] D. B. West. Introduction to Graph Theory. Prentice Hall,
Upper Saddle River-NJ, 1996.
[9] S. Wasserman, K. Faust. Social Network Analysis: Methods
and Applications (Structural Analysis in the Social
Sciences). Cambridge University Press, 1999.
[10] M.E.J. Newman. The mathematics of networks. Technical
Report University of Michigan, 2008.
[11] M.E.J. Newman. The structure of scientific collaboration
networks. Proc. Natl. Acad. Sci.USA, 98:404409, 2001.

27

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Prototipao de Sistemas Colaborativos Mveis com Base


na Arquitetura de Referncia CReAMA: Um Estudo de
Caso da Plataforma Conecte Ideias
Maison Melotti, Roberta Lima Gomes, Victor
Raft Oliveira Nunes

Marco Aurlio Gerosa


Universidade de So Paulo (USP)
Rua do Mato, 1010 - Cidade Universitria. So Paulo,
SP.

Universidade Federal Do Esprito Santo (UFES)


Av. Fernando Ferrari, 514. CT IX. LPRM. Vitria, ES.

{maisonmelotti, victoraft}@gmail.com,
rgomes@inf.ufes.br

gerosa@ime.usp.br
decorrer de atividades colaborativas podem ocorrer problemas
indesejados devido frequente interrupo do canal de
comunicao [22]. A limitao nos recursos computacionais de
dispositivos mveis pode atrapalhar operaes j iniciadas,
devido, por exemplo, necessidade de mais dados que ainda no
foram totalmente transferidos para o dispositivo.

ABSTRACT
Developers of mobile collaborative systems deal with many
technical issues, in addition to the usual difficulties for
collaborative systems development. In this paper, we evaluate
CReAMA, a reference architecture defined to guide the
development of component-based mobile collaborative systems,
by means of its use in the development of two mobile clients of a
collaborative application.

Novos paradigmas de colaborao precisam ser desenvolvidos


para levar em conta fatores como a disponibilidade do usurio, a
variabilidade em recursos dos dispositivos e a conectividade de
rede no confivel em ambientes de computao mvel [23].
Outro problema est relacionado durao do perodo em que um
usurio mvel permanece conectado. Essa durao depende de
vrios fatores, como tempo de vida limitado da bateria, largura de
banda instvel das redes sem fio ou usurios em locomoo. Tudo
isso pode resultar em longos atrasos ou longos perodos de
interrupo para as atividades colaborativas de usurios de
dispositivos mveis [22].

Categories and Subject Descriptors


H.5.3 [Information Interfaces and Presentation]: Group and
Organization Interfaces Computer-supported cooperative work.

General Terms
Design.

Keywords
CSCW, Mobile Collaboration, Reference Architecture.

A mobilidade traz, portanto, novas dificuldades. Essas


dificuldades so causadas em parte por requisitos mal elicitados e
falta de experincia de programadores em relao a esse tipo de
sistema [21]. Processos de colaborao mvel no tm sido
estudados extensivamente e difcil para desenvolvedores de
software analisar e modelar esse tipo de trabalho. Mtodos de
anlise de software tradicionais no consideram vrios aspectos
importantes de colaborao mvel [21]. Questes como a
mobilidade dos colaboradores, as diversas tecnologias disponveis
para apoiar a mobilidade (Wi-fi, WiMax, Bluetooth, etc.) e a
mudana contnua nos cenrios de colaborao trazem novos
desafios para o desenvolvimento desses sistemas [19].

1. INTRODUO
Vem ocorrendo uma mudana nos modelos de interao entre as
pessoas, dando origem aos sistemas colaborativos mveis [12]. As
aplicaes mveis atuais esto se tornando uma parte importante
das ferramentas de suporte colaborao [13]. De acordo com
Papadopoulos [30], esses sistemas possibilitam, por exemplo, que
equipes cooperem enquanto esto em movimento.
importante ressaltar que o desenvolvimento de sistemas
colaborativos intrinsecamente complexo. Sistemas colaborativos
so difceis de serem projetados e implementados visto que
apresentam os desafios da rea de sistemas distribudos somados
aos problemas de sistemas multiusurios [16]. De acordo com
Gerosa e Fuks [15], a rea de sistemas colaborativos altamente
interdisciplinar e os processos de negcio que definem a dinmica
do grupo de trabalho so difceis de modelar e apoiar.

Torna-se importante, portanto, prover suporte ao desenvolvimento


de sistemas colaborativos mveis por meio de um conjunto de
ferramentas ou mtodos que apoiem o desenvolvedor na criao
desses sistemas. No contexto de sistemas colaborativos em geral,
diferentes solues so encontradas. Por exemplo, para o
desenvolvimento de aplicaes colaborativas na Web 2.0, foi
proposto o Groupware Workbench (GW) [18], que fornece um
ferramental baseado em componentes para encapsular as
complexidades tcnicas envolvidas no desenvolvimento de
sistemas colaborativos. Porm, no contexto de sistemas
colaborativos mveis, ainda falta arquiteturas ou plataformas para
auxiliar seus desenvolvedores. So encontrados na literatura
poucos trabalhos que propem o uso de ferramentas para o
desenvolvimento desses sistemas, com algumas limitaes, como
apresentado por Byrne [9] e Bendel e Schuster [3].

As oportunidades de colaborar so ampliadas pela computao


mvel [12] e essas oportunidades acarretam muitos desafios para
o desenvolvimento de sistemas colaborativos mveis,
especialmente em termos de compartilhamento e sincronizao de
informao por meio de dispositivos mveis. Por exemplo, no
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

Em trabalho prvio [26], foi definida uma arquitetura de


referncia denominada CReAMA (Component-Based Reference
Architecture for Collaborative Mobile Applications) para
orientar o desenvolvimento de aplicaes colaborativas para

28

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

dispositivos mveis baseadas em componentes. Uma arquitetura


de referncia vista como uma forma de apresentar um padro
genrico para um projeto [38]. Com base na arquitetura, o
desenvolvedor projeta, desenvolve e configura uma aplicao,
prototipando-a por meio de componentes reusveis.

O conjunto de ferramentas proposto pelo WMP centrado no


cliente e possibilita que o desenvolvedor do aplicativo se
concentre na utilizao de funcionalidades j desenvolvidas por
meio dos chamados componentes de desenvolvedor (que so
parte da GUI do sistema) e componentes de suporte, que
fornecem funcionalidade como sincronizao de dados e uso de
protocolos de rede necessrios para a colaborao [3]. Apesar das
diversas funcionalidades oferecidades nesse trabalho, ainda
existem muitas questes em aberto, como o tratamento de
problemas relacionados conectividade e desconectividade do
usurio (consistncia e sincronizao) e falta de suporte a
informaes de rede, bateria e sensores.

Neste trabalho, estendemos a avaliao da arquitetura por meio da


implementao de um prottipo de sistema colaborativo mvel
que utiliza um conjunto de componentes desenvolvidos com base
na arquitetura de referncia.
Este artigo encontra-se estruturado da seguinte forma: a Seo 2
apresenta trabalhos relacionados ao suporte ao desenvolvimento
de sistemas colaborativos mveis; na Seo 3 apresentada a
arquitetura de referncia; na Seo 4 discutida a implementao,
assim como a avaliao da proposta por meio de um estudo de
caso; na Seo 5 so mostrados os resultados obtidos neste
trabalho; e a Seo 6 apresenta concluses e trabalhos futuros.

No que diz respeito ao suporte metodolgico, destaca-se o


trabalho de Herskovic et. al. [21], em que apresentado um
framework que especifica uma lista de requisitos gerais a serem
considerados durante a concepo e projeto de um sistema de
colaborao mvel a fim de aumentar a sua probabilidade de
sucesso. O framework foi obtido com base em um levantamento
de pesquisas relacionadas, bem como das experincias dos autores
em desenvolvimento de sistemas colaborativos mveis [21].

2. TRABALHOS RELACIONADOS
O suporte ao desenvolvimento de sistemas ou aplicaes
colaborativas mveis geralmente encontrado sob duas formas:
tecnolgica (plataformas, toolkits, etc.) e metodolgica (mtodos,
modelos de referncia, organizao ou agrupamento de requisitos,
etc.) [26]. Nesta seo, os trabalhos relacionados encontrados na
literatura so apresentados seguindo essa distino.

A literatura oferece muitas perspectivas sobre os aspectos


importantes a serem considerados no desenvolvimento de
sistemas colaborativos mveis. Porm, de acordo com Herskovic
et. al. [21], a maioria desses estudos est focada em uma rea
especfica de aplicao e no considera o impacto dos requisitos
gerais sobre o sucesso do projeto de desenvolvimento, nem como
relacionar os requisitos com a maneira como o trabalho mvel
ocorre. A ideia principal no trabalho apresentado fornecer uma
viso mais abrangente das necessidades tpicas de colaborao
mvel e as relaes entre elas.

Dentre as solues tecnolgicas, algumas plataformas foram


propostas para o desenvolvimento de sistemas colaborativos
mveis. A plataforma MUSE, realizada por Byrne [9], fornece um
sistema confivel para a criao de aplicaes de aprendizagem
colaborativa. A plataforma contm trs componentes principais: o
servidor de aplicao MUSE, um conjunto de servios de
infraestrutura e o middleware MUSE. Como definido pelos
autores, MUSE uma plataforma MCSCL (Mobile Computer
Supported Collaborative Learning) para aplicaes multimdia
que aborda as consideraes tcnicas de aplicaes colaborativas
mveis e pedaggicas da aprendizagem colaborativa. MUSE
utiliza um modelo de arquitetura orientada a servios para facilitar
a reutilizao de componentes fracamente acoplados,
possibilitando assim o desenvolvimento de aplicaes flexveis e
reconfigurveis, adequados a esse ambiente heterogneo [9].

Ainda em relao ao suporte metodolgico, o trabalho


apresentado por Berkenbrock et al. [4] exploram requisitos
especficos no que diz respeito a interfaces grficas no projeto de
sistemas colaborativos mveis. Esse trabalho tambm apresenta
tcnicas e abordagens para a construo e verificao de
requisitos para interfaces grficas.
Os trabalhos de Neyem et al. [28] e Herskovc et al. [20]
apresentam diferentes tipos de suporte metodolgico para
workspaces mveis e compartilhados. O primeiro prope um
processo de desenvolvimento e vrias instrues baseadas em
reviso de literatura e experincia dos autores para o
desenvolvimento desses sistemas. O segundo apresenta um
framework com requisitos gerais que normalmente esto presentes
nesses sistemas.

MUSE se concentra na produo de narrativa digital, e fornece


um conjunto de servios genricos para serem utilizados por
desenvolvedores. Uma das contribuies alcanadas desse
trabalho um conjunto de requisitos funcionais para plataformas
MCSCL. Assim, desenvolvedores de aplicaes para
aprendizagem colaborativa podem se apoiar nesses requisitos para
criar novas aplicaes ou plataformas melhoradas. Um ponto
importante que apesar do autor realizar uma ampla busca na
literatura relacionada colaborao mvel e ter encontrado
requisitos genricos para aplicaes colaborativas mveis, o foco
do trabalho est apenas na aprendizagem colaborativa por meio de
narrativa digital. A plataforma no busca cumprir todos os
requisitos genricos encontrados.

Trabalhos como [6], [20] e [28] tambm exploram alguns


requisitos genricos para colaborao mvel, assim como
apresentam requisitos de domnios e cenrios especficos. Esses
trabalhos foram utilizados na definio da arquitetura de
referncia, porm, o framework apresentado por Herskovic et. al.
[21] surge como base para a organizao desses requisitos, devido
viso mais abrangente para sistemas colaborativos mveis que
esse trabalho apresenta.

No trabalho de Bendel e Schuster [3] proposto um toolkit


denominado WatchMyPhone (WMP) para facilitar a construo
de aplicaes colaborativas. Esse toolkit de desenvolvedor
focado na criao de aplicaes de colaborao em dispositivos
mveis, especialmente em aplicaes de compartilhamento de
interface grfica de usurio (GUI), como visualizadores de texto
em um ambiente multiusurio. fornecido um conjunto de
ferramentas, bem como uma aplicao de demonstrao para
edio de texto compartilhado baseada em Android [3].

3. CREAMA: A COMPONENT-BASED
REFERENCE ARCHITECTURE FOR
MOBILE APPLICATIONS
CReAMA tem como principal objetivo orientar o
desenvolvimento de sistemas colaborativos mveis baseados em
componentes. Sistemas desenvolvidos de acordo com essa
arquitetura devem dar suporte ao desenvolvimento de

29

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

componentes, e criao de aplicaes colaborativas por meio da


composio desses componentes. As aplicaes e componentes
so desenvolvidos para plataformas mveis, facilitando o uso de
recursos inerentes a essas plataformas, tais como informaes de
sensores embarcados [26].

iii. Autonomia [4], [6], [28], [31]: Deve ser possvel que a
aplicao funcione autonomamente para considerar mudanas no
contexto do aparelho e ambiente. Por exemplo, a aplicao deve
perceber quando a bateria estiver acabando, com o intuito de
economiz-la para tarefas essenciais.

importante ressaltar que a arquitetura foi definida considerando:


aspectos da plataforma mvel, de sistemas colaborativos, e da
prpria orientao a componente. Com relao plataforma
mvel, neste trabalho optou-se por uma plataforma especfica,
visando-se a definio de uma arquitetura otimizada para as
caractersticas da respectiva plataforma. A plataforma escolhida
foi o Android, visto que se trata de uma plataforma de cdigo
aberto que vem sendo adotada por uma quantidade crescente de
usurios e desenvolvedores em todo o mundo [35].

(C) PROTEO
i. Sesses de trabalho [20], [21], [28]: A interao entre os
usurios mveis deve ser protegida de modo a evitar a
participao no autorizada no grupo e invalidar o acesso a
recursos compartilhados entre eles.
ii. Privacidade do usurio [20], [21]: Cada usurio deve ser capaz
de escolher quais dados compartilhar e, algumas aes a serem
realizadas em particular.

A arquitetura prov suporte ao desenvolvimento de novos


sistemas baseados em componentes, considerando tambm
aspectos relativos comunicao com a Web (persistncia,
sincronizao e disponibilidade de dados a partir de um servio)
[26]. Nas prximas subsees so descritos os requisitos
considerados na definio da arquitetura e a origem desses
requisitos.

(D) COMUNICAO
i. Mensagens sncronas [20], [21]: Quando dois usurios
estiverem disponveis simultaneamente e acessveis, eles devem
ser capazes de trocar mensagens.

iii. Segurana [20], [21], [28]: O trabalho de cada usurio deve ser
protegido para que ningum possa destruir o trabalho de outro.

ii. Mensagens assncronas [20], [21]: Quando dois usurios


trabalham em diferentes momentos, o sistema deve permitir-lhes
enviar mensagens que eles recebem quando entrarem online.

3.1 Definio de Requisitos


A definio da arquitetura foi realizada em grande parte com base
em um conjunto de requisitos definidos na literatura e
apresentados em diversos trabalhos. Visto que se trata de uma
arquitetura de referncia para orientar o desenvolvimento de
sistemas colaborativos mveis baseados em componentes, os
requisitos foram organizados de acordo com os dois principais
aspectos contemplados pela arquitetura: requisitos de colaborao
mvel e requisitos de desenvolvimento baseado em componentes
[26].

iii. Transferncia de arquivos [20], [21]: Membros de um


determinado grupo de trabalho mantm, localmente, os recursos
que so relevantes para a realizao de suas tarefas e em
determinados momentos pode ser necessrio compartilhar esses
arquivos com outros usurios.
iv. Notificaes [4], [6]: As mensagens so entregues aos usurios
mveis no momento em que se conectam ao servidor/servio.
Normalmente, uma janela pop-up exibida na interface do
usurio para mostrar as mensagens pendentes.

3.1.1 Colaborao Mvel

(E) HETEROGENEIDADE
i. Heterogeneidade [20], [21]: Colaborao pode envolver
dispositivos heterogneos, tais como laptops, smartphones e
tablets. Esses dispositivos tm recursos de hardware e capacidades
diferentes de computao.

Os requisitos de sistemas colaborativos mveis levantados com


base na literatura podem ser agrupados nas seguintes categorias:
autonomia (usurio e aplicao), proteo, comunicao,
heterogeneidade, awareness, suporte, hardware e interface com
usurio [26]. Esses requisitos foram obtidos por meio de uma
extensa busca por trabalhos na rea, e so apresentados abaixo:

ii. Interoperabilidade[20], [21]: deve ser possvel que o sistema


entenda o significado de dados e servios, mesmo que esses
recursos sejam projetados por vrios provedores.

(A) AUTONOMIA DE USURIO


i. Deteco automtica de usurio [4], [6], [20], [21], [28]: a
aplicao tem que coletar automaticamente e armazenar
informaes relacionadas disponibilidade dos usurios. Com
base nessas informaes de contexto, o sistema colaborativo pode
possibilitar o inicio de atividades colaborativas sob demanda.

(F) AWARENESS
i. Percepo online [4], [6], [20], [21], [28]: Exemplos de
percepo online so listas de usurios conectados, locais de
usurios, e atividade atuais desenvolvidas por usurios.

ii. Colaborao sob demanda [20], [21], [28], [29], [31]: As


aplicaes devem possibilitar aos participantes trabalharem
desconectados na maioria do tempo e, se for o desejado, mudar
para o uso online sob demanda.

ii. Percepo offline [4], [6], [20], [21]: Exemplos: ltima


modificao feita em um documento, autoria de texto.
iii. Percepo de transio [4], [6], [21]: Conscientizao sobre as
transies entre conexo e desconexo, ou a percepo de entrega
de mensagens.

(B) AUTONOMIA DE APLICAO


i. Variao do contexto [28]: Alguns atributos, como a internet,
acesso a servidores, indisponibilidade de servio de GPS, etc.,
mudaro de um lugar para outro. A aplicao deve considerar
automaticamente essas mudanas de contexto, a fim de
proporcionar um apoio eficaz para a colaborao.

(G) SUPORTE
i. Caching [5], [21]: Quando os usurios colaboram, os dados
compartilhados devem ser automaticamente salvos na aplicao
cliente, a fim de fornecer a cada usurio as informaes mais
atualizadas para trabalhar de forma autnoma (offline) quando
necessrio.

ii. Descoberta de servio e dispositivo [21]: Servios disponveis e


dispositivos (como telas pblicas, Smartboards, envio de
arquivos, etc.) devem ser dinamicamente detectados e integrados
no ambiente de colaborao em torno do contexto de trabalho.

ii. Resoluo de conflitos [4], [5], [6], [20], [21], [24], [28]: os
usurios mveis podem atualizar as informaes locais sobre a
aplicao mvel colaborativa quando esto trabalhando offline. O

30

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

sistema deve permitir a correo das inconsistncias nos dados


compartilhados.

colaborativos, como Gerosa [14], Michalsky [27] e Wulf et. al.


[36], e para sistemas colaborativos mveis, como apresentado por
Alaya et. al [1]. Tambm foi considerado o cenrio motivador
descrito em trabalho prvio [26]. Os requisitos levantados foram:

(H) HARDWARE
i. Uso de recursos [4], [6], [28]: devem ser levados em conta os
recursos limitados de hardware, como capacidade de
armazenamento e memria, poder de processamento, tamanho da
tela de entrada de dados e vida til da bateria.

(J) COMPONENTIZAO
i. A instalao de componentes vista em dois nveis diferentes:
(a) instalao de componentes para que desenvolvedores possam
compor aplicaes, e (b) instalao de componentes dentro da
aplicao para que usurios possam utiliz-los. O modelo de
componentes deve dar suporte a ambos.

ii. Limitaes de rede [4], [6]: devem ser consideradas as


limitaes de rede, como as conexes, que podem variar
significativamente (em termos de atraso, largura de banda e taxa
de erro).

ii. A maneira como feita a utilizao dos componentes deve


estar devidamente documentada, escrita de maneira clara,
utilizando diagramas e exemplos para facilitar o entendimento.
Assim, outros desenvolvedores podero usar os componentes para
criar suas prprias aplicaes.

(I) INTERFACE COM O USURIO


i. Scrolling [4]: Devido ao espao limitado na tela em dispositivos
portteis, muitas aplicaes utilizam rolagem (scrolling) como um
mecanismo para acessar informaes que no cabem na tela. No
entanto, a rolagem de tela para cima e para baixo, pode ser
desconfortvel para os usurios. Assim, importante fazer o
desenvolvimento de interfaces evitando-se a rolagem.

iii. Um dos conceitos mais importantes em termos de


componentizao o agrupamento de componentes. Esse
agrupamento pode ser visto de duas maneiras: diferentes
componentes grficos agrupados em uma mesma tela, e o
agrupamento lgico que diz respeito s relaes e dependncias
entre os componentes. A maneira como esses dois tipos de
agrupamento feita deve estar devidamente documentada no
modelo de componentes.

ii. Navegao [4]: pequenas telas podem tornar tarefas bsicas,


como navegao, uma tarefa difcil. Ento, importante definir
uma estrutura de navegao adequada para apresentar melhor as
informaes, Reduzindo o nmero de passos necessrios para
executar uma tarefa para simplificar a navegao.
iii. Capacidade de Gerenciamento [4], [6]: um dos obstculos em
termos de usabilidade a dificuldade de iniciar uma sesso. Ento
preciso simplificar os passos para gerenciar as sesses e permitir
que as tarefas sejam realizadas intuitivamente.

iv. No que diz respeito ao versionamento dos componentes,


considerando que podem coexistir muitos componentes com
diferentes implementaes, preciso controlar as verses e os
nomes dos componentes para evitar conflitos e possibilitar a
substituio dos componentes similares.

3.1.2 Desenvolvimento Baseado em Componentes

v. Em relao customizao dos componentes, deve ser possvel


modificar as configuraes padres dos componentes, como cores
e fontes, por exemplo.

No que diz respeito aos requisitos de desenvolvimento de


software baseado em componentes, alguns deles so muito
importantes para o decorrer do presente trabalho. Esses requisitos
foram obtidos por meio de estudos de trabalhos sobre plataformas
e frameworks orientados a componentes para sistemas

Figura 1. Agrupamento de Componentes.


vi. Os componentes devem estar disponveis por meio de
repositrios para facilitar o acesso rpido aos componentes pelas
equipes de desenvolvimento e de manuteno ao longo do ciclo
de vida do software.

servios. Assim, a arquitetura passa a ser utilizada para orientar


o desenvolvimento do aplicativo mvel em si, abstraindo os
aspectos internos dos servios a serem acessados pelos
aplicativos. Para facilitar o entendimento, a arquitetura foi
dividida em trs partes principais: orientao a componentes,
sensores e infraestrutura [26].

3.2 Modelo Arquitetural


Os trabalhos relacionados mostram uma crescente adoo de
arquiteturas orientadas a servios (Service Oriented Architecture
SOA) para usurios mveis [34]. Com isso, CReAMA foi
concebida visando o desenvolvimento de aplicaes clientes,
considerando um sistema colaborativo que trabalhe orientado a

A Figura 1 apresenta os elementos da arquitetura relacionados


orientao a componentes. Nos diagramas apresentados nesta
seo, as classes definidas pela prpria plataforma Android so
destacadas com um esteretipo (<<Android>>). Vale ressaltar

31

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

definida para gerenciar o acesso dos componentes da aplicao


ao sistema colaborativo via rede.

que a opo por esta plataforma atende parcialmente os


requisitos de Heterogeneidade (requisitos E.i e E.ii), visto que
diferentes plataformas de hardware (entre tablets e smartphones)
adotam essa tecnologia.
Cada tela da aplicao deve ser uma subclasse de CrActivity
enquanto todos os componentes a serem utilizados so
subclasses de CrComponent. Por meio da operao
addCrComponent(), o desenvolvedor decide quais componentes
faro parte de cada tela da aplicao. Com isso, a prototipao
facilitada permitindo que o desenvolvedor monte sua aplicao a
partir de componentes j existentes (requisito J.i). Alm disso,
possvel a realizao de testes em relao interface grfica, at
que seja atingido um nvel satisfatrio, ou seja, a arquitetura
facilita o esforo dos desenvolvedores no atendimento aos
requisitos de Interface com o Usurio, permitindo que os
mesmos construam sistemas com pouco uso de rolagem e de
navegao fcil (requisitos I.i e I.ii).

Figura 3. Organizao da Infraestrutura.


A comunicao com o sistema colaborativo se faz por meio de
chamadas realizadas pelos componentes aos servios do sistema.
Essas chamadas so tratadas como requisies pelo
ConnectionManager. As requisies so atendidas conforme o
escalonamento definido pela RequestQueue. Para cada
requisio criada uma WorkerThread, responsvel por
gerenciar essa requisio. Face s limitaes de rede (requisito
H.ii), um papel importante do ConnectionManager gerenciar a
intermitncia no canal de conexo sem fio, visando garantir que
cada WorkerThread consiga completar sua requisio. Se os
usurios estiverem trabalhando offline, as requisies
permanecem na RequestQueue. Se o usurio estiver online e
quiser colaborar, as requisies na fila so atendidas, permitindo
ao usurio escolher seu nvel de participao nas atividades,
cumprindo o requisito de colaborao sob demanda (requisito
A.ii).

Figura 2. Servio de Sensores.

4. IMPLEMENTAO E AVALIAO
DA PROPOSTA

A Figura 2 apresenta os elementos da arquitetura relacionados


ao acesso a sensores da plataforma. Essa parte da arquitetura foi
definida visando-se cumprir os requisitos relacionados ao uso de
informaes de rede, bateria, localizao, etc. Os componentes
tm acesso aos sensores por meio de um servio local
denominado SensorsService. A definio de um servio local
visa oferecer uma interface comum de acesso aos diferentes
sensores da plataforma. Esse servio principal usado para obter
informaes sobre o prprio dispositivo para que estas possam
ser, por exemplo, exibidas ao usurio ou enviadas via rede aos
servios do sistema colaborativo. Com essas informaes, o
sistema obtm informaes de contexto do usurio, e pode
implementar servios que combinem essas informaes.

Para avaliar a arquitetura CReAMA, desenvolvida em parte em


trabalho prvio [26] e aprimorada para este, foi realizada a
implementao de um prottipo. Neste trabalho, foi gerado um
conjunto de ferramentas denominado CReAMA Tools. Essa
implementao teve como principal objetivo fornecer suporte
tecnolgico para o desenvolvimento de sistemas colaborativos
mveis baseados em componentes.

4.1 Metodologia
Para avaliar a arquitetura de referncia, primeiramente foi
realizada uma instanciao da arquitetura, denominada
CReAMA Tools. A partir desse ferramental, foi desenvolvido o
primeiro conjunto de componentes, chamado GW-Android [25],
que uma extenso do Groupware Workbench (GW). Depois os
dois primeiros prottipos de aplicao foram desenvolvidos no
contexto do GW: um sistema de perguntas e respostas e a verso
mvel da rede social Arquigrafia [27].

Dessa maneira, possvel fornecer informaes para


desenvolvedores construrem componentes especficos para suas
aplicaes que satisfaam requisitos que no so cumpridos
diretamente pela arquitetura, como por exemplo, uma lista de
usurios conectados (requisito A.i). Com essas informaes
igualmente possvel desenvolver componentes para satisfazer os
requisitos categorizados em Awareness (requisitos F.i, F.ii e
F.iii) e Autonomia de Aplicao (requisitos B.i, B.ii e B.iii).

A partir da, foi realizada uma anlise da arquitetura


desenvolvida com base nos requisitos definidos anteriormente
para verificar se todos requisitos foram atendidos. Depois do
desenvolvimento dos dois primeiros prottipos que serviram
como prova de conceito, foi realizado um estudo que consiste

Finalmente, a Figura 3 apresenta os elementos da arquitetura


relacionados infraestrutura. Essa parte da arquitetura foi

32

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

O trabalho foi realizado por dois desenvolvedores diferentes,


cada um desenvolvendo o mesmo sistema, mas com recursos
diferentes. Para o desenvolvimento do sistema mvel foram
definidos os requisitos:

em uma comparao na utilizao e no utilizao de CReAMA


no desenvolvimento de dois clientes do sistema colaborativo
Conecte Ideias.
A comparao foi feita de duas maneiras: a primeira baseada em
mtricas de software para comparar os dois projetos apontando
benefcios e implicaes para cada mtrica; e a segunda consiste
em analisar caractersticas de suporte mobilidade em cada uma
das aplicaes.

4.2 CREaMA Tools


Desenvolvido com base na arquitetura de referncia, o
CReAMA Tools composto por duas partes principais:
Infraestrutura (incluindo o servio de sensores) e Component
Framework.

A Infraestrutura consiste de um conjunto de servios locais que


que so responsveis por gerenciar, entre outras coisas, a
comunicao, conexo, persistncia e sensores. O Component
Framework consiste de um conjunto de funcionalidades
relacionadas aos componentes responsveis por gerenciar,
inicializar, executar, agrupar e desativar os componentes,
facilitando a prototipao de aplicaes colaborativas mveis.

Execuo do login para acessar os dados da plataforma;


Visualizao de uma lista com todas as ideias da
plataforma e uma lista com as ideias mais recentes;
Visualizao dos dados de ideias especficas, contendo:
descrio das ideias, lista de imagens, lista de envolvidos e
lista de comentrios;
Visualizao dos dados de um usurio especfico,
contendo: lista das ideias que o usurio participa, lista de
imagens do usurio e lista de atividades recentes;
Busca de ideias a partir de input de usurios;
Permitir que usurios criem novas ideias;
Permitir que usurios adicionem comentrios relacionados
s ideias;

O sistema colaborativo mvel Conecte Ideias construdo


utilizando CReAMA Tools composto por dois projetos: o
projeto da aplicao e o projeto dos componentes. O projeto da
aplicao consiste basicamente de classes que representam a
interface grfica com o usurio (CRActivity) e esse projeto
utiliza as classes do projeto de componentes para montar a
aplicao. A aplicao montada utilizando essas classes do
projeto de componentes que representam componentes grficos
e podem ser acoplados e desacopladps a uma CRActivity. A
arquitetura do sistema que utilizou CReAMA e sua relao com
o CReAMA Tools so apresentadas na Figura 4.

Alguns servios desenvolvidos so usados para acessar


informaes do prprio dispositivo, fornecendo ao servidor as
informaes de contexto do usurio, como atividades
desenvolvidas, ltima modificao em algum documento, se o
usurio est disponvel, entre outras informaes [26]. Apesar
do estudo no abordar todos esses aspectos, com esse conjunto
de servios ser possvel construir componentes como lista de
usurios conectados, lista de documentos alterados no dia, lista
de atividades desenvolvidas por usurio de um mesmo grupo de
trabalho, etc. Todos esses servios foram desenvolvidos com
base na arquitetura de referncia proposta
Vale mencionar que muitos requisitos so dependentes do tipo
de aplicao. Exemplos que no foram explicitamente citados
so os requisitos de Comunicao (requisitos D.i a D.iv) e o
requisito de capacidade de gerenciamento (requisito I.iii). O
importante que a arquitetura possa prover meios de se obter as
informaes necessrias para que a aplicao atenda aos
requisitos implementando componentes, como foi citado no caso
de Awareness e Autonomia de Aplicao [26].
Depois de todo o desenvolvimento, foi realizada uma anlise de
CReAMA Tools com base nos requisitos definidos
anteriormente. Para cada requisito foi feito o questionamento: a
implementao da arquitetura atende ao requisito x? Como
todos os requisitos foram atendidos pelo menos parcialmente, as
possveis respostas foram: atende diretamente (AD), prov
meios de atender (PMA) e atende parcialmente (AP). O
resultado dessa anlise apresentado na Tabela 1.

Figura 4. Relao da Aplicao e CReAMA Tools

4.3 Estudo de Caso

O projeto de componentes faz referncia CReAMA Tools e o


projeto da aplicao faz referncia ao projeto de componentes.
Vale a pena mencionar que o sistema colaborativo mvel
Conecte Ideias construdo sem auxlio da arquitetura de
referncia composto apenas por um projeto. Nas Figuras 5 e 6
so mostradas telas dos dois sistemas mveis desenvolvidos.

O Conecte Ideias [10] uma plataforma que possibilita a


construo colaborativa de novas ideias e solues. Para realizar
o estudo foram desenvolvidas duas aplicaes clientes para o
Conecte Ideias: uma aplicao desenvolvida utilizando os
recursos fornecidos pelo ferramental do CReAMA Tools e uma
aplicao construda sem o auxlio do CReAMA (o
desenvolvedor utilizou algumas bibliotecas disponveis na Web).
O objetivo foi fazer uma comparao de dificuldade de
desenvolvimento de cada verso para discutir as vantagens e
desvantagens da utilizao de CReAMA.

33

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Esse modelo foi apresentado em Antioniol et al. [2] e tem como


objetivo estimar o esforo de desenvolvimento em um projeto de
software utilizando atributos de tamanho. De acordo com
Rosenberg e Hyatt [33], mtricas de tamanho afetam os
seguintes atributos de qualidade de software: usabilidade,
manutenibilidade e reusabilidade. Vale mencionar que essas
caractersticas de qualidade so muito importantes para o
presente trabalho por se tratar de uma arquitetura para orientar o
desenvolvimento de sistemas orientados a componentes.
Para finalizar o estudo, foi realizada uma anlise das
caractersticas de suporte mobilidade em cada um dos sistemas
mveis implementados, apontando vantagens e benefcios. Os
resultados da avaliao incluindo essa comparao so
mostrados a seguir.

5. RESULTADOS
Para realizar a avaliao da arquitetura de referncia, foi feita
uma anlise da implementao da arquitetura com base nos
requisitos definidos anteriormente para verificar de que maneira
cada um dos requisitos so atendidos. Para cada requisito foi
feito o questionamento: a implementao da arquitetura atende
ao requisito x? Como todos os requisitos foram atendidos pelo
menos parcialmente, as possveis respostas foram: atende
diretamente (AD), prov meios de atender (PMA) e atende
parcialmente (AP). Essa anlise foi realizada com um checklist e
o resultado apresentado na Tabela 1.

Figura 5. Conecte Ideias Desenvolvido sem CReAMA

Tabela 1. Anlise dos requisitos atendidos na implementao


Requisitos
Ai
Aii
Bi
Bii
Biii
Ci
Cii
Ciii
Di
Dii
Diii
Div
Ei
Eii
Fi
Fii
Fiii
Gi
Gii
Hi
Hii
Ii
Iii
Iiii
Ji
Jii
Jiii
Jiv
Jv
Jvi

Figura 6. Conecte Ideias Desenvolvido com CReAMA


Foi realizada a comparao das duas aplicaes com base em
mtricas de software e levando em conta caractersticas
especficas da mobilidade. As mtricas utilizadas neste trabalho
tm relao direta com estimativa de esforo de
desenvolvimento de softwares, sendo elas: lines of code (LOC),
number of classes (NOC) e weighted methods per class (WMC).
As mtricas foram obtidas utilizando o Eclipse Metrics Plugin
[11].
Das mtricas relacionadas ao tamanho, a contagem de linhas de
cdigo fonte (LOC) popular devido facilidade de definir e
discutir, de medir objetivamente e conceitualmente familiar a
desenvolvedores de software [37]. As outras duas mtricas,
NOC e WMC, so utilizadas pelo Modelo de Ponto de Funo
Orientado a Objetos (Object Oriented Function Point - OOFP).

AD

PMA
X

AP

X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X

Vale mencionar que muitos requisitos so dependentes do tipo


de aplicao. Requisitos de Comunicao (requisitos D.i a D.iv),

34

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

por exemplo, devem ser implementados por meio de


componentes e no na infraestrutura. O importante neste caso
que a arquitetura possa prover meios de se obter as informaes
necessrias para que os componentes de domnio da aplicao
atendam aos requisitos. Outros exemplos de requisitos que se
encaixam nesse caso Awareness (requisitos F.i e F.ii) e
Autonomia de Aplicao (requisitos B.i e B.ii).

A segunda parte da avaliao consistiu em analisar


caractersticas de suporte mobilidade em cada uma das
aplicaes. A Tabela 3 mostra esses dados.
Como pode-se observar, o sistema com CReAMA d suporte
aos cinco itens enquanto o outro sistema d suporte apenas a um
dos itens. Pode-se concluir que neste estudo de caso, o uso do
CReAMA apresentou vantagens. Alm de produzir menos
cdigo para a aplicao, o sistema possui mais funcionalidades
no que diz respeito ao suporte colaborao mvel.

Depois dessa anlise, foi realizada a aplicao de mtricas nos


trs projetos: projeto do Conecte Ideias baseado em
componentes, projeto dos componentes do Conecte Ideias e o
Projeto Conecte Ideias sem utilizar CReAMA. Foi realizada a
soma dos dois projetos que utilizaram CReAMA e apresentado
na Tabela 2 como Projeto Conecte Ideias Com CReAMA.

Tabela 3. Comparao do suporte mobilidade utilizando


CReAMA (UC) e no utilizando CReAMA (NUC)
Suporte a limitaes relacionadas mobilidade
Permite a utilizao do sistema mesmo sem
conexo com a internet
Fornece percepo sobre a bateria do dispositivo
Fornece ao usurio as informaes mais
atualizadas para utilizar o sistema off-line quando
necessrio
Interface grfica construda com pouca rolagem
Fornece percepo sobre mudanas de estado da
rede em que o dispositivo est conectado

Tabela 2. Resultado da aplicao de mtricas nos projetos


Projeto da Aplicao
Baseada em
componentes
Projeto dos
Componentes
Projeto Conecte
Ideias Com
CReAMA
Projeto Conecte
Ideias Sem
CReAMA

LOC

WMC

NOC

137

47

1183

380

24

1320

417

28

1896

701

X
X
X
X

Ferramentas para apoiar desenvolvedores de software so muito


importantes, principalmente no que diz respeito colaborao
mvel, que um cenrio novo de desenvolvimento, que envolve
uma srie de complexidades tcnicas e sociais. Neste trabalho
foi realizada uma avaliao de CReAMA, uma arquitetura de
referncia para orientar o desenvolvimento de sistemas
colaborativos mveis orientados a componentes. Como estudo
de caso, dois clientes mveis da plataforma Conecte Ideias
foram implementados, um utilizando CReAMA e o outro no.

50

1800
ProjetodaAplicao
Baseadaem
componentes

1600
1400

Depois do desenvolvimento desses sistemas, foi feita uma


comparao para mostrar benefcios e vantagens de utilizar a
arquitetura de referncia proposta. Os resultados mostraram que
CReAMA tem potencial para facilitar o desenvolvimento de
sistemas colaborativos mveis e oferece vrias funcionalidades
comuns de colaborao mvel implementada pelo CReAMA
tools. Como trabalho futuro, sero realizados experimentos e
novas instanciaes com o intuito de avaliar mais
profundamente o potencial dessa arquitetura de referncia.

Projetodos
Componentes

1200
1000

ProjetoConecte
Ideias Com
CReAMA

800
600
400

ProjetoConecte
Ideias SemCReAMA

200

7. AGRADECIMENTOS
Agradecemos ao suporte financeiro recebido da FAPES,
FAPESP, NAWEB, NAPSoL-PRP-USP e CNPq.

0
WMC

NUC

6. CONCLUSO

2000

LOC

UC

NOC

8. REFERNCIAS

Figura 7. Grfico Comparativo do Desenvolvimento dos Dois


Sistemas Utilizando Mtricas

[1] Alaya, M. B.; Baudin, V.; Drira, K. Dynamic deployment of


collaborative components in service-oriented architectures. In:
11th International Conference of New Technologies in Distributed
Systems (IEEE NOTERE, 2011).

Como pode ser observado, CReAMA apresentou vantagem no


que diz respeito a todas as mtricas. Utilizando CReAMA, a
quantidade de linhas de cdigo e classes produzidas do sistema
foi muito inferior em relao ao projeto que no utilizou a
arquitetura. Foram produzidas 44% menos classes e 31% menos
linhas de cdigo. Alm disso, a mtrica WMC apresentou um
resultado 41% menor no sistema que utilizou CReAMA.
importante mencionar que de acordo com Rosenberg e Hyatt
[33], quanto maior o WMC da classe, mais tempo e esforo
necessrio para desenvolv-la e mant-la.

[2] Antoniol, G.; Fiutem, R.; Lokan, C. "Object-Oriented Function


Points: An Empirical Validation", Empirical
Engineering, vol. 8, no. 3, pp.225 -254 2003.

Software

[3] Bendel, S.; Schuster, D. WatchMyPhone - Providing developer


support for shared user interface objects in collaborative mobile
applications, in Proc. IEEE PERCOM Workshops, 2012.

[4] Berkenbrock, C. D. M.; Da Silva, A. P. C.; Hirata, C. M.


Designing and Evaluating Interfaces for Mobile Groupware
Systems. Proceedings of the 2009 13th International Conference
on Computer Supported Cooperative Work in Design. 2009.

35

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

[5] Berkenbrock, C. D. M.; Hirata, C. M. Uma estratgia para garantir

[24] Lukosch, S. Seamless Transition between Connected and

coerncia de cache e percepo em sistemas cooperativos com


apoio mobilidade. Tese de Doutorado Instituto Tecnolgico de
Aeronutica. So Paulo, 2009.

Disconnected Collaborative Interaction; J.UCS (Journal of


Universal Comp. Science), 14, 1 (2008), 59-87.

[25] Melotti, M.; Gomes, R. L. Extenso do Groupware Workbench

[6] Berkenbrock, C. D. M.; Hirata, C. M.; Fernandes, C. T.; Pichiliani,

para Prototipao de Sistemas Colaborativos Mveis. Proceedings


of the IX Brazilian Symposium in Collaborative Systems.
Workshop de Teses e Dissertaes. 2012.

M. C. Requisitos de Usabilidade para o Desenvolvimento e


Avaliao de Aplicaes Cooperativas Mveis. VI Simpsio
Brasileiro de Sistemas Colaborativos. 2009.

[26] Melotti, M.; Gomes, R. L.; Nunes, V. R. O.; Gerosa, M. A.

[7] Borghoff, U. M.; Schilichter, J. H. Computer-Supported


Cooperative Work: Introduction to Distributed Applications.
Munique, Alemanha: Springer, 2000.

CReAMA: A Component-Based Reference Architecture for


Collaborative Mobile Applications. Proceedings of the X Brazilian
Symposium in Collaborative Systems. 2013.

[8] Buschmann, F., Henney K., Schmidt, D. C. Pattern Oriented

[27] Michalsky, S. Componentes de Software no desenvolvimento de

Software Architecture, Volume 5: On Patterns and Pattern


Languages. Wiley & Sons, 2007.

aplicaes colaborativas para Web: Evoluo da plataforma


Groupware Workbench. Dissertao de Mestrado Universidade
de So Paulo, Departamento de Matemtica e Esttisca. So Paulo,
2012.

[9] Byrne, P. MUSE - Platform for Mobile Computer Supported


Collaborative Learning, Ph.D. dissertation, University of Dublin,
2011.

[28] Neyem, A., Ochoa, S.F., Pino, J.A. Integrating Service-Oriented


Mobile Units to Support Collaboration in Ad-hoc Scenarios;
J.UCS (Journal of Universal Computer Science), 14, 1 (2008), 88122.

[10] Conecte Ideias. Disponvel em http://conecteideias.com/. Acesso


em Maio de 2014.

[11] Eclipse

Metrics Plugin. Disponvel em http://eclipsemetrics.sourceforge.net/. Acesso em Maio de 2014.

[29] Ochoa, S.F., Neyem, A., Pino, J., Borges, M. Supporting Group
Decision Making and Coordination in Urban Disasters Relief
Efforts; Journal of Decision Systems 16, 2 (2007), 143-172.

[12] Filippo, D., Filho, J. V., Endler, M., Fuks, H. Mobilidade e


ubiqidade para colaborao. In: Sistemas Colaborativos. Rio de
Janeiro: Elsevier, 2011. 294-315.

[30] Papadopoulos, C. Improving Awareness in Mobile CSCW. Mobile


Computing, IEEE Transactions on, Vol. 5, No. 10. 2006, pp. 13311346.

[13] Fonseca, B.; Paredes, H.; Sousa, J. P.; Martins, F. M.; Carrapatoso,
E. SAGA Reloaded: towards a generic platform for developing
cooperative applications. 13th International Conference on
Computer Supported Cooperative Work in Design (CSCWD
2009). Santiago, Chile.

[31] Pinelle, D., Gutwin, C. Loose Coupling and Healthcare


Organizations: Deployment Strategies for Groupware; Computer
Supported Cooperative Work Journal, 15, 5-6 (2006), 537-572.

[14] Gerosa, M. A. Desenvolvimento de Groupware Componentizado

[32] Richardson, L.; Ruby, S. RESTful Web Services: Web Services for

com Base no Modelo 3C de Colaborao. Tese de Doutorado Pontifcia Universidade Catlica do Rio de Janeiro, Departamento
de Informtica. Rio de Janeiro, 2006.

[33] Rosenberg, L. H.; Hyatt, L. Software Quality Metrics for Object-

[15] Gerosa, M.A.; Fuks, H. A. Component Based Workbench for

[34] Truong, H-L, Dustdar, S. Service-Oriented Architecture for Mobile

Groupware Prototyping. 1st Workshop on Software Reuse Efforts


(WSRE), 2nd Rise Summer School, 27-28 de outubro de 2008,
Recife.

Services. In Handbook of Mobile Systems Applications and


Services, Kumar, A. and Xie, B. editors. Auerbach Publications,
2012, 612 p.

[16] Gomes, R. L, Willrich, R., Rivera, G. D. H. Arquiteturas

[35] VISION MOBILE. Developer Economics 2013-Developer Tools-

distribudas para sistemas colaborativos. In: Sistemas


Colaborativos. Rio de Janeiro: Elsevier, 2011. pp. 328-346.

the Foundation of the App Economy. Disponvel


em:
http://www.visionmobile.com/product/developer-economics-2013the-tools-report. Acesso em maio de 2013.

theReal World. OReilly Media Inc, 2007.


Oriented Environments. Crosstalk Journal. 1997.

[17] GreenDAO. Android ORM for SQLite. Disponvel em

[36] Wulf, V.; Pipek, V.; Won, M. Component-based tailorability:

http://greendao-orm.com/. Acesso em Maio de 2013.

Enabling highly flexible software applications. Int. J. Hum.Compt. Stud. 66(1), 2008, 11-22.

[18] Groupware Workbench. Groupware Workbench: Descrio do


Projeto. http:/www.groupwareworkbench.org.br. Acesso em Maio
de 2013.

[37] Yun, S. J. Productivity Prediction Model Based on Bayesian


Analysis and Productivity Console. Dissertation, Texas A&M
University, 2005.

[19] Herskovic, V., Ochoa, S.F., Pino, J.A. Modeling Groupware for
Mobile Collaborative Work. IEEE Press, Los Alamitos, CA. 13th
International Conference on Computer Supported Cooperative
Work in Design (CSCWD'09), Santiago, Chile, April 22-24, 2009,
384-389.

[38] Zambiasi, S. P. Uma Arquitetura de Referncia para Softwares


Assistentes Pessoais Baseada na Arquitetura Orientada a Servios.
Tese de Doutorado - Universidade Federal de Santa Catarina.
Florianpolis, 2012.

[20] Herskovic, V., Ochoa, S.F., Pino, J.A., Neyem, A. General


Requirements to Design Mobile Shared Workspaces. Proceedings
of CSCWD 2008. IEEE Press. Xian, China. April 16-18, 2008,
582-587.

[21] Herskovic, V.; Ochoa, S. F.; Pino, J. A.; Neyem, A. The Iceberg
Effect: Behind the User Interface of Mobile Collaborative
Systems. Journal of Universal Computer Science, vol. 17, no. 2
(2011), 2011,183-202.

[22] Le, H. N.; Nygard, M. A transaction model for Supporting mobile


Collaborative Works. In Proc. CTS07: 7th International
Symposium on Collaborative Technologies and Systems, 2007.

[23] Litiu, R.; Zeitoun, A. Infrastructure Support for Mobile


Collaboration. Proceedings of the 37th Annual Hawaii
International Conference on System Sciences, vol. 1, pp.10031a,
2004.

36

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Modelo de Recomendao de Especialistas em Ambientes


Sociais Virtuais
Diego Oliveira Rodrigues, Edeilson
Milhomem da Silva
Centro Universitrio Luterano de
Palmas, Dep. de Computao,
Palmas, Brasil
diegopso2@gmail.com,
ems5@cin.ufpe.br

Jackson Gomes de Souza, Parcilene


Fernandes de Brito
Centro Universitrio Luterano de
Palmas, Dep. de Computao,
Palmas, Brasil
jgomes@ceulp.edu.br,
parcilene@gmail.com

Ana Carolina Salgado, Silvio Romero


Lemos Meira
Universidade Federal de Pernambuco
Centro de Informtica
Recife, Brasil
acs@cin.ufpe.br, srlm@cin.ufpe.br

Para amenizar o problema de excesso de informaes


surgem servios de informaes eficientes fornecidos aos
usurios dos ambientes virtuais [2]. Esses servios se valem
das tcnicas de recuperao da informao que, por
exemplo, permitem que seja analisado e classificado
(ranking) um grande nmero de informaes, facilitando o
acesso dos usurios aos contedos mais relevantes [3].
Diferentes softwares fornecem metodologias para
classificao de resultados estticos (i. e. listas de contedos
indexados), como o Apache Lucene 1 e o Sphinx 2. Esse tipo
de classificao esttica por muitas vezes ineficiente, pois
no personalizada ao problema do usurio [4].
Uma forma de fornecer informaes mais especificas
aos usurios atravs de Sistemas de Recomendao, que
aprimoram os resultados da indexao de contedos. Tais
sistemas visam apresentar aos usurios um conjunto de itens
de seus interesses [5]. Tais sistemas de recomendao j
provaram ser uma importante resposta para o problema de
information overload, uma vez que fornecem servios de
informaes personalizados [6]. Este perfil do indivduo
pode ser formado de diferentes maneiras, como por
exemplo, atravs da anlise dos dados de navegao dele (i.
e. sites visitados), ou atravs da anlise das transaes feitas
por ele (i. e. itens adquiridos, como livros ou ferramentas).
Mesmo na presena de um conjunto personalizado de
informaes podem ser encontradas dificuldades para
resolver problemas complexos, principalmente problemas
que requerem determinado nvel de experincia para serem
resolvidos. Em casos como este, uma alternativa encontrar
um indivduo com habilidades especficas, que possua essa
experincia, para ajudar a resolver esses problemas [7], [8].
Esses indivduos podem auxiliar com a soluo desses
problemas, pois adquiriram conhecimentos tcitos que os
permitem, por exemplo, reconhecer mais facilmente as
causas do problema. Esse indivduo com habilidades
especficas pode ser considerado um especialista de
domnio, ou simplesmente especialista, por causa dos
conhecimentos por ele adquiridos a respeito de um tema.
Entende-se por especialista um indivduo que possua um
nvel apropriado de conhecimento, habilidade, ou
proficincia, em determinada rea [9]. Neste caso diz-se que
o indivduo especialista, ou possui expertise, nessa rea. A
expertise uma caracterstica difcil de mensurar e de nvel

ABSTRACT
This paper presents an expert locator approach in socialbased virtual environments. This approach uses
interpersonal interactions among people and the individuals
explicit knowledge in different virtual social environments
(e.g. Facebook or Twitter) to infer the individuals expertise.
For this, we did use different techniques, such as: similarity
algorithms (e.g. Vector Models, Cosine Algorithm) and
Ontologies. Thus, this approach could be used to: stimulate
new relationships (e.g. coautorship), by recommending
relationships between individuals who perform similar
tasks; or as a tool to manage organizational knowledge.
Both applications stimulate collaboration.

Categories and Subject Descriptors


H.5.3 [Group and Organization Interfaces]: Web; H.5.3
[Group and Organization Interfaces]: Web-based interaction

General Terms
Algorithms, Design, Human Factors.

Keywords
Gesto de Conhecimento, Sistemas de Recomendao,
Recomendao de Especialistas; Redes Sociais.

1. INTRODUO
O pesadelo da informao insuficiente que fez nossos pais
sofrerem foi substitudo pelo pesadelo ainda mais terrvel da
enxurrada de informaes que ameaa nos afogar [1]. Essa
citao traz a tona um dos grandes problemas de
gerenciamento de informaes, o information overload.
Esse problema consiste em um excesso de informaes que
dificulta a identificao das informaes mais relevantes
quando elas so necessrias. Tanta informao originada
pelos milhes de usurios da internet, redes sociais,
dispositivos mveis e outros aparatos que facilitam a criao
e compartilhamento de contedos principalmente atravs de
ambientes virtuais.
Permission to make digital or hard copies of all or part of this work
for personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

1
2

37

Apache Lucene: http://lucene.apache.org/


Sphinx: http://sphinxsearch.com/

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

variado [10] que reflete o nvel de conhecimento de um


especialista em uma rea. Esta dificuldade de avaliao da
expertise devida a vrios fatores, como por exemplo, a
quantidade de informao disponvel sobre as habilidades de
cada indivduo; a frequncia com que cada indivduo muda
sua rea de atuao, e com isso seu nvel de expertise em
determinadas reas; e tambm a falta de um padro definido
para mensurar a expertise, pois existem diferentes
abordagens de medida, no entanto no h um consenso
sobre qual a mais eficaz.
Uma maneira de auxiliar na soluo de problemas
altamente especficos seria atravs do compartilhamento do
conhecimento dos especialistas. No entanto no uma tarefa
trivial realizar este tipo de compartilhamento, uma vez que o
conhecimento tcito de difcil documentao ou
formalizao [11]. A dificuldade de formalizao desse
conhecimento devida ao seu carter altamente pessoal, o
que cria barreiras para seu compartilhamento entre
indivduos [12]. Dada essa dificuldade de formalizao
deste tipo de conhecimento, uma alternativa para
compartilh-lo atravs da recomendao do prprio
individuo, como especialista. Este tipo de recomendao de
indivduos especialistas se tornou um problema conhecido
na literatura como recomendao de especialistas.
A fim de identificar especialistas para a recomendao,
podem ser utilizadas diversas tcnicas derivadas de vrias
reas da computao, tais como, TF-IDF [13], que uma
anlise de ocorrncia de palavras-chave em uma coleo de
documentos; o modelo vetorial que permite a comparao
de entidades representadas por ele; ontologias, que so
modelos que representam um entendimento comum,
formalizado e compartilhado por um grupo de indivduos,
sobre determinada teoria de um domnio [14], [15]; dentre
outras tcnicas.
O presente trabalho prope um modelo de recomendao
de especialistas em ambientes sociais virtuais. A
recomendao de especialistas em ambientes sociais
virtuais, alm de auxiliar com a soluo de problemas
especficos dos usurios, pode atuar como estimulo
socializao de especialistas nesses ambientes. Essa
socializao ocorre uma vez que especialistas de mesma
rea possam ser identificados, e mutuamente recomendados,
para a formao de equipes de pesquisa ou participao em
eventos. Tal socializao naturalmente promove a troca de
ideias, colaborao, alm de criao e compartilhamento de
informaes dentro do ambiente social virtual [16]. A
apresentao desse modelo, no presente trabalho, est
organizada da seguinte forma: a seo 2 apresenta os
principais processos da identificao de especialistas, em
seguida a seo 3 apresenta metodologias que utilizam as
tcnicas mencionadas para identificao de especialista. A
seguir, na seo 4, apresentado o modelo de recomendao
de especialistas proposto nesse trabalho. Por fim so
apresentadas as Consideraes Finais (seo 5) e
Referncias Bibliogrficas.

2. RECOMENDAO DE ESPECIALISTAS
O processo de identificao de especialidades dos
indivduos permite a localizao (e recomendao) de
especialistas de domnio e, com isso, auxilia a localizao
de informaes especficas para determinados cenrios.
Muitas vezes, apenas as informaes documentadas podem
no ser suficientes para fornecer uma soluo a determinado
problema. Nesses casos pode-se requerer informaes
particulares que venham a existir apenas no conhecimento
tcito de um especialista de domnio.
Uma forma de utilizar sistemas de recomendao de
especialistas atravs do seu emprego integrado a um, ou
como um, Knowledge Managment System (KMS). KMSs
so sistemas de informao responsveis por facilitar a
codificao, coleta, integrao e disseminao de
conhecimento organizacional [17], [18]. Tais sistemas
surgiram como uma resposta observao de que o
conhecimento possua valor organizacional limitado caso
no fosse compartilhado, por exemplo, entre os membros de
uma organizao [19]. Em organizaes, SREs atuam
diretamente
na
disseminao
de
conhecimento
organizacional tcito. Atravs da localizao e
recomendao de especialistas para diferentes cenrios e
situaes. Assim, esse tipo sistema cria condies para o
melhor aproveitamento das habilidades dos membros da
organizao e seus conhecimentos.
Como mencionado, em determinados cenrios o acesso a
conhecimento tcito pode ser essencial para a soluo de um
problema. Alm do acesso ao conhecimento tcito, recorrer
a informaes de especialistas ainda apresenta outras
vantagens como as apresentadas em [19], a saber: (1)
informaes mais especficas, informadas pelo especialista
de acordo com a situao a ele apresentada; (2) experincia
de outrem, isto , a experincia do especialista com
situaes semelhantes; (3) reduo da necessidade de
interpretao, uma vez que o especialista pode explicar com
detalhes e tirar dvidas sobre o conhecimento em questo;
(4) socializao, (em sua maioria) pessoas preferem
interagir com outras pessoas ao invs de utilizarem livros ou
documentos.
Cada uma das vantagens supracitadas quanto utilizao
dos SREs pode surgir em diferentes contextos. De forma
semelhante, diferentes contextos alteram o perfil de
especialista ideal, ora pode ser necessrio um especialista
mais tcnico para solucionar um problema aplicado, ora um
mais terico para ajudar com o entendimento de algum
conceito, ora um especialista com maior disponibilidade
para ajudar na soluo de um problema trabalhoso e
demorado. Em observncia s situaes como essas, diz-se
que os SREs devem solucionar dois problemas [7], [20]: (1)
a identificao de especialistas, e seus nveis de
especialidade; e (2) a seleo de especialistas, que deve
considerar a probabilidade do especialista ajudar com seus
conhecimentos.
O processo de identificao de especialistas analisa
informaes explcitas e implcitas a fim de determinar

38

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

quais as reas de especialidades dos indivduos [9], [20].


Atravs da anlise dessas informaes, o processo de
identificao de especialistas traa o perfil de conhecimento
dos indivduos. Antes de a anlise ser completada no existe
uma certeza das especialidades dos indivduos, nesse
sentido, os indivduos analisados tambm podem ser
chamados de candidatos a especialistas. O perfil de
conhecimento deve representar o conjunto relevante de
habilidades do candidato a especialista e permitir que estas
habilidades sejam analisadas, por exemplo, com anlises
semnticas, estatsticas e de similaridade. A fim de
encontrar provas de que essas habilidades so na verdade
especialidades do indivduo podem ser utilizadas
informaes de diferentes origens, como: homepages dos
candidatos, contedos publicados ou marcados por eles,
publicaes cientficas, posts em blogs ou redes sociais web
dentre vrias outras fontes de informaes.
Aps a identificao das especialidades dos indivduos,
o processo de seleo de especialistas determina quais os
melhores especialistas para o contexto em questo. Dessa
forma, a seleo de especialistas o processo da
recomendao de especialistas que permite a personalizao
e ordenao do conjunto de respostas [9]. Assim a
metodologia utilizada para determinar o melhor especialista
a ser designado para uma tarefa tem seus fundamentos
alterados de acordo com o ambiente no qual opera o SRE.
Em um ambiente virtual mais dinmico (i. e. que
atualizado quase constantemente), como uma rede social
web, o melhor especialista a ser designado poder ser o que
estiver on-line no momento de sua solicitao, pois a
disponibilidade do usurio poderia agilizar o desempenho
dessa tarefa, por exemplo. No entanto cenrios diferentes
podem necessitar de outros perfis de especialistas, em
ambientes de incerteza (e. g. que envolvem segredos
empresariais), por exemplo, o melhor especialista pode ser
aquele no qual mais se pode confiar.
A unio dessas duas tarefas, identificao e seleo de
especialistas origina os SREs. Para realiz-las, como
supracitado, so analisadas diferentes informaes de
diferentes origens. Essas informaes so analisadas com o
uso de diversas tcnicas derivadas de outras reas da
computao, dentre outras cincias, como: Recuperao da
Informao, Redes Sociais, Ontologias e etc. A seo 3
apresenta alguns trabalhos relacionados ao modelo proposto
nesse trabalho e a relao de algumas das tcnicas utilizadas
por esses trabalhos que derivam dessas reas.

de informaes dos indivduos a fim de inferir a existncia


de alguma especialidade.
Uma metodologia utilizada no processo de identificao
de especialidades o Modelo Vetorial, que representa
contedos como vetores das frequncias dos termos
contidos neles e cria condio de compar-los entre si, por
exemplo, atravs do algoritmo do cosseno [13]. Esse
modelo permite que se estabelea um perfil de
conhecimento de determinado indivduo a partir das
representaes de contedos ligados a ele (e. g. de autoria
dele). Dessa forma, as especialidades do indivduo sero
evidenciadas pelos termos relacionados a ele.
O SRE exposto em [21] um exemplo de sistema que
constri um perfil de conhecimento dos indivduos e os
compara com determinadas querys, por meio do Modelo
Vetorial, para identificar aqueles com maior probabilidade
de responder perguntas especficas em comunidades on-line
de perguntas e respostas. Esse SRE utiliza duas abordagens
para inferir as especialidades dos usurios da comunidade
de perguntas e respostas: uma baseada em termos e outra em
tpicos. A abordagem baseada em termos a qual faz uso
do Modelo Vetorial, e contabiliza os termos utilizados no
histrico de respostas de cada membro da comunidade. A
outra abordagem utiliza um modelo de segmentao de
tpicos [22], [23] para descobrir as reas de interesse dos
membros da comunidade.
Demartini [24] tambm prope um mecanismo de
representao de conhecimento de usurios na Wikipdia.
Para construir esses perfis so consultados os artigos
editados por esses usurios. ento realizada uma anlise
TF-IDF sobre os contedos desses artigos para identificar as
especialidades dos usurios. Essa anlise, alm de
contabilizar a frequncia dos termos nos artigos, busca
identificar a relevncia desses termos contabilizando
tambm a frequncia com que o termo se repete na base de
artigos como um todo e a quantidade de artigos nos quais o
termo ocorre.
Alm da anlise de artigos, outra fonte importante de
provas de especialidades de indivduos so suas interaes
sociais, como posts, comentrios, atividades, avaliaes e
etc. Uma srie de trabalhos de Fazel-Zarandi e Fox [7], [9],
[25] prope uma abordagem de segmentao de provas de
especialidades. De acordo com os tipos de provas as
especialidades podem ser divididas em: (1) demostradas; (2)
sugeridas; (3) desconhecidas; e (4) refutadas.
Cada um dos tipos de provas indica diferentes fontes de
informaes a serem analisadas. Assim, para cada um dos
tipos de especialidades supracitados tem-se as seguintes
exemplificaes de fontes de informaes:
As demostradas so aquelas obtidas por meios que
garantem que o indivduo possua determinada
especialidade, como a execuo de uma atividade (e. g.
desempenho de tarefas, ministrao de palestra em
evento), a concluso de um curso de especializao (e. g.
graduao, mestrado) e etc.

3. TRABALHOS RELACIONADOS
Diversas abordagens de identificao de especialistas esto
disponveis na literatura. Essas metodologias utilizam
tcnicas de recuperao da informao a fim de encontrar
evidncias que indiquem a expertise de um indivduo em
determinado domnio. Tais evidncias podem ser
encontradas explicitamente, em contedos da web, artigos
cientficos e etc; ou ainda implicitamente a partir da anlise

39

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

As sugeridas so aquelas que provm das opinies de


indivduos em um ambiente social. Nesse caso, cada
indivduo pode sugerir que outro tenha expertise em
algum domnio.
As desconhecidas caracterizam especialidades as quais
no se tm certeza que o indivduo possua. Um exemplo
de prova desse tipo de especialidade a prpria afirmao
do indivduo sobre uma especialidade sua. Isto pois, o fato
do indivduo afirmar possuir uma especialidade nem
sempre comprova a existncia da mesma.
por fim, as refutadas so aquelas que se tm provas de
que o indivduo no possui determinada especialidade.
Esse tipo de informao tambm pode ser extrada das
opinies dos indivduos em uma comunidade, assim como
as especialidades sugeridas. Porm, nas especialidades
refutadas, as opinies dos indivduos negam uma
determinada especialidade de outro indivduo.
Essa segmentao de tipos de especialidades, proposta
por Fazel-Zarandi e Fox foi estendida e utilizada para
concepo do modelo proposto neste trabalho. Na seo 4.4
apresentada essa extenso que utiliza tcnicas de modelos
ontolgicos para analisar provas no explcitas de
especialidades, acrescentado um novo tipo de especialidades
lista, a especialidade inferida.
As especialidades inferidas so analisadas por meio de
ontologias. Outras abordagens que utilizam ontologias para
identificao de especialistas tambm so frequentes na
literatura, como o modelo de Mochol, et. al. [26]. Esse
modelo utiliza a representao de vagas de emprego e
candidatos a essas vagas, em portais de empregos, para
flexibilizar as consultas (buscas) dos usurios por vagas.
Essa flexibilizao permite que a consulta identifique vagas
de emprego relacionadas que tambm podem ser relevantes
para o candidato a empregado.
Para determinar o conjunto de resultados relevantes para
as consultas de vagas de empregos utilizada uma tcnica
de pesquisa semntica que combina descries feitas com
um vocabulrio controlado e conhecimento de domnio. Por
fim, para classificar os resultados so utilizados clusters
temticos com a representao das propriedades comuns
dos perfis de candidatos a empregos (e. g. habilidades,
salrios). Para definir a similaridade entre os perfis
representados, e assim criar a segmentao dos clusters,
utilizada a similaridade taxonmica dos conceitos contidos
nos perfis representados. Essa similaridade obtida atravs
do calculo da distncia entre os conceitos em uma hierarquia
de conceitos (i. e. formato de representao de conceitos e
sub-conceitos em estrutura de rvore).
Para adio das especialidades inferidas foi utilizado o
modelo de ontologia simples. Esse formato de ontologias
simples semelhante ao da hierarquia de conceitos, no
entanto utilizada estrutura de grafo no local de uma rvore.
Nessa estrutura perde-se a noo de relacionamento
hierrquico entre os conceitos, de forma a impossibilitar a
anlise de conceitos e seus sub-conceitos, substituindo-a por
pesos de relacionamentos entre os termos, que permite

anlises estatsticas desses relacionamentos entre os


conceitos. Essa abordagem permite que se analise, alm da
distncia entre os conceitos, o peso atribudo ao
relacionamento entre eles. A seo 4 apresenta um modelo
de recomendao de especialistas que baseia-se nos quatro
tipos de especialidades propostas por Fazel-Zarandi e um
tipo adicional proposto.

4. MODELO
O modelo apresentado neste trabalho utiliza como base a
diviso de tipos de especialidades de indivduos proposta
por Fazel-Zarandi & Fox [7], [9], [25], que, como citado
anteriormente, classifica as especialidades em quatro tipos:
(1) Demostradas; (2) Sugeridas; (3) Desconhecidas; e (4)
Refutadas. Alm disso, o presente trabalho acrescenta mais
um tipo de especialidade essa lista, a Especialidade
Inferida. Cada um desses tipos de especialidades indicado,
ora por uma fonte de informaes diferente (e. g.
informaes fornecidas por membros de comunidades online, publicaes cientficas), ora por formas diferentes de
analisar as mesmas informaes (e. g. as informaes
fornecidas pelos membros de comunidades podem ser
utilizadas tanto para identificar especialidades sugeridas,
como refutadas).
A diviso de especialidades em cinco categorias foi
utilizada como base para definio das heursticas de anlise
das informaes dos usurios a fim de descobrir quais suas
especialidades. As sees 4.1 4.4
apresentam as
metodologias utilizadas para obteno de cada um dos
nveis de especialidades em seus respectivos tipos. Para
obteno do resultado final da anlise, dado pelo perfil de
conhecimento do usurio e nveis de expertise por
especialidade, realizada uma soma ponderada dos nveis
de especialidade para todos os tipos de especialidades. A
seo 4.5 apresenta por completo esse processo.

4.1 Especialidades Demonstradas


Uma especialidade de um indivduo pode ser
considerada demonstrada quando existem provas
conclusivas de que tal indivduo a possua. O presente
modelo considera que uma forma de provar as
especialidades de um indivduo atravs de produes
cientficas relacionadas ao domnio da referida
especialidade. Desse modo, a existncia de produes
cientficas de um indivduo em determinado domnio indica
a existncia de expertise do indivduo naquele domnio. O
nvel de expertise do candidato a especialista indicado por
suas produes cientficas deve refletir a quantidade (i. e.
nmero de trabalhos publicados) e a qualidade dessas
publicaes (e. g. conceito QUALIS do veculo de
publicao). A quantidade de publicaes, assim como a
relevncias delas, deve influenciar diretamente o nvel de
Especialidade Demonstrada dos autores em cada uma das
reas indicadas nas publicaes
Para determinar qual o domnio da publicao cientfica
so utilizadas as suas palavras chave. Desse modo, o

40

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

pelo conjunto (, ). O nvel de Especialidade


Demonstrada por cada publicao (, )
proporcional relevncia (()). Para definir o peso de
cada autor nas publicaes, e determinar a proporo de
especialidade para cada candidato a especialista, utilizada
uma funo de relevncia do autor no domnio analisado
((, )).
Para determinar a relevncia dos candidatos a
especialista em cada uma das reas de especialidades
contidas em seus artigos utilizada uma metodologia
baseada em ontologias simples. O termo que representa o
domnio a ser analisado utilizado como base para uma
consulta na ontologia, em busca dos seus relacionamentos
com outros termos. De posse dos termos relacionados ao
termo base na ontologia, e dos termos relacionados a cada
autor, determinados a partir de uma analise simplificada de
suas publicaes que contabiliza a frequncia de ocorrncia
dos termos nas suas publicaes, realizada uma anlise de
similaridade. A anlise de similaridade compara a
frequncia de co-ocorrncia dos termos na ontologia
(determinada pelos relacionamentos da ontologia) e as
frequncias dos termos relacionados ao candidato a
especialista. O processo de comparao realizado atravs
do algoritmo do Cosseno [13], conforme ilustra a Figura 1.

conjunto de palavras chave escolhidas pelos autores para a


publicao deve determinar quais os conceitos
desenvolvidos no trabalho e, consequentemente, as reas de
especialidades que podem ser provadas a partir daquele
trabalho. Aps identificar quais as reas de especialidades
sero provadas por aquela publicao necessrio encontrar
o nvel de especialidade fornecida pela publicao a cada
autor.
Outro fator a ser observado ao analisar as Especialidades
Demonstradas dos candidatos a especialista a
caracterstica colaborativa das publicaes cientficas. Essas
publicaes, em geral, so escritas por muitos autores, logo
uma questo a ser estudada o quanto cada autor conhece
sobre cada rea envolvida nas publicaes. Existe na
literatura abordagens que tambm utilizam publicaes
cientficas para identificar expertise de candidatos a
especialista. Uma abordagem utilizada para amenizar o
problema da mltipla autoria dos artigos utilizada em [27]
a diviso igualitria das especialidades indicadas por um
trabalho entre seus autores. Dessa forma, admitido que
todos os autores da publicao possuem igual conhecimento
sobre todas as reas abrangidas pelo trabalho. Essa
abordagem pode gerar alguns problemas, uma vez que
diferentes autores possuem nveis de conhecimentos
diferentes sobre os temas apresentados em uma publicao.
A abordagem de dividir igualmente a especialidade
indicada por cada trabalho considera que os autores
possuem os mesmos nveis de conhecimento nas mesmas
reas, porm o mais comum que pesquisadores formem
equipes de pesquisa para complementar suas habilidades.
Nesse sentido o presente trabalho propes outra
metodologia que visa descobrir quais as contribuies de
cada autor com as reas apresentadas na publicao. Atravs
da anlise das provveis contribuies dos autores
possvel determinar a proporo de especialidade indicada
pelas publicaes para cada autor. Essa metodologia,
baseada na relevncia dos autores nos domnios da
publicao, ser explicada nos pargrafos seguintes junto ao
processo de anlise de especialidades demonstradas.
A partir das informaes apresentadas nos pargrafos
anteriores foi concebida uma metodologia para identificao
de especialidades demonstradas que utiliza a equao (1).
(, ) = (, )

(,)

()

Figura 1 - Processo de determinao da relevncia dos


autores nas reas indicadas em suas publicaes
O termo base da anlise k1 representa o domnio
analisado d. A partir desse termo foi extrado um
subconjunto (O) dos relacionamentos da ontologia que
envolvem k1. Os valores desses relacionamentos, assim
como as frequncias dos termos associados aos autores
(nesse caso A, B e C), so utilizados para construir vetores
que sero comparados. O valor do cosseno entre esses
vetores indica a similaridade entre os termos relacionados
ao autor e os termos relacionados ao termo base na
ontologia. Quanto maior a similaridade entre os vetores,
maior a relevncia daquele autor no domnio representado
pelo termo base. Uma observao que deve ser realizada
que na ontologia o termo base no possui um auto
relacionamento, dessa forma deve-se admitir que o valor
que ocuparia a sua posio no vetor que representa a
ontologia (no exemplo da Figura 1 o primeiro valor do vetor
O) maior que os demais valores dos relacionamentos. No
presente modelo esse valor foi definido maior por uma

(1)

Na equao (1) u e d representam respectivamente o


candidato a especialista e um domnio, ou especialidade, a
ser analisado. Dessa forma, a expresso D(u, d) denota o
valor de especialidade d demonstrada pelo candidato u.
Como mencionado anteriormente, o domnio d
representado por uma palavra chave extrada das
publicaes do candidato. Para determinar o nvel de
especialidade demonstrada pelo candidato so consideradas
todas as publicaes disponveis para anlise, denotadas

41

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

unidade dos demais, no entanto ainda necessrio um


estudo mais aprofundado para validar essa abordagem ou
determinar outra. Sabe-se porm que esse valor deve ser
maior que os demais, pois caso fossem analisadas as
frequncias de co-ocorrncias entre os termo, essa coocorrncia do termo com ele mesmo sempre seria igual ou
maior que as demais co-ocorrncias com outros termos.
O valor da similaridade entre os termos relacionados ao
autor e os relacionamentos da ontologia determina a
relevncia do autor ((, )). O valor resultante dessa
anlise pertence ao intervalo [0, 1] e deve refletir a
contribuio do candidato a especialista u para os contedos
relacionados ao domnio d na publicao. Aps determinar a
relevncia do autor no domnio, necessrio determinar o
peso da publicao. Vrias metodologias podem ser
utilizadas para definir o peso das publicaes, um exemplo
seria utilizar como base o conceito QUALIS da CAPES. Por
exemplo, quanto maior o conceito do peridico no qual foi
publicado o trabalho, maior o peso da publicao. De posse
do peso para cada publicao e da relevncia do autor para
os domnios, possvel determinar seus nveis de
especialidades demonstradas.
Apesar do enfoque de analise de publicaes cientficas
para comprovar Especialidades Demonstradas, a mesma
abordagem apresentada nessa seo pode ser estendida para
outras fontes de informao. Por exemplo, a utilizao de
titulaes acadmicas ou certificaes como provas dessas
especialidades. Para utilizar essas e outras fontes de
informaes seria necessrio o estabelecimento de outras
formas de ponderao das provas de especialidades. Nas
titulaes, por exemplo, poder-se-ia utilizar a nota oferecida
pelo MEC para os cursos e instituies para realizar essa
ponderao.

Essas indicaes, no presente modelo, so utilizadas para


avaliar as especialidades Sugeridas e Refutadas dos
candidatos. Nesse sentido, esse modelo apresenta uma
abordagem para que as sugestes de membros dos
ambientes virtuais sejam refletidas nas especialidades dos
candidatos. Alm disso, toda sugesto de especialidade de
um indivduo A a outro indivduo B, disponvel no
ambiente, deve ser refletida na anlise de especialidades
Sugeridas e Refutadas.
Cada uma das sugestes existentes deve possuir
determinado peso para a anlise de uma especialidade d de
um candidato a especialista u. Esse peso de cada sugesto
deve representar a experincia e relevncia do autor da
sugesto no ambiente. Nesse caso, para determinar o peso
da sugesto de cada membro no ambiente virtual so
utilizadas funes de Reputao, que representam o quo
bem visto um membro do ambiente pelos demais
membros como um todo. As funes de Reputao so um
recurso utilizado na rea de anlise de confiana em
ambientes sociais virtuais, como apresentado em [24][26].
Nos ambientes sociais virtuais existe um fenmeno que
poder interferir na anlise das sugestes dos membros do
ambiente, a popularidade. Pessoas mais populares no
ambiente tendem a receber mais sugestes de forma que
podem ser ora beneficiadas por isso, na anlise de
Especialidades Sugeridas, e ora prejudicadas, na anlise de
Especialidades Refutadas. A quantidade de avaliaes
recebidas pelos candidatos a especialistas deve influenciar
nos nveis de especialidade sugerida e refutada, no entanto o
impacto de sugestes massivas a um usurio em detrimento
dos demais deve ser minimizado. A observao dos fatores
supracitados conduz a uma anlise qualitativa (atravs da
Reputao) e quantitativa (atravs da quantidade de
sugestes) das sugestes realizadas pelos membros do
ambiente social a fim de determinar as especialidades
Sugeridas e Refutadas.
Para reduzir o impacto das avaliaes em massa a um
mesmo candidato a especialista foi adotada uma abordagem
semelhante utilizada em diversos jogos de RPG on-line.
Nesses RPGs, o jogador deve realizar tarefas a fim de
adquirir pontos de experincia para avanar de nvel.
Quanto mais alto o nvel do jogador, mais experincia
necessria para avanar para o prximo nvel. No caso dos
jogos a quantidade de experincia necessria para avanar
de nvel cresce exponencialmente. Como a velocidade de
evoluo de nvel inversa quantidade de experincia
necessria para avanar o nvel, a curva de evoluo de
nvel dos personagens torna-se uma curva logartmica,
conforme Figura 2.

4.2 Especialidades Sugeridas e Refutadas


As Especialidades Sugeridas e Refutadas so analisadas
a partir da mesma fonte de informaes, e com
metodologias semelhantes, por esse motivo apenas ser
elaborada uma seo que apresenta ambas as metodologias.
A diferena existente entre as duas metodologias est
relacionada ao seu peso ao se unirem os resultados das
anlises de todas as especialidades, nesse caso o peso das
Especialidades Refutadas negativo em detrimento das
demais. A Especialidade Sugerida indica a existncia de
uma especialidade de um candidato a especialista, enquanto
que a Refutada indica a existncia de uma inaptido (em
oposio especialidade) do candidato em uma rea. Nesse
sentido, a anlise de Especialidades Sugeridas deve resultar
em um valor positivo, enquanto que a anlise de
especialidade refutada deve resultar em um negativo. Os
demais aspetos da anlise desses tipos de especialidades so
iguais.
Em ambientes sociais, a interao dos indivduos pode
originar diferentes tipos de indcios de especialidades, como
as indicaes de usurios do ambiente sobre possveis
especialidades, ou inaptides, de candidatos a especialistas.

42

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Reputao afetiva dos usurios do ambiente virtual sobre o


usurio analisado (i. e. os autores das sugestes),
representando o respeito e confiana dos membros do
ambiente; e (2) a segunda representa o nvel de maturidade
das publicaes (e. g. comentrios e posts) dos usurios no
ambiente, e tambm a relevncia dessas publicaes,
refletindo uma Reputao cognitiva do indivduo analisado.
Dessa forma a funo ( ) dada pela mdia desses dois
tipos de Reputao dos autores das sugestes, conforme (3).

150

Avano de Nvel ou Experincia Requerida

Curva Logartmica (Nvel)


Curva Exponncial (Experincia Requerida)

100

50

10

20

30

40
50
Experincia

60

70

80

( ) =

90

(3)

Em (3) ( ) representa a Reputao e ( ) a


maturidade do usurio , que so os autores das sugestes.
O modelo de recomendao de especialistas ainda pode
funcionar com outra funo que calcule a Reputao dos
usurios, caso exista uma mais adequada a um ambiente em
especfico. Alm disso, o modelo pode operar em ambientes
sem suporte a anlise de Reputao, para isso a funo deve
ser substituda por um valor constante (e. g. ( ) = 1).
Nesse ultimo caso a Reputao do usurio analisado para de
influenciar a anlise, no entanto a quantidade de sugestes
conserva a relevncia da anlise, quanto mais sugestes
maior indicio de existncia de uma especialidade.
A anlise de especialidades sugeridas realizada sobre
as sugestes que indicam especialidades dos candidatos a
especialistas. Para obter as especialidades refutadas dos
candidatos, o mesmo processo empregado sobre as
sugestes que indicam inaptides dos candidatos em
determinados domnios. O nvel de especialidade refutada
do usurio u no domnio d ((, )) o valor negativo do
resultado da mesma anlise efetuada sobre essas sugestes
de inaptides.

Figura 2 - Curvas caractersticas de avano de nvel e


experincia requerida em RPGs on-line
Como apresentado na Figura 2, o aumento da
experincia do jogador implica no aumento da experincia
requerida para passar de nvel o que acarreta uma
diminuio na velocidade de evoluo de nvel de forma a
amenizar o efeito de distanciamento rpido entre os nveis
dos jogadores. Para simular esse comportamento na anlise
de Especialidades Sugeridas e Refutadas e impedir que
quantidades excessivas de sugestes criem especialistas com
nveis de especialidades acima do valor real por causa de
suas popularidades, os nveis de experincia devem crescer
em uma escala logartmica conforme indicado em (2).

(, ) = log 1 + ( )

( ) + ( )
2

(2)

()

O nvel de especialidade sugerida do candidato u no


domnio d, (, ) (ou refutada (, )) dado pelo
logaritmo da soma das reputaes r(us) dos membros us do
ambiente social que realizaram sugestes () ao
usurio u. Ainda como parte da funo logartmica
adicionada uma unidade com o propsito de colocar o valor
do nvel de Especialidades Sugeridas no intervalo desejado
(0 (, ), pois log 1 = 0). Inicialmente a base adotada
para o logaritmo foi a base 10, acredita-se que esse valor
possui uma reduo na taxa de crescimento (i. e. relacionada
log
) rpida o suficiente para
variao da derivada

comportar o fenmeno da popularidade em boa parte dos


ambientes sociais virtuais, no entanto esse valor passvel
de alterao e ambientes especficos.
A funo de Reputao utilizada no modelo foi extrada
de um algoritmo de anlise de confiana em redes sociais
web intitulado T-SWEETS [24], [27]. Esse algoritmo
consiste em quatro elementos de anlise de confiana dos
quais dois permitem a anlise de Reputao, a saber: (1)
Reputao; e (2) Nvel de Maturidade. Ambas as mtricas
de Reputao so interessantes para o presente modelo,
pois: (1) a primeira representa a percepo sobre a

4.3 Especialidades Desconhecidas


As especialidades desconhecidas so aquelas das quais
no se possuem indcios conclusivos de sua existncia. No
presente modelo, as especialidades informadas pelo prprio
candidato especialista compe esse tipo de especialidade.
Para avaliar esse tipo de especialidade necessrio que se
estabelea um peso para as afirmaes do indivduo sobre
suas prprias especialidades (i. e. auto-sugestes) fornecidas
pelo prprio candidato a especialista. O nvel de
especialidade d do candidato u dado pelo valor do peso da
auto-sugesto fornecida pelo candidato. Para determinar
essa Reputao utilizada a mesma metodologia
representada em (3). Em (4) formaliza o processo de
obteno do nvel de especialidade desconhecida.
(), caso ,
(, ) =
0, caso contrario

(4)

A Especialidade Desconhecida (i. e. informada pelo


candidato) ((, )) dada pela Reputao do candidato u
(()) para todos os domnios , que o candidato
43

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

afirmar possuir expertise. Como o nico meio de adio de


Especialidades Desconhecidas so as auto-sugestes dos
candidatos e, alm disso, supondo que ele possa fazer isso
apenas uma vez, no existem fatores agravantes que exijam
um abordagem mais elaboradas para determinar o peso das
auto-sugestes por ele fornecidas. No entanto, caso
necessrio, o efeito desse valor sobre a anlise final ainda
poder ser reduzido, ou aumentado, durante a soma
ponderada, apenas ajustando o peso dessa parcela, conforme
apresentado na seo 4.5.

4.4 Especialidade Inferida


A existncia de uma Especialidade Inferida ocorre
quando apenas existe uma probabilidade de que o candidato
a especialista a possua, porm sem a existncia de provas
concludentes. Nesse caso, acredita-se que a existncia de
expertise em determinado domnio possa indicar a
existncia de especialidade em outro domnio. Por exemplo,
existe uma probabilidade de que um candidato que possua
expertise em projetos de bancos de dados e sistemas de
bancos de dados distribudos possua tambm conhecimentos
de sistemas gerenciadores de bancos de dados, como o
MySQL. Mesmo na ausncia de provas da existncia desse
conhecimento essa probabilidade no deve ser
desconsiderada.
Para analisar as Especialidades Inferidas utilizado um
perfil prvio de especialidades dos candidatos. Esse perfil
prvio um conjunto de termos, que representam
especialidades, que figuram nas anlises dos demais tipos de
especialidades. Alm disso, tambm constituem o perfil
prvio os nveis de especialidades (ou nveis prvios de
especialidade) obtidos em cada uma das anlises. Os termos
obtidos desse perfil prvio de especialidades so submetidos
a uma anlise atravs de uma ontologia simples. Atravs dos
relacionamentos da ontologia possvel descobrir o quo
inter-relacionados esto dois termos. Ora se um candidato u
possui uma especialidade a que est fortemente relacionada
a outra especialidade b, atravs dos termos que as
representam na ontologia, esse relacionamento deve refletir
a probabilidade do candidato de possuir tambm a
especialidade b.
A ontologia simples a ser utilizada para a anlise de
Especialidades Inferidas deve possuir seus relacionamentos
ponderados com a frequncia de co-ocorrncia de termos
em uma base de documentos do ambiente virtual (e. g. base
formada pelos posts, comentrios e publicaes dos
membros de uma comunidade virtual). Os pesos dos
relacionamentos devem ser normalizados na escala [0, 1]
para que sejam multiplicados pelos nveis prvios de
especialidades e resultarem em um nvel de especialidade
inferida do candidato. A Figura 3 exemplifica o processo.

Figura 3 - Anlise de especialidades inferidas a partir do


termo k1
Na Figura 3 deseja-se obter as provveis especialidades
do candidato A que podem ser inferidas a partir de sua
especialidade k1 e os relacionamentos com outros termos ki
na ontologia. O primeiro passo da anlise construir uma
matriz normalizada com os pesos dos relacionamentos de k1
e os outros termos existentes na ontologia de simples. Como
o termo k1, naturalmente, no possui um auto
relacionamento o seu peso na matriz definido como o
maior peso dos relacionamentos da ontologia acrescido de
uma unidade (mesma abordagem utilizada na seo 4.1). A
matriz de pesos normalizados ento multiplicada pelo
nvel prvio de especialidade do candidato representado
pelo termo k1. Os resultados obtidos na matriz resultante
devem representar os nveis de especialidade inferida nos
domnios representados pelos termos relacionados a k1 (e. g.
o nvel de especialidade no domnio k2 4,4). Em (5)
resumido o processo descrito.

(, ) = (, ) [()]||,

(5)

Neste ponto, o nvel de especialidade inferida ((, ))


do candidato u a partir do domnio d (i. e. utilizando o termo
d como base para a anlise na ontologia simples) dado
pelo produto do nvel prvio de especialidade do candidato
no domnio ((, )) e a matriz normalizada de
relacionamentos do termo d na ontologia ([()]||, ).
possvel notar que a matriz sempre ter dimenses || ,
pois composta por todos os || termos que compe a
ontologia em uma nica coluna matricial. Essa
multiplicao do nvel prvio de especialidade e a matriz de
relacionamentos
normalizada
deve
influenciar
a
probabilidade de o candidato u possuir as especialidades
relacionadas a d.
Como foi apresentado na Figura 3, os pesos dos
relacionamentos entre os termos so normalizados com o
maior peso existente na ontologia. Isto feito para que
termos que tenham baixos relacionamentos, mas estejam em

44

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

uma regio do grafo onde isso ocorre frequentemente, no


sejam encarados como altamente relacionados. Porm,
outras discusses podem questionar se este mesmo um
mtodo vlido, uma vez que uma ontologia de pesos leves
uma estrutura muito complexa que pode originar clusters de
relacionamentos entre termos, principalmente termos
relacionados a uma mesma rea do conhecimento. Dentro de
cada um destes clusters o comportamento dos
relacionamentos pode ser diferente, ora pesos muito altos,
ora muito baixos. Esse tipo de comportamento junto a
normalizao dos termos utilizando o maior valor
encontrado na ontologia pode prejudicar a anlise. A Figura
4 apresenta exemplos destes dois casos mencionados.

especialidades pode variar. Neste sentido, para encontrar o


valor final de expertise resultante da anlise utilizada uma
soma ponderada dos valores encontrados em cada uma das
anlises de tipos de especialidades, como apresentado em
(6).
(, ) = (, ) + (, ) + (, )
(6)
+ (, ) + (, )

A expertise do usurio u no domnio d dada pela soma


ponderada do nvel de especialidade demonstrada (, ), o
nvel de Especialidade Sugerida (, ),o nvel de
Especialidade Refutada (, ), o nvel de Especialidade
Desconhecida (, ) e o nvel de Especialidade Inferida
(, ). Os pesos da soma ponderada , , , e no so
definidos e devem variar conforme o ambiente no qual o
modelo for implantado. Aps o processo de soma ponderada
ainda opcional um processo de normalizao dos
resultados obtidos pela diviso das expertises de todos os
usurios pelo maior valor de expertise para cada domnio.
Esse processo pode facilitar a visualizao e compreenso
dos resultados da anlise pelos membros do ambiente social,
pois colocaria o resultado da anlise no intervalo [0, 1],
onde possuir o nvel 1 em algum domnio significaria ser o
maior especialista naquele domnio.

Figura 4 - Clusters na ontologia de pesos leves


Na Figura 4 apresentada a estrutura de ontologia de
pesos leves na qual pode-se observar a diviso em dois
clusters: C1 e C2. Os pesos em C1 so significativamente
menores que os pesos em C2. No entanto, se executado o
processo de normalizao proposto anteriormente, todos os
valores seriam divididos pelo maior valor de relacionamento
da ontologia, neste caso 840. Mesmo o termo mais
significante em C1 (340 em verde) seria considerado um
valor baixo na anlise. Uma soluo para esse problema
seria um processo de normalizao que considerasse apenas
os pesos dos relacionamentos do termo analisado. Porm,
isto poderia resultar em outro problema, pois termos que
no estiverem bem relacionados poderiam ser beneficiados
pela regio onde esto presentes. Por exemplo, o termo em
vermelho possui pesos baixos para C2, porm, caso sejam
normalizados com os termos de sua vizinhana facilmente
atingiro valores altos, pois os termos da vizinhana
tambm so baixos. Esses relacionamentos pouco
significantes iriam seriam comparados com os
relacionamentos mais relevantes do cluster (como o de 550),
pois estes podem estar prximos a outros relacionamentos
relevantes. Uma anlise aprofundada sobre as caractersticas
de cada um dos clusters poderia ser realizada para
solucionar este tipo de problema, porm tal anlise foge ao
escopo deste trabalho e fica como um possvel estudo
futuro.

5. CONSIDERAES FINAIS
Foi apresentado um modelo para recomendao de
especialistas em ambientes sociais virtuais. O modelo
encontra os nveis de expertise de cada membro do ambiente
em determinados domnios permitindo que esse nvel seja
utilizado para identificar quais os especialistas cujos
conhecimentos se adequam melhor a dada situao (ou
consulta). O sistema realiza o processo de medida de
expertise com base em informaes de publicaes
cientficas e sugestes de especialidades entre os membros
do ambiente. Alm dessas informaes adicionada
informao de uma ontologia simples para expandir os
resultados da anlise atravs da inferncia de provveis
domnios de especialidades dos indivduos e os respectivos
nveis de expertise do indivduo nesses domnios.
Como descrito na seo 4, a extenso do conjunto de
especialidades dos indivduos por meio da ontologia simples
vantajosa, pois permite a identificao de especialidades
latentes dos indivduos. Tais especialidades so
consideradas latentes, pois existe alta probabilidade de sua
existncia, porm no existem provas (i. e. documentos
disponveis) que indiquem essa existncia. A inferncia
dessas especialidades latentes ocorre por meio de uma
analise semntica das demais especialidades dos indivduos
com o auxlio da ontologia. Dessa forma, possvel estender
o conjunto de especialidades do indivduo o que origina
determinado nvel de flexibilidade para anlise, pois permite
que essas especialidades latentes tambm sejam
consideradas no processo de seleo de especialistas.

4.5 Integrao dos Resultados


Os nveis de cada uma das especialidades devem ser
utilizados a fim de determinar o valor de expertise do
usurio em cada domnio. Alm disso, em diferentes
ambientes, a relevncia dos diferentes tipos de

45

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Algumas das abordagens utilizadas no modelo ainda no


foram completamente validadas por falta de experimentos
mais aprofundados. Por exemplo, a definio do peso de
auto relacionamentos ao criar as matrizes a partir da
estrutura da ontologia, como descrito nas sees 4.1 e 4.4.
Tais experimentos que permitiriam a anlise da abordagem
utilizada para definir o peso desses auto relacionamentos
sero abordados em trabalhos futuros. Ainda relacionado
definio de matrizes a partir da ontologia, o problema
relacionado aos clusters naturalmente formados na estrutura
da ontologia no foi inserido no modelo. Como apresentado
na seo 4.4 essa uma anlise mais complexa da ontologia
e ainda carece de uma definio mais elaborada da
abordagem a ser utilizada para amenizar esse problema.

[12] K. K. Morgan, Does Polanyis Tacit Knowledge


Dimension Exist?, in Proceedings of Polanyi Society
Conference, 2008, pp. 1 35.
[13] R. A. Baeza-Yates and B. Ribeiro-Neto, Modern
Information Retrieval. Boston, MA, USA: AddisonWesley Longman Publishing Co., Inc., 1999.
[14] P. Borst, H. Akkermans, and J. Top, Engineering
ontologies, Int. J. Hum. Comput. Stud., vol. 46, no. 2
3, pp. 365406, Feb. 1997.
[15] T. R. Gruber, Technical Report KSL 92-71 Revised
April 1993 A Translation Approach to Portable
Ontology Specifications by A Translation Approach to
Portable Ontology Specifications, no. April, 1993.
[16] D. O. Rodrigues and E. M. Silva, T-SWEETS:
inferncia de confiana em redes sociais web. p. 4,
2008.
[17] M. Alavi, KPMG Peat Marwick U.S.: One Giant
Brain. Harvard Business School Pub., 1997.
[18] C. A. Barlett, McKinsey & Company: Managing
Knowledge and Learning, 2000.
[19] M. Alavi, KNOWLEDGE MANAGEMENT:
ISSUES, CHALLENGES, AND BENEFITS, Comun.
Assoc. Inf. Syst., vol. 1, no. February, pp. 137, 1999.
[20] D. W. Mcdonald and M. S. Ackerman, Just Talk to
Me: A Field Study of Expertise Location, pp. 111,
1998.
[21] F. Riahi, Z. Zolaktaf, M. Shafiei, and E. Milios,
Finding expert users in community question
answering, Proc. 21st Int. Conf. companion World
Wide Web - WWW 12 Companion, no. i, p. 791, 2012.
[22] L. Du and M. Johnson, Topic Segmentation with a
Structured Topic Model, no. June, pp. 190200, 2013.
[23] M. Riedl and C. Biemann, Text Segmentation with
Topic Models, J. Lang. Technol. Comput. Linguist.,
pp. 4769, 2012.
[24] G. Demartini, Finding Experts Using Wikipedia, in
Proceedings of the Workshop on Finding Experts on
the Web with Semantics (FEWS2007) at
ISWC/ASWC2007, 2007, pp. 3341.
[25] M. Fazel-zarandi and M. S. Fox, An Ontology for
Skill and Competency Management, in Formal
Ontology in Information Systems, 2012, pp. 89102.
[26] M. Mochol, H. Wache, and L. Nixon, Improving the
accuracy of job search with semantic techniques.
[27] C. A. Rockenbach, Recomendao de especialistas na
plataforma de gesto de conhecimento Konnen.
Palmas, TO, 2012, p. 79.
[28] E. M. Silva, D. O. Rodrigues, J. G. De Souza, P.
Fernan-, A. C. Salgado, S. Romero, L. Meira, and J. A.
F. Costa, Inferring Hidden Trust Relationships in
Social Networks for Encouraging Collaboration and
Cooperation among Individuals, in Collaboration and

Referncias Bibliogrficas
[1] Z. Bauman, 44 cartas do mundo lquido moderno.
Zahar, 2011, p. 226.
[2] J. O. Donovan and B. Smyth, Trust No One:
Evaluating Trust-based Filtering for Recommenders.
[3] D. Sullivan, D. Wilson, and B. Smyth, Improving
Case-Based Recommendation, in Advances in CaseBased Reasoning, Springer Berlin Heidelberg, 2002,
pp. 278291.
[4] P. Brusilovsky, Adaptive Hypermedia, pp. 87110,
2001.
[5] R. Boim, H. Kaplan, T. Milo, and R. Rubinfeld,
Improved recommendations via (more)
collaboration, Procceedings 13th Int. Work. Web
Databases - WebDB 10, p. 1, 2010.
[6] P. Melville, R. J. Mooney, and R. Nagarajan,
Content-Boosted Collaborative Filtering for
Improved Recommendations, no. July, pp. 187192,
2002.
[7] M. Fazel-Zarandi, H. J. Devlin, Y. Huang, and N.
Contractor, Expert recommendation based on social
drivers, social network analysis, and semantic data
representation, Proc. 2nd Int. Work. Inf. Heterog.
Fusion Recomm. Syst. - HetRec 11, pp. 4148, 2011.
[8] T. Casciaro and M. S. Lobo, Competent jerks, lovable
fools, and the formation of social networks., Harv.
Bus. Rev., vol. 83, no. 6, pp. 929, 149, Jun. 2005.
[9] M. Fazel-Zarandi and M. S. Fox, Constructing expert
profiles over time for skills management and expert
finding, Proc. 11th Int. Conf. Knowl. Manag. Knowl.
Technol. - i-KNOW 11, p. 1, 2011.
[10] M. J. Earl, Knowledge Management Strategies:
Toward a Taxonomy, no. I, pp. 215233.
[11] E. M. . Silva, R. A. . Costa, L. R. B. . Schmitz, and S.
R. L. Meira, SWEETS: um Sistema de
Recomendao de Especialistas aplicado a uma
plataforma de Gesto de Conhecimento, Rev.
Informtica Terica e Apl., vol. 18, 2011.

46

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Technology: 19th International Conference, CRIWG,


Wellington, New Zealand: Springer Berlin Heidelberg,
2013, pp. 4260.
[29] E. Z. S. Mamani and M. A. Gerosa, Clculo de
Reputao em Redes Sociais, in Anais do VIII
Simpsio Brasileiro de Sistemas Colaborativos, 2011,
pp. 200207.
[30] M. Taherian, M. Amini, and R. Jalili, Trust Inference
in Web-Based Social Networks Using Resistive

Networks, 2008 Third Int. Conf. Internet Web Appl.


Serv., pp. 233238, Jun. 2008.
[31] E. M. Silva, D. O. Rodrigues, J. G. De Souza, A. C.
Salgado, and S. R. L. Meira, T-SWEETS: An
Alternative to the Stimulus Collaboration from Trust
Inference in Social Networks, 2012 Brazilian Symp.
Collab. Syst., pp. 168173, Oct. 2012.

47

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

TidalTrust Versus. T-SWEETS: uma Anlise da Eficcia no


Processo de Inferncia de Confiana em Ambientes
Virtuais Sociais
Edeilson Milhomem Silva
Centro de Informtica
Universidade Federal de Pernambuco
UFPE (Refice/PE) e Centro
Universitrio Luterano de Palmas
CEULP/ULBRA (Palmas/TO), Brasil
(ems5@cin.ufpe.br e
milhomem@ceulp.edu.br)

Ana Carolina Salgado, Silvio Romero


Diego Oliveira Rodrigues,
Lemos Meira
Jackson Gomes de Souza,
Centro de Informtica Universidade
Parcilene Fernandes de Brito
Federal de Pernambuco - UFPE
Departamento de Computao
Centro Universitrio Luterano de
Palmas CEULP/ULBRA
diegopso2@gmail.com
(jgomes, parcilene)@ceulp.edu.br

e C.E.S.A.R
Centro de Estudos e Sistemas
Avanados do Recife - Recife, Brasil
(acs, srlm)@cin.ufpe.br

de mape-las em ambientes computacionais. Nesta direo,


estudos sobre as relaes de confiana entre indivduos em
ambientes virtuais sociais vm despertando o interesse de
pesquisadores da rea, uma vez que permitem representar a
estrutura bsica da sociedade, atravs das pessoas e seus
relacionamentos [2]. Assim, naturalmente, oferecem indicadores
para a identificao dos relacionamentos de confiana entre os
indivduos.

ABSTRACT
This paper presents an overview of trust relationships applied in
web-based social networks. Furthermore, it also presents some
approaches to identify hidden trust relationships in social
networks using information from the connections between
individuals (nodes in the network). We present these approaches:
(1) an algorithm called TidalTrust, a classical algorithm to trust
inference; and (2) T-SWEETS, an approach we did develop
previously. The T-SWEETS approach uses different elements to
infer hidden trust relationships, such as: individuals experiences
and opinions. This paper uses background from these two
approaches and aims to present a comparative analysis between
them using results from some experiments.

A estrutura de redes sociais pode ser mapeada em um grafo, em


que os ns podem representar as pessoas e as arestas representam
os relacionamentos entre estas pessoas. Uma aresta pode possuir
rtulos que caracterizam explicitamente a natureza dos
relacionamentos, por exemplo, rtulos de amizade ou de parceria
profissional. Estes relacionamentos podem ser unidirecionais ou
bidirecionais, por exemplo: a) unilateral: enquanto A explicita que
colega de trabalho de B, o segundo no confirma este
relacionamento; e b) bilateral: se uma pessoa A colega de
trabalho de B, ento, como consequncia, B tambm ser colega
de trabalho de A.

Categories and Subject Descriptors


H.5.3 [Group and Organization Interfaces]: Web; H.5.3 [Group
and Organization Interfaces]: Web-based interaction

General Terms

Considerando esta estrutura que pode ser mapeada


computacionalmente, diversos algoritmos foram propostos para a
inferncia de relacionamentos ocultos de confiana em ambientes
virtuais sociais, tais como, TidalTrust [3]; o RN-Trust, [5];
SUNNY [6][7]; FlowTrust [8]; o de Mamami [9]; e o T-SWEETS
[10]. Neste sentido, o objetivo do presente trabalho utilizar,
parte do algoritmo T-SWEETS, que foi desenvolvido por ns, e
fazer uma anlise em relao ao algoritmo clssico para inferncia
de confiana disponvel na literatura, o TidalTrust. Para isso, so
utilizados os resultados apresentados no trabalho de (Golbeck, [3]
e fontes de dados de relacionamentos de confiana oriundos do
Epinions 1, Slashdot 2 e Wikipedia 3.

Algorithms, Design, Human Factors.

Keywords
Anlise de Confiana, Redes Sociais, Interao, Sistemas
Colaborativos e Recomendao.

1. INTRODUO
Confiana oferece subsdios para apoiar a sociedade em tomadas
de decises, que vo desde as mais bsicas at as mais complexas
um dos elementos que mantm a sociedade [1]. Como
confiana um elemento que origina-se a partir das relaes
sociais entre indivduos, que so mantidas pela interao, troca de
experincias, convvio no trabalho ou em famlia, observao de
comportamentos, dentre outros, e estas relaes sociais podem ser
explicitamente ou implicitamente determinadas, h a possibilidade

O presente trabalho est organizado da seguinte forma: (Seo 1),


apresenta os conceitos e caractersticas peculiares s redes sociais;
(Seo 2) faz meno em como confiana pode ser mapeada em
ambientes computacionais; (Seo 3) so apresentados alguns
algoritmos para a inferncia de confiana; (Seo 4) apresenta

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

48

Epinions.com: Product
http://www.epinions.com/

Reviews

and

Consumer

Slashdot: News for nerds, stuff that matters: http://slashdot.org/

Wikipdia, a enciclopdia livre: https://pt.wikipedia.org/

Reports:

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

detalhes do algoritmo TidalTrust, um dos objetos da anlise


apresentada; (Seo 5) outro objeto de estudo deste trabalho, o
algoritmo T-SWEETS, (Seo 6) os experimentos realizados e o
resultados obtidos; e, por fim, (Seo 7) as Concluses.

supracitado, j que considera o contexto social das pessoas;


agregabilidade, tambm relacionada ao item II; e assimetria,
relacionada ao item I. A transitividade representa a possibilidade
de transferir a confiana de pessoa a pessoa. A agregabilidade
representa a condio que define se uma pessoa procurar
informaes adicionais para decidir se confia ou no em outra
pessoa. J a assimetria, indica que o nvel de confiana de uma
pessoa em relao outra unilateral, isto , a confiana de uma
pessoa A em relao B diferente da confiana de uma pessoa
B em relao A.

2. CONFIANA
O conceito de confiana um dos conceitos que sustenta a
sociedade e diz o quo confivel uma entidade (ex.: pessoa ou
um agente) em relao outra, e diferentes reas de conhecimento
realizam pesquisas sobre este conceito, por exemplo, Psicologia
[11][12] , Sociologia[13], Filosofia [14][14] e Computao [15]
[4].

Considerando as peculiaridades supracitadas, inerentes ao


conceito de confiana, existem na literatura alguns algoritmos
que realizam a inferncia de confiana, cada qual explora os
elementos disponveis no ambiente em que implantado. Neste
sentido, a seo 3 apresenta alguns trabalhos disponveis na
literatura com o referido propsito.

Um trabalho pioneiro sobre confiana em ambientes


computacionais foi o desenvolvido por Marsh [13]. Em seus
estudos, Marsh analisou o conceito nas diferentes reas, como
sociologia, com o intuito de formaliz-lo em ambientes
computacionais. Para isso, baseou-se em trs princpios: (1)
agentes que interagem entre si, (2) as informaes de histrico
mantidas a partir destas interaes; e (2) e a observao dos
comportamentos destes agentes. Diante destes estudos, Marsh
concebeu um modelo para aplicao em sistemas de Inteligncia
Artificial, para auxiliar agentes inteligentes a raciocinarem em
situaes de incerteza. Para a avaliao do modelo proposto, foi
criada uma situao, fundamentando-se no Dilema dos
Prisioneiros, em que alguns agentes poderiam interagir
ciclicamente.

3. ALGORITMOS PARA INFERNCIA DE


CONFIANA
TidalTrust [3] um dos algoritmos precursores de uma srie de
trabalhos que exploram a estrutura dos relacionamentos das redes
sociais para inferncia de confiana, porm recebe diversas
crticas pelos pesquisadores pela perda de informaes, pois
realiza uma rotina de seleo de fontes de informao (i. e. ns)
na rede, antes da anlise de confiana. Como evoluo do
TidalTrust foi desenvolvido o SUNNY [6][7] que, alm da
estrutura dos relacionamentos, tambm considera avaliaes dos
usurios sobre determinados contedos (como textos e fotos) para
auxiliar na inferncia de confiana. Alguns trabalhos similares ao
TidalTrust e SUNNY so [18][19].

Golbeck [4] baseou-se na definio dada por Deutsch [16] de que


confiana a aposta sobre futuras aes de outras pessoas para
o desenvolvimento de uma proposta de anlise de confiana para
os cenrios de redes sociais. Assim, so considerados dois
principais componentes para a definio: crena e compromisso.
A crena porque representa a viso de uma pessoa sobre
determinadas aes de outra pessoa considerada confivel; e o
compromisso, porque representa o nvel de comprometimento de
uma pessoa em realizar uma determinada ao.

Para sanar o problema da perda de informaes dos algoritmos


previamente apresentados, h o algoritmo FlowTrust [8] que,
para inferir confiana, utiliza todas as informaes de
relacionamentos disponveis na rede social. Este algoritmo, alm
de no perder informaes, aplica o conceito de
multidimensionalidade, isto , explora mais de um elemento (nvel
de confiana e nvel confidncia) para inferir confiana. No
entanto, as informaes exploradas pelo FlowTrust (dados de
relacionamentos na rede social) esto todas relacionadas ao
mesmo conceito e ainda so necessrias informaes de outras
fontes (ex.: como dados sobre contedos e contextos) para
aumentar a eficincia na identificao do fato de um usurio ser
realmente confivel. Outros algoritmos que exploram informaes
disponveis em toda a rede so RelTrust [20] e CircuitTrust [21].

Os estudos e as definies de confiana disponveis na literatura


oferecem subsdios para que algumas propriedades possam ser
definidas. Estas propriedades devem representar explicitamente
elementos que determinam naturalmente as relaes sociais entre
as pessoas (ex.: nvel de relacionamento como pai, irmo(a),
amigo(a), colega e namorado(a)) e devem ser bem definidas e
claras (ex.: as pessoas e seus relacionamentos) de forma que
possam ser utilizadas em ambientes computacionais.
Nesta direo, h trs elementos que esto relacionados
confiana que so fortemente discutidos na literatura, de acordo
com Reis [17], so eles, subjetividade, contexto e dinamismo.
i.

subjetividade: confiana subjetiva e, portanto,


assimtrica, isto , a confiana de uma pessoa p, em
relao a uma pessoa p1 no a mesma confiana da
pessoa p1 em relao a p;

ii.

contexto: confiana depende do contexto, ou seja, pode


ser medida de uma pessoa em relao outra, em um
grupo ou at mesmo diante de uma determinada situao;

iii.

dinamismo: confiana dinmica, isto , muda com o


tempo - pode aumentar se as experincias forem positivas,
e pode diminuir se as experincias forem negativas.

Um algoritmo que explora informaes dos documentos e


contedos publicados pelos usurios em um ambiente
colaborativo o apresentado por Mamami [9]. Este algoritmo
considera informaes sobre a quantidade e qualidade dos
contedos postados pelos usurios do domnio social. Alm
destes, h tambm o T-SWEETS [10], que une diferentes
elementos para a inferncia do grau de confiana entre dois
indivduos, so eles: semelhanas entre os perfis de conhecimento
e opinio; relacionamentos de confiana, os prprios valores (que
so atribudos explicitamente) de confiana entre os indivduos; a
maturidade de um indivduo, que mensura o quanto este
indivduos produz conhecimentos relevantes; e a reputao, que
considera a viso que um grupo de indivduos tem em relao a
uma pessoa em especfico.
O algoritmo objeto de anlise neste trabalho o TidalTrust. Alm
deste ser um algoritmo clssico da literatura, ele possui
caractersticas que se assemelham a um dos elementos

Assim, no mbito computacional, para a aplicao em redes


sociais, Golbeck [4] define algumas propriedades de confiana:
transitividade, que est diretamente relacionada ao item II

49

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

considerados no T-SWEETS, que o Relacionamento de


Confiana

usurios, mais confiveis so suas produes


consequentemente, mais confivel o autor;

e,

4. TIDALTRUST

Para que o algoritmo TidalTrust possa realizar a inferncia dos


relacionamentos de confiana entre os indivduos, inicialmente,
faz uma seleo dos ns que so considerados na anlise. Nesta
seleo so estabelecidos o tamanho mximo dos caminhos e os
valores mnimos de confianas entre os ns que podero ser
explorados durante a anlise de confiana. Em seguida, com estes
valores possvel excluir alguns ns que, segundo Golbeck [3],
reduziriam a preciso da anlise de confiana.

Destes elementos, o Relacionamento de Confiana, ser objeto


de estudo neste trabalho, j que o elemento que baseia-se em
caractersticas similares ao algoritmos clssico da literatura,
TidalTrust [3].
Este elemento baseia-se nas propriedades de confiana definidas
por Golbeck [4], que so: Transitividade, Assimetria e
Agregabilidade.

Aps a seleo dos ns a serem explorados na anlise de


confiana, o algoritmo TidalTrust calcula o valor de confiana
entre dois ns como uma mdia ponderada das informaes de
confiana extradas destes ns. A Equao 1 mostra como os
valores de confiana so calculados, onde , = (, ) quando i
for adjacente a j.
, =

adj(),,max

, ,

adj(),,max

A confiana entre as pessoas um fenmeno que pode ser


transitivo, j que as pessoas podem procurar informaes a
respeito das outras para obter parmetros que possam ser
utilizados no auxlio identificao do fato de uma pessoa ser ou
no confivel. Contudo, confiana no um fenmeno totalmente
transitivo, isto , nem toda confiana de uma pessoa pode ser
transferida a outra considerando sua rede de relacionamentos.
Isso implica dizer que: se uma pessoa a, confia muito em uma
pessoa b, e se b, por sua vez, confia muito em uma terceira pessoa
c - formando assim o caminho de relacionamento a->b->c -, no
quer dizer que a confia muito em c. Entretanto, podem ser
utilizadas informaes de confiana dos relacionamentos (a->b>c) para inferir o quo a pessoa a eventualmente poderia confiar
em c. Alm disso, dizer que a confia muito em b no implica que
b confie muito em a, neste caso a primeira informao (a->b)
sequer fornece condies para que se obtenha a segunda (b->a)
por isso, h a Assimetria [3]. Alm da Transitividade e
Assimetria, o Relacionamento de Confiana tambm pode
explorar o conceito de Agregabilidade [3], o qual define que se a
confia em mais de uma pessoa que possui informaes de
confiana sobre c, ento estas informaes podem ser
consideradas no processo de inferncia de confiana.

(1)

A Equao 1 representa o clculo da confiana de um n u em


relao a v. Para realizar o clculo so utilizados os ns
intermedirios j tais que o caminho de u a v seja menor que o
caminho mximo pr-definido, e os valores de confiana entre ns
adjacentes sejam maiores que o valor mnimo estabelecido (max).
Ainda na Equao 1, representa o peso da relao de u a v por
um determinado caminho o peso pode variar de acordo com o
domnio da anlise de confiana. Por exemplo, um algoritmo
derivado de TidalTrust o FilmTrust, utilizado para criar
recomendaes de filmes, neste caso o peso de cada relao
dado pela valor de avaliao de um n ao filme em questo.

5. T-SWEETS

Diante das condies previamente apresentadas para


Relacionamentos de Confiana, ela pode ser definida conforme
a Equao 2 [10]:

T-SWEETS, um algoritmo desenvolvido por ns [10] para


inferncia de confiana em ambientes virtuais sociais [10], baseiase em 4 (quatro) elementos para inferncia destes relacionamentos
de confiana, so eles:

similaridade entre perfis: considera que pessoas que


possuem perfis similares, sejam as opinies ou os
conhecimentos, tm tendncia a confiarem um no outro
mutuamente.

relacionamento de confiana: considera as relaes de


confiana j existentes entre as pessoas. Assim, considera a
confiana de um usurio a em relao a um usurio b
atribuda explicitamente por a; ou a probabilidade de a
confiar em b dado que existe um caminho de relacionamento
de confiana (e. g. abc) entre eles

nvel de maturidade: representa o quanto as produes dos


usurios so vistas na rede social. Para isso, so consideradas
todas as avaliaes dadas aos contedos de um usurio x em
relao s produes dos demais usurios y. Este elemento
considera que os usurios que produzem conhecimentos
relevantes s pessoas que os rodeiam e aos grupos que
participam, tendem a ser mais confiveis que os usurios que
no produzem conhecimento de qualidade. Quanto maior o
nvel de maturidade dos conhecimentos produzidos pelos

reputao: a viso que um grupo de pessoas g tem sobre


uma pessoa p, determinada pelo grau de confiana que g tem
em relao p.

(, ) =

(, ), caso exista um valor atribudo diretamente

1
(, ) , em caso contrrio
|(, )|
(,) adj(,)

(2)

Na Equao 2, a frmula para o valor de confiana pode variar de


acordo com a seguinte situao: caso o usurio a j tenha
atribudo um valor de confiana ao usurio b, ento este ser o
valor de confiana de a a b (T(a,b)), caso contrrio utilizada a
frmula apresentada na Equao 1, segunda parte. Nesta frmula,
P(a,b) o conjunto de todos os caminhos p que podem ser
estabelecidos entre os usurios a e b na representao do grafo da
rede social, com |P(a,b)| sendo o nmero de elementos deste
conjunto. Cada elemento deste conjunto um par (u,v), que
representa cada aresta, e as informaes de confiana relacionadas
a ela, que relacionam os usurio u e v em um caminho p.

5.1 T-SWEETS versus. TidalTrust


O T-SWEETS baseia-se na teoria do TidalTrust para a seleo dos
caminhos de confiana que so considerados para o processo de
inferncia de confiana. Assim, so considerados apenas os
menores caminhos que unem dois usurios a e b.

50

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

No TidalTrust, alm dos menores caminhos, tambm


estabelecido um limiar de grau de confiana para decidir se um
caminho deve ou no ser considerado. No T-SWEETS, este limiar
no adotado, pois acredita-se que a qualidade do algoritmo pode
ser comprometida, uma vez que valores baixos de confiana
seriam desconsiderados. Se os valores baixos de confiana no
fizerem parte da anlise, h uma tendncia natural para o aumento
do grau de confiana inferido entre dois usurios a e b.

relacionamentos de confiana. Slashdot, um site voltado para


publicaes de notcias de tecnologia. Neste ambiente, os usurios
podem associar tags a outros usurios classificando-os como
amigos ou inimigos. Wikipedia, uma enciclopdia online em que
as pessoas podem colaborar livremente para o seu
desenvolvimento. Os usurios podem passar para a categoria de
administradores da enciclopdia, a partir das avaliaes que
podem receber de outros usurios, que so positivas, negativas e
neutras.

A definio para inferncia dos Relacionamentos de Confiana


adotada no T-SWEETS baseada na definio apresentada por
Golbeck [3], que confiana no um fenmeno totalmente
transitivo. Apesar desta definio, o algoritmo TidalTrust torna a
transitividade de confiana totalmente transitiva em algumas
situaes. J o formalismo do T-SWEETS resolve este problema.
Para exemplificar esta situao, ser considerada a situao em
que o objetivo calcular o grau de confiana entre dois usurios F
e E. O caminho entre eles FH, e o valor de confiana que

Estas fontes de dados so oriundas do trabalho de Leskovec [22],


e esto disponveis no projeto SNAP 7, desenvolvido por
pesquisadores de Stanford. O trabalho de Leskovec [22] analisa
estes relacionamentos a partir de associaes ternrias (trades),
que so relacionamentos formados pelo conjunto de trs ns,
conforme apresentado na Figura 1.

F tem em H e H tem em E 0,8. Assim, o clculo detalhado em


ambos os algoritmos apresentado no Quadro 1.
Quadro 1: Demonstrao da problemtica do algoritmo TidalTrust
em relao ao conceito de Transitividade de Confiana.
Algoritmo
TidalTrust
T-SWEETS

Inferncia de confiana entre F e


E
1
(0.8 0.8 + 0.8 0.8) = 0,8
1,6

Figura 1: Estrutura de uma trade


Cada relacionamento forma uma relao de confiana de valores
{-1,+1}, em que o valor positivo indica que h a confiana entre
os ns, enquanto o valor negativo indica a ausncia de confiana.
De acordo com este cenrio, o Quadro 2 apresenta a proporo
dos dados originados de cada uma das fontes supracitadas.

1
(0.8 0.8 + 0.8 0.8) = 0,64
2

Tanto o T-SWEETS quando o TidalTrust explora a transitividade


de confiana baseada em um modelo probabilstico. Porm,
existem outros algoritmos que exploram a transitividade de
confiana baseando-se em teorias diferentes. Por exemplo, RNTrust (2008) e FlowTrust [8], que baseiam-se teorias que avaliam
o mximo de confiana que pode fluir (passar) atravs dos ns de
uma rede.

Quadro 2: Classificaes e quantidades de trades nas fontes de


dados do Epinions, Slashdot e Wikipdia [22].

6. Experimento: Anlise do T-SWEETS


Versus. Algoritmos Relacionados

6.1 Objetivo
Para a anlise da eficcia do algoritmo T-SWEETS, inicialmente,
foi realizado um experimento considerando os resultados obtidos
nos relacionamentos de confiana oriundos do trabalho
desenvolvido por Leskovec [22]; e depois foi realizada uma
anlise em relao ao algoritmo TidalTrust [3].

Foram utilizadas como fonte de relacionamentos de confiana,


dados oriundos do Epinions 4, Slashdo 5t e Wikipedia 6. Epinions
um ambiente em que os usurios podem realizar avaliaes a
determinados produtos (e.g. notebook e smartphone) ou avaliar
pessoas (os prprios avaliadores). A partir das avaliaes
realizadas entre estes avaliadores forma-se uma rede social de
Epinions.com: Product
http://www.epinions.com/

Reviews

and

Consumer

Slashdot: News for nerds, stuff that matters: http://slashdot.org/

Wikipdia, a enciclopdia livre: https://pt.wikipedia.org/

| |

+++

11.640.257

( )

947.855

7,1%

++

698.023

5,2%

89.272

0,7%

87%

As trades podem variar conforme o valor atribudo aos


relacionamentos na rede social, conforme apresentado no Quadro
2. Por exemplo, 3 uma trade na qual os trs relacionamentos
possuem pesos positivos, j em 2 apenas um relacionamento
positivo, enquanto que os outros dois so negativos. Para executar
o algoritmo T-SWEETS nas bases supracitadas, o tamanho do
caminho entre dois ns tambm foi limitado a 3 tamanho esse
limitado pela trade.

6.2 Cenrio

Trade

6.3 Resultados
Experimento

da

Primeira

Fase

do

De acordo com as associaes ternrias mencionadas


anteriormente e os valores positivos e negativos, alguns cenrios

Reports:

51

Stanford
Large
Network
http://snap.stanford.edu/data/#signnets

Dataset

Collection:

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

para a inferncia de relacionamentos de confiana podem ser


representados. A Figura 2 apresenta estes cenrios.

confiana foi nulo ou foi integral (100%). Contudo, esta


deficincia pode ser justificvel, uma vez que foram utilizados
valores inteiros positivos e negativos. Para evitar esta limitao, o
ideal utilizar valores fracionados em uma escala de [-1...+1].

6.3.1 Problema
Leskovec [22] faz uso dessas trades para analisar os seguintes
princpios: o amigo do meu amigo meu amigo; o amigo do
meu inimigo meu inimigo; o inimigo do meu amigo meu
inimigo; e o inimigo do meu inimigo meu amigo. Alm
disso, considera apenas valores inteiros de confiana, {-1,+1}.
Essas caractersticas inviabilizam a utilizao de um caminho no
grafo social maior que 3, j que tornaria ainda mais ineficaz a
avaliao de confiana entre dois indivduos. Essa ineficcia
deve-se, principalmente, por tornar totalmente transitiva a relao
de confiana entre dois ns A e B, independente do tamanho do
caminho que os une. Esta ineficcia tambm ocorre em um
caminho 3, porm, nestes casos, h uma representao dos
princpios apresentados no incio desta seo (por exemplo, o
amigo do meu inimigo meu inimigo) o propsito de Leskovec.

Figura 2: Possibilidades de trades que podem ser usadas nas


anlises
Leskovec [22] apresentou um estudo de algumas possibilidades
para a construo de trades, de acordo com os valores {-1,+1}.
Neste estudo, foi apresentado que, dado dois relacionamentos com
valores de confiana quaisquer (+1 ou -1), qual a probabilidade do
terceiro ser positivo ou negativo. O relacionamento com a seta
vermelha na Figura 2 representa este terceiro relacionamento. Este
quadro de probabilidades pode ser visualizado no Quadro 3.

Tanto o T-SWEETS quanto o TitalTrust, realizam inferncia com


maior eficcia com entradas positivas fracionrias no intervalo
[0,1]. Assim, possvel a obteno de valores de confiana no
discretos entre indivduos da rede. Ou seja, a inferncia de
confiana no totalmente transitiva, um dos princpios da anlise
de confiana.

Quadro 3: Probabilidades de inferncia de relacionamentos


positivos e negativos para cada trade. ([22] - adaptada)

(+)
0,97

()

0,54

0,46

0,30

0,70

0,23

0,77

6.4 Resultados
Experimento

da

Segunda

Fase

do

Para realizar uma anlise sobre valores fracionados e positivos, foi


usado o conjunto de dados apresentados no trabalho de [3], que
so usados para analisar o algoritmo Tidaltrust.

0,03

De acordo com as probabilidades apresentadas no Quadro 3,


possvel executar o algoritmo T-SWEETS e verificar a sua
eficcia. Alm do T-SWEETS, tambm, foi realizada uma anlise
em relao ao algoritmo clssico TidalTrust [3]. Assim, para cada
uma das configuraes apresentadas (Figura 2 e Quadro 3), o
Quadro 4 apresenta os resultados obtidos.
Quadro 4: Porcentagem da quantidade de relacionamentos
positivos em cada trade

(+)

Leskovec [22]

TidalTrust

T-SWEETS

97%

100%

100%

54%

0%

0%

30%

0%

0%

23%

100%

100%

Figura 3: Grafo de relacionamentos utilizado para analisar os


algoritmos (Taherian, 2008)
Aps a aplicao de ambos algoritmos, TidalTrust e T-SWEETS,
foram inferidos valores de confiana entre os ns apresentados no
grafo da Figura 3. Os valores inferidos so apresentados nos
Quadros 5 e 6. Os valores destacados so os graus de confiana
que foram atribudos diretamente pelos usurios a outros usurios

De acordo com os resultados que podem ser visualizados no


Quadro 4 pode-se observar que tanto os resultados obtidos do TSWEETS, quanto do TidalTrust, so valores muito
determinsticos nos cenrios apresentados. Isto , ou o grau de

52

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Quadro 5: Resultados (escala de 0 a 10) aps a execuo do


algoritmo T-SWEETS aplicado no cenrio da Figura 3.
A

7.5

10

3.7

2.5

1.3

3.2

0.2

1.2

0.7

0.5

0.7

7.5

0.3

0.9

0.9

2.5

0.9

2.2

1.1

2.2

0.8

10

0.5

2.5

6.9

2.5

3.4

0.9

0.5

0.7

0.3

0.2

2.5

2.5

0.1

2.5

0.9

0.6

3.7

1.9

2.8

3.7

0.7

1.8

0.9

4.4

3.7

1.9

2.8

3.7

1.4

1.8

0.9

7.5

5.3

2.5

1.3

1.9

2.5

0.9

0.5

0.6

0.3

10

2.5

3.7

2.5

3.7

1.9

2.5

0.7

7.5

3.7

5.6

7.5

2.8

1.4

3.7

1.9

2.4

0.1

10

7.5

10

7.5

10

3.7

1.9

2.5

1.3

3.2

De acordo com o que pode ser observado no Quadro 7, a mdia


dos valores de confiana entre os relacionamentos maior no
algoritmo TidalTrust. O valor menor obtido no T-SWEETS em
decorrncia de que este se baseia no princpio que quanto maior
os caminhos de confiana que unem dois ns, menor a relao
de confiana entre eles. Assim, T-SWEETS considera que pessoas
que estejam mais prximas, tm maior tendncia que haja uma
maior relao de confiana entre elas, j que esta relao de
confiana baseada em informaes (e.g. trocas de experincias)
que as pessoas possuem umas sobre as outras.

Quadro 6: Resultados (escala de 0 a 10) aps a execuo do


algoritmo TidalTrust aplicado no cenrio da Figura 3. [5]
A

7.5

10

7.5

2.5

2.5

10

2.5

7.5

7.5

7.5

10

7.5

5.7

2.5

2.5

8.8

7.5

10

7.5

10

2.5

10

2.5

7.5

10

7.5

7.5

2.5

2.5

3.8

7.5

7.5

10

5.7

2.5

2.5

8.8

7.5

7.5

10

7.5

5.7

2.5

7.5

2.5

7.5

10

7.5

10

7.5

2.5

10

2.5

7.5

10

7.5

10

7.5

5.7

7.5

7.5

10

7.5

5.7

2.5

10

2.5

10

7.5

10

7.5

10

7.5

2.5

2.5

10

Figura 4: Disperso dos valores obtidos para o grafo da Figura 3


com os algoritmos TidalTrust e T-SWEETS.
Alm da disperso (existem pontos sobrepostos) dos valores
obtidos com a execuo dos algoritmos TidalTrust e T-SWEETS,
no cenrio apresentado anteriormente, so aprestadas tambm as
tendncias dessas disperso, considerando o aumento na distncia
do caminho social que liga dois ns no grafo. Essas linhas de
tendncias foram calculadas a partir da interpolao dos pontos na
disperso em um polinmio de grau 5. De acordo com o grfico
apresentado na Figura 3 (linha pontilhada) possvel observar que
no T-SWEETS a tendncia decrescente, na maior parte de sua
extenso, medida que a distncia social aumenta. Ao mesmo
tempo, o algoritmo TitalTrust apresenta um comportamento sem
padro em relao distncia social. Diante da premissa que
quanto maior a distncia social entre dois ns h uma tendncia de
menor relao de confiana entre eles, o T-SWEETS apresenta
um comportamento mais adequado.

7. CONCLUSES
Para uma compreenso do conceito de confiana, um dos
fenmenos que sustenta a sociedade, e como este vem e pode ser
explorado em ambientes computacionais, o presente artigo
apresentou a definio de confiana, suas propriedades, e como
esta pode ser utilizada/inferida em ambientes de redes sociais,
explcitas ou implcitas.

Quadro 7: Mdia e desvio padro dos valores dos Quadros 5 e 6.


Mdia

Desvio Padro

T-SWEETS

4,73

3,59

TidalTrust

6,27

3,13

Com a descoberta de relacionamentos ocultos de confiana em


ambientes virtuais sociais, h uma tendncia natural no estimulo
colaborao entre os indivduos destes ambientes, uma vez que
contribuiria para que os usurios explicitassem seus
conhecimentos nestes ambientes com uma maior frequncia [10].
Nesta direo, foi objetivo deste trabalho apresentar os resultados
de uma anlise em duas das abordagens para inferncia de
relacionamentos de confiana que possuem caractersticas
similares para medir a eficcia de ambos e, assim, naturalmente,

53

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

identificar qual delas poderia ter um resultado mais satisfatrio


caso fossem efetivamente implantadas em uma plataforma virtual
social. Com isso, constatou-se que a abordagem T-SWEETS [10]
considera com maior eficcia a relao entre o grau de confiana e
a distncia social em que duas pessoas esto na rede social, uma
vez que tem uma tendncia natural a diminuir o nvel de confiana
entre dois indivduos se estes esto a uma distncia social maior
um do outro. Ao mesmo tempo, a abordagem TidalTrust [3] no
possui um comportamento padro considerando este afastamento
entre as pessoas (a distncia social entre elas).

[11] Yamagishi, T. & Yamagishi, M. (1994): Trust and


commitment in the United States and Japan. Motivation and
Emotion, vol. 18, Issue 2, pp. 129166.

Alm disso, foi constatado tambm com esta anlise que a


utilizao da escala que determina o grau de confiana entre dois
indivduos na rede social pode influenciar nos resultados das
inferncias dos relacionamentos de confiana que esto implcitos
no ambiente. Assim, sugerido que, em uma eventual
implantao das abordagens em uma plataforma social, o ideal
que seja utilizada uma escala fracionada [-1...+1] ao invs de
valores inteiros positivos e negativos.

[13] Murayama, H.; Taguchi, A.; Ryu, S.; Nagata, S.; Murashima,
S. (2011) : Institutional trust in the national social security
and municipal healthcare systems for the elderly and anxiety
with respect to receiving elderly care in Japan: a crosssectional study, Oxford Journals (Oxford University Press),
Health Promot

Cooperation among Individuals, 19th International


Conference, CRIWG, Springer Berlin Heidelberg , v. 8224,
p. 42-60.

[12] Yamagishi, T., Cook, K. S. & Watabe, M. (1998):


Uncertainty, trust and commitment formation in the United
States and Japan. American Journal of Sociology, vol. 104,
Issue 1, pp. 165194.

[14] Scheffler, I. (2010): Worlds of Truth: A Philosophy of


Knowledge By Israel iScheffler, Worlds of Truth: A
Philosophy of Knowledge, Oxford University Press, vol. 70,
Issue 2, pp. 383-385,

Como trabalho futuro, espera-se realizar um estudo para tentar


identificar caractersticas no algoritmo T-SWEETS que possam
ser utilizadas como objeto de estudo/anlise em relao a outros
algoritmos. Alm de, tambm, apresentar diferentes anlises
dentre o conjunto de algoritmos disponveis na literatura
comparando-os uns com os outros. Para que, ento, a partir destas
anlises possam ser apresentados dados que comprovem uma
direo para o formalismo ideal para inferncia de
relacionamentos ocultos de confiana em redes sociais.

[15] Marsh, S. (1994): Formalising Trust as a Computational


Concept. PhD thesis, Department of Mathematics and
Computer Science, University of Stirling.
[16] Deutsch, M. (1962): Cooperation and Trust. Some
Theoretical Notes. in Jones, M.R. (ed) Nebraska Symposium
on Motivation. Univer. Nebraska Press, xiii, p. 330.

8. REFERNCIAS

[17] Ries, S., Kangasharju, J., & Muhlhauser, M. (2006). A


Classification of trust systems, 782 LNCS 4277/2006. Berlin:
Springer, pp. 894903

[1] Yamamoto, Y. (1990): A Morality Based on Trust: Some


Reflections on Japanese Morality, Journal Philosophy East &
West. vol: 40, ed. 4, p. 451-469.
[2] Pimentel, M., Fuks, H. (2011) Sistemas Colaborativos, Ed.
Elsevier, p. 375.

[18] Katz Y.; Golbeck J. (2006): Social network-based trust in


prioritized default logic, proceedings of the 21st national
conference on Artificial intelligence, p.1345-1350..

[3] Golbeck, J. (2005): Computing and Applying Trust in


Webbased Social Networks. Ph.D. Dissertation, University
of Maryland, College Park, MD, USA.

[19] Golbeck, J.; Hendler, J. (2006): Inferring binary trust


relationships in Web-based social networks, Journal ACM
Transactions on Internet Technology, vol. 6, ed. 4

[4] Golbeck, J. (2008): Trust on the World Wide Web: A


Survey. Foundations and Trends in Web Science, vol. 1: no
2, pp 131-197.

[20] Mahoney G.; Myrvold, W., and Shoja, G. C. (2005):


Generic Reliability Trust Model, Proc. of PST pp. 113-120.
[21] Taherian, M.; Amini, M., and Jalili, R. (2008) Trust
Inference in Web-Based Social Networks using Resistive
Networks, Proc. of ICIW, pp. 233-238.

[5] Taherian, M.; Amini, M., and Jalili, R. (2008): Trust


Inference in Web-Based Social Networks using Resistive
Networks, Proc. of ICIW, Washington, DC, USA, pp. 233238.

[22] Leskovec, J.; Huttenlocher, D.; Kleinberg, J.: (2010) Signed


networks in social media, CHI '10 Proceedings of the
SIGCHI Conference on Human Factors in Computing
Systems, pp. 1361-1370.

[6] Kuter, U., Golbeck, J. (2007): SUNNY: a new algorithm for


trust inference in social networks using probabilistic
confidence models, Proceedings of the 22nd national
conference on Artificial intelligence, p.1377-1382, ancouver,
British Columbia, Canada.
[7] Kuter, U., Golbeck, J. (2010): Using probabilistic confidence
models for trust inference in Webbased social networks.
ACM Trans. Intern. Tech. vol. 10, ed. 2.
[8] Wang, G.; Wu J. (2011): FlowTrust: Trust Inference with
Network Flows. In Frontiers of Computer Science. China,
vol. 5, n. 2, p. 181-194.
[9] Mamami, E. Z. S.; Gerosa, M. A., (2011): Clculo de
Reputao em Redes Sociais. VIII Simpsio Brasileiro de
Sistemas Colaborativos, p. 202207.
[10] Silva et. Al. (2013): Inferring Hidden Trust Relationships in
Social Networks for Encouraging Collaboration and

54

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Um Mtodo para Recomendao de Relacionamentos em


Redes Sociais Cientficas Heterogneas
Patrcia Zudio de Lima

Luziane Ferreira de Mendona

Jonice Oliveira

Universidade Federal do Rio de


Janeiro

Universidade Federal do Rio de


Janeiro

Universidade Federal do Rio de


Janeiro

patricia.lima@ppgi.ufrj.br

luziane@dcc.ufrj.br

jonice@dcc.ufrj.br

bem curto, se estendendo a no mximo trs anos. Quando esses


alunos concluem seus estudos, levam consigo todo o aprendizado
adquirido, no passando adiante o conhecimento de suas
dissertaes, pesquisas e projetos, para que seja dada
continuidade a eles. O mesmo ocorre com posdocs, professores e
pesquisadores que permanecem pouco tempo em uma instituio.
H tambm os casos das aposentadorias, transferncias para outras
instituies e mudanas para outros empregos. Quando esses
pesquisadores e professores perdem o vnculo com a instituio,
corre-se o risco de ningum dar continuidade aos seus projetos e
pesquisas. Isso pode ocorrer por falta de conhecimento do que se
trata a pesquisa, pois o pesquisador pode ter trabalhado nela
sozinho e no passou seu conhecimento adiante, ou ainda, por se
tratarem de assuntos em que h poucas pessoas com interesse ou
expertise neles. Esse ltimo caso reflete aquele em que h raros
especialistas dentro de uma determinada rea, e quando se precisa
de algum para trabalhar no assunto, no se encontra, ou precisa
resgatar pessoas j aposentadas.

ABSTRACT

The social network area is in evidence nowadays. In this area,


topics like academic social network and link prediction are
arousing interest among researchers because of information flow
problem in academic scenario. For better knowledge
dissemination, several studies have been done in this area
analyzing an academic social network and suggesting partnerships
between researchers. Because of it, this work proposes a new link
prediction method of researchers based on common neighbors and
shortest path.We use Ant Colony Algorithm to implement our
proposed method.

Categories and Subject Descriptors

J.4 [Computer Applications]: Social and Behavioral Sciences,


K.4.3 Organizational Impacts [Computers and Society], G.1.6
Optimization [Numerical Analysis].

General Terms

Ainda relacionado ao fluxo da informao, outro problema a


maneira como o conhecimento cientfico disseminado. Apesar
dos avanos da Cincia, a divulgao dos resultados ainda
paper-oriented, ou seja, atravs de artigos e teses. Se dois
pesquisadores trabalharem na mesma rea ou reas correlatas, mas
publicarem em veculos diferentes ou participarem de eventos
diferentes, existe uma chance de no se conhecerem.

Algorithms, Experimentation.

Keywords

Sistemas de Recomendao, Predio de Relacionamentos, Redes


Sociais.

No ambiente acadmico tambm h casos em que o conhecimento


fica restrito a um pesquisador ou a um grupo devido ausncia de
interao externa. Por exemplo, em grupos de pesquisa de uma
determinada rea em uma universidade, naturalmente as pessoas
interagem muito entre si, ocorrendo uma troca de conhecimento.
Porm, a interao com outros fora do seu grupo ou instituio
mais rara. Como consequncia, h grupos diferentes
desenvolvendo trabalhos similares, s vezes at iguais,
acarretando em gastos e retrabalho desnecessrios.

1. INTRODUO

A rea de anlise de redes sociais uma rea abrangente que vem


crescendo e despertando o interesse de vrios pesquisadores nas
ltimas duas dcadas [12]. Podemos verificar esse fato atravs do
aumento de publicaes relacionadas com esse assunto nos
ltimos seis anos [12]. O avano das pesquisas nessa rea
possibilitou o surgimento de novas frentes de estudo mais
especficas, tais como, as redes sociais cientficas [26]. Tais redes
retratam a interao existente entre os pesquisadores dentro da
comunidade cientfica,
atravs dos seus diferentes
relacionamentos.

Estes problemas apresentados podem ser identificados com o


auxlio da anlise da rede social cientfica. Todos os diferentes
tipos de relacionamento presentes em uma comunidade cientfica
enriquecem o entendimento sobre a rede social. Por isso, podem
ser analisados para identificar grupos e a interao entre eles,
melhorar o fluxo da informao e a disseminao do
conhecimento. Aps analisar a rede, uma das maneiras de tentar
melhorar o fluxo da informao realizar recomendaes de
pares, ou seja, sugerir relacionamentos entre ns da rede. Tais
recomendaes podem ser feitas utilizando dois tipos de redes
sociais distintas: homogneas ou heterogneas [30]. Redes sociais
homogneas so aquelas que apresentam apenas um tipo de n e
um tipo de relacionamento. Por exemplo, uma rede social
cientfica homognea de coautoria apresenta relacionamentos de

O cenrio cientfico apresenta problemas com o fluxo da


informao e com a disseminao do conhecimento. Uma das
causas destes problemas a rotatividade de pessoas neste meio.
Por exemplo, o tempo de permanncia de um aluno de mestrado
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

55

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

coautoria entre pesquisadores, ou seja, os ns da rede so os


pesquisadores e as arestas so os relacionamentos de coautoria
entre eles. J as redes sociais heterogneas so redes mais
complexas, pois apresentam diferentes tipos de ns e/ou diferentes
tipos de relacionamentos. Em uma rede social heterognea de
viagens podemos ter pessoas e lugares como ns e,
relacionamentos de visita entre pessoas e lugares, assim como
relacionamentos de amizade entre as pessoas.

Palavras-chaves tambm so utilizadas por [29], porm, em seu


trabalho ele considera as palavras-chaves que j esto presentes
nas publicaes. H trabalhos que no levam em considerao
palavras-chaves extradas de artigos para medir a semelhana
entre pesquisadores, mas sim as referncias e citaes. o caso
do trabalho [11] de Heck, em que dois pesquisadores so
semelhantes se os trabalhos referenciados em suas publicaes
forem similares. Se dois pesquisadores forem citados pelos
mesmos trabalhos, tambm so considerados semelhantes. Ao
usar essa abordagem, Heck em [11] est indiretamente tentando
descobrir as reas de pesquisa dos pesquisadores.

De acordo com [30], a maioria dos trabalhos encontrados sobre


recomendao de pares em redes sociais cientficas fazem uso de
redes homogneas. A rede homognea mais utilizada para analisar
os relacionamentos de colaborao entre pesquisadores a de
coautoria [31]. Porm, a acurcia da recomendao de pares
melhor quando so utilizadas redes heterogneas [30]. Com o uso
de redes heterogneas, diferentes tipos de interao entre os
pesquisadores podem ser analisados e, os diferentes tipos de
relacionamento podem ser considerados no modelo de
recomendao. Ao considerar somente um tipo de relacionamento
no modelo de recomendao, dois pesquisadores que j possuem
uma ligao podem ser recomendados equivocadamente. Como
por exemplo, um caso em que dois pesquisadores de interesses em
comum co-orientam alunos juntos, porm no so coautores. Na
rede social de coautoria, eles no possuiriam relacionamentos e
poderiam ser recomendados um ao outro, mesmo j existindo
outros tipos de relacionamento entre eles. Tais relaconamentos
no poderiam ser detectados devido a rede s considerar um tipo
de relacionamento.

Um desafio nesta rea levar em considerao caractersticas


pessoais dos ns para fazer as recomendaes, pois difcil obter
tais dados [30]. J caractersticas profissionais, com respeito a
publicaes, encontram-se disponveis em diferentes bases de
dados na World Wide Web, como por exemplo, a base de dados
da Dblp [6]. No mbito nacional, essas informaes podem ser
extradas da Plataforma Lattes [15]. Para tentar utilizar
caractersticas pessoais, [24] fez uso do Myers-Briggs Type
Indicator (MBTI) [25], uma classificao tipolgica para
identificar o perfil psicolgico de cada pesquisador. Alm disso,
ele tambm utilizou as competncias dos pesquisadores, extradas
atravs da minerao das publicaes. Devido ao uso do MBTI,
foi possvel recomendar pesquisadores com perfis compatveis,
idnticos ou opostos. Brando em [3] fez uso do princpio de
homofilia para recomendar pares. Este princpio afirma que
pessoas tendem a se relacionar com pessoas que possuam
caractersticas similares. Para aplicar este princpio, Brando
considera que pesquisadores tendem a colaborar com
pesquisadores de instituies com as quais eles j tenham
colaborado anteriormente.

Diante disso, este trabalho visa propor um mtodo para


recomendao de novos relacionamentos entre pesquisadores
utilizando redes sociais heterogneas, levando em considerao
diferentes tipos de interao cientfica e o perfil do pesquisador
(sua formao acadmica, titulao, bolsa de produtividade, e
etc.). O mtodo proposto utiliza o algoritmo Ant Colony.

As caractersticas citadas anteriormente, utilizadas para a


recomendao de pares, so comumente encontradas na literatura.
So caractersticas clssicas que compe o perfil de um
pesquisador e que so utilizadas em muitos trabalhos. No entanto,
Heck em [11] prope uma caracterstica nova, que no provm
diretamente do pesquisador, mas do olhar que uma pessoa tem
sobre os trabalhos daquele pesquisador. Ela prope explorar as
informaes contidas em redes sociais online, como por exemplo,
o Citeulike [5], para melhorar a recomendao. Para isso, ela usa
as classificaes dadas aos artigos dos pesquisadores para detectar
a semelhana entre eles. Essa classificao feita por usurios do
Citeulike a partir de tags. Os pesquisadores que possuem
trabalhos classificados com um conjunto de tags iguais so
considerados similares.

Na seo seguinte (2) iremos apresentar os trabalhos correlatos.


Na seo 3 ser apresentada a arquitetura conceitual da
abordagem proposta. Na seo 4 ser descrito o extrator de dados
criado para coletar as informaes dos currculos Lattes [15] dos
pesquisadores para montar a rede social. Na seo 5 ser
apresentado o mtodo de recomendao. A seo 6 traz a
concluso deste trabalho. E por fim, a seo 7 conter os
agradecimentos.

2. TRABALHOS CORRELATOS

A rea de recomendao de relacionamentos em redes sociais


cientficas possui trabalhos com abordagens bem distintas entre si,
que levam em considerao diferentes aspectos da rede para
realizar as recomendaes entre pesquisadores. Alguns trabalhos
consideram as caractersticas dos ns, ou seja, os atributos, para
determinar a semelhana entre eles. Tais caractersticas podem
ser: reas de pesquisa, palavras-chaves contidas em artigos,
expertise, local de trabalho, lngua falada, e etc. H ainda
trabalhos que consideram os relacionamentos existentes entre os
ns, tais como, coautoria, citao, referncia bibliogrfica,
participao em eventos, e etc.

Alm das caractersticas dos ns, podem ser utilizadas


caractersticas topolgicas da rede, ou seja, de sua estrutura, para
fazer recomendaes. A estrutura de uma rede social pode afetar o
seu funcionamento, ou seja, o modo como a informao se
propaga entre os membros da rede [28]. A partir da anlise da
estrutura possvel detectar problemas na mesma e, uma tentativa
de amenizar tais problemas fazer a recomendao de
relacionamentos. Para detectar ns problemticos na rede, [24]
utiliza algumas mtricas que detectam caractersticas dos ns e da
rede como um todo, tais como: densidade, inclusividade,
centralidade local absoluta, centralidade local relativa e
centralidade global. [28] tambm utiliza a topologia da rede para
prever relacionamentos, porm, com uma proposta diferente: ao
invs de prever um relacionamento no futuro que no existe no
presente, ele prev relacionamentos recorrentes, ou seja, prev se
existiro novos relacionamentos no futuro entre dois ns que j

Em [18] so utilizadas as reas de pesquisa de um pesquisador


como uma das medidas para calcular a similaridade entre ele e
outros pesquisadores. Para definir as reas de cada pesquisador
foram utilizadas as palavras-chaves extradas dos ttulos das
publicaes de cada um deles. O nosso mtodo tambm utiliza as
reas de pesquisa de um pesquisador, porm considerando as
reas de atuao que so inseridas em seu currculo Lattes.

56

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

possuem pelo menos um relacionamento no presente. Para isso,


ele utiliza redes de coautoria em seu experimento.

escolhida a plataforma Lattes como a fonte de onde os dados


seriam extrados. A subetapa seguinte foi a de criao do extrator
de dados, que ser descrito brevemente posteriormente. Por fim,
foi realizada a coleta dos dados dos pesquisadores necessrios
para a criao da rede social cientfica. Aps a coleta de dados foi
feita ainda uma validao dos mesmos para garantir que as
informaes a serem analisadas e utilizadas pelo mtodo estariam
corretas. Tal validao foi feita a partir da comparao manual
entre os dados na base e os currculos lattes dos pesquisadores.

H trabalhos que levam em considerao tanto as caractersticas


dos ns quanto a topologia da rede, como [24] e [29]. Em [30] e
[16], congressos, artigos, autores (pesquisadores) e tpicos (frases
frequentes que foram extradas dos ttulos dos artigos) so
utilizados como ns na rede. [30] e [16] utilizaram diferentes
relacionamentos entre os tipos de ns citados anteriormente, tais
como: relacionamento de autoria entre pesquisador e artigo, de
publicao entre pesquisador e congresso, de citao entre artigos,
de citao entre pesquisador e tpico e, por fim, o relacionamento
entre tpicos, onde um tpico contm outro. Todos esses
relacionamentos so bidirecionais. Esta outra caracterstica da
rede que pode ser explorada: dependendo da direo do
relacionamento, ele pode apresentar uma semntica diferente. [18]
explora tais relacionamentos bidirecionais. Em seu trabalho
definida a mtrica cooperao global, que mede o grau de
colaborao entre dois pesquisadores.

A etapa seguinte envolveu os trabalhos correlatos. Foram


identificados trabalhos correlatos a esse para descobrir lacunas no
estado da arte e observar como os mtodos de recomendao
existentes se comportam, assim como seus pontos positivos e
negativos. E assim, a partir dessas observaes, elaborar o nosso
mtodo. Isso foi feito a partir da simulao manual dos trabalhos
correlatos em uma rede social cientfica restrita e pr-definida: a
rede social cientfica dos pesquisadores do Programa de PsGraduao em Informtica (PPGI) da Universidade Federal do
Rio de Janeiro (UFRJ). Aps a simulao, foi feita a anlise,
comparao e avaliao dos trabalhos correlatos, utilizando
diferentes mtricas de avaliao de sistemas de recomendao. A
partir da anlise dos trabalhos correlatos tambm foi possvel
observar como ocorre a interao e colaborao entre
pesquisadores nas redes sociais utilizadas em tais trabalhos.

3. ARQUITETURA CONCEITUAL

Para elaborar o mtodo de recomendao de relacionamentos em


uma rede social cientfica heterognea foram necessrias algumas
etapas, conforme ilustrado na Figura 1.

A terceira etapa do trabalho foi a de elaborao do mtodo de


recomendao, baseada na observao dos trabalhos correlatos
feita na etapa anterior.
As prximas etapas sero de implementao e avaliao do
mtodo proposto. Foi feito um prottipo inicial em Matlab do
algoritmo Ant Colony. Porm, tal prottipo no foi avaliado com
dados reais at o momento.

4. O EXTRATOR DE DADOS

Para montar a rede social cientfica necessrio obter diferentes


informaes sobre os pesquisadores. Essas informaes variam de
acordo com a estratgia utilizada para fazer a recomendao. Uma
rede social cientfica pode conter, por exemplo, caractersticas
pessoais dos pesquisadores, tais como, titulao, quantidade de
artigos publicados, prmios conquistados, e etc. Tais dados
podem ser encontrados em plataformas/sistemas, em sua maioria
web, que divulgam o conhecimento cientfico. A Microsoft
Academic Search (MAS), por exemplo, disponibiliza suas
informaes a partir de servios web. Essas informaes podem
ser acessadas via requisio HTTP GET no formato JSON ou via
protocolo SOAP [22]. Diferente do MAS, o Arnet Miner
disponibiliza seus dados atravs de diferentes servios web
RESTful e arquivos de texto [1]. J a Dblp disponibiliza sua base
de dados completa no formato XML [6], sendo possvel ainda
acessar seus dados a partir de requisies HTTP GET [7]. H
ainda sistemas que no disponibilizam suas informaes ou
disponibilizam apenas parcialmente. Para esses casos necessrio
desenvolver algumas alternativas para obter tais informaes,
como a construo de um software para extrair os dados das
pginas HTML. O Lattes um exemplo desse tipo de plataforma.
Seus dados so disponibilizados parcialmente em alguns casos
especficos, no estando acessveis a qualquer instante como nas
outras aplicaes [14].

Figura 1. Arquitetura Conceitual - Etapas do Trabalho


A primeira etapa consiste de 3 subetapas. O objetivo final da
etapa 1 era coletar os dados para montar a rede social cientfica.
Para coletar tais dados, primeiro foi feita uma avaliao de
diferentes plataformas/sistemas que disponibilizam informaes
sobre a comunidade cientfica. As plataformas avaliadas foram:
Lattes [15], Dblp [8], Microsoft Academic Search (MAS) [23] e
Arnet Miner [2]. Nas plataformas avaliadas, com exceo do
Lattes, as informaes apresentadas so inferidas a partir de dados
extrados automaticamente de diferentes sites existentes na
internet. Com isso, tais plataformas apresentam informaes
equivocadas sobre os pesquisadores, como por exemplo, reas de
pesquisa em que o pesquisador nunca havia atuado. Como a
plataforma Lattes apresenta dados que foram inseridos
manualmente pelos prprios pesquisadores, possvel afirmar que
a confiabilidade de tais informaes maior. Diante disso, foi

Dentre as plataformas, como j foi mencionado anteriormente, o


Lattes se tornou a base mais propcia para a captura das
informaes. Devido ao seu preenchimento manual, acreditamos
que suas informaes so mais confiveis do que as dos outros

57

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

sistemas que so extradas automaticamente. Outro ponto a ser


comentado que o Lattes uma rica fonte de dados, contendo
diversas informaes da vida acadmica de um pesquisador e que
so necessrias para esta pesquisa, tais como, seu nome, titulao,
publicaes, projetos, bolsa de produtividade, dentre outros. As
demais plataformas analisadas no continham todos esses dados
sobre os pesquisadores.

ltimo caso, os interesses dos pesquisadores poderiam ser


considerados complementares. O relacionamento de coautoria
um relacionamento que pode ser considerado forte ou fraco, pois
h diversas razes que fazem com que dois pesquisadores
publiquem um trabalho juntos, tais como: participar do mesmo
projeto, coorientar um trabalho, um pesquisador auxiliar o outro
em alguma etapa da pesquisa, um pesquisador escrever um livro
em colaborao com outro e etc.

Dessa forma, um extrator de dados foi construdo para ler o


currculo Lattes de um pesquisador e extrair as informaes
necessrias. Os dados extrados foram armazenados em um banco
de dados relacional para posteriores consultas. Foram capturadas
as seguintes informaes: Bolsa de Produtividade do CNPq,
Formao Acadmica/Titulao, Atuao Profissional Atual,
reas de Atuao, Bancas, Orientaes, Publicaes dos
Pesquisadores, sejam em Revistas ou Congressos e Participao
em Projetos.

A publicao contm um atributo que o local em que a


publicao foi feita, ou seja, o congresso, revista ou conferncia
em que o trabalho foi publicado. A submisso de trabalhos
repetidamente para locais que abordem os mesmos assuntos,
tambm pode ser um indicativo da rea de atuao do
pesquisador. Se forem selecionadas as ltimas publicaes a partir
de um determinado perodo de tempo at a presente data,
possvel descobrir a rea de atuao atual do pesquisador.

Cada uma das informaes extradas importante para formar o


perfil de cada pesquisador. A partir da bolsa de produtividade, da
formao acadmica e da atuao profissional do pesquisador
inferimos a sua expertise, ou seja, o quanto ele sabe de um
determinado assunto ou rea.

Por fim, a partir dos projetos em que um pesquisador est


envolvido, tambm possvel inferir as suas reas de atuao.
Para a experimentao completa do modelo, foram coletadas as
informaes dos currculos Lattes dos pesquisadores dos
programas de ps-graduao do Brasil da rea de Cincia da
Computao que foram avaliados pela Capes no trinio iniciado
em 2010 com nota superior a 2, totalizando 54 instituies.

As reas de atuao indicam os campos de interesse do


pesquisador. Com esta informao possvel recomendar
pesquisadores que atuam nas mesmas reas ou em reas
complementares, mas que nunca interagiram. No mtodo proposto
sero recomendados pesquisadores que atuem nas mesmas reas.

5. O MTODO DE RECOMENDAO

Esta seo apresenta o mtodo de recomendao proposto por este


trabalho. Sero descritos: a frmula utilizada para detectar a
semelhana entre pesquisadores, os critrios utilizados para
ponderar a frmula e o algoritmo Ant Colony utilizado para
implementar o mtodo.

As informaes coletadas com respeito a bancas, orientaes,


publicaes e projetos no se restringiram aos seus atributos,
como o ano em que ocorreram ou seus ttulos, mas tambm foram
coletados os relacionamentos em si para cada um destes itens. A
partir desses relacionamentos possvel identificar quais
pesquisadores j interagiram.

5.1 Descrio do Mtodo

H diferentes mtodos que podem ser utilizados para a


recomendao de relacionamentos em redes sociais. Tais mtodos
usualmente so derivados da teoria dos grafos e da anlise de
redes sociais [17]. De uma forma geral, existem os mtodos
baseados na vizinhana do n e os mtodos baseados no caminho
mnimo. Os mtodos baseados na vizinhana do n partem do
princpio de que h uma probabilidade maior de dois ns se
relacionarem no futuro se eles possurem muitos vizinhos em
comum [17]. J os mtodos baseados no caminho mnimo se
apoiam no princpio de que redes de colaborao so smallworlds, ou seja, so redes em que os ns esto conectados
atravs de caminhos curtos [17]. Cada um deles se adqua melhor
a um determinado tipo de problema. Por exemplo, o mtodo de
conexo preferencial, baseado na vizinhana dos ns,
usualmente utilizado em redes de colaborao, tais como uma
rede social cientfica [17] [27]. [17] e [19] apresentam uma
descrio detalhada dos mtodos de recomendao de
relacionamentos em redes sociais, porm, cada um usa uma
classificao diferente para agrup-los.

A participao em bancas de dissertao de mestrado e teses de


doutorado pode ser um indicativo da experincia profissional do
pesquisador em um determinado assunto, ou seja, do grau de sua
expertise. Pois, so convidadas para bancas de defesa pessoas que
conhecem bem o assunto a ser abordado. Porm, no mtodo
proposto, a participao em bancas no ser utilizada para
detectar a expertise do pesquisador, mas servir para identificar
relacionamentos fracos entre os mesmos.
A partir de todas as orientaes j feitas por um pesquisador
possvel descobrir o histrico das reas de atuao do mesmo, ou
seja, se ele continua atuando nas mesmas reas desde o incio da
sua carreira ou se houve uma mudana. As informaes de
orientaes coletadas tambm abrangem as coorientaes. O
relacionamento de coorientao pode indicar se dois
pesquisadores tm interesses em comum, ou ainda, se trabalham
em reas complementares. Se a parceria ocorrer repetidas vezes
um indicativo de que o relacionamento foi positivo. Caso
contrrio, ocorreu algo que impediu que a parceria se repetisse. O
relacionamento de orientao entre pesquisadores um
relacionamento forte, pois at conseguir independncia na
pesquisa, o pesquisador ainda se mantm ligado ao orientador.
Geralmente o orientador que proporciona os relacionamentos
iniciais de um pesquisador jnior.

Dentre os mtodos baseados na vizinhana dos ns, podemos citar


o que leva em considerao o nmero de vizinhos em comum.
Segundo [27], quanto maior o nmero de vizinhos em comum
entre dois pesquisadores, maior ser a probabilidade de eles virem
a colaborar no futuro. Outro mtodo que podemos citar o
preferencial attachment ou conexo preferencial, citado
anteriormente. Tal mtodo afirma que a probabilidade de um
pesquisador colaborar com outros aumenta de acordo com o
nmero de colaboraes passadas que ele possui [27]. A
abordagem de recomendao proposta neste trabalho utiliza

As publicaes representam os relacionamentos de coautoria


existentes entre pesquisadores. Assim como nas coorientaes, o
relacionamento de coautoria tambm pode indicar se dois
pesquisadores tm interesses em comum ou no, ainda que
existam casos de publicaes que envolvam reas distintas. Neste

58

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

esses dois mtodos baseados na vizinhana do n citados


anteriormente - vizinhos em comum e preferencial attachment
em diferentes momentos, conforme ser explicado posteriormente.

suas. No caso do ambiente acadmico, um pesquisador tende a


colaborar com outros que so da mesma rea de atuao que ele
ou que possuem o mesmo nvel de expertise, por exemplo. Outras
caractersticas que poderiam ser levadas em considerao so o
local de trabalho, a idade, a localizao geogrfica, o tempo de
formao, o tempo de atuao, dentre outros.

Para elaborar o mtodo de recomendao proposto, baseado nos


trabalhos correlatos analisados, foram considerados trs fatores
diferentes: i)a compatibilidade entre os ns vizinhos, ii)a
popularidade dos ns possveis de serem recomendados
(chamados de ns destinos) e, iii)as reas de atuao que os
pesquisadores possuem em comum. Abaixo segue o pseudo
cdigo:

No caso da induo, Christakis afirma em [4] que pessoas tendem


a fazer o que pessoas que se relacionam com ela fazem. Ou seja,
uma caracterstica que pode estar relacionada diretamente aos
relacionamentos entre as pessoas. Por exemplo, se um
pesquisador A se relaciona com o pesquisador B e o pesquisador
B se relaciona com o pesquisador C, por induo, os
pesquisadores A e C podem vir a se relacionar.

Score(P1,P2) =
= Compatibilidade (P1, VizinhosP1 VizinhosP2) * p1 +
+ reas em Comum (P1, P2) * p2 +

Por fim, a confuso est relacionada com a exposio aos mesmos


fatores. Pessoas que esto expostas aos mesmos fatores possuem
um relacionamento indireto entre elas. Por exemplo, o
relacionamento de participao em banca um relacionamento
indireto entre dois pesquisadores aonde eles foram expostos
defesa de um trabalho. Submeter trabalhos aos mesmos locais
tambm pode ser considerado um relacionamento indireto entre
dois pesquisadores.

+ Popularidade do N Destino * p3
Onde:
- P1 e P2: pesquisadores,
- VizinhosP1: ns vizinhos de P1,
- VizinhosP2: ns vizinhos de P2,
- p1,p2,p3: pesos atribudos a cada fator do pseudo
cdigo de acordo com sua importncia.

Dados os critrios apresentados acima, dividimos e ponderamos


as caractersticas individuais e os tipos de relacionamentos entre
os pesquisadores conforme apresentado na Tabela 1.

Cada um dos fatores do mtodo de recomendao sero


explicados nas sees 5.1.1, 5.1.2 e 5.1.3.

Tabela 1. Categorizao dos relacionamentos e atributos e seus


respectivos pesos.

A abordagem proposta leva em considerao diversos tipos de


relacionamento existentes entre os pesquisadores, caracterizandose assim uma rede social heterognea. Poucos trabalhos
atualmente levam em considerao redes sociais heterogneas
para fazer recomendaes de relacionamentos [30]. Alm disso,
esta abordagem tambm leva em considerao o grau de expertise
do pesquisador para realizar a recomendao. Tal grau utilizado
para ponderar a frmula de recomendao proposta. Dependendo
do grau de expertise do pesquisador, ser priorizado o fator de
compatibilidade ou o fator de popularidade do mtodo, conforme
ser descrito nas prximas sees.

Homofilia
rea de Atuao
(3)

A compatibilidade entre os ns vizinhos mede a compatibilidade


entre dois pesquisadores a partir dos relacionamentos que eles
possuem com seus vizinhos em comum. Este fator da equao
considera os diferentes tipos de relacionamentos existentes entre
os pesquisadores e seus vizinhos. Os tipos de relacionamentos
utilizados foram:
coautoria,

participao em banca,

participao nos mesmos projetos,

coorientao,

orientao.

Orientao (3)

Grau de Expertise *

Coorientao (2)

Participao em
Projeto (2)

Coautoria (2)

Confuso
Participao em
banca (1)
Submisso aos
mesmos locais (1)

Enquanto todos os itens descritos na Tabela 1 representam tipos


de relacionamentos, a rea de Atuao e o Grau de Expertise so
utilizados para caracterizar o perfil do pesquisador. No caso do
grau de expertise, ele ser formado pelos seguintes fatores: i)a
funo que o pesquisador exerce, ou seja, sua atuao profissional
atual (por exemplo, se ele professor adjunto ou titular) ii)o nvel
de sua bolsa de produtividade do CNPQ (caso tenha) iii)
formao acadmica (se o pesquisador Mestre ou Doutor, ou se
possui ps-doutorado) iv) e o tempo de formao.

5.1.1 Compatibilidade

Induo

A atuao profissional atual de um pesquisador nos diz em que


degrau de sua carreira o mesmo se encontra. Na progresso
habitual da carreira de pesquisador, o mesmo pode ser Emrito,
Titular, Associado, Adjunto, Livre Docente, Assistente ou
Auxiliar, sendo o nvel mais alto da carreira atingido quando o
mesmo se torna Emrito. Para cada um desses nveis de carreira, o
pesquisador deve possuir uma titulao mnima. Por exemplo,
para um pesquisador ser Assistente necessrio que ele possua
pelo menos o ttulo de Mestre. Quanto maior a titulao, maior o
nvel que o pesquisador pode atingir. Alm da titulao mnima,
outros fatores so considerados para que um pesquisador atinja
cada um desses nveis em sua carreira, como o nmero de
publicaes e a relevncia delas. Considerando esses fatores, para
cada um dos nveis da carreira de um pesquisador foi atribudo um
peso variando de 1 a 3, onde 3 indica o nvel mais alto da carreira
e 1 indica o nvel inicial, da seguinte maneira: Emrito (3), Titular

Na abordagem proposta, foi atribudo um peso diferente para cada


tipo de relacionamento, baseado no seu grau de importncia. Cada
peso varia de 1 a 3. Para determinar o grau de importncia dos
relacionamentos, foram utilizados os conceitos de homofilia,
induo e confuso, citados por Christakis em [4], os quais so
bases para a criao de novos relacionamentos. Segundo
Christakis, a homofilia caracteriza o comportamento das pessoas
de se unirem a outras que possuem caractersticas similares s

59

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

(2,8), Associado (2,5), Adjunto (2), Livre Docente (2), Assistente


(1,5), Auxiliar (1), Demais (0,5).

compatibilidades recebero uma penalizao devido ao ano em


que o relacionamento ocorreu.

Para determinar o segundo fator da expertise foram levadas em


considerao as diferentes bolsas concedidas aos pesquisadores.
Essas bolsas so fornecidas de acordo com o desempenho
apresentado por eles em suas pesquisas, produes tecnolgicas e
ensino. Dentre as bolsas oferecidas, as de produtividade so
consideradas as mais importantes e, devido a isso, apenas elas
foram utilizadas para o clculo da expertise. Dentre as bolsas de
produtividade, existem as de produtividade em pesquisa, que so
destinadas aos pesquisadores que se destacam na produo
cientfica. Existem tambm as bolsas de produtividade em
desenvolvimento tecnolgico e extenso inovadora, destinadas
aqueles que se destacam na produo de desenvolvimento
tecnolgico e inovao. Cada uma dessas bolsas possui diferentes
nveis. Para calcular a expertise foi atribudo um peso para cada
um desses nveis da seguinte maneira: nvel 2 (peso 1), nvel 1D
(peso 2), nvel 1C (peso 2,3), nvel 1B (peso 2,6) e nvel 1A (peso
3), onde 2 o nvel inicial e 1A o maior nvel.

O tipo de um relacionamento, em conjunto com a quantidade


daquele tipo de relacionamento, tambm importante para
determinar a compatibilidade entre dois pesquisadores, pois
dependendo do seu tipo e quantidade, o relacionamento pode ser
indireto ou direto, fraco ou forte. Em [21] foi utilizado o mesmo
peso para todos os tipos de relacionamento, porm, em nosso
mtodo utilizamos os pesos definidos na Tabela 1.
A seguir, segue a equao proposta por [21] que foi utilizada
neste trabalho para calcular a compatibilidade parcial entre um
pesquisador e seus vizinhos.

Onde:

- Px P1 P2,
- R: fora do relacionamento do tipo i entre P1 e Px,

O ltimo fator utilizado para calcular a expertise a formao


acadmica. Nele, considerada a ltima titulao adquirida por
um pesquisador, como por exemplo, Mestre ou Doutor, em
conjunto com o ano de obteno do ttulo. No caso em que o
pesquisador possuir dois tipos de formaes iguais como ltimas
formaes, ser considerada a primeira formao adquirida. Por
exemplo, supondo que o pesquisador possua dois doutorados, ser
considerado o ano do primeiro doutorado obtido, pois a partir
dele, o pesquisador j passou a ter o ttulo de Doutor. Conforme
os outros fatores considerados para calcular a expertise, para cada
formao acadmica foi atribudo um peso, do seguinte modo:
Doutorado (3), Livre Docncia (3), Mestrado (2), Especializao
(1).

- : peso dado ao relacionamento do tipo i.


- T: valor de penalizao com relao ao ano em que o
relacionamento ocorreu.
- t: total de tipos de relacionamento entre P1 e Px.
- d: durao de cada relacionamento em anos.
Para calcular R, ou seja, a fora do relacionamento, utilizamos a
frmula a seguir, tambm proposta por [21]:

Onde:

Compondo esses trs fatores, ser dado um peso variando de 0 a 1


ao grau de expertise do pesquisador, onde 1 representa um
pesquisador snior e, valores prximos ao 0 representam o
pesquisador jnior, ou seja, em incio de carreira. Quanto mais
prximo do 1, mais snior o pesquisador ser.

Px.
P1.
Px.

Para determinar a compatibilidade final entre dois pesquisadores


P1 e P2, deve-se: 1) calcular a compatibilidade parcial entre P1 e
seus vizinhos em comum com P2; 2) calcular a compatibilidade
parcial entre P2 e seus vizinhos em comum com P1; 3) somar as
duas compatibilidades parciais.

- RCi: nmero de relacionamentos do tipo i entre P1 e


- TR1: total de relacionamentos do tipo i do pesquisador
- TRx: total de relacionamentos do tipo i do pesquisador

A funo de penalizao do tempo dada por:

O valor dado da soma das compatibilidades parciais entre P1 e P2


e seus vizinhos pertence a um intervalo que varia de 0 a N.
Quanto maior for o valor, maior ser a compatibilidade entre os
pesquisadores. Para calcular a compatibilidade parcial, utilizamos
o mtodo proposto por [21]. Ele prope uma equao que calcula
o nmero de relacionamentos de diferentes tipos existentes entre
dois pesquisadores, considerando: i)a idade do relacionamento, ou
seja, o quo recente ou o quo antigo o relacionamento; ii)o tipo
de relacionamento, onde cada relacionamento recebe um peso
diferente, descrito na Tabela 1; e iii)a quantidade de
relacionamentos.

Onde:
- Aa: ano atual,
- Ar: ano do relacionamento.
A seguir ser descrito o fator reas em comum do mtodo de
recomendao proposto.

5.1.2 reas em Comum

A idade do relacionamento utilizada para refletir se aquele um


relacionamento que ainda se mantm forte entre os dois
pesquisadores ou se um relacionamento que deixou de existir
com o decorrer do tempo. Por exemplo, um pesquisador P1 que
possui 2 publicaes com um pesquisador P2 em 2014 deve ter
uma compatibilidade maior com P2 do que um pesquisador P3
que possui 2 publicaes com P2 em 2010. Para isso, as

O fator de reas em comum mensura os interesses em comum que


dois pesquisadores possuem. Esse fator considera as reas de
atuao que os pesquisadores colocam em seus currculos Lattes.
Tais reas podem ser preenchidas de forma manual ou no.
Quando o pesquisador insere sua rea de atuao de forma
manual, ele digita a rea que ele deseja em seu currculo. A outra
forma de preenchimento selecionando uma das reas que o

60

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

prprio Lattes oferece, atravs de uma taxonomia do CNPq. Essa


tabela contm reas bem genricas, tais como: Cincia da
Computao, Sistemas de Informao, dentre outras.

Portanto, no mtodo de recomendao proposto, cada fator da


frmula receber um peso de acordo com o grau de expertise do
pesquisador. Para os pesquisadores em incio de carreira, o fator
de popularidade do n destino receber um peso maior que o fator
compatibilidade. No caso dos pesquisadores plenos ou sniors, o
fator de compatibilidade ser maior que o fator de popularidade.

Quando o pesquisador insere uma rea manualmente, julgamos


que essa rea tem maior importncia para ele e que ela uma rea
mais especfica de seu interesse. Por isso, ao calcular a
semelhana entre dois pesquisadores a partir da frmula dada
anteriormente, consideramos que as reas de atuao preenchidas
manualmente devem receber um peso maior do que as outras.

Para definirmos os valores que sero utilizados nesses pesos,


faremos uma srie de testes at ajust-los ao melhor valor possvel
dentro de cada situao.

A seguir ser apresentado o fator da rea de atuao da frmula:

5.1.4 Consideraes sobre os fatores


O fator compatibilidade do mtodo proposto tambm est baseado
no princpio de induo, mencionado anteriormente, pois ele leva
em considerao os vizinhos em comum entre dois pesquisadores
que nunca se relacionaram. Segundo [4], tal princpio diz que
pessoas tendem a fazer o que pessoas que se relacionam com elas
fazem. Portanto, se duas pessoas se relacionam com muitas
pessoas em comum, elas possivelmente tendero a se relacionar
em algum momento no futuro, induzidas pelos relacionamentos de
seus vizinhos. Principalmente se tais pessoas compartilharem
interesses em comum, pois, segundo o princpio de homofilia,
pessoas tendem a se relacionar com pessoas que possuem
caractersticas semelhantes s dela.

Onde:
-NumAreasComunsCnpq: nmero de reas em comum
da tabela do CNPQ entre o pesquisador P1 e o pesquisador P2.
- NumAreasComuns: nmero de reas em comum
inseridas manualmente entre o pesquisador P1 e o pesquisador P2.
CNPQ.

- p1: peso dado ao nmero de reas comuns da tabela do

- p2: peso dado ao nmero de reas comuns inseridas


manualmente.

O fator de reas de atuao do mtodo proposto tambm est


baseado no princpio de homofilia, pois quanto maior o nmero
de reas de atuao em comum entre dois pesquisadores, maior
ser o grau de homofilia entre eles.

- p2 > p1.

5.1.3 Popularidade do N Destino

Por fim, o fator de popularidade do n destino do mtodo


proposto est baseado no princpio de confuso, pois tal princpio
afirma que pessoas expostas aos mesmos fatores possuem um
relacionamento indireto entre elas. Pesquisadores populares esto
expostos a muitos relacionamentos, muitos vizinhos. Pessoas no
populares esto expostas a poucos relacionamentos, poucos
vizinhos.

O ltimo fator que falta ser descrito a popularidade do n


destino. N destino so todos os ns que podem vir a ser
recomendados para um pesquisador em questo. Um n dito
popular quando possui muitos vizinhos. Portanto, este fator mede
a popularidade de um n, ou seja, ele leva em considerao a
quantidade de vizinhos que o n possui. Quanto maior o nmero
de vizinhos, maior ser a popularidade. A popularidade do n
destino foi adicionada frmula pensando nos pesquisadores em
seus diferentes momentos da carreira: do momento que um
pesquisador jnior ou um pesquisador snior.

5.2 Algoritmo das Formigas (Ant Colony)

Para implementar o mtodo de recomendao proposto


anteriormente, utilizamos o algoritmo das formigas ou Ant Colony
[10]. Essa escolha foi feita porque o algoritmo das formigas um
algoritmo de otimizao criado para soluo de problemas
computacionais que envolvem a procura de caminhos em grafo.

O fator de compatibilidade (explicado na seo 5.1.1) da frmula


analisa os ns vizinhos em comum aos ns que se deseja prever
um relacionamento. Porm, um pesquisador jnior, em incio de
carreira, no possui muitos relacionamentos na rede, ou seja, no
possui muitos ns vizinhos. Portanto, essa estratgia poderia no
ser muito efetiva, podendo ocorrer o problema do Cold Start [13],
em que no se tem muita informao sobre o item que voc deseja
oferecer recomendaes. Devido a isso, um pesquisador jnior
deve entrar em contato com pesquisadores populares ou sniors,
para ampliar a sua rede de relacionamentos.

Em [20] utilizado o algoritmo das formigas para recomendar um


conjunto de pessoas para relacionamentos em uma rede social de
relacionamentos. Apesar de o domnio ser diferente, o objetivo
final o mesmo: recomendar relacionamentos.

Segundo [27], a probabilidade de um pesquisador colaborar com


outros aumenta de acordo com o nmero de colaboraes que
aquele pesquisador j possui. Ou seja, quanto maior o nmero de
vizinhos de um pesquisador, maior a probabilidade dele vir a
colaborar com outro pesquisador. Baseado em tal afirmao, [27]
criou a medida Conexo Preferencial. Esta medida calculada a
partir do produto entre o nmero de vizinhos de cada pesquisador.
exatamente esta medida que chamamos de Popularidade do n
vizinho.
Figura 2. Ilustrao do Algoritmo das Formigas.

61

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

O algoritmo das formigas simula o comportamento das formigas


em busca de comida [9]. Inicialmente a formiga sai do
formigueiro, em busca de comida, sem destino exato, ou seja, ela
escolhe um caminho aleatoriamente (ver Figura 2 em t = 1). Ao
caminhar por esse caminho, a formiga deposita uma substncia
chamada feromnio no solo, para marcar o caminho e poder voltar
por ele posteriormente (Figura 2 em t = 2). As formigas se sentem
atradas por essa substncia (Figura 2 em t = 3). Ao achar comida,
a formiga volta pelo mesmo caminho, depositando feromnio nele
tambm. Portanto, o caminho inicial que levou at a comida
possui duas vezes mais feromnio do que os demais caminhos.
Com isso, as prximas formigas que sarem do formigueiro,
tendem a ir por esse caminho, pois ele est com maior
concentrao de feromnio. Com o passar do tempo, o feromnio
vai evaporando do solo. Ou seja, caminhos por onde a formiga
no passa frequentemente e que no levaram a comida ficam com
uma concentrao menor do que os caminhos que levaram a
comida e que as formigas passaram com mais frequncia. Ao final
de muitas iteraes, o caminho com maior concentrao de
feromnio, tende a ser o melhor caminho.

Nesta seo ser apresentado um exemplo do mtodo de


recomendao proposto.
Considere os dois pesquisadores X e Y conforme ilustrado na
Figura 3. Os dois pesquisadores no possuem nenhum tipo de
relacionamento em comum, porm possuem trs vizinhos em
comum: os ns A, B e C.
X possui ligao forte tanto com o pesquisador A quanto com o
B, pois possui diversos relacionamentos de coautoria e
participao em projetos com ambos. J o relacionamento entre X
e o pesquisador C um relacionamento fraco de participao em
algumas bancas de graduao, devido s reas de atuao que eles
tm em comum. X possui as seguintes reas de atuao: Cincia
da Computao, Metodologias e Tcnicas da Computao,
Sistemas de Informao, Redes Sociais, Sistemas de
Recomendao e Gesto do Conhecimento.
Y possui relacionamentos fortes com os pesquisadores B e C.
Seus relacionamentos com eles so de coorientao e coautoria,
alm da participao de algumas bancas em comum. J com o
pesquisador A, apesar de Y possuir muitos relacionamentos com
ele, tais relacionamentos so fracos, de submisso aos mesmos
locais devido s reas de atuao em comum. Y trabalha nas
seguintes reas: Cincia da Computao, Metodologias e Tcnicas
da Computao, Sistemas de Informao, Sistemas Colaborativos,
Sistemas de Recomendao e Redes Sociais.

Alm da concentrao de feromnio, o algoritmo da formiga


tambm leva em considerao a atratividade do caminho, na hora
de escolher por qual caminho seguir. A atratividade do caminho,
na abordagem de [20], estava relacionada a caractersticas dos ns
do caminho e era representada por uma funo. Na abordagem
proposta, a atratividade do caminho tambm levar em
considerao caractersticas dos ns, mas alm disso, levar em
considerao os relacionamentos entre os ns vizinhos em comum
ou a popularidade do n destino. Ou seja, a funo de atratividade
da abordagem proposta ser a funo de recomendao descrita
anteriormente.

Considere que o pesquisador X ir receber recomendaes feitas


pelo mtodo de recomendao proposto. Para verificar se o
pesquisador Y poder ter algum tipo de interao no futuro com o
pesquisador X, podemos ter inicialmente dois casos diferentes:
1) Grau de Expertise: X jnior, Y jnior

O algoritmo da formiga tambm leva em conta uma terceira


funo chamada de objetivo. Tal funo determina qual o melhor
caminho dentre todos os melhores caminhos percorridos em cada
interao. No nosso caso, a funo objetivo dever maximizar a
funo de atratividade, pois, quanto maior o valor dado pela
funo de atratividade, melhor ser o nosso caminho. Portanto, a
funo objetivo desta abordagem maximizar a funo de
atratividade.

X acabou de se iniciar na carreira acadmica. Ele um


pesquisador Adjunto, sem bolsa de produtividade do CNPQ e
com 2 anos de concluso do doutorado. Sua expertise se enquadra
na categoria jnior.
Neste caso, dado um peso maior ao fator de popularidade do n
destino na equao de recomendao. Isto se deve ao fato do
pesquisador jnior no possuir geralmente uma rede vasta de
relacionamentos por estar em incio de carreira. Neste caso, se
considerarmos apenas o fator de compatibilidade da equao de
recomendao ou atribuirmos a este fator um peso maior, talvez
no ocorram recomendaes satisfatrias para o pesquisador
jnior, pois o fator de compatibilidade leva em considerao a
vizinhana entre os ns.

5.3 Exemplo de Uso do Mtodo

Como atribudo um peso maior ao fator de popularidade do n


destino, pesquisadores seniores (ou seja, pesquisadores que
possuem muitos vizinhos e por isso, so populares), tendem a ser
recomendados para os pesquisadores juniores. Isto importante
para os pesquisadores juniores conseguirem aumentar sua rede de
relacionamentos e conseguirem independncia na pesquisa. E,
como foi visto anteriormente, quanto maior o nmero de vizinhos
que um pesquisador tem, maior ser a probabilidade de ele vir a se
relacionar com outros pesquisadores. Ento h uma grande
probabilidade de pesquisadores seniores se relacionarem com
pesquisadores juniores. Neste caso, o relacionamento entre um
pesquisador snior e um pesquisador jnior um relacionamento
de subordinao. Portanto, se X jnior e Y jnior, de acordo
com nosso mtodo a tendncia que eles no sejam
recomendados um ao outro, pois o interessante nessa etapa da

Figura 3. Exemplo de rede de relacionamentos entre


pesquisadores.

62

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

I. CompatibilidadeVizX
=
CompatibilidadeVizX
+
Compatibilidade(Vi, X).
1.2) Calcule Compatibilidade(Vi,Y) de acordo com
Equao apresentada na anteriormente.
I. CompatibilidadeVizY
=
CompatibilidadeVizY
+
Compatibilidade(Vi, Y).

carreira que eles se relacionem com pesquisadores mais


experientes.
Devido a flexibilidade presente nesta proposta, podemos
modificar os pesos de cada fator do mtodo e dar importncia
igual para eles. Nesse caso, como X e Y possuem diversas reas
de atuao em comum, a tendncia que eles sejam
recomendados, j que estaramos desconsiderando a expertise no
mtodo de recomendao.

2) Calcule Compatibilidade(X,Y) = (CompatibilidadeVizX +


CompatibilidadeVizY) * a1.

2) Grau de Expertise: X snior


Se o pesquisador que est recebendo as recomendaes for um
pesquisador snior ou pleno, ser dado um peso maior ao fator de
compatibilidade na equao de recomendao, pelo motivo
contrrio ao apresentado no caso anterior. Um pesquisador snior
ou pleno possui geralmente uma rede de relacionamentos
consolidada, sendo portanto possvel analisar e considerar a
vizinhana dos ns na equao de recomendao. E, como foi
visto anteriormente, quanto maior o nmero de vizinhos em
comum que dois pesquisadores possuem, maior a probabilidade
de eles virem a se relacionar. Neste caso, os relacionamentos
feitos entre pesquisadores com o mesmo grau de expertise ou
graus prximos so relacionamentos de colaborao.

3) Calcule AA(X,Y) = [(NumAreasComunsCNPQ * p1) +


(NumAreasComunsManuais * p2)] * a2.
4) Calcule Pop(X,Y) = (NumVizinhosX * NumVizinhosY) * a3.
5) Calcule Score(X,Y) = Compatibilidade(X,Y) + AA(X,Y) +
Pop(X,Y).

6. CONCLUSO

Neste artigo apresentamos um novo mtodo para recomendao


de relacionamentos entre pesquisadores utilizando uma rede social
cientfica heterognea. Tal mtodo leva em considerao
diferentes tipos de relacionamento, tais como, coautoria,
orientao, participao em projetos e participao em bancas,
alm de atributos como reas de atuao, atuao profissional
atual. Embora mais custoso computacionalmente, o uso de uma
rede heterognea melhora a acurcia da recomendao. Neste
trabalho propomos um mtodo de recomendao que varia de
acordo com a expertise do pesquisador que est recebendo as
recomendaes. Caso o pesquisador seja jnior, o mtodo
recomenda pesquisadores seniores que sejam compatveis com
ele, a fim de ajudar o pesquisador a ampliar sua rede de
relacionamentos. J para pesquisadores seniores, o mtodo
recomenda pesquisadores que possuam grande compatibilidade
com eles, independente da sua expertise.

Como X um pesquisador snior, de acordo com nosso mtodo a


tendncia que ele se relacione no futuro com Y, devido a
compatibilidade que existe entre eles: possuem vizinhos em
comum com relacionamentos fortes com ambos e possuem
diversas reas de atuao em comum.
Portanto, na equao de recomendao, os fatores de
popularidade e compatibilidade so ponderados de acordo com a
expertise do pesquisador, pois dependendo da expertise, ser mais
interessante
recomendar
pesquisadores
populares
ou
pesquisadores com quem o pesquisador j tenha uma vizinhana
grande em comum.
Vimos que X e Y possuem algumas reas de atuao em comum.
Cada um deles citou seis reas em seu currculo Lattes. Dessas
seis reas, eles possuem cinco reas em comum, ou seja,
apresentam grande afinidade em suas reas de pesquisa, apesar de
nunca terem se relacionado. As reas de Cincia da Computao,
Metodologias e Tcnicas da Computao e Sistemas de
Informao so reas genricas que pertencem tabela das
grandes reas do CNPQ. J as reas de Redes Sociais e Sistemas
de Recomendao so reas mais especficas de atuao que
conseguem representar melhor os trabalhos desenvolvidos por
esses pesquisadores. Portanto, temos duas reas em comum que
foram inseridas manualmente pelos pesquisadores e trs que
foram inseridas a partir da seleo de reas do prprio Lattes. No
fator de reas de atuao da equao de recomendao, as reas
inseridas manualmente, que so reas de atuao mais especficas
dos pesquisadores, recebero um peso maior que as grandes reas
selecionadas a partir do Lattes. Para este exemplo, o fator de reas
de atuao ficar assim: AA(X,Y) = (3 * p1) + (2 * p2), p2 > p1.

Para implementar o mtodo proposto foi utilizado o algoritmo das


formigas. O algoritmo das formigas usualmente utilizado para
encontrar solues de problemas computacionais que envolvem a
busca de caminhos em grafos, tal como, uma rede social.
As prximas etapas deste trabalho ser o desenvolvimento de um
sistema de recomendao baseado no mtodo proposto e a
realizao de experimentaes.

7. AGRADECIMENTOS

Este trabalho foi financiado com o auxlio da FAPERJ, CAPES e


do CNPQ.

8. REFERNCIAS

[1] Arnet Miner RESTful API. Disponvel em


http://arnetminer.org/RESTful_service - agosto, 2014.
[2] Arnet Miner. Disponvel em http://arnetminer.org/ - maro,
2014.

Para saber se os dois pesquisadores podero ser recomendados ou


no, deve-se calcular cada um dos fatores propostos na equao
de recomendao e som-los, conforme a seguir:

[3] Brando, M. A. e Moro, M. M. 2012. Recomendao de


Colaborao em Redes Sociais Acadmicas baseada na
Afiliao dos Pesquisadores. In Proceedings of the 27th
Brazilian Symposium on Databases.

1) Para cada vizinho Vi de X em comum com Y, com i > 0 e i <


total de vizinhos em comum:
1.1) Calcule Compatibilidade(Vi, X) de acordo com
Equao apresentada anteriormente.

63

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

[4] Christakis, N.A e Fowler, J.H. 2012. Social contagion


theory: examining dynamic social networks and human
behavior. Statistics in medicine. DOI= 10.1002/sim.5408

[20] Mendona, L. F. 2014. An approach for personalized


matching systems by using ant colony. Social networking.
(Maro, 2014), 102-107.

[5] Citeulike. Disponvel em http://www.citeulike.org/ - maro.

[21] Menezes, V. S. A. 2012. Anlise de Redes Sociais


Cientficas. Rio de Janeiro. Dissertao (Doutorado em
Engenharia de Sistemas e Computao) Universidade
Federal do Rio de Janeiro, 2012.

[6] Dblp - Base de dados. Disponvel em http://dblp.unitrier.de/xml/ - agosto, 2014.


[7] Dblp HTTP GET API. Disponvel em http://dblp.unitrier.de/xml/docu/dblpxmlreq.pdf - agosto, 2014.

[22] Microsoft Academic Search API. Disponvel em


http://academic.research.microsoft.com/about/Microsoft%20
Academic%20Search%20API%20User%20Manual.pdf
agosto, 2014.

[8] Dblp. The DBLP Computer Science Bibliography.


Disponvel em http://dblp.uni-trier.de/db/ - maro, 2014.
[9]

Dorigo, M. e Blum, C. 2005. Ant colony optimization


theory: A survey. In Theoretical Computer Science. 344, 2-3
(Novembro 2005), 243-278. DOI=10.1016/j.tcs.2005.05.020

[23] Microsoft Academic Search. Disponvel em


http://academic.research.microsoft.com maro, 2014.

[10] Dorigo, M. e Stutzle, T. 2004. Ant Colony Optimization, The


MIT Press, Cambridge.
DOI=http://dx.doi.org/10.1007/b99492

[24] Monclar, R. S. 2008. Anlise e Balanceamento de Redes


Sociais no Contexto Cientfico. Rio de Janeiro. Dissertao
(Mestrado em Cincias em Engenharia de Sistemas e
Computao) Universidade Federal do Rio de Janeiro,
2008.

[11] Heck, T. 2013. Combining social information for academic


networking. In Proceedings of the 2013 Conference on
Computer Supported Cooperative Work.

[25] Myers, I. B. 1980. Gifts Differing: Understanding


Personality Type. Palo Alto, Califrnia: DavisBlack
Publishing, Reprint Edition (Maio, 1995).

[12] Hoonlor, A., Szymanski B. K. e Zaki, M. J. 2013. Trends in


computer science research. In Communications of the ACM.
56, 10 (Outubro 2013), 74-83.
DOI=http://doi.acm.org/10.1145/2500892

[26] Newman, M. E. 2001. The structure of scientific


collaboration networks. In Proceedings of the National
Academy of Sciences of the United States of America.

[13] Lam, X. N, Vu, T., Le, T. D. e Duong, A. D. 2008.


Addressing cold-start problem in recommendation systems.
In Proceedings of the 2nd international conference on
Ubiquitous information management and
communication (ICUIMC '08). ACM, New York, NY, USA,
208-211. DOI=10.1145/1352793.1352837

[27] Newman, M. E. 2001.Clustering and preferential attachment


in growing networks. In Physical Review E. 64, 2 (July.
2001), 025102-025106. DOI=
http://dx.doi.org/10.1103/PhysRevE.64.025102
[28] Oliveira, R. M. 2012. Predio de Conexes Recorrentes em
Redes Complexas. Pernambuco. Dissertao (Mestrado em
Cincia da Computao) Universidade Federal de
Pernambuco, 2012.

[14] Lattes Extrao de Dados. Disponvel em


http://www.cnpq.br/web/portal-lattes/extracoes-de-dados janeiro, 2014.
[15] Lattes. Plataforma Lattes. Disponvel em
http://lattes.cnpq.br/ - maro, 2014.

[29] Sie, R.L.L, Drachsler, H., Bitter-Rijpkema, M. e Sloep,


P.2012. To Whom and Why Should I Connect? Co-author
Recommendation Based on Powerful and Similar Peers. In
International Journal of Technology Enhanced Learning,
pages 121-137. Inderscience Publishers.

[16] Lee, J.B. e Adorna, H. 2012. Link Prediction in a Modified


Heterogeneous Bibliographic Network. In Proceedings of
International Conference on Advances in Social Networks
Analysis and Mining.

[30] Sun, Y., Barber, R., Gupta, M., Aggarwal, C. C. e Han, J.


2011. Co-author Relationship Prediction in Heterogeneous
Bibliographic Networks. In Proceedings of International
Conference on Advances in Social Networks Analysis and
Mining.

[17] Liben-Nowell, D. e Kleinberg, J. 2007. The link-prediction


problem for social networks. J. Am. Soc. Inf. Sci.
Technol. 58, 7 (Maio 2007), 1019-1031.
DOI=10.1002/asi.v58:7 http://dx.doi.org/10.1002/asi.v58:7

[31] Toral, S.L., Bessis, N., Martinez-Torres, M.R., Franc, F. ,


Barrero, F. e Xhafa, F. 2011. An Exploratory Social
Network Analysis of Academic Research Networks. In
Proceedings of Third International Conference on Intelligent
Networking and Collaborative Systems.

[18] Lopes, G. R. e Moro, M. M., Wives, L. K., de Oliveira, J., P.


M. 2010. Collaboration Recommendation in Academic
Social Networks. In ER Workshops. Vancouver, Canada, pp.
190199, 2010.
[19] Lu, L. e Zhou, T. 2010. Link prediction in complex
networks: a survey. Physica A: Statistical mechanics and its
applications. 390, 6 (Maro 2011), 1150-1170. DOI=
10.1016/j.physa.2010.11.027

64

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

A relao entre o tamanho do grupo e a produo de


mensagens de bate-papo
Edmilson Barcelos Rocha

Mariano Pimentel

Morganna Carmem Diniz

Universidade Federal do Estado do


Rio de Janeiro (Unirio)
Avenida Pasteur, 458 - Urca
Rio de Janeiro - RJ - Brasil
55 21 3323-8028 / 2530-8051

Universidade Federal do Estado do


Rio de Janeiro (Unirio)
Avenida Pasteur, 458 - Urca
Rio de Janeiro - RJ - Brasil
55 21 3323-8028 / 2530-8051

Universidade Federal do Estado do


Rio de Janeiro (Unirio)
Avenida Pasteur, 458 - Urca
Rio de Janeiro - RJ - Brasil
55 21 3323-8028 / 2530-8051

edmilson.rocha@uniriotec.br

pimentel@uniriotec.br

morganna@uniriotec.br

ABSTRACT

discusso, frum usados para apoiar o trabalho em grupo [8].

The goal of the research presented in this article is to estimate


how many users will participate in a chat session to try to ensure a
minimum level of interaction. The indicator used to measure the
level of interaction among users was the number of messages sent
per user during the chat session. For this estimate, a mathematical
model was developed and, to parameterize the model, studies on
the behavior of users were realized when reading and writing
messages in chat sessions. The model developed proved valid for
the estimation of the expected number of messages depending on
the number of users in chat session, allowing estimate how many
users will participate in a chat session to ensure a minimum level
of interaction.

A Comunicao Mediada por Computador (CMC), quando


realizada nos contextos educacional e empresarial, necessita que
os usurios acompanhem toda a conversao. Em sistemas
assncronos, esse problema minimizado pela prpria
caracterstica desses sistemas de permitirem que a informao
permanea disponvel por longo perodo. Em sistemas sncronos,
como o bate-papo, acompanhar a conversao no problema
caso a maioria dos usurios sejam apena ouvintes, no precisam
fazer parte do dilogo. No entanto, esses sistemas foram
concebidos para promoverem a interao. Quando dada a
possibilidade de participar, uma quantidade muito grande de
usurios pode ocasionar uma sobrecarga de informao, fazendo
como que os usurios no consigam acompanhar a conversao.
Saber se numa sesso de bate-papo podem participar ao mesmo
tempo 100 ou apenas 10 usurios, tem um grande impacto no
planejamento de grupos de trabalho. Essa informao
encontrada na literatura de forma pouco precisa e no leva em
conta o contexto em que realizada a sesso de bate-papo.

Categories and Subject Descriptors


I.6.5 [Simulation and Modeling]: Model Development
Modeling methodologies.

General Terms
Measurement,
Verification.

Experimentation,

Human

Factors,

O objetivo da pesquisa descrita no artigo estimar o tamanho


mximo do grupo de usurios numa sesso de bate-papo, para um
determinado contexto, de forma a garantir que faam parte da
conversao. Para obter essa estimativa foi construdo um modelo
da interao entre usurios de bate-papo. Para desenvolver o
modelo, foi usado o mtodo formal de modelagem de sistemas
com aplicao da Teoria de Filas [4]. A avaliao do modelo
proposto foi feita por meio de comparao das estimativas
produzidas pelo modelo com dados de logs reais de bate-papo.

Theory,

Keywords
Chat, Group Size, Mathematical Modeling, Queuing Systems.

1. INTRODUO
Os sistemas de bate-papo surgiram no incio dcada de 1970
com o Part Line [12] e se tornaram um fenmeno social na
dcada de 1990 com a popularizao da Internet e o lanamento
do IRC (Internet Relay Chat). No final da dcada de 1990, o IRC
estava caindo em desuso [16]. Atualmente, os sistemas de batepapo mais utilizados encontram-se integrados em sistemas de
redes sociais. O uso de sistemas sncronos de comunicao, como
o bate-papo, na educao amplamente encorajado por
pesquisadores para promover a participao dos alunos, pois
proporcionam um espao para emoes que diminuem a sensao
de impessoalidade e isolamento [17]. No contexto empresarial, os
sistemas de comunicao sncronos como: videoconferncias,
Instant Messages; assncronos: correio-eletrnico, lista de

Esse artigo encontra-se estruturado nas seguintes sees. A


questo de pesquisa quantos usurios devem participar de uma
sesso de bate-papo? discutida na seo 2. Na seo 3, so
descritas as aes realizadas pelos usurios durante uma sesso de
bate-papo. A metodologia aplicada para o desenvolvimento do
modelo discutida na seo 4. Em seguida, na seo 5, so
discutidos os resultados da avaliao do modelo elaborado. Com
o modelo validado, foi possvel responder questo norteadora
dessa pesquisa, seo 6. Por ltimo, na seo 7, so apresentadas
as consideraes finais e trabalhos futuros.

2. QUANTOS USURIOS DEVEM


PARTICIPAR DE UMA SESSO DE BATEPAPO?

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

A conversao por bate-papo deixou de ser aberta e realizada


entre estranhos identificados por apelidos (nickname), como na

65

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

srio 1 importante que todos consigam ler todas as mensagens e


que tambm possam enviar mensagens de vez em quando. Essas
restries no acontecem num bate-papo recreativo (para
socializao ou namoro) em que o usurio no tem a necessidade
de acompanhar a discusso nem se v obrigado a escrever
mensagens, no precisa ler tudo e pode manter-se calado. Numa
sesso recreativa no h um fator limitante para a quantidade de
pessoas no bate-papo. S faz sentido discutir a quantidade
mxima de usurios se for desejado um nvel mnimo de
interaes entre os usurios, pois caso a participao possa ser
zero (o usurio no precisa ler nem escrever mensagens), tal como
ocorre na transmisso de um vdeo em broadcasting, ento no h
um limite mximo de usurios: um usurio pode conduzir a
reunio por bate-papo para centenas de outros usurios
conectados ao mesmo tempo desde que somente o condutor esteja
digitando as mensagens e a quantidade de mensagens produzidas
por usurio tenda a zero. O problema surge quando se d a chance
para os usurios interagirem entre si e para isso que serve o
bate-papo. Desta forma, desejvel determinar a quantidade
mxima de usurios numa sesso de bate-papo em que seja
possvel alcanar uma qualidade de interao definida em termos
da quantidade de mensagens lidas e produzidas por usurio.
Considerando que todos devem ler todas as mensagens, ento a
qualidade da interao ir variar em funo da quantidade das
mensagens produzidas.

poca do IRC, e se tornou uma conversa contextualizada em


comunidades virtuais entre usurios identificados por um perfil no
sistema de redes sociais [17]. Uma comunidade virtual pode ser
uma turma de uma disciplina, uma equipe de trabalho, um grupo
de amigos, ou um agrupamento de pessoas interessadas num tema.
Desta forma, alm da socializao e recreao, os sistemas de
bate-papo passaram a ser usados para dar suporte a diferentes
processos de trabalho em grupo: debates, reunies, entrevistas etc.
O bate-papo um meio de conversao sncrono em que so
trocadas pequenas mensagens textuais publicadas para todos os
conectados na mesma sala de bate-papo. Embora a troca de
mensagens seja realizada por escrito, os usurios sentem como se
estivessem conversando. Os interlocutores at modificam a
linguagem formal escrita para torn-la mais parecida com a
conversao face-a-face, por exemplo, fazendo uso de
onomatopeias, alongamentos voclicos e sobrecarga de
pontuao. Esse fenmeno, denominado re-oralizao da lngua
escrita [12], indica a ocorrncia de caractersticas da conversao
oral no texto produzido numa sesso de bate-papo.
A grande popularidade e a reconhecida utilidade dos sistemas de
bate-papo motivaram a realizao da presente pesquisa. Buscou-se
equacionar quantos usurios devem participar de uma sesso de
bate-papo sem decair a qualidade de interao. Saber quantos
usurios no mximo devem participar de uma sesso importante,
por exemplo, para planejar o tamanho do grupo de trabalho. Se o
moderador da sesso de bate-papo puder agrupar de 100 em 100
usurios ou apenas de 5 em 5 tem um grande impacto no
planejamento de horas de reunies. Por exemplo, numa equipe de
projeto com 500 usurios online, dependendo do tamanho do
grupo definido para a realizao de um debate sncrono, sero
necessrias 100 sesses, 50, 33, 25, 10 ou apenas 5 sesses.
Quanto maior o grupo de usurios numa sesso de bate-papo,
menor o tempo gasto nessa atividade. Contudo, quantos mais
usurios na sesso, menor a qualidade da interao no bate-papo.

Conforme aumenta a quantidade de usurios na sesso, mais


mensagens so produzidas, o que demanda de cada usurio mais
tempo para ler todas as mensagens e assim cada indivduo tem
menos tempo para enviar novas mensagens. Embora a produo
total de mensagens aumente com a quantidade de usurios,
tambm fato que a produo individual de mensagens decai com
o aumento do nmero de usurios. Na Figura 1 ilustrado um
modelo idealizado da interao entre usurios de bate-papo. O
modelo representa a produo de mensagens em funo da
quantidade de usurios.
Quantidade de mensagens produzidas

Stahl [21] chama ateno para o impacto do tamanho do grupo


sobre a eficcia dos diferentes meios de comunicao; ele defende
que grupos pequenos, de trs ou quatro usurios ativos, so mais
complexos e interessantes do que uma dupla respondendo um ao
outro. Contudo, se o grupo for grande demais ocorrero
problemas. A confuso no bate-papo [6] definida quando os
usurios no conseguem acompanhar a discusso pela ocorrncia
de fenmenos, como por exemplo, a sobrecarga de mensagens
causada pela grande quantidade de mensagens postadas em um
curto intervalo de tempo decorrente de um nmero excessivo de
usurios na sesso de bate-papo. Alguns autores, a partir de dados
empricos e em contextos especficos, indicam que o nmero ideal
de usurios num bate-papo entre 4 e 5 pessoas [1], [2], [3]; h
quem defenda que o bate-papo mais produtivo com 7 ou mais
usurios [16]; h quem defenda que o grupo deve ser inferior a 10
usurios [14]; h quem indique que 10 um tamanho bom para o
grupo de usurios [19]; e h quem indique que a quantidade de
usurios deve estar entre 6 a 18 alunos [18]. Alguns sistemas de
bate-papo limitam o nmero de usurios a 30 usurios por sesso,
e h sistemas que no estabelecem limites. Com essa diversidade
de sugestes no convergentes da quantidade de usurios que
devem participar de uma sesso de bate-papo, foi identificada a
necessidade de equacionar essa questo objetivo dessa pesquisa.

C3

C2
C1

Ymin
nvel mnimo de
interao esperado

Quantidade de usurios
Xmax
Quantidade mxima de usurios
do contexto C2 para que seja
alcanado o nvel de interao
esperado na sesso de bate-papo

Figura 1. Modelo Idealizado de Interao entre Usurios de


Bate-papo

Entende-se que deve existir um limite mximo de usurios, a


partir do qual ocorre confuso na conversao, o que compromete
a qualidade da interao na sesso de bate-papo. No bate-papo

66

Cunhamos essa expresso baseada no termo "jogo srio"


("serious game"), que so os jogos que tm o objetivo de
transmitir um contedo alm do entretenimento.

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

terceiro sobre assunto diferente; e dois desses logs foram


apresentados num bate-papo tpico e um deles foi apresentado
numa interface de bate-papo com avatar. Aps coletado o tempo
de leitura de cada usurio de cada mensagem dos trs logs, por
meio de testes estatsticos, foi possvel concluir quais dos fatores
levantados de fato influenciam o tempo de leitura. Todas as
anlises foram realizadas com o uso do software estatstico R[11]
e o nvel de significncia adotado foi o de 5%. Com a inteno de
verificar qual melhor conjunto de testes a ser usado (paramtricos
ou no paramtricos), testou-se inicialmente se os tempos de
leitura seguiam a distribuio normal por meio do teste ShapiroWilk. Para esse teste, foi obtido um valor p < 0,05, o que rejeita a
hiptese de os dados seguirem a distribuio normal. A partir
desse resultado, o teste no paramtrico de Kruskal-Wallis foi
usado para testar as hipteses, para isso, foi verificado se havia
diferena significativa entre os tempos de leitura obtidos entre os
indivduos em: todos os trs logs; entre os logs 1 e 2 (se a
interface do sistema influencia); e entre os logs 1 e 3 (se o assunto
influencia).

No modelo da Figura 1 so apresentadas curvas diferentes C1,


C2 e C3 que representam contextos distintos (grupos
diferentes). Os contextos representam as caractersticas singulares
de cada grupo tais como: idade mdia, nvel de instruo, assunto
debatido, protocolo da conversao etc. Na presente pesquisa,
deseja-se determinar, para um dado contexto, qual a quantidade
mxima de usurios (Xmax) que deve estar na sesso para que seja
possvel alcanar um determinado nvel de interao, representado
pela produo mdia de mensagens (Ymin)

3. AES REALIZADAS PELOS


USURIOS DURANTE UMA SESSO DE
BATE-PAPO
Durante uma sesso de bate-papo, o usurio l, escreve
mensagens e tambm reflete sobre a discusso. Essas aes,
descritas nas subsees a seguir, so os comportamentos
elementares de qualquer usurio de bate-papo e constituem a base
do modelo matemtico apresentado na seo seguinte.

Para inferir sobre a velocidade de leitura dos indivduos (hiptese


i), foi verificado se h diferena significativa na distribuio dos
tempos que cada um dispendeu ao ler as mensagens do log 1. Os
resultados obtidos pela aplicao do teste foi um p-valor < 0,001,
o que possibilitou concluir que os sujeitos realmente leem de
forma significativamente diferente, com diferentes velocidades.

3.1 Leitura
Uma pessoa no l igual outra pessoa; a velocidade de leitura
depende do nvel de escolaridade, da experincia em bater-papo,
do grau de interesse e de conhecimento sobre o assunto em
discusso, dentre outras caractersticas do indivduo. O tempo de
leitura tambm depende de fatores externos ao sujeito, como o
tamanho da mensagem e a interface do sistema de bate-papo.

Para testar a hiptese (ii), que o tempo de leitura proporcional


quantidade de caracteres da mensagem, foi verificada a correlao
entre a quantidade de caracteres das mensagens de cada log e os
tempos de leitura de cada usurio. A mdia das correlaes foi de
0,72, o que, de acordo com Shimakura [20], possibilita interpretar
que a correlao entre essas variveis forte, possibilitando
concluir que o tempo de leitura realmente proporcional
quantidade de caracteres (ainda que cada sujeito tenha uma
velocidade distinta de leitura). A correlao entre o tempo de
leitura e o tamanho da mensagem ilustrada para um dos usurios
do estudo na Figura 2.

Para caracterizar a ao de leitura de mensagens de bate-papo,


foram investigados quais fatores externos influenciam o processo
de leitura. Foi realizado um experimento com 6 alunos de psgraduao em Informtica de uma Universidade Pblica do Rio de
Janeiro, sendo 4 homens e 2 mulheres com idade entre 24 e 55
anos. Para medir o tempo de leitura, cada indivduo leu
mensagem-a-mensagem de um log real de bate-papo pela tela do
computador. Quando o indivduo pressionava uma tecla, uma
nova mensagem era apresentada e era registrado o tempo de
leitura decorrido entre uma tecla e a seguinte. Buscou-se
caracterizar como ocorre a leitura de mensagens entre diferentes
indivduos ao ler mensagens de diferentes tamanhos, em logs
sobre diferentes assuntos e apresentados em diferentes interfaces
de bate-papo. Foram testadas as 4 hipteses a seguir:

140

e po de e tu a a u o 6 e og
Assunto: linguagem Java + Interface: bate-papo tpico

Nmero de Caracteres da Mensagem

120

(i) Os usurios leem com velocidades significativamente


diferentes;
(ii) O tempo de leitura varia em funo da quantidade de
caracteres na mensagem;
(iii) O tempo de leitura varia em funo do assunto em
discusso;
(iv) A interface do sistema de bate-papo influencia o tempo
de leitura das mensagens.
Para testar estas hipteses, cada usurio deveria ler 3 logs reais de
bate-papo, sendo: dois logs sobre um mesmo assunto e um

100

80

60

40

20

coeficiente de correlao
linear de Pearson = 0,79
0
0

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
Conference10, Month 12, 2010, City, State, Country.
Copyright 2010 ACM 1-58113-000-0/00/0010 $15.00.

10

Tempo de Leitura (segundos)

Figura 2. Correlao entre o tempo de leitura e o tamanho da


mensagem de um dos usurios
Sobre a influncia do assunto (hiptese iii), o teste comparando os
tempos de leitura dos logs 1 e 3 (em que foram abordados

67

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

assuntos diferentes) no apontou diferena significativa com pvalor > 0,05. Ao menos a partir desse experimento no foi
possvel concluir que assuntos distintos provocam diferenas
significativas na velocidade de leitura dos indivduos.

3.3 Reflexo
O usurio de bate-papo no fica lendo e digitando mensagens o
tempo todo. Ocorrem intervalos, por exemplo, entre o trmino da
leitura das mensagens publicadas e a chegada de uma nova
mensagem a ser lida, em que o usurio no est digitando nem
lendo mensagens. Nestes momentos o usurio encontra-se
refletindo sobre a discusso.

Sobre a hiptese (iv), concluiu-se que os sujeitos leem em tempos


significativamente diferentes dependendo da interface do sistema
de bate-papo.

O tempo de reflexo o tempo que sobra de uma sesso de batepapo desconsiderando o tempo em que o usurio fica escrevendo
suas mensagens e o tempo em que fica lendo as mensagens.
Assim, nesta pesquisa, o tempo de reflexo foi estimado por meio
da equao (3).

Dado que a velocidade de leitura uma caracterstica individual e


que depende da quantidade de caracteres a serem lidos, e
considerando que no h diferena significativa na velocidade de
leitura em funo do assunto em discusso e que a interface do
sistema a mesma durante toda uma sesso de bate-papo - a partir
desses resultados foi assumido, por simplificao, que o tempo de
leitura pode ser modelado por uma equao linear em funo da
quantidade de caracteres da mensagem.

TR = durao da sesso (

*p) (

(3)

onde TR o tempo total de reflexo numa sesso de bate-papo,


o nvel de interao que se espera representado pela quantidade
mdia de mensagens enviadas por usurio na sesso, e p a
quantidade de usurios na sesso.

= 1 + (0,04 * mdia de caracteres por mensagem) (1)


A equao (1) representa o tempo mdio, em segundos, que os
sujeitos do experimento dispenderam para a leitura das mensagens
daquelas sesses de bate-papo (calculada a partir das linhas de
tendncia linear da correlao entre o tempo de leitura e a
quantidade de caracteres por mensagem por indivduo). preciso
ressaltar que essa equao vlida para o grupo de usurios do
experimento e que para outro perfil de usurios os coeficientes
dessa equao so diferentes.

4. PROCESSO DE MODELAGEM
Para modelar interao entre os usurios de bate-papo foi
utilizada a Teoria de Filas [15] em que cada usurio foi
representado como um servidor que precisa ler (atender) todas as
mensagens (clientes) digitadas pelos demais usurios e
enfileiradas na ordem em que so enviadas (publicadas na sala de
bate-papo) Figura 3.

3.2 Escrita
Cada pessoa possui uma velocidade de digitao especfica. No
s a velocidade de digitao, mas tambm os padres de digitao
diferem de um indivduo para outro. O intervalo entre o
pressionar de uma tecla e a outra, e o tempo em que uma tecla
permanece pressionada, so caractersticas nicas de cada
indivduo e corroboram para o estabelecimento de um padro de
digitao individual [9], [10]. Esses padres so estudados na rea
de Biometria da Digitao.

Figura 3. Teoria de Filas para modelar interao em bate-papo


Cada usurio, alm de ser um servidor, tambm desempenha o
papel de uma fonte geradora de mensagens enviadas para a fila de
todos os usurios da sesso. A taxa de leitura de mensagens o
inverso do tempo mdio de leitura
, e a taxa de produo de
mensagens o que se deseja determinar dado o tamanho p do
grupo de usurios. Os tempos de leitura e de produo de
mensagens foram considerados, na presente pesquisa, como
exponencialmente distribudos.

Para o presente artigo, de interesse obter tempos mdios de


digitao de mensagens em sesses de bate-papo, sendo preciso
medir a velocidade de elaborao de mensagem dos usurios. Para
efetivar essa medio, foi desenvolvido um mecanismo que
captura o tempo de cada tecla pressionada durante a digitao de
uma mensagem de bate-papo. Foi realizado um estudo, com
profissionais de computao, em que os sujeitos digitaram
algumas mensagens e o tempo de digitao foi registrado e
posteriormente analisado. Nesse estudo, o tamanho mdio das
mensagens digitadas foi de 85 caracteres por mensagem e o tempo
mdio de digitao foi de 24 segundos por mensagem, resultando
na velocidade mdia de digitao de 1 caractere / 0,28 segundos.
Verificou-se uma correlao muito forte (0,95) entre a quantidade
de caracteres e o tempo de digitao da mensagem. A partir desse
resultado foi assumido que o tempo de escrita ( ) pode ser
estimado por meio de uma equao linear em funo da
quantidade de caracteres da mensagem.
= 0,28 * mdia de caracteres por mensagem

Para obter as estimativas de produo de mensagem a partir dessa


modelagem, o modelo foi implementado no Tangram-II [4], que
um ambiente de modelagem baseado no paradigma orientado a
objetos e que fornece uma variedade de solvers para obteno das
medidas de interesse. As estimativas produzidas a partir do
modelo elaborado na presente pesquisa, discutidas nas prximas
sees, foram obtidas a partir da Soluo Analtica do TangramII.

4.1 Modelagem do comportamento de um


usurio de bate-papo

(2)

A equao (2) descreve o tempo mdio de escrita de mensagens,


medido em segundos, dispendido pelos sujeitos do grupo do
experimento.

Para modelar o comportamento de um usurio da sesso de batepapo, foi desenvolvido um diagrama de estados para representar
as atividades elementares que o usurio realiza durante o batepapo: ler e escrever mensagens Figura 4. Nessa abordagem, o
usurio permanece no estado Escrevendo por um determinado

68

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

refletindo por algum tempo at que decide escrever uma nova


mensagem, indo para o estado Escrevendo.

tempo at que envia a mensagem aos demais usurios. Aps


enviar a mensagem, ele verifica se existem mensagens a serem
lidas, e se houver passa para o estado Lendo. Enquanto o usurio
est Escrevendo ou Lendo mensagens, outras mensagens podem
chegar e essas so enfileiradas na ordem em que so enviadas
pelos demais usurios em um Fila de Mensagens. A transio de
estados modelada em funo de taxas. O usurio permanece
Lendo uma determinada mensagem por um tempo mdio de
leitura ( T L ), e a taxaLeitura calculada como o inverso do tempo
mdio. Da mesma forma, o usurio permanece no estado
Escrevendo durante um tempo mdio de escrita ( T E ), a partir do
qual se calcula a taxa de escrita.

BatepapoComeou

MensagemRecebida
taxaIniciativaParaEscrever
DecidiuEscrever

/ fila = fila + 1

Escrevendo
taxaEscrita
EnviouMensagem
[fila==0]

BatepapoComeou

[fila>0] [fila>0]

[fila==0]

Refletindo

taxaLeitura
LeuMensagem
MensagemRecebida

/ fila = fila - 1

/ fila = fila + 1

Escrevendo

MensagemRecebida
taxaEscrita
EnviouMensagem

[fila==0]
[fila>0]

[fila>0]

Lendo
MensagemRecebida

/ fila = fila + 1

/ fila = fila + 1

[fila==0]

taxaLeitura
LeuMensagem

BatepapoTerminou

/ fila = fila-1

Figura 5. Representao grfica das atividades realizadas


durante o bate-papo de um usurio
Lendo

Como discutido na Seo 5, esse diagrama com trs estados foi


implementado no modelo e mostrou-se adequado, pois foram
produzidas estimativas compatveis com os dados das sesses
reais de bate-papo educacional.

MensagemRecebida
/ fila = fila + 1

4.2 Modelagem da interao entre usurios de


bate-papo

BatepapoTerminou

Numa primeira estratgia de modelagem para a implementao do


modelo no Tangram-II, foi definido um objeto para representar
cada usurio individualmente, conforme ilustrado na Figura 6.
Cada objeto Indivduo realiza as atividades apresentadas no
diagrama da Figura 5: l e escreve mensagens, e fica refletindo.
Cada Indivduo tambm caracterizado por suas taxas de leitura,
escrita e iniciativa para escrever mensagens. Os usurios enviam
mensagens uns para os outros e tambm leem as mensagens
enviadas de acordo com suas respectivas taxas. As mensagens
recebidas so enfileiradas para a posterior leitura caso o usurio
esteja ocupado naquele momento lendo outras mensagens ou
escrevendo uma nova mensagem.

Figura 4. Diagrama dos Estados Lendo e Escrevendo


Representar um usurio de bate-papo por apenas dois estados
irreal, pois pressupe que o usurio fica o tempo todo ou Lendo
ou Escrevendo mensagens. Contudo, essa simplificao
possibilita estimar um Limite Mximo de mensagens produzidas
pelo usurio numa sesso de bate-papo pressupondo que esse
sujeito se encontra o tempo todo ocupado lendo todas as
mensagens publicadas e produzindo o mximo de mensagens que
seria capaz. Esse limite mximo de mensagens por indivduo
calculado pela equao (4).
m* T E + m*p* T L = Tsesso
m = Tsesso / ( T E + p * T L )

(4)

Indivduo 1

onde m representa o nmero de mensagens produzidas por usurio


em uma sesso de 60 minutos.
O Limite Mximo de produo de mensagens corrobora para a
avaliao do modelo de participao, como ser discutido na
Seo 5.

O diagrama de estados apresentado na Figura 5 mais prximo do


comportamento real dos usurios, pois leva em conta que um
usurio, alm de ler e escrever mensagens, tambm reflete em
alguns momentos. Nesse diagrama, o indivduo vai para o estado
Refletindo quando no tem mais mensagens a serem lidas, e fica
refletindo por um tempo at que: chega uma nova mensagem a ser
lida e, imediatamente, o usurio volta para o estado Lendo; ou fica

Figura 6. Estratgia de Modelagem: Interao entre


Indivduos

69

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Tabela 1. Obteno da estimativa de mensagens enviadas


adotando a estratgia Interao Indivduo-Grupo

Nessa estratgia de modelagem, cada Indivduo representado


por duas variveis: Fila, que contm a quantidade de mensagens a
serem lidas; e Estado, que representa a atividade realizada pelo
Indivduo em um determinado momento da sesso de bate-papo.
O conjunto de todos os estados dos p indivduos, bem como as
transies possveis entre os estados, so representados por uma
Cadeia de Markov [5].
Seguindo o paradigma do Tangram-II, o objeto Indivduo
replicado n vezes, um para cada indivduo do grupo da sesso.
Essa estratgia de modelagem, contudo, provoca uma exploso de
estados da cadeia de Markov, o que impossibilita obter a medida
de interesse pelo Tangram-II para grupos com 6 ou mais usurios.

taxaEnvioMsg

Indivduo

Valor calculado
pelo Tangram-II:
quantidade de
mensagens
enviadas pelo
Usurio Isolado
durante 1h de
bate-papo
34,4

3,4 (34,0)

34,2

3,5 (35,0)

34,0

Conforme apresentado na Tabela 1, foram testadas sucessivas


taxas de envio de mensagens do Grupo. Dentre as taxas testadas, a
que mais aproximou a quantidade de mensagens enviadas por
cada indivduo do grupo com a do indivduo isolado foi 3,4. Para
essa taxa, cada indivduo do grupo teria produzido 34,0
mensagens, enquanto o Indivduo Isolado, conforme o clculo
produzido pelo Trangram-II, teria enviado 34,2 mensagens
durante 60 minutos. Essa diferena inferior a 1 mensagem, e
restringindo a preciso da taxa a uma casa decimal, essa a taxa
que mais se aproxima da produo do indivduo isolado com a do
indivduo do grupo. Repetindo esse trabalho para diferentes
quantidades de usurios no grupo, obtm-se a curva de interesse:
quantidade de mensagens produzidas por um usurio da sesso de
bate-papo em funo dos diferentes tamanhos de grupo.

...
(p-1) * taxaEnvioMsg

Chute inicial: Taxa de


envio de mensagens do Grupo
(e a respectiva quantidade de
mensagens enviadas por cada
usurio do Grupo)
Mensagens por indivduo do
grupo durante sesso de 1h =
taxa * 60min /6 usurios
3,3 (33,0)

(p-1)
Grupo de Indivduos

Figura 7. Estratgia de Modelagem: Interao IndivduoGrupo


Para contornar a exploso de estados, uma segunda estratgia de
modelagem foi elaborada Figura 7. Nessa nova abordagem, aqui
denominada Interao Indivduo-Grupo, um nico objeto Usurio
interage com uma entidade nica que representa os demais
usurios do grupo produzindo mensagens.
Enquanto na estratgia Interao entre Indivduos ocorre o
aumento exponencial do nmero de estados conforme aumenta a
quantidade de usurios da sesso de bate-papo, na estratgia
Interao Indivduo-Grupo apenas dois objetos interagem, no
variando em funo da quantidade de integrantes do grupo, e
consequentemente no provocando a exploso dos estados, o que
possibilitou obter pelo Tangram-II as estimativas de interesse
dessa pesquisa.

5. AVALIAO DO MODELO
Para avaliar a adequao do modelo elaborado nesta pesquisa, as
estimativas produzidas pelo modelo foram comparadas com os
dados reais obtidos de um corpus de anlise. O corpus de anlise
utilizado constitudo de logs de sesses de bate-papo das turmas
de uma disciplina lecionada totalmente a distncia, denominada
Tecnologias de Informao Aplicadas Educao (TIAE) [7].
Ao todo foram obtidos 142 logs de bate-papo ocorridos em 18
turmas ministradas entre os anos de 1999 e 2008 (em cada turma
foram realizadas, em mdia, 8 sesses de 1h de bate-papo).

Nessa estratgia, cada usurio do Grupo deve produzir mensagens


numa taxa semelhante ao do indivduo isolado, pois assume-se
que todos os usurios do bate-papo tem um comportamento
similar. Isto significa que a taxa de envio do Grupo dividida por
(p-1) precisa ser prxima ao nmero de mensagens enviadas pelo
indivduo isolado. O valor da taxa de mensagens enviadas pelo
indivduo isolado a medida de interesse que se quer encontrar.
Para obter essa taxa, o primeiro passo atribuir um valor aleatrio
para a taxa de produo de mensagens pelo grupo e, pelo
Tangram-II, calcular a taxa de envio de mensagens do indivduo
isolado. Em seguida compara-se a taxa atribuda ao sujeito do
grupo e a produzida pelo indivduo isolado. A diferena entre as
taxas deve ser a menor possvel nessa pesquisa, foi definido que
a diferena deveria ser inferior a 1 mensagem. Em funo do
resultado obtido pelo Tangram-II, ajusta-se a estimativa da taxa de
envio de mensagens do grupo at que a taxa dos indivduos do
grupo fique prxima da taxa do indivduo isolado. Desta forma,
iterativamente, obtm-se uma estimativa para a quantidade de
mensagens produzidas por usurio dado um determinado tamanho
do grupo essa a medida de interesse dessa pesquisa. Como
exemplo, na Tabela 1 so exemplificados os passos realizados
iterativamente para se obter a estimativa da produo individual
de mensagens considerando que h 7 usurios na sesso (um
indivduo mais 6 integrantes no grupo).

5.1 Parametrizao do modelo


Para se obter as estimativas de produo de mensagens por
usurio dado um tamanho de grupo, necessrio realizar a
parametrizao do modelo. De acordo com a Figura 5, cada
usurio pode estar, durante uma sesso de bate-papo, em um dos
trs estados: Lendo, Escrevendo ou Refletindo. A transio entre
os estados ocorre conforme a ocorrncia de Eventos que, por sua
vez, ocorre seguindo as seguintes taxas: taxaLeitura, taxaEscrita e
taxaIniciativaParaEscrever.
A maneira de se parametrizar o modelo por meio da obteno
dos tempos mdios de leitura, escrita e reflexo dos usurios em
um determinado contexto. Como a avaliao do modelo foi
realizada pela comparao das estimativas produzidas com os
dados extrados de logs reais, o modelo tambm foi parametrizado
por meio de dados obtidos dos logs, tais como: durao das
sesses de bate-papo, nmero de usurios em cada sesso,
quantidade mdia de caracteres por mensagem e quantidade mdia
de mensagens enviadas por usurio. Esses dados, em conjunto
com as equaes produzidas nos estudos sobre as aes dos

70

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

usurios durante o bate-papo (seo 3), se apresentaram como


uma forma alternativa para a parametrizao do modelo, j que
no era possvel ter acesso aos usurios que participaram das
sesses de bate-papo das turmas TIAE.

dos resultados produzidos pelo modelo para a turma TIAE


2007.1.
50

Mdia de mensagens enviadas por usurio


em uma sesso de 60 min

Para estimar o parmetro taxaLeitura, foi considerado o tamanho


mdio das mensagens produzidas em cada turma, sendo este um
dado obtido dos logs. Na equao (5) exemplificada a aplicao
da equao (1) para estimar o parmetro taxaLeitura dos usurios
da turma TIAE2007.1 (primeiro semestre de 2007), onde:
T L = 1 + (0,04 * tamanho mdio das mensagens)

= 1 + (0,04 * 94,1) = 1 + 3,76 = 4,76 seg = 0,08 min


taxaLeitura = 1/ 4,76 = 0,21 msg/seg = 12,6 msg/min

(5)

De forma similar, para estimar as taxas de escrita, considerou-se


que a equao (2) e o tamanho mdio das mensagens de cada
turma TIAE (obtido dos logs reais). Na equao (6),
exemplificada a aplicao da equao (2) para estimar a
taxaEscrita.

45

Estimativa para 5 usurios:


37,4 mensagens

40
35
30

Sesso real de bate-papo do grupo 2007.1:


9,7 usurios 32,3 mensagens

25
20
15
10

Estimativa para 50 usurios:


12,1 mensagens

T E = 0,28 * mdia de caracteres por mensagem


0

= 0,28 * 94,1 = 26,3 seg = 0,44 min

10

15

20

25

30

35

40

45

50

55

(6)

Quantidade de usurios

Para estimar as taxaIniciativaParaEscrever, foi primeiramente


utilizada a equao (3) para estimar o tempo de reflexo total na
sesso de bate-papo (TR) considerando: durao da sesso (obtida
de cada log), a quantidade de usurios de cada turma TIAE; a
mdia de mensagens enviadas por usurio; e os tempos de leitura
e de escrita estimados de cada turma. Considerando-se que o
usurio envia em mdia m mensagens durante a sesso de batepapo, ento entre a escrita de uma mensagem e a outra esse
usurio fica refletindo, em mdia, TR / m . Optou-se em adotar
esse valor como uma aproximao do tempo mdio de iniciativa
de escrita de mensagens ( T IE ). A taxa de iniciativa para escrever
ento obtida pelo inverso de T IE . O procedimento elaborado para
a estimativa desses parmetros na turma TIAE2007.1
exemplificado na equao (7).

Figura 8. Curva de interao estimada pelo modelo e pontos


representando a produo real obtida dos logs

taxaEscrita = 1/0,44 = 2,3 msg/min

Aplicando-se os procedimentos aqui descritos, foi estimada uma


curva de interao para cada turma TIAE. Essa estimativa foi
utilizada para avaliar a preciso do modelo, como descrito a
seguir.

5.2 Teorema Central do Limite para avaliar a


preciso do modelo
Para avaliar o modelo elaborado, as estimativas produzidas
pelo modelo foram comparadas com os dados obtidos dos logs
reais. Diferentemente do modelo que estima a produo mdia de
mensagens para cada tamanho do grupo, nos dados reais ocorrem
diferentes valores para um mesmo tamanho de grupo por
exemplo, numa turma com 10 usurios, em mdia cada um
produziu 32 mensagens durante uma sesso, mas na sesso
seguinte produziram em mdia 29 mensagens (conforme os dados
extrados da turma TIAE 2007.1 nas sesses 3 e 4). Portanto, se
pudssemos realizar vrias sesses com exatamente 10 usurios
no grupo, seria possvel estimar um valor mdio de mensagens
produzidas e um intervalo ao redor dessa mdia que abrigaria a
maioria das ocorrncias reais.

Alm das taxas, preciso especificar a funo de distribuio de


probabilidade dos eventos. Na presente pesquisa, optou-se por
utilizar o modelo Poisson com a distribuio exponencial para
representar a distribuio de todos os eventos do modelo j que
essa distribuio representa um grande nmero de processos na
natureza e a distribuio mais comumente utilizada em
processos modelados como fila. Alm disso, de acordo com
Fogliatti e Mattos [5], "sempre que possvel, deve ser escolhida a
distribuio exponencial mesmo que no seja o melhor ajuste,
pois a sua utilizao em muito facilita a obteno das medidas de
desempenho do sistema" (p.219).

A preciso da estimativa do modelo em relao aos dados


reais fundamentada pelo Teorema Central do Limite. Pelo
Teorema, conforme vai aumentando o tamanho da amostra
(ocorrncias reais), a distribuio amostral da mdia aproxima-se
de uma distribuio Normal, e neste caso 95% dos dados
amostrais ficam entre -2 e +2, onde a mdia populacional
e o desvio padro populacional. Optou-se por um intervalo
de confiana de 95%, por ser o tradicionalmente adotado em
pesquisa quantitativa [22]. Para usar o intervalo de confiana de
95% , usa-se a rea entre -2 e +2. Isso implica em verificar
se 95% dos dados reais ocorridos nas sesses da turma TIAE

Com as taxas usadas como parmetros do modelo


considerando os dados de cada turma TIAE, e especificadas as
funes de distribuio de probabilidade dos eventos, o modelo
pde ser rodado no ambiente Tangram-II para obter o nmero de
mensagens enviadas em funo das seguintes quantidades de
usurios: 5, 9, 12, 20, 30, 50 e 100 usurios. Com os valores
calculados pelo modelo e interpolando os valores no calculados,
traada a curva de interao estimada para cada turma TIAE.
Como exemplo, na Figura 8 apresentada a curva traada a partir

71

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

A primeira constatao sobre essa questo que no existe uma


resposta nica, pois o limite de usurios depende do contexto de
cada grupo de trabalho: do perfil dos usurios (velocidade de
leitura e de digitao) e das caractersticas da sesso de bate-papo
(interface do sistema, protocolo de conversao etc.). No modelo,
essas caractersticas so encapsuladas nos parmetros Tempo
Mdio de Escrita, Leitura e Reflexo. Estimados esses parmetros
para um contexto ou para o perfil mdio de usurios de um grupo
de trabalho, o modelo usado para traar a curva de interao
como a ilustrada na Figura 10.

ficam dentro desses limites ao redor da mdia estimada pelo


modelo.
Cada ponto da curva de participao obtida do modelo
corresponde estimativa da mdia de mensagens enviadas numa
amostra ( x ) em funo do tamanho do grupo de usurios. Falta
definir o desvio padro dessa mdia de mensagens produzidas na
amostra (s). Foram realizados testes estatsticos que possibilitaram
concluir que o processo real de produo de mensagens nas
turmas TIAE pode ser aproximado por uma Poisson. Assumindo
essa distribuio amostral, o desvio padro calculado como
sendo =
(na distribuio de Poisson, a mdia
representada pela letra grega [lambda]).

QUANTIDADE DE MENSAGENS EM FUNO DA QUANTIDADE DE USURIOS


(EM SESSO DE BATE-PAPO COM DURAO DE 1 HORA)
50

A partir dessa abordagem, foi verificado se 95% dos dados


reais ficavam dentro dos limites calculados em funo das mdias
estimadas pelo modelo. Foram contabilizadas quantas sesses das
turmas TIAE ficaram dentro da regio estimada em funo do
modelo e quantos ficaram fora, como exemplifica o procedimento
ilustrado Figura 9.

Quantidade
esperada de
mensagens
produzidas por
usurio

Todas as sesses de bate-papo desse grupo ficaram


dentro da regio estimada em funo do modelo.
Conclui-se que, para este grupo, o modelo produziu
estimativas adequadas aos dados reais observados.

curva de interao para o


contexto do grupo 2007.1

30

20

10

0
0

Sesso 1
de bate-papo
do grupo 2007.1

Intervalo de confiana
que deve conter 95%
dos dados amostrais

Mdia de mensagens enviadas por usurio


em uma sesso de 60 min

Avaliao do Modelo da Interao entre usurios de


bate-papo segundo o Teorema Central do Limite

QUANTIDADE DE MENSAGENS

40

10

Devem participar no mximo 10


usurios, para que cada um
consiga enviar ao menos 1
mensagem a cada 2 minutos
(30 mensagens por hora)

+2
Limite superior

Curva de interao
estimada pelo modelo

15

20
25
30
35
QUANTIDADE DE USURIOS

No mximo 23 usurios devem


participar, para que cada um
consiga enviar ao menos 1
mensagem a cada 3 minutos
(20 mensagens por hora)

Figura 10. Quantidade de mensagens em funo do tamanho


do grupo

-2
Limite inferior

Alm do contexto, o limite de usurios que podem participar da


sesso de bate-papo tambm depende da expectativa do nvel de
interao (quantidade de mensagens) que cada usurio deve
produzir durante a sesso. No exemplo apresentado na Figura 10,
suponha que se espere que cada usurio envie, em mdia, 1
mensagem a cada 3 minutos de conversa, isto , 20 mensagens
durante uma sesso de 60 minutos. Pela curva identifica-se que
esse mnimo de mensagens alcanado quando se tem, no
mximo, 23 usurios. Caso o nvel de participao esperado seja
de 1 mensagem a cada 2 minutos (30 mensagens por hora),
naquele contexto, deveriam participar da sesso de bate-papo no
mximo 10 usurios.

Quantidade de usurios

Figura 9. Dados reais obtidos dos logs, curva de interao e


regio estimada em funo do modelo
De todas as 142 sesses de bate-papo das turmas TIAE,
95,8% ficaram dentro da regio estimada em funo do modelo.
Este valor est dentro dos limites definidos pelo Teorema Central
do Limite (95,4%), o que possibilita concluir que o modelo de
participao produz estimativas adequadas da mdia de
mensagens enviadas por usurio em funo do tamanho do grupo
presente na sesso de bate-papo educacional.

A estimativa precisa requer que sejam obtidos os parmetros


discutidos nesse artigo, como o tempo mdio de leitura e de
digitao dos alunos, no contexto que se deseja estimar, para cada
turma especfica. Contudo, conforme ilustrado na Figura 11,
estudando as vrias turmas de uma disciplina possvel obter uma
curva mdia que serve para estimar a produo mdia de
mensagens em qualquer turma daquela disciplina. Essa uma
curva til para definir a quantidade de usurios que podem
participar das sesses de bate-papo naquela disciplina
(independentemente do contexto).

6. QUANTIDADE DE MENSAGENS EM
FUNO DO TAMANHO DO GRUPO
Uma vez que o modelo foi considerado vlido, conforme a
avaliao apresentada na seo anterior, foi possvel buscar uma
resposta para a pergunta inicial desta pesquisa: quantos usurios
devem participar de uma sesso de bate-papo?

72

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Dentre as limitaes dessa pesquisa esto os poucos dados obtidos


dos experimentos sobre os processos elementares de interao em
bate-papo espera-se que os processos de leitura, escrita e
reflexo sejam caracterizados com mais preciso e generalizao
em trabalhos futuros. Outra limitao da presente pesquisa a
concentrao dos dados reais do corpus de anlise ao redor de 10
usurios por sesso, com desvio padro de 3,8 usurios. Essa
concentrao impossibilitou a avaliao do modelo em grupos
pequenos (com 5 ou menos usurios) e tambm em grupos muito
maiores (com 20 ou mais usurios) em trabalhos futuros, esperase avaliar o modelo considerando uma maior variao no nmero
de usurios em um mesmo contexto. Tambm se espera, em
trabalhos futuros, que sejam produzidas estimativas em outros
contextos, como em uma equipe de desenvolvimento distribudo
de software ou reunies de tomada de deciso colaborativa.

60

Quantidade
esperada de
mensagens
produzidas por
usurio

QUANTIDADE DE MENSAGENS

50

curva de interao obtida pela


mdia dos 18 grupos TIAE

40

30

20

10

0
0

10

15

Devem participar no mximo 14


usurios, para que cada um
consiga enviar ao menos 1
mensagem a cada 2 minutos
(30 mensagens por hora)

20
25
30
35
QUANTIDADE DE USURIOS

8. REFERNCIAS
[1] Beauvois, M. H. 1992. Computer-assisted classroom
discussion in the foreign language classroom: Conversation
in slow motion. In Foreign Language Annals, 25, 455-464.

No mximo 28 usurios devem


participar, para que cada um
consiga enviar ao menos 1
mensagem a cada 3 minutos
(20 mensagens por hora)

[2] Bhlke, O. 2003. A comparison of student participation


levels by group size and language states during chatroom and
face-to-face discussions in German. CALICO Journal, 21
(1), pginas 67-83.

Figura 11. Curva mdia de interao no contexto TIAE


A partir dos resultados obtidos com a presente pesquisa,
possvel discutir os resultados encontrados na literatura
apresentados na seo 2. No possvel enunciar um valor
consensual sobre a quantidade de alunos que devem participar de
uma sesso de bate-papo, pois depende do contexto e do nvel de
interao (produo de mensagens dos usurios ao longo da
sesso de bate-papo) almejado. Os valores encontrados na
literatura foram obtidos de contextos especficos e decorrentes da
expectativa dos pesquisadores sobre a interao dos usurios.

[3] Bump, J. 1990. Radical changes in class discussion using


networked computers. Computer and the Humanities, 24, 4965.
[4] De Souza e Silva, E., Figueiredo, D., Leo, R. 2009. The
TangramII integrated modeling environment for computer
systems and networks. In ACM SIGMETRICS Performance
Evaluation Review, 36(4): 64-69.

O que se pde concluir, em funo dos estudos aqui apresentados


sobre as sesses de bate-papo de um grupo de usurios em
particular, foi: no preciso constituir grupos muito pequenos de
apenas 3 ou 4 alunos, como sugerem alguns autores; mas tambm
no devem ser agrupados muitos alunos (os pesquisadores dos
grupos estudados sugerem evitar grupos com mais de 18 usurios
[18]) porque a confuso comea a se tornar crtica: os usurios
no conseguem ler todas as mensagens; a produo individual de
mensagens decai; e sobra pouco tempo para o usurio refletir
sobre o que est sendo discutido na sesso.

[5] Fogliatti, M. C., Mattos, N. M. C. 2007. Teoria de filas. Rio


de Janeiro: Intercincia.

7. CONCLUSO E TRABALHOS
FUTUROS

[8] Fuks, H., Gerosa, M.A., Pimentel, M. 2003. Projeto de


Comunicao em Groupware: Desenvolvimento, Interface e
Utilizao. XXII Jornada de Atualizao em Informtica,
Anais do XXIII Congresso da Sociedade Brasileira de
Computao, v2, cap. 7, p. 295-338.

[6] Fuks, H., Pimentel, M., Lucena, C.J.P. 2006. R-U-Typing-2Me? Evolving a chat tool to increase understanding in
learning activities. In International Journal of ComputerSupported Collaborative Learning, v. 1, p. 117-142, 2006.
[7] Fuks, H., Gerosa, M. A., Lucena, C. J. P. 2002. The
Development and Application of Distance Learning on the
Internet. In Journal of Open and Distance Learning, Vol.
17, N. 1, ISSN 0268-0513, pp. 23-38.

No presente artigo foi elaborado um modelo matemtico para


representar o comportamento de usurios em sistemas de batepapo visando determinar qual o nmero mximo de usurios que
devem participar de uma sesso de bate-papo. Os resultados
produzidos pelo modelo elaborado mostraram-se adequados em
comparao com os dados reais obtidos de 142 sesses de batepapo realizadas em 18 turmas de uma disciplina a distncia, e
assim conclui-se que o modelo elaborado nessa pesquisa produz
estimativas adequadas. O modelo til para subsidiar diferentes
estudos, e nesse artigo mostrou-se a utilidade do modelo para
apoiar o planejamento do tamanho do grupo de trabalho ao
participar de uma sesso de bate-papo esse resultado de
interesse tanto para as instituies que promovem educao online
quanto para empresas que usam esses sistemas para apoiarem o
trabalho em grupo.

[9] Gaines, R., Lisowski, W., Press, S. and Shapiro N. 1980.


Authentication by keystroke timing: Some preliminary
results. Rand Report R-256-NSF. Rand Corporation, Santa
Monica, CA.
[10] Garcia, J. 1986. Personal identification apparatus. Patent
Number 4.621.334. U.S. Patent and Trademark Office,
Washington, D.C.
[11] Gentleman, R. , Ihaka, R. 2013. The R Project for Statistical
Computing. http://www.r-project.org/, Acessado em 10 ago
2013.

73

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

[18] Pimentel, M., Lucena, C. J. P., Fuks, H. 2003. Debati,


debati... aprendi? Investigaes sobre o papel educacional
das ferramentas de bate-papo. In IX Workshop sobre
Informtica na Escola - WIE2003. Agosto, 2003.

[12] Hilgert, J. G. 2000. A construo do texto falado por


escrito na Internet. Fala e escrita em questo. Dino Preti
(org). So Paulo: Humanistas/FFLCH/USP.
[13] Hiltz, S.R. and Turoff, M. 1978. The Network Nation:
Human Communication via Computer, Addison-Wesley,
1978.

[19] Piva, D. J., Pupo, R., Gamez, L., Oliveira, S. 2011. EAD na
Prtica Planejamento, mtodos e ambientes de educao
online. Elsevier Editora Ltda. pginas 164-170.

[14] Hrastinski, S. 2008. The potential of synchronous


communication to enhance participation in online
discussions: A case study of two e-learning courses. In
Information & Management, 45, 499-506.

[20] Shimakura, S. 1990. CE003 - Estatstica II.


http://leg.ufpr.br/~silvia/CE003 , acessado em 20 jul 2013.,
24, 49-65, 1990..

[15] Kleinrock, L. 1975. Queueing Systems - Theory, Vol. I.


Wiley-Interscience.

[21] Stahl, G. 2009. Studying Virtual Math Teams. New York,


NY: Springer.

[16] Lber, A., Schwabe, G., Grimm, S. 2007. Audio vs. chat:
The effects of group size on media choice. Proceedings of
the 40th HICCS Hawaii International Conference on System
Sciences.

[22] Wainer, J. 2007. Mtodos de pesquisa quantitativa e


qualitativa para a Cincia da Computao, em JAI 2007 Jornada de Atualizao em Informtica, Anais do XXVII
Congresso da Sociedade Brasileira de Computao. p.221262.

[17] Pimentel, M., Gerosa, M. A., Fuks, H. 2011. Sistemas de


comunicao para colaborao. In Sistemas Colaborativos,
cap.5. Rio de Janeiro: Elsevier.

74

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

A Influncia da Diversidade de Conhecimento no Processo


de Aprendizagem Colaborativa
Edmar Welington Oliveira

Marcos Roberto da Silva Borges

Universidade Federal de Juiz de Fora - UFJF


Juiz de Fora, Brasil

Universidade Federal do Rio de Janeiro - UFRJ


Rio de Janeiro, Brasil

oliveira.edmar@ufjf.edu.br

mborges@nce.ufrj.br

ABSTRACT

Categorias e Descritores do Assunto

Individuals have different cognitive abilities, although in some


cases equivalents. That means, considering a learning context, that
individuals learn differently, according to their interests, needs,
capabilities etc., which are specific to each person. In learning
environments, it is common to use the idea of collaboration as a
strategy to instigate and encourage learning, mainly because of the
difficulty that certain individuals have on learning individually.
However, fostering the interaction between "homogeneous"
individuals, with equivalent levels of knowledge, makes it
difficult - and sometimes impossible - that collaboration achieves
the desired objectives. This work aims to investigate the influence
of diversity (difference) of knowledge in collaborative learning
process. It was investigated whether students could learn more
when they participate in collaborative environments where
interactions take place between individuals with different levels of
knowledge. An experiment was conducted in a class in order to
evaluate whether knowledge diversity, in a learning collaborative
process, is beneficial regarding knowledge acquisition.

K.3.1 [Computadores e Educao]: Aprendizagem Colaborativa

Termos Gerais

Experimentao, Fatores Humanos.

Palavras-Chave

Aprendizagem Colaborativa, Diversidade.

1. INTRODUO

A evoluo do conhecimento depende do trabalho coletivo, e no


individual. Isso porque ele visto como um construto social e est
vinculado s relaes humanas [9]. O conhecimento pode, sim, se
desenvolver em nvel individual, mas em um menor grau do que
se fosse compartilhado. Mesmo resultando de aes individuais
j que aprendizado especfico de cada pessoa , o conhecimento
pode ser aprimorado e ampliado. Isso requer, contudo, interaes
entre pessoas [13]. essencial que se promova o
compartilhamento de ideias, saberes e opinies [2]. O processo de
desenvolvimento de conhecimento depende da contribuio
individual e da interao que ocorre dentro de um grupo, atravs
de processos comunicacionais.

RESUMO

Indivduos possuem capacidades cognitivas diferentes, ainda que,


em alguns casos, equivalentes. Isso quer dizer, em um contexto de
aprendizagem, que indivduos aprendem de formas diversas, em
funo dos interesses, necessidades, habilidades etc. especficos
de cada um. Em ambientes de aprendizagem, frequente o uso da
ideia de colaborao como estratgia para instigar e impulsionar o
aprendizado, principalmente em virtude da dificuldade que certos
indivduos possuem em aprender individualmente. Entretanto, o
fomento interao entre indivduos homogneos, com nveis
de conhecimento equivalentes, acaba por dificultar e por vezes,
impossibilitar que a colaborao atinja os objetivos pretendidos.
O objetivo deste trabalho foi investigar a influncia da diversidade
(diferena) de conhecimento no processo de aprendizagem
colaborativa. Buscou-se avaliar se alunos conseguem aprender
mais quando participam de ambientes colaborativos onde as
interaes so realizadas entre indivduos com diferentes nveis de
conhecimento. Um experimento em um ambiente real de aula foi
realizado de forma a analisar se, de fato, a diversidade de
conhecimento, em um processo de aprendizagem colaborativa,
benfica no que tange ao aprendizado.

Em um ambiente altamente competitivo, a vantagem do indivduo


reside em sua capacidade reativa de aprender e to importante
quanto aprender rpido, aprender de forma eficaz. Desse modo,
verifica-se a adoo, cada vez maior, de prticas colaborativas no
norteamento de processos educacionais, principalmente daqueles
em que a complexidade ultrapassa as capacidades cognitivas
individuais. Logo, permite-se que o conhecimento seja construdo
no apenas por meio de empenho individual, mas, principalmente,
atravs do esforo de uma coletividade. importante ressaltar que
essa viso fomenta uma ressignificao do conceito de aprender.
Trata-se, portanto, de compreender a educao como um processo
de socializao, que oportunize a adoo de um fazer pedaggico
dinmico, fundamentado nas interaes entre indivduos e na
sinergia de saberes [6].
Para a aprendizagem, interessam as condies necessrias sua
realizao e criao do conhecimento. H, de certo modo, a
concepo de que o foco est no indivduo e na forma como este
pode construir seu conhecimento. Entretanto, o senso, mesmo o
individual, , em parte, de fundo coletivo - visto que parte dos
pressupostos de uma pessoa fruto de uma cultura adquirida em
um processo de socializao. Assim, quando indivduos aprendem
em conjunto, eles se desenvolvem de forma mais rpida do que se
estivessem agindo isolados. Entende-se, portanto, que o processo
de aprendizado depende de interao. Faz-se necessrio, portanto,
ponderar sobre a adoo de prticas visando troca constante de
conhecimentos e habilidades. neste contexto que se questiona o
modelo tradicional de aprendizagem, centrado no sujeito, em prol

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

75

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

de uma aprendizagem coletiva, fundamentada na interao entre


indivduos - uma ideia cada vez mais usada na esfera educacional
[1] e cuja aprendizagem decorrente mostra-se particularmente
benfica [12].

Dentro do contexto da aprendizagem colaborativa, estimula-se o


esforo coletivo, ao invs do envolvimento individual. Isso
permite que haja troca de saberes entre os indivduos, instigando
neles a proposta de aprender com e para os outros, rompendo com
os limites convencionais da aprendizagem. Verifica-se
convergncia para uma dinmica de desenvolvimento
compartilhado - onde h a interao de indivduos, com
habilidades complementares. Para o presente trabalho, interessa,
justamente, essa proposta de troca de conhecimento entre
indivduos, de forma que seja possvel a eles aprender em
conjunto, aproveitando-se de eventuais diferenas no nvel desse
conhecimento. Parte-se do princpio de que, nesse tipo de
aprendizagem, a interao em grupos reala o aprendizado, mais
do que em um esforo individual. Uma aprendizagem mais
eficiente, assim como um trabalho mais eficiente, colaborativa e
social, em vez de competitiva e isolada. A troca ideia e saberes
melhora o pensamento e aprofunda o entendimento [4].

Entretanto, embora se percebam as vantagens da interao para a


aprendizagem, no raro os objetivos, quanto ao aprendizado, no
so alcanados. So vrios os fatores que, em um contexto de
aprendizagem colaborativa, afetam a eficcia do aprendizado. No
presente trabalho, interessa, especificamente, a questo da
diversidade1 de conhecimento em um ambiente de interao e
seu impacto no aprendizado. [14] analisou a distncia entre o
nvel de desenvolvimento cognitivo real de um sujeito,
determinado pela resoluo independente de problemas, e o nvel
superior de desenvolvimento potencial, determinado pela
resoluo de problemas em colaborao com pares mais capazes.
Verificou-se que aquilo que um aluno capaz de realizar ao atuar
em colaborao com um colega mais favorvel para seu prprio
desenvolvimento do que seu desempenho analisado isoladamente.
Portanto, neste trabalho, acredita-se que, quando indivduos com
nveis de conhecimento equivalentes atuam em conjunto, o
aprendizado decorrente acaba no sendo to eficiente quanto seria
se a interao ocorresse entre indivduos diversos (ou seja, com
nveis de conhecimento diversos). Este trabalho prope investigar
a influncia da diversidade em um contexto de aprendizagem
colaborativa. Parte-se da hiptese de que, quando realizada entre
indivduos com diferentes nveis de conhecimento, a
aprendizagem colaborativa possibilita um aprendizado individual
em maior grau.

3. DIVERSIDADE

A palavra diversidade possui diferentes conotaes. Na maioria


dos dicionrios de lngua portuguesa, as seguintes definies so
encontradas: diferena, dessemelhana, variedade, multiplicidade,
pluralidade etc. possvel verificar, portanto, dois sentidos bem
distintos: diferena e variedade. No contexto deste trabalho, como
mencionado, interessa a diversidade no sentido da diferena (de
conhecimento) e o seu impacto no processo de aprendizagem. O
intuito da pesquisa verificar se a interao entre indivduos com
nveis diferentes de conhecimento promove um aprendizado em
maior grau do que se as interaes ocorressem entre indivduos
com nveis de conhecimento equivalentes. A inteno da pesquisa
no foi analisar se o conjunto global de conhecimentos dos
indivduos tem influncia sobre o aprendizado de novos
contedos. Planeja-se isso como possvel trabalho futuro desta
pesquisa.

Alm desta seo introdutria, este trabalho est organizado como


descrito a seguir. Na seo 2, discorre-se sobre a abordagem de
aprendizagem colaborativa. A seo 3 discute sobre a questo da
diversidade. A seo 4 apresenta o experimento realizado para se
verificar a validade da proposta de pesquisa. A seo 5 mostra e
analisa os resultados obtidos. A seo 6 expe as concluses. Por
fim, as referncias bibliogrficas so apresentadas na seo 7.

A anlise sobre o aspecto de grupos homogneos e heterogneos


se baseou em trabalhos [10] onde se afirma que grupos com maior
diversidade apresentam melhor desempenho, especificamente no
que tange s tarefas complexas, que grupos homogneos mesmo
quando, individualmente, os integrantes dos grupos homogneos
eram pessoas com maior capacidade de solucionar problemas. De
fato, nos grupos homogneos, os integrantes tendem a pensar de
forma equivalente, propondo as mesmas solues. Por outro lado,
grupos heterogneos possuem integrantes diversos, com perfis,
formaes e capacidades cognitivas diferentes e, por essa razo,
tendem a melhorar, substancialmente a capacidade de resoluo
de problemas. Embora a ideia de diversidade, neste trabalho, seja
aplicada sob um aspecto mais restrito do que o considerado em
[10], acredita-se que, assim como em [10], grupos heterogneos,
formados por indivduos com diferentes nveis de conhecimento,
apresentam melhor desempenho, em termos de aprendizado, do
que grupos homogneos (onde os indivduos possuem nveis
equivalentes de conhecimento). No presente trabalho, parte-se do
princpio de que aprender uma tarefa complexa.

2. APRENDIZAGEM COLABORATIVA

Para [3], a aprendizagem colaborativa remete a uma situao de


aprendizagem na qual duas ou mais pessoas aprendem ou tentam
aprender algo juntas, sendo considerada uma proposta muito til
para apoiar processos educacionais. Segundo [5], em ambientes
instrucionais centrados na aprendizagem colaborativa, observa-se
uma centralizao de esforos no sentido de prover uma interao
entre os indivduos, buscando transmitir conhecimento entre todos
atravs de estratgias de colaborao. Para [8], o desenvolvimento
cognitivo dos indivduos muito beneficiado por processos de
aprendizagem colaborativa. Embora seja possvel encontrar vrias
definies para o conceito de aprendizagem colaborativa, pode-se
dizer que a premissa dessa abordagem se baseia na construo do
conhecimento atravs da cooperao, da interao entre sujeitos
[11]. De maneira geral, espera-se que ocorra o aprendizado como
consequncia de uma interao entre pares que atuam em sistema
de interdependncia na resoluo de problemas ou na realizao
de uma tarefa. A proposta de aprendizagem colaborativa, segundo
[6], a direo mais promissora no sentido do desenvolvimento
do saber. Para [7], uma pedagogia centrada no conceito de
grupo e no nos indivduos isoladamente.

4. EXPERIMENTO

O experimento foi realizado em trs aulas da disciplina de


Orientao a Objetos especificamente, na turma do 3 perodo
do curso de Graduao em Cincias Exatas, da Universidade
Federal de Juiz de Fora. Participaram os 24 alunos da turma.
Optou-se pela escolha desse pblico pela razo discutida a seguir:
segundo o professor da disciplina em questo, uma das grandes
dificuldades dos alunos (independente da turma) sempre foi o

Adotado, nesse trabalho, no sentido de disparidade, diferena e


no no sentido de pluralidade, multiplicidade ou variedade.

76

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

minutos para desenvolvimento e entrega (que deveria ser


realizado via sistema Moodle). A durao foi estabelecida com
base no tempo total disponvel de 2 horas (tempo de uma aula). O
primeiro exerccio, PROG01, enfatizava o processo de tratamento
de exceo (gerao do objeto de exceo, lanamento, captura e
tratamento). Para este exerccio, os alunos deveriam usar excees
definidas na biblioteca da linguagem de programao Java. J o
segundo exerccio, PROG02, embora envolvesse esse mesmo
processo, impunha aos alunos a obrigatoriedade de criao de
classes de erro. Isso lhes possibilitou explorar o conceito sob duas
perspectivas. Para a realizao dos exerccios, os alunos
utilizaram o aplicativo BLUEJ. Entre os exerccios PROG01 e
PROG02, foi definido um tempo de descanso de 10 minutos
para os alunos. O propsito foi amenizar o cansao dos alunos,
uma ameaa que prejudicaria a etapa.

aprendizado do conceito de Tratamento de Exceo. Os alunos do


curso de Cincias Exatas cursam essa disciplina ao ingressarem no
terceiro perodo da graduao. Entretanto, a bagagem que esses
alunos trazem dos dois perodos anteriores no que diz respeito
ao conhecimento sobre programao bastante limitada. Como
a disciplina de Orientao a Objetos, em geral, aborda conceitos
mais avanados sobre programao, os alunos acabam
apresentando algumas dificuldades no aprendizado dos mesmos.
A adoo de prticas colaborativas (por exemplo, a realizao de
exerccios em grupos) uma estratgia considerada pelo professor
visando melhorias no processo de aprendizagem. Entretanto, ao
longo dos perodos, observou-se que nem sempre o uso dessa
proposta proporcionou uma melhoria no que tange aquisio de
conhecimento ao menos para alguns alunos. Em outras palavras,
o desempenho deles (verificado atravs de avaliaes individuais),
por vezes, no apresenta avanos. O tratamento de exceo, em
especial, tem sido aquele no qual os alunos tm apresentado mais
dificuldade, em muito pela complexidade inerente ao conceito. O
problema de aprendizado em questo fomentou o interesse em se
investigar as razes pelas quais, mesmo atuando em grupos, os
alunos no conseguiam aprender de forma satisfatria. Em funo
disso, resolveu-se aplicar um experimento que permitisse explorar
a influncia da diversidade (sob uma conotao de diferena) de
conhecimento entre os alunos, em um ambiente de interao, no
aprendizado deles. O objetivo foi analisar se alunos com
diferentes nveis de conhecimento, ao atuarem juntos, conseguiam
aprender mais se comparado interao entre alunos com nveis
de conhecimento equivalentes.

J na segunda etapa do experimento, todos os exerccios foram


corrigidos pelo professor da disciplina. Foram atribudas notas
para as solues apresentadas pelos alunos. Com esses resultados,
foi possvel ranquear os alunos em ordem decrescente de notas.
Um ranque (chamado de R01) foi criado com base nas notas do
exerccio PROG01 e, outro (chamado de R02), com base nas
notas do exerccio PROG02. Em ambos, os alunos foram
classificados de A1 a A24, sendo A1 o aluno com a melhor nota e
A24 o aluno com a pior nota. A partir dessas classificaes,
tornou-se vivel verificar o nvel de conhecimento dos alunos
sobre os conceitos abordados. Dessa forma, tem-se uma noo
acerca do conceito no qual o aluno estava mais/menos
preparado. A tabela 4.1 ilustra o quantitativo para cada
conceito2 (nota) obtido pelos alunos, em ambos os exerccios.
Pode-se observar que primeiro exerccio - PROG01, sobre o
processo de tratamento de exceo - exigiu conhecimentos, para
sua resoluo, que metade dos alunos no possua (ou era
insuficiente). J o segundo exerccio PROG02, sobre o processo
de tratamento de exceo com criao de classes de erro cobrou
conceitos mais familiares aos alunos. Alm disso, importante
considerar a curva de aprendizado entre a resoluo do exerccio
PROG01 e a resoluo do exerccio PROG02. O conceito
aprendido com o primeiro exerccio, presumivelmente, ainda que
em parte, deve ter sido aplicado no desenvolvimento do segundo.

Para minimizar eventuais ameaas ao experimento, buscou-se, ao


mximo, limitar as interaes entre os alunos e o responsvel pela
conduo do experimento (professor). Ao professor, cabia separar
os grupos e aplicar os exerccios do experimento, no podendo
auxili-los na resoluo. Para os alunos, fora dito que a atividade
no seria diferente, em termos de avaliao, das demais atividades
que o professor, frequentemente, aplicava. Buscou-se, com isso,
no interferir na motivao dos alunos. Por fim, ao longo da
realizao do experimento, foram concedidos, entre a resoluo
dos exerccios, alguns minutos de descanso, buscando-se evitar
que o cansao dos alunos pudesse interferir no comportamento
deles.

Tabela 4.1. Quantidade de alunos para cada conceito (nota)

4.1 Dinmica do Experimento

Antes da realizao do experimento, o professor ministrou uma


aula (com durao de 2 horas) sobre o conceito de Tratamento de
Exceo. Fora solicitado aos alunos que estudassem os conceitos
vistos na aula, visando realizao de exerccios na aula seguinte.
Essa uma prtica comum adotada pelo professor. Os alunos no
foram informados sobre a realizao do experimento. O objetivo
foi seguir a prtica pedaggica habitual do professor, buscando
no influenciar na preparao dos alunos para o desenvolvimento
dos exerccios. O experimento foi dividido em quatro etapas. Na
primeira delas, foram aplicados dois exerccios de programao
(PROG01 e PROG02), ambos relacionados ao conceito de
Tratamento de Exceo. Fora definido que ambos os exerccios
seriam realizados individualmente, mas com possibilidade de
consulta ao material. Ademais, definiu-se um tempo para o
desenvolvimento e entrega de cada exerccio.

PROG01
PROG02

A
4
11

B
8
3

C
1
5

D
4
2

E
7
3

A terceira etapa foi dividida em quatro momentos. No primeiro


(realizado extraclasse), os 24 alunos foram divididos em oito
grupos (G1 a G8), de trs alunos. Para essa diviso, utilizou-se o
ranque R01. O grupo G1 foi formado pelos trs primeiros alunos
(A1, A2 e A3) do ranque. O grupo G2, pelos trs alunos seguintes
(A4, A5, e A6), e assim por diante. Dessa forma, o grupo G1
comportava os alunos com as trs maiores notas no exerccio
PROG01. Em contrapartida, o grupo G8 comportava os alunos
com as trs piores notas. O propsito dessa diviso foi criar
grupos cujos membros possussem conhecimento nivelado. A
tabela 4.2 ilustra a diviso dos grupos, considerando-se os
conceitos dos alunos.

Optou-se pela execuo individual dos exerccios tendo em vista o


propsito de se verificar a assimilao do contedo pelo aluno.
No houve restrio de consulta, uma vez que o aprendizado
obtido pelos alunos durante a execuo das atividades era
desejvel. Para cada exerccio, fora definido um tempo de 50

77

As notas foram definidas atravs de conceitos, cujos respectivos


intervalos de valores foram definidos conforme a seguir: A (8.1
a 10), B (6.1 a 8), C (4.1 a 6), D (2.1 a 4), E (0 a 2).

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Assim como na terceira etapa, o grupo G1 foi formado pelos


alunos com as trs melhores notas no ranque R02. A formao
dos demais grupos seguiu a mesma estratgia. Objetivava-se obter
grupos cujos membros possussem nveis de conhecimento
equivalentes. A tabela 4.4 ilustra a diviso dos grupos,
considerando-se os conceitos dos alunos.

Tabela 4.2. Primeira diviso dos grupos


G1
AAA

G2
ABB

G3
BBB

G4
BBB

G5
CDD

G6
DDE

G7
EEE

G8
EEE

No segundo momento, aps a diviso dos grupos, fora planejado


que estes deveriam realizar um exerccio de programao (E01).
Objetivava-se incentivar o processo de colaborao para a soluo
do exerccio. Para a realizao do exerccio E01, fora definido um
tempo de 25 minutos. Aps o trmino do prazo, todos os alunos
deveriam, individualmente, responder ao questionrio Q01. Um
prazo de 5 minutos foi estipulado para isso. No Terceiro momento
dessa etapa, os grupos foram reorganizados segundo um critrio
explicado a seguir. No quarto momento, um novo exerccio de
programao (E02) foi aplicado. Assim como o primeiro, este
deveria ser realizado pelo grupo, dentro de um prazo de 25
minutos. No final, um questionrio (Q02) foi aplicado, o qual
deveria ser respondido por todos os alunos em um prazo de 5
minutos. A reorganizao dos grupos foi realizada de forma a
tornar os grupos mais diversos (mais heterogneos). Em outras
palavras, buscou-se criar grupos cujos membros, diferentemente
dos grupos do primeiro momento, possussem nveis de
conhecimento dspares.

Tabela 4.4. Terceira diviso dos grupos


G1
AAA

G3
ADE

G4
ACE

G5
BBE

G6
BBE

G7
BBE

G4
AAB

G5
BBC

G6
CCC

G7
CDD

G8
EEE

No segundo momento, aps a diviso dos grupos, fora planejado


que estes deveriam realizar um exerccio de programao (E03).
Para a realizao do exerccio E01, fora definido um tempo de 25
minutos. Aps o trmino do prazo, todos os alunos deveriam,
individualmente, responder ao questionrio Q03. Um prazo de 5
minutos foi estipulado para isso. No Terceiro momento, os grupos
foram reorganizados. No quarto momento, um novo exerccio de
programao (E04) foi aplicado. Assim como o primeiro, este
deveria ser realizado pelo grupo, dentro de um prazo de 25
minutos. Ao final, um questionrio (Q04) foi aplicado, o qual
deveria ser respondido por todos os alunos em um prazo de 5
minutos. A reorganizao dos grupos buscou torn-los mais
heterogneos. Em outras palavras, buscou-se criar grupos cujos
membros possussem nveis de conhecimento dspares. O critrio
utilizado para diviso dos grupos foi idntico ao adotado na
terceira etapa. A diferena foi o ranque considerado (nesse caso, o
R02). A tabela 4.5 ilustra como ficou a reorganizao dos grupos
novamente, considerando-se as notas.
Tabela 4.5. Quarta diviso dos grupos

Tabela 4.3. Segunda diviso dos grupos


G2
ADE

G3
AAA

Como observado na tabela 4.4, o percentual de alunos com


conceito A ou B relativamente maior se comparado tabela
(4.1) resultante do exerccio PROG01. Isso pode ser justificado,
primeiro, pela curva de aprendizado. O exerccio E02 cobrava os
conceitos abordados no exerccio E01, apenas acrescentando a
abordagem de criao de classes de erro. Assim, ao fazerem o
exerccio E02, os alunos j haviam adquirido algum conhecimento
resultado da resoluo do exerccio E01. Em segundo lugar, a
turma pode, com base na aula do professor, ter entendido melhor
e mais sobre a parte de criao de classes de erro, se comparado
ao processo de tratamento de exceo.

O critrio utilizado para diviso dos grupos foi conforme descrito


a seguir. Tomou-se como base o mesmo ranque R01. Os alunos
com as oito piores notas nesse ranque (A24 a A17) encabearam
os grupos G1 a G8. Assim, o aluno com a pior nota (A24) ficou
no grupo G1. J o aluno com a segunda pior nota (A23), ficou no
grupo G2. O processo continuou at que esses oito alunos fossem
distribudos. Posteriormente, os alunos com as oito melhores
notas (A1 a A8) foram inseridos nos grupos G1 a G8. Assim, o
aluno com a melhor nota (A1) ficou no grupo G1, juntamente com
o aluno com a pior nota (A24). J o aluno com a segunda melhor
nota (A2), ficou no grupo G2, e assim por diante. Para completar
a diviso dos grupos, os demais alunos (A16 a A9) foram
inseridos, respectivamente, nos grupos G1 a G8. Ao final do
processo, o grupo G1, por exemplo, ficou com o aluno de maior
nota (A1), com o aluno de menor nota (A24) e com um aluno
(A16) cuja nota ficou entre as oito notas intermedirias. A
tabela 4.3 ilustra a nova distribuio dos grupos, considerando-se
as notas dos alunos.
G1
ADE

G2
AAA

G1
ACE

G8
BBD

G2
ACE

G3
ABE

G4
ABD

G5
ABD

G6
AAC

G7
AAC

G8
AAC

Em comparao terceira diviso de grupos, observa-se que h,


nessa quarta diviso, certa diversidade entre seus membros. Nesta
quarta etapa, ambos os exerccios E03 e E04 envolviam a criao
de classes de erros, embora tambm envolvessem o processo de
tratamento de exceo. Neste caso, a programao envolvia tanto
a gerao de objetos de erro (instncias das classes de erro criadas
pelos alunos), como o lanamento, captura e tratamento dos
mesmos.

Optou-se por essa estratgia de diviso, pois seria possvel criar


grupos em que, ao menos, um aluno considerado bom (mdia A
ou B) estivesse presente. Em alguns casos, alguns grupos ficaram
com dois alunos bons e um aluno ruim (mdia C, D ou E). O
objetivo foi tornar o grupo, considerando os conceitos obtidos
pelos alunos, o mais diverso possvel. Ao fim dessa terceira etapa,
os alunos tiveram 10 minutos de descanso. Novamente, o objetivo
foi amenizar o provvel cansao fsico e, principalmente, mental
deles. Nessa terceira etapa, ambos os exerccios E01 e E02
cobravam os conceitos relacionados ao processo de tratamento de
exceo.

O experimento, como um todo, foi realizado em trs aulas da


disciplina de Orientao a Objetos. Essas aulas ocorreram em dias
distintos. Na primeira aula, como discutido, o professor ministrou
aula sobre o conceito de tratamento de exceo. possvel
denominar etapa como sendo a etapa de preparao. J na segunda
aula, fora realizado a primeira etapa do experimento, onde os
alunos realizaram os exerccios PROG01 e PROG02, necessrios
para a gerao das classificaes. Na terceira aula, foram

A quarta etapa, a exemplo da terceira, tambm foi dividida em


quatro momentos. No primeiro momento (realizado extraclasse),
os 24 alunos voltaram a ser divididos em oito grupos, com trs
alunos. Contudo, para essa diviso, utilizou-se o ranque R02
(obtido a partir dos resultados notas do exerccio PROG02).

78

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

exerccios E03 e E04 da quarta etapa cobrarem, alm do processo


de tratamento de exceo, a criao de classe de erro. Optou-se
por essa repetio para que fosse possvel comparar os
resultados de ambas as etapas e analisar se seriam equivalentes. A
figura 4.1 ilustra, graficamente, todas as etapas do experimento.

realizadas a terceira e quarta etapas, onde os alunos se


organizaram em grupos para resolver os exerccios E01, E02, E03
e E04 e responder aos questionrios de avaliao Q01, Q02, Q03
e Q04. importante enfatizar que a quarta etapa uma mera
repetio da terceira. A diferena est no fato de ambos os

Figura 4.1. Representao das etapas do experimento


Na figura 4.1, a diferena de colorao entre os grupos (G1 a G8)
do primeiro e terceiro momentos (para ambas a terceira e a quarta
etapas) busca representar a reorganizao dos grupos.

importante ressaltar que todas as perguntas dos questionrios


Q01 e Q02 estavam relacionadas apenas terceira etapa e todas as
perguntas dos questionrios Q03 e Q04 estavam relacionadas
apenas quarta etapa. Alm disso, tanto na terceira etapa quanto
na quarta, todos os 24 alunos participaram de dois grupos um
homogneo (primeiro) e outro heterogneo (segundo). Nos
questionrios Q02 e Q04, a quinta pergunta pedia ao aluno para
dizer em qual dos dois grupos (primeiro ou segundo) dos quais ele
participou a interao foi mais intensa. Dessa forma, no
questionrio Q02, por exemplo, o aluno deveria responder se a
interao foi maior no grupo que resolveu o exerccio E01
(primeiro grupo da terceira etapa) ou no grupo que resolveu o
exerccio E02 (segundo grupo da terceira etapa). A sexta pergunta
pedia ao aluno para dizer em qual dos dois grupos (primeiro ou
segundo) ele aprendeu mais. A stima, e ltima, pergunta pedia ao
aluno para comparar o nvel de dificuldade do segundo exerccio
de cada etapa em relao ao primeiro. No questionrio Q02,
comparava-se a dificuldade do exerccio E02 em relao ao E01.
No questionrio Q04, comparava-se a dificuldade do exerccio
E04 em relao ao E03.

4.2 Questionrios de Avaliao

Ao todo, foram aplicados quatro questionrios de avaliao (Q01


a Q04), todos no ltimo dia do experimento, cada um deles logo
aps os exerccios E01 a E04. Os questionrios eram compostos
de 4 (Q01 e Q03) ou 7 (Q02 e Q04) perguntas, todas de mltipla
escolha. As quatro primeiras perguntas de cada questionrio eram
idnticas. Somente os questionrios Q02 e Q04 continham trs
perguntas adicionais. Os questionrios Q01, Q02, Q03 e Q04
foram aplicados imediatamente aps os exerccios E01, E02, E03
e E04, respectivamente. A primeira pergunta solicitava ao aluno
classificar (dentre as opes: muito alto, alto, mdio, baixo, muito
baixo) o nvel de interao (troca de ideias/conhecimento, debate,
etc.) entre os membros de seus respetivos grupos durante a
realizao do exerccio. Optou-se pela palavra interao, ao invs
de colaborao, pois os alunos poderiam entender esta ltima
como sendo a contribuio efetiva individual na construo da
soluo e no a participao no processo. Em outras palavras, um
aluno poderia participar, massivamente, do processo de resoluo
do exerccio explicando algum conceito aos colegas, discutindo
o uso ou no de algoritmos, etc. , mas no ter nenhuma de suas
sugestes transformadas em cdigo.

5. RESULTADOS

Nessa seo, so apresentados os resultados obtidos a partir da


aplicao dos questionrios Q01, Q02, Q03 e Q04. Os resultados
so apresentados separadamente para a terceira e quarta etapas.

A segunda pergunta pedia ao aluno para classificar (dentre as


opes: muito alta, alta, mdia, baixa, muito baixa) a eficincia da
interao entre os membros de seus respectivos grupos ou seja,
o quanto a interao ajudou na resoluo do exerccio. A terceira
pergunta solicitava ao aluno para classificar seu grupo (dentre as
opes: muito forte, forte, mdio, fraco, muito fraco) quanto ao
conhecimento coletivo (conhecimento do grupo como um todo)
em relao ao conceito de tratamento de exceo cobrado no
exerccio. A quarta pergunta pedia ao aluno para responder se a
interao com os integrantes de seu grupo lhe ajudou (sim, no)
no aprendizado do contedo. Outras trs foram inseridas nos
questionrios Q02 e Q04 os quais finalizavam a terceira e quarta
etapas, respectivamente.

5.1 Terceira Etapa

No incio da terceira etapa, os alunos foram separados em grupos


homogneos para resolver o exerccio E01. Aps a atividade,
todos responderam o questionrio Q01. Depois, foram separados
em novos grupos, heterogneos, para resolver o exerccio E02.
Aps a atividade, todos responderam o questionrio Q02. Isso
quer dizer que os resultados referentes ao questionrio Q01 esto
relacionados dinmica realizada com os grupos homogneos e
os resultados referentes ao questionrio Q02 esto relacionados
com a dinmica realizada com os grupos heterogneos. Os
resultados dessa subseo comparam as respostas dos
questionrios Q01 e Q02.

79

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

A figura 5.1 apresenta os resultados relativos pergunta 1:


avaliao do nvel de interao entre os participantes dos grupos.

os grupos formados por alunos mais capacitados tendem a ser


mais eficientes na resoluo do exerccio, j que contam com um
nvel de conhecimento coletivo mais alto. Observa-se, entretanto,
que mesmo nos grupos heterogneos, a interao contribuiu para a
resoluo do exerccio ainda que sua intensidade no tenha sido
to alta como a observada nos grupos homogneos.
A figura 5.3 apresenta os resultados relacionados pergunta 3:
classificao dos grupos considerando-se o conhecimento
coletivo.

Figura 5.1. Resultados da pergunta 1


Dos 24 alunos, para 8 (33%), a interao nos grupos homogneos
foi muito alta. Para 14 (58%), a interao foi alta. Para 2 (8%), a
interao foi mdia. J na avaliao dos grupos heterogneos, 3
alunos (12%) consideraram a interao muito alta, 14 (48%) alta,
5 (21%) mdia e 2 (8%) baixa. Dos 24 alunos, 22 (91%) acharam
que a interao nos grupos homogneos foi muito alta ou alta. J
para os grupos heterogneos, a proporo foi de 17 (71%) alunos.
O resultado indica que a interao foi maior no grupo homogneo.
Acredita-se que, ao participar de um grupo homogneo onde o
aluno verifica que seu nvel de conhecimento equivalente aos
dos demais membros do grupo talvez ele se sinta mais vontade
para interagir (discutir, trocas ideias/saberes, etc.). Por outro lado,
ao verificar que ele faz parte de um grupo onde alguns membros
possuem maior conhecimento sobre o assunto (no caso dos grupos
heterogneos), talvez o aluno se sinta pouco vontade, assumindo
uma postura mais passiva (de ouvir) do que ativa (discutir) seja
por achar que no oferecer contribuies teis ao grupo, ou
receio de ser retaliado, etc.

Figura 5.3. Resultados da pergunta 3


Dos 24 alunos, para 3 (12%), o grupo homogneo do qual
participaram eram muito fortes. Para 10 (41%), era forte. Para 11
(46%), era mdio. Dos 24 alunos, apenas 1 (4%) considerou seu
grupo heterogneo muito forte. 8 (33%) avaliaram como forte, 10
(41%) como mdio e, 5 (21%), como fraco. Dos 24 alunos, 13
(54%) consideram o grupo homogneo como muito forte ou forte.
J no contexto dos grupos heterogneos, 9 alunos (37%)
avaliaram-nos como sendo muito fortes ou fortes. O resultado
indica que os grupos homogneos foram considerados mais fortes.
Como esses grupos tiveram maior intensidade de interao e, alm
disso, foram mais eficientes, acredita-se que isso tenha
proporcionado aos alunos a sensao de esses grupos serem mais
fortes (possurem um conhecimento, coletivo, maior). Convm
destacar que at a aplicao do experimento, os alunos, ao menos
no que tange disciplina em questo (Orientao a Objetos) no
possuam conhecimento da competncia de seus pares (visto que o
professor no havia liberado qualquer nota referente a avaliaes
e exerccios realizados pelos mesmos). Portanto, acredita-se ser
pouco provvel que o fato de os alunos se conhecerem tenha tido
incisiva influncia na classificao dos grupos.

A figura 5.2 apresenta os resultados relativos pergunta 2: nvel


de eficincia da interao o quanto ela ajudou na resoluo do
exerccio.

A figura 5.4 apresenta os resultados relacionados pergunta 4: se


a interao com os membros do grupo ajudou no aprendizado do
aluno. importante ressaltar que no foi solicitado aos alunos,
nesta pergunta, para comparar os grupos homogneos com os
grupos heterogneos. A pergunta 4 procurou saber do aluno se a
interao no grupo lhe ajudou no aprendizado.

Figura 5.2. Resultados da pergunta 2


Dos 24 alunos, 10 (41%) avaliaram que a interao nos grupos
homogneos teve eficincia muito alta. Para 12 (50%), alta. Para 1
(4%), mdia. Para 1 (4%), baixa. As repostas do questionrio Q02
mostram que 6 (25%) alunos avaliaram a eficincia da interao
nos grupos heterogneos como muito alta, 13 (54%) alta, 2 (8%) e
3 (12%) baixa. Dos 24 alunos, 22 (92%) consideraram a eficincia
da interao nos grupos homogneos como muito alta ou alta. J
no contexto dos grupos heterogneos, a eficincia foi muito alta
ou alta para 19 (79%) alunos. O resultado indica que a eficincia
da interao foi maior nos grupos homogneos. Como a interao
foi considerada mais intensa nesses grupos, acredita-se que essa
intensidade tenha se transformado, na viso dos alunos, em
resultado til: resoluo do exerccio. Alm disso, dos 8 grupos
homogneos, 4 eram formados por alunos com conceitos A ou B
e, em 1 dos 4 demais grupos, havia um aluno com conceito C,
mas cuja nota foi muito prxima do conceito B. Portanto, pode-se
dizer que mais da metade dos grupos homogneos possua alunos
com nvel de conhecimento de moderado a alto. Acredita-se que

Figura 5.4. Resultados da pergunta 4


Dos 24 alunos, para 20 deles (83%), a interao nos grupos
homogneos ajudou em seus processos de aprendizagem. J para
4 (16%), essa interao no ajudou o aprendizado. As respostas
do questionrio Q02 mostram que para 18 alunos (75%), dos 24, a
interao nos grupos heterogneos os ajudou no aprendizado. J
para 6 (25%), essa interao no ajudou. O resultado indica que a

80

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

interao nos grupos homogneos foi mais benfica no que tange


ao aprendizado dos alunos. Como esses grupos foram avaliados
como os com maior nvel de interao, e os com maior eficincia,
acredita-se que o aprendizado seja uma consequncia direta disso.
possvel observar, entretanto, que as interaes no contexto dos
grupos heterogneos tambm contriburam para o aprendizado dos
alunos, ainda que em menor nvel se comparado aos grupos
homogneos. Acredita-se que isso seja consequncia da interao
dos alunos com maior nvel de conhecimento com aqueles com
menor nvel.

interao entre os alunos, fosse compartilhado. Como


consequncia, os alunos que no o possuam antes da interao,
provavelmente, passaram a t-lo aps. Acredita-se que, embora
ocorra aprendizado nos grupos homogneos, uma vez que h troca
de saberes, discusso, etc., a tendncia que esse aprendizado
seja mais intenso (ao menos para alguns alunos) nos grupos
heterogneos.
Por fim, a pergunta 7 questionou os alunos no que tange o nvel
de dificuldade do exerccio E02 em comparao o E01. O
resultado apresentado na figura 5.7.

Na figura 5.5, so apresentados os resultados obtidos na pergunta


5: considerando os dois grupos, primeiro e segundo, em qual
deles a interao foi mais intensa.

Figura 5.7. Resultados da pergunta 7


Dos 24 alunos, 1 (4%) afirmou que o exerccio E02 estava muito
mais difcil que o exerccio E01. Para 5 alunos (21%), E02 estava
mais difcil que E01. Para 11 (46%), E02 e E01 eram equivalentes
em termos de dificuldade. Para outros 5 (21%), E02 era mais fcil
que E01 e, para 2 (8%), o exerccio E02 era muito mais fcil que
o E01. Acredita-se, pelo resultado, que uma eventual diferena no
nvel de dificuldade entre os exerccios no tenha influenciado os
resultados obtidos na terceira etapa do experimento.

Figura 5.5. Resultados da pergunta 5


Dos 24 alunos, 14 (59%) consideraram que a interao entre os
alunos foi mais intensa nos grupos homogneos. J para 10 alunos
(41%), a interao foi mais intensa nos grupos heterogneos. Esse
resultado condizente com o resultado obtido com a pergunta 1
(figura 5.1).

5.2 Quarta Etapa

A quarta etapa ocorreu de forma idntica terceira, inclusive com


relao aplicao dos questionrios. A nica diferena estava no
contedo dos exerccios cobrados. Alm do conhecimento sobre o
processo de tratamento de exceo, os exerccios da quarta etapa
cobravam dos alunos conhecimentos sobre a criao de classes de
erro. No incio da quarta etapa, os alunos foram organizados em
grupos homogneos para resolver o exerccio E03. Ao final da
atividade, eles responderam o questionrio Q03. Em seguida, os
alunos foram separados em grupos heterogneos, que resolveram
o exerccio E04. Em seguida, os alunos responderam o
questionrio Q04. Os resultados referentes ao questionrio Q03
esto associados dinmica realizada com grupos homogneos. J
os resultados referentes ao questionrio Q04 esto associados
dinmica realizada com os grupos heterogneos. Os resultados
desta subseo comparam as respostas dos questionrios Q03 e
Q04.

A figura 5.6 apresenta os resultados da pergunta 6: em qual dos


dois grupos primeiro ou segundo o aluno acredita ter
aprendido mais. Nessa pergunta, ao contrrio da pergunta 4, foi
solicitado aos alunos para compararem os grupos homogneos
com os heterogneos, indicando em qual deles o aprendizado foi
maior.

Figura 5.6. Resultados da pergunta 6


Dos 24 alunos, 14 (59%) afirmaram que aprenderam mais ao
participar do segundo grupo (heterogneo). J para 10 (41%), esse
aprendizado foi maior ao participarem do grupo homogneo. O
resultado acima indica o que se queria, de fato, demonstrar com o
experimento: grupos heterogneos (diversos) so mais eficazes do
que grupos homogneos para o aprendizado em um ambiente de
aprendizagem colaborativa. Nos grupos homogneos, os alunos
possuam nveis de conhecimento equivalentes. Assim, ainda que
tenha sido observada uma maior interao entre eles, contribuindo
para aquisio de novos conhecimentos, acredita-se que essa
contribuio seja menor, se comparada aos grupos heterogneos
afinal, o mesmo saber que um dos membros do grupo homogneo
possui, provavelmente, os outros integrantes do grupo tambm
possuem. Em contrapartida, nos grupos heterogneos, alguns
alunos possuam maior conhecimento que outros (j que
obtiveram maior nota, individualmente, nos exerccios da segunda
etapa). Assim, presumvel que esse conhecimento, em funo da

A figura 5.8 apresenta os resultados relativos pergunta 1:


avaliao do nvel de interao entre os participantes dos grupos.

Figura 5.8. Resultados da pergunta 1


Dos 24 alunos, para 9 (37%), a interao nos grupos homogneos
foi muito alta. Para 7 (30%), foi alta. Para 5 (21%), foi mdia.
Para 3 (12%), foi baixa. J com a dinmica realizada com os
grupos heterogneos, 15 alunos (62%) avaliaram a interao

81

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

tenham se motivado a mostrar os conhecimentos adquiridos com


as interaes passadas.

nesses grupos como muito alta, 4 (17%) alta e 5 (21%) mdia.


Dos 24 alunos, 19 (79%) consideraram que a interao nos grupos
heterogneos foi muito alta ou alta. J para os grupos
homogneos, a proporo foi de 16 alunos (66%). O resultado
indica que a interao foi maior no grupo heterogneo. Nota-se
que esse resultado contrrio ao observado na terceira etapa,
onde os alunos responderam que o nvel de interao foi maior
nos grupos homogneos.

A figura 5.9 apresenta os resultados relativos pergunta 2: nvel


de eficincia da interao o quanto ela ajudou na resoluo do
exerccio.

No incio da quarta etapa, os alunos foram organizados em grupos


homogneos (assim como na terceira etapa). Como a diviso dos
grupos baseou-se nas notas obtidas pelos alunos
(individualmente) no exerccio PROG02, alguns que haviam
formado um dos oito grupos homogneos na terceira etapa,
voltaram, na quarta etapa, a participar de um mesmo grupo. Dos
oitos grupos homogneos da quarta etapa, em cinco deles
verificou-se repetio de alunos. Mais especificamente, em quatro
desses cinco grupos, dois de seus trs alunos integrantes haviam
participado de um mesmo grupo homogneo na terceira etapa. Um
desses cinco grupos era formado pelos mesmos alunos que, na
terceira etapa, formaram um dos grupos homogneos. Desse
modo, pode ser que alguns alunos no tenham se motivado para
discutir outro exerccio com as mesmas pessoas de antes.
Acredita-se que isso seja justificativa para, na quarta etapa, o nvel
de interao nos grupos homogneos ter sido menor, se
comparado ao nvel de interao desses grupos na terceira etapa.

Figura 5.9. Resultados da pergunta 2


Dos 24 alunos, 5 (21%) avaliaram que a interao nos grupos
homogneos teve eficincia muito alta. Para 11 (46%), alta. Para 5
(21%), mdia. Para 3 (12%), baixa. As repostas do questionrio
Q02 mostram que 9 alunos (37%) avaliaram a eficincia da
interao nos grupos heterogneos como muito alta, 12 (50%) alta
e 3 (12%) mdia. Dos 24 alunos, 21 (87%) consideraram a
eficincia da interao nos grupos homogneos como muito alta
ou alta. J no contexto dos grupos homogneos, a eficincia foi
muito alta ou alta para 16 alunos (66%). O resultado indica que a
eficincia da interao foi maior nos grupos heterogneos. Como
a interao foi considerada mais intensa nos grupos heterogneos,
acredita-se que essa intensidade tenha se transformado, na viso
dos alunos, em um resultado til: resoluo do exerccio. Esse
resultado foi o contrrio do obtido na terceira etapa, mas pode ser
justificado pela intensidade da interao, que, como observado,
foi maior nos grupos heterogneos. Alm do mais, com as
interaes passadas, provavelmente os alunos adquiriram novos
conhecimentos, que acabaram sendo utilizados na resoluo do
exerccio E04, dando a sensao de que a eficincia, no contexto
dos grupos heterogneos, foi maior.

Os exerccios E03 e E04 quarta etapa cobraram o mesmo


conhecimento (sobre processo de tratamento de exceo) exigido
pelos exerccios E01 e E02 terceira etapa. Em ambos (E03 e
E04), acrescentou-se somente a exigncia de criao de classes de
erro. Dessa forma, os grupos homogneos da quarta etapa
resolveram um exerccio semelhante, conceitualmente, ao
exerccio da terceira etapa. provvel que, nesses grupos
homogneos da quarta etapa (alguns deles formados por alunos
que participaram de um mesmo grupo homogneo na terceira
etapa), os alunos no tenham sentido muita necessidade de voltar
a discutir um assunto j discutido (ao menos em parte) na etapa
anterior. Deve-se considerar, ainda, o fator aprendizado, ocorrido
entre uma etapa e outra. possvel que os alunos tenham
aprendido o assunto tratado nos exerccios anteriores a ponto de
no sentirem necessidade de discusses mais intensas, de troca de
conhecimento, de ideias, etc. ao resolverem o exerccio E03. Alm
disso, mesmo os exerccios da quarta etapa exigindo, de novidade,
a parte de criao de classes de erro, preciso considerar que esse
foi um tema que grande parte dos alunos demonstrou dominar. De
fato, 18 (75%) dos 24 alunos conseguiram mdias acima de 6 ao
resolverem o exerccio PROG02. O exerccio E03,
provavelmente, no desafiou os alunos a ponto de fomentar neles
a necessidade de discusses.

A figura 5.10 apresenta os resultados da pergunta 3: classificao


dos grupos considerando-se o conhecimento coletivo.

Figura 5.10. Resultados da pergunta 3


Dos 24 alunos, para 2 (8%), o grupo homogneo dos quais eles
participaram eram muito fortes. Para 12 (50%), forte. Para 7
(30%), mdio. Para 3 (12%), fraco. Os 24 alunos, 3 (12%)
consideraram seu grupo heterogneo muito forte. 15 (62%)
avaliaram como forte e, 6 (25%), como mdio. Dos 24 alunos, 18
(75%) consideram o grupo heterogneo muito forte ou forte. J no
contexto dos grupos homogneos, 14 alunos (58%) avaliaram tais
grupos como sendo muito forte ou forte. O resultado indica que os
grupos heterogneos foram considerados mais fortes. Esse,
tambm, foi um resultado contrrio ao obtido na terceira etapa.
Como os grupos heterogneos tiveram maior intensidade de
interao e foram mais eficientes, acredita-se que isso tenha
proporcionado aos alunos a sensao de esses grupos serem mais
fortes. Alm disso, h a curva de aprendizado dos alunos. Com

Por outro lado, os grupos heterogneos sempre foram formados


por alunos distintos, em todas as etapas. Assim, um aluno sempre
esteve diante de pessoas diferentes, com nveis de conhecimento
diferentes. O fato de os alunos formarem grupos com colegas com
os quais no haviam formado grupos nas etapas anteriores pode
ter fomentado a interao nos grupos heterogneos. Alm disso,
pode-se considerar a curva de aprendizado dos alunos ao longo de
todo o experimento, fazendo com que eles se sentissem mais
vontade (menos inibidos) e mais seguros para, mesmo em um
grupo heterogneo, discutir, defender suas ideias, propor
solues, etc. ainda que o exerccio proposto (E04) tenha sido
conceitualmente similar aos exerccios aplicados antes. H de se
considerar, ainda, a questo motivacional: talvez os alunos

82

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

isso, provvel que os grupos heterogneos da quarta etapa, na


viso dos alunos, sejam mais fortes que os da terceira etapa e
mesmo mais fortes que os grupos homogneos da prpria etapa
(porque os grupos homogneos da quarta etapa eram, em pelo
menos 5 deles, quase os mesmos grupos homogneos da terceira
etapa).

por pessoas diferentes, etc. tenha fomentado neles o desejo pela


interao, de mostrar o que foi aprendido, de tentar contribuir
para a resoluo do exerccio, etc.
A figura 5.13 apresenta os resultados da pergunta 6: em qual dos
dois grupos primeiro ou segundo o aluno acredita ter
aprendido mais.

A figura 5.11 apresenta os resultados relacionados pergunta 4:


se a interao com os membros do grupo ajudou no aprendizado
do aluno. No foi solicitado aos alunos para comparar os grupos
homogneos com os grupos heterogneos. Assim como na terceira
etapa, a pergunta 4 da quarta etapa procurou saber se a interao
ajudou no aprendizado (ou seja, se houve aprendizado).

Figura 5.13. Resultados da pergunta 6


Dos 24 alunos, 19 (79%) afirmaram que aprenderam mais ao
participar do segundo grupo (heterogneo). J para 5 (11%), esse
aprendizado foi maior ao participarem do grupo homogneo. O
resultado acima indica o que se queria, de fato, demonstrar com o
experimento: que os grupos heterogneos (diversos) so eficazes
na aprendizagem colaborativa. Esse foi o mesmo resultado obtido
na terceira etapa (onde os alunos afirmaram terem aprendido mais
ao participarem de grupos heterogneos, mesmo esses grupos no
terem tido uma interao to intensa e eficiente como os grupos
homogneos). Acredita-se que os alunos disseram ter aprendido
mais nos grupos heterogneos, primeiro, pelo fato de os nveis de
conhecimento ser diferentes e, segundo, pelo fato de o prprio
conhecimento em si ser diferente em cada pessoa (por exemplo,
um aluno X pode saber um conceito que o outro Y no sabe, mas,
ao mesmo tempo, Y pode conhecer algum conceito que X no
sabe). Acredita-se que, ao formarem novos grupos heterogneos,
os alunos tinham novos conhecimentos (adquiridos nas etapas
anteriores) que puderam ser compartilhados com os demais
membros do grupo. Em outras palavras, provvel que houvesse
mais conhecimento diverso a ser compartilhado nesses grupos
heterogneos.

Figura 5.11. Resultados da pergunta 4


Dos 24 alunos, para 23 (96%) a interao nos grupos
heterogneos ajudou em seus processos de aprendizagem. J para
1 (4%), essa interao no ajudou no aprendizado. As respostas
do questionrio Q01 mostram que para 18 dos 24 alunos (75%) , a
interao nos grupos homogneos os ajudou no aprendizado. J
para 6 (25%), essa interao no ajudou. O resultado indica que a
interao nos grupos heterogneos ajudou os alunos a aprender.
Como os grupos heterogneos foram considerados os com maior
nvel de interao e os com maior eficincia, acredita-se que o
aprendizado seria uma consequncia direta. Alm disso, devem-se
considerar, novamente, os novos conhecimentos que esses alunos
adquiriram ao longo do experimento. provvel que esses novos
conhecimentos tenham sido compartilhados em maior intensidade
nesses grupos heterogneos e, consequentemente, tenham sido
absorvidos pelos membros do grupo. Percebe-se que, nesse caso,
h mais saberes sendo compartilhados.

Por fim, a pergunta 7 questionou os alunos no que tange o nvel


de dificuldade do exerccio E04 em comparao o E03. O
resultado apresentado na figura 5.14.

Na figura 5.12, so apresentados os resultados obtidos na


pergunta 5: considerando os dois grupos, primeiro e segundo, em
qual deles a interao foi mais intensa.

Figura 5.14. Resultados da pergunta 7


Dos 24 alunos, 1 (4%) afirmou que o exerccio E04 estava muito
mais difcil que o exerccio E03. Para 5 (21%), E04 estava mais
difcil que E03. Para 14 (58%), E04 e E03 eram equivalentes em
termos de dificuldade. Para outros 3 (12%), E04 era mais fcil
que E03 e, para 1 (4%), o exerccio E04 era muito mais fcil que
o E03. Acredita-se, pelo resultado, que uma eventual diferena no
nvel de dificuldade entre os exerccios no tenha influenciado os
resultados obtidos na terceira etapa do experimento.

Figura 5.12. Resultados da pergunta 5


Dos 24 estudantes, 19 (79%) consideraram que a interao entre
os alunos foi mais intensa nos grupos heterogneos. Para 5 (21%),
a interao foi mais intensa nos grupos homogneos. Esse
resultado confirma as repostas obtidas na pergunta 1, onde a
interao nos grupos heterogneos foi considera muito alta ou alta
por 87% dos alunos. Porm, esse resultado foi contrrio ao obtido
na terceira etapa, onde a interao foi dita ser maior nos grupos
homogneos. Novamente, acredita-se que o fato de os alunos
adquirirem novos conhecimentos, participar de grupos formados

83

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

diferentes. Os resultados obtidos com essa pesquisa apresentam


indcios para a validade da hiptese.

5.3 Anlise dos Resultados

Verifica-se, da anlise e comparao dos resultados da terceira e


quarta etapas, indcios de que o aprendizado considerando-se
um contexto colaborativo ocorre em maior grau quando pares,
com diferentes nveis de conhecimento, colaboram entre si, atuam
em conjunto. A terceira etapa mostrou que os grupos homogneos
fomentaram uma maior intensidade na interao entre pares, alm
de terem sido considerados mais eficientes no desenvolvimento do
exerccio e mais fortes (com um maior nvel de conhecimento, do
ponto de vista do coletivo). Alm disso, esses grupos ajudaram
mais os alunos no processo de aprendizado.

Como possveis trabalhos futuros, prope-se reaplicar o


experimento em outros ambientes: por exemplo, em um ambiente
de aprendizagem organizacional. Outro possvel trabalho seria
considerar a questo da diversidade sob um aspecto mais amplo,
considerando o sentido de multiplicidade, de variedade e, com
isso, analisar como o aprendizado pode ser aperfeioado a partir
da anlise dos perfis cognitivos (preferncias, interesses,
habilidades etc.) dos alunos.

7. REFERNCIAS

Na comparao direta entre grupos homogneos e heterogneos,


viu-se que, embora a interao tenha sido maior nos primeiros, o
aprendizado foi maior nos ltimos. Acredita-se que isso ocorreu,
basicamente, devido diversidade de conhecimento existente
entre os alunos dos grupos heterogneos. No contexto da terceira
etapa, provvel que essa diversidade tenha fomentado a troca de
saberes, j que alunos com maior nvel de conhecimento
repassavam esse conhecimento para os alunos com menor nvel.
Ao se considerar grupos homogneos, percebe-se um nvel de
aprendizado menor, visto que embora haja troca de saberes o
conhecimento que compartilhado os alunos, de certa forma, j
possuem.

[1] Bacon, D.; Stewart, K.; Stewart-Belle, S. Exploring


Predictors of Student Project Performance. In: Journal of
Marketing Education, v. 20, pp. 63-71, 1998.
[2] Correa, C. H. W. Comunidades Virtuais Gerando Identidades
na Sociedade em Rede. In: Revista do Programa de PsGraduao em Comunicao da Universidade Federal
Fluminense, v.13, 2004.
[3] Dillenbourg, P. et al. The evolution of research on
collaborative learning. In: SPADA, E.; REIMAN, P. (Ed.)
Learning in Humans and Machine: Towards an
interdisciplinary learning science. Oxford: Elsevier, 1996. p.
189-211.

A quarta etapa mostrou que os grupos heterogneos e no os


homogneos fomentaram uma maior intensidade na interao
entre pares, alm de terem sido considerados mais eficientes no
desenvolvimento do exerccio. Alm disso, esses grupos ajudaram
mais os alunos no processo de aprendizado. Na comparao direta
entre grupos homogneos e heterogneos, viu-se que tanto a
interao quanto a aprendizagem foram maiores nos ltimos. Pelo
que foi discutido nos resultados da quarta etapa, acredita-se que a
maior interao seja consequncia de mudana na postura dos
alunos ( provvel que, com maior conhecimento obtido pelas
vrias interaes, eles tenham se sentido mais seguros, mais
propensos discusso, troca de ideias etc.). Acredita-se que o
aprendizado em maior grau seja consequncia da diversidade: os
grupos heterogneos da quarta etapa eram constitudos de alunos
que haviam adquirido conhecimentos em virtude das interaes
passadas e que desejavam compartilhar esse conhecimento (o que
pode ser comprovado pelo maior nvel de interao entre pares
nesses grupos).

[4] Gerdy, Kristin B. If Socrates Only Knew: Expanding Law


Class Discourse. J Reuben Clark Law School, Brigham
Young University. Lawyering Skills Section 9, 1998.
[5] Kumar, V. S. Computer-Supported Collaborative Learning:
Issues for research, In 8th Annual Graduate Symposium on
Computer Science, University of Saskatchewan, Canada,
1996.
[6] Levy, P. Cibercultura. So Paulo, SP: Editora 34, 264p,
1999.
[7] Minhoto, P.; Meirinhos, M. As Redes Sociais na Promoo
da Aprendizagem Colaborativa: Um Estudo no Ensino
Secundrio. In: Educao, Formao e Tecnologias, v. 4, n.
2, pp.25-34, 2011.
[8] Miyake, N. Constructive Interaction and the Iterative Process
of Understanding. Cognitive Science, Vol. 10, 1986, pp.
151-177.

Os resultados obtidos com o experimento indicam, portanto, que a


diversidade de conhecimentos, em um ambiente de aprendizagem
colaborativa, fomenta o aprendizado. Ao promover a colaborao
entre pares com nveis diferentes de conhecimento, a tendncia
que ocorra aprendizado em maior grau se comparado ao
aprendizado resultante da colaborao entre pares com nveis de
conhecimento equivalentes.

[9] Nonaka, I.; Takeuchi, H. Criao do Conhecimento na


Empresa. Rio de Janeiro, RJ: Elsevier, 358p. 1997.
[10] Page, S. E. The Difference: How The Power of Diversity
Creates Better Groups, Firms, Schools, and Societies.
Princeton University Press, 456p, 2008.
[11] Panitz, T.; Panitz, P. Ways to Encourage Collaborative
Teaching in Higher Education. In University Teaching:
International Perspectives, James J. F. Forest Edition,
Garland Publishers: New York, pp. 167-202, 1998.

6. CONCLUSO

O presente trabalho buscou investigar a influncia da diversidade


de conhecimento em um processo de aprendizagem colaborativa.
Buscou-se analisar se a diferena de conhecimento entre pares, em
um contexto de colaborao, visando aprendizagem, benfica
no que tange aquisio de conhecimento (ao aprendizado). Um
experimento foi realizado com uma turma de graduao, de forma
a tentar validar a hiptese de que alunos tendem a aprender mais
quando, em um processo de aprendizagem colaborativa, a
colaborao ocorre entre pares com diversidade de conhecimento
- ou seja, entre pares heterogneos, com nveis de conhecimento

[12] Schaffer, C. The Use of the Team Learning Approach in


Marketing Courses. Marketing Education Review, v. 5, pp.
41-50, 1995.
[13] Terra, J. C. C.; Gordon, C. Portais Corporativos: A
Revoluo na Gesto do Conhecimento. So Paulo, SP:
Negcio, 480p, 2002.
[14] Vygotsky, L. Psicologia Pedaggica. Traduzido por Paulo
Bezzera. Editora WMF Martins Fontes, 576p, 2010

84

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Avaliao de Comunicabilidade em Ambientes


Colaborativos Tridimensionais: Estudo de Caso no
Sloodle
Adriana Dantas

David Lima

Thas Castro

UFAM ICOMP - PPGI

IFAM CMZL

UFAM - ICOMP

dricadoroteu@gmail.com

david.lima@icomp.ufam.edu.br

thais@icomp.ufam.edu.br

Lucilene Maciel

Isomar Lima

Antnio Neto

UFAM ICOMP - PPGI

UFAM ICOMP - PPGI

IFAM PROEN

lucilene.maciel31@gmail.com

isomar.lima@gmail.com

ded_proen@ifam.edu.br

Baseado nessa problemtica, o ensino distncia surgiu como


uma oportunidade de levar educao onde quer o aluno esteja,
dando a ele a possibilidade de gerenciar o seu tempo [1].

ABSTRACT
In recent years, collaborative systems are being used on a large
scale, primarily for academic purposes, is the convenience that
they bring or involve several students in the same environment
remotely. In order to improve these systems, evaluations of these
environments become important for both researchers and
developers. Today, there are few evaluation methods for these
environments. Communicability Evaluation Method for
Collaborative Systems (CEM-g) is based on the Semiotic
Engineering for HCI Theory. This article presents an evaluation
using CEM in Sloodle, which is a virtual environment for teaching
and learning in 3D virtual environments derived from two others,
Moodle and Second Life. The findings contribute for the
improvements of theses scenarios, thus identifying advantages and
disadvantages of these uses, and contribute to new perspectives
for this teaching-learning model used.

No contexto educacional, Tecnologias da Informao e


Comunicao (TICs) podem ampliar as possibilidades de
interao e colaborao entre os estudantes e professores,
permitindo novas prticas pedaggicas. TICs podem ser usadas
tanto no apoio a aulas na modalidade presencial, quanto na
modalidade distncia [1, 2].
De acordo com a pesquisa apresentada em [3], o Ambiente Virtual
de Aprendizagem, (AVA) uma plataforma que dispe de um
ambiente com aparatos pedaggicos e educacionais que so
integrados a prticas de ensino que so disponibilizados por
professores que interagem com os alunos de forma prtica.
Segundo [4], vrias empresas e instituies de ensino j utilizam
essa modalidade de ensino, que traz vrios benefcios tanto para os
alunos e professores que no precisam est presencialmente na
sala, como para a instituio que no precisa dispor de um local
fsico para alocar os alunos.

Categories and Subject Descriptors


H.5.3 [Group and Organization Interfaces]: Collaborative
computing and Evaluation/methodology.

Na Educao Distncia (EaD), a mediao um fator chave e o


uso de recursos multimdia muda o conceito de presena, tanto do
professor quanto do estudante [1].

General Terms
Design and Human Factors.

As TICs devem ento dar suporte a mediao e prover um


ambiente onde estudantes e professores podem estabelecer uma
presena social.

Keywords
Semiotic Engineering, Second Life, 3D virtual environment.

1.

Um dos ambientes utilizados na EaD o Sloodle, que tem como


objetivo aumentar e melhorar a interao, comunicabilidade e
aprendizagem dos alunos em um ambiente tridimensional onde
eles sero os principais personagens de um jogo de aprendizagem
da vida real [5].

INTRODUO

A falta de tempo uma problemtica crescente entre vrios


indivdios e a necessidade de obter conhecimento para ser
aproveitado pelo mercado de trabalho to competitivo se torna
imprescindvel na vida das pessoas.

A principal contribuio deste artigo identificar as vantagens e


desvantagens do ambiente Sloodle e demonstrar a utilizao do
mtodo de avaliao de comunicabilidade MAC-g. Atravs desta
avaliao ser possvel verificar a possibilidade de melhorar o
MAC-g para ambientes em trs dimenses.

Permission to make digital or hard copies of all or part of this work


for personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

85

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

DE

a ferramentas sncronas, o SecondLife tem a vantagem de permitir


a demonstrao dos contedos em tempo real [4].

Ambientes Virtuais Colaborativos (Collaborative Virtual


Environments - CVE) so considerados espaos onde ocorrem
simulaes de mundos reais ou imaginrios, sendo formados pelo
prprio espao virtual, atravs do qual seus participantes podem
interagir, compartilhar informaces, colaborar no desenvolvimento
de atividades e fazer uso de artefatos disponveis neste ambiente
[6].

Uma das principais vantagens do SecondLife o envolvimento,


estimulando os alunos a vivenciarem exaustivamente uma dada
experincia. Esta envolvncia deve-se, em grande medida, ao
sentido de presena e interao, potenciando, consequentement a
formao de comunidades [14].

2. MUNDOS
APRENDIZAGEM

VIRTUAIS

O Sloodle adiciona ao SecondLife objetos existentes em uma sala


de aula real como cadeiras, quadros, salas entre outros. Gera
tambm interaes existentes em um ambiente de aprendizagem
presencial como: quiz, provas, perguntas e respostas, avatar
levantando o dedo entre outras formas [15]. Com isso pretende-se
no simplesmente replicar o modelo ultrapassado de sala de aula
convencional mas potencializ-lo a partir de elementos
conhecidos, possibilitando outras interaes.

Esses ambientes surgem como importantes espaos para a


colaborao, explorao e interao, permitindo a realizao de
uma srie de atividades, entre elas, atividades de cunho
educacional e de treinamento [2]. Esses mundos combinam
grficos 3D interativos, tecnologia de simulao, realidade virtual
e mdia digital para fornecer aos usurios, habilidades para se
comunicar, colaborar e explorar [7,8].

3. ENGENHARIA SEMITICA

Esse conjunto de tecnologias fornece uma interface para um


mundo tridimensional, de modo que o usurio acredita estar
realmente nesse mundo e, intuitivamente, passa a interagir com
esse ambiente imersivo e dinmico [2].

A Engenharia Semitica uma teoria explicativa da Interao


Humano-Computador (IHC) que nos permite entender os
elementos abrangidos no processo de design, do uso e da avaliao
de um sistema interativo [16, 17].

Os motivos para a adoo e para a manuteno de atividades


educacionais em mundos virtuais, destacadas por [9], so as
seguintes: (a) apoia a aprendizagem distncia, flexvel e blended
learning; (b) permite o aprendizado atravs da imerso; (c)
promove a aprendizagem dialgica; (d) ofusca as relaes de
poder no aprendizado; (e) apoia a criatividade e a diverso em
aprender; (f) induz a reconsiderao da identidade na
aprendizagem; e (g) encoraja a explorao da emoo na
aprendizagem.

Na Engenharia Semitica, o sistema analisado como um elemento


de metacomunicao. Na Figura 1 mostrado o modelo de
abordagem da Engenharia Semitica, na qual o designer envia para
os usurios uma mensagem por meio da interface, cujo contedo
o modelo conceitual da aplicao.

Assim, instituies acadmicas e empresas tm explorado os


benefcios de ambientes imersivos onde os participantes podem
interagir uns com os outros, bem como, com o professor, mesmo
que estejam fisicamente a milhares de quilmetros de distncia
[10].
O Moodle (Modular Object-Oriented Dynamic Learning
Environment) foi criado em 1999 com base pedaggica da
abordagem social-construcionista da educao [11].
Segundo [12], a proposio de prticas pedaggicas para o
desenvolvimento de comunidades virtuais contribui para a
construo de aes colaborativas, cooperativas e construtivistas.
Pois passa pela concepo do pensamento sistmico, onde
identifica-se como algo maior do que o somatrio de suas
relaes individuais e estabelece um compromisso de longo prazo
com o bem-estar.

Figura 1. Modelo de abordagem da Engenharia Semitica.


A mensagem do designer por acepo, interativa e dinmica, pois
formada por um conjunto de signos, ou seja, palavras, grficos,
figuras, e sons, trocados entre o sistema e o usurio durante todo o
processo de interao.

J o SecondLife tem como objetivo imitar o mundo real atravs do


uso de avatares que simular pessoas reais, de regies que simular
cenrios reais. Essa imerso em um contexto virtual atravs do uso
de avatares facilita o processo de interao e comunicao em
ambientes 3D [13].

Ao se construir ambientes computacionais, em especial Ambientes


de Realidade Virtual, necessrio observar os aspectos metacomunicacionais da interface com o usurio.
Os ambientes de realidade virtual utilizam elementos grficos em
3D, logo, geralmente requerem uma compreenso do usurio
quanto aos modelos reais que representam. Alm da compreenso
do usurio, esses sistemas permitem a interao entre usurios e
objetos, possibilitando uma alta qualidade de interao e
comunicao Usurio-Sistema-Usurio [5, 7].

A comunicao fomentada pelo SecondLife, atravs das


ferramentas de chat, voice, mensagens privadas e gestos, permite
leccionar remotamente, reunindo, num mesmo local, estudantes de
diferentes pases, o que se revela uma mais-valia indescritvel para
a percepo da multiculturalidade. Por outro lado, este ambiente
possibilita a resposta imediata aos problemas colocados pelo
aluno, independentemente do local ou da hora, o que no
possvel com as ferramentas assncronas que se utilizam
regularmente na educao. Embora muitos professores j recorram

Para avaliar como a comunicabilidade dos sistemas


computacionais, a Engenharia Semitica prope dois mtodos [16,
17, 18], o Mtodo de Inspeo Semitica (MIS) e o Mtodo de
Avaliao da Comunicabilidade (MAC). J para apoiar o projetista

86

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

na reflexo e definio da comunicao entre usurios atravs do


sistema e o impacto que esta comunicao pode ter sobre os
usurios foi criada a proposta de projeto de sistemas colaborativos
chamada MANAS, permitindo que o projetista descreva o modelo
de comunicao usurio-sistema-usurio pretendido para o sistema
[18].

3.1 Mtodo
de
Avaliao
Comunicabilidade MAC

3.2 Mtodo
de
Avaliao
de
Comunicabilidade
em
Sistemas
Colaborativos MAC-G
O MAC-g consiste em uma extenso do MAC original, voltada
especificamente para sistemas colaborativos [19, 20]. Tendo em
vista que o MAC visa avaliar apenas a interao do usurio com
sistema, o MAC-g o complementa por considerar a utilizao do
sistema pelo usurio para interagir com outros usurios.

de

As etapas de coleta e anlise dos dados do MAC-g so as mesmas


do MAC original, no entanto, o MAC-g possui novas etiquetas
que abrangem diferentes tipos de rupturas especficas de Sistemas
Colaborativos SiCos). Visando facilitar a aplicao do mtodo,
foi proposto que essas etiquetas sejam mapeadas a partir de uma
combinao de valores correspondentes a quatro dimenses
descritas que so relevantes para a interao de SiCos e
representam assim, as possibilidades de rupturas de
comunicabilidade [19].

O Mtodo de Avaliao de Comunicabilidade MAC um dos


mtodos propostos pela Engenharia Semitica para avaliar a
comunicabilidade de um sistema. Esse um mtodo qualitativo,
que envolve a observao de usurios por especialistas, que
analisam a interao do usurio com o sistema e identificam as
rupturas por ele vivenciadas [16, 17].
De acordo com [19] o MAC se concentra em como a
metamensagem est sendo recebida pelo usurio. As etapas de
preparao do MAC envolvem a seleo dos participantes e
gerao do material para a avaliao. A aplicao feita em um
ambiente controlado e requer a gravao da interao do usurio
com o sistema. Esta gravao fundamental para a etapa de
anlise, recomendvel que os avaliadores faam anotaes
durante a execuo de aes dos usurios que aps a execuo dos
testes, passa-se ento para a etapa de anlise dos dados, que
dividida em trs passos:

A finalidade de caracterizar as rupturas que ocorrem em ambientes


de grupo em funo de dimenses que as descrevem permitir que
o avaliador faa uma associao direta entre problemas e
expresses, com base no contexto de ocorrncia da ruptura [19].
No MAC-g, tais dimenses so usadas na formao de uma tupla,
que caracteriza de maneira completa a ruptura. Desse modo, cada
combinao de valores corresponde a uma nova etiqueta. Depois
de formada, a tupla poder ser utilizada de forma associativa com
uma tabela que contenha todas as expresses de comunicabilidade
para ambientes de grupo, oferecendo ao avaliador acesso s regras
de formao das expresses, que continuariam a identificar de
forma nica cada problema.

1. Etiquetagem: gravaes da interao so vistas pelos


avaliadores e expresses (selecionadas a partir de um conjunto
pr-definido de treze expresses) so associadas aos momentos
de ruptura de comunicao, simulando a comunicao do
usurio para o designer sobre a interface;

A explicao de [19] sobre as dimenses est bem clara: primeira


dimenso considera o nvel de interao em que pode ocorrer
uma ruptura. Em sistemas colaborativos, uma ruptura pode ocorrer
no nvel individual, interpessoal ou de grupo. Rupturas no nvel
individual so aquelas que ocorrem quando o usurio interage
apenas com a sua parte privada da aplicao, com o objetivo de
executar alguma tarefa individual que lhe foi conferida. Apesar de
nesse caso a interao do usurio ser exclusivamente com o
sistema, rupturas que acontecem nesse nvel poderem ser
repercutidas para os demais membros do grupo de forma direta ou
indireta.

2. Interpretao: com base na etiquetagem, identifica-se classes


de problema de comunicao projetista-usurio ou interao
considerando a classificao das expresses que caracterizam a
ruptura quanto ao tipo de falha (completas, parciais ou
temporrias) que representam na comunicao entre o sistema e
usurio, a freqncia e o contexto em que ocorrem as rupturas, a
identificao de padres de sequncias de expresses e o nvel
da ao em que ocorre a ruptura (operacional, ttico ou
estratgico);
3. Gerao do perfil semitico: realiza-se a reconstruo da
meta-mensagem sendo transmitida pelo projetista ao usurio
atravs da interface, e medida que o avaliador vai fazendo tal
reconstruo, ele deve enderear os desencontros entre o que o
projetista pretendia dizer e as evidncias de como os usurios
esto interpretando o que ele diz.

A segunda dimenso [19] afirma que se trata dos aspectos


colaborativos necessrios para o suporte s atividades de
comunicao, coordenao e colaborao entre os membros de
sistemas colaborativos e sobre os quais pode ocorrer uma ruptura.
Esses aspectos podem assumir os valores artefato, local, viso,

Figura 2. As quatro dimenses do MAC-g com os valores que cada uma pode receber.

87

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

audio e fala (habilidades comunicativas) ou ao. Nesse


contexto, artefato tudo aquilo que faz parte da aplicao e sobre
o que o usurio pode aplicar transformaes arbitrrias e
manipular atributos, como por exemplo, um documento
compartilhado. Locais so partes do ambiente que os membros ou
subgrupos podem frequentar, dentro da virtualidade criada
pela aplicao. Habilidades comunicativas so as formas que os
membros do grupo tm disponveis para se comunicarem sobre os
objetos e outros elementos na aplicao.

Para isso, categorias de problemas de interao em grupo so


adotadas [19, 21].
A primeira a Falta de percepo de fenmenos de discurso,
que inclui falta de informaes sobre as respostas e reaes dos
outros membros em relao comunicao, e tambm da
inexistncia dos processos e protocolos de comunicao.
A segunda categoria a Falta de percepo do espao virtual,
que categoriza a falta de informaes sobre os outros membros do
grupo ou da interao deles com o espao de trabalho em que
atuam na aplicao como uma falta de conhecimento do espao
virtual.

Essas habilidades podem ser classificadas como viso, audio e


fala, sendo que viso se refere s questes de permisso de acesso
aos elementos presentes no sistema, e audio e fala tratam da
possibilidade de que donos e no donos de um artefato possam
conversar sobre o mesmo. O ltimo aspecto colaborativo a ao,
que diz respeito s aes que os usurios podem executar no
sistema e que no esto includas dentro das classificaes
anteriores [19, 20].

A terceira categoria a Falta de percepo das possibilidades de


coordenao, para as situaes de problema geradas quando o
usurio no tem informaes suficientes sobre os mecanismos
para dar apoio coordenao do grupo.
Por fim, ainda h o problema da Falta de percepo da
tecnologia que trata da falta de informaes que permitam ao
usurio levantar hipteses apropriadas relativas a problemas com a
tecnologia, que o caso, por exemplo, de quando uma falha na
conexo com a internet no percebida pelo usurio, o que pode
a pensar que no recebe resposta de outro usurio por estar sendo
ignorado. Em [19], alm da apresentao do mtodo em questo,
foi mostrada a sua aplicao para analisar aspectos de interao
sncrona e assncrona dos usurios, em uma ferramenta de
colaborao em grupo, tendo permitido a identificao de
problemas de interao do usurio tanto com o sistema quanto
com outros usurios atravs do sistema.

A terceira dimenso de acordo com [19] considera o tempo em


que a ruptura ocorre. Em sistemas monousurio, as expresses
apresentadas esto todas no presente. Em sistemas colaborativos
algumas rupturas so geradas por eventos que ocorreram ou iro
ocorrer durante o trabalho do grupo.
Pode-se ento dividir a ocorrncia dos eventos em trs momentos:
o passado, para o caso de rupturas associadas a eventos que
ocorreram em um intervalo de tempo definido no passado; o
presente, para rupturas sobre eventos que esto ocorrendo neste
momento e o futuro, para representar as opes futuras possveis
para o grupo, como, por exemplo, uma ruptura que ocorre quando
o usurio altera a permisso de acesso de determinado artefato,
mas no consegue descobrir quem passa a ter acesso a ele.

4. APLICANDO O MAC-G NO SLOODLE


O objetivo da avalio tentar melhorar o MAC-g, adequando-o
ao ambiente em trs dimenses, uma vez que imerso do ambiente
tras para o aluno uma forma diferente de interao e comunicao.
A contribuio para o ensino distncia tentar prender a ateno
do aluno tornado o ambiente interessante, diminuindo assim o
ndice de evaso dos cursos distncia.

De acordo com [19], a quarta dimenso considera as rupturas de


comunicabilidade do MAC original, e logo as treze etiquetas so
usadas para caracteriz-las, tendo em vista que, apesar das
particularidades existentes em SiCos, as mesmas rupturas que
ocorrem entre usurio e sistema tambm podem ocorrer nesse tipo
de aplicao.
No entanto, como o conjunto original de etiquetas no inclui
aspectos da interao especficos de trabalho em grupo, como a
atuao de diferentes membros, a comunicao entre eles e os
diversos espaos em que podem atuar, necessrio complementlo com as demais dimenses de interao de SiCos, acima
descritas para formar a tupla que caracteriza cada ruptura.

4.1 Preparao do Ambiente

Um exemplo seria a tupla formada pelos valores (Interpessoal,


Ao, Presente, O que isso?) em suas quatro dimenses, que
remete expresso O que isso que voc est fazendo?, e que
representa uma ruptura que ocorre quando o usurio no sabe ou
no entende o qu o outro membro est fazendo e o pergunta
diretamente.

1. Instalao das ferramentas Moodle, SecondLife e OpenSim.

Para o processo de avaliao vrias etapas foram realizadas, como


a preparao do ambiente com a instalao do Sloodle. Alm da
etapa de instalao foram introduzidos os principais recursos para
desenvolvimento de mundos virtuais utilizando estas ferramentas.
Foram realizadas trs etapas para instalao do Sloodle:

2. Instalao de recursos do Sloodle no Moodle e no OpenSim.


3. Construo do ambiente virtual no OpenSim.
O OpenSim foi utilizado por ser uma plataforma de cdigo livre
que permite a criao e edio de ambientes em 3D [22] e pode ser
executado em dois modos, StandAlone e Grid [23]. O OpenSim
foi utilizado para importao de ambientes disponibilizados
gratuitamente (denominados ilhas) e os dois modos de execuo
foram testados.

Alm das treze etiquetas do MAC original, tendo em vista que em


SiCos a falta de percepo da presena de outros membro pode
gerar rupturas [19,20], foi adicionada a etiqueta quem?,
especfica de sistemas colaborativos, posto que podem surgir
rupturas relativas identificao de quem executou ou est
executando determinada ao.

possvel registrar atividades do Second Life no Moodle e


importar recursos do Moodle para o Second Life. Atravs do
OpenSim importou-se ambientes contendo prdios, auditrios etc,
em formato oar (formato para importar ilhas inteiras) ou no
formato iar (formato para objetos desde cadeiras a prdios).

A Figura 2 feita por [19] mostra as quatro dimenses consideradas


pelo MAC-g e os possveis valores que cada uma pode assumir na
formao das tuplas que caracterizam a ruptura. Na etapa de
interpretao, rupturas identificadas so associadas a problemas.

88

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Para a modelagem virtual da ilha foram utilizados os seguintes


recursos criados pelo Sloodle no Moodle: Controller, Choice
Vertical, Choice Horizontal, Primdrop, Quizpile, Lite Toolbar e
Login Zone.

e posteriormente as atividades individuais para que fossem


analisadas.
Vale ressaltar que antes dos testes os participantes assinaram um
Termo de Consentimento Livre e Esclarecido que descrevia o
processo da pesquisa, o objetivo e a importncia da veracidade da
resposta de cada participante para a pesquisa.

O Controller um objeto do ambiente virtual 3D que faz conexo


da disciplina do Moodle com a regio da disciplina na ilha do
Second Life. Este elemento responsvel por criar e controlar os
demais objetos na ilha, tais como: o Choise Vertical, Choise
Horizontal e Primdrop.

Foram gravadas as interaes de todos os participantes para que


posteriormente fossem analisadas e etiquetadas. Durante o
processo de avaliao os usurios foram instrudos a realizarem
algumas atividades especficas de uma sala virtual comum ao
Moodle, porm em um ambiente 3D utilizando o Sloodle. No
prprio ambiente, os alunos pediam instrues das atividades que
sentiam dificuldades de realizar. Isso ficava por conta de um
avatar na sala de aula.

O Choice Vertical e Choise Horizontal so objetos do ambiente


virtual 3D que representa o Quiz, recurso que simula uma pesquisa
de opinio sobre determinado assunto do Moodle no Second Life.

4.2 Cenrios dos Testes


Foram apresentados aos alunos dois ambientes distintos para cada
atividade: um para atividade individual, outro para reunio.

O processo de avaliao durou aproximadamente duas horas e


cinquenta minutos para todas as equipes, todas elas realizaram as
atividades simultaneamente. As atividades foram divididas em
duas fases: atividades individuais e atividades em grupo.

O ambiente para atividade individual foi uma sala de aula


convencional, onde os alunos podiam ver as atividades propostas,
como mostra a Figura 3.

4.4.1 Atividades Individuais


Os alunos acessaram o ambiente e realizaram as atividades que
estavam expostas para eles, sendo:
1. Responder a um questionrio onde as respostas estavam em um
texto disponibilizado na sala onde eles deveriam fazer o download
do arquivo para responder as perguntas.
2. Fazer o upload do arquivo com as respostas.
3. Responder no frum a respeito do texto lido.
4. Enviar uma mensagem dizendo que terminou a avaliao.

4.2.2 Atividades em Grupo


Os alunos foram divididos em grupos obedecendo ao critrio da
ordem alfabtica, sendo:
1. Resolver um problema de raciocnio lgico entre os membros
do grupo. Para cada grupo foi distribudo uma dica diferente no
intuito de ajud-los a resolver o problema.
2. Para resolver o problema, os membros do grupo deveriam
interagir usando o chat como meio de comunicao.

Figura 3. Sala de aula no ambiente Sloodle.

3. Enviar uma mensagem dizendo que terminou a avaliao.

O segundo ambiente apresentado aos alunos foi uma sala de


reunies onde um pequeno grupo se reuniu para realizar uma
atividade do problema de raciocnio lgico.

4.4.3 Etiquetagem
Para a avaliao, participaram trs avaliadores, sendo dois com
pouca experincia e um com muita experincia em avaliar o
MAC-g. Para tentar diminuir o vis pela diferena da experincia
dos avaliadores, foi realizada uma capacitao com os trs
avaliadores com o intuito de mostrar o processo de avaliao do
MAC e do MAC-g. A avaliao consistiu em uma aula sobre os
mtodos, leitura de artigos e um teste piloto com os dois mtodos.

4.3 Perfil dos Participantes


Os participantes foram alunos do Instituto Federal do Amazonas
IFAM, que cursavam a disciplina Introduo Informtica no
Curso de graduao em Engenharia Civil. A turma formada por
30 alunos com idade entre 18 a 39 anos e sem nenhuma
experincia na utilizao do ambiente de aprendizagem Sloodle.

Para realizar a etiquetagem, os avaliadores assistiram aos vdeos


que foram gravados, onde mostra a interao dos usurios,
identificando pontos negativos de rupturas na comunicao do
ambiente.

4.4 Execuo da Avaliao


O teste foi realizado em abril de 2014, no laboratrio de
Informtica do IFAM, onde cada participante estava em uma
mquina e no poderia ter nenhum tipo de comunicao no
ambiente real, apenas no virtual.

Nas tuplas de ruptura de nvel de interao individual houve uma


menor incidncia com relao s rupturas de interao de nvel
colaborativo.

Foram formados seis grupos de cinco pessoas para a concluso das


atividades, onde primeiro foram realizadas as atividades em grupo

89

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Segundo [19] uma ruptura classificada como individual quando


o usurio interage exclusivamente com o sistema, o que inclui os
casos em que as rupturas possam ter repercusses para os demais
membros do grupo e as situaes em que para a realizao da
tarefa tenham sido usadas informaes do trabalho de outros
membros.

concluir, por conta disso ficou claro a predominncia da etiqueta


Para mim est bom na atividade.
Na atividade individual 3, os alunos tiveram muita facilidade em
realizar a tarefa, uma vez que era apenas a resposta ao frum sobre
o texto que foi lido e tirado as questes.
Na atividade individual 4, os participantes responderam sobre
questionamentos feitos sobre a utilizao da ferramenta. As
respostas eram dissertativas e foram feitas na prpria ferramenta.

Na segunda dimenso relacionada a aspectos colaborativos de


ao, as rupturas encontradas foram maiores, os membros dos
grupos sentiram dificuldades na comunicao e colaborao para
resolver o problema da atividade em grupo.

Nas atividades em grupo 1 e 2, os participantes interagiram


bastante trocando mensagens via chat at resolver o problema de
raciocnio lgico. Apenas uma nica equipe teve dificuldade em
resolver o problema em questo e demorou um pouco mais de
tempo que as outras equipes.

Na terceira dimenso, todas as rupturas foram relacionadas ao


tempo presente, pois estavam voltadas a interao do usurio com
a plataforma Sloodle.
Com relao a aes executadas no passado, no foram
encontradas rupturas, assim como tambm no foram encontradas
rupturas do futuro, pois os alunos tinham acesso irrestrito s
atividades que foram passadas. Esse aspecto foi visto antes da
avaliao para que no afetasse o resultado.

4.4.5 Interpretao do Perfil Semitico


Na descrio do perfil semitico foram analisadas as rupturas de
comunicao das etiquetas, e foi feita a reconstruo da metamensagem passada do designer para o usurio atravs dos signos.
Na fase de reconstruo da meta-mensagem foram encontradas
algumas falhas de comunicao entre as intenes do projetista e a
interpretao de sua mensagem por parte do usurio. Verificou-se
que algumas dessas intenes no esto claras no sentido do que
realmente querem passar na interface, como exemplo a ao
"envio de mensagens no ficou clara para os alunos, onde eles
poderiam encontrar na visualizao da sala.

4.4.4 Interpretao
Com relao s etiquetas, foram encontradas falhas de
comunicabilidade com relao execuo de atividades. A
etiqueta Cad foi muito utilizada, pois os participantes
procuravam itens que tinham no Moodle que foi confundido ou
interpretado de outra forma pelo Sloodle.
A etiqueta O que isso teve a segunda maior ocorrncia, j que
alguns alunos tinham a curiosidade de ver do que se tratava
determinada atividade no Sloodle. A Tabela 1 mostra a incidncia
das etiquetas.

Apesar do Sloodle apresentar funcionalidades onde permitem que


o usurio entenda suas expectativas no que diz respeito a um
ambiente virtual de aprendizagem, foi percebido que a partir da
interao do usurio com a plataforma, alguns elementos
disponveis na interface no correspondiam a suas
funcionalidades. Talvez a falta de experincia dos usurios com o
ambiente tenha sido um fator determinante para que essa
dificuldade ocorresse. Esse fato fez com que alguns participantes
demorassem mais tempo para realizar algumas atividades.

Tabela 1. Incidncia das etiquetas do MAC.


Etiqueta

Quantidade de Ocorrncias

Cad

49

Para mim est bom

23

Assim no d

19

U, o que houve?

09

Por que no funciona?

07

O que isso?

34

Epa!

21

Onde Estou

03

E agora?

11

Vai de outro jeito

08

Algumas tarefas especficas no foram concludas como a


atividade individual 2, onde os participantes tinham que responder
um questionrio e fazer o upload do arquivo, pois muitos usurios
pensaram que tinham conseguido terminar a atividade, mas no
conseguiram conclu-la.
Na parte das atividades em grupo onde todas as atividades
contavam com a comunicao dos usurios com seus respectivos
grupos no foram encontradas muitas rupturas durante a execuo
da atividade embora um dos grupos tenha demorado muito tempo
para executar a atividade que mais deu trabalho a eles, com isso
alguns participantes no responderam adequadamente como
deveriam a algumas perguntas pertinentes depois das atividades
individual e em grupo.

Na atividade individual 1, os participantes sentiram um pouco de


dificuldade com relao ao download do arquivo devido a
problemas tcnicos, como a velocidade da internet, e tambm
foram encontradas algumas rupturas nessa atividade por eles no
entenderem qual dos questionrios seria utilizado.

Na atividade de envio de mensagens aos avaliadores os usurios


sentiram um pouco de dificuldade em encontrar o percurso para
realizar tal atividade. Os usurios no sabiam que precisavam
clicar em participantes e depois clicar no nmero dos usurios
para enviar as mensagens.

Na atividade individual 2, muitos participantes no entenderam


que era para enviar na prpria atividade o exerccio, que era
concluir o upload do arquivo com as respostas. Muitos alunos
pensaram que tinham concludo a atividade quando na verdade
no tinham terminado, a maioria dos alunos no atentaram para a
concluso do uploaud completo da atividade e clicavam em

5. DISCUSSO DOS RESULTADOS DO


MAC-g
O MAC-g foi aplicado no Sloodle e permitiu aos avaliadores a
identificao de diversos problemas de interao, o principal deles

90

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

falta de visualizao de ferramentas necessrias para a


comunicao entre os participantes do grupo.

colaborao entre os participantes do grupo. No grupo 03 houve


diviso de liderana entre dois participantes do grupo. Nos demais
grupos no houve muita organizao por parte dos membros do
grupo ao conduzir a realizao do problema.

Algumas dificuldades foram encontradas por parte dos usurios,


embora no tenham causado tantos prejuzos na interao do
usurio com a plataforma, mas que atrasaram de uma certa forma
a realizao de algumas atividades, pois alguns alunos perderem
muito tempo tentando encontrar o que queriam. Lembrando que
todas as atividades realizadas pelos alunos eram feitas por intuio
pois, todos eles no tinham experincias na utilizao do sloodle,
eles tinham apenas experincia no moodle, o que tornou mais
interessante a aplicao do MAC-g em um ambiente totalmente
novo para os alunos.

Sobre a cooperao dos membros do grupo para a realizao da


tarefa.
A grande maioria dos grupos no cooperou como deveria na
concluso do problema, mas houve muita comunicao entre os
membros do grupo no sentido de instruir a realizao das
atividades, um exemplo disso foi a descrio passo-a-passo do uso
do chat por um dos participantes para todo o grupo, assim o grupo
no precisava perder tempo para pedir algum tipo de instruo do
professor em sala, representado por um avatar.

Acredita-se que a pequena quantidade de rupturas encontradas e


classificadas no grupo de atividades individuais est atrelada a
pequena quantidade de atividades sugeridas para os participantes
realizarem.

No grupo de nmero 02 pde ser percebido uma troca maior de


mensagens por chats que nos demais grupos, isso mostra que
embora todos os grupos tenham resolvido o problema em questo
a maioria deles no cooperou como deveria para a realizao da
mesma, dando destaque a participao de um ou no mximo dois
membros de cada grupo, isso aconteceu com a maioria dos grupos.

Um fato importante que a maioria das tuplas encontradas foram


relacionadas a atividades individuais e no nvel de interao, ao
presente em suas trs primeiras dimenses. Confirmando as
rupturas ficaram por conta das etiquetas do MAC original na
quarta dimenso.

Sobre a comunicao atravs de chat ter sido suficiente para


resoluo do problema.

Os avaliadores tiveram trabalho para etiquetar as atividades


devido a grande quantidade de participantes. De acordo com [16],
o nmero de participantes ideal que seja de 6 a 10. Durante a
fase de etiquetagem foram percebidas necessidades de inserir
outras etiquetas para que a pesquisa ficasse mais completa, ou at
colocar uma das treze etiquetas com um significado semelhante
porm com um olhar diferenciado.

Para o grupo 01 a interao via chat foi boa, embora o nmero de


mensagens tenha sido o menor de todos os grupos, a maioria dos
membros da equipe no entenderam que precisavam colaborar e
interagir para resolver o problema, e tambm no entenderam
como poderia ser resolvido o problema proposto, por isso teve
pouca colaborao entre os participantes, o lder do grupo teve
destaque por conseguir sozinho ter a viso geral do problema e
resolv-lo de forma rpida, foi percebido que ele ainda enviou
para o grupo trs mensagens via chat, perguntado se algum havia
entendido do problema e todos responderam que no, ele sugeriu
ao grupo que eles lssem novamente o problema proposto e
perguntou novamente se o grupo havia entendido e depois de um
tempo ele respondeu que j estava resolvendo o problema sozinho,
pois apenas uma pessoa tinha interagido com ele para resoluo do
problema.

Foi percebido que alguns alunos no participaram mais


efetivamente da avaliao por terem medo de mexer na ferramenta
e acabar atrapalhando o grupo. Alguns alunos sentiram muita
necessidade de interagir fisicamente com o intuito de resolver logo
o problema proposto para o grupo, j outros terminavam suas
atividades e continuavam no ambiente tentando aprender mais
sobre ele e suas especificidades.

6.
DISCUSSO
COMPORTAMENTO
EM GRUPO

NAS

DO
ATIVIDADES

O grupo 02 interagiu de forma mais intensa tanto por via chat


como por mensagens, a troca de mensagens entre eles foi muito
elevada em relao aos outros grupos, dois membros do grupo
relataram sobre a demora na velocidade do protocolo de
comunicao. Os grupos 03 e 04 sentiram a necessidade de
discutir o problema ao-vivo fora do ambiente para concluir a
atividade com mais rapidez, pois a maioria estava preocupada em
realizar tambm a atividade individual que seria feita aps a
atividade em grupo.

Foram divididos seis grupos de cinco pessoas, onde cada grupo


recebeu parte diferenciada de dicas para a resoluo do problema.
Para a realizao da atividade em grupo os alunos utilizaram
basicamente o chat, mas tambm foram utilizadas muitas
mensagens. Alguns grupos conseguiram concluir as atividades
mais rapidamente que outros, e devido a essa grande diferena de
tempo ao realizar as atividades foram feitos alguns
questionamentos relacionados a organizao de cada grupo para
concluir a atividade, lembrando que essa a viso do avaliador a
partir dos vdeos de cada grupo:

Os grupos 05 e 06 foram os grupos que mais demoraram a


concluir a resoluo do problema embora tenham usado bastante o
chat foi percebido que em ambos os grupos no tenham trabalho
muito bem a organizao e a liderana dentro do grupo, por isso
demoraram na cloncluso do problema.

Sobre a coordenao para realizar as atividades.


Foi percebido que apenas dois grupos dos seis seguiram
estratgias de coordenar as atividades e com isso concluiu mais
rpido o problema, um exemplo disso foi o grupo 02, onde um dos
alunos liderou o grupo dando e pedindo sugestes de todos
participantes durante toda a resoluo do problema.

7. CONCLUSES
FUTUROS

TRABALHOS

Para um ambiente 3D a aplicao do mtodo MAC-g pde


identificar vrios problemas, como melhorar a visualizao de
ferramentas necessrias para a comunicao entre os membros do
grupo dentro do ambiente, sendo esse, um feedback da avaliao
para o design.

No grupo 01 tambm houve um participante que se destacou ao


relatar tudo o que ele fazia, foi o grupo que concluiu com mais
rpidez o problema, embora no tenha tido muita comunicao e

91

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

Durante a avaliao foi percebida a necessidade de inserir outras


etiquetas para complementar e enriquecer o MAC-g, talvez seja
necessrio fazer uma extenso do mtodo para ambientes
tridimensionais. Um exemplo de etiqueta que seria muito bem
colocada o que isso faz?. Seria semelhante a atual etiqueta do
Mac-g o que isso?, no entanto, com um olhar diferenciado,
enquanto no Mac-g o significado para a etiqueta o usurio no
entende um signo da interface e procura por esclarecimentos lendo
o tool tip do sistema ou examinando o signo. Para a etiqueta o
que isso faz, o usurio tambm no entende o signo, mas ele
interage diretamente com o objeto.

2. Valente, C. e Mattar, J. Second Life e web 2.0 na educao: o


potencial revolucionrio das novas tecnologias. So Paulo:
Novatec, 2007.
3. Legoinha, P., Pais, J. e Fernandes, J. O Moodle e as
comunidades virtuais de aprendizagem. VII Congresso
Nacional de Geologia de Portugal (2006), 1-4.
4. Mattar, J. O uso do Second Life como ambiente virtual de
aprendizagem. Rev. Fonte, n. 8. (2008), 88-95.
5. Cheng, K-H. e Tsai, C-C. Affordances of Augmented Reality
in Science Learning: Suggestions for Future Research.
Journal of Science Education Technology, Springer 22, 4
(2013), 449-462. DOI=
http://link.springer.com/10.1007/s10956-012-9405-9

No ambiente em trs dimenses o aluno no dispe de qualquer


tipo de esclarecimento do signo, a utilizao de elementos grficos
possibilita ao aluno a interao com objetos, essa comunicao se
torna de alta qualidade aguando assim a curiosidade do aluno na
utilizao total do ambiente e isso se torna relevante em um
espao de aprendizagem porque ser uma forma do aluno se
comunicar seja com o professor, com outros alunos ou mesmo
com o ambiente.

6. Raposo, A. B. Ambientes Virtuais Colaborativos. In: Sistemas


Colaborativos (Org. Pimentel, M; Fuks, H). Rio de Janeiro:
Elsevier (2011), 94-109.
7. Bainbridge, W. S. Online worlds: convergence of the real and
the virtual. London: Springer, 2010.

Para trabalhos futuros, verificou-se que necessrio fazer mais


avaliaes de ambientes 3D no intuito de melhorar as ferramentas
j existentes, assim como melhorar o mtodo MAC-g para
ambientes em trs dimenses. Seria interessante tambm realizar
pesquisa utilizando os logs dos usurios, executar mais
experimentos com poucas pessoas e com mais atividades para os
alunos sentirem a comunicao do ambiente. Talvez fosse
importante tambm avaliar o nvel de satisfao da utilizao do
Sloodle como apoio a EaD, ou tambm fazer um experimento
comparando qual a maior satisfao dos alunos na utilizao das
duas formas de interao, no Sloodle e no Moodle e ver em qual
dos ambientes eles interagem de forma mais prtica e rpida, ou
ainda fazer a mesma avaliao com participantes com e sem
experincia na utilizao das duas ferramentas.

8. Hodge, E., Collins, S. e Giordano, T. The virtual worldsh: how


to use Second Life and other 3D virtual environments.
Sudbury: Jones and Bartlett, 2011
9. Savin-Baden, M. A practical guide to using Second Life in
higher education. New York: McGraw-Hill, 2010.
10. Wankel, C. e Kingsley, J. Higher education in virtual worlds.
Bingley: Emerald, 2009.
11. Douguimas, M. Reading and Writing for Internet Teaching,
1999.
12. Palloff, R. M. e Pratt K. Construindo Comunidades de
Aprendizagem no Ciberespao. Porto Alegre: Artmed, 2002.
13. Rymaszewski, M. Second Life: The Official Guider. New
Jersey: Wiley publishing, 2007.

Na discusso das atividades em grupo no item 6, foram levantados


alguns questionamentos sobre o comportamento dos grupos, essas
observaes foram descritas a partir dos vdeos e olhar do
avaliador e no do aluno, para trabalhos futuros seria importante
fazer um estudo de caso com questes respondidas pelos prprios
alunos, dessa forma o trabalho ficaria mais completo com a viso
real do participante das vantagens e desvantagens do ambiente
avaliado.

14. Delwiche, A. Massively multiplayer online games (MMOs) in


the new media classroom. J. Educational Technology &
Society 9, 3 (2006), 160172.
15. Sloodle. Sloodle About It.
http://www.sloodle.org/blog/?page_id=2
16. de Souza, C. S.. The semiotic engineering of human computer
interaction. MIT Press, 2005.

H necessidade de fazer mais avaliaes com outras ferramentas


que tambm utilizam os ambientes tridimensionais para
comunicao e colaborao de atividades ou ainda utilizar verses
mais novas da mesma ferramenta, vale ressaltar que o Moodle
instalado para os testes dessa pesquisa foi a verso 2.6 e que uma
nova verso do ambiente foi lanada recentemente.

17. de Souza, C.S. e Leitao, C.F. Semiotic Engineering Methods


for Scientific Research in HCI. Morgan & Claypool, 2009.
DOI=
http://www.morganclaypool.com/doi/abs/10.2200/S00173ED1
V01Y200901HCI002
18. Castro, T. e Fuks, H. Inspeo Semitica do ColabWeb:
Proposta de Adaptaes para o Contexto da Aprendizagem de
Programao. RBIE 17, 1 (2009), 71-81.

8. AGRADECIMENTOS
Esse trabalho recebeu apoio financeiro da FAPEAM e do IFAM
CMZL. Agradecemos aos alunos de Engenharia Civil que
participaram das atividades propostas e aos avaliadores pela
parceria.

19. Villela, M. L. B.; Xavier. S.; Prates, R. O. "Mtodos de


Avaliao de Comunicabilidade para Sistemas Colaborativos:
Um Estudo de Caso. SBCSC, 2013.
20. Prates, R. O., de Souza, C. S., Barbosa, S. D. J., 2000. A
method for evaluating the communicability of user interfaces.
In Interactions, v. 7, n. 1, p. 31-38

9. REFERNCIAS
1. Tori, R. Educao sem distncia: as tecnologias interativas na
reduo de distncias em ensino e aprendizagem. So Paulo:
Senac, 2010.

21. Prates, R. O. ; Barbosa, S. D. J. Introduo Teoria e Prtica


da Interao Humano-Computador fundamentada na
Engenharia Semitica. Em: T.Kowaltowski e K. K. Breitman
(Org.). In JAI 2007.

92

SBSC 2014 Proceedings - Concluded Research

October 6-9, 2014 - Curitiba, PR, Brazil

22. Mattos, B. Uma Extenso do Mtodo de Avaliao de


Comunicabilidade para Sistemas Colaborativos. 150 p.
Dissertao de Mestrado em Cincia da Computao.
DCC/UFMG, 2010.
23. Mattos, B., Santos, R. L. e Prates, R. O. Investigating the
Applicability of the Semiotic Inspection Method to
Collaborative Systems. Brazilian Symposium of Collaborative
Systems, 2009, 53-60.
DOI=http://dx.doi.org/10.1109/SBSC.2009.28
24. Lima, D. e Castro, T. Music spectrum: A collaborative
immersion musical system for children with autism. In IX
SBSC, IEEE CS (2012), 5358. DOI=
http://dx.doi.org/10.1109/SBSC.2012.33
25. Lima, D. e Castro, T. Music Spectrum: A Music Immersion
Virtual Environment for Children with Autism. J. Procedia
Computer Science 14 (2012), 111-118. DOI=
http://dx.doi.org/10.1016/j.procs.2012.10.013

93

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

CollabCumulus: Uma Ferramenta de Apoio Anlise


Colaborativa de Provenincia em Workflows Cientficos
Guilherme Miranda, Joo A. de Souza, Vanessa Braganholo, Daniel de Oliveira
Universidade Federal Fluminense
Niteri Rio de Janeiro

{guilhermecvm, joaovianna}@id.uff.br, {vanessa, danielcmo}@ic.uff.br


ABSTRACT

aparato tecnolgico que engloba o uso de ambientes de


processamento de alto desempenho, redes de sensores, etc.

In silico scientific experiments usually demand high performance


execution environments, and consume and produce an
overwhelming quantity of data. Workflow Management Systems
support the execution of this kind of experiment in high
performance environments, but fail to support the analysis of the
experiments results. In fact, analyzing these large amounts of data
to prove of refute an experiments hypothesis is a very time
consuming task, which demands a large team of scientists that
may be geographically disperse. Additionally to the fact that the
Workflow Management Systems do not support the analysis phase
of the experiment, existing analysis tools fail in allowing data that
was captured during the experiment execution to be shared and
analyzed by the scientists. This kind of data is crucial to the
analysis process. To overcome this limitation, in this paper we
present CollabCumulus, a tool that allows scientists to share data
about the execution of their experiments, and analyze them
together with colleagues, even when they are physically
distributed. CollabCumulus uses the concept of social networks to
make collaborative analysis of scientific experiments a reality.

Esses experimentos se caracterizam pelo uso intenso de


simulaes que so baseadas em modelos computacionais
complexos. Em geral, esses modelos se referem ao encadeamento
de um conjunto de programas, formando um fluxo. A modelagem
desse fluxo de maneira estruturada denominada workflow
cientfico [2]. Um workflow um arcabouo funcional que modela
um conjunto de atividades (que podem ser invocaes de
programas, servios Web, etc.) e a dependncia de dados entre as
atividades (i.e. uma atividade consome os dados produzidos pela
atividade imediatamente anterior). Os Workflows so executados
em mecanismos complexos chamados de Sistemas de Gerncia de
Workflows Cientficos (i.e. SGWfC).
Devido complexidade dos modelos associados aos experimentos
cientficos, eles comumente necessitam execues em paralelo
usando ambientes de Processamento de Alto Desempenho (PAD)
como os clusters computacionais [4], as grades computacionais
[5] e mais recentemente as nuvens de computadores [6]. Em
especial, as nuvens de computadores oferecem a computao
como um servio que pode ser adquirido sob demanda por
diferentes tipos de usurios (inclusive cientistas), seguindo um
modelo pague-pelo-uso (do ingls pay-per-use) [7].

Categories and Subject Descriptors


H.5.3 [Group and Organization
supported cooperative work.

Interfaces]:

Computer

Como a complexidade dos workflows vem aumentando


exponencialmente (seja em relao quantidade de parmetros
explorados ou quantidade de atividades que compem o
workflow), executar esses workflows exige uma capacidade de
processamento que s pode ser oferecida pelos ambientes de
nuvem, uma vez que seus recursos so elsticos, i.e. o cientista
pode requisitar recursos de uma forma teoricamente infinita
(apesar de os provedores imporem um limite, ele relativamente
grande). Dessa forma, a computao em nuvem vem alavancando
o desenvolvimento de experimentos cientficos baseados em
simulao uma vez que cientistas que antes no possuam acesso a
ambientes de processamento de alto desempenho agora podem
criar clusters virtuais na nuvem e executar seus workflows em
paralelo.

General Terms
Documentation, Experimentation, Human Factors.

Keywords
Provenance Data, Workflows, SciCumulus, Collaboration.

1. INTRODUO
Nos ltimos anos, o processo de experimentao cientfica vem
sendo modificado de forma drstica. Diferentemente dos
experimentos cientficos tradicionais, como aqueles clssicos de
qumica e fsica onde os cientistas realizam suas pesquisas em
laboratrios, os experimentos atuais no se resumem mais
somente pesquisa laboratorial [1]. A evoluo da cincia da
computao e da engenharia nas ltimas dcadas permitiu a
explorao de novos tipos de experimentos cientficos baseados
em simulao [2,3]. Dessa forma, os experimentos atuais
passaram a possuir uma forte dependncia em relao a um

Porm, a execuo do workflow em paralelo em ambientes de alto


desempenho no o nico aspecto importante. Mesmo que um
workflow seja executado da melhor forma possvel, seus
resultados devem ser passveis de avaliao e reproduo. Desta
forma, para validar e reproduzir um workflow necessita-se possuir
dados descritores tanto do ambiente em que o workflow foi
executado quanto dos prprios workflows que esto sendo
executados. Esse tipo de dado denominado Dado de
Provenincia [8], e contm o histrico de toda a execuo do
workflow, desde os tempos de execuo de cada atividade at os
arquivos que foram produzidos. Este tipo de dado deve ser
analisado de forma que se possa verificar se a hiptese cientfica

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

94

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

que o workflow apoia foi confirmada ou refutada, i.e. para que


cheguemos a concluses cientficas.

apresentamos um estudo preliminar da ferramenta e finalmente na


Seo 6 conclumos o artigo e discutimos trabalhos futuros.

O grande problema que essa anlise no uma tarefa trivial de


ser desempenhada. Muitas vezes ela deve ser realizada em
conjunto com diversos especialistas de domnio da aplicao que
podem estar geograficamente dispersos. Alm disso, o volume de
dados produzidos pode chegar a uma escala que torna impossvel
que eles sejam avaliados por uma pessoa isoladamente. Essa
necessidade de avaliao colaborativa dos dados, aliada ao
volume de dados produzidos pela execuo de workflows de
larga-escala em ambientes de alto desempenho, nos leva a uma
situao onde o processo de anlise dos dados e validao do
experimento passa a ser um ponto crtico, enquanto que anos atrs
o gargalo estava em prover uma execuo paralela eficiente. Esse
um cenrio clssico em problemas de Big Data [9].

2. REFERENCIAL TERICO
Essa seo discute conceitos importantes que servem de base para
a abordagem CollabCumulus. Em especial, so apresentados os
conceitos de workflow cientfico e provenincia de dados na
Seo 2.1 e nuvens de computadores na Seo 2.2. Finalmente, a
Seo 2.3 apresenta o SGWfC SciCumulus, que base da
proposta aqui apresentada.

2.1 Workflows Cientficos


Podemos definir um experimento cientfico como "um teste
executado em condies controladas, que realizado para
demonstrar uma verdade conhecida, examinar a validade de uma
hiptese, ou determinar a eficcia de algo previamente no
explorado" [16]. Apesar da abrangncia da definio, no contexto
desse artigo consideraremos uma categoria de experimentos
cientficos em especial chamada de experimentos in silico (ou
baseados em simulao) [17]. Dessa forma, deste ponto em diante,
sempre que mencionarmos o ao termo experimento cientfico
estaremos nos referindo aos experimentos in silico.

De acordo com Winslett et al. [10], a maioria dos SGWfC


existentes apoiam bem a execuo e o monitoramento dos
workflows em ambientes distribudos, e tambm a captura e
armazenamento dos dados de provenincia. Porm, nenhum deles
oferece funcionalidades para anlise e para a explorao da
provenincia. Muitas vezes os cientistas tem que analisar
manualmente os dados ou utilizar ferramentas de terceiros (no os
SGWfC) para faz-lo. Alguns SGWfC como o VisTrails [11] e o
SciCumulus [12] fornecem funcionalidades para navegar na
definio do workflow, porm no oferecem apoio para anlise
dos resultados. Portanto, as solues que visam apoiar a anlise
(intrinsicamente colaborativa) da provenincia so plausveis e
necessrias.

Este tipo de experimento encontrado em uma gama grande de


domnios, que variam desde a bioinformtica [1820] ao
mapeamento dos corpos celestes [1], passando por experimentos
de engenharia como os de dinmica de fluidos computacional
[21,22]. Independente do domnio em que se encontra, cada
experimento desses geralmente envolve mltiplas execues,
sendo que cada uma delas pode demandar um conjunto de
recursos computacionais (processamento, armazenamento, etc.)
durante um longo perodo de tempo. Devido sua larga escala,
esses experimentos necessitam tcnicas de paralelismo e
execues em ambiente de PAD como os clusters, as grades, e
mais recentemente as nuvens de computadores.

Ao mesmo tempo, as tecnologias de redes sociais tm


possibilitado a insero de novos costumes e prticas em nossa
sociedade [13]. Por meio de redes sociais, seus membros podem
trocar informaes, promover eventos e debates, etc. Acreditamos
que este tipo de tecnologia pode ser utilizado para apoiar a anlise
e compartilhamento de resultados de experimentos cientficos
modelados como workflows. De fato, j existem solues para
compartilhamento de workflows baseadas em redes sociais como o
myExperiment [14] e o CrowdLabs [15]. Entretanto, as mesmas
tm um foco maior no compartilhamento dos arquivos de
definio dos workflows (em geral um arquivo XML) do que na
anlise dos resultados das execues. Por mais que a definio do
workflow em uma linguagem seja importante, acreditamos que a
anlise dos resultados produzidos pode se beneficiar muito mais
de uma abordagem colaborativa.

Essas execues comumente envolvem o encadeamento de


programas que consumem um grande volume de dados e
requerem grande capacidade de processamento (i.e. intensivos em
computao e dados). Nesse contexto, o produto de dados (i.e.
arquivos, parmetros, tabelas em bancos de dados, etc.) gerado
por um programa utilizado como entrada pelo programa
seguinte, e assim sucessivamente. Esse encadeamento pode ser
modelado como um workflow cientfico, que uma abstrao para
modelar o fluxo de atividades e de dados em um experimento.
Cada atividade implementada por um programa ou um servio
que invocado e cada invocao de servio chamada de cloud
activity no contexto desse artigo. Esses workflows so controlados
e executados pelos Sistemas de Gerncia de Workflows
Cientficos (SGWfC), que tm como objetivo especificar,
executar e monitorar a execuo de workflows nos mais variados
ambientes. H muitos SGWfC disponveis, como o VisTrails [11],
o Swift/Turbine [23], o Chiron [24] e o SciCumulus [12]. Cada
um tem suas prprias caractersticas. No entanto, todos esses
citados fornecem apoio fundamental a execues em ambientes de
PAD, mas nenhum apoio etapa de anlise.

Assim, no sentido de auxiliar os cientistas a analisar os dados de


provenincia de workflows cientficos executados em ambientes
de computao de alto desempenho, este artigo prope o
CollabCumulus. O CollabCumulus uma ferramenta baseada em
redes sociais que visa apoiar a anlise de dados de provenincia
de forma colaborativa e ao mesmo tempo ajudar os cientistas a
compartilhar seus experimentos e resultados. No CollabCumulus,
cada cientista pode autorizar o acesso sua base de dados de
provenincia de forma que terceiros possam analisar os seus
resultados e reutilizar experimentos j executados. Em sua verso
atual, o CollabCumulus apoia os workflows executados pelo
SGWfC SciCumulus [12], mas extenses so possveis.

Como o CollabCumulus baseado em uma arquitetura em nuvens


de computadores, a seguir apresentamos o conceito para um
melhor entendimento.

Este artigo est dividido em 4 sees, alm desta introduo. Na


Seo 2 so apresentados conceitos bsicos de experimentao
cientfica, workflows cientficos e da mquina de execuo
SciCumulus que a base do CollabCumulus. Na Seo 3
apresentamos trabalhos relacionados. Na Seo 4 apresentamos o
CollabCumulus e suas principais caractersticas. Na Seo 5

2.2 Nuvens de Computadores


A computao em nuvem [6,7] um modelo de computao cujo
objetivo fornecer acesso a diferentes tipos de recursos de
software e hardware por meio da Web. Assim, os programas,

95

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

contexto de workflows cientficos, a provenincia prospectiva est


preocupada em capturar os dados relativos estrutura do
workflow. Por outro lado, a provenincia retrospectiva foca na
captura dos produtos de dados e seus descritores produzidos a
partir da execuo de um determinado workflow. Dados de
provenincia retrospectiva englobam tempos de incio e fim de
execuo, arquivos consumidos e produzidos, erros que
ocorreram, informaes de desempenho de atividades, entre
outros. Assim, o repositrio de provenincia contm informaes
sobre elementos que representam: (i) workflows executados na
nuvem; (ii) os produtos de dados consumidos e produzidos pela
execuo do workflow, e (iii) informaes sobre o ambiente de
nuvem. Todas essas informaes garantem a validao e a
reproduo do workflow e comumente so analisadas por um
grupo de cientistas que pode estar geograficamente disperso. Essa
distncia pode ser um problema, uma vez que o SciCumulus (e
tambm nenhum outro SGWfC) oferece apoio computacional para
a etapa de anlise dos resultados dos workflows.

plataformas e os dados passaram dos desktops para a nuvem.


Conceitos como a elasticidade [6] (capacidade de fornecer
recursos sob demanda, teoricamente de forma infinita) fazem
das nuvem um ambiente propcio para a execuo de workflows
em paralelo com capacidade de PAD. A natureza das necessidades
dos workflows cientficos se encaixa bem com a flexibilidade e a
elasticidade, sob demanda, oferecida pelas nuvens. De acordo
com Simmhan et al. [25] o uso efetivo de nuvens pode reduzir o
custo real com equipamentos e sua consequente manuteno, alm
da questo das atualizaes constantes de software e hardware.
As nuvens permitem que o cientista crie um ambiente totalmente
virtual (i.e. cluster virtual) e utilize esses recursos de forma
reservada durante uma janela de tempo. Alm disso, com o uso
das nuvens, os grandes conjuntos de dados utilizados e gerados
pela execuo dos workflows podem ser mais facilmente
compartilhados para a anlise, dentro ou fora da nuvem,
democratizando o acesso aos resultados cientficos.
Desta forma, as nuvens proporcionam um ambiente adequado
para a execuo paralela de workflows cientficos que demandem
PAD. Entretanto, apesar de muitos SGWfC apoiarem a execuo
paralela de workflows em nuvens, nenhum deles se preocupa com
a questo da anlise dos resultados que se encontram dispersos em
mltiplas mquinas virtuais e mltiplos provedores de nuvens
(e.g. Amazon EC2, Microsoft Azure, etc.). Desta forma, novas
propostas so necessrias para fornecer uma soluo transparente
para os cientistas analisarem os resultados dos seus workflows de
forma sistemtica e colaborativa. A seguir, de forma a explicar
melhor o cenrio do CollabCumulus, apresentamos o SGWfC
SciCumulus que foi o escolhido como primeiro SGWfC a ser
apoiado pelo CollabCumulus.

3. TRABALHOS RELACIONADOS
De acordo com Winslett et al. [10], o uso de ferramentas
independentes de SGWfC para prover a capacidade de anlise de
provenincia necessrio, uma vez que os SGWfCs existentes
no proveem essa capacidade. A seguir, apresentamos algumas
das abordagens existentes para anlise de provenincia, sendo esta
anlise colaborativa ou no.
A abordagem pioneira em termos de compartilhamento de
workflows para anlise foi o myExperiment [14]. O
myExperiment uma abordagem que apoia o compartilhamento
de workflows modelados utilizando o SGWfC Taverna [28]. Ele
atua como um repositrio pblico de definies de workflows (em
XML) que serve como base para que terceiros possam reutilizar
workflows previamente modelados. Os cientistas podem
compartilhar seus workflows entre si, comentar a modelagem e
enviar mensagens pessoais, formando comunidades virtuais.
Entretanto, o myExperiment no permite que o cientista analise os
resultados de um experimento, faa download de resultados ou
acesse repositrios de provenincia diretamente. Toda essa anlise
realizada externamente ferramenta, fazendo com que esse
conhecimento continue sendo tcito.

2.3 SciCumulus
O SciCumulus um SGWfC que gerencia a execuo paralela de
workflows cientficos em ambientes de nuvem. Com base na
especificao do workflow e do conjunto de dados de entrada
fornecidos pelos cientistas, o SciCumulus capaz de distribuir as
execues de atividades (que no possuem dependncia entre si)
em um conjunto de Mquinas Virtuais (MV), aumentando assim o
paralelismo e reduzindo o tempo que o cientista deve esperar pelo
resultado do workflow. O SciCumulus permite que o cientista
informe suas preferncias para a execuo, como por exemplo, o
tempo de execuo mximo ou o custo financeiro mximo. Dessa
forma, SciCumulus distribui as execues das diversas atividades
respeitando a dependncia entre elas, e de acordo com seu tempo
de execuo estimado. Estas estimativas so fornecidas por meio
de consulta a um repositrio de provenincia baseado no modelo
PROV-WF [26]. Diferentemente de outros SGWfC, o
SciCumulus pode aumentar ou diminuir a quantidade de MVs
envolvidas na execuo para atender s necessidades dos
cientistas. O SciCumulus capaz de adicionar (ou remover), de
forma automtica, MVs a partir do conjunto de MVs disponveis
para a execuo. O SciCumulus tambm possui um mecanismo de
notificao [27] que identifica alguns eventos pr-definidos e
notifica cientistas por meio de servios de dispositivos mveis do
SO Android.

Similar ao myExperiment, o grupo do SGWfC VisTrails props o


CrowdLabs [15]. Apesar do propsito equivalente, no CrowdLabs
os cientistas so capazes de fazer o upload dos seus conjuntos de
dados de entrada para a plataforma, de forma que os mesmos
possam ser analisados e reutilizados por terceiros. Alm disso,
eles possibilitam que o usurio utilize um dos mashups [29], que
se encontram embutidos no prprio portal e executem seus
workflows utilizando o VisTrails server. Entretanto, o CrowdLabs
tambm no oferece apoio anlise da provenincia retrospectiva
(resultados, produtos de dados, etc.) dos workflows j executados.
Para realizar tal atividade, o cientista tem que realizar o download
do XML que contm os dados de provenincia retrospectiva.
Outras abordagens visam fornecer um arcabouo para anlise de
dados de provenincia, mas no necessariamente de dados
gerados por workflows cientficos. Um exemplo desse tipo de
abordagem so os NanoCubes (http://www.nanocubes.net/). A
ideia dos NanoCubes permitir que os cientistas possam
visualizar e interagir com grandes massas de dados de forma
eficiente em sua prpria estao de trabalho. O projeto
NanoCubes de cdigo aberto e est disponvel para download no
GitHub. Para gerar a visualizao, o usurio necessita informar
um conjunto de dados em formato CSV ou uma tabela em um
banco de dados que contenha informaes de latitude, longitude e

O SciCumulus tambm possui um rico repositrio de provenincia


que armazena as informaes de gro fino sobre o experimento
que est sendo executado e sobre o prprio ambiente de nuvem.
As informaes existentes nesse repositrio podem ser
classificadas de duas formas: provenincia prospectiva e
retrospectiva [8]. A provenincia prospectiva est interessada em
capturar e armazenar os dados relativos estrutura do workflow
que levou gerao de um determinado produto de dados. No

96

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

experimentos e resultados. O CollabCumulus foi projetado de


forma que fosse independente de SGWfC adotado e pudesse ser
integrado a qualquer SGWfC, contanto que um cartucho [30]
especfico fosse desenvolvido.

data. Apesar de muito interessante e promissora, essa ideia est


desconectada do conceito de workflow cientfico.

4. COLLABCUMULUS
O CollabCumulus foi desenvolvido com o objetivo de auxiliar a
anlise e consulta de dados de provenincia produzidos pela
execuo de workflows em ambientes distribudos, ou seja, ajudar
os cientistas na fase de anlise do experimento cientfico.
Atualmente, essa funo desempenhada a partir da manipulao
direta do banco de dados, o que quer dizer que os pesquisadores
necessitam de conhecimento prvio da estrutura do repositrio e
da linguagem de consulta utilizada pelo mesmo. Assim, a ideia
por trs do CollabCumulus retirar esse nus do cientista, criando
um ambiente baseado no conceito de redes sociais para apoiar a
anlise de dados de provenincia de forma colaborativa e ao
mesmo tempo ajudar os cientistas a compartilhar seus

Nesse artigo ns apresentamos como o CollabCumulus foi


utilizado integrado ao SciCumulus e seu repositrio de
provenincia. A arquitetura do CollabCumulus consiste de 3
componentes principais: (i) o portal CollabCumulus, (ii) os
cartuchos para acesso aos repositrios de provenincia e (iii) o
repositrio do CollabCumulus. Optamos por separar o
CollabCumulus em trs camadas por diversos motivos, entre eles:
simplificar o desenvolvimento inicial visto que, durante este
perodo, no necessrio a comunicao entre o cartucho e o
portal; facilitar a manuteno, e possibilitar a criao de novos
servios que utilizam os cartuchos desenvolvidos (Figura 1).
Repositrio de+Provenincia
do+SciCumulus
Provenincia&
Prospectiva&
e&Retrospectiva

CollabCumulus
Portal

Cartucho
SGWfC SciCumulus

Cientistas
Dados&Sociais&+&Anotaes

VM#1

Internet

VM#2

VM#n

Mquinas Virtuais

Repositrio do+CollabCumulus

Figura 1. Arquitetura do CollabCumulus

4.1 O Portal CollabCumulus

4.2 Cartuchos para Acesso aos Repositrios

Um dos componentes principais do CollabCumulus o seu portal.


atravs desse portal que os diversos cientistas tm acesso ao
contedo dos repositrios de provenincia de forma a realizar a
anlise dos dados gerados/consumidos. Neste portal, cada
cientista tem um usurio associado que tem acesso a um conjunto
de repositrios de provenincia, e pode comentar, criar tpicos de
discusso e analisar colaborativamente os resultados com seus
parceiros de pesquisa. Alm disso, o portal prov uma busca
facetada de todas as informaes relativas aos workflows,
atividades, ativaes e arquivos que j foram executados. Essas
caractersticas no s criam um ambiente propcio para discusses
e interao para gerar concluses de melhor qualidade, como
permite que muitos dos problemas possam ser solucionados a
partir dos comentrios dos mltiplos usurios.

Os cartuchos desempenham um papel fundamental no


CollabCumulus. Se considerarmos que o CollabCumulus pode
capturar dados de provenincia de diferentes SGWfCs, a gerncia
desses dados de provenincia torna-se um desafio uma vez que
cada SGWfCs possui seu prprio modelo de provenincia
associada, que pode ser implementado em diferentes tecnologias.
Por exemplo, o repositrio de provenincia do SciCumulus utiliza
o modelo relacional, o do VisTrails utiliza um dialeto XML e o do
Taverna utiliza RDF. Dessa forma, faz-se necessrio o uso de um
componente com uma assinatura pr-definida, que possa ser
acessado pelo portal, mas que implemente as consultas de acordo
com cada tipo de repositrio utilizado.
Os cartuchos desempenham exatamente essa funo. Alm disso,
cada cartucho tem como objetivo normalizar os dados para que
os mesmos possam ser exibidos, uma vez que cada SGWfC
captura a provenincia em diferentes granularidades e nem sempre
recolhe todos os dados disponveis. No caso do SciCumulus, cada
cartucho tem mtodos pr-definidos, os quais so implementados
atravs de uma classe que executa consultas em SQL. Assim, o
portal solicita um recurso ao cartucho que implementa uma API.
S tero acesso API os usurios autenticados, e para consumir
um recurso o usurio deve ter autorizao. Para cada operao
executada, a API retorna para o portal os dados no formato JSON
(Javascript Object Notation) (www.json.org/), um formato leve
para troca de dados entre as duas aplicaes. Por exemplo, no
mtodo RetrieveActivation esperado que se informe a tag do
workflow (i.e. seu nome) e sua exectag (seu identificador de
execuo). A partir dos dados informados, so retornadas as

O desenvolvimento do portal foi realizado utilizando o Bootstrap


(http://getbootstrap.com/) e o AngularJS (https://angularjs.org/). O
Bootstrap um arcabouo que facilita o desenvolvimento de uma
interface grfica responsiva, ou seja, que pode ser visualizada por
diversos dispositivos como computadores, tablets e celulares.
baseado em HTML5, CSS3 e jQuery. O AngularJS um
framework MVC que auxilia na criao de pginas Web
dinmicas. Ele elimina a necessidade de manipulao do DOM
(Document Object Model) pelo desenvolvedor, ou seja, a incluso
e atualizao de contedo da pgina Web (view) a partir de cdigo
JavaScript. As informaes so obtidas diretamente do model, e
por isso, quando este atualizado, a view modificada
automaticamente. O mesmo acontece inversamente devido
ligao direta e bidirecional dos dados (two-way data binding).

97

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

cientistas podem adicionar Comentrios para os Workflows,


Atividades, Cloud Activities e Arquivos. Assim, as classes do
CollabCumulus enriquecem o banco de provenincia previamente
existente. Ao mesmo tempo, usurios vinculados a um mesmo
workflow podem trocar comentrios da mesma forma que o fazem
em uma rede social. Aqui, a interao se d no contexto de um
workflow. Para melhor ilustrar essas ideias, a seguir apresentamos
um estudo de caso do uso do CollabCumulus em um workflow de
bioinformtica chamado SciPhy [19].

informaes completas do workflow, de cada uma de suas


atividades e de cada uma das execues das atividades por meio
da seguinte consulta em SQL. Note que, nessa consulta, assumese que o usurio informou a tag SciPhy e a exectag SciPhy03.
SELECT w.*, a.*, ac.*
FROM hworkflow w, hactivity a,
hactivation ac
WHERE w.wkfid = a.wkfid
AND
a.actid = ac.actid
AND
w.tag = 'SciPhy'
AND
w.tagexec = 'SciPhy03'
Alm da funo de consulta, a API deve persistir informaes de
usurios, permisses, comentrios e outras informaes no
repositrio do CollabCumulus (apresentado na Seo 4.3) e salvar
imagens dos perfis dos usurios. Utilizamos o mdulo PDO (PHP
Data Object) do PHP, que tem como objetivo fornecer uma
estrutura que facilita a integrao da aplicao com o banco de
dados. O mdulo, alm de prover segurana aplicao, facilita a
conexo com diferentes tipos de bancos de dados.

4.3 Repositrio do CollabCumulus


Conforme mencionado anteriormente, o objetivo do
CollabCumulus acessar repositrios de terceiros para que se
possa realizar anlise da provenincia de forma colaborativa.
Entretanto, alm de acessar os repositrios de provenincia j
existentes, o CollabCumulus possui um repositrio prprio de
forma que possa armazenar informaes da rede social como
usurios, grupos de pesquisa, comentrios, dvidas e
questionamentos. No contexto desse artigo, os modelos do
SGWfC SciCumulus e do CollabCumulus foram inseridos em um
mesmo modelo conceitual apresentado na Figura 2. Na Figura 2,
as classes na cor branca so relativas ao modelo do SciCumulus,
enquanto que as classes em cinza so relativas ao CollabCumulus.

Figura 2 Modelo de dados do CollabCumulus

5. ESTUDO DE CASO
Nesta seo apresentamos um estudo de caso do CollabCumulus
com um workflow real de bioinformtica chamado SciPhy [19]. O
SciPhy foi projetado para gerar rvores filogenticas que so
estruturas hierrquicas que exibem a relao evolutiva entre
organismos. O SciPhy recebe como entrada sequncias de
aminocidos, porm seu uso pode ser extrapolado para outros
tipos de sequncias biolgicas. O workflow SciPhy composto
por quatro atividades principais que so: (i) a construo do
alinhamento gentico (MSA); (ii) a converso de formato do
alinhamento; (iii) a escolha do melhor modelo evolutivo a ser
usado e (iv) a construo da rvore filogentica. Estas atividades,
respectivamente, executam as seguintes aplicaes de
bioinformtica: MAFFT, ReadSeq, ModelGenerator e RAxML.

Inicialmente, detalhamos as classes que representam informaes


relativas ao workflow executado, ou seja, sua estrutura. A classe
Workflow possui os atributos tag, que serve para classificar um
determinado experimento e tagExecuo, que identifica
unicamente uma tentativa de execuo do experimento. A classe
Atividade possui um atributo tag que identifica a atividade de um
determinado workflow. Os atributos incio e fim contm,
respectivamente, a informao do tempo de incio da execuo da
primeira cloud activity desta atividade e a informao do tempo de
trmino da execuo da ltima cloud activity desta atividade. A
classe CloudActivity possui os atributos nmero e comando que
representam, respectivamente, o identificador da cloud activity,
bem como o nmero de identificao da linha de execuo. O
atributo workspace indica o local em que a cloud activity
consumiu e produziu os seus dados. O atributo estado e log so
importantes para armazenamento de provenincia referente aos
dados de execuo da cloud activity. Os atributos incio e fim
contm, respectivamente, a informao do incio e trmino da
execuo desta cloud activity. A classe Arquivo usada para
coletar as informaes de todos os arquivos consumidos e
produzidos durante a execuo de uma cloud activity, ou seja,
nome, data e tamanho.

Neste estudo de caso, iniciamos com uma busca pelos workflows


existentes como apresentado na Figura 3. Essa primeira tela do
CollabCumulus permite que o usurio liste todas as execues dos
workflows existentes, alm de possibilitar buscas pelo nome do
workflow ou por palavras que faam parte da sua descrio.
Uma vez selecionado o workflow SciPhy, basta que o cientista
selecione a execuo desejada e o detalhamento do workflow
apresentado de acordo com a Figura 4. Na Figura 4 podemos
perceber que so exibidas as atividades do SciPhy, aqui
representadas pelos nomes dos programas que as implementam.
Nesse momento j podemos analisar alguns resultados, como os
tempos de incio e fim de atividade. Alm disso, o CollabCumulus
permite que sejam filtradas atividades de acordo com seu nome
(tag) e suas datas de incio e fim (essa funcionalidade til para
workflows com muitas atividades). No estudo de caso
selecionamos a atividade raxml para fornecer um detalhamento.

Alm das informaes do workflow, o CollabCumulus adiciona


suas prprias informaes. Essas informaes so relativas ao
Repositrio que registrado nos sistemas. Cada Repositrio est
associado a um Usurio e um Grupo de Pesquisa. Usurios s
tm acesso aos repositrios caso estejam cadastrados e
autorizados. Um Workflow est cadastrado em um repositrio e os

98

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Figura 3 Busca por workflows

Figura 4 Detalhamento do workflow

produzidos diretamente da nuvem, os usurios podem apenas


baixar os arquivos que sejam de fato importantes e no precisam
baixar o dataset inteiro para, analisar conforme acontece no
CrowdLabs. Nessa tela de detalhamento da cloud activity, os
cientistas tambm podem adicionar comentrios e observaes
sobre os dados produzidos. Para ilustrar, a Figura 6 mostra
comentrios da equipe de cientistas que est analisando o
resultado da cloud activity. Ao perceber que o tempo de execuo
fugiu muito dos demais tempos para a mesma atividade, os
cientistas optaram por realizar uma nova execuo.

Uma vez selecionada a atividade raxml so apresentadas todas as


Cloud Activities associadas a essa atividade, conforme
apresentado na Figura 5. Nessa tela, podemos perceber que so
listadas todas as cloud activities associadas a essa atividade (1, 13
e 14) e os arquivos associados. Os cientistas j podem postar
comentrios associados a essa atividade ou aos arquivos
produzidos. Uma anlise comum verificar quais erros ocorreram
nas execues e se alguma execuo falhou e deve ser repetida,
conforme apresentado na Figura 5, na seo de comentrios. O
cientista ainda pode detalhar mais a anlise da provenincia,
escolhendo uma das execues da atividade. Nesse caso,
escolhemos uma execuo especfica do raxml.

O mesmo tipo de interao pode ser feito para cada arquivo


produzido por uma cloud activity. Por exemplo, ao selecionar o
arquivo ORTHOMCL1311 da Figura 6, uma tela similar
acionada, onde os cientistas podem analisar o arquivo e fazer
comentrios. Nesse trabalho, essa tela omitida devido a
limitaes de espao.

Finalmente, na Figura 6 apresentamos o detalhamento de uma das


execues da atividade raxml. Nesse detalhamento podemos
verificar todos os arquivos que foram produzidos com essa
execuo, com a possibilidade de realizar download de qualquer
um desses arquivos. A partir do download dos arquivos que foram

99

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Figura 5 Detalhamento da atividade

Figura 6 Detalhamento da Cloud activity


Apesar de j representar um avano na questo de anlise
colaborativa de provenincia, ainda existem questes em aberto.
A primeira delas a validao do CollabCumulus com um
conjunto significativo de cientistas de forma que consigamos
concluir se o uso do CollabCumulus de fato ajuda no processo de
anlise. Melhorias no CollabCumulus tambm se fazem
necessrias, como o apoio a grandes volumes de dados como por
exemplo os da astronomia, onde cada produto de dados pode
alcanar gigabytes. Alm disso, mecanismos de segurana mais
sofisticados tambm se fazem necessrios, pois potenciais
resultados de pesquisa esto nos repositrios e ainda no foram
publicados.

Este um estudo de caso inicial. Apesar dele no validar de fato o


CollabCumulus, seu objetivo foi exemplificar o uso do
CollabComulus em um workflow real que foi executado em
paralelo na nuvem. Novas avaliaes sero realizadas no futuro.

6. CONCLUSES
Neste artigo apresentamos o CollabCumulus, uma ferramenta que
permite aos cientistas compartilhar dados sobre a execuo de
seus experimentos, e analis-los em conjunto com outros
cientistas ou grupos de pesquisa, mesmo quando os mesmos se
encontram distribudos geograficamente. Diferentemente de
abordagens existentes, o CollabCumulus acessa diretamente
repositrios de provenincia dispersos na nuvem e permite aos
cientistas analisar tanto os metadados (e.g. medidas de tempo e
erros) quanto os produtos de dados gerados (i.e. arquivos). O
CollabCumulus usa o conceito de redes sociais para propiciar a
anlise colaborativa de experimentos cientficos.

7. AGRADECIMENTOS
Os autores agradecem o apoio financeiro concedido pela FAPERJ
e pelo CNPq.

100

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

8. REFERNCIAS BIBLIOGRFICAS

Software Engineering the Future of Empirical Studies in Software


Engineering, p. 117130

[1] T. Hey, S. Tansley, and K. Tolle, 2009, The Fourth Paradigm:


Data-Intensive Scientific Discovery. Microsoft Research.

[18] A. Matsunaga, M. Tsugawa, and J. Fortes, 2008,


CloudBLAST: Combining MapReduce and Virtualization on
Distributed Resources for Bioinformatics Applications, IEEE
eScience 2008, p. 222229.

[2] E. Deelman, D. Gannon, M. Shields, and I. Taylor, 2009,


Workflows and e-Science: An overview of workflow system
features and capabilities, Future Generation Computer Systems, v.
25, n. 5, p. 528 540.

[19] K.A.C.S. Ocaa, D. Oliveira, E. Ogasawara, A.M.R. Dvila,


A.A.B. Lima, and M. Mattoso, 2011, SciPhy: A Cloud-Based
Workflow for Phylogenetic Analysis of Drug Targets in
Protozoan Genomes, In: Advances in Bioinformatics and
Computational Biology, p. 6670

[3] M. Mattoso, C. Werner, G.H. Travassos, V. Braganholo, L.


Murta, E. Ogasawara, D. Oliveira, S.M.S. da Cruz, and W.
Martinho, 2010, Towards Supporting the Life Cycle of Largescale Scientific Experiments, International Journal of Business
Process Integration and Management, v. 5, n. 1, p. 7992.

[20] D. Oliveira, K.A.C.S. Ocaa, E. Ogasawara, J. Dias, J.


Goncalves, and M. Mattoso, 2012, Cloud-based Phylogenomic
Inference of Evolutionary Relationships: A Performance Study,
In: Proceedings of the 2nd International Workshop on Cloud
Computing and Scientific Applications (CCSA)

[4] M. Dantas, 2005, "Clusters Computacionais", Computao


Distribuda de Alto Desempenho: Redes, Clusters e Grids
Computacionais, 1 edRio de Janeiro: Axcel Books, p. 145180.
[5] I. Foster and C. Kesselman, 2004, The Grid: Blueprint for a
New Computing Infrastructure. Morgan Kaufmann.

[21] E.F. Lins, R.N. Elias, G.M. Guerra, F.A. Rochinha, and
A.L.G.A. Coutinho, 2009, Edge-based finite element
implementation of the residual-based variational multiscale
method, International Journal for Numerical Methods in Fluids,
v. 61, n. 1, p. 122.

[6] L.M. Vaquero, L. Rodero-Merino, J. Caceres, and M. Lindner,


2009, A break in the clouds: towards a cloud definition,
SIGCOMM Comput. Commun. Rev., v. 39, n. 1, p. 5055.
[7] D. Oliveira, F.A. Baio, and M. Mattoso, 2010, "Towards a
Taxonomy for Cloud Computing from an e-Science Perspective",
In: N. Antonopoulos and L. Gillam, eds., Cloud Computing,
London: Springer London, p. 4762.

[22] G. Guerra, F. Rochinha, R. Elias, A. Coutinho, V.


Braganholo, D. de Oliveira, E. Ogasawara, F. Chirigati, and M.
Mattoso, 2009, Scientific Workflow Management System Applied
to Uncertainty Quantification in Large Eddy Simulation, In:
Congresso Ibero Americano de Mtodos Computacionais em
Engenharia, p. 113

[8] J. Freire, D. Koop, E. Santos, and C.T. Silva, 2008,


Provenance for Computational Tasks: A Survey, Computing in
Science and Engineering, v.10, n. 3, p. 1121.

[23] J.M. Wozniak, T.G. Armstrong, K. Maheshwari, E.L. Lusk,


D.S. Katz, M. Wilde, and I.T. Foster, 2012, Turbine: a distributedmemory dataflow engine for extreme-scale many-task
applications, p. 112

[9] E. Bertino, P. Bernstein, D. Agrawal, S. Davidson, U. Dayal,


M. Franklin, J. Gehrke, L. Haas, A. Halevy, et al., 2011,
Challenges and Opportunities with Big Data
[10] R. Hasan, R. Sion, and M. Winslett, 2007, Introducing secure
provenance: problems and challenges, In: Proceedings of the 2007
ACM workshop on Storage security and survivability, p. 1318

[24] E. Ogasawara, J. Dias, V. Silva, F. Chirigati, D. Oliveira, F.


Porto, P. Valduriez, and M. Mattoso, 2013, Chiron: A Parallel
Engine for Algebraic Scientific Workflows, Concurrency and
Computation, v. 25, n. 16, p. 23272341.

[11] S.P. Callahan, J. Freire, E. Santos, C.E. Scheidegger, C.T.


Silva, and H.T. Vo, 2006, VisTrails: visualization meets data
management, In: SIGMOD International Conference on
Management of Data, p. 745747

[25] Y. Simmhan, C. Ingen, G. Subramanian, and J. Li, 2010,


Bridging the Gap between Desktop and the Cloud for eScience
Applications, In: 3rd IEEE Conference of Cloud Computing, p.
474481

[12] D. Oliveira, E. Ogasawara, F. Baio, and M. Mattoso, 2010,


SciCumulus: A Lightweight Cloud Middleware to Explore Many
Task Computing Paradigm in Scientific Workflows, In: 3rd
International Conference on Cloud Computing, p. 378385

[26] F. Costa, V. Silva, D. de Oliveira, K. Ocaa, E. Ogasawara,


J. Dias, and M. Mattoso, 2013, Capturing and Querying Workflow
Runtime Provenance with PROV: A Practical Approach, In:
Proceedings of the Joint EDBT/ICDT 2013 Workshops, p. 282
289

[13] E. Bakshy, I. Rosenn, C. Marlow, and L. Adamic, 2012, The


Role of Social Networks in Information Diffusion, In:
Proceedings of the 21st International Conference on World Wide
Web, p. 519528

[27] J. Pintas, D. Oliveira, K.A.C.S. Ocaa, E. Ogasawara, and M.


Mattoso, 2013, SciLightning: a Cloud Provenance-based Event
Notification for Parallel Workflows, In: Proceedings of the 3rd
International Workshop on Cloud Computing and Scientific
Applications (CCSA)

[14] C.A. Goble and D.C.D. Roure, 2007, myExperiment: Social


Networking for Workflow-using e-Scientists, In: Proceedings of
the 2nd workshop on Workflows in support of large-scale science,
p. 12

[28] D. Hull, K. Wolstencroft, R. Stevens, C. Goble, M.R.


Pocock, P. Li, and T. Oinn, 2006, Taverna: a tool for building and
running workflows of services, Nucleic Acids Research, v. 34, n.
2, p. 729732.

[15] P. Mates, E. Santos, J. Freire, and C.T. Silva, 2011,


CrowdLabs: Social Analysis and Visualization for the Sciences,
In: 23rd Scientific and Statistical Database Management
Conference

[29] E. Santos, L. Lins, J. Ahrens, J. Freire, and C. Silva, 2009,


VisMashup: streamlining the creation of custom visualization
applications, IEEE transactions on visualization and computer
graphics, v. 15, n. 6 (Dec.), p. 15391546.

[16] C. Soanes and A. Stevenson, 2003, Oxford Dictionary of


English. 2nd Revised edition ed. Oxford University Press.
[17] G.H. Travassos and M.O. Barros, 2003, Contributions of In
Virtuo and In Silico Experiments for the Future of Empirical
Studies in Software Engineering, In: 2nd Workshop on Empirical

[30] D. Birsan, 2005, On plug-ins and extensible architectures,


Queue, v. 3, n. 2, p. 4046.

101

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Caixas de Interesses: um Novo Mecanismo para a


Colaborao atravs de Nuvem de Armazenamento de
Dados
Felipe Leite da Silva, Roberto Arajo, Lucas Melo Silva, Nelson Neto Sampaio
Laboratrio de Segurana e Criptografia Aplicada (LabSC)
Faculdade de Computao
Universidade Federal do Par (UFPA)
Par, Brasil

Email:{fsilva,rsa,lucasmelo,nelsonneto}@ufpa.br
Esses servios oferecem aos seus usurios capacidade de
armazenamento de acordo com suas necessidades e incluem
outros benefcios, como a alta disponibilidade (ex. arquivos so
acessveis a qualquer momento) e o acesso multiplataforma por
meio de diferentes dispositivos [1][2].

ABSTRACT
Individuals and organization have increasingly adopted cloud
computing services for outsourcing computational resources. Data
storage, specifically, presents one of the most popular outsourced
resources. Using cloud storage services, clients meet their needs
obtaining a data repository for archive and backup files. Usually,
these services offer unlimited storage capacity along with a high
availability and easy multi-platform access infrastructure. In
addition, they also offer collaboration capability between users.
The data sharing mechanisms provide the primary means of
collaboration and allow users to work from remote locations and
exchange large amounts of information.
Although traditional mechanisms present benefits, they also
restrict file sharing among users. By design, they limit sharing
capability to group of users that know each other. In particular,
cloud storage services do not fully support content share between
users with no social ties, but with common interest (e.g.,
researchers with the same area of expertise).
Targeting this scenario, we introduce a sharing mechanism based
on so-called interest box as a novel approach for sharing content
in cloud storage services. This mechanism enable file sharing
between users with a potential common interest based on their
stored content. Moreover, the user controls who can access his
files using attributes from an attribute provider center, allowing
only authorized access to his data.

Alm disso, essas nuvens caracterizam-se por facilitar a


colaborao entre usurios. O compartilhamento de dados, em
particular, um dos principais recursos ofertados para promover
tal colaborao. Por meio dele, os usurios podem trocar grande
quantidade dados entre si e trabalhar de forma integrada. Por
exemplo, organizaes podem compartilhar dados dinamicamente
entre suas filiais e pesquisadores de institutos diferentes podem
cooperar em trabalhos multinstitucionais.
Tradicionalmente, os mecanismos de compartilhamento presentes
em nuvens de armazenamento de dados tm seu funcionamento
baseado na delegao explcita de acesso aos arquivos. Em outras
palavras, o usurio determina regras de acesso para seus arquivos
definindo outros usurios do servio que podero acess-los.
Essas regras so definidas atravs da utilizao de um
identificador (ex. e-mail, nome de usurio) referente ao receptor
do arquivo compartilhado. Exemplos de mecanismos desse tipo
so as listas de controle de Acesso (Access Control List - ACL)
como as utilizadas pela Amazon S3 [3] e os nveis hierrquicos
(Role Based Access Control - RBAC) como utilizados pela nuvem
Rackspace [4]. Esta forma de compartilhamento possibilita a
colaborao dinmica e controlada entre os usurios, pois eles
podem definir a qualquer momento quem ter acesso aos seus
arquivos.

Keywords
Cloud, sharing files, cloud storage collaboration.

Apesar dos benefcios, esses mecanismos apresentam uma


limitao inerente quando utilizados juntamente com nuvens de
armazenamento: eles requerem o conhecimento prvio do
identificador do usurio receptor do arquivo compartilhado.
Tendo em vista que nuvens de armazenamento so servios que
agregam cada vez mais usurios, esses mecanismos apenas
viabilizam o compartilhamento entre conjuntos de usurios que de
alguma forma obtiveram os identificadores de outros (ex. amigos,
familiares, trabalhadores de uma empresa). Em particular,
usurios que no se conhecem, mas que poderiam se beneficiar
compartilhando dados entre si (ex. pesquisadores de uma mesma
rea de atuao que no se conhecem) no so comtemplados por
estes mecanismos.

1. INTRODUO
O surgimento de novas tecnologias e o aprimoramento dos
dispositivos mveis impulsiona um amplo crescimento da
quantidade de dados produzidos tanto por organizaes quanto
por pessoas. Mediante a crescente necessidade de armazenamento
desses dados, diversos servios surgem a fim de atender a tal
demanda.
Nesse contexto, as nuvens de armazenamento destacam-se como
uma das principais solues para o armazenamento de dados.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

Por outro lado, os servios de armazenamento em nuvem


possibilitam a criao de arquivos ou pastas pblicas como
alternativa a delegao explcita de acesso a arquivos. Essa forma
de compartilhamento baseia-se na remoo de restries de acesso
sobre o item selecionado tornando-o disponvel ao pblico em

102

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

geral. Tal soluo possibilita um compartilhamento mais


abrangente, pois qualquer pessoa poder acessar o arquivo
publicado. No entanto, ela compromete o controle do usurio
sobre seus dados, uma vez que ela no oferece uma forma de
definir restries de acesso ao arquivo. Outra limitao est
relacionada ao suporte para divulgao dos arquivos publicados.
Normalmente, os dados so disponibilizados por meio de um link
pblico. Esse link, por sua vez, deve ser divulgado atravs de uma
plataforma externa (ex. sites pessoais) dificultando a obteno do
arquivo por outros usurios.

1- Propor um mecanismo de compartilhamento de arquivos que


estende a capacidade de colaborao entre usurios de nuvens de
armazenamento de dados atravs do compartilhamento entre
usurios que no se conhecem.
2- Propor a utilizao da deduplicao de dados como forma de
identificao de usurios desconhecidos que apresentam possveis
interesses em comum em nuvens de armazenamento. Essa
abordagem usufrui de uma tcnica que se difundiu nas nuvens de
armazenamento, e auxilia no aprimoramento da capacidade
colaborativa dessas plataformas atravs do mecanismo abordado
pelo artigo.

Para fim de exemplificao, o cenrio a seguir captura as


limitaes relativas ao compartilhamento em nuvens de
armazenamento de dados. Duas pessoas (Alice e Bob) so
usurios de um mesmo servio de armazenamento de dados em
nuvem. Este servio consiste em uma nuvem comunitria em que
pesquisadores de todo o pas armazenam informaes sobre suas
pesquisas. Alice uma usuria que armazena, na nuvem,
documentos referentes a sua pesquisa. Embora alguns documentos
de Alice devam ser mantidos de forma privada (ex. resultados
parciais de pesquisas no publicadas) outros no comprometeriam
sua privacidade caso fossem acessados por terceiros (ex. artigos e
outros documentos referentes a pesquisas publicadas). Bob, por
sua vez, um pesquisador da mesma rea de conhecimento que
Alice, mas que no a conhece. Nesse contexto, Alice e Bob so
usurios que poderiam se beneficiar atravs do compartilhamento
de dados, mas que no so completamente contemplados pelos
mecanismos disponveis. Visto que no se conhecem, tanto Alice
quanto Bob no trocariam identificadores entre si. Alm disso, o
compartilhamento entre esses usurios pode no ser efetivado
caso criem links pblicos para seus arquivos. Isso porque esta
forma de compartilhamento no prov meios de divulgao do
arquivo publicado a outros usurios da nuvem. Ele apenas remove
as restries de acesso sobre os dados.

3- Propor um esquema de controle de acesso que permita o


compartilhamento controlado em nuvens de armazenamento entre
usurios desconhecidos.
4- Apresentar uma discusso inicial sobre o mecanismo proposto.
A organizao deste artigo esta conforme descrito a seguir: na
Seo 2 so apresentados os trabalhos relacionados ao tema
abordado. Em seguida destaca-se na Seo 3 o conceito de
deduplicao de dados. Ele servir de base para o entendimento
do mecanismo proposto neste artigo. Ento, na Seo 4 o
mecanismo apresentado e descrito e na Seo 5 realizada uma
discusso inicial sobre ele. Por fim na Seo 6, as consideraes
finais e o direcionamento para trabalhos futuros so apresentados.

2. TRABALHOS RELACIONADOS
No contexto comercial, o compartilhamento de dados tornou-se
uma das principais estratgias para viabilizar a colaborao entre
usurios de nuvens de armazenamento de dados. Sendo
amplamente adotado por diversos servios[3][4][8], em alguns
casos, ele aprimorado viabilizando a edio simultnea e em
tempo real de alguns formatos de arquivos[9][10]. Por outro lado,
os mecanismos disponibilizados limitam o compartilhamento,
pois baseiam-se no modelo de delegao explicita de acesso e de
publicao de arquivos conforme introduzidos na seo anterior.

Mediante as limitaes destacadas, este artigo apresenta um novo


mecanismo para o compartilhamento de dados em nuvens de
armazenamento. Denominado de compartilhamento por caixas de
interesses, ele atua de forma complementar as estratgias
tradicionais de compartilhamento e proporciona uma nova forma
de colaborao entre usurio do servio de nuvem.
Especificamente, esse mecanismo possibilita que usurios
desconhecidos com algum interesse em comum troquem arquivos
entre si. Para promover tal compartilhamento, o mecanismo
utiliza a tecnologia de deduplicao de dados do servio de
nuvem. Alm disso, cada usurio capaz de controlar o acesso
aos seus dados atravs da utilizao de atributos pertencentes a
um centro provedor de atributos. Esse provedor implantado
atravs de servios de federao de identidade.

No contexto cientfico, algumas propostas visam utilizao


colaborativa das nuvens de armazenamento de dados. No Brasil, o
grupo de trabalho Computao em Nuvem para a Cincia (GTCNC)[11][12] realiza trabalhos nesse contexto. Eles propem o
desenvolvimento de uma nuvem de armazenamento cientifica em
que os usurios das instituies pertencentes a Comunidade
Acadmica Federada (CAFe) da Rede Nacional de Pesquisa
(RNP) possam usufruir do servio de forma colaborativa
compartilhando dados entre si. Alm desse grupo, Koulousis et.
al. [13] tambm considera a criao de federaes de nuvens para
promover o compartilhamento de dados cientficos no contexto do
projeto VPH-Share. Essas propostas tm por objetivo principal
unificar recursos de diferentes infraestruturas e assim permitir que
os usurios da federao tenham acesso a eles. Contudo, esses
trabalhos no apresentam nenhum mecanismo que contemplem o
compartilhamento de dados entre usurio com interesses em
comum que no se conhecem.

Diferentemente de outras abordagens de compartilhamento de


dados, como as redes sociais gerais [5] ou profissionais [6][7],
esta proposta permite que os usurios usufruam do recurso de
armazenamento disponibilizado pelos servios de nuvem
estendendo sua capacidade colaborativa. Alm disso, a
aplicabilidade do mecanismo proposto no se restringe ao
contexto de compartilhamento de dados em nuvens cientficas.
Ela pode ser estendida para outros tipos de nuvens, permitindo o
compartilhamento de dados em outros contextos, como por
exemplo, entre pessoas de organizaes distintas em uma
federao.

Outras propostas destinam-se a estender a capacidade de


colaborao a um escopo mais abrangente de usurios. Chard et.
al.[14] e outros pesquisadores [15][16][17] apresentam o conceito
de nuvens sociais. Elas correspondem a um modelo em que
recursos de nuvens computacionais podem ser compartilhados
com base nos relacionamentos que seus usurios possuem em
redes sociais. Desta forma, esse modelo fundamenta-se na
confiana que um usurio possui nas pessoas com que se relaciona

Abaixo so listadas as principais contribuies introduzidas por


este artigo:

103

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

e assim promove a troca de informaes de forma mais aberta,


pois considera todos os laos da rede social para o
compartilhamento.

Por outro lado, as tcnicas de deduplicao podem ser aplicadas


de forma diferentes conforme a necessidade do servio de
armazenamento. Uma das principais distines entre as tcnicas
est relacionada com a granularidade da comparao dos dados.
Nesse contexto, a deduplicao pode ser categorizada em duas
estratgias principais: a deduplicao em nvel de arquivo e
deduplicao em nvel de blocos.

No entanto, esse tipo de compartilhamento ainda se limita a um


grupo restrito de usurios. Especificamente, mesmo ampliando a
capacidade de compartilhamento por meio de laos existentes nas
redes sociais, os usurios que no se conhecem, mas que poderiam
compartilhar dados de interesses em comum entre si no so
compreendidos nesse modelo.

Na deduplicao em nvel de arquivo considera-se todo o arquivo


para identificar dados redundantes. Isto , o valor hash calculado
com base em todo o contedo do arquivo. Neste caso, no
possvel a identificao de arquivos que apenas partes similares,
mas apenas de arquivos completamente iguais.

Christin et al [18] apresenta um mecanismo de controle de acesso


que amplia a capacidade de compartilhamento compreendendo
usurios desconhecidos. O mecanismo denominado de bolhas
privadas baseia se em parmetros espao-temporais e permitem,
atravs do uso de dispositivos mveis, o compartilhamento de
dados entre usurios que estejam em um mesmo local, mas que
no possuem laos sociais. Apesar de no prever o uso de nuvens
de armazenamento em seu trabalho, a proposta pode ser estendida
para esse contexto. Em contra partida, ela est restrita ao
compartilhamento atravs do uso de dispositivos mveis.

Na deduplicao em nvel de blocos, por sua vez, o arquivo


fragmentado antes de iniciar a verificao de redundncia. Ento,
cada fragmento tem seu valor hash calculado e comparado com os
fragmentos armazenados pelo servio de armazenamento. Esta
estratgia possui maior eficincia na deteco de dados iguais,
visto que blocos iguais entre dois arquivos que apresentam
pequenas diferenas so detectados, deduplicados e apenas os
blocos diferentes do novo arquivo so enviados ao repositrio de
armazenamento.

3. DEDUPLICAO
Em nuvens de armazenamento de dados comum o acumulo de
vrios arquivos iguais na infraestrutura do servio. Por exemplo,
dois arquivos de apresentaes digitais contendo os mesmos
slides. No entanto, ao armazenar o mesmo dado, a nuvem
desperdia espao. De forma a resolver tal problema, as nuvens
utilizam-se de tcnicas de deduplicao de dados. Tais tcnicas
identificam mltiplas cpias de um arquivo e armazenam apenas
uma nica instncia no repositrio de dados[19][20].

4. O NOVO MECANISMO DE
COMPARTILHAMENTO DE DADOS EM
NUVEM
Conforme apresentado inicialmente, este artigo prope um novo
mecanismo de compartilhamento de dados para nuvens de
armazenamento. Nesta seo esta soluo detalhada.
Inicialmente, introduzida uma viso geral do mecanismo na
subseo 4.1. Na subseo seguinte so apresentadas definies
preliminares a fim de oferecer suporte ao entendimento do
mecanismo. Por fim, o funcionamento do mecanismo descrito
na Subseo 4.3.

Comparada com a compresso, a deduplicao um mecanismo


ainda mais atrativo para grandes repositrios. Isso porque
enquanto as tcnicas de compresso apenas aperfeioam o
armazenamento tratando a redundncia de informaes dentro de
um arquivo (ex. reduzindo a quantidade de bits para representar
um dado), na deduplicao esse tratamento pode ocorrer tanto
dentro de um arquivo quanto entre arquivos diferentes com
contedo igual ou similar (ex. salvando uma nica cpia de um
fragmento repetido em um ou mais arquivo). Desta forma
elevadas taxas de economia dos recursos de armazenamento
podem ser obtidas atravs da deduplicao[21][22]. Mediante esse
benefcio, ela uma tcnica bastante difundida entre os servios
de armazenamentos de dados em nuvem sendo utilizada por
servios como Dropbox [8] e outros[23][24].

4.1 Viso Geral


O compartilhamento por caixas de interesses consiste em um
mecanismo que permite usurios desconhecidos pertencentes a
um mesmo servio de armazenamento de dados em nuvem
compartilharem arquivos de interesses em comum entre si. Esse
mecanismo baseia-se na utilizao de deduplicao de dados para
a identificao de interesses em comum entre usurios. Os
usurios armazenam seus dados em estruturas denominadas de
caixas de interesses e ento os arquivos deduplicados nestas
estruturas indicam que outros usurios possuem os mesmos
arquivos. Esses usurios so, ento, identificados como
suscetveis ao compartilhamento. A partir de ento os demais
arquivos das caixas de interesses que no foram deduplicados so
sugeridos para o compartilhamento de dados.

O funcionamento de um mecanismo de duplicao pode ser


sintetizado conforme os passos a seguir:
1- Inicialmente calculado o valor hash do arquivo que ser
enviado. Esse valor representa um identificador nico do arquivo
e gerado com base no seu contedo atravs de funes de hash
criptogrfico [25].

O mecanismo realizado por meio da interao entre trs


elementos principais: uma nuvem de armazenamento, um centro
de distribuio de atributos e o conjunto de usurios do servio de
nuvem.

2- Esse valor comparado com outros valores hashs referentes


aos arquivos armazenados pelo servio de armazenamento. Esta
comparao pode ser realizada tanto pelo cliente do servio
(source based deduplication) quanto pelo provedor do servio
(target based deduplication).

A nuvem de armazenamento o servio que os usurios utilizam,


atravs de um cliente de acesso, para armazenar, compartilhar e
resgatar arquivos. O centro de distribuio de atributos consiste
em uma federao de identidade. Essas federaes so formadas a
partir de unies de organizaes que desejam compartilhar
servios entre seus usurios, como por exemplo, servios em
nuvem. As federaes de identidade gerenciam os usurios

3- Quando uma cpia encontrada, o usurio no envia o arquivo.


Ele apenas referenciado no arquivo armazenada no servidor
evitando o armazenamento de dados duplicados.

104

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

atravs de provedores de identidade (Identity Provider - IdP). Os


IdPs disponibilizam as informaes de identidade dos usurios aos
provedores de servios da federao (Service Provider - SP). Os
SPs, por sua vez, so os consumidores das credencias. Eles
permitem o acesso ao seu servio mediante credencias vlidas. No
contexto deste trabalho a nuvem de armazenamento o servio
que consome as credenciais disponibilizadas pelos IdPs e,
portanto, ela representa o SP da federao de identidade.

caixa do detentor do arquivo recebero os dados. Alm disso, o


usurio pode tornar o compartilhamento indisponvel removendo
o arquivo da caixa de interesse.
Na terceira etapa, o servio de nuvem atua na identificao de
possveis usurios receptores do compartilhamento. Para isso, ela
conta com um componente denominado de Gerenciador de Caixas
de Interesse. Esse componente responsvel por encontrar outros
usurios que possuam caixas de interesse compatveis com a caixa
do arquivo adicionado na etapa 2.

A Figura 1 apresenta estes componentes assim como uma viso


geral do fluxo de interaes entre eles.

Por fim, a nuvem promove o compartilhamento dos arquivos na


etapa 4. Ela obtm informaes de caixas de interesses em comum
interagindo com o componente gerenciador. Em seguida, ela
sugere o compartilhamento entre os usurios com base nas
informaes obtidas. O compartilhamento, por sua vez, apenas
ser efetivado mediante a aceitao do usurio receptor. Desta
forma, o receptor pode controlar quais arquivos ele recebe pelo
compartilhamento.

4.2. Definies
Nesta seo so introduzidas as principais notaes e definies
utilizadas na descrio do mecanismo na Seo 4.3.
Definio 1. (Nuvens de Armazenamento de Dados) Uma
Nuvem de Armazenamento uma 4-upla CSP = <U, F, P, R>.
Em que:
- U o conjunto de todos os usurios da nuvem, U = {1 ,
2 , , }, (1 ).

Figura 1. Viso Geral do Mecanismo de Compartilhamento de


Dados por Caixas de Interesses.

- F o conjunto de todos os arquivos armazenados na nuvem,


F = {1 , 2 , , }, (1 ).

Conforme se pode observar, as interaes ocorrem atravs de


quatro etapas principais. Essas etapas correspondem ao
funcionamento do mecanismo de compartilhamento por caixas de
interesses.

- P o conjunto de todos os diretrios existentes na nuvem,


F = {1 , 2 , , }, (1 ).

- R = {1 , 2 , , } o conjunto de todas as relaes de posse


que os usurios possuem sobre seus dados, tal que = {1 ,
2 , , } (1 ) representa a relao de posse de cada
arquivos e pasta pertencente a um usurio da nuvem. O valor
a k-sima relao de posse de (1 ). Ele
definido pelo par ( : ) e pelo par ( : ), F, P e
U.

Na primeira etapa o usurio realiza a autenticao e a obteno de


seus atributos. Neste artigo considera-se que a federao prove o
servio de identidade por meio do protocolo SAML 2.0 (Security
Assertion Markup Language) [26]. Este protocolo oferece tanto a
disponibilizao de atributos dos usurios quanto a capacidade de
autenticao nica entre domnios diferentes (Single Sing On SSO). Ele representa um dos principais protocolos suportado pelas
solues de identidade federada [27][28]. Aps esta etapa o
usurio possui acesso a nuvem de armazenamento de dados.

Acima introduzida a definio de nuvem de armazenamento


adotada neste artigo. Ela apresentada com base em quatro
elementos existentes na nuvem: um conjunto de usurios, um
conjunto de arquivos, um conjunto de diretrios e um conjunto de
relacionamentos de posse de dados. Essa notao pode ser
representada como um grafo bipartido direcionado em que um
conjunto de vrtices representa os usurios do servio e outro
conjunto distinto de vrtices representam os dados dos usurios.
As arestas do grafo representam o relacionamento de posse de
arquivos e de diretrios que os usurios possuem.

Na segunda etapa o usurio cria sua caixa de interesse.


Concretamente, essas estruturas so representadas por pastas ou
elementos semelhantes existentes em nuvens de armazenamento
de dados (ex. buckets, contineres). As caixas de interesses se
distinguem das pastas atravs da adio de metadados gerais e
especficos que as caracterizam. Os metadados gerais definem
uma pasta como uma caixa de interesse e tambm podem agregar
outras informaes a ela, como por exemplo, a data de criao e
uma descrio. Os metadados especficos so os atributos que o
usurio possui na federao. Eles so obtidos na primeira etapa
quando o usurio e interage com o servio de identidade federada.

Esta definio destaca a viso de colaborao existente nas


nuvens de armazenamento, pois apresenta um conjunto de
conexes de compartilhamento de arquivos que ocorrem quando
dois ou mais usurios esto conectados a um mesmo n. Atravs
dela possvel abstrair esses servios a partir dos principais
componentes envolvidos no mecanismo proposto.

A fim de promover o compartilhamento, o usurio dever adicionar


arquivos na caixa de interesse. Ao adicion-los, eles se tornam
disponveis para que outros usurios possam obt-los quando
identificados como potenciais receptores. Para controlar a
disponibilizao dos dados compartilhados, o usurio deve incluir
os metadados especficos da caixa de interesse. Desta
forma, apenas caixas de interesses com atributos iguais aos da

Definio 2. (Caixas de Interesses) Seja P = {1 , 2 , , } o


conjunto de diretrios existentes na nuvem CSP e seja CI o
subconjunto CI = {1 , 2 , , } CI P de todas as caixas de
interesses da nuvem. O elemento P (1 ) uma caixa

105

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

de interesse CI (1 ) se possuir os metadados gerais e


atributos como metadados especficos ( 1).

Tabela 1. Notaes dos elementos envolvidos na descrio do


mecanismo.

A Definio 2 caracteriza as estruturas definidas neste artigo


como caixas de interesses. Ela captura a noo de que essas caixas
so criadas a partir de metadados gerais e metadados especficos
definidos nelas. Esses metadados so importantes em dois
aspectos. O primeiro que eles distinguem as caixas de interesses
de outras estruturas (ex. pastas). O segundo que atravs deles o
usurio capaz de refinar o controle de acesso sob seus arquivos.

Conforme apresentado na Subseo 4.1, os atributos so


disponibilizados pelos servios de identidade federada. Considerase ento que cada usurio apresenta um conjunto de atributos
na federao. Esse conjunto representado como um vetor
que possui a forma: [1 (), 2 (), ()]. () o k-simo
atributo de (1 ). Cada atributo representado por um
par no formato <propriedade: valor>, () = < =
>. Nos casos em que um usurio possui mais de um valor
para um mesmo atributo (atributo multivalorado), considera-se um
par para cada valor, isto , < = > < =
+1 > indicam que possui os valores e +1 .

FedIDP

Portanto, para fins de exemplificao, uma caixa de interesse


de um usurio que possui o atributo conforme a Figura 2,
possui o par < = > como
metadado.

Definio 3. (Compartilhamento Baseado em Interesses em


Comum) Seja e duas caixas de interesses pertencentes a
usurios distintos. Seja CIF e CIF o conjunto de arquivos
existentes em e respectivamente. O compartilhamento
baseado em interesses em comum ocorre quando CIF CIF
. Ento, ser adicionada dos elementos CIF - CIF CIF,
e ser adicionada dos elementos CIF - CIF CIF.

CIGer

ID, Att

Credencial
acesso
atributos
usurio.

(. )

A definio acima apresenta a noo de compartilhamento


baseado em interesses em comum introduzida neste artigo. Em
outras palavras, esse tipo de compartilhamento ocorre quando os
usurios envolvidos apresentam um ou mais arquivos em comum
nas suas caixas de interesses. Satisfeita essa condio, os arquivos
distintos em ambas podem ser compartilhados com o outro
usurio.

A concepo por trs desta forma de compartilhamento que os


usurios que possuem arquivos iguais entre si, agrupam arquivos
de um mesmo assunto (ou assuntos similares) em suas caixas de
interesses. Portanto, os arquivos compartilhados podem se referi a
um interesse em comum dos usurios, isto , o interesse por um
mesmo assunto.

4.3. Funcionamento do Mecanismo


Nesta seo so descritas as etapas introduzidas na Seo 4.1.
Nelas so utilizadas notaes para o detalhamento do mecanismo.
Essas notaes so apresentadas na tabela abaixo:

106

Servio
de
identidade
federada.
Ele
disponibiliza o
IDP
da
federao.
Servio
gerenciador
caixas
interesses.

Dedup(.)

Figura 2. Exemplo de Atributo de Federao de Identidade


(Exemplo Simplificado).

Servio
de
armazenamento
de dados em
nuvem. Ele o
SP da federao.

de
de

de
e
do

Funo
de
deduplicao de
dados.
Funo
Hash
aplicada sobre o
arquivo e seus
fragmentos. Ela
pode
ser
compreendida
como funo que
gera um token
nico
que
representa
um
arquivo.
Usurio
do
servio
de
armazenamento
de dados em
nuvem (1
,
, || = ).
Caixa
de
Interesses de um
usurio

(1 ,
, || = ).

Arquivo
includo
em uma caixa de
interesse. Ele ser
fragmentado em k
partes
pelo
mecanismo
de
deduplicao para
ser armazenado em
nuvem (1 ,
, || =
)
Parte de que
ser enviada para a
nuvem, 0 k.

( )

Valor hash de .

( )

Valor hash de .

comp

selec

comp

comp

Conjunto de caixas
de interesses que
possuem
os
mesmos atributos
que ,

Conjunto de caixas
de
interesses
selecionadas
por
, selec

comp.

Conjunto de todos
os
( )
de
selec.
Conjunto
de
arquivos recebidos
atravs
do
compartilhamento
comp .

SBSC 2014 Proceedings - Ongoing Research

I.

October 6-9, 2014 - Curitiba, PR, Brazil

( ) e . Esses valores so, ento, enviados para a


nuvem CSP (Operao 3).

Etapa de Autenticao e Obteno de Atributos

A autenticao e obteno de atributos consistem na primeira


etapa do mecanismo. Nela o usurio autentica-se utilizando o
servio de identidade federada. Aps isso, ele obtm seus
atributos na federao assim como o acesso a nuvem. O
procedimento de autenticao ocorre conforme o padro adotado
pelo protocolo SAML. A Figura 3 sintetiza esta etapa:

Ao receber ( ) e , CSP verifica se esses dados j


existem na nuvem aplicando a deduplicao de dados (Operao
4). O CSP termina esta etapa enviando ( ) e ao
componente CIGer. Desta forma, este componente mantem o
controle dos arquivos existentes nas caixas de interesses da nuvem
registrando as relaes de posse daquele usurio (isto , o par
( : )).

Operao 1: CSP

Operao 2: CSP FedIDP

Caso o arquivo no seja deduplicado, o CSP apenas envia


( ) e ao componente CIGer e no realiza as etapas
seguintes. Isso porque o arquivo ainda no existe na nuvem e
portanto no existem caixas de interesses com arquivos em
comum para realizar o compartilhamento. Caso contrrio a Etapa
3 iniciada.

Operao 3: FedIDP
,

Operao 4: CSP

Figura 3. Etapa de Autenticao e Obteno de Atributos


(Resumo)
Inicialmente o usurio solicita acesso ao servio de
armazenamento de dados em nuvem CSP (Operao 1). Ento, a
nuvem redireciona o usurio para um IDP da federao para que
ele se autentique e obtenha acesso ao servio (Operao 2).
Obtendo sucesso na autenticao, o usurio recebe sua credencial
e seus atributos (Operao 3) e ento comunicasse com a nuvem
novamente para acessar seu espao de armazenamento (Operao
4).

III. Etapa de Identificao de Usurios


Na etapa de identificao de Usurios apenas o CSP e o
componente CIGer esto envolvidos. De forma geral, ela consiste
em um processamento realizado pelo CIGer para a identificao
de caixas de interesses que possuem um arquivo em comum e na
notificao da existncia dessas caixas para a nuvem.
Se CSP encontrou armazenado todos os , , 0 k

II. Etapa de Criao de Caixas de Interesses

Operao 1: CIGer procura pelas caixas de interesses


associadas a ( ) que possuam atributos iguais ao de
de .

Aps a Etapa 1, o usurio encontra-se autenticado e tambm


possui seus atributos. Nesta segunda etapa ele se comunica com o
servio de armazenamento de dados em nuvem e define
metadados em um diretrio transformando-o em um caixa de
interesse. A partir de ento, quando o usurio incluir arquivos
neste diretrio, o servio de nuvem utiliza o componente CIGer
para registrar os arquivos pertencentes a ele.

Operao 2: CIGerCSP

Figura 5. Etapa de Identificao de Usurios (Resumo)

A Figura 4 apresenta o funcionamento desta etapa.

A identificao de potenciais usurio para o compartilhamento


ocorre atravs da busca por caixas de interesses definidas por
outros usurios da nuvem. Essa busca e realizada atravs do valor
( ) (Operao 1). Ao encontra o hash do arquivo, o
componente CIGer obtm as caixas que tambm possuem o
mesmo arquivo e atributos em comum.

Operao 1: CSP

, ,

Operao 2: CSP CIGer


( ), ( )

Operao 3: CSP
Operao 4: CSP computa:
Dedup( ), , 0 k;

Isso possvel, pois, conforme apresentado na descrio das


etapas anteriores, o CIGer notificado sobre a existncia de uma
caixa de interesses toda vez que ela criada, assim como
notificado sobre arquivos que ela possui no momento em que eles
so adicionados nela.

( ),

Operao 5: CSP CIGer

Figura 4. Etapa de Criao de Caixas de Interesses (Resumo)

Tendo resgatado as caixas de interesses em comum, CIGer envia


essa informao ao CSP e ento se inicia a Etapa 4.

A etapa iniciada pelo usurio quando ele cria uma caixa de


interesses na nuvem (Operao 1). Para isso ele seleciona um
diretrio na nuvem e define seus metadados. Os metadados gerais
que podem ser definidos so nome, data de criao e descrio
para caixa de interesse. Os metadados especficos so os atributos
da federao. Em seguida, CSP informa o componente CIGer
que o usurio criou a caixa de interesse assim como os
atributos definidos nela (Operao 2). CIGer registra esses dados
para manter o conhecimento das caixas de interesses criadas.

IV. Compartilhamento de Dados


Esta consiste na ltima etapa do mecanismo. Nela o componente
CIGer notifica o servio de armazenamento em nuvem quando
encontrar caixas de interesses com arquivos em comum. A nuvem
por sua vez, notifica o usurio e, mediante seu aceite, promove o
compartilhamento de dados de uma caixa de interesse para outra.
A Figura 6 apresenta o protocolo de funcionamento desta etapa.

Aps definir uma caixa de interesse, o usurio pode seguir o


procedimento de envio de arquivos de forma idntica ao envio
para um diretrio qualquer. Devido ao mecanismo de
deduplicao da nuvem, o arquivo fragmentado em pedaos
antes de ser enviado e tambm so calculados os valores hash

Operao 1: CSP

Operao 2: CSP

Operao 3: CSP CIGer

107

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

encontre diretamente ( ). e no os valores . Desta


forma h uma maior flexibilidade na aplicao do
compartilhamento em outros cenrios, como por exemplo, outros
servios de armazenamento de dados que utilizao a
deduplicao de arquivos inteiros.

Operao 4: CIGer CSP


Operao 5:
CSP obtm para cada elemento de
a partir de cada , 1 n
a partir de cada , , 1 n

Outra considerao est relacionada com a utilizao de


federaes de identidade como centro de distribuio de atributos.
Esses servios tm sido amplamente adotados por diversas
instituies [29][30][31] e so capazes de oferecer tanto a
autenticao quanto os atributos atravs de um nico servio
diminuindo a complexidade gerenciamento de ambos.

Operao 6: CSP

Figura 6. Etapa de Compartilhamento de Dados (Resumo)

Inicialmente, o servio de nuvem realiza a Operao 1 do fluxo


acima. Esta operao refere-se a disponibilizao da lista de
caixas de interesses encontradas na Etapa III para o usurio que
adicionou um arquivo na sua caixa de interesses conforme
apresentado na Etapa II. O servio de nuvem CSP sugere as caixas
encontradas e aguarda o aceite do usurio. O usurio por sua vez,
pode aceitar apenas aquelas que desejar. Desta forma, apenas a
solicitao de compartilhamento com as caixas de interesses
aceitas por so encaminhadas para a nuvem (Operao 2).

Alm disso, a utilizao desses servios permite que a


implantao do mecanismo seja flexibilizada para nuvens com
diferentes modelos de implantao. Em outras palavras, atravs da
utilizao de federaes de identidade o mecanismo de
compartilhamento por caixas de interesses pode ser implantado
tanto no contexto de nuvens privadas e comunitrias quanto no de
nuvens pblicas.
Em nuvens privadas e comunitrias, desejvel que apenas os
usurios das organizaes envolvidas possam realizar o
compartilhamento. Neste cenrio pode se utilizar um servio de
identidade federada mantido pelas organizaes, limitando o
escopo de compartilhamento entre seus usurios. Um possvel
cenrio de aplicao nesse contexto seria a implantao do
compartilhamento por caixas de interesses em uma nuvem
comunitria de pesquisa. Os seus usurios seriam professores e
pesquisadores que armazenam suas pesquisas (ex. artigos
publicados) nas suas caixas de interesses e assim colaborariam
compartilhando-as com outros pesquisadores que pesquisam sobre
um tema em comum.

Recebendo as caixas de interesses que o usurio deseja ter


disponveis para si, o CSP realiza a Operao 3 e as encaminha
para CIGer. O componente CIGer procura as caixas de interesse
contidas na lista recebida e retorna os valores hashs dos
fragmentos referentes aos arquivos includos nelas (Operao 4).
Na Operao 5, CSP toma conhecimento do(s) arquivo(s) que
ser(m) disponibilizado(s) ao usurio encontrando os fragmentos
Ento, por fim, CSP
a partir dos valores .
disponibiliza os arquivos pertencentes as caixas de interesses
aceitadas por (Operao 6). Antes do envio dos arquivos, a
nuvem se sincroniza com o usurio (ex. comunicando-se com um
aplicativo cliente) e verifica quais arquivos j existem na caixa de
interesse dele, enviando desta forma apenas aqueles que no
existem nela.

Em contra partida, as federaes organizacionais no contemplam


o cenrio de utilizao de nuvens pblicas em que h a
necessidade de compartilhamento entre usurios do pblico em
geral. Neste caso necessrio um servio de identidade federada
pblico como centro provedor de atributos. Para atender esse
contexto, o mecanismo pode ser implantado para atuar utilizando
as redes sociais como centro provedor de atributos. Isso possvel
pois grande parte delas tambm utilizam protocolos de
autenticao federada, como o Oauth [32], para fornecer a
autorizao de acesso a recursos de seus usurios para terceiros.
Exemplificando com a rede social Facebook[5], os recursos
disponibilizados so as propriedades dos perfis de usurios [33],
tais quais sua localizao e o seu local de estudo, por exemplo.
Essas propriedades seriam os atributos que os usurios
adicionariam as suas caixas de interesses. Atravs desses novos
centros de distribuio de atributos o mecanismo amplia sua
abrangncia viabilizando o compartilhamento por interesses em
comum alm do contexto organizacional.

5. DISCUSSO INICIAL
Conforme se observa na Seo 4, o mecanismo proposto apresenta
alguns elementos essenciais para sua realizao. A nuvem de
armazenamento e a federao de identidade, em particular,
possuem papel fundamental nesse contexto, pois atuam como o
repositrio de execuo do compartilhamento e como o centro
provedor de atributos respectivamente. Desta forma, algumas
consideraes relativas ao funcionamento e ao cenrio de
implantao do mecanismo por meio desses elementos so
apresentadas nesta seo.
A primeira considerao est relacionada com a forma de
deduplicao utilizada. De acordo com o apresentado na Seo 3,
a deduplicao pode ocorrer de duas formas. No
compartilhamento por caixas de interesses considera-se a
deduplicao em nvel de blocos. Essa deciso est em
concordncia com o tipo de deduplicao que vem sendo utilizada
pelos servios de armazenamento nuvem, como o caso, por
exemplo, do Dropbox [8], e do Mozy [23]. Assim, o mecanismo
proposto possui aderncia ao contexto dos servios de nuvem
possibilitando maior facilidade de implantao em um cenrio
real, como por exemplo, atravs em uma plataforma de nuvem de
cdigo aberto.

6. CONCLUSO
Neste artigo foi proposto um novo mecanismo para o
compartilhamento de dados entre usurios desconhecidos de
servios de armazenamento de dados em nuvem. O
compartilhamento por caixas de interesses usufrui da tcnica de
deduplicao utilizada pelo provedor de nuvem e fornece a
capacidade de compartilhamento controlado de arquivos. Desta
forma, os provedores no s se beneficiam da utilizao racional
de recursos de armazenamento, como tambm podem oferecer
uma forma complementar de colaborao aos seus usurios.

Alm disso, o mecanismo pode ser facilmente adaptado para ser


executado com a abordagem de deduplicao em nvel de arquivo.
Para isso, necessrio que o mecanismo inicie a Etapa III caso

108

SBSC 2014 Proceedings - Ongoing Research

Por fim, ressalta-se que este trabalho apenas o esforo inicial de


se obter um mecanismo que viabilize o compartilhamento de
dados de forma mais ampla entre os usurios. Como trabalhos
futuros, prev-se o desenvolvimento de um prottipo do
mecanismo proposto. A partir dele, ento, a realizao de um
estudo sobre diversos aspectos, tais quais, a avaliao da eficcia
de colaborao, atravs do teste do mecanismo em um cenrio
real com um grupo de usurios, a anlise de desempenho do
mecanismo e a capacidade de estender o funcionamento do
mecanismo utilizando servios de nuvem diferentes, como por
exemplo, nuvens hbridas. Por meio deste estudo podero ser
identificadas possveis melhorias e extenses para a proposta.

7. REFERNCIAS

October 6-9, 2014 - Curitiba, PR, Brazil

[13] Kolouzis S., Cuching R., Bellloum A. e Bubak, M., Cloud


Federation for Sharinh Scientific Data,, 8th International
eScience 2012 Conference on, 2012.
[14] K. Chard, K. Bubendorfer, S. Caton e O. F. Rana, Social
Cloud Computing: A Vision for Socially Motivated Resource
Sharing, Services Computing, IEEE Transactions on, pp.
551 - 563, 2012.
[15] Thaufeeg A. M., Bubendorfer K. e Chard K., Collaborative
eResearch in a Social Cloud, E-Science (e-Science), 2011
IEEE 7th International Conference on, pp. 224 - 231, 2011.
[16] John K., Bubendorfer K. e Chard K., A Social Cloud for
Public eResearch, E-Science (e-Science), 2011 IEEE 7th
International Conference on, pp. 363 - 370, 2011.

[1]

Borgmann M., Hahn T., Herfert M., Kunz T., Richter M.,
Viebeg U. e Vowe S., On the Security of Cloud Storage
Services,
2012.
[Online].
Available:
https://www.sit.fraunhofer.de/fileadmin/dokumente/studienund
_technical_reports/Cloud-Storage-Security_a4.pdf.
[Acesso
em abril 2014].

[2]

Mell. P. e Grance. T., The NIST Definition of Cloud


Computing,
2011.
[Online].
Available:
http://csrc.nist.gov/publications/nistpubs/800-145/SP800145.pdf.

[3]

Overview of Managing Access - Amazon S3, [Online].


Available:
http://docs.aws.amazon.com/AmazonS3/latest/dev/accesscontrol-overview.html. [Acesso em abril 2014].

[19] C. Bo, Z. F. Li e W. Can, Research on Chunking


Algorithms of Data De-duplication, Proceedings of the
2012 International Conference on Communication,
Electronics and Automation Engineering, pp. 1019-1025,
2013.

[4]

Role Based Access Control - Rackspace Cloud Files,


[Online].
Available:
http://docs.rackspace.com/files/api/v1/cfdevguide/content/RBAC.html. [Acesso em abril 2014].

[20] D. Mishra e S. Sharma, Comprehensive study of data deduplication, International Conference on Cloud, Big Data
and Trust 2013, 2013.

[5]

Facebook, [Online]. Available: http://www.facebook.com.


[Acesso em agosto 2014].

[6]

ResearchGate,
[Online].
Available:
http://www.researchgate.net/. [Acesso em agosto 2014].

[7]

Academia.edu, [Online]. Available: http://academia.edu.


[Acesso em agosto 2014].

[8]

Dropbox, [Online]. Available: http://www.dropbox.com.


[Acesso em abril 2014].

[9]

Box, [Online]. Available: http://www.box.com. [Acesso


em abril 2014].

[10] Google Drive, [Online]. Available: drive.google.com.


[Acesso em abril 2014].
[11] Diniz, T. F.S., Silva, C. E. e Araujo R., Integrando o
Openstack Keystone com Federaes de Identidade,
Simpsio Brasileiro em Segurana da Informao e Sistemas
Computacionais, pp. 465-474 , 2013.
[12] Silva L., Silva F., Araujo R., Diniz, T. F.S. e Silva, C. E.,
Estudo de Caso: Integrao de Clientes de Nuvem
Openstack Swift com Federao de Identidade, Simpsio
Brasileiro em Segurana da Informao e Sistemas
Computacionais, pp. 455-464 , 2013.

[17] Punceva M., Rodero I., Parashar M., Rana O. F. e Petri I.,
Incentivising Resource Sharing in Social Clouds, Enabling
Technologies: Infrastructure for Collaborative Enterprises
(WETICE), 2012 IEEE 21st International Workshop on, pp.
185 - 190, 2012.
[18] Christin D., Lpez P. S., Reinhardt A. e Hollick M., Share
with strangers: Privacy bubbles as user centered privacy
control for mobile content sharing applications, Information
Security Technical Report, p. 105116, 2013.

[21] D. Meister, J. Kaiser, A. Brinkmann, T. Cortes, M. Kuhn e


J. Kunkel, A study on data deduplication in HPC storage
systems, High Performance Computing, Networking,
Storage and Analysis (SC), 2012 International Conference
for, pp. 1-11, 2012.
[22] K. Jin e E. L. Miller, The Effectiveness of Deduplication
on Virtual Machine Disk Images, SYSTOR '09
Proceedings of SYSTOR 2009: The Israeli Experimental
Systems Conference, 2009.
[23] Mozy [Online]. Available: https://mozy.com/. [Acesso
em abril 2014].
[24] Memopal
[Online].
Avaiable:
http://www.memopal.com/pt-br/. [Acesso em abril 2014]
[25] Secure
Hash
Standart.
[Online]
Available:
http://csrc.nist.gov/publications/fips/fips180-4/fips-1804.pdf [Acesso em abril 2014]
[26] SAML
Especifications,
[Online].
Available:
http://saml.xml.org/saml-specifications. [Acesso em abril
2014].
[27] CAS
Federation,
[Online].
Available:
http://www.uky.edu/ukit/iog/cas. [Acesso em abril 2014].
[28] Shibbolleth, [Online]. Available: https://shibboleth.net/.
[Acesso em abril 2014].

109

SBSC 2014 Proceedings - Ongoing Research

[29] CAFe - Comunidade Acadmica Federada [Online].


Available: https://portal.rnp.br/web/servicos/cafe. [Acesso
em abril 2014].
[30] CANARIE - Canadian Access Federation, [Online].
Available: http://www.canarie.ca/en/caf/join. [Acesso em
abril 2014].

October 6-9, 2014 - Curitiba, PR, Brazil

[32] Hardt D. The Oauth Autorization Framework. Available:


http://tools.ietf.org/html/rfc6749 [Acesso em abril 2014].
[33] Facebook Graph API Reference User. [Online] Available:
https://developers.facebook.com/docs/graphapi/reference/v2.0/user[Acesso em abril 2014]

[31] InCommon
Federation,
[Online].
Available:
http://www.incommonfederation.org/. [Acesso em abril
2014].

110

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Usando Pesquisa-ao no Desenvolvimento de um


Sistema Colaborativo para Tratamento Multidisciplinar na
Rede do SUS
Luciana Pereira de
Arajo

Carla Diacui Medeiros


Berkenbrock

Departamento de Cincia da
Computao Universidade
do Estado de Santa Catarina
(UDESC)

Departamento de Cincia da
Computao Universidade
do Estado de Santa Catarina
(UDESC)

luciana.pda@gmail.com

Mauro Marcelo Mattos


Lab. de Desenvolvimento e
Transferncia de Tecnologias
(LDTT) Universidade
Regional de Blumenau
(FURB)

carla.berkenbrock@udesc.br

ABSTRACT

mattos@furb.br

ves da articulaca
o dos trabalhos especializados. Esta atuaca
o conjunta ocorre atraves de reuni
oes peri
odicas sobre um
plano terapeutico criado para o paciente. Nesse plano os
profissionais anotam os cuidados que est
ao sendo prestados
ao paciente [2].

This paper presents the research performed during the construction of a collaborative system to improve the communication between multidisciplinary care teams of public health
at Blumenau city. Participatory design techniques are used
in the system project in order to involve the users in the
development of a multidisciplinary treatment module. This
paper also uses the action research method to expand the
scientific knowledge based on a local problem. The results
show that users interaction provides improvements in the
system design.

Conforme Matumoto (2004) [3], a constituica


o de uma equipe
de sa
ude n
ao se estabelece somente pela alocaca
o de trabalhadores de diferentes categorias atuando em um u
nico espaco. Essa equipe tambem e constituta da promoca
o de
canais de interaca
o constantes para a realizaca
o de tarefas
assistenciais, do atendimento integral, da reconstruca
o dos
modos de lidar com os saberes e disciplinas necess
arias para
o atendimento em sa
ude.

RESUMO
O artigo apresenta a pesquisa realizada durante a construc
ao de um sistema colaborativo para melhorar a comunicac
ao entre equipes de tratamento multidisciplinar na a
rea da
sa
ude na cidade de Blumenau. Foram utilizadas tecnicas do
design participativo com o objetivo de envolver usu
arios e
projetistas durante o projeto de um m
odulo de tratamento
multidisciplinar. O artigo tambem utiliza a pesquisa-aca
o
como metodo para ampliar o conhecimento cientfico com
base em um problema local. Os resultados mostram que a
interaca
o entre os usu
arios a partir do design participativo
permitiu melhorias durante o projeto do sistema.

Existem equipes normalmente voltadas a um problema especfico ou a uma determinada faixa et


aria, tais como grupo de
acompanhamento a diabeticos ou grupo de atenc
ao ao idoso.
Contudo, devido a
`s limitac
oes na infraestrutura de TI, cada
profissional precisa anotar as aco
es tomadas, bem como a
previs
ao de aco
es futuras a serem aplicadas ao paciente, para
posteriormente conversar com a equipe durante os encontros
peri
odicos. Eventualmente podem ocorrer encontros casuais
que propiciam a troca de informaco
es informalmente.

Conforme Peduzzi (2001) [1], a proposta do trabalho em


equipe tem sido veiculada como estrategia para enfrentar o
intenso processo de especializaca
o na a
rea da sa
ude.

Desde meados de 2011, Blumenau vem investindo na construca


o de um sistema de gest
ao de sa
ude p
ublica, denominado PRONTO. Esse sistema tem por objetivo viabilizar
um atendimento de melhor qualidade no contexto do Sis
tema Unico
de Sa
ude.

Neste contexto, Tratamento Multidisciplinar (TM) e o atendimento prestado a um paciente por uma equipe de agentes
de diferentes a
reas profissionais que realizam m
ultiplas intervenco
es tecnicas, bem como atuam conjuntamente atra-

Um dos objetivos deste trabalho e apresentar o projeto do


sistema colaborativo com suporte ao atendimento multidisciplinar baseado em design participativo que est
a em desenvolvimento no escopo do projeto PRONTO.

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

A tecnica de design participativo possibilita que os profissionais da sa


ude que utilizar
ao o sistema possam opinar durante
o processo de construca
o do mesmo, permitindo que as funcionalidades necess
arias para a realizaca
o de suas atividades
estejam abrangidas no sistema. Apesar de ser um tipo de
metodo j
a consolidado para sistemas interativos monousu
arios, ainda n
ao existem subsdios suficientes para afirmar se o
metodo e eficiente para sistemas colaborativos. Dessa forma,

1.

INTRODUO

111

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

com agentes de sa
ude em sistemas de sa
ude na India. Esses sistemas utilizaram o design participativo durante sua
concepca
o, mas n
ao obtiveram sucesso. Conforme o estudo
realizado, o problema da utilizaca
o do design participativo
na construca
o desses sistemas foi a forma com que a tecnica
foi aplicada. Para os autores, ao utilizar o design participativo, devem ser inseridos no contexto usu
arios que realmente
utilizar
ao o sistema e estes devem ser designers do projeto,
ou pelo menos, auxiliar fortemente no design da aplicaca
o.
Alem disso, esses participantes devem conhecer de tecnologia de informaca
o, ou serem apresentados ao contexto a ser
estudado. Devem saber o que a populaca
o que utilizar
a o
sistema precisa, bem como conhecer os problemas reais j
a
existentes.

outro objetivo do trabalho e verificar se o design participativo contribui para se projetar um sistema colaborativo,
buscando sua consolidaca
o nessa a
rea.
Para a construca
o e avaliaca
o da pesquisa foi utilizado o metodo de pesquisa-aca
o que busca resolver um problema local
a fim de promover o crescimento cientfico. Dessa forma, o
trabalho usa a pesquisa-aca
o como um metodo ainda novo
na construca
o de sistemas colaborativos.
O artigo est
a organizado da seguinte forma. A seca
o 2 apresenta trabalhos relacionados com a pesquisa. A seca
o 3 apresenta o contexto do projeto. A sec
ao 4 apresenta o design
participativo. Na seca
o 5 e apresentada a pesquisa-aca
o bem
como os ciclos de pesquisa realizados. A sec
ao 6 mostra os
requisitos elencados durante os ciclos de pesquisa. Por fim,
a seca
o 7 apresenta as conclus
oes.

2.

Os trabalhos apresentados utilizam o design participativo


para sua construca
o. Dois deles apresentam resultados positivos para a construca
o do sistema colaborativo, porem o
u
ltimo trabalho apresentado mostra que a utilizaca
o incorreta do design participativo na construca
o de um sistema
colaborativo pode n
ao trazer bons resultados. Sendo assim,
o presente estudo busca assegurar que o design participativo
pode ser utilizado para o desenvolvimento do sistema colaborativo seguindo as regras estabelecidas pelo uso do design.

TRABALHOS RELACIONADOS

Para o desenvolvimento da pesquisa foram estudados trabalhos que envolveram o design participativo durante sua
construca
o. S
ao investigados sistemas voltados para a sa
ude,
bem como sistemas que proporcionam o trabalho em grupo.
Hwang, Truong & Mihailidis (2012) [4] apresentam um sistema para auxiliar idosos com demencia a realizar suas atividades de forma independente. Para a construc
ao do sistema,
o design participativo foi utilizado com uma equipe de seis
idosos com demencia em duas fases de design. Na primeira
fase os autores realizaram duas seco
es de design participativo com o mesmo grupo. As seco
es ocorreram com um
intervalo de seis meses. A primeira teve por objetivo passar
o entendimento do projeto para os participantes e permitir
que eles dessem sua opini
ao. J
a a segunda sess
ao teve como
objetivo capturar a opini
ao dos participantes com relaca
o
ao design da ferramenta, bem como saber sua opini
ao. As
duas seco
es usaram reuni
ao, vdeo e gravaca
o de a
udio para
uma avaliaca
o posterior. Na segunda fase do design participativo foi realizada uma avaliaca
o de usabilidade sobre
o prot
otipo apresentado com os mesmos participantes. Os
autores concluem que o design participativo obteve sucesso
para o desenvolvimento do sistema e que os participantes
se sentiram entusiasmados em participar da construca
o e de
utilizar o sistema posteriormente.

3.

O CONTEXTO DO PROJETO

O sistema PRONTO foi desenvolvido atraves de um convenio de cooperaca


o entre a Prefeitura Municipal de Blumenau
(PMB) e a Universidade Regional de Blumenau (FURB),
atraves do Laborat
orio de Desenvolvimento e Transferencia
de Tecnologia (LDTT).
O PRONTO e um sistema transversal de gest
ao de sa
ude
p
ublica que permite aos gestores a tomada de decis
oes suportadas por informaco
es em tempo real atualizadas, ao mesmo
tempo em que viabiliza a otimizaca
o dos processos de atendimento ao cidad
ao. Ele e um sistema web que busca preencher as lacunas informacionais identificadas em CONASS

(2011) [7] implementando o conceito de Prontu


ario Unico
do
Paciente (PUP). O sistema tambem visa minimizar a quantidade de atendimento nas unidades avancadas de sa
ude e
hospitais de media e alta complexidade.
Atualmente, o sistema est
a implantado em 17 unidades da
rede abrangendo 10 unidades de Estrategia de Sa
ude da Famlia (ESF), 7 farm
acias dos Ambulat
orios Gerais, a farm
acia da Policlnica, o SAS e o Centro de Testagem e Aconselhamento (CTA). O m
odulo de vacinaca
o encontra-se em
fase de homologaca
o (Vigil
ancia Epidemiol
ogica) e a integraca
o com resultados de exames laboratoriais fornecidos
por laborat
orios conveniados na rede de atenca
o b
asica de
Blumenau.

Castela et al. (2013) [5] apresentam o desenvolvimento e


avaliaca
o de uma interface para um sistema de escalonamento. Para a realizaca
o do sistema foi proposto um metodo colaborativo de atualizaca
o din
amica do modelo de neg
ocios. Nesse metodo, os atores organizacionais envolvidos
no processo da construca
o do sistema monitoraram de forma
contnua as atividades desenvolvidas, bem como atualizaram
constantemente a representaca
o gr
afica do sistema no modelo de neg
ocios. Conforme as sugest
oes dos envolvidos e as
anotaco
es realizadas por eles, o sistema pode ser atualizado
gerando novas vers
oes do modelo de neg
ocios. Ao termino
dos estudos, os autores concluem que os atores envolvidos
conseguiram identificar alteraco
es no decorrer do desenvolvimento do projeto. Dessa forma, o metodo colaborativo na
construca
o do sistema foi eficiente e pode permitir a inserca
o
direta dos usu
arios na validaca
o do modelo.

Ate marco/2014, o m
odulo de farm
acia registrou mais de
70 mil usu
arios, tendo processado mais de 300 mil receitas
medicas; e o m
odulo de ESF registrou mais de 5000 consultas
medicas e odontol
ogicas [8].
O M
odulo de Tratamento Multidisciplinar (MTM), objeto
deste trabalho, est
a sendo integrado no sistema PRONTO.
O m
odulo tem a intenca
o de permitir que os grupos multidisciplinares possam interagir e colaborar independente do
espaco geogr
afico e do tempo.

Mushtaq & Hall (2009) [6] apresentam um estudo realizado

112

SBSC 2014 Proceedings - Ongoing Research

4.

October 6-9, 2014 - Curitiba, PR, Brazil

DESIGN PARTICIPATIVO

definir com base na avaliac


ao se o problema foi solucionado
ou n
ao. Caso tenha sido solucionado, o ciclo e finalizado;
caso contr
ario, volta-se a
` etapa diagnosticar. As etapas s
ao
realizadas em conjunto pelo pesquisador e pelas pessoas envolvidas de forma colaborativa.

O design participativo e um metodo utilizado para construir


e avaliar o design de sistemas interativos [9]. Para a definic
ao do design s
ao realizadas reuni
oes com os usu
arios que
utilizar
ao o sistema e que conhecem o problema em quest
ao
[10]. Esses usu
arios normalmente s
ao pessoas que j
a entendem os problemas relacionados com as atividades a serem
modeladas, pois trabalham nelas de forma manual ou por
meio de um sistema antigo. E, no design participativo, essas
pessoas devem ser consideradas parte da equipe de design e
s
ao convidadas a darem sua opini
ao e sugest
oes sobre o projeto do sistema [11]. Existem v
arias tecnicas que podem
ser utilizadas durante as reuni
oes, como: prototipaca
o com
componentes de interface, sequencia de tarefas e reflex
oes.

5.1

Ate o presente momento foram realizados dois ciclos de pesquisa-aca


o em um tempo de seis meses. O primeiro ciclo teve
por objetivo definir os requisitos e modelar as telas do MTM.
E o segundo ciclo teve por objetivo validar a construca
o das
telas realizadas. Esta sec
ao apresenta cada um dos ciclos,
separadamente com suas etapas: diagnosticar, planejar, intervir, avaliar e refletir. Os requisitos elencados na etapa
2 (planejar) e 5 (refletir) s
ao apresentados em conjunto, na
seca
o 6.

Para o projeto do MTM, o design participativo e utilizado


com uma equipe do SUS de tratamento multidisciplinar com
foco em cuidados na sa
ude do idoso. Essa equipe j
a realiza o
trabalho multidisciplinar que envolve os cuidados de idosos
com demencia em uma equipe formada por dez profissionais
da sa
ude de
areas distintas. Esses profissionais ainda n
ao
utilizam um sistema informatizado para a realizac
ao do tratamento, mas sabem como o fluxo de trabalho funciona, pois
realizam essa atividade todos os dias de forma manual. A
aplicaca
o do design participativo com a equipe escolhida e
apresentada nos ciclos de pesquisa-aca
o das pr
oximas sec
oes.

5.

Ciclos da pesquisa-ao realizada

Nesta pesquisa foi investigada a forma com que os profissionais da sa


ude se relacionam em um tratamento multidisciplinar para atender seu paciente, com o objetivo de promover
um ambiente informatizado para que eles possam se comunicar e realizar suas atividades colaborativas.

5.1.1

Primeiro ciclo da pesquisa-ao

Esta seca
o apresenta cada uma das etapas do primeiro ciclo
da pesquisa-aca
o. A Tabela 1 apresenta de forma reduzida
o que ser
a encontrado em cada uma das etapas. O diagn
ostico envolveu levantamento bibliogr
afico e conversa com
assistente social. No planejamento foram elencados requisitos. Na intervenc
ao foi construdo um modelo do design
do MTM. Posteriormente a avaliaca
o, o design foi analisado
pela equipe multidisciplinar de atenca
o ao idoso. E, finalmente, na reflex
ao decidiu-se realizar um novo ciclo que e
apresentado na sec
ao 5.1.2.

PESQUISA-AO COMO MTODO DE


PESQUISA

A pesquisa-aca
o e um metodo de pesquisa que tem o objetivo de ampliar os conhecimentos cientficos a partir de uma
pesquisa e promover a melhoria em uma organizac
ao ou comunidade de onde a pesquisa est
a sendo realizada a partir
de uma aca
o [12].
Na pesquisa-aca
o o pesquisador e envolvido no contexto a ser
pesquisado, sendo tambem atuante no meio a ser modificado.
Assim, ele possui dois objetivos: pesquisar para ampliar o
conhecimento cientfico e aca
o para promover melhorias no
ambiente em que a pesquisa est
a sendo realizada [13].

Table 1: Estrutura do ciclo de


Diagnosticar Planejar
Intervir
Literatura
LevantaDesign
Assist.
mento de
do
Social
Requisitos MTM

pesquisa-a
c
ao
Avaliar
Refletir
Equipe de Novo
atenc
ao
ciclo
ao idoso

Etapa 1 (Diagnosticar): A revis


ao da literatura feita pelo
pesquisador aponta o problema da falta de comunicaca
o entre os profissionais de sa
ude em tratamentos multidisciplinares. Conforme o diagn
ostico feito pelo pesquisador, o problema ocorre devido a
` falta de comunicac
ao entre os profissionais da sa
ude e o desenvolvedor, bem como pelos sistemas
utilizados n
ao conterem funcionalidades que permitam essa
comunicaca
o [16]. Para afirmar a existencia desse problema
foi conversado com uma assistente social que trabalha de
forma multidiscilpinar em sua a
rea e com o coordenador de
implantaca
o do sistema PRONTO. Ap
os a conversa com os
participantes foi possvel identificar e entender os problemas
de comunicaca
o existentes entre os profissionais que est
ao em
uma u
nica unidade de sa
ude, ou em unidades de sa
ude diferentes. Conforme os participantes, nos tratamentos multidisciplinares nos quais a comunicaca
o e prejudicada, o tempo
do tratamento com o paciente e maior do que naqueles em
que a comunicaca
o e facilitada.

A pesquisa-aca
o envolve ciclos de pesquisa, nos quais s
ao
adquiridos ou confrontados novos conhecimentos, ideias e
pontos de vista. Os ciclos s
ao iterativos e envolvem a participaca
o dos interessados para refinar a soluca
o e aumentar o rigor cientfico [14, 13]. Existem v
arios ciclos para a
pesquisa-aca
o. Para esta pesquisa foi escolhido o ciclo que
possui 5 etapas, detalhado por Davison, Martines e Kock
(2004) [15]. Conforme afirma Filippo (2011), esse ciclo e
bem reportado na literatura da a
rea. Ap
os a realizaca
o do
ciclo, pode-se iniciar um novo ciclo ou dar a pesquisa por
finalizada quando a soluca
o encontrada for satisfat
oria ou
quando, por qualquer motivo, a pesquisa tiver que ser interrompida.
As etapas que comp
oem o ciclo s
ao: diagnosticar, planejar
aca
o, intervir, avaliar e refletir. A etapa de diagnosticar
procura o problema a ser trabalhado. A etapa planejar aca
o
define o que ser
a feito para solucionar o problema. Em intervir, e aplicado o que foi planejado na busca da soluca
o.
Na etapa avaliar deve ser feito um estudo para verificar se o
problema foi solucionado. Por fim, a etapa de refletir busca

Etapa 2 (Planejar aca


o): Depois de identificar e entender
o problema em quest
ao foram planejadas as aco
es a serem

113

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

tomadas. Para elencar os Requisitos Funcionais (RF) relacionados com o MTM foram pesquisados sistemas disponveis
na literatura, bem como foi realizada uma reuni
ao com os
participantes da etapa 1. Durante a conversa, a assistente
social descreveu as atividades realizadas em conjunto com as
unidades de sa
ude, Ambulat
orios Gerais (AGs) e o Sistema

Unico
de Assistencia Social (SUAS) de Blumenau. A partir
da conversa e dos dados coletados na literatura foi possvel
entender como funciona a colaboraca
o entre os profissionais
de sa
ude durante o tratamento de um caso multidisciplinar. Dessa forma, podem-se elencar os RFs apresentados
na seca
o 6. Como resultado da etapa tambem se obteve
os dados a serem coletados. Dessa forma, antes da intervenca
o dever
ao ser coletadas informaco
es de percepca
o dos
usu
arios com relaca
o ao seu trabalho multidisciplinar atual.
Durante a intervenca
o, o design do MTM dever
a ser avaliado
com as tecnicas do design participativo. Na implementaca
o,
a avaliaca
o utilizar
a tecnicas do design baseado em cen
arios, coletando assim as informaco
es a respeito das funco
es,
nomenclaturas e atividades que ainda devem ser alteradas
ou adicionadas. E, ap
os a intervenca
o dever
ao ser coletadas as informaco
es de percepca
o do usu
ario com relaca
o ao
novo sistema implantado. Os participantes, em todas as
etapas, devem ser grupos de profissionais que trabalham de
forma colaborativa e que futuramente, utilizar
ao o sistema
PRONTO com o m
odulo multidisciplinar. Os dados coletados ser
ao tanto qualitativos como quantitativos e ser
ao
realizados a partir de question
arios que medem a colaborac
ao de uma equipe multidisciplinar, bem como a partir de
conversas registradas.

cartolina com a sequencia das atividades a serem realizadas,


conforme a tecnica CARD [9], para que se tivesse uma vis
ao
macrosc
opica da soluca
o apresentada. Tambem foi utilizada
a tecnica PICTIVE [9] para que se tivesse uma vis
ao microsc
opica dos problemas em quest
ao.
Os participantes inicialmente apresentaram-se e contaram a
respeito de suas atividades dentro do grupo multidisciplinar. Em seguida, o design foi apresentado a eles. Durante a
reuni
ao, os participantes realizaram perguntas e explicaram
melhor a respeito do funcionamento do tratamento.
A equipe identificou alguns equvocos na modelagem do design, como por exemplo, ter que fornecer informaca
o sobre
o problema que o paciente possui antes dele ser consultado.
Outro problema no design est
a relacionado com a necessidade de indicaca
o de cada um dos membros de uma equipe
multidisciplinar a cada tratamento. De acordo com os participantes, normalmente essa equipe e a mesma. Desta forma,
uma alternativa sugerida por eles e a criaca
o de um grupo
multidiciplinar. Assim, ao atender um paciente este grupo
e relacionado a ele. Os profissionais tambem sentiram falta
de um espaco para a construca
o do planejamento do tratamento multidisciplinar. Esse planejamento e o centro do tratamento e deve ser feito para cada paciente que for atendido
pelo grupo. Por fim, sugeriram mudancas no layout da aplicaca
o e recomendaram que o sistema multidisciplinar n
ao
estivesse em um m
odulo separado, como o planejado, mas
sim, fosse uma interaca
o durante o pr
oprio atendimento do
paciente. Apesar das sugest
oes realizadas, os participantes
ficaram entusiasmados com o sistema a ser desenvolvido, e
mostraram querer colaborar com a equipe de design. Dessa
forma, nessa etapa foi observado que os problemas de comunicaca
o dentro do sistema n
ao seriam resolvidos com o
design apresentado.

Etapa 3 (Intervir): Nessa etapa foi construdo o design do


MTM com base nas conversas realizadas nas etapas anteriores. O design inicial do sistema foi realizado com base nos
requisitos elencados. Ele visa permitir o trabalho colaborativo necess
ario para a realizaca
o do tratamento multidisciplinar. Para a realizaca
o do design foram utilizadas tecnicas
de usabilidade de interface conforme Vora [17]. E o desenho
foi realizado utilizando a ferramenta web Balsamiq [18] no
modo demonstraca
o. O design realizado nessa etapa pode
ser visto em Araujo et al. (2014) [19].

Etapa 5 (Refletir): Com os resultados obtidos na etapa anterior foi decidido junto com a nova equipe de participantes
remodelar o design com base nas informaco
es coletadas. Ate
o momento, obteve-se como conhecimento cientfico como e
o funcionamento de um sistema multidisciplinar e, que o design participativo consegue identificar falhas em um sistema
colaborativo durante a fase de design. Nessa etapa tambem
houve o levantamento dos requisitos para a realizaca
o de um
sistema colaborativo que permite o tratamento multidisciplinar. Esses requisitos s
ao apresentados separadamente na
seca
o 6.

Para a avaliaca
o do design realizado foi realizada uma reuni
ao com uma equipe multidisciplinar utilizando tecnicas do
design participativo. Essa reuni
ao foi gravada para que fosse
possvel a realizaca
o do backtracking para posterior an
alise
das informaco
es. A equipe foi indicada pelos participantes
iniciais, pois e uma equipe multidisciplinar do SUS de Blumenau que necessita ampliar seus metodos de comunicaca
o
e colaboraca
o a fim de aprimorar o atendimento de seus pacientes.

Nesse ciclo foi percebido que alguns dos requisitos voltados


para a colaboraca
o puderam ser alcancados a partir do projeto apresentado para os profissionais de sa
ude. Alguns desses requisitos foram: troca de mensagens entre profissionais
a partir da tela de chat, comunicaca
o sobre os atendimentos
e procedimentos realizados com o paciente e visualizaca
o do
estado (em aberto, em andamento ou concludo) do procedimento a ser realizado.

Etapa 4 (Avaliar): O design foi avaliado a partir das tecnicas do design participativo com uma equipe multidisciplinar
do centro de atenc
ao ao idoso. A equipe escolhida trabalha diariamente com o tratamento multidisciplinar, porem
sem a utilizaca
o de um sistema, e futuramente utilizar
a o
sistema PRONTO. O design participativo envolveu apenas
uma sess
ao e participaram da reuni
ao os seguintes profissionais: medico, enfermeira, fisioterapeuta, nutricionista, assistente social, fonoaudi
ologa, dentista, tecnica em enfermagem, tecnico de sa
ude bucal e terapeuta ocupacional. Os
desenhos das telas do MTM foram apresentados em uma

5.1.2

Segundo ciclo da pesquisa-ao

Ap
os a finalizaca
o do primeiro ciclo, iniciou-se o segundo
ciclo da pesquisa-aca
o. Esta seca
o apresenta cada uma das
etapas do segundo ciclo. A Tabela 2 apresenta de forma
reduzida o que ser
a encontrado em cada uma das etapas
do segundo ciclo. O diagn
ostico manteve-se igual ao utili-

114

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

zado no primeiro ciclo. No planejamento foram alterados


alguns requisitos. Na intervenca
o foi reconstrudo o modelo
do design do MTM. Posteriormente na avaliaca
o o design foi
analisado pela mesma equipe multidisciplinar de atenca
o ao
idoso. E finalmente, na reflex
ao decidiu-se realizar um novo
ciclo que ainda n
ao foi realizado.
Table 2: Estrutura da segunda etapa de pesquisaa
c
ao
Diagnosticar Planejar
Intervir
Avaliar
Refletir
Mantido
Alteraca
o Redesign Equipe de Novo
diagn
ostico
de
do
atenca
o
ciclo
RFs
MTM
ao idoso
Etapa 1 (diagnosticar): A partir da identificaca
o de que
ainda h
a falhas no design do MTM, decidiu-se que no segundo ciclo ser
a mantido o foco no design da aplicac
ao. Essa
decis
ao foi tomada considerando a necessidade de que o sistema esteja com suas funcionalidades definidas antes de ser
desenvolvido.
Etapa 2 (planejar aca
o): Ap
os analisar os resultados do primeiro ciclo e diagnosticar os problemas ainda existentes,
decidiu-se alterar alguns dos RFs j
a estabelecidos e adicionar outros. Esses RFs se encontram na seca
o 6. Ap
os essa
alteraca
o, decidiu-se que o novo design dever
a atingir os novos RFs, bem como os que n
ao foram alterados. Ap
os o
redesign, o novo design ser
a avaliado pela equipe do Centro de Sa
ude do Idoso (CSI) que tambem avaliou o primeiro
design. Nesta etapa tambem foi decidido aplicar um question
ario para avaliar o trabalho em equipe e o tratamento
multidisciplinar em grupos que ainda n
ao utilizam sistemas.
Esse question
ario tem a proposta de permitir a comparac
ao posterior entre o tratamento sem e com o sistema, a fim
de verificar se o tratamento com a utilizaca
o do sistema proporcionou melhorias no atendimento e nos cuidados a
` sa
ude.
Alem disso, eles tem por finalidade auxiliar na modelagem
das telas, pois firmam alguns dos requisitios j
a elencados.
O primeiro question
ario foi construdo com base no question
ario Collaborative Leadership: Self-Assessment Questionnaires [20] e o segundo com base em Multidisciplinary
Treatment Planning Questionnaire [21].

da consulta, o profissional pertencente ao grupo ter


a acesso
ao chat e aos coment
arios nos agendamentos e prescrico
es.
Caso o profissional atender o paciente que est
a dentro de
um grupo multidisciplinar, porem o profissional n
ao fizer
parte de seu grupo, poder
a solicitar ao respons
avel pelo tratamento a participaca
o no caso. O respons
avel pode aceitar
ou n
ao a participaca
o do novo profissional. Ainda na tela
de atendimento, quando o profissional e o participante atendido pertencerem a um grupo ser
a exibido o bot
ao planejamento do tratamento multidisciplinar. Para a construca
o
dessa janela, primeiro foi estudado o que e o planejamento de
um tratamento multidisciplinar. Verificou-se que o planejamento de um tratamento multidisciplinar e a forma com que
os profissionais v
ao tratar o paciente do incio ao fim, contendo tambem os resultados esperados em cada etapa [22].
Logo, para a construca
o do plano foi proposto no design que,
conforme o profissional atender o paciente, e gerado uma tabela com as doencas e problemas encontrados. Assim, essa
tabela e gerada por paciente uma u
nica vez dentro do tratamento. Nessa tabela os profissionais poder
ao definir uma
meta para o problema, ou seja, o que pretendem resolver,
bem como a aca
o a ser tomada para resolve-lo. Para cada
problema deve tambem existir o estado (finalizado, em andamento, em aberto) e o profissional que est
a acompanhando
o problema com maiores detalhes. Essas definico
es s
ao feitas durante as reuni
oes de equipe que poder
ao passar a ser
realizadas no mesmo ambiente ou a
` dist
ancia por meio do
chat. Como o planejamento do tratamento multidisciplinar
pode ser alterado de acordo com a evoluca
o ou regress
ao do
paciente, ser
a permitido que sejam acrescentados dados nas
informaco
es definidas. Porem, as informac
oes anteriores n
ao
podem ser removidas para que se mantenha um hist
orico.
Etapa 4 (Avaliaca
o): Nessa etapa foi conversado com a
mesma equipe multidisciplinar do centro de atenca
o ao idoso,
novamente utilizando as tecnicas do design participativo.
Para a apresentaca
o do prot
otipo foi apresentado o sistema
PRONTO e realizado os coment
arios sobre as inovaco
es na
tela de atendimento que permitir
ao a realizaca
o do tratamento multidisciplinar. Desta vez, algumas telas foram prototipadas com a utilizaca
o do Microsoft PowerPoint 2010.
Durante os coment
arios foram mencionados todos os itens
elencados na Etapa 3. Os membros da equipe se mostraram
satisfeitos com esse novo design apresentado e concordaram
com as alteraco
es relacionadas com o tratamento multidisciplinar. Porem, com relaca
o ao planejamento do tratamento
multidisciplinar, sugeriram poder acrescentar e remover problemas alem dos pre-estabelecidos durante as consultas com
os pacientes. Isso porque afirmaram que nem todos os problemas encontrados s
ao colocados no plano de tratamento.

Etapa 3 (intervenca
o): Nessa etapa foi realizado o novo design com base nas informaco
es coletadas do primeiro ciclo.
Dessa vez, o design foi modelado sobre o pr
oprio sistema
PRONTO. Como redesign foi definido que dever
a haver uma
janela para cadastrar um grupo multidisciplinar. Esse grupo
ser
a criado por qualquer profissional de sa
ude. E no momento da criaca
o ele informar
a os profissionais que pertencem ao grupo. Quando os profissionais forem adicionados
receber
ao uma notificaca
o para aceitar ou n
ao o convite.
Cada grupo ter
a um nome para ser identificado. O paciente
e includo no grupo quando um dos profissionais que o atender achar necess
ario. Esse processo de inclus
ao e realizado
no momento do atendimento. Sempre que um paciente for
includo para ser acompanhado por um grupo, deve ser informado o motivo do acompanhamento e o nome do profissional
de referencia que ser
a o respons
avel do grupo. Tambem, no
atendimento, quando o profissional fizer parte de um grupo
multidisciplinar e atender o paciente que est
a relacionado
com ele, poder
a ver todas as informaco
es prescritas e cadastradas pelos outros profissionais do grupo. No pr
oprio local

Na etapa tambem foi aplicado o question


ario de trabalho
em equipe e tratamento multidisciplinar com a equipe de
atenca
o ao idoso. Os profissionais responderam o question
ario sem d
uvidas, sendo assim, o pre-teste foi bem-sucedido.
Esse question
ario tambem auxiliar
a na construca
o da tela
do planejamento multidisciplinar, pois contem quest
oes relacionadas ao funcionamento de um grupo e suas formas de
colaboraca
o. Sendo assim, a partir das escalas respondidas
ser
a possvel identificar quais funcionalidades deve-se priorizar no sistema a ser desenvolvido.
Etapa 5 (Refletir): Com base na sess
ao de design participa-

115

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

tivo realizada, pode-se concluir a fase de design do MTM. A


fase foi concluda, pois a maior parte dos requisitos mostrou
ser atendida pelo novo prot
otipo apresentado. Nessa fase
tem-se as atividades colaborativas necess
arias para o tratamento multidisciplinar, sendo elas: troca de mensagens
entre os profissionais da equipe; visualizaca
o de prontu
ario
eletr
onico de forma colaborativa, ou seja, identificaca
o dos
profissionais que escreveram no prontu
ario a partir de uma
cor u
nica (cor por profissional); acompanhamento do paciente atraves de um planejamento multidisciplinar construdo
pela equipe; e, notificaca
o de inserca
o de novos pacientes
dentro da equipe multidisciplinar.

sionais que foram convidados a fazer parte do caso;

Nesse ciclo conseguiu-se compreender o que e um planejamento multidisciplinar e como ele funciona, para que este
possa ser anexado ao sistema. Decidiu-se ent
ao iniciar a
fase de desenvolvimento do MTM. Ap
os parte do desenvolvimento realizado ser
a iniciada a validac
ao das funcionalidades com o design baseado em cen
arios. Para essa validaca
o
tambem ser
a envolvida a mesma equipe multidisciplinar de
atenca
o ao idoso e acrescentada uma nova equipe de tratamento multidisciplinar.

RF11: O MTM deve permitir que os profissionais insiram


coment
arios sobre os agendamentos;

Como conclus
ao deste segundo ciclo ainda obteve-se o conjunto final dos requisitos funcionais necess
arios para o desenvolvimento de um sistema de tratamento multidisciplinar
apresentado na seca
o 6.

RF14: O MTM deve permitir a criac


ao de grupos de tratamento multidisciplinar a partir de profissionais cadastrados
no PRONTO;

6.

RF08: O MTM deve permitir que os profissionais convidados aceitem ou recusem o convite, e caso recusem deve convidar um pr
oximo profissional aleat
orio para o tratamento;
RF09: O MTM deve possuir um chat para que o profissional
possa se comunicar com um interlocutor ou com um grupo;
RF10: O MTM deve permitir que os profissionais visualizem os agendamentos do paciente prescritos por todos os
profissionais que est
ao o atendendo;

RF12: O MTM deve permitir que os profissionais visualizem


as informaco
es do paciente;
RF13: O MTM deve permitir que qualquer profissional adicione no chat outro profissional da sa
ude para que possa
trocar informaco
es;

RF15: Cada grupo multidisciplinar deve ter um foco de estudo;

REQUISITOS FUNCIONAIS

Durante a pesquisa-aca
o foram elencados os Requisitos Funcionais (RF) que dever
ao ser atendidos pelo sistema multidisciplinar. No primeiro ciclo foram classificados treze requisitos. J
a no segundo ciclo foram alterados tres dos requisitos
elencados no primeiro ciclo e foram adicionados sete novos
requisitos.

RF16: O MTM deve permitir que o profissional seja adicionado a um grupo multidisciplinar j
a criado;
RF17: Para cada paciente adicionado a um grupo, deve-se
selecionar um profissional de referencia que e respons
avel
pelo tratamento;

Como resultado final obteve-se um conjunto com vinte RF,


sendo eles:

RF18: O MTM deve permitir que os profissionais que fazem


parte do grupo de tratamento multidisciplinar visualizem de
forma diferenciada o atendimento do paciente que est
a sendo
acompanhado pelo grupo;

RF01: O MTM deve permitir a criaca


o de um tratamento
multidisciplinar pelo medico que atender o paciente no momento de sua consulta;

RF19: O MTM deve permitir que os profissionais realizem


um plano de tratamento multidisciplinar por paciente;

RF02: Ao atender o paciente de forma multidisciplinar, o


profissional deve informar na tela de consulta o problema
que o paciente possui, podendo ser informados um ou mais
problemas;

RF20: O plano de tratamento multidisciplinar deve conter


os problemas, as metas, as aco
es a serem tomadas, o estado
e o profissional de referencia.

RF03: O MTM deve permitir que o medico informe o motivo


do tratamento multidisciplinar;

7.

CONCLUSO

Ate o presente momento foi possvel identificar que a utilizaca


o das tecnicas do design participativo durante o processo de design de uma ferramenta colaborativa auxilia no
levantamento das funcionalidades do sistema. Com a interac
ao dos usu
arios proporcionada pela aplicaca
o do design
participativo pode-se melhorar o design do sistema colaborativo sendo construdo. Essa afirmaca
o e possvel, pois o
design apresentado inicialmente sofreu transformaco
es sugeridas pelos participantes para proporcionar a realizac
ao de
atividades que antes n
ao estavam sendo contempladas. Essa
quest
ao foi observada ap
os a realizaca
o do primeiro ciclo de
pesquisa-aca
o, quando foi necess
ario o reprojeto das janelas
do MTM.

RF04: O MTM deve permitir que o medico selecione a


partir de uma lista de profissionais cadastrados no sistema
PRONTO, quais profissionais participar
ao do caso;
RF05: O MTM deve permitir que os profissionais consultem
casos em andamento e resolvidos a partir de atendimento
multidisciplinar;
RF06: O MTM deve permitir que o medico crie o tratamento
multidisciplinar;
RF07: O MTM deve enviar uma notificaca
o para os profis-

116

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Realizando o design do MTM, com a participaca


o dos usu
arios que utilizar
ao o sistema e profissionais envolvidos em atividades de tratamento multidisciplinar, foi possvel alcancar
parte dos objetivos, pois a comunicac
ao entre os projetistas
e usu
arios aumentou ainda na fase de projeto e atraves dela
foi possvel identificar melhorias no software a ser desenvolvido.

2011.
[14] M. J. Mantau, C. D. Berkenbrock, and G. R.
Berkenbrock, Visualizacao e filtragem de informacoes
de percepcao em groupwares moveis, in Proceedings of
the X Brazilian Symposium in Collaborative Systems,
SBSC 13, (Porto Alegre, Brazil, Brazil), pp. 9:99:15,
Sociedade Brasileira de Computacao, 2013.
[15] R. M. Davison, M. G. Martinsons, and N. Kock,
Principles of canonical action research, Information
Systems Journal, vol. 14, pp. 6586, 2004.
[16] D. Rigby, Collaboration between doctors and
pharmacists in the community, Australian Prescriber,
vol. 33, no. 6, pp. 191193, 2010.
[17] P. Vora, Web Application Design Patterns. Morgan
Kaufmann, Elsevier, 2009.
[18] C. Balsamiq, Balsamiq launch demo version, 2013.
[19] L. P. Araujo, C. D. M. Berkenbrock, M. M. Mattos,
and E. Boeing, Using participatory design in
designing phase of collaborative system, in Computer
Supported Cooperative Work in Design (CSCWD),
IEEE, IEEE, 2014.
[20] P. Johnson-Lenz and T. Johnson-Lenz, Groupware:
coining and defining it, SIGGROUP Bull., vol. 19,
pp. 34, Aug. 1998.
[21] M. Fennell, I. Das, S. Clauser, N. Petrelli, and
A. Salner, The organization of multidisciplinary care
teams: modeling internal and external influences on
cancer care quality, National Cancer Institute,
vol. 40, pp. 7280, 2010.
[22] A. R. C. Control, Organizational survey on
multidisciplinary treatment planning for cancer.
national cancer institue, 1993.

O processo de desenvolvimento encontra-se em fase avancada, a qual, uma vez finalizada permitir
a a conclus
ao dos
objetivos inicialmente propostos. Para isso o desenvolvimento do MTM ser
a continuado com a aplicaca
o de tecnicas do design baseado em cen
arios e as funcionalidades ser
ao
avaliadas com os question
arios aplicados durante o pre-teste.

8.

REFERENCES

[1] M. Peduzzi, Equipe multiprofissional de sa


ude:
conceito e tipologia, Revista de Sa
ude P
ublica, vol. 1,
pp. 103109, 2001.
[2] Inca, Tratamento do c
ancer no sus, Aco
es de
Controle, vol. s.v., no. s.v., pp. 9499, s.a.
[3] S. Matumoto, Supervis
ao de equipes no programa de
sa
ude da famlia: reflex
oes acerca do desafio da
produc
ao de cuidados, Dossie. Interface:
Comunicaca
o, Sa
ude, Educaca
o, vol. 9(16), pp. 924.,
2004.
[4] A. Hwang, K. Truong, and A. Mihailidis, Using
participatory design to determine the needs of
informal caregivers for smart home user interfaces, in
Pervasive Computing Technologies for Healthcare
(PervasiveHealth), 2012 6th International Conference
on, pp. 4148, 2012.
[5] M. Z. N. Castela, P. Dias and J. Tribolet, Atualizaca
o
colaborativa do modelo de processos de neg
ocio,
Revista Iberica de Sistemas e Tecnologias de
Informaca
o, vol. 12, pp. 3347, 2013.
[6] U. Mushtaq and K. Hall, Power and agency in health
information technology: towards a more meaningful
participatory design for sustainable development, in
Science and Technology for Humanity (TIC-STH),
2009 IEEE Toronto International Conference,
pp. 10361041, 2009.
[7] M. Z. N. Castela, P. Dias and J. Tribolet, An
alise
sobre situaca
o atual dos sistemas de informaca
o do
sistema u
nico de sa
ude propostas para adequaca
o,
Conselho Nacional de Secret
arios de Sa
ude, Nota
Tecnica 20/2011, vol. sn, no. sn, pp. 114, 2011.
[8] LDTT, Pronto: Gest
ao de sa
ude p
ublica, Jul 2013.
[9] J. Preece, Y. Rogers, and H. Sharp, Interaction
Design: Beyond Human - Computer Interaction.
Wiley, 3 ed., 2011.
[10] R. Iqbal, N. Shah, A. James, and J. Duursma,
User-centred design and evaluation of support
management system, in Computer Supported
Cooperative Work in Design, 2009. CSCWD 2009.
13th International Conference on, pp. 155160, 2009.
[11] J. Nielsen, Usability Engineering. Academic Press Elsevier, 1 ed., 1993.
[12] B. Dick, You want to do an action research thesis?,
1993.
[13] D. Filippo, Pesquisa-aca
o em sistemas colaborativos,
ch. 26, pp. 449466. Mariano Pimentel e Hugo Fuks,

117

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

AGORA-PL: Uma Proposta para Desenvolvimento de


Famlias de Sistemas Colaborativos baseados em VGI
para a Gesto do Risco de Inundao
Roberto dos Santos Rocha

Lvia Castro Degrossi

Flvio E. A. Horita

Departamento de Sistemas de
Computao, ICMC/USP,
So Carlos, Brasil

Departamento de Sistemas de
Computao, ICMC/USP,
So Carlos, Brasil

Departamento de Sistemas de
Computao, ICMC/USP,
So Carlos, Brasil

rsrocha@usp.br

degrossi@icmc.usp.br

horita@icmc.usp.br

Joo Porto de Albuquerque


Departamento de Sistemas de
Computao, ICMC/USP, So Carlos
GIScience Chair, Instituto de
Geografia, Universidade de
Heidelberg, Alemanha

jporto@icmc.usp.br
ABSTRACT

Volunteered Geographic Information, usually known as VGI, can


be a valuable source of information about the impacts of natural
disasters. This work is part of a research project about flood risk
management, developed by an interdisciplinary group, which aims
to develop a geospatial open collaborative architecture for
building resilience against floods and their impacts. The approach
combines data from a sensor network, climate change models,
volunteers information, and research results to provide early
warnings and forecasts of long-term risk. In terms of
systematization, Software Product Line (SPL) can be applied in
this domain since flexibility and reuse are main goals required for
development of complex applications based on Geospatial Web
Services. The main contributions of this work were twofold: (i)
insertion of reuse in the context of flood risk management; and (ii)
redefinition of feature model, aimed at creating a framework to
support and systematization the generation of families of Spatial
Decision Support Systems (SDSS).

INTRODUO

Dentre os desastres naturais que ocorrem em todo o mundo, as


inundaes tm sido mais frequentes [1], resultando em danos
financeiros e econmicos cada vez piores. Neste panorama, as
inundaes urbanas so particularmente importantes, pois muitos
cidados se concentram em torno das reas de risco. Como forma
de mitigar esse risco e aumentar o poder de resilincia, adaptao
e mudana das comunidades em risco, a Gesto do Risco de
Inundao (GRI) define um processo composto por tarefas,
separadas em trs fases preparao, resposta e recuperao que
objetiva minimizar os impactos causados por um evento [2].
Desastres naturais recentes tm mostrado que informaes
geogrficas de voluntrios (VGI), fornecidas pela internet, podem
melhorar a conscincia situacional (CS) [3]. Esse tipo de
conscincia permite a percepo dos elementos no ambiente,
dentro do tempo e espao, alm da compreenso dos seus
significados e a projeo de suas condies em um futuro prximo
[49]. Assim, VGI oferece uma grande oportunidade para aumentar
a conscincia devido ao nmero elevado de voluntrios, mais de
seis bilhes de pessoas, que podem agir como "sensores",
observando importantes parmetros da gesto de desastres em um
ambiente local [4].

Categories and Subject Descriptors

D.2.13 [Software Engineering]: Reusable Software; H.5.3


[Information Interfaces and Presentation]: Collaborative
computing.

Este trabalho faz parte do escopo do projeto de pesquisa intitulado


AGORA A Geospatial Open collaboRative Approach for
Building Resilience against Flooding [5], que visa desenvolver
uma abordagem geoespacial colaborativa aberta para melhorar a
resilincia da comunidade contra inundaes e seus impactos.
Essa abordagem tem como pblico alvo tomadores de deciso e a
comunidade interessada.

General Terms

Design.

Keywords

Software Product Line, Volunteered Geographic Information,


Flood Risk Management, Spatial Decision Support Systems,
WPS.

Alm disso, a partir de uma reviso sistemtica da literatura


conduzida pelos autores deste trabalho, identificou-se que
abordagens de reso ainda no foram inseridas no contexto de
GRI. Dessa forma, o objetivo deste trabalho apresentar a ideia
preliminar de uma Linha de Produto de Software (LPS) para o
contexto de GRI, utilizando como base os trabalhos de Degrossi
et. al. [6] e Horita et al. [7], que ser tratada na Seo 4.

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

118

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

O restante deste artigo est estruturado da seguinte forma: a Seo


2 apresenta a fundamentao terica deste trabalho. A Seo 3
apresenta os trabalhos relacionados a esta proposta. Na Seo 4
apresentada uma proposta para desenvolvimento de famlias de
sistemas colaborativos. Por fim, na Seo 5 so apresentadas as
consideraes finais e propostas de trabalhos futuros.

2.2 Informao Geogrfica de Voluntrios

Na literatura, vrias abordagens fornecem taxonomias e


classificaes de sistemas colaborativos. Estas so concebidas
para separar estes sistemas com base nas suas propriedades e
caractersticas. Dentre elas, Heipke [14] props o termo
"crowdsourcing" para definir o fenmeno que envolve a produo
de contedo baseado na experincia de voluntrios, independentes
da forma que eles usam seu tempo livre e esto localizados em
reas remotas e diversas.

FUNDAMENTAO TERICA

Nesta seo, os conceitos bsicos relacionados a GRI (Seo 2.1),


VGI (Seo 2.2) e LPS (Seo 2.3), que so usados ao longo do
artigo, so apresentados.

Em um contexto ligado s questes geogrficas, Goodchild [4]


usou o termo Volunteered Geographic Information (VGI) para
definir uma coleo de dados espaciais e digitais, produzidos por
cidados comuns e instituies informais utilizando ferramentas
apropriadas para reuni-las e publica-las na web. Entre as
vantagens associadas ao VGI, pesquisadores destacam seu uso
para enriquecer, atualizar ou completar conjuntos de dados
geoespaciais existentes [4]. Em diferentes contextos, estas
informaes voluntrias podem ter melhor qualidade que os dados
disponibilizados por organizaes especializadas, visto que em
diferentes partes do mundo essas informaes esto desatualizadas
ou foram adquiridas com tecnologias antigas e menos precisas do
que as disponveis atualmente para o pblico geral [15]. Dentre
suas aplicaes, destacam-se as plataformas colaborativas
Wikimapia e OpenStreetMap que visam criar mapas mundiais a
partir de dados fornecidos por voluntrios disponveis na web.

2.1 Gesto do Risco de Inundao

Dentre os desastres naturais que ocorrem em todo o mundo, as


inundaes tm sido mais frequentes, resultando em danos
financeiros e econmicos cada vez piores [1][8]. Neste panorama,
as inundaes urbanas so particularmente importantes, pois
muitos cidados se concentram em torno das reas de risco [9],
enquanto, inundaes bruscas causam numerosos danos devido
dificuldade em prev-las, pois o curto tempo de deslocamento das
ondas de cheia impedem previses com maior antecedncia [10].
Dessa forma, o risco de inundaes pode ser considerado como a
relao entre ameaa, vulnerabilidade e exposio [11]. A ameaa
caracterizada pelo fenmeno natural que atinge uma
determinada regio (e.g. inundao), a exposio representada
pelas pessoas e bens econmicos que se encontram na rea afetada
e a vulnerabilidade indica a capacidade de uma regio sofrer o
impacto causado por um evento extremo.

Em particular, o uso de VGI no contexto de gesto de desastres


vem sendo amplamente utilizado [16], principalmente, por
melhorar a conscincia situacional, fornecendo uma viso geral
sobre a presente situao [3]. Tal fato ocorre, pois VGI oferece
uma grande oportunidade para aumentar a conscincia devido ao
nmero potencialmente grande de voluntrios, mais de seis
bilhes de pessoas, que agem como sensores, observando
importantes parmetros da gesto de desastres em um ambiente
local [3][4][17]. Ainda, apesar dos recentes avanos no
desenvolvimento de sensores, suas observaes podem no estar
disponveis devido a interrupes de comunicao ou, at mesmo,
a destruio do sensor, alm de os mesmos no serem capazes de
medir certos fenmenos, como tempestades de granizo [3].
Alguns exemplos so as inundaes ocorridas no Paquisto em
2010, Queensland em 2010/2011, Tailndia em 2011, terremoto
no Haiti em 2010, queimada na Frana em 2009, entre
outros [18][19][20][21].

Como forma de mitigar esse risco e aumentar o poder de


resilincia, adaptao e mudana das comunidades de risco, a
Gesto do Risco de Inundao (GRI) define um processo
composto por tarefas, separadas em trs fases (a preparao,
resposta e recuperao) e que buscam minimizar os impactos
causados por um evento [2]. Dentre elas, destacam-se alertas
precoces, previso de cenrios, planos de contingncia e
atividades para restaurao [9].
Durante a fase de planejamento so realizadas atividades para
tentar reduzir os danos causados por uma inundao, desde a
definio dos planos de evacuao at simulaes para otimizar o
uso das terras ao redor da calha dos rios. Aps ecloso da
inundao, a resposta objetiva executar tarefas definidas no
planejamento para reagir ao evento. Por fim, a recuperao
desenvolve um conjunto de tarefas para a comunidade atingida
retomar seu convvio e adaptar-se para o caso de novos
acontecimentos [12].

Contudo, apesar das vantagens da participao da populao em


coletar informaes, h um grande nmero de desafios a serem
enfrentados. Apesar do potencial do VGI, a qualidade dos dados
a maior preocupao. Informaes provenientes de muitos
indivduos podem ocasionar dvidas sobre a credibilidade [22].
Outro desafio enfrentado refere-se localizao. Diferentemente
dos sensores in-situ, as pessoas esto em constante movimento,
assim as observaes por elas realizadas precisam ser localizadas
para que se tornem teis [3]. Por fim, VGI considerada como
insuficientemente estruturada, documentada e validada [23].

Atualmente, informaes geogrficas e tecnologias relacionadas


possuem papel fundamental em todas as fases da GRI. Desastres
naturais so tipicamente monitorados utilizando diferentes
dispositivos, como sensores, satlites, sismgrafos, entre outros.
Contudo, esses dispositivos no oferecem informaes sobre os
impactos provocados por tais desastres [3]. Para auxiliar nesse
contexto, Poser e Dransch [3] utilizaram informaes geogrficas
provindas de cidados afetados pela inundao para estimar os
impactos por ela causados. Assim, informaes voluntrias,
comumente conhecidas como VGI, podem ser uma fonte de
informao valiosa sobre os impactos decorrentes de desastres
naturais [13], devido ao nmero potencialmente grande de
voluntrios que atuam como "sensores" observando importantes
parmetros da gesto de desastres em um ambiente local [3].

Nesse cenrio, diferentes plataformas de software vm sendo


empregadas com o intuito de coletar informaes voluntrias,
permitir sua visualizao e anlise. Em particular, essas so
utilizadas como ferramentas para ajudar vtimas de desastres
naturais. Alm disso, diversas aplicaes de software utilizam
informaes voluntrias como fonte de dados em tempo real para
a gesto de desastres.

119

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Produto Orientadas a Servios LPSOAs: (i) Variabilidade de


Workflow: em um workflow, algumas unidades de servios
podem no ser solicitadas por um usurio de um servio
especfico; alm disso, parte dessa sequncia pode ser realizada de
forma diferente para outro usurio especfico. Assim, unidades de
servios podem ser alternativas ou de forma opcional ajustadas a
determinado workflow dependendo dos usurios especficos dos
servios; (ii) Variabilidade de Composio: a variao ocorre
sobre a seleo da interface de servio mais adequada, pois para
uma unidade de servio pode existir mais de uma interface de
servio possvel, com diferentes lgicas de implementao ou
atributos de qualidades; (iii) Variabilidade de Interface: ocorre
quando as interfaces de unidade de servio no correspondem s
interfaces de servios publicados em UDDI no registro de
servios; (iv) Variabilidade Lgica: o componente de servio
deve fornecer lgicas diferentes dependendo dos servios
especficos solicitados.

2.3 Linha de Produto de Software LPS

LPS um conjunto de sistemas que usam software


intensivamente, compartilhando um conjunto de caractersticas
comuns e gerenciadas, que satisfazem as necessidades de um
segmento particular de mercado ou misso, e que so
desenvolvidos a partir de um conjunto comum de ativos principais
e de uma forma preestabelecida [24]. O processo sistemtico para
desenvolvimento de uma LPS possui dois ciclos de vida
Engenharia de Domnio e Engenharia de Aplicao que usam
como artefato base a arquitetura da LPS.
Um conceito central em LPS so variabilidades [25]: diferenas
tangveis, entre produtos, que podem ser reveladas e distribudas
entre todos os artefatos da LPS de forma rastrevel. As variaes
podem ser reveladas em qualquer passo do desenvolvimento de
uma LPS, a comear pela anlise de requisitos [25]. H dois
conceitos relacionados a variabilidades [26]: (i) pontos de
variao so posies em que a variao pode ocorrer; (ii)
variantes so as diferentes possibilidades que existem para
satisfazer um determinado ponto de variao. Uma das tcnicas
mais usadas ao gerenciamento das variabilidades em uma LP so
os modelos de caractersticas [27][28].

TRABALHOS RELACIONADOS

A abordagem PL-Science [35] tem o propsito de apoiar a


especificao e a conduo de experimentos cientficos em
Bioinformtica, atravs da associao de modelo de caractersticas
e ontologia com elementos de suporte s atividades colaborativas.

Uma caracterstica pode ser definida como uma propriedade de


um sistema que relevante para alguma entidade envolvida em
seu desenvolvimento ou uso. Ela usada para capturar pontos
comuns ou estabelecer uma discriminao entre sistemas em uma
famlia de sistemas. Uma caracterstica pode denotar qualquer
propriedade funcional ou no funcional em relao a requisitos,
arquitetura, componentes ou plataformas computacionais [29].

A abordagem Collaborative PL-Science [36] possui como


objetivo o desenvolvimento de um servio para apoiar a interao
entre os cientistas e oferecer mais semntica para o domnio de eCincia. Para esta finalidade, a abordagem PL-Science [35] foi
estendida. A ideia que essa proposta implemente um servio que
capture o histrico das atividades realizadas pelos cientistas, o que
possibilitar que consultas e novas descobertas sejam feitas a
partir desses dados. Esse histrico das atividades pode ser
entendido como sendo os passos dos cientistas, bem como as
decises que foram tomadas, anotaes feitas sobre os artefatos ou
caractersticas [36].

A representao grfica mais comum por meio de rvore, o que


constitui o diagrama de caracterstica (feature diagram) como
apresentado na Figura 1. Nesses diagramas, caractersticas podem
ser representadas como: Obrigatria, Opcional, E, OUExclusivo e OU-Inclusivo.

Considerando a taxonomia proposta por Chang e Kim [34], os


trabalhos apresentados anteriormente de LPS no domnio
cientfico tratam apenas de "Variabilidade de Workflow". A nossa
abordagem alm desta, cobre tambm "Variabilidade de
Composio", que ser tratada na Seo 4.
Degrossi et al. [6] propuseram a criao de uma plataforma
croudsowrcing, a partir de uma configurao existente para a
obteno de informaes geogrficas voluntrias teis para o
contexto de gesto de risco. Com o objetivo de promover a
utilizao de tcnicas de reso no contexto de GRI, utilizamos as
propostas de Degrossi et. al. [6] e Horita et al. [7] como base para
a nossa abordagem de LPS, que ser tratada na prxima seo.

Figura 1. Modelo de caractersticas de uma loja virtual [30]


Um modelo de caractersticas pode descrever o espao de
configurao de uma famlia de sistemas [30]. Um membro da
famlia pode ser especificado por meio da seleo das
caractersticas desejadas a partir do modelo de caractersticas,
considerando as restries de variabilidades definida pelo modelo.
O conjunto de caractersticas selecionadas chamado de
configurao [31].

Uma Proposta para Desenvolvimento de


Famlias de Sistemas Colaborativos

Esta seo apresenta a AGORA-PL abordagem que contribui


com os desafios identificados na Seo 1. Para uma melhor
compreenso da nossa proposta, esta seo foi dividida em quatro
partes: na Seo 4.1 apresentada a viso geral da arquitetura em
que este trabalho est inserido; Na Seo 4.2 apresentamos o
componente AGORA-VOS. Na Seo 4.3 apresentamos o
componente AGORA-DS. Finalmente, na Seo 4.4 detalhamos o
componente AGORA-PL, foco desta proposta.

O entendimento do domnio e a seleo das caractersticas uma


questo fundamental no contexto de LPS Orientada a Servios
(LPSOA) um tipo especfico de LPS que formada por um
conjunto de sistemas orientados a servios similares em um
domnio especfico que pode ser desenvolvido a partir de um
ncleo comum de artefatos reusveis [32][33]. Deste modo,
Chang e Kim [34] fornecem uma taxonomia para compreenso
dos tipos de variabilidade que podem ocorrer em Linhas de

120

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

intuito disponibilizar alertas antecipados e exibir em mapas o


ndice de perigo.

4.1 AGORA

Esse trabalho est inserido em uma pesquisa sobre gesto do risco


de inundao, desenvolvida por um grupo interdisciplinar, o qual
formado por pesquisadores da rea de Sistemas de Informao,
Hidrologia e de Redes de Computadores. Em particular, esse
trabalho parte do escopo de um projeto de pesquisa intitulado
AGORA1 A Geospatial Open collaboRative Approach for
Building Resilience against Flooding ([FAPESP 2012/18675-1]),
proposto por Albuquerque e Zipf [5], que visa desenvolver uma
abordagem geoespacial colaborativa aberta para melhorar a
resilincia da comunidade contra inundaes e seus impactos. A
abordagem AGORA combina dados provenientes de rede de
sensores, de modelos de mudana climtica, informaes
voluntrias e resultados de pesquisa, para fornecer alertas
antecipados e projees de risco de longo prazo. Alm disso, essa
abordagem tem como pblico alvo os tomadores de deciso e,
tambm, a comunidade. Para tanto, essa dividida em trs pilares
distintos: aquisio, integrao e aplicao (Figura 2), sendo cada
pilar composto por dois componentes.

4.2 AGORA-VOS: Volunteers as Sensor

O componente AGORA-VOS faz parte do pilar de aquisio de


informaes. Em particular, esse componente tem como objetivo
coletar informaes voluntrias relacionadas ao contexto de
gesto de risco de inundao. Para tanto, foi proposta uma
plataforma de crowdsourcing, intitutlada Observatrio Cidado
de Enchentes (OCE), para a obteno dessas informaes. Essa
possibilita a obteno de informaes teis ao contexto de GRI,
mais especificamente sobre reas alagadas e altura da gua no
leito do rio. Em particular, o OCE consiste em uma instncia da
plataforma de crowdsourcing Ushahidi, pois essa mundialmente
utilizada por ativistas, agncias de emergncia e cidados para
mapear eventos extremos [38].
A fim de facilitar o fornecimento de informaes sobre o risco de
inundao no OCE, uma equipe interdisciplinar, composta por
cientistas da computao e hidrologistas, definiu mecanismos de
interpretao que so representados por meio de categorias
distintas, sendo as marcaes dessas representadas por
subcategorias. Dessa forma, o voluntrio pode identificar mais
facilmente a categoria que melhor representa o cenrio observado.

A camada de aquisio composta por um componente para a


obteno de informaes voluntrias [6], e por um componente
para o gerenciamento dinmico e em tempo real de geosensores
heterogneos envolvidos na GRI. Esse, por sua vez, envolve a
descoberta de geosensores, o acesso aos dados por eles
produzidos, bem como a atribuio de uma tarefa especfica a um
determinado geosensor.

Para enviar um relato, os participantes podem utilizar tanto o


aplicativo para celular quanto o Web site. O envio de um relato
requer que o voluntrio fornea algumas informaes obrigatrias,
sendo as demais informaes opcionais (nome, sobrenome, email, link de fonte de notcias, link de vdeo externo e fotos): (i)
Ttulo: representa o assunto abordado no relato; (ii) Descrio:
representa a observao realizada pelo voluntrio, por exemplo, a
altura da gua ou rea alagada; (iii) Categoria: representa o
mecanismo utilizado para interpretao da varivel ambiental, o
qual fornece informaes sobre a altura da gua no leito do rio e
reas alagadas; (iv) Nome do local: representa o local de onde o
voluntrio est enviando o relato.

A camada de integrao composta por um componente para o


gerenciamento e a fuso de informaes, o qual consiste em uma
arquitetura geoespacial colaborativa para gerenciar e integrar
dados de sensores, informaes voluntrias e dados de fontes
oficiais relacionados inundao. O Segundo componente dessa
camada est voltado para a garantia da qualidade das informaes,
sendo esse desenvolvido por pesquisadores da Universidade de
Heidelberg, na Alemanha.

Em virtude da incerteza da credibilidade das informaes


voluntrias, essas so verificadas antes de serem disponibilizadas
para a visualizao. O objetivo dessa verificao reduzir o
nmero de informaes falsas ou imprecisas. Assim, antes dos
relatos serem disponibilizados online, o administrador da
plataforma deve aprov-los. Uma vez aprovado, esse pode ter dois
status distintos: verificado e no verificado. O status "verificado"
indica que a informao presente no relato pode ser confirmada
por outras fontes externas, como diferentes mdias e outros
voluntrios. Em contrapartida, o status "no verificado" indica
que no ocorreu nenhuma verificao relacionada ao incidente
reportado, ou seja, o administrador no encontrou outras notcias
na mdia que confirmassem tal acontecimento ou nenhum outro
voluntrio reportou o mesmo incidente. Inicialmente, os
responsveis pelo OCE exercem o papel de administrador da
plataforma, aprovando e verificando os relatos inseridos na
mesma. Contudo, espera-se que agncias de emergncia,
envolvidas na gesto de risco de inundao, desempenhem
futuramente esse papel.

Figura 2. Arquitetura do AGORA


Por fim, a camada de aplicao composta por um componente
de apoio deciso [37], que consiste em uma abordagem que
processa dados convencionais (dados de sensores e dados oficiais)
e informaes de voluntrios e os disponibiliza para os tomadores
de deciso, a fim de apoiar o processo de tomada de deciso na
GRI, e por um componente para o engajamento dos cidados, cujo

4.3 AGORA-DS: Decision Support

O componente AGORA-DS tem como objetivo processar, em


conjunto, informaes advindas das redes de sensores sem fio e
fontes de dados oficiais com aquelas compartilhadas por
voluntrios a fim de utiliza-las para apoiar o processo de tomada
de deciso na GRI. Para isso, ele est fundamentado em uma

http://www.agora.icmc.usp.br/

121

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

abordagem suportada pela estrutura conceitual apresentada na


Figura 3 [37]. Como pode-se observar, esta estrutura composta
por quarto camadas, aquisio, integrao, aplicao e negcio,
responsveis por definir mecanismos essenciais para compor o
componente AGORA-DS. Dentre eles, destaca-se o AGORAGeoDash, um sistema de informao em forma de geosensor
dashboard definido com o objetivo de apresentar, de maneira
simples, todas as informaes essenciais para apoiar as tarefas
presentes no processo decisrio da GRI [7].

4.4 AGORA-PL: Product Line Engineering

AGORA-PL o componente responsvel pela gerao de famlias


de sistemas de apoio deciso espacial (Spatial Decision Support
Systems SDSS). A base do AGORA-PL so as LPSOAs,
considerando que a integrao de dados no AGORA feita por
meio de SOA e servios web.
AGORA-PL tem como principal objetivo modelar explicitamente
as caractersticas comuns e variveis de uma LPS, por meio da
tcnica de modelos de caractersticas. Uma caracterstica pode
denotar qualquer propriedade funcional ou no funcional em
relao a requisitos, arquitetura, componentes ou plataformas
computacionais. O processo evolucionrio da AGORA-PL
consiste em dois principais processos como mostrado na Figura 5,
similar ao da abordagem PLUS [40]: (i) Engenharia de Linha de
Produto um modelo de LPS, que oferece mltiplas vises da
LPS; (ii) Engenharia de Aplicao um sistema alvo (aplicao)
um membro da LPS, e a mltipla viso do modelo para um
sistema alvo configurado a partir do modelo de mltiplas vises
da Engenharia de LPS. Outra iniciativa do AGORA-PL apoiar,
por meio da aplicao tcnicas de LPS, a composio de servios
web geoespaciais.

Figura 3. Estrutura conceitual do AGORA-DS


A estrutura do AGORA-DS define um conjunto de elementos para
atuar na coleta, armazenamento, processamento e apresentao
das informaes necessrias para GRI. Uma rede de sensores sem
fio coleta, em tempo real, dados relacionados a situao real das
variveis presentes nas zonas de risco. Estes dados so
armazenados e compartilhados com ferramentas de visualizao
utilizando padres de interoperabilidades [39]. Por fim, com vias
de tornar fcil e rpido a compreenso dessas informaes, eles
so apresentados em um geosensor dashboard utilizando um
conjunto de ndices em grficos com interpretao intuitiva e
imediata como apresentado na Figura 4.

Figura 5. Modelo de processo evolucionrio para LPS

4.4.1.

Composio de Servios Web Geoespaciais

Geralmente, um servio web geoespacial (Geospatial Web Service


GWS) pode ser visto como uma aplicao web modular que
fornece servios em relao aos dados geoespaciais, informaes
ou conhecimento [41]. Semelhante a um servio web tradicional,
as operaes bsicas durante o ciclo de vida de um GWS incluem
publicao, descoberta, ligao, invocao e execuo. GWS
fornece aos usurios a capacidade de gerao de funcionalidades
complexas, a partir da composio de servios atmicos, e essas
novas funcionalidades compostas tambm podem ser publicadas
como novos servios web, reiniciando o ciclo de vida do
GWS [42].
Existem vrias estratgias diferentes de composio de servios
web baseadas em plataformas e frameworks existentes. Vrios
autores tm providenciado avaliaes comparativas e crticas
dessas estratgias, incluindo Mathkour et al. [43]. Abordagens
desenvolvidas na literatura para a composio de servios podem
ser classificadas em duas categorias [43]: sintticas e semnticas.
A estratgia sinttica trata da composio baseada em modelos
abstratos e XML. A estratgia semntica trata da composio
baseada em ontologia, com o objetivo de permitir que aplicativos
usem anotaes e mecanismos de inferncia apropriados para
automatizar todas as etapas do ciclo de vida do servio web.

Figura 4. Geosensor Dashboard


Como observa-se na Figura 4, os ndices citados so apresentados
nos elementos 2, 3, 4, 5 e 8. Alm disso, o elemento 1 um mapa
utilizando para identificar os sensores que monitoram o rio nas
reas de risco e o elemento 7 exibe uma foto tirada por um desses
sensores. Todos estes elementos so essenciais para auxiliar no
monitoramento do risco de inundaes pelas agencias oficias,
regionais e nacionais.

Nos primeiros trabalhos sobre a composio de GWS, houve uma


tentativa de aplicar essas mesmas estratgias ao domnio

122

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

geoespacial. No entanto, alguns destes estudos no conseguiram


satisfazer as necessidades desse domnio, pois a composio de
GWS diferente devido s seguintes caractersticas [44]: (i)
consiste em protocolos leves, (ii) processam informaes baseadas
em crowdsourcing e, principalmente, (iii) devem ter a capacidade
de processar, em tempo real, as fontes de dados geoespaciais que
produzem grandes volumes de dados heterogneos.

web geoespaciais. Neste ponto, destaca-se que j existe uma


reviso sistemtica em conduo. Os resultados desta serviro de
base para a adaptao do framework; (iii) Propor um conjunto de
ferramentas, para apoiar o processo de engenharia do AGORA-PL
e (iv) Integrar a gerao automtica de modelos camada de
aplicao do AGORA-DS.
Em um nvel de granularidade menor, concentraremos os esforos
na resoluo do problema de composio de servios web, a partir
da utilizao do padro OGC WPS e modelos de caractersticas,
conforme discutido na Subseo 4.4.1.

Assim, tendo em vista a heterogeneidade de dados geoespaciais


que a abordagem AGORA utiliza informaes de voluntrios,
dados provenientes de rede de sensores e de modelos de mudana
climtica so necessrios padres para tratamento da
interoperabilidade entre eles [44]. Um exemplo de padro, foco
do AGORA-PL, o OGC Web Processing Service (WPS),
especificao que define um conjunto de interfaces padronizadas
para facilitar a publicao e acesso dos processos geoespaciais por
meio da rede [42][45]. Essa especificao define apenas a
estrutura de comunicao entre o servidor de aplicao e o cliente.

4.4.3.

Segundo Walenciak e Zipf [46], para fazer especificaes sobre o


contedo de um WPS necessrio criar um perfil de aplicao. A
especificao WPS 1.0 [45] define um perfil de aplicao como
um nico processo que descrito por meio da funo
DescribeProcess [46]. Esta definio no satisfaz as exigncias do
domnio GRI, pois no inclui a variedade de processos que este
domnio requer. Levando em considerao que a especificao
WPS limitada, mtodos/tcnicas para melhorar a especificao
atual so necessrios. Em termos de sistematizao, LPS pode ser
aplicada na composio de GWS, pois flexibilidade e reso so os
principais objetivos demandados no desenvolvimento de
aplicaes complexas baseadas em Servios Web OGC [47].

Na Figura 6(a) apresentado um exemplo de diagrama de


caractersticas. O diagrama composto por um elemento principal
chamado Raiz AGORA, que possui ligaes para outros
elementos, que so denominados de Ramos. Estes ramos levam a
outros elementos que tambm possuem outros ramos. O elemento
que no possui ramos conhecido como Folha. Para a gerao do
diagrama, adotamos as seguintes regras: (i) os ramos representam
os componentes do workflow AGORA-SM, AGORA-IFM,
AGORA-DS ou subcomponentes AGORA-VOS, AGORAQA e AGORA-CE; (ii) as folhas representam as fontes de dados
e/ou informao que o AGORA utiliza Human as Sensors; Webbased Crowdsourcing, Static Sensor, Mobile Sensors, Official
Data, Citizens e Decision Makers.

Dessa forma, uma reviso sistemtica da literatura (RS), em fase


de conduo pelos autores deste trabalho, visa entender a
dinmica de funcionamento da composio geoespacial. O
resultado dessa RS fornecer o suporte necessrio ao AGORA-PL
para a composio de GWS, utilizando o padro OGC WPS.

4.4.2.

Exemplo de Aplicao

Utilizamos o prprio AGORA como exemplo de aplicao para a


gesto de variabilidades e gerao de famlias de SDSS. A
iniciativa deixar o uso da abordagem AGORA flexvel para
diferentes contextos, ou seja, em alguns pode-se ter um SDSS
com dados de voluntrios e dados oficiais de sensores estticos,
em outros, apenas dados oficiais e dados de sensores mveis etc.

(a)

(b)

Estgio Atual do AGORA-PL

No estgio atual da nossa pesquisa, estamos trabalhando na


redefinio da semntica dos modelos de caractersticas para
suportar o domnio de gesto do risco de inundao. Essa
redefinio visa fornecer uma maneira correta de gerar os
esquemas de composio, sem ambiguidade, a partir dos modelos
de caractersticas.
Tendo em vista que trata-se de um trabalho em desenvolvimento,
destacamos aqui apenas as contribuies em direo a
identificao/extrao de caractersticas do domnio GRI, por
meio da aplicao de tcnica de modelos de caractersticas. Os
modelos gerados diagramas de caractersticas a partir da
aplicao desta tcnica, so incorporados aos ativos principais da
LPS. Na prxima subseo, demonstramos a aplicao da tcnica
para gerao dos diagramas de caractersticas. Esses modelos
sero, em um segundo momento, transformados em esquemas de
composio para facilitar a orquestrao dos GWS.

Legenda:
Obrigatria
Opcional

[1..1] OU Exclusivo
[1..*] OU Inclusivo

Figura 6. Diagrama de caractersticas do AGORA


A Figura 8(b) apresenta um exemplo de configurao para o
modelo apresentado na Figura 8(a), ou seja, um modelo de
configurao vlido foi gerado para o modelo apresentado na
Figura 8(a). Neste exemplo, as caractersticas escolhidas so as
destacadas, o que geraria um SDSS que utiliza informaes de
VGI e sensores estticos, como se pode observar ao selecionar,
respectivamente, as caractersticas filhas Human as Sensors e
Static Sensors. As caractersticas desprezadas aparecem tachadas,
como o caso de Web-based Crowdsourcing. Conforme anlise
do modelo da Figura 6(a), so possveis 120 configuraes
vlidas/famlias para o AGORA. Portanto, para cada contexto,

Como prxima etapa do nosso projeto, a nossa inteno definir


um framework para apoiar as fases de gerao das famlias de
SDSS, similar ao processo DynPL4BPM [48] para comportar as
especificidades do domnio de GRI. Contudo, alguns desafios
devero ser concludos para desenvolver a abordagem aqui
proposta. Estes incluem: (i) Entender as especificidades do
domnio GRI requisitos, restries, ciclo de vida etc.;
(ii) Identificar as principais estratgias de composio de servios

123

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Conf. (Pennsylvania, May. 18-21, 2014). ISCRAM '14. The


Penn State University, 302-311.

seria possvel gerar uma configurao de SDSS, e com isso


estamos fornecendo flexibilidade ao domnio de GRI. Destaca-se
que nenhuma restrio foi imposta ao modelo, o que demonstra o
nmero elevado de configuraes vlidas de famlias de SDSS.

[8] Jha, A.K., Bloch, R., and Lamond, J. 2012. Cities and
Flooding: A guide to integrated urban flood risk management
for the 21st century. World Bank, Washington.

CONSIDERAES FINAIS E
TRABALHOS FUTUROS

[9] E. M. Mendiondo. 2005. Flood Risk Management of Urban


Waters in Humid Tropics: Early Warning, Protection and
Rehabilitation. In Proc. of the Workshop on Integrated
Urban Water Managmt. in Humid Tropics (F. Iguau, Apr.
2-3, 2005). 1-14.

O objetivo deste trabalho foi propor uma abordagem preliminar de


LPS, denominada AGORA-PL, que integra elementos de
colaborao e sistemas de suporte deciso geoespacial. No
contexto do projeto AGORA, o AGORA-PL o componente
responsvel pela gerao de famlias de sistemas de apoio
deciso espacial, tendo como base as LPSOAs, considerando que
a camada de integrao dos dados no AGORA utiliza SOA e
servios web. As principais contribuies desta proposta foram:
(i) Insero do reso no contexto da GRI; (ii) Redefinio dos
modelos de caractersticas para permitir as especificidades do
contexto da GRI (1 etapa), visando a criao de um framework
para apoiar e sistematizar a gerao de famlias de SDSS (2
etapa).

[10] Fava, M.C., Mendiondo, E. M., Souza, V.C.B.,


Albuquerque, J.P. de, Ueyama, J. 2013. Proposta
Metodolgica para Previso de Enchentes com uso de
Sistemas Colaborativos. In Proc. of the XX Simpsio
Brasileiro de Recursos Hdricos (Bento Gonalves, Nov. 1722, 2013). SBRH '13. ABRH, Bento Gonalves, RS, 1-8.
[11] Crichton, D. and Mounsey, C. 1997. How the insurance
industry will use its oods research. In Proc. of the 3rd MAFF
Conf. of Coastal and River Engineers. CCRE '97.
[12] Simonovic, S. P. 1999. Decision Support System for Flood
Management in the Red River Basin. Canadian Water
Resources J. 24, 3 (1999), 203-223.

Como prximas etapas do nosso trabalho, pretende-se apresentar


uma proposta para resoluo do problema da especificao OGC
WPS, discutida na Subseo 4.4.1, incluindo a utilizao de
tcnicas de reso e captura de domnio modelos de
caractersticas. Alm desta, esforos sero concentrados na
resoluo dos desafios apresentados na Subseo 4.4.2,
especificamente aqueles relacionados definio do framework.

[13] De Longueville, B., Annoni, A., Schade, S., Ostlaender, N.,


and Whitmore, C. 2010. Digital earths nervous system for
crisis events: real-time sensor web enablement of volunteered
geographic information. Int. J. of Digital Earth. 3, 3 (May.
2010), 242-259.

REFERNCIAS

[14] Heipke, C. 2010. Crowdsourcing geospatial data. ISPRS-J.


Photogramm. Remote Sens. 65, 6 (Nov. 2010), 550557.

[1] UNISDR. 2007. Hyogo Framework for Action 2005-2015:


Building the Resilience of Nations and Communities to
Disasters.
Available
in
http://www.unisdr.org/files/
1037_hyogoframeworkforactionenglish.pdf

[15] Goodchild, M.F., and Li, L. 2012. Assuring the quality of


volunteered geographic information. Spatial Statistics. 1
(May. 2012), 110-120.

[2] Plate, E.J. 2002. Flood risk and flood management. J. of


Hydrology. 267, 2 (Oct. 2002), 2-11.

[16] Horita, F. E. A., Degrossi, L. C., de Assis, L. F. G., Zipf, A.,


and de Albuquerque, J.P. 2013. The use of volunteered
geographic information (VGI) and crowdsourcing in disaster
management: a systematic literature review. In Proc. of the
19th Americas Conf. on Information Syst. (Chicago, Illinois,
Aug. 15-17, 2013). AMCIS'13. AIS, Atlanta,1-10.

[3] Poser, K., and Dransch, D. 2010. Volunteered geographic


information for disaster management with application to
rapid flood damage estimation.Geomatica.64,1(2010),89-98.
[4] Goodchild, M.F. 2007. Citizens as sensors: the world of
volunteered geography. Geojournal. 69, 4(2007) 211-221.

[17] Schade, S., Daz, L., Ostermann, F., Spinsanti, L., Luraschi,
G., Cox, S., Nuez, M. and Longueville, B. D. 2013. Citizenbased sensing of crisis events: sensor web enablement for
volunteered geographic information. Applied Geomatics. 5, 1
(Mar. 2013), 3-18.

[5] Albuquerque, J.P., and Zipf, A. 2012. Collaborative


information systems for disaster management: Building
resilience against disasters by combining participatory
environmental monitoring and vulnerability communication.
In Proc. of the Alumni Seminar Natural Hazards Research
on Natural Disasters, Civil Defense, Disaster Prevention,
and Aid (Terespolis, Jun. 15-17, 2012). ALUMNI
SEMINAR '12. DAAD, Rio de Janeiro, 71-74.

[18] Kaewkitipong, L., Chen, C., & Ractham, P. 2012. Lessons


learned from the use of social media in combating a crisis: A
case study of 2011 thailand flooding disaster. In Proc. of the
33th International Conf. on Information Systems. (Orlando,
2012). ICIS '12. AIS, Atlanta, USA, 1-17.

[6] Degrossi, L.C., Albuquerque, J. P., Fava, M.C., Mendiondo,


E.M. 2014. Flood Citizen Observatory: a crowdsourcingbased approach for flood risk management in Brazil. In Proc.
of the 26th Int. Conf. on Soft. Engineering and Knowledge
Engineering (Vancouver, Jul. 1-3, 2014). SEKE '14.
Knowledge Systems Inst. Graduate School, 1-6.

[19] Longueville, B. D., Smith, R. S., and Luraschi, G. 2009.


Omg, from here, I can see the flames! a use case of mining
location based social networks to acquire spatio-temporal
data on forest fires. In Proc. of the Int. Workshop on
Location Based Social Networks (Seattle, Nov. 3, 2009).
LBSN '09. ACM, New York, 73-80.

[7] Horita, F.E.A., Fava, M.C., Mendiondo, E.M., Rotava, J.,


Souza, V.C., Ueyama, J., and Albuquerque, J.P. 2014.
AGORA-GeoDash: A Geosensor Dashboard for Real-time
Flood Risk Monitoring. In Proc. of the 11th Int. ISCRAM

[20] McDougall, K. 2011. Using Volunteered Information to Map


the Queensland Floods. In Proc. of the Surveying & Spat.
Sci. Biennal Conf. (Wellington, Nov. 21-25, 2011). SSSC'11.

124

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Computing. In Proc. of the Int. Software Product Line Conf.


(Kyoto, 2007). SPLC'07. IEEE, Washington,261-268.

[21] Zook, M., Graham, M., Shelton, T., Gorman, S. 2010.


Volunteered geographic information and crowdsourcing
disaster relief: a case study of the Haitian Earthquake. World
Medical & Health Policy 2, 2 (Jul. 2010), 7-33.

[35] Costa, G. C. B., Braga, R. M., David, J. M. N., Campos, F.


C. A., Arbex, W. 2013. PL-Science: A Scientific Software
Product Line. Procedia Comp. Sci.18 (2013), 759-768.

[22] Erskine, M., Gregg, D. 2012. Utilizing Volunteered


Geographic Information to Develop a Real-Time Disaster
Mapping Tool: A Prototype and Research Framework. In
Proc. of the Int. Conf. on Information Resources Manag.
(Vienna, May. 21-23, 2012). Conf-IRM '12.AIS,Atlanta,1-13

[36] Pereira, F. A., David, J. M. N., Braga, R., and Campos, F.


2013. Uma Abordagem para a Integrao de Elementos de
Colaborao ao Ncleo de Artefatos de uma Linha de
Produtos de Software Cientfico. In Simp. Brasileiro de
Sistemas Colaborativos (Manaus, AM, Out, 8-11, 2013).

[23] De Longueville, B., Luraschi, G., Smits, P., Peedell, S., and
De Groeve, T. 2010. Citizens as Sensors for Natural Hazards:
A VGI integration Workflow. Geomatica. 1(Jan.2010)41-59.

[37] Horita, F. E. A. and Albuquerque, J. P. 2013. An Approach


to Support Decision-Making in Disaster Management based
on Volunteer Geographic Information (VGI) and Spatial
Decision Support Systems (SDSS). In Proc. of the 10th
ISCRAM Conf. (Baden Baden, Germany, 2013).
ISCRAM'13. The Penn State University, 301-306.

[24] Clements, P. and Northrop, L. 2001. Software Product Lines:


Practices and Patterns. Addison-Wesley, Boston, MA.
[25] Gimenes, I. and Travassos, G. H. 2002. O Enfoque de Linha
de Produto para Desenvolvimento de Software, In: XXI
Jornada de Atualizao em Informtica - Livro Texto,
Sociedade Brasileira de Computao, Porto Alegre.

[38] Ushahidi. 2014. The ushahidi platform. Available in


http://ushahidi.com/products/ushahidi-platform

[26] Bachmann, F., and Bass, L. 2001. Managing variability in


software architectures. In: Proc. of the Symposium on
Software Reusability (Toronto, Canada, May. 18-20, 2001)
SSR '01. ACM, New York, 126-132.

[39] Botts, M., Percivall, G., Reed, C., and Davidson, J. 2008.
OGC sensor web enablement: Overview and high level
architecture, GeoSensor Networks. 4540 (2008), 175-190.
[40] Gomaa, H.; Saleh, M. Software product line engineering for
Web services and UML. In Proc. of the 3rd IEEE Int. Conf.
on Computer Systems and Applications (Cairo, Egypt, 2005)
ACS'05. IEEE, Washington, 110.

[27] Santos Rocha, R. and Fantinato, M. 2013. The use of


software product lines for business process management: a
systematic literature review. Inform and Software Tech. 55, 8
(Aug. 2013), 1355-1373.

[41] Khaled, R., Tayeb, L.M., and Servigne, S. 2010. Geospatial


Web Services Semantic Discovery Approach Using Quality.
J. of Convergence Information Tech. 5, 2 (Apr. 2010),28-35.

[28] Kang, D., and Baik, D. K. 2010. Bridging software product


lines and service-oriented architectures for service
identification using BPM and FM. In Proc. of the 9th
IEEE/ACIS Int. Conf. on Computer and Inf. Sci. (Yamagata,
Aug., 2010). ACIS '10. IEEE, Washington, 755-759.

[42] Farnaghi, M. and Mansourian, A. 2013. Automatic


composition of WSMO based geospatial semantic web
services using artificial intelligence planning. J. Spat. Sci.
58, 2 (Jul. 2013), 235-250.

[29] Kang, C. K., Kim, S., Lee, J., Kim, K, Shin, E., and Huh, M.
1998. FORM: A feature-oriented reuse method with domainspecific reference architectures. Ann. Softw. Eng. 5 (Jan.
1998), 143-168.

[43] Mathkour, H., Gannouni, S. and Beraka, M. 2012. Web


Service Composition: Models and Approaches. In Proc. of
the Int. Conf. on Multimedia Comput. and Systems (Tangier,
May, 2012). ICMCS'12. IEEE, Washington, 718-723.

[30] Fantinato, M. 2007. Uma abordagem baseada em


caractersticas para o estabelecimento de contratos
eletrnicos para servios web. Tese de Doutorado, IC,
Unicamp, Campinas, 2007.

[44] Zhao, P., Foerster, T. and Yue, P. 2012. The geoprocessing


web. Comput. Geosci. 47 (Oct. 2012), 3-12.
[45] OGC. 2014. Open Geospatial Consortium. Available in
http://www.opengeospatial.org

[31] Groner, G., Wende, C., Boskovic, M., Silva Parreiras, F.,
Walter, T., Heidenreich, F., Gasevic, D., and Staab, S.
Validation of Families of Business Processes. In Proc. of the
23rd Int. Conf. on Advanced Information Syst. Eng (London,
2011).CAiSE'11. Springer, Heidelberg, 551-565.

[46] Walenciak, G., and Zipf, A. Designing a Web Processing


Service Application Profile for Spatial Analysis in Business
Marketing. In Proc. of the AGILE Conf. on Geographic Inf.
Sci. (Guimares, 2010) AGILE'10. Springer, Heidelberg, 1-8.

[32] Trujillo, S., Kstner, C., and Apel, S. 2007. Product Lines
that Supply Other Product Lines: A Service-Oriented
Approach. In Proc. of the Workshop on Service-Oriented
Architectures and Software Product Lines (Kyoto, Japan,
2007). SOAPL'07. SEI, Hanscom AFB, MA, E1-E6.

[47] Weiser, A., and Zipf, A. 2007. Web service orchestration of


OGC web services for disaster management. In Proc. of the
Joined CIG/ISPRS Conf. on Geomatics for Disaster and Risk
Management (Toronto, May. 23-25, 2007). Gi4DM '07.
Springer, Heidelberg, 1-15.

[33] Ye, E., Moon, M., Kim, Y., and Yeom, K. 2007. An
approach to designing service-oriented product-line
architecture for business process families. In Proc. of the 9th
Int. Conf. on Adv. Communication Technology (GangwonDo, 2007). CACT'07. IEEE, Washington, 999-1002.

[48] Rocha, R.S. 2012. Linha de produto para Gesto de


Processos de Negcio incluindo aspectos dinmicos.
Dissertao de Mestrado, EACH, USP, So Paulo, 2012.
[49] Endsley, M.R. 1988. Design and evaluation for situation
awareness enhancement. In Proc. of the Human Factors and
Ergonomics Society Annual Meeting (Anaheim, California).
HFES'88, 97-101.

[34] Chang, S. H., and Kim, S. D. 2007. A Variability Modeling


Method for Adaptable Services in Service-Oriented

125

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Filtragem colaborativa de rotas de nibus usando dados


sobre a acessibilidade das vias urbanas
Marlon Fernandes Antonio, Filipe Roseiro Cgo, Igor Steinmacher, Ana Paula Chaves
Universidade Tecnolgica Federal do Paran - UTFPR
Via Rosalina Maria dos Santos, 1233
Campo Mouro, Paran

marlonfa@gmail.com, {filiper, igorfs, anachaves}@utfpr.edu.br


ABSTRACT
Big cities still facing serious problems related to urban traffic. This fact highlights the need for new solutions aiming
to improve the efficiency of the public transportation systems. Based on this, researchers have been developing systems to improve the experience of using public transportation. However, there is still an unexplored gap related to
the use of these systems by visually impaired people. The
goal of this study is presenting a technological solution that
relies on data obtained from the crowds to recommend routes according to the bus stop accessibility level to support
visually impaired users to use public transportation system
with autonomy and safety.

Categories and Subject Descriptors


H.5.3 [Information Interfaces and Presentation]:
Computer-supported cooperative work

General Terms
Human Factors

Keywords
accessbility, public transportation, bus route recommendation, crowdsourcing

1.

INTRODUO

As grandes cidades possuem diversos problemas relacionados ao tr


ansito urbano [16], tais como engarrafamentos,
falta de infraestrutura e m
a qualidade dos servicos prestados
pelo transporte p
ublico, os quais impactam a mobilidade das
pessoas no cen
ario urbano. Estimular o uso do transporte
p
ublico e uma possvel soluca
o para dar suporte a
` mobilidade urbana, pois reduz a quantidade de veculos nas vias
p
ublicas [5] e possibilita que o tr
ansito cumpra sua funca
o
social, relacionada ao atendimento a
`s demandas de acessibilidade, mobilidade e qualidade de vida da populaca
o urbana

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR,
. Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

[2]. Entretanto, existem diversos problemas relacionados ao


uso dos transportes p
ublicos que, muitas vezes, fazem com
que as pessoas optem por usar veculos particulares. Muitos
desses problemas s
ao relacionados a
` falta de infraestrutura
e de informaco
es atualizadas sobre o servico prestado (hor
arios, atrasos, linhas e veculos disponveis, entre outros [4]).
Em particular, pessoas com deficiencia visual, mais especificamente pessoas cegas, enfrentam desafios ainda maiores
para se deslocar utilizando o transporte p
ublico, pois possuem necessidades especficas que muitas vezes n
ao s
ao suficientemente apoiadas pelas facilidades de acesso oferecidas
pelo servico p
ublico de transporte. Problemas como a falta
de infraestrutura adequada, de identificaca
o dos
onibus, de
identificaca
o correta das paradas de o
nibus, de sinais sonoros, dentre outros, refletem a falta de acessibilidade ao uso do
transporte p
ublico. Acrescenta-se a isso as m
as condico
es de
acessibilidade nos locais pr
oximos a
`s paradas de o
nibus. Em
pesquisas realizadas por Monteiro [13] e Fornaziero [6] fica
claro que pessoas com deficiencia visual apresentam grande
dificuldade em chegar ao ponto de o
nibus desejado, seja por
falta de informaca
o a respeito da localizaca
o do ponto, pelos
diversos obst
aculos presentes nas calcadas (lixeiras, buracos,
telefones p
ublicos, etc) ou pela maneira de identificar o
onibus pelo qual est
ao esperando, sem que haja alguma pessoa
disposta a avis
a-los. Por esta raz
ao, torna-se mais difcil
o uso do sistema p
ublico de transporte por esse grupo de
usu
arios [2]. Alem disso, de acordo com Hara et al. [8],
pessoas com deficiencia visual dependem de planejamento e
de conhecimento previo sobre as condico
es de acessibilidade
de cada local, podendo, dessa forma, eleger o seu trajeto de
acordo com as suas capacidades fsicas e/ou cognitivas.
Informaco
es sobre quais facilidades de acesso existem em
locais pr
oximos a
` parada de o
nibus (por exemplo, sinais sonoros, calcadas ou mapas t
ateis) nem sempre est
ao disponveis para quem delas necessitam. Quando a informaca
o
existe, nem sempre est
a atualizada. Por exemplo, algumas
empresas permission
arias disponibilizam informaco
es a respeito da acessibilidade em seus pr
oprios sites, como e o caso
da empresa URBS (Urbanizaca
o de Curitiba S/A) 1 , em Curitiba. Porem, podem haver determinadas paradas em que
as facilidades oferecidas estejam danificadas, inoperantes ou
ausentes, por diferentes raz
oes. Ou ainda, as informaco
es
podem n
ao ser precisas para dizer, exatamente, para qual
parada de o
nibus cada facilidade est
a disponvel e, em muitas situaco
es, instrumentar os veculos e as paradas de o
nibus com sensores n
ao e uma alternativa de baixo custo.
Com o intuito de compreendermos as principais dificulda1

126

http://www.urbs.curitiba.pr.gov.br/acessibilidade

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

des enfrentadas por esse grupo de usu


arios, foram coletados
alguns feedbacks de pessoas com deficiencia visual a respeito
da sua experiencia com o uso de transportes p
ublicos. Os
resultados, que ser
ao brevemente discutidos na Seca
o 3, mostraram a necessidade de conhecer previamente o trajeto que
ir
a seguir antes de dirigir-se a
`s paradas de o
nibus. Alem
disso, os feedbacks mostram a dependencia que o deficiente
visual tem de outras pessoas para poder utilizar o servico
de transporte com seguranca. Perguntar a terceiros e uma
maneira bastante comum de adquirir informaca
o sobre as
condico
es de acessibilidade dos locais pelos quais planeja-se
passar. Sendo assim, considera-se o uso de crowdsourcing
como uma forma vi
avel de se obter dados a respeito da disponibilidade, das condico
es de uso e das facilidades de acesso
de um local. De acordo com Howe [10], crowdsourcing e um
modelo de produca
o de informaca
o colaborativo, baseado na
inteligencia coletiva, que consiste em delegar pequenas tarefas para uma grande quantidade de pessoas. Os resultados
dessas pequenas tarefas podem, ent
ao, ser combinadas de
maneira a produzir informaca
o e novos conhecimentos.
Este artigo tem como objetivo apresentar um algoritmo
de filtragem colaborativa que se utiliza da inteligencia coletiva para recomendar rotas de o
nibus mais apropriadas para
deficientes visuais, baseado na identificaca
o do nvel de acessibilidade de determinadas locais pr
oximos a paradas de o
nibus. Para lidar com as informaco
es obtidas, um algoritmo
cl
assico de filtragem colaborativa foi adaptado. A filtragem
colaborativa [17] utiliza os perfis, as preferencias e as avaliac
oes anteriores de um grupo de usu
arios a fim de predizer
a recomendaca
o para um usu
ario especfico. No contexto do
recomendador de rota de
onibus, tais preferencias e avaliac
oes s
ao as informaco
es sobre o nvel de acessibilidade de
acordo com as particularidades da deficiencia de cada indivduo, obtidas por meio de crowdsourcing.
Com a utilizaca
o do sistema de recomendaca
o de rotas de
o
nibus, o usu
ario com deficiencia visual ser
a capaz de planejar sua rota utilizando o transporte p
ublico, observando a
acessibilidade das paradas e dos locais pr
oximos a
`s paradas.
A principal contribuic
ao deste trabalho e demonstrar como
a utilizaca
o de um algoritmo de recomendaca
o baseado na
filtragem colaborativa de informac
oes sobre os nveis de acessibilidade das vias urbanas pode auxiliar deficientes visuais
a julgar se uma determinada rota de o
nibus e adequada a
`s
suas limitaco
es.
O restante deste trabalho est
a organizado da seguinte
forma. Na Seca
o 2, s
ao apresentados trabalhos relacionados
que serviram como base para a concepca
o desta pesquisa.
Na Seca
o 3 s
ao apresentados alguns dados relacionados ao
feedback dos deficientes visuais a respeito de suas experiencias no uso do transporte p
ublico coletivo. Na Seca
o 4, e
descrito o contexto em que o recomendador de rotas de o
nibus est
a inserido e suas interfaces. A Seca
o 4.2 apresenta
as principais caractersticas do recomendador e um cen
ario
de aplicaca
o. Por fim, a Seca
o 6 faz algumas discuss
oes a
respeito da pesquisa e dos trabalhos futuros.

2.

TRABALHOS RELACIONADOS

H
a trabalhos que enfatizam a import
ancia dos pontos de
paradas de o
nibus terem acessibilidade para as pessoas com
deficiencia, como em Norgate [14] e Soltania et al. [18], que
argumentam sobre a necessidade de uma melhor infraestrutura no ambiente urbano para auxiliar pedestres com deficiencia. Segundo os autores, itens como informaco
es audi-

127

tivas e t
ateis, calcadas antiderrapantes e com rebaixamento
nas extremidades tornam o ambiente mais seguro para esses
usu
arios.
Hara et al. [8] desenvolveram um trabalho que avalia a
factibilidade de se explorar dados de crowdsourcing para
identificar as condico
es de acessibilidade das calcadas utilizando imagens do Google Street View. Neste estudo, os
usu
arios podem localizar e avaliar os problemas das calcadas de maneira colaborativa. Posteriormente, Hara et al.
[7] atualizaram esse estudo apresentando um sistema capaz
de reconhecer as paradas dos pontos de o
nibus para auxiliar
usu
arios com deficiencia visual. Com esse sistema, ele pode
informar aos usu
arios com deficiencia visual quais obst
aculos
poderiam estar presentes nos pontos de paradas de o
nibus,
a fim de alertar esses usu
arios das problem
aticas que poderiam enfrentar. Ambos os trabalhos indicam que o uso de
dados crowdsourcing podem contribuir para identificar problemas relacionados a calcadas e sua acessibilidade, o que
tambem motivou o uso dessa tecnica nesta pesquisa.
Azenkot et al. [3] mostram a viabilidade do uso de crowdsourcing para obter informaco
es sobre hor
arios e locais das
paradas de o
nibus e apresentam um sistema m
ovel chamado
GoBraile. Esse sistema atua por meio de anotaca
o Braile,
permitindo usu
arios com deficiencia visual obterem informaco
es referente aos hor
arios de chegada e os locais de paradas dos
onibus, com dados obtidos por meio de crowdsourcing.Em Prasain [15], foi apresentado um refinamento
do sistema GoBraile, o qual descarta o uso de um anotador
Braile, utilizando somente recursos do pr
oprio dispositivo
m
ovel. Em Ferris et al. [5] e apresentado um aplicativo chamado OneBusAway, o qual utiliza informaco
es em tempo
real para notificar os usu
arios sobre o hor
ario de partida
e chegada dos o
nibus, facilitando a escolha sobre qual o
nibus pegar, baseado no tempo de chegada. As informaco
es
geradas pelo aplicativo OneBusAway s
ao obtidas de forma
colaborativa, ou seja, os usu
arios que est
ao dentro dos o
nibus utilizam o aplicativo informando-o sobre os hor
arios de
partida e chegada de cada parada da rota desse
onibus.
Na literatura existem tambem algumas pesquisas relacionadas ao uso de dados crowdsourcing para auxiliar as pessoas em diversas tarefas relacionadas a mobilidade e transporte p
ublico, como no trabalho desenvolvido por Kashif et
al. [11] no qual apresentam um aplicativo m
ovel chamado
CrowdITS. Este aplicativo objetiva auxiliar usu
arios e motoristas de transporte p
ublico a fornecerem e obterem informaco
es a respeito de congestionamentos e, assim, poder reencaminhar o trajeto para possveis caminhos livres. Todos
os dados que a aplicaca
o CrowITS utiliza provem dos pr
oprios usu
arios e s
ao gerados de maneira colaborativa. Kashif
et al. defendem o uso de crowdsourcing, pois por meio desta
soluca
o e possvel obter informaco
es sobre os problemas de
tr
ansito em tempo real e assim poder notificar os usu
arios sobre ocorrencias que possam influenciar em sua interaca
o com
o sistema p
ublico de transporte. Considerando os objetivos
deste trabalho, as informaco
es atualizadas sobre o nvel de
acessibilidade dos pontos das paradas de o
nibus podem ser
utilizadas para auxiliar deficientes visuais a tomar decis
oes
sobre o trajeto a seguir, tornando-se e um fator motivador
para utilizar dados crowdsourcing.
Em Ludwig et al. [12], foi desenvolvido um aplicativo
m
ovel chamado Rose, que recomenda rotas a partir de um
ponto de interesse do usu
ario. Por exemplo, se o usu
ario
digita comer pizza o recomendador retorna uma lista de

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

sugest
oes contendo os restaurantes que vendem pizza. O
usu
ario escolhe qual restaurante ele deseja ir, o recomendador calcula a rota a partir do local atual do usu
ario ate
o restaurante, considerando qual o transporte p
ublico mais
pr
oximo do usu
ario para lev
a-lo ao seu ponto de destino.
Essa recomendaca
o exibe ao usu
ario o hor
ario de partida
dos
onibus, assim o usu
ario saber
a se haver
a tempo de chegar `
a parada a tempo de tomar o o
nibus ou n
ao. Caso o
usu
ario perca o o
nibus, o aplicativo faz uma busca de outro
mais pr
oximo ou recomenda ao usu
ario esperar outro o
nibus ou, ate mesmo, se deslocar a pe ate o seu destino de
interesse.
Holone et al. [9] propuseram o OurWay, um sistema de
recomendaca
o de rotas que visa auxiliar pedestres que utilizam cadeiras de rodas ou pais que caminham com carrinhos de bebe a transitarem no ambiente urbano. O sistema
OurWay foi disponibilizado em vers
ao m
ovel para que as
pessoas, de forma colaborativa, possam relatar os lugares
que apresentam problemas nas calcadas, como obst
aculos e
falta de acessibilidade. Assim o usu
ario, antes de tracar uma
rota pode identificar os lugares que tenham esses problemas
e ent
ao ter a chance de evit
a-los. Holone conclui seu trabalho afirmando que, mesmo havendo poucos relatos referentes
aos lugares com problemas, seu sistema foi capaz de gerar
rotas eficases aos usu
arios.
Embora as pesquisas citadas sejam de grande import
ancia no que diz respeito `
a sistemas de informaca
o que d
ao
suporte ao uso do sistema de transporte p
ublico e mostrem
a import
ancia da acessibilidade para pessoas com deficiencia visual, elas n
ao investigam soluco
es especficas para recomendaca
o de rotas de
onibus para esses usu
arios levando em
consideraca
o o nvel de acessibilidade dos pontos de parada
dos o
nibus. Dessa forma, na pr
oxima seca
o discutiremos os
resultados do feedback obtido a partir de um question
ario
aplicado a 27 usu
arios do transporte p
ublico com deficiencia
visual.

3.

QUESTIONRIO SOBRE ACESSIBILIDADE E USO DO TRANSPORTE PBLICO

A fim de compreender as principais necessidades relacionadas ao uso do transporte p


ublico por pessoas com deficiencia visual, no perodo de Fevereiro a Maio de 2014 foram coletados feedback de 27 deficientes visuais que utilizam
transporte p
ublico coletivo por meio de um question
ario elaborado. O question
ario foi submetido a e-mails de grupos
de usu
arios com deficiencia visual. Os participantes foram
convidados a responder algumas quest
oes a respeito de sua
experiencia no uso de transportes p
ublicos e, a partir das
respostas obtidas e do conhecimento identificado na literatura, foram estabelecidas as principais caractersticas para o
recomendador de rotas de o
nibus. Nesta sec
ao apresentamos
resultados preliminares relacionados a
` an
alise das respostas
recebidas, objetivando levantar os principais requisitos para
implementaca
o do sistema de recomendaca
o de rotas de o
nibus para deficientes visuais.
A primeira caracterstica importante a ser destacada diz
respeito a
` interaca
o com o recomendador. Dentre os participantes do question
ario, todos utilizam leitores de tela como
tecnologia assistiva e somente alguns utilizam display braile.
Assim, o recomendador foi projetado de forma que a rota de
o
nibus pudesse ser lida por um software leitor de tela. Para

128

tanto, a rota ser


a descrita de maneira textual na interface,
de forma que as paradas de o
nibus sejam identificadas, bem
como outras informac
oes importantes disponibilizadas aos
usu
arios.
Quando arguidos sobre as principais dificuldades e desafios
encontrados para se deslocar no ambiente urbano, os participantes relataram, principalmente, problemas relacionados
a informaco
es sobre o estado de conservaca
o dos locais, a
falta de sinal sonoro nos sem
aforos, as calcadas irregulares
ou inexistentes, as obstruco
es nas vias e nas calcadas, a falta
de piso t
atil e a falta de informaco
es sobre a localizaca
o e as
linhas de o
nibus. Dessa forma, conforme ser
a apresentado
na Seca
o 4, a arquitetura do sistema de recomendac
ao de
rotas de o
nibus preve o uso de um dicion
ario de palavras
para identificar, a partir do conte
udo de mensagens sobre as
condico
es de acessibilidade dos locais, potenciais problemas
que afetem o deslocamento de pessoas com deficiencia visual
no ambiente urbano e, em particular, nos locais pr
oximos a
`s
paradas de o
nibus.
Outra quest
ao e sobre o uso de tecnologia (aplicativo ou
dispositivo eletr
onico) para planejar o deslocamento urbano
por parte dos deficientes visuais usu
arios do transporte p
ublico, a partir da qual foi possvel perceber que a maioria
dos participantes n
ao fazem uso de tecnologias para essa tarefa. Dentre os participantes que faziam uso de tecnologia,
pode-se perceber que o uso de GPS para se localizar e bastante comum e que, sempre que alguma informaca
o sobre a
acessibilidade de um local e necess
aria para planejamento do
deslocamento urbano, essa informaca
o e conseguida a partir
de outros usu
arios que j
a tenham passado por esse local ou
que estejam nele, conforme pode ser verificado pelas declarac
oes seguintes.
As u
nicas informaco
es que me ajudam em minha caminhada s
ao passadas por outros usu
arios
que venham a me rodear conforme meu trajeto;
(. . . ) pesquiso como chegar, onde buscar orientaco
es, quando preciso de o
nibus pesquiso pelas
linhas que terei de usar, etc.
Perguntou-se tambem sobre como as informaco
es a respeito das condico
es de acessibilidade de um ponto na cidade
s
ao adquiridas e, novamente, foi indicado que as pessoas
s
ao as principais fontes de informaca
o. Respostas tais como
(. . . ) atraves de conversas com outras pessoas (. . . ) e
(. . . ) por meio de terceiros que j
a tenham se locomovido
pelo local (. . . ) s
ao exemplos das respostas tpicas sobre
como a informaca
o a respeito da acessibilidade e adquirida
pelos participantes. Tais respostas reafirmam a import
ancia
de se considerar o uso de inteligencia coletiva para indicar
as facilidades de acesso em diferentes pontos da cidade.
Os participantes foram tambem questionados sobre suas
percepco
es a respeito da utilidade de um recomendador de
rotas que considerasse as condico
es de acessibilidade nas vias
p
ublicas.
N
ao sei bem se um dispositivo a mais seria interessante, mas sim um sistema online de consulta
importante para impedir por exemplo
(. . . ); E
possveis transtornos.; Caso eu pudesse visualizar o local com antecedencia, para eu programar
qual rota eu faria. Acharia bem v
alido isso, se
fosse real, e n
ao apenas na suposica
o.

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Dessas afirmaco
es e possvel perceber que, na considerac
ao dos participantes, e interessante uma soluca
o que permita planejar previamente a rota de o
nibus, considerando
as condico
es de acessibilidade de cada local que dever
a ser
visitado.
Assim, neste trabalho explora-se quest
oes relacionadas a
`
tarefa de auxiliar usu
arios com deficiencia visual a planejarem seus deslocamentos urbanos usando o sistema p
ublico de
transporte. Para enderecar tais quest
oes, prop
oe-se um Re
comendador de Rotas de Onibus.
Esse recomendador calcula
rotas de o
nibus passveis de serem utilizadas por um usu
ario, considerando os nveis de acessibilidade das localidades
pr
oximas `
as paradas de o
nibus. As informaco
es necess
arias
a
`s recomendaco
es ser
ao obtidas por meio de crowdsourcing,
seja a partir da mineraca
o dados de redes sociais (como o
Twitter, por exemplo), como por meio de um aplicativo especfico para publicaca
o de mensagens sobre as facilidades
de acesso presentes em cada local. Na seca
o seguinte, detalhamos o sistema de recomendaca
o de rotas de o
nibus.

4.

RECOMENDADOR DE ROTAS DE NIBUS

O recomendador de rotas de o
nibus proposto neste artigo
faz parte de um conjunto de recursos computacionais que
est
ao sendo desenvolvidos paralelamente, com o objetivo de
oferecer tecnologias assistivas a pessoas com deficiencia visual. Tais tecnologias s
ao inter-relacionadas, pois h
a dependencia entre os dados gerados por cada uma delas. No
caso do recomendador de rotas de o
nibus, e essencial que as
mensagens obtidas por crowdsourcing sejam pre-processadas
e classificadas para servir de entrada para o recomendador.
Na subseca
o seguinte, apresentamos os principais componentes que interagem com o recomendador de rotas de o
nibus
proposto.

4.1

Contexto para o recomendador

A Figura 1 mostra os elementos externos ao recomendador


que geram dados necess
arios ao seu funcionamento. Sumariamente, as etapas funcionais necess
arias a
` tarefa de recomendaca
o s
ao as seguintes:
1. Usu
arios de transporte p
ublico coletivo, sejam eles deficientes visuais ou n
ao, ao constatar a existencia (ou
ausencia) de facilidades de acesso nos locais pr
oximos
a
`s ou nas pr
oprias paradas de o
nibus, registram essas
informaco
es, seja em uma aplicaca
o especfica para esse
fim, seja em redes sociais de que o usu
ario participa,
por exemplo, o Twitter.
2. Um minerador e respons
avel por coletar essas mensagens, extrair os dados relativos a
`s facilidades de acesso
usando um dicion
ario de palavras e classific
a-los de
acordo com a localizaca
o e o nvel de acessibilade do
ponto;
3. A partir da classificac
ao, o minerador deve gerar um
modelo baseado em regras com o seguinte formato:
<Usu
ario, Latitude, Longitude, Nvel de Acessibilidade>, onde Usu
ario e quem classificou o nvel de acessibilidade do ponto em quest
ao, Latitude e Longitude
definem a localizaca
o para o qual o registro foi feito e
Nvel de Acessibilidade define um valor numerico entre

129

Figura 1: Fluxo de execu


c
ao do sistema para recomenda
c
ao de rotas
0 e 3, em que 0 indica que nenhum item de acessibilidade est
a disponvel naquele ponto e 3 indica que todos os itens de acessibilidade mapeados pelo dicion
ario
de palavras est
ao disponveis. Para os pontos em que
o nvel de acessibilidade e desconhecido ou n
ao informado, e atribudo o valor padr
ao NULL. O modelo ent
ao, gerado pelo minerador servir
a como entrada para
o recomendador de rotas de o
nibus;
4. Quando um usu
ario desejar consultar uma rota, ele informar
a a origem e o destino do seu trajeto, utilizando
interface pr
opria. O recomendador oferecer
a sugest
oes
de trajetos, tomando como base o nvel de acessibilidade registrado por usu
arios com perfil similar ao seu,
baseado no conceito de filtragem colaborativa.
importante notar que o foco deste artigo e apresentar
E
o recomendador de rotas de o
nibus e que, portanto, o algoritmo utilizado pelo minerador para processar textualmente
as mensagens e calcular o nvel de acessibilidade de cada
ponto est
a fora do escopo da nossa discuss
ao. Como a arquitetura do sistema e modular, o recomendador de rotas e
capaz de trabalhar com qualquer minerador, desde que este
gere como sada o modelo esperado. As mensagens sobre
os nveis de acessibilidade s
ao descritas por uma interface
que permite um usu
ario relacionar uma mensagem sobre a
acessibilidade de um dado ponto de latitude e longitude.
Sendo assim, para este artigo, assume-se que os nveis
de acessibilidade representam com algum grau de confiabilidade, a opini
ao dos usu
arios a respeito da acessibilidade dos
pontos de parada de o
nibus. A seguir, definiremos formalmente o algoritmo utilizado para o recomendador de rotas,
mostrando como a utilidade de uma rota pode ser calculada
para um usu
ario, considerando os nveis de acessibilidade dos
pontos da via urbana anotados de maneira colaborativa.

4.2

Recomendador de Rotas de nibus

Em sua formulaca
o mais comum, o problema de recomendac
ao e reduzido ao problema de se estimar a import
ancia

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

de itens que n
ao sejam conhecidos pelo usu
ario [17]. No
caso da recomendaca
o de rotas de o
nibus para usu
arios com
deficiencia visual, n
ao se trata de estimar a import
ancia de
itens que n
ao sejam conhecidos pelo usu
ario, mas sim de
estimar a import
ancia de itens (rotas de o
nibus) que maximizem a utilidade (acessibilidade, autonomia e seguranca)
para o usu
ario. Seja C o conjunto de todos os usu
arios e S
o conjunto de rotas possveis de serem recomendadas2 . Seja
r uma funca
o que denota a utilidade de uma rota s para
um usu
ario c, i.e, r : C S R , onde R e um conjunto
ordenado de n
umeros reais n
ao negativos. Assim, para cada
usu
ario c C, deseja-se escolher rotas s0 que maximizem a
utilidade para o usu
ario, baseado no nvel de acessibilidade
registrado por usu
arios com perfis similares.
Para o recomendador de rotas, a utilidade de uma rota
e dada pelos nveis de acessibilidade dos locais pr
oximos a
`s
paradas de o
nibus pertencentes a
` rota. Portanto, a funca
o r
depende de se determinar uma forma de combinar os valores
de nveis de acessibilidade anotados por todos os usu
arios e
um limiar de dist
ancia dos pontos anotados ate as paradas
de o
nibus. Para cada parada de o
nibus, o nvel de acessibilidade ser
a estimado de acordo com a media dos nveis
de acessibilidade dos locais (pontos de latitude e longitude)
pr
oximos metros da parada, os quais foram anotados pelos usu
arios. Assim, gera-se uma matriz de nveis de acessibilidade, em que cada entrada ser
a dada por E = ec,sj ,
calculada a partir dos nveis de acessibilidade anotados pelo
usu
ario c e que interferem na parada de o
nibus sj s, sendo
s {sj : sj Us } e Us o conjunto de paradas de o
nibus da
rota s. Se consideramos w(c, px,y ) o nvel de acessibilidade
aferido pelo usu
ario c em um ponto de coordenadas (x,y), a
entrada ec,sj pode ser calculada por:
P
ec,sj =

(x,y)j

w(c, px,y )

|(x, y) j |

(1)

sendo sj uma parada de o


nibus na rota s sendo recomendada, de forma que a utilidade de uma rota s para um usu
ario c possa ser calculada por dada por:
rc,s =

rc,sj ,

(2)

sj Us

na qual j e o conjunto de coordenadas distante no m


aximo metros da parada de o
nibus sj .
A formulaca
o apresentada e semelhante a
`s funco
es de
agregaca
o apresentadas na literatura como sendo valores tpicos de utilidade de um item recomendado [1], no entanto
se diferencia ao incorporar o ndice relacionado a
`s paradas
de
onibus individuais de uma rota, cuja soma das utilidades
resulta na utilidade de toda a rota. Outra quest
ao relevante refere-se a
` necessidade de se considerar um limiar de
dist
ancia para que determinada anotaca
o sobre o nvel de
acessibilidade de um local se relacione a determinada parada de o
nibus. Esse limiar e dado pela utilizaca
o explicita
do valor de j no c
alculo das entradas matriz de nveis de
acessibilidade.
2
Para efeito de recomendaca
o, considera-se uma rota como
um conjunto ordenado de, no mnimo duas paradas de o
nibus (origem e destino), incluindo paradas de o
nibus intermedi
arias nas quais o usu
ario dever
a fazer baldeaca
o para
chegar ao local desejado

130

Cada elemento do espaco de usu


ario C e definido com um
perfil de usu
ario, que inclui caractersticas relevantes para a
recomendaca
o (como, por exemplo, preferencias de facilidades de acesso tais como rampas, sinais sonoros, pisos t
ateis,
etc.). Sistemas de recomendaca
o por filtragem colaborativa
tentam predizer a utilidade de rotas para um usu
ario particular baseado nas rotas que foram previamente avaliadas
por outros usu
arios. Mais formalmente, a utilidade rc,s ) de
uma rota s para um usu
ario c e estimada baseada nas utilidades rcj ,s da rota s determinadas pelos usu
arios cj C,
os quais sejam similares ao usu
ario c.
A utilidade rc,sj de uma parada de o
nibus sj na rota s
para um usu
ario c pode ser computada como uma agregaca
o
dos nveis de acessibilidade das paradas da rota s pelos N
usu
arios mais similares ao usu
ario c. Isso significa que uma
rota s e composta por um conjunto de paradas de o
nibus
sj , cada qual com um nvel de acessibilidade determinado.
Assim, a utilidade de uma parada de o
nibus sj para um
usu
ario c e descrita por:
rc,sj = aggr rc0 ,sj = k

c0 C

sim(c, c0 ) rc0 ,sj ,

(3)

c 0 C

na qual C representa o conjunto de N usu


arios que s
ao
similares ao usu
ario c que tenham avaliado a acessibilidade
das paradas sj da rota s {sj : sj Us } e k e um fator de
normalizaca
o.
A dist
ancia de similaridade entre os usu
arios c e c0 ,
0
sim(c , c), e uma medida de dist
ancia essencial e e usada
como um peso, i.e., quanto mais similar os usu
arios c e c0
s
ao, maior o peso para o fator rc0 ,s da Equaca
o 3. No caso
do recomendador de rota de o
nibus, o perfil de cada usu
ario
c C pode ser descrito como um vetor no qual, cada dimens
ao, representa o valor da dependencia de uma determinada
facilidade de acesso. Pode-se, ent
ao, utilizar um valor de dist
ancia vetorial como valor de sim(c0 , c). Se considerarmos

c como o vetor representando os valores para a dependencia de cada facilidade de acesso para o usu
ario c, podemos
calcular a dist
ancia entre os perfis dos usu
arios c0 e c usando
o cosseno do
angulo entre esses vetores.
O recomendador considera as paradas de o
nibus de origem, de destino e todos os pontos intermedi
arios do percurso, desde que o usu
ario necessite realizar baldeac
ao naquela parada. Sendo assim, se um usu
ario escolhe um trajeto
que passa por cinco diferentes paradas de o
nibus, porem n
ao
far
a troca de o
nibus durante o percurso, apenas os pontos
de origem e destino ser
ao considerados. Caso o usu
ario deseje, ele tambem poder
a deliberadamente incluir paradas na
rota. O fluxo de execuca
o do recomendador e o seguinte:
O usu
ario c, por meio da interface, insere os dados
referentes ao ponto de origem e ao ponto de destino;
A interface faz uma solicitaca
o ao recomendador de
rota de o
nibus, enviando os par
ametros passados pelo
usu
ario;
O recomendador de rotas armazena a matriz E
de nveis de acessibilidade, cujas entradas ec,sj
s
ao calculadas a partir da Equaca
o 1;
O recomendador processa os par
ametros e calcula cada
rota s, sendo uma rota uma lista de paradas de o
nibus
sj calculadas a partir da Equaca
o 3;

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Para cada rota s, o recomendador, calcula a ordem para serem apresentadas de acordo com a
Equaca
o 2;
O recomendador gera uma resposta contendo informac
oes sobre as rotas s e seus respectivos valores de rc , s;
Uma interface gr
afica assistiva recebe a resposta proveniente do recomendador e apresenta ao usu
ario.
A seguir, ser
a demonstrado um cen
ario de aplicaca
o para
o recomendador, de maneira que seja possvel perceber como
a formalizaca
o apresentada pode ser utilizada em um cen
ario
real de aplicaca
o.

5.

CENRIO DE APLICAO

Para validar a utilizaca


o do esquema de recomendaca
o
descrito, foi idealizado um cen
ario tomando como base dados reais de linhas de o
nibus da cidade de Curitiba - PR.
Os dados disponveis dizem respeito a
`s linhas de o
nibus Expresso, que circulam em canaletas exclusivas, e a
`s paradas

dessas linhas, tambem conhecidos como estaco


es tubo. E
importante destacar que o recomendador de rotas de o
nibus
projetado poderia ser executado em qualquer outro cen
ario,
desde que houvessem disponveis os dados georreferenciados
de linhas de o
nibus do local e de paradas dessas linhas.
Sup
oe-se que usu
arios registraram informaco
es de acessibilidade em vias p
ublicas, seja em perfis de redes sociais ou
em interface assistiva pr
opria para esse fim. Sup
oe-se ainda
que o m
odulo minerador, a partir dessas informac
oes, produziu dados no formato <Usu
ario, Latitude, Longitude, Nvel
de Acessibilidade>, conforme esperado pelo recomendador.
A Tabela 1 mostra um exemplo dos resultados trazidos pelo
minerador. Esses dados servir
ao como base para a apresentaca
o do cen
ario proposto.
Cada vez que o recomendador recebe novas entradas a partir do minerador (novas linhas para a Tabela 1), as paradas
de o
nibus afetadas pelos novos registros s
ao identificadas.
Com base nos valores referentes a
` latitude e longitude dos
pontos, o recomendador identifica quais s
ao as paradas de
o
nibus em um raio de (em metros) do ponto. Para este
cen
ario, utilizamos = 500m. Para os dados contidos na
Tabela 1, tem-se que os pontos registrados pelos usu
arios
influenciam no c
alculo da acessibilidade de 3 estaco
es tubo:
as linhas de 1 a
` 4 da tabela, se referem aos pontos pr
oximos
da Estaca
o Tubo UTFPR, as linhas de 5 a
` 8 se referem aos
pontos pr
oximos da Estaca
o Tubo Jardim Bot
anico e as linhas de 9 a
` 12 se referem aos pontos pr
oximos da Estac
ao
Tubo Sete de Setembro.
Tabela 1: Modelo baseado em regras gerado pelo
minerador, mostrando exemplo de pontos anotados
pelos usu
arios
Usu
ario
c1
c1
c2
c3
c1
c2
c2
c3
c1
c1
c2
c3

Latitude
-25.438439
-25.439773
-25.439294
-25.439638
-25.438371
-25.438575
-25.439640
-25.437625
-25.439609
-25.440897
-25.440713
-25.438746

Longitude
-49.268569
-49.267847
-49.267890
-49.267491
-49.238304
-49.237778
-49.238926
-49.237778
-49.271646
-49.271453
-49.270444
-49.272515

Nvel Acess.
2
1
2
1
3
2
1
2
1
2
1
2

Os nveis de acessibilidade de cada parada de o


nibus sj ,
de acordo com a opini
ao de cada usu
ario c s
ao determinados
pela Equaca
o 1. A Tabela 2 mostra a matriz de nveis de
acessibilidade, para cada parada de o
nibus avaliada pelos
usu
arios.
Tabela 2: Nveis de acessibilidade de cada parada
de
onibus sj , determinados com base nos nveis de
acessibilidade anotados por cada usu
ario.
Usu
ario
c1
c2
c3
...

s1
1,5
2,0
1,0

s2
1,5
1,0
2,0

s3
3,0
1,5
2,0

...
...
...
...

A matriz de nveis de acessibilidade e, ent


ao, utilizada
pelo recomendador, para calcular a utilidade de uma rota
para um determinado usu
ario, permitindo a recomendaca
o
da melhor rota com base nos nveis de acessibilidade identificados por usu
arios com perfis similares.
Para exemplificar a recomendaca
o, sup
oe-se que um usu
ario c4 deseja deslocar-se utilizando o transporte p
ublico coletivo. Para esse exemplo, considere que o usu
ario c4 sair
a
do seu ponto de origem Universidade Tecnol
ogica Federal
do Paran
a (UTFPR) de Curitiba, para chegar ao ponto de
destino Jardim Bot
anico de Curitiba. Para isso, o usu
ario
c4 acessa a interface apresentada na Figura 2. Essa interface foi desenvolvida baseada nos princpios estabelecidos
pela WCAG 3 , para receber os dados de entrada para o recomendador. A partir dessa interface, o usu
ario pode inserir
um ponto de origem e um ponto de destino.

Figura 2: Entrada de origem e destino no prot


otipo
de interface
Assim que recebe os par
ametros de entrada (pontos de
origem e destino), o recomendador localiza as tres paradas de
o
nibus mais pr
oximas da origem e as tres paradas de o
nibus
mais pr
oximas do destino, utilizando a API do Google Maps.
Para o exemplo, de acordo com a API, as tres estaco
es tubo
mais pr
oximas da origem s
ao Estaca
o Tubo UTFPR (s1 ,
na Tabela 2), Estaca
o Tubo Alferes Poli/Catedral da Fe e
Estaca
o Tubo 7 de Setembro (s2 , na Tabela 2). As estaco
es
tubo mais pr
oximas do destino s
ao Estaca
o Tubo Jardim
Bot
anico (s3 , na Tabela 2), Estaca
o Tubo Urbano Lopes e
Estaca
o Tubo Hospital Cajuru. Alem do nome das estaco
es,
s
ao recuperadas informaco
es para cada estaca
o tubo, tais
como o tempo gasto a pe, em minutos, do ponto de origem
ou de destino definido pelo usu
ario ate a estaca
o tubo e a
3
O WCAG e um manual de recomendaco
es que explica
como deixar o conte
udo da Web mais acessvel a pessoas com deficiencia visual e pode ser encontrado em
http://www.w3.org/TR/WCAG20/

131

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

dist
ancia (em quil
ometros) do ponto de origem ou de destino
ate a estaca
o tubo.
Em seguida, o recomendador traca rotas combinando as
paradas pr
oximas da origem com as paradas pr
oximas do
destino, totalizando 9 combinaco
es de rotas, como mostra
na Figura 3. O resultado das 9 combinaco
es de rotas s
ao
geradas pela API do Google Maps, sendo a mesma respons
avel por oferecer tambem dados como dist
ancia, tempo do
percurso e se h
a ou n
ao pontos intermedi
arios na rota. Para
cada uma das rotas, calcula-se a utilidade para o usu
ario c4
utilizando a Equaco
es 2 e 3.
A Equaca
o 3 e respons
avel por definir a similaridade de
perfil usu
ario c4 com os demais usu
arios. Para o exemplo, sup
oe-se que sim(c1 , c2 ) = 1, 5, sim(c2 , c2 ) = 1, 0,
sim(c3 , c4 ) = 2, 0.

Figura 3: Combina
c
ao das 9 rotas possveis quando
n
ao h
a paradas intermedi
arias entre a origem e o
destino.
Em seguida, o recomendador utiliza a Equaca
o 2, para
determinar a utilidade rc,s de cada uma das rotas selecionadas. Por raz
ao de simplicidade, ser
a exemplificado apenas o
c
alculo de utilidade para o usu
ario c4 de duas rotas, a saber:
(i) Estaca
o Tudo UTFPR (s1 ) como origem e Estaca
o Tudo
Jardim Bot
anico (s3 ) como destino; e (ii) Estac
ao Tubo 7 de
Setembro (s2 ) como origem e Estaca
o Tudo Jardim Bot
anico
(s3 ) como destino.
Para c = c4 e s = s1,3
rc,s1 = k [(1, 5 1, 5) + (1, 0 2, 0) + (2, 0 1, 0)]
rc,s3 = k [(1, 5 3, 0) + (1, 0 1, 5) + (2, 0 2, 0)]
rc4 ,s1,3 = rc,s1 + rc,s3
e, para c = c4 e s = s2,3
rc, s2 = k [(1, 5 1, 5) + (1, 0 1, 0) + (2, 0 2, 0)]
rc,s3 = k [(1, 5 3, 0) + (1, 0 1, 5) + (2, 0 2, 0)]
rc4 ,s2,2 = rc,s2 + rc,s3
Assim, c
alculo da utilidade de uma rota s no recomendador e determinado pela soma das utilidades de cada parada de o
nibus contida na rota, pertencentes ao conjunto
Us . Alem disso, o recomendador considera um fator maior
para usu
arios que possuem necessidades (perfis) semelhantes. Uma possvel extens
ao do modelo e a inclus
ao do nvel
de acessibilidade dos pr
oprios veculos que atendem a
`s paradas de
onibus.
Depois de combinadas as estaco
es para gerar as rotas, o
resultado obtido e apresentado na Tabela 3. Nesta tabela, a
primeira coluna refere-se `
a identificaca
o da rota (R), seguida
do nome da estaca
o tubo de origem (ETO), a dist
ancia do
trajeto (em quil
ometros) do ponto de origem ate estaca
o

132

tubo de origem (D(Km)), o nome da estaca


o tubo de destino
(ETD), a dist
ancia do trajeto (em quil
ometros) da estaca
o
tubo de destino ate o ponto de destino (D(Km)), o tempo
gasto de o
nibus, em minutos, entre uma estaca
o tubo ate a
outra (T(m)) e a utilidade da parada de o
nibus sj para o
usu
ario c (rc,sj ).

Tabela 3: Resultado das rotas


R
1

ETO
7 de Setembro
Rebou
cas
UTFPR

D(Km) ETD
0,4
Jardim
Bot
anico

D(Km) T(m)
0,7
18

rc,sj
1,725

0,1

0,7

1,625

Jardim
Bot
anico

13

De acordo com a sada do recomendador, o trajeto com


paradas de o
nibus mais acessveis seriam as Estaco
es Tubo
7 de Setembro (origem) e Jardim Bot
anico (destino), dado
pela utilidade da parada de o
nibus (rc,sj ). Como pode se
observar pelos resultados da tabela, o trajeto recomendado
n
ao e, necessariamente, o mais r
apido, porem, e o que oferece mais condico
es de acessibilidade, de acordo com seu
perfil e com a opini
ao de outros usu
arios com perfis semelhantes. O resultado apresentado na Tabela 3 dever
a ser,
ent
ao, apresentado em uma interface assistiva, para que o
mesmo julgue, com base nas informaco
es disponveis, se a
rota sugerida e a que mais se adequa a
`s suas necessidades
naquele momento.

6.

CONCLUSES

Este artigo apresentou um algortimo de filtragem colaborativa que se baseia em informaco


es provenientes das massas
sobre o nvel de acessibilidade das paradas de
onibus. O objetivo do algoritmo e recomendar rotas de o
nibus para pessoas com deficiencia visual severa, baseando-se no perfil dos
indivduos e nas peculiaridades da sua deficiencia. Um cen
ario de aplicaca
o foi utilizado para mostrar o funcionamento
do algoritmo de recomendac
ao, que recebe como entrada
um conjunto de pontos georeferenciados e os nveis de acessibilidade aferidos pelos usu
arios para, ent
ao, recomendar
um conjunto de rotas para um usu
ario. Nesse algoritmo, a
opini
ao de usu
arios com perfis similares s
ao utilizadas para
predizer a recomendaca
o de rotas de o
nibus, no entanto, em
trabalhos futuros deseja-se considerar no algoritmos outras
quest
oes que possam influenciar na recomendaca
o, tais como
a dist
ancia a ser percorrida e os nveis de acessibilidade dos
veculos (
onibus) a serem utilizados na rota. Nas pr
oximas
etapas do desenvolvimento deste trabalho ser
ao realizadas
sess
oes de avaliaca
o centrada no usu
ario para determinar a
eficiencia do algoritmo proposto.
O pr
oximo desafio de pesquisa consiste na definica
o da
interface assistiva para apresentaca
o das recomendac
oes.
Como pode-se perceber pela Tabela 3, a quantidade de informaco
es retornadas dificulta a tomada de decis
ao, j
a que
o usu
ario com deficiencia visual, usando, por exemplo, um
leitor de tela, precisaria armazenar mentalmente todos os
dados para compar
a-los e decidir sobre o melhor trajeto.
Assim, e necess
ario estilos de interaca
o adequados para a
apresentaca
o desses resultados, de forma que a pessoa com
deficiencia visual tenha, de fato, autonomia para decidir dentre os trajetos recomendados, o que mais se adequa a
`s suas
necessidades fsicas e cognitivas.
A respeito do question
ario com feedbacks sobre o uso de

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

transportes por deficientes visuais, um trabalho de pesquisa


paralelo est
a concentrado em realizar uma an
alise qualitativa com o intuito de identificar os principais problemas
apontados por deficientes visuais a respeito do servico p
ublico de transporte. Os resultados dessa an
alise tambem
ser
ao discutidos com a comunidade em trabalhos futuros.
Com esta pesquisa, espera-se contribuir para a discuss
ao sobre como um recomendador por filtragem colaborativa
pode ser modelado de forma a auxiliar pessoas com deficiencia visual a utilizarem o sistema p
ublico de transporte de
maneira mais efetiva, segura e aut
onoma.

7.

AGRADECIMENTOS

O autor Marlon Fernandes Antonio agradece `


a PROGRAD (Pr
o-Reitoria de Graduaca
o e Educaca
o Profissional)
da Universidade Tecnol
ogica Federal do Paran
a, pelo incentivo e apoio financeiro para a realizaca
o desta pesquisa.

8.

REFERNCIAS

[1] G. Adomavicius and A. Tuzhilin. Toward the next


generation of recommender systems: A survey of the
state-of-the-art and possible extensions. IEEE Trans.
on Knowl. and Data Eng., 17(6):734749, June 2005.
[2] M. Araujo, J. Oliveira, M. Jesus, M. S
a, P. Santos,
and T. Lima. Transporte p
ublico coletivo: discutindo
acessibilidade, mobilidade e qualidade de vida.
Psicologia & Sociedade, 23(1):574582, Dezembro
2011.
[3] S. Azenot, S. Prasain, A. Borning, E. Fortuna,
R. Ladner, and J. Wobbrock. Enhancing independence
and safety for blind and deaf-blind public transit
riders. In Proceedings of the SIGCHI Conference on
Human Factors in Computing Systems, pages
32473256, May 2011.
[4] A. P. Chaves, I. Steinmacher, and V. Vieira. Social
networks and collective intelligence applied to public
transportation systems: A survey. In VIII Simp
osio
Brasileiro de Sistemas Colaborativos, 2011.
[5] B. Ferris, K. Watkins, and A. Borning. Location-aware
tools for improving public transit usability. IEEE
Pervasive Computing, 9(1):1319, Jan.-March 2010.
[6] Z. M. Fornaziero S. Estudo das dificuldades
encontrados pelas pessoas com deficiencia visual no
uso do transporte coletivo. In XIV Encontro Latino
Americano de Iniciaca
o Cientfica e X Encontro
Latino Americano de P
os-Graduac
ao Universidade
do Vale do Paraba, 2012.
[7] K. Hara, S. Azenkot, M. Campbell, C. L. Bennett,
V. Le, S. Pannella, R. Moore, K. Minckler, R. H. Ng,
and J. E. Froehlich. Improving public transit
accessibility for blind riders by crowdsourcing bus stop
landmark locations with google street view. In
Proceedings of the 15th International ACM
SIGACCESS Conference on Computers and
Accessibility, pages 16:116:8, October 2013.
[8] K. Hara, V. Le, and J. Froehlich. A feasibility study of
crowdsourcing and google street view to determine
sidewalk accessibility. In Proceedings of the 14th
International ACM SIGACCESS Conference on
Computers and Accessibility, pages 273274. ACM,
October 2012.

133

[9] H. Holone, G. Misund, and H. Holmstedt. Users are


doing it for themselves: Pedestrian navigation with
user generated content. In Next Generation Mobile
Applications, Services and Technologies, 2007.
NGMAST 07. The 2007 International Conference on,
pages 9199, Sept 2007.
[10] J. howe. The rise of crowdsourcing, wired, 2006.
[11] D. A.-Y. Kashif Ali, T. J. Ali Ejaz, and H. S.
Hassanein. Crowdits: Crowdsourcing in intelligent
transportation systems. In Wireless Communications
and Networking Conference (WCNC), pages 3307
3311, April 2012.
[12] B. Ludwig, B. Zenker, and J. Schrader.
Recommendation of personalized routes with public
transport connections. In Intelligent Interactive
Assistance and Mobile Multimedia Computing,
volume 53, pages 97107, 2009.
[13] J. L. Monteiro. Os desafios dos cegos nos espacos
sociais: um olhar sobre a acessibilidade. In IX
ANPED SUL 2012 - Semin
ario de Pesquisa em
Educaca
o da Regi
ao Sul, 2012.
[14] S. H. Norgate. Accessibility of urban spaces for
visually impaired pedestrians. Proceedings of the ICE Municipal Engineer, 165(4):231 237, December 2012.
[15] S. Prasain. Stopfinder: Improving the experience of
blind public transit riders with crowdsourcing. In The
Proceedings of the 13th International ACM
SIGACCESS Conference on Computers and
Accessibility, pages 323324, October 2011.
[16] P. T. V. Resende and P. R. Sousa. Mobilidade urbana
nas grandes cidades brasileiras: um estudo sobre os
impactos do congestionamento. In Simp
osio de
administrac
ao da produc
ao, logstica e operac
oes
internacionais, FGV.
[17] B. Sarwar, G. Karypis, J. Konstan, and J. Riedl.
Item-based collaborative filtering recommendation
algorithms. In Proceedings of the 10th International
Conference on World Wide Web, WWW01, pages
285295, New York, NY, USA, 2001. ACM.
[18] S. H. K. Soltania, M. Shamb, M. Awangb, and
R. Yaman. Accessibility for disabled in public
transportation terminal. Procedia - Social and
Behavioral Sciences, 35(0):8996, December 2012.

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Folksonomias Representam Conceitualizaes


Compartilhadas de Domnio?
Josiane M. Pinheiro, Cesar Augusto Tacla
Universidade Tecnolgica Federal do Paran (UTFPR)
Av. Sete de setembro 3165, CEP 80230-901
Curitiba PR Brasil
+55 44 3310-4685

jmpinhei@din.uem.br, tacla@utfpr.edu.br

Ao associarem as mesmas tags aos mesmos recursos os usurios


constroem um vocabulrio consensual para um determinado
conjunto de recursos que pode ser representativo em um domnio,
como mencionado por vrios autores [12, 16, 20, 23, 30, 31], e
pode ser visto como uma forma simples de conceitualizao
compartilhada especificada na forma de uma lista de termos (tags,
neste caso).

ABSTRACT
This paper presents a method for assessing whether folksonomies
are shared conceptualizations useful (or not) for conceptual
modeling. A method based on the Mika's tripartite model (of
actors, concepts and instances) extracts a folksonomy related to a
knowledge domain from social applications. The hypothesis is
that whether folksonomies are shared conceptualizations then
their use in conceptual modeling should reduce the number of
divergences among actors when they elicit terms to be part of the
model, a concept map. Controlled experiments of conceptual
modeling were done with experimental groups that received tags
extracted from tagging data from Delicious and control groups
that received terms extracted from web pages tagged in Delicious.
The results shows that experimental groups had less divergence
(mean) in the elicitation of terms when compared to control
groups, but in the model these divergences not had significant
differences.

Vrias abordagens usam dados dos STCs para construir algum tipo
de representao de conhecimento considerada consensual (por
exemplo, vocabulrio compartilhado, agrupamento de tags
semelhantes, taxonomia, ontologia) [2, 6, 13, 16, 20, 23, 25, 27, 28,
31]. Esta representao de conhecimento pode ser utilizada tanto
para melhorar o prprio sistema de tagging (na busca,
desambiguao, recomendao de tags, entre outras tarefas)
quanto para representar o conhecimento necessrio a uma
aplicao ou para descrever algum domnio. Em muitas
abordagens essa representao considerada consensual chamada
de folksonomia [8]. No entanto, poucos trabalhos avaliam essa
representao por meio de experimentos com usurios [3, 22, 30,
31]. Alm disso, a maioria das abordagens avaliam a
representao para o objetivo para o qual ela foi criada, e no se
ela realmente consensual ou compartilhada por alguma
comunidade de usurios.

Categories and Subject Descriptors


I.2.6 [Artificial Intelligence]: Learning Knowledge acquisition.
H.3.3 [Information Storage and Retrieval]: Information Search
and Retrieval Information filtering.

General Terms

A suposio deste trabalho que se esse conhecimento derivado


dos STCs realmente representa uma conceitualizao
compartilhada, ele pode ser til na obteno de modelos
conceituais de consenso. A especificao do modelo conceitual
um artefato concreto que permite aos atores envolvidos no
processo de construo do modelo compreender o domnio,
atingir consenso sobre o significado das entidades representadas e
se comunicar [11]. O modelo conceitual a concretizao da
conceitualizao e do modelo mental construdos pelas pessoas
sobre algum domnio. Por isso, na passagem de modelos mentais
para modelos conceituais entra em cena o problema do gargalo de
aquisio de conhecimento, que agravado quando o nmero de
atores envolvidos no processo grande (e/ou a quantidade de
fontes de informao), causando um aumento no nmero de
divergncias e interaes para resolv-las.

Algorithms, Design, Experimentation.

Keywords
Keywords are your own designated keywords.

1. INTRODUO
Nos Sistemas de Tagging Colaborativo (STC), como Delicious e
Bibsonomy, usurios associam termos (tags) de forma livre a
recursos da Web (URLs, vdeos, msicas, entre outros). Esta
associao de termos a um recurso na Web feita por um usurio
chamada de categorizao ou etiquetagem (do ingls tagging).
Um recurso pode ser categorizado por vrios usurios com
quantos e quais termos eles acharem convenientes para
representar aquele recurso. O fato interessante que, apesar de
no existir um vocabulrio controlado, depois de certo tempo
(mais ou menos 100 categorizaes) as tags utilizadas pelos
usurios para etiquetar um recurso parecem estabilizar [9, 12, 23].

Este trabalho investiga se as folksonomia realmente representam


conceitualizaes compartilhadas de certos domnios. Se esse o
caso ento o uso de folksonomias no processo de especificao
colaborativa de modelos conceituais deve reduzir o nmero de
divergncias entre os atores, facilitando o atingimento de
consenso. proposto um mtodo de extrao de folksonomia dos
dados do STC baseado no modelo tripartite de Mika [20]. Para
avaliar se essas folksonomias representam conceitualizaes
compartilhadas de um dado domnio, experimentos controlados de

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

134

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

eles, a folksonomia uma estrutura extrada dos dados do STC


por meio de algum algoritmo. Esta definio ser utilizada ao
longo deste trabalho e o algoritmo proposto neste trabalho para
extrair a folksonomia do STC descrito na prxima seo.

modelagem conceitual foram realizados e seus resultados so


descritos neste artigo.
Este artigo est organizado da seguinte forma: A seo 2 descreve
algumas abordagens que extraem conhecimento dos STCs e como
essas abordagens avaliam essa estrutura. A seo 3 descreve os
conceitos de STC e folksonomia e a seo 4 descreve o mtodo de
extrao de folksonomia proposto. A seo 5 mostra as bases de
dados do STC utilizadas neste trabalho e os testes realizados nelas
e a seo 6 descreve como foram obtidos os dados de controle. A
seo 7 descreve o processo de experimentao, a seo 8 mostra
os resultados de experimento, e as sees 9 e 10 trazem as
concluses e trabalhos futuros respectivamente.

Formalmente, um STC uma qudrupla S = {U, T, R, Y}, na qual:


U, T e R so conjuntos finitos de Usurios, Tags e Recursos
respectivamente e Y uma relao ternria entre eles de forma
que Y = {y | y U x T x R}. Neste trabalho, uma Folksonomia
uma propriedade emergente de um STC e que pode ser
representada como um conjunto F = {S, T, C, A}, onde: S um
STC, T T, e C = {({ti, tj}, p) | ti, tj T e ij, p +}, sendo p
o peso do relacionamento gerado pelo algoritmo de extrao A.

2. ABORDAGENS QUE EXTRAEM


CONHECIMENTO DOS STCs

4. MTODO DE EXTRAO DE
FOLKSONOMIAS

Existem inmeras abordagens que exploram os dados dos STCs.


Algumas delas utilizam medidas de similaridade e tcnicas de
clusterizao para derivar grupos de tags relacionadas [2, 4, 18].
Em [24] os autores utilizam tcnicas de KDD (Knowledge
Discovery and Data Mining) para descobrir regras de associao
entre tags. Em [25] so utilizados modelos de subsuno para
derivar rvores de tags. Transformaes e anlise de redes so
utilizadas em [20] e outras ontologias so utilizadas em [3] para
derivar grafos de tags relacionadas. Algumas medidas de
similaridade e divergncia so utilizadas em [23] para derivar
grafos de tags relacionadas e comunidades de usurios. Outras
abordagens constroem hierarquias ou taxonomias de tags
baseando-se em medidas de similaridade e centralidade [14],
regras de associao [17] e tcnicas de clusterizao [22]. Formal
Concept Analysis (FCA) tambm utilizada para derivar
conjuntos de tri-conceitos em [16] e modelos semnticos
probabilsticos baseados no algoritmo EM (ExpectationMaximization) so utilizados para representar o relacionamento
entre tags, recursos e usurios como vetores multidimensionais
em [31]. Algumas abordagens derivam ontologias de tags [5] e
algumas delas so baseadas em fontes externas de informao,
como a WordNet1, por exemplo [1, 7, 28].

O mtodo de extrao de folksonomias recebe como entrada uma


representao inicial de algum domnio de interesse e uma
qudrupla S representando algum STC e produz como sada uma
folksonomia F para o domnio. O mtodo possui trs etapas, como
mostra o fluxograma da Figura1. A primeira analisa se existem
dados suficientes no STC para representar o domnio desejado. Se
a resposta da primeira etapa for positiva, a segunda etapa realiza
uma limpeza nas tags do STC, e a terceira etapa processa os dados
do STC e produz a folksonomia sobre o domnio de interesse.

Avaliao do CTS em
relao ao domnio

Para saber se o conhecimento derivado por estas abordagens pode


ser considerado consensual sobre um domnio de conhecimento, o
conhecimento extrado dos dados do STC precisa ser usado e
avaliado por um nmero significativo de usurios. Porm, a
maioria das abordagens revisadas faz uma anlise informal que
discute sobre o quo coerente as folksonomias so para o
propsito para o qual ela foi criada (recomendao de tags, busca
no espao de tags, representao sobre o domnio) [1, 2, 14, 16,
17, 2325, 27, 28]. Apenas alguns autores realizam avaliaes
com usurios [3, 20, 22, 30, 31] e, mesmo assim, nenhum deles
avalia se o conhecimento resultante da abordagem consensual
sobre um domnio.

Dados
suficientes
?

[no]

[sim]
Limpeza de tags

[tags limpas]
Extrao de
Folksonomia

3. STC E FOLKSONOMIA
Alguns autores tratam os termos folksonomia e STC quase como
sinnimos [7, 10, 15, 16, 24]. Outros autores no fazem questo
de diferenciar os dois termos, mas concordam com a definio de
folksonomia sugerida por Wander Wal [8] de taxonomia
construda pelo povo.

Folksonomia do
domnio (F)

O fato que apesar de existir consenso implcito na coletividade


das tags, no existe nos dados de tagging nenhuma estrutura
explcita [19, 26]. Alguns autores deixam claro que os dados de
todos os usurios do STC so diferentes da folksonomia [29]. Para
1

Dados do STC
(S)

Domnio desejado

Fig. 1. Fluxograma do Mtodo de Extrao de Folksonomias.


A descrio inicial do domnio desejado atualmente um termo
simples (palavra) que deve ser relevante no domnio. Qualquer

http://wordnet.princeton.edu/

135

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

STC pode ser usado como entrada para o mtodo de extrao de


folksonomias, desde que ele possua a relao Y.
A primeira etapa tem como objetivo determinar se existem
dados suficientes no STC para produzir uma folksonomia com
termos que possuem significado para o domnio no final do
processo de extrao2. Se a anlise concluir que os dados so
insuficientes3, o mtodo termina. Nesse caso, usurios do mtodo
podem testar outros termos para representar o domnio ou outro
STC para o mesmo domnio. Caso a anlise conclua que os dados
do STC so suficientes para gerar informaes teis para o
domnio, ento a segunda etapa do mtodo executada.

relativamente simples, modelando os dados como


hipergrafos
e
realizando
algumas
transformaes
consolidadas da rea de anlise de redes nestes hipergrafos;

todo conhecimento produzido provm dos dados do STC,


no includo o vis de utilizar uma fonte de dados externa
como, por exemplo, a WordNet, utilizada por outras
abordagens.

Um grafo bipartite (com dois tipos de ns, tambm chamado


2-mode network) conectando tags a recursos construdo.
Cada conexo pesada pelo nmero de vezes que a tag foi
usada para categorizar o recurso em Y;

O grafo bipartite dicotomizado usando um limiar = 1


(arestas com peso < 1 so eliminadas e arestas com
peso >= 1 ficam com peso = 1);

Este passo do processo ainda no foi automatizado. No


momento, os dados resultantes do mtodo de extrao so
analisados por humanos para determinar se eles so coerentes
para o domnio.

O grafo de tags normalizado por normalizao geomtrica.


As arestas entre duas tags so pesadas pela fora da conexo
entre elas.

O mtodo de extrao foi testado em duas bases de dados do


Delicious5. A menor foi coletada em 2006 pelo Grupo de
Sistemas Interativos Inteligentes da Universidade Estadual de
Maring6 e possui mais de 181 mil tags, 763 mil recursos e 650
usurios que produziram quase 4 milhes de taggings. A maior,
tambm foi coletada em 2006 pelo projeto TAgora 7 e possui
aproximadamente 2,5 milhes de tags, 17 milhes de recursos e
532 mil usurios que produziram 140 milhes de taggings. Nessa
ltima, apesar da quantidade de dados ser bastante expressiva,
tanto as URLs (recursos) quanto os usurios so anonimizados.
A limpeza de tags e o algoritmo de extrao foram testados para
diversos domnios, entre eles food, travel, animal,
database, security, fashion e biology. As 50 tags com
maior peso ligadas a esses termos na folksonomia geral foram
extradas e avaliadas manualmente considerando o significado
delas para o domnio. Por exemplo, as tags recipe e salt tem
um significado claro para domnio food, enquanto a tag
design no tem um significado diretamente ligado ao domnio.
Alguns domnios como food, travel e database produziram
termos que possuem um significado claro para o domnio
desejado. Outros, porm, por possurem poucos dados no STC, ou
por representarem domnios muito abrangentes produziram
poucos termos com significado para o domnio.

A abordagem de Mika foi implementada da seguinte forma:

5. BASES DE DADOS DOS STCs E TESTES

A terceira etapa do mtodo utiliza os dados do STC com as tags


limpas para efetivamente extrair a folksonomia. Existem vrias
abordagens na literatura que extraem conhecimento dos dados de
tagging como pode ser visto na seo 2. A princpio adotou-se
como algoritmo de extrao a abordagem de Mika [20] para
produzir as folksonomias e realizar os primeiros experimentos. A
escolha pela implementao da abordagem de Mika justifica-se
por alguns fatores:
uma das abordagens mais citadas na literatura;

O grafo bipartite dividido em 2 grafos (1-mode network).


O primeiro com os recursos e o segundo com as tags e o
relacionamento entre eles. Esta transformao obtida pela
multiplicao da matriz que representa o grafo pela sua
transposta;

A estrutura resultante pode ser considerada como uma


folksonomia geral. A folksonomia sobre o domnio desejado pode
ser gerada dos relacionamentos da folksonomia geral. So
selecionadas as 50 tags que possuem maior peso na conexo com
o termo inicial (entrada do mtodo). No momento, a folksonomia
gerada est sendo avaliada apenas como um vocabulrio
compartilhado, sem levar em considerao os relacionamentos
entre as tags. Sabe-se que existe um relacionamento entre as tags,
mas somente com os dados do STC no possvel saber qual o
significado dessa relao. Para nomear esses relacionamentos
seria necessrio consultar uma base de dados lxica (por exemplo,
WordNet ou YAGO4), mas isso poderia introduzir algum vis ao
experimento, j que o relacionamento encontrado na base pode
no ser o relacionamento pretendido pelos usurios do STC.

A segunda etapa do mtodo de extrao realiza uma limpeza nas


tags (T) do STC. Esta limpeza necessria porque os usurios dos
STCs so livres para utilizar qualquer termo como tag. Isso faz
com que os usurios criem tags com termos diferentes, mas com o
mesmo significado. Por exemplo, os termos semantic_web,
semanticWeb, semantic-web e *Semantic_Web tem o
mesmo significado que o termo Semantic Web. O processo de
limpeza de tags passa todos os caracteres da tag para minsculo,
remove qualquer caractere que no seja letra ou nmero (tambm
caracteres asiticos ou arbicos), e coloca todas as tags na forma
singular. O processo tambm remove stop words como, todo,
toread, reference, readme.

Foram realizados testes pilotos (com 5 ou menos participantes)


para os domnios food e travel com o intuito de refinar a
metodologia de experimentao assim como o algoritmo de
extrao de folksonomias. A prxima seo descreve como os
dados usados pelos grupos de controle foram coletados.

6. DADOS DE CONTROLE
A folksonomia pode ser considerada um conhecimento consensual
por ser fruto da ao coletiva de seus usurios (por possuir a

Segundo alguns testes realizados para alguns domnios


diferentes utilizando-se o mtodo de extrao proposto, a
proporo de n de taggings/n usurios diretamente ligados
tag que representa o domnio deve ser maior do que 12, para
que o mtodo produza tags com significado para o domnio.

4
5
6
7

136

http://www.mpi-inf.mpg.de/yago-naga/yago/
https://delicious.com/
http://din.uem.br/gsii/
http://www.tagora-project.eu/

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

dimenso social) [12, 16, 23, 30]. Para colocar essa dimenso
coletiva em evidncia, elas devem ser comparadas a conjuntos de
dados que no possuem essa caracterstica. Sendo assim, um
algoritmo que processa pginas Web foi implementado para
coletar e contar a frequncia dos termos nessas pginas.

linguagem visual de modelagem bastante simples e de fcil


entendimento. Em mapas conceituais, cada tripla conceitorelao-conceito forma uma afirmao sobre o domnio que est
sendo modelado.
Para bloquear a varivel relacionada competncia dos
participantes em modelagem conceitual, dois dos mapas
conceituais produzidos no treinamento por cada participante
foram avaliados por um dos autores deste trabalho. Os
participantes foram classificados em pouca, mdia ou boa
experincia em modelagem. O objetivo desta classificao
formar grupos experimentais e de controle com experincia de
modelagem mais homognea possvel.

Foram processadas as mesmas pginas Web (recursos) presentes


no grafo bipartite de tags e recursos gerado pelo algoritmo de
extrao de folksonomias. Somente as pginas acessveis e com
informaes textuais foram processadas (passaram por
tokenizao, retirada de stop words, lematizao e contagem de
frequncia dos termos). Finalmente, os termos resultantes desse
processamento foram contados e ordenados por frequncia. Os 5
termos mais frequentes de cada pgina foram selecionados para
construir um grafo bipartite que conecta os termos s suas pginas
Web. Cada aresta foi pesada pela frequncia do termo na pgina.
Esse grafo foi dicotomizado, dividido em um grafo de termos e
um de pginas e normalizado da mesma forma descrita na seo 4
para obter o grafo de tags e recursos da folksonomia. Foram
selecionados os 50 termos com maior peso conectados ao termo
inicial que representa o domnio.

O experimento durou aproximadamente 2 horas e comeou com a


recepo dos participantes, a explicao do experimento e a
assinatura dos mesmos de um termo de consentimento. Tambm
foram apresentados o domnio objeto da modelagem (travel) e a
questo focal. A partir deste ponto os participantes comearam a
tarefa experimental que foi dividida em 6 etapas:
1.

Os participantes foram convidados a escrever termos que eles


considerassem convenientes sobre o domnio para responder
a questo focal. Esses termos so chamados de Vocabulrio
Inicial do participante (VI) e permitem analisar
posteriormente o impacto dos dados disponibilizados como
entrada, chamados de Termos Sugeridos (TS), sobre a
elicitao de termos de cada participante.

2.

Os participantes foram convidados a analisar uma lista de


termos sugeridos (TS) e decidir se o termo deve fazer parte
da elicitao de termos sobre o domnio ou no, ou se
desconhecem o termo.

3.

Os participantes foram convidados a analisar novamente os


termos do VI, agora sob a influncia de TS, e decidir se eles
ainda devem fazer parte da elicitao de termos sobre o
domnio ou no.

4.

Os participantes foram convidados a elaborar uma lista de


termos elicitados sobre o domnio. Uma lista com todos os
termos de TS e do VI que foram marcados como elicitados
nas etapas 2 e 3 mostrada ao participante como a elicitao
de termos sobre o domnio. O participante est livre para
remover ou inserir algum termo que julgar conveniente (esta
a fase de elicitao de termos).

5.

Usando a lista de termos elicitados (etapa 4), os participantes


foram convidados a elaborar um mapa conceitual usando a
ferramenta CMapTools (est a fase de modelagem).

6.

Os participantes foram convidados a responder um


questionrio de experincia para avaliar sua prpria
percepo de conhecimento sobre o domnio travel,
experincia em modelagem e s dificuldades encontradas
durante o experimento.

7. EXPERIMENTAO
Experimentos de modelagem conceitual colaborativa esto sendo
feitos para avaliar se as folksonomias extradas do STC realmente
representam uma conceitualizao compartilhada sobre um
domnio, a ponto de reduzir o gargalo de aquisio de
conhecimento e auxiliar os atores envolvidos na modelagem
conceitual a produzir modelos conceituais de consenso.
Participaram do experimento 68 alunos de graduao do curso de
Cincia da Computao (segundo e terceiro anos) e Bacharelado
em Informtica (quarto ano) da Universidade Estadual de
Maring. Eles foram divididos em 5 grupos experimentais e 5
grupos de controle formados por 7 participantes em mdia. Os
participantes produziram de forma individual um mapa
conceitual sobre o domnio travel, utilizando os dados de
entrada disponibilizados sobre o domnio. A questo focal
elaborada foi: Quando vamos viajar, com o que devemos nos
preocupar?. O domnio travel foi escolhido por ser um domnio
fora da rea de atuao dos participantes, e para o qual nenhum
deles deve ser especialista.
Dois conjuntos de dados so disponibilizados para comparao:
i) a folksonomia, produzida com base no mtodo de extrao de
folksonomias descrito anteriormente na seo 4, foi utilizada
pelos grupos experimentais; e ii) os termos extrados das pginas
que possuam texto endereadas pelas URLs que foram utilizadas
para construir a folksonomia, como descrito na seo 6, foram
utilizados pelos grupos de controle. A comparao entre os dois
conjuntos de dados feita principalmente pelo nmero de
divergncias geradas entre os participantes dos grupos quando
eles selecionaram termos para fazer parte da elicitao de termos e
do mapa conceitual.

8. RESULTADOS

O procedimento experimental possui duas etapas principais:


treinamento dos participantes e experimentao propriamente dita.
A etapa de treinamento teve como objetivo bloquear algumas
variveis identificadas em experimentos pilotos anteriores, como,
diferentes graus de conhecimento na linguagem, na ferramenta e
no mtodo de modelagem utilizados. Por isso, os participantes
foram treinados durante 2 horas para produzirem modelos
conceituais sobre vrios domnios, na forma de mapas
conceituais [21], utilizando a ferramenta CMapTools, e um
mtodo simples de elicitar termos e identificar ligaes entre eles.
Foram utilizados mapas conceituais, por ser tratar de uma

Dados coletados do experimento foram avaliados comparando o


nmero de divergncias geradas entre os participantes de cada
grupo tanto nos termos elicitados quanto no mapa conceitual. O
objetivo foi avaliar se a folksonomia representa um vocabulrio
consensual considerando somente os termos escolhidos e no seus
relacionamentos. Participantes selecionaram termos para compor
os artefatos gerados no experimento (IV, termos elicitados e o
mapa conceitual) e fizeram escolhas sobre os termos de TS (para
simplificar os termos escolhidos de TS tambm sero chamados
de artefato). Diferentes escolhas de termos para gerar os artefatos

137

SBSC 2014 Proceedings - Ongoing Research

precisamente,

p3

p4

p5

dnorm

% dnorm

p2

# Termos
Modelo

p1

% dnorm

Grupo

Tabela 1. Exemplo de divergncia para um grupo P e um


conjunto de termos T.

# Termos
Elicitados

Tabela 2. Nmero de participantes, nmero de termos e


divergncia mdia normalizada de cada grupo para os
artefatos produzidos no experimento.
% dnorm

O conjunto T formado pela unio de todos os termos


usados por pelo menos um dos participantes do grupo no
artefato. Portanto, cada participante P est associado a um
subconjunto de T.

# Termos
TS

% dnorm

O nmero mdio de divergncias em um artefato definido a


partir de um conjunto de participantes denotado por P e de
um conjunto de termos T.

# Termos
VI

grupos que utilizaram dados das pginas Web so os grupos de


controle. A Tabela 2 mostra que a divergncia mdia (assim como
os desvios padro) so menores para os grupos experimentais.
importante notar que os grupos experimentais produziram
artefatos com um nmero maior de termos. Essa uma tendncia
que os experimentos pilotos j mostravam.

# Grupo

foram
consideradas
divergncias.
Mais
divergncias so calculadas como a seguir:

October 6-9, 2014 - Curitiba, PR, Brazil

77 39,0

47 46,8

104 41,7

119 43,4

t1

65 39,5

47 47,5

86 45,3

80 49,6

t2

89 32,3

44 29,5

120 30,6

115 37,9

101 40,6

49 34,0

146 39,0

151 41,7

66 31,4

47 38,3

102 33,1

86 41,3

t3

0,5

t4

0,5

0,5

7,4 79,6 36,6 46,8 39,2 111,6 37,9 110,2 42,8

0,5 15,4

4,3 1,79

7,9

22,7

6,1

28,6

4,3

74 38,3

43 46,5

95 49,8

93 46,2

74 31,8

43 48,3

109 40,4

103 37,6

62 47,3

47 27,7

104 45,5

99 54,2

55 58,2

40 58,7

79 58,9

83 59,6

41 56,1

A Tabela 1 mostra um exemplo do clculo da divergncia em


relao a cada termo (coluna d) e do nmero mdio de
divergncias para um artefato arbitrrio. Cada linha ti representa
um termo e cada coluna pj representa um participante (p1 at p5).
Posies marcadas com 1 indicam que o termo ti foi selecionado
pelo participante pj (caso contrrio a posio marcada com
zero). O nmero na coluna d indica quo divergente a minoria:
na linha t1, p3 e p5 divergem de todos os outros participantes, na
linha t4, somente p2 diverge dos outros, e na linha t2 no existe
divergncia.

Termos das Pginas

Folksonomia

O valor mximo da divergncia depende do tamanho do grupo.


Por exemplo, grupos com 5 participantes tem divergncia mxima
igual a 2, isto , int(|P|/2). A ltima coluna (dnorm) da Tabela 1
mostra a divergncia normalizada conforme a Equao 1 que
varia de zero (nenhuma divergncia) a 1 (mximo valor da
divergncia):

As colunas em destaque da Tabela 2 mostram que os grupos


experimentais, que utilizaram a folksonomia, tiveram mdias de
divergncia (assim como os desvios padro) menores do que os
grupos de controle, que utilizaram os termos extrados das pginas
da Web. No entanto, para determinar se a diferena entre as
divergncias mdias encontradas so realmente significativas ou
aconteceram ao acaso necessrio aplicar o Teste t para
comparao de duas mdias. Para aplic-lo, necessrio que as
distribuies das amostras sejam consideradas normais e que se
saiba se as varincias entre os grupos so iguais ou diferentes. Em
seguida, mostram-se os passos at a realizao do Teste t. Todas
as anlises estatsticas foram feitas utilizando o software Action8.

(1)

(||/2)

A divergncia mdia calculada pela mdia aritmtica simples


dos valores na coluna d e dnorm, conforme a Equao 2. Ela mede
o grau de divergncia entre os participantes P em relao a um
conjunto T.

||

32 39,1

71 49,3

80 50,0

6,2 61,2 46,3 41,0 44,0

91,6 48,8

91,6 49,5

1,6 13,9 11,3 5,61 11,5

16,2

10,0

6,8

8,3

Pr-requisito 1: distribuio das amostras de divergncias devem


ser normais

A Tabela 1 mostra que dados os termos em T provenientes dos


artefatos produzidos por todos os participantes de P, foi detectada
uma divergncia absoluta de 1 (i.e. em mdia, um participante
diverge dos demais por termo) o que corresponde a uma
divergncia normalizada de 0,5 ou 50%. O pior caso de
divergncia seria dois participantes divergentes para cada termo ti.

10

Para determinar se a distribuio das amostras de divergncias


mdias so normais ou no foram realizados testes de ShapiroWilk com nvel de significncia de 95% sobre as amostras
reproduzidas na Tabela 3 para testar as seguintes hipteses:
h0, normal = os dados provm de uma distribuio normal.

(2)

h1, normal = os dados no provm de uma distribuio normal.

A Tabela 2 mostra o resultado do experimento por grupo: o


nmero de participantes (#Grupo), o nmero de termos (#Termos)
e a divergncia normalizada porcentual (%dnorm) calculada para
cada artefato (VI, TS, Termos Elicitados e Modelo). Os grupos
que utilizaram a folksonomia so os grupos experimentais e os

138

http://www.portalaction.com.br/

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

O Teste t realizado para as divergncias encontradas nos termos


elicitados resultou em um p-valor = 0,014 < 0,05. Portanto,
rejeita-se h0, elic e aceita-se a hiptese alternativa de que a mdia
das divergncias geradas nos grupos experimentais, que utilizaram
a folksonomia pode ser considerada menor do que mdia das
divergncias geradas nos grupos de controle.

Tabela 3. Amostras das divergncias dos Grupos


Experimentais (GE) e de Controle (GC) na Elicitao de
termos (E) e no Modelo (M).

GE

GC

G1

G3

G5

G7

G9

p-valor

41,67

45,35

30,63

39,04

33,09

43,42

49,58

37,83

41,72

41,28

G2

G4

G6

G8

G10

49,82

40,37

45,51

58,86

49,30

0,83

46,24

37,62

54,21

59,64

50,00

0,97

0,78

J o Teste t realizado para as divergncias encontradas nos


modelos resultou em um p-valor = 0,07 > 0,05. Portanto, aceita-se
h0, model de que a mdia das divergncias geradas nos grupos
experimentais e nos grupos de controle so iguais. Ou seja, no se
pode afirmar que os grupos experimentais geraram nmeros
diferentes de divergncias na produo dos modelos conceituais.

0,59
p-valor

Para comparar as mdias das divergncias dos dois grupos,


necessrio saber se as amostras possuem varincias iguais ou
diferentes. Foram realizados Testes F para duas varincias e
nvel de significncia de 95% sobre as amostras para testar as
seguintes hipteses:

Outro ponto a considerar na anlise dos dados da Tabela 2 que,


na mdia calculada, as divergncias geradas pelos grupos
experimentais, so menores do que as divergncias geradas pelos
grupos de controle, j no Vocabulrio Inicial (36,6% x 46,3%).
Esse fato gera a dvida de que a diferena na mdia das
divergncias dos termos elicitados e do modelo podem ser
consequncia das divergncias geradas em VI que foram
carregadas para os outros artefatos, e no influncia dos termos
sugeridos. Por isso, foi feita uma anlise das mdias de
divergncias geradas em VI, para determinar se elas realmente so
menores nos grupos experimentais. Sendo assim, temos as duas
hipteses:

h0, var = as varincias amostrais dos dois tipos de grupos so


iguais.

h0, VI = A mdia das divergncias geradas em VI igual no grupo


experimental e no grupo de controle.

h1, var = as varincias amostrais dos dois tipos de grupos so


diferentes.

h1, VI = A mdia das divergncias geradas em VI menor no grupo


experimental do que no grupo de controle.

Para as divergncias na elicitao de termos obtemos um p-valor


= 0,83>0,05 fazendo com h0, var seja aceita, ou seja, as varincias
amostrais no grupo experimental e de controle para as
divergncias encontradas nos termos elicitados podem ser
consideradas iguais.

As amostras de VI foram consideradas normais pelo teste de


Shapiro-Wilk (p-valor = 0,108>0,05 para os grupos experimentais
e p-valor = 0,597>0,05 para os grupos de controle) e as varincias
foram consideradas iguais para os dois tipos de grupos (pvalor=0,088>0,05).

Para as divergncias no modelo obtemos um p-valor = 0,23>0,05


fazendo com h0, var seja aceita, ou seja, as varincias amostrais no
grupo experimental e de controle para as divergncias encontradas
nos modelos tambm podem ser consideradas iguais.

O Teste t realizado para amostras independentes e varincias


iguais, com significncia de 95% para as hipteses h0, VI e h1, VI
resultou em um p-valor = 0,054>0,05 fazendo com que h0, VI seja
aceita, ou seja, a mdia das divergncias geradas em VI pelos
grupos experimentais pode ser considerada igual mdia das
divergncias geradas em VI pelos grupos de controle. Isso uma
evidncia de que as diferenas nas divergncias dos termos
elicitados e do modelo no devem ser consequncia das
divergncias geradas em VI, j que a mdia das divergncias
igual nos dois tipos de grupos.

Todos os p-valores para as quatro amostras testadas foram


maiores do que 0,05 fazendo com que h0, normal seja aceita, ou seja,
os dados de todas as amostras provm de uma distribuio
normal.
Pr-requisito 2: varincias das amostras de divergncias devem
ser iguais

Aplicao do teste T
Retomando as hipteses deste trabalho e considerando que nesse
experimento a folksonomia est sendo avaliada como vocabulrio
consensual, a hiptese foi desmembrada em:
h0, elic = A mdia das divergncias geradas nas elicitaes de
termos igual no grupo experimental e no grupo de controle.

Alm disso, foi feita uma anlise de correlao entre os conjuntos


de termos que constam em cada artefato nos dois tipos de grupos.
As duas matrizes de correlao calculadas pela Correlao de
Pearson so mostradas nas Tabelas 4 e 5 a seguir. A correlao
positiva varia entre 0 (nenhuma correlao) e 1 (totalmente
correlacionada). Sendo assim, quanto mais perto de 1 maior a
correlao entre as duas variveis.

h1, elic = A mdia das divergncias geradas nas elicitaes de


termos menor no grupo experimental do que o grupo de
controle.
h0, model = A mdia das divergncias geradas nos modelos igual
no grupo experimental e no grupo de controle.
h1, model = A mdia das divergncias geradas nos modelos menor
no grupo experimental do que o grupo de controle.

O que se pode observar nas Tabelas 4 e 5 que a correlao entre


VI e os termos elicitados e do modelo bem menor do que a
correlao de TS com os termos elicitados e do modelo. Sendo
assim, mesmo que a mdia das divergncias em VI fosse menor
nos grupos experimentais do que no grupo de controle, a
influncia de VI nesses artefatos pequena se comparada
influncia de TS (quase 3 vezes maior nos termos elicitados e
mais de 2 vezes maior no modelo). Outro aspecto a observar que
a correlao entre VI e os termos elicitados e do modelo bem
parecida nos dois tipos de grupos, no justificando a influncia de
VI na diferena das divergncias desses dois artefatos.

Sabendo-se que as distribuies das amostras so normais e que as


varincias entre os grupos podem ser consideradas iguais, pode-se
realizar o Teste t para determinar se a diferena entre as
divergncias mdias encontradas so realmente significativas ou
aconteceram ao acaso.
Como as amostras so independentes, foi realizado o Teste t para
amostras independentes e varincias iguais, com significncia de
95% para as hipteses h0, elic, h1, elic, h0, model, h1, model:

139

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

subconjunto dos termos elicitados no modelo, foram escolhidos


subconjuntos de termos diferentes para compor os modelos
individuais.

Tabela 4. Matriz de Correlao de Pearson para os termos


presentes nos artefatos produzidos pelos grupos experimentais
(folksonomia).
VI

TS

Elic

Model

VI

0,11

0,34

0,37

TS

0,11

0,96

0,89

Elic

0,34

0,96

0,95

Model

0,37

0,89

0,95

Foram calculadas as matrizes de correlao entre todos os termos


utilizados em cada artefato para cada grupo. Essa anlise nos
permite concluir que os termos sugeridos influenciam muito mais
a elicitao de termos e o modelo do que os termos do vocabulrio
inicial do participante. Essa pode ser uma evidncia de que quanto
mais consensual forem os termos sugeridos, menor pode ser o
nmero de divergncias geradas na elicitao de termos e no
modelo.

10. TRABALHOS FUTUROS


Outras anlises estatsticas devem ser feitas com os dados das
respostas do questionrio de experincia respondido pelos
participantes no final do experimento. O objetivo ser determinar
se a experincia em modelagem percebida pelo participante
influencia na escolha dos termos empregados na elicitao de
termos e no modelo. Novos experimentos devem ser realizados
com folksonomias geradas por outras abordagens consolidadas
como [2, 23], tanto para avaliar a folksonomia como vocabulrio
consensual como para avaliar os relacionamentos entre as tags.

Tabela 5. Matriz de Correlao de Pearson para os termos


presentes nos artefatos produzidos pelos grupos de controle
(pginas Web).
VI

TS

Elic

Model

VI

0,05

0,33

0,42

TS

0,05

0,94

0,85

Elic

0,33

0,94

0,95

Model

0,42

0,85

0,95

O processo de limpeza de tags e o processo de extrair termos das


pginas Web esto sendo melhorados, inclusive com a extrao de
bigramas. Outras mudanas podem melhorar o mtodo de
extrao de folksonomias: i) a representao do domnio desejado
(varivel de entrada) deve suportar um conjunto de termos ao
invs de apenas um (isso permitir que o domnio seja melhor
especificado); ii) a anlise da base de dados do STC para
determinar se existe dados suficientes para produzir uma
folksonomia com bons termos sobre o domnio deve ser
automatizada (atualmente esta anlise est sendo feita por
inspeo humana). Uma anlise da estabilidade das tags como
apresentado em [23] deve ser includa. Robu et al. [23] tentam
encontrar recursos para os quais o vocabulrio de tags se
estabiliza no tempo e, portanto, podem ser estveis sobre o
domnio. Para fazer isso, a base de dados do STC precisa da data
da categorizao que vai alm da relao Y do STC, sendo
necessrio incluir a dimenso tempo da categorizao.

Outro ponto que pode ser observado nas duas matrizes que os
termos de TS esto mais relacionados aos termos elicitados do que
os termos do modelo, e que apesar da diferena ser pequena, a
correlao de TS nos dois artefatos maior nos grupos
experimentais.

9. CONCLUSO
O objetivo deste estudo investigar se as folksonomias
representam conceitualizaes compartilhas de domnios ou no.
Se esse for o caso, ento grupos de modelagem que usam esses
dados para obter um modelo de algum domnio devem se deparar
com um nmero menor de divergncias do que grupos usando
outros dados que no tem a dimenso social dos dados
encontrados no STC.

Entre as limitaes deste trabalho podemos citar: i) o nmero de


amostras pequeno e a no variedade de domnios alvo dos
experimentos, o que deve ser resolvido com a realizao de outros
experimentos; ii) a no variedade de experincia dos participantes
(todos so estudantes), devido dificuldade de encontrar
voluntrios que possam realizar o experimento e iii) a
impossibilidade de validar a folksonomia gerada como
vocabulrio consensual perante a prpria comunidade que gerou
os dados do STC.

Um mtodo de extrao de folksonomias baseado no modelo


tripartite de Mika [20] foi implementado. A folksonomia
resultante foi avaliada em um experimento com 68 participantes
divididos e cinco grupos experimentais e cinco grupos de
controle.
Este trabalho tenta responder a seguinte questo:
As folksonomias extradas dos dados STCs ajudam os atores a
atingir consenso mais facilmente na especificao de modelos
conceituais quando comparadas a atores que utilizam dados
extrados de texto por meio de um algoritmo baseado na
frequncia dos termos?

11. AGRADECIMENTOS
Agradecemos Fundao Araucria pela bolsa de doutorado
concedida a Josiane M. Pinheiro durante o seu doutorado, no qual
este trabalho est sendo desenvolvido. Agradecemos tambm ao
professor Srgio R. P. da Silva que muito contribuiu para este
trabalho, mas que faleceu em maro/2014, antes de v-lo
concludo.

As divergncias geradas em todos os grupos foram calculadas e,


aps a anlise estatstica, podemos afirmar por meio do resultado
do Teste t que a mdia de divergncias nos termos elicitados foi
menor nos grupos experimentais do que nos grupos de controle.
Porm, nos termos utilizados para compor o mapa conceitual no
se pode afirmar que as divergncias geradas so diferentes nos
dois grupos. Isso provavelmente se deve ao fato de que os termos
elicitados no foram discutidos colaborativamente entre os atores
do grupo, como deveria acontecer em situao real, antes dos
participantes elaborarem seus mapas conceituais individuais.
Dessa forma, como a tendncia que os participantes utilizem um

12. REFERNCIAS
[1] Alves, H. and Santanch, A. 2013. Folksonomized ontology
and the 3E steps technique to support ontology evolvement.
Journal of Web Semantics. 18, 1 (Jan. 2013), 1930.

140

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

[2] Begelman, G. et al. 2006. Automated Tag Clustering:


Improving search and exploration in the tag space. Collaborative
Web Tagging Workshop at WWW06 (Edinburgh, Scotland, 2006).

[17] Lin, H. et al. 2009. An Integrated Approach to Extracting


Ontological Structures from Folksonomies. Proceedings of 6th
European Semantic Web Conference, ESWC 2009 (Creta, Grcia,
2009), 654668.

[3] Cantador, I. et al. 2011. Categorising social tags to improve


folksonomy-based recommendations. Journal of Web Semantics.
9, (2011), 115.

[18] Markines, B. et al. 2009. Evaluating Similarity Measures for


Emergent Semantics of Social Tagging. Proceedings of the 18th
International Conference on World Wide Web - WWW09 (2009),
641650.

[4] Cattuto, C. et al. 2008. Semantic Grounding of Tag


Relatedness in Social Bookmarking Systems. Proceedings of 7th
International Conference on The Semantic Web ISWC08 (2008),
116.

[19] Mathes, A. 2004. Folksonomies - Cooperative Classification


and Communication Through Shared Metadata. Library and
Information Science. (2004), 113.

[5] Chen, W. et al. 2010. Generating ontologies with basic level


concepts from folksonomies. Procedia Computer Science. 1, 1
(May 2010), 573581.

[20] Mika, P. 2007. Ontologies are us: A unified model of social


networks and semantics. Journal of Web Semantics. 5, 1 (Mar.
2007), 515.

[6] Damme, C. van et al. 2008. Deriving a Lightweight


Corporate Ontology from a Folksonomy: a Methodology and its
Possible Applications. Scalable Computing: Practice and
Experience - Scientific International Journal for Parallel and
Distributed Computing. 9, 4 (2008), 293301.

[21] Novak, J.D. and Caas, A.J. 2008. The Theory Underlying
Concept Maps and How to Construct and Use Them.
[22] Plangprasopchok, A. et al. 2010. Growing a Tree in the
Forest: Constructing Folksonomies by Integrating Structured
Metadata. 16h ACM SIGKDD Conference on Knowledge
Discovery and Data Mining (KDD) 2010 (2010).

[7] Damme, C. van et al. 2007. FolksOntology: An Integrated


Approach for Turning Folksonomies into Ontologies. IESWC
Workshop Bridging the Gap between Semantic Web and Web 2.0
(2007), 5770.

[23] Robu, V. et al. 2009. Emergence of consensus and shared


vocabularies in collaborative tagging systems. ACM Transactions
on the Web. 3, 4 (Sep. 2009), 134.

[8] Folksonomy Coinage and Definition: 2007.


http://vanderwal.net/folksonomy.html. Accessed: 2013-01-16.

[24] Schmitz, C. et al. 2006. Mining Association Rules in


Folksonomies. Lecture Notes in Computer Science - The Semantic
Web: Research and Applications (2006), 411426.

[9] Golder, S.A. and Huberman, B.A. 2006. The Structure of


Collaborative Tagging Systems. Journal of Information Science.
32, 2 (2006), 198208.

[25] Schmitz, P. 2006. Inducing ontology from Flickr tags.


Collaborative Web Tagging Workshop at 15th WWW06
Conference (Edinburgh, Scotland, 2006).

[10] Gruber, T. 2007. Collective knowledge systems: Where the


Social Web meets the Semantic Web. Journal of Web Semantics.
06, 01 (Dec. 2007), 413.

[26] Smith, G. 2008. Tagging: People-powered metadata for the


social web. New Riders.

[11] Guizzardi, G. 2005. Ontological Foundations for Structural


Conceptual Models. University of Twente, Enschede.
[12] Halpin, H. et al. 2007. The complex dynamics of
collaborative tagging. Proceedings of the 16th International
Conference on World Wide Web - WWW07 (2007), 211220.

[27] Specia, L. et al. 2007. Bridging the Gap Between


Folksonomies and the Semantic Web: An Experience Report.
Workshop Bridging the Gap between Semantic Web and Web 2.0,
European Semantic Web Conference (2007), 93106.

[13] Hamasaki, M. et al. 2007. Ontology Extraction using Social


Network. Proceeding of International Workshop on Semantic Web
for Collaborative Knowledge Acquisition (2007).

[28] Specia, L. and Motta, E. 2007. Integrating Folksonomies


with the Semantic Web. 4th European Semantic Web Conference
(Berlin Heidelberg, Germany, 2007), 624639.

[14] Heymann, P. and Garcia-Molina, H. 2006. Collaborative


creation of communal hierarchical taxonomies in social tagging
systems.

[29] Strohmaier, M. et al. 2012. Evaluation of Folksonomy


Induction Algorithms. Transactions on Intelligent Systems and
Technology. (2012).

[15] Hotho, A. et al. 2006. Information Retrieval in


Folksonomies: Search and Ranking. The Semantic Web: Research
and Applications, volume 4011 of LNAI (2006), 411426.

[30] Wu, H. et al. 2006. Harvesting social knowledge from


folksonomies. Proceedings of the seventeenth conference on
Hypertext and hypermedia - HYPERTEXT06. (2006), 111114.

[16] Jschke, R. et al. 2008. Discovering shared


conceptualizations in folksonomies. Journal of Web Semantics. 6,
1 (Feb. 2008), 3853.

[31] Wu, X. et al. 2006. Exploring social annotations for the


semantic web. Proceedings of the 15th International Conference
on World Wide Web - WWW06. (2006), 417426.

141

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

MoodleGroups: Um Aplicativo para Identificar as


Relaes Sociais entre Alunos em Ambientes Virtuais de
Aprendizagem
Dhanielly Lima

Bruno Gadelha

Jos Francisco Netto

Vitor Bremgartner

Universidade Federal do
Amazonas
Instituto de Computao
+55 92 3305-2808

Universidade Federal do
Amazonas
Instituto de Computao
+55 92 3305-2808

Universidade Federal do
Amazonas
Instituto de Computao
+55 92 3305-2808

Universidade Federal do
Amazonas
Instituto de Computao
+55 92 3305-2808

dhanielly@icomp.ufa
m.edu.br

bruno@icomp.ufam.e
du.br

jnetto@icomp.ufam.e
du.br

vitorbref@icomp.ufam
.edu.br

Aprendizagem (AVAs) que permitem a realizao de atividades


colaborativas e a interao entre os usurios. Porm, muitos
AVAs no possuem uma ferramenta para monitorar as interaes
entre os usurios, dificultando o diagnstico do professor a
respeito da turma. Para resolver este problema, o artigo apresenta
uma estratgia que faz uso de um Sistema Multiagente,
responsvel por analisar os fruns que os estudantes participam e
as mensagens trocadas entre os estudantes em um AVA, e
apresenta as informaes ao professor sob a forma de sociograma
por intermdio dos dispositivos mveis. Desta forma, o professor
pode visualizar a qualquer momento e em qualquer lugar as
interaes sociais de seus alunos dentro do curso, e adotar tticas
que promovam a insero social, visto que pode haver na turma
estudantes com dificuldades de socializar. Esta abordagem auxilia
o professor a promover a interao entre os estudantes e um
meio de construir o conhecimento do aluno.

ABSTRACT

With increasing use of Internet and Distance Education, the


common practice has been to use the Learning Management
System (LMS), enabling collaborative activities and interaction
among users. However, many LMS do not have a tool to monitor
the interactions among users, making diagnosis difficult about the
class by teacher. To solve this problem, this paper presents a
strategy that makes use of a Multi-Agent System responsible for
analyze forums in which students have participated and messages
that students have exchanged in a LMS, and displays the
information to the teacher by a shaped sociogram by means of
mobile devices. Thus, the teacher can view anytime and anywhere
social interactions of their students within the course, and adopt
tactics that promote social inclusion, since there may be in the
classroom students with difficulties in socializing. This approach
helps the teacher to promote interaction among students and is a
way to construct the student's knowledge.

Palavras Chave

AVA, Sistema Multiagente, Relao Social, Sociograma.

Categories and Subject Descriptors

I.2.11 [Artificial Intelligence]: Distributed Artificial Intelligence


--- intelligent agents, multiagente systems.
J.4 [Computer Applications]: Social and Behavioral Sciences --sociology.
K.3.1 [Computers and Education]: Computer uses in Education
--- distance learning.

1. INTRODUO

Com o crescente uso da Internet, a sociedade est se tornando


cada vez mais conectada rede, o que afeta as relaes
interpessoais, de trabalho e a educao [1]. Ao mesmo tempo,
pode-se dizer tambm que a Internet tem se transformado em uma
importante ferramenta para fins pedaggicos, devido ao avano
das Tecnologias de Informao e Comunicao (TICs) e pela
procura por plataformas educacionais, que possibilitam uma
interao entre alunos e professores, compartilhando o
conhecimento [2].

General Terms

Experimentation, Human Factors.

Keywords

LMS, Multi-Agent System, Social Relations, Sociogram.

A disseminao e adoo das TICs contribuem para a formao de


comunidades de aprendizagem que privilegiam a construo do
conhecimento, a comunicao, a formao continuada, a gesto
administrativa, pedaggica e de informaes [3]. Porm, algumas
TICs, entre elas os Ambientes Virtuais de Aprendizagem (AVAs)
possuem uma quantidade escassa de ferramentas para auxiliar os
professores no mbito das relaes sociais, dificultando desta
forma a promoo da insero social e da deteco dos grupos e
subgrupos dentro de uma disciplina. As TICs devem ento dar
suporte mediao e prover um ambiente onde estudantes e
professores pudessem estabelecer uma presena social [1].

RESUMO

Com o crescente uso da Internet e da Educao a Distncia, a


prtica comum tem sido utilizar os Ambientes Virtuais de
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

142

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

O fato de socializar os participantes de um curso importante,


dado que influencia e proporciona o compartilhamento do
conhecimento, o que caracteriza a Era do Conhecimento, que
marcada pela forte utilizao da Internet nas relaes humanas e
caracterizada pela valorizao e compartilhamento do
conhecimento, pela inovao como fator estratgico, pelo trabalho
colaborativo e o desenvolvimento de uma inteligncia coletiva
[4].

evoluiu para o que hoje conhecido como Anlise de Redes


Sociais ou Social Network Analisys (SNA). Os mtodos
sociomtricos quando so representados graficamente recebem o
nome de sociograma, que tambm podem ser chamados de
diagrama de relao social ou diagrama de rede social.
O objetivo do sociograma de acordo com Vaz [8] tornar a
leitura das relaes mais fcil. Desta forma, o sociograma deve
permitir a visualizao das relaes da maneira mais clara
possvel.

A fim de ilustrar a motivao dessa pesquisa, apresentado o


seguinte cenrio: Um professor ministra uma disciplina de um
curso de Educao a distncia (EaD) disponibilizando o contedo
e incentivando a interao entre os alunos atravs de um AVA e
suas ferramentas. Porm, o professor e os tutores que o auxiliam
notaram a baixa participao dos alunos nas discusses e o baixo
rendimento dos alunos nas atividades solicitadas no AVA. O
professor ciente de que se as interaes entre os alunos forem
incentivadas, mais motivados eles ficaro, o que resultar em uma
melhora no rendimento dos alunos na disciplina, uma vez que leu
o trabalho de Turoff [5] que mostra que um grupo tem uma
capacidade maior de gerar alternativas para um determinado
problema de forma criativa, levantando as vantagens e
desvantagens de cada uma delas e selecionando as alternativas
mais viveis para as tomadas de deciso. Assim, o professor
decide investigar como os alunos esto se relacionando dentro do
ambiente virtual a fim de tentar fazer com que esses alunos atuem
como um grupo. Para tanto, ele tenta verificar manualmente todas
as mensagens enviadas nos fruns de discusso e as mensagens
trocadas entre os alunos, e percebe que esse trabalho exige
dedicao e bastante tempo disponvel. Dado que em meio a
tantas ferramentas que so disponibilizadas pelo AVA, no h um
gerenciamento de forma automtica e inteligente no que diz
respeito s relaes sociais estabelecidas pelos alunos dentro do
curso. Ento, como ajudar esse professor?

Entre os softwares que elaboram sociogramas citamos: o NetDraw


[9], Weft QDA [10] e o NodeXL [11].
A Figura 1 um exemplo de sociograma que foi elaborado de
acordo com as relaes sociais de um usurio do Facebook [12], o
sociograma foi elaborado com o auxlio da ferramenta online
TouchGraph [13].

Figura 1. Exemplo de um Sociograma de um usurio da rede


social Facebook.

Considerando o cenrio descrito, este trabalho mostra o


desenvolvimento do aplicativo MoodleGroups, que voltado para
a educao e tem como finalidade identificar as relaes sociais
entre os alunos de um Ambiente Virtual de Aprendizagem. O
aplicativo ser acessado pelo professor por intermdio dos
dispositivos mveis, e como resultado ser mostrado o
sociograma dos alunos participantes do curso, obtido com o
auxlio dos Agentes Inteligentes (AIs).

Na Figura 1 os crculos representam as pessoas que fazem parte


do grupo de amizade do usurio x, e os grupos e subgrupos nos
quais as pessoas fazem parte, sendo destacados por cores
diferenciadas.
No sociograma da Figura 1 levado em considerao os amigos
do usurio x que mais postam em seus perfis e os que mais
possuem amigos em comuns com o usurio x. possvel detectar
tambm as pessoas que so pontes de relacionamento, ou seja, o
usurio de um determinado grupo (diferenciado pela cor) que est
conectado com um outro usurio de cor diferente. As pessoas que
interligam um grupo ao outro na sociometria recebem o nome de
ponte de relacionamento. Os grupos so formados pelas pessoas
que so amigas entre si, logo so aquelas pessoas que possuem o
outro usurio adicionado em seu Facebook tambm.

Atravs do MoodleGroups, professores podem visualizar as


interaes a qualquer momento e em qualquer lugar, visto que as
tecnologias proporcionam um grande impacto na aprendizagem,
de modo que os estudantes e professores podero mover-se cada
vez mais para fora da sala de aula em direo a um ambiente de
aprendizagem, real ou virtual, caracterizado por uma
aprendizagem contextualizada, personalizada e colaborativa [6].
Este artigo est estruturado da seguinte forma: as Sees 2 e 3
descrevem a fundamentao terica no qual se baseia o trabalho; a
seo 4 mostra os trabalhos relacionados; a seo 5 apresenta a
proposta, com o modelo arquitetural; a seo 6 apresenta a
avaliao funcional do aplicativo e por fim a seo 7 com as
consideraes finais.

Com isso, pode-se concluir que os sociogramas so


representaes grficas das relaes existentes em um grupo de
indivduos e, mais do que um mtodo de apresentao, os
sociogramas constituem um mtodo de explorao, uma vez que
possibilitam a identificao de fatos sociomtricos e a anlise
estrutural de uma comunidade [8].
Logo, a utilizao de sociogramas poderia auxiliar os professores
de um AVA tendo em vista que os mesmos no possuem um
mecanismo que lhe mostrem as interaes de forma grfica,
proporcionando uma viso geral e detalhada acerca das relaes
sociais que so estabelecidas no decorrer de um curso. Essas

2. A UTILIZAO DE SOCIOGRAMAS NA
EDUCAO A DISTNCIA

Conforme Moreno [7], o padro do universo social invisvel,


mas os grficos podem torn-lo visvel. A sociometria de Moreno

143

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

informaes so importantes ao professor, tendo em vista que a


mediao um fator chave na Educao a Distncia (EaD), e o
uso de recursos muda o conceito de presena tanto do professor
quanto do aluno [14]. A disponibilizao de sociogramas
proporcionaria ao professor a oportunidade de adotar medidas
preventivas de acordo com as representaes visuais, podendo
promover a socializao dos seus alunos que possuem
dificuldades em interagir, alm de promover a interao entre os
grupos existentes na disciplina.

grupo de estudantes tinham que resolver um problema. Desta


forma, a pesquisa consistiu em observar e analisar a colaborao
que ocorreu entre o grupo na resoluo do problema, levando em
considerando as mtricas do modelo 3C de colaborao.
O trabalho de Bartholo et al [21], apresentou um modelo,
denominado M-AVA, para apoiar a adaptao de AVAs
existentes para o contexto de dispositivos mveis. A partir da
concepo do M-AVA observou-se a necessidade de incluir uma
camada de adaptao na arquitetura de AVAs, a fim de que os
mesmos pudessem atender a demanda de novas tecnologias. Para
mostrar a viabilidade do uso do modelo de adaptao proposto,
foi apresentado no trabalho um estudo de caso em detalhes.

3. A UTILIZAO DE SISTEMAS
MULTIAGENTE NO CONTEXTO DA
EDUCAO A DISTNCIA

J o trabalho de Pimentel et al [23], mostra a utilidade do Modelo


3C em diferentes etapas do processo de desenvolvimento de
sistemas colaborativos do grupo de pesquisa do mesmo.
Mostrando a importncia do Modelo 3C nas anlises do
groupware a ser desenvolvido; no estabelecimento do foco para o
desenvolvimento de sucessivas verses do groupware num
processo iterativo e investigativo; e para o desenvolvimento de
arquitetura e componentes 3C.

Existe uma abordagem na Inteligncia Artificial Distribuda (IAD)


que tem como finalidade de sua pesquisa os agentes inteligentes,
esta abordagem a de Sistemas Multiagente (SMA) [15].
Para Jaques [16], quando um sistema formado por mais de um
agente, ele conhecido como SMA. A autora ainda afirma, que os
agentes so entidades autnomas que tm conhecimento de sua
existncia e da existncia dos demais agentes, por isso colaboram
uns com os outros para atingirem um objetivo comum dentro do
ambiente.

Foi apresentado por Silva et al [22], uma abordagem baseada em


agentes para recomendao sensvel ao contexto de Objetos de
Aprendizagem, a fim de aperfeioar o processo de ensino na
aprendizagem mvel.

Segundo Krupansky [17], um SMA uma coleo de agentes de


software que trabalham em conjunto, podendo cooperar ou
competir, ou ainda empreender alguma combinao de
cooperao e competio. O conceito de Krupansky[17] evoca a
noo de que os agentes agindo em conjunto so mais eficientes
do que agindo solitariamente.

Nos trabalhos de Bremgartner [2] e Jaques [16], foi utilizado na


abordagem os agentes inteligentes como soluo estratgica para
um determinado problema relacionado aos Ambientes Virtuais de
Aprendizagem.
Outro trabalho importante o de Saltz et al [24], que utiliza os
grafos a fim de obter uma anlise mais clara acerca das interaes
sociais dos alunos dentro de um AVA. No trabalho empregado o
conceito de redes sociais para realizar uma anlise das interaes
de cada aluno, obtendo como resultado um grafo social do
estudante que disponibilizado ao professor.

Os Agentes Inteligentes AI, segundo Wooldridge [18], quando


empregados em um sistema devem possuir as seguintes
caractersticas: autonomia, habilidade social, reatividade, pratividade. Desta forma, um agente um sistema computacional,
posicionado em algum ambiente, que capaz de agir com
autonomia flexvel visando atingir os objetivos para o qual foi
projetado [19].

E por fim o trabalho de Gerosa [25], que analisa profundamente


as interaes que ocorrem nos fruns de discusso, possibilitando
uma melhor coordenao dos professores para com os alunos. No
presente artigo investigado como melhorar o apoio
coordenao de um frum usando dispositivos mveis para
mitigar as dificuldades do mediador em seguir o status de um
frum.

Com base em tais informaes, a utilizao de agentes neste


contexto justifica-se pelo fato dos mesmos apresentarem uma
flexibilidade maior no tratamento dos elementos que compem o
sistema, deixando o sistema com um maior nvel de inteligncia e
atendendo da melhor forma as necessidades do aprendiz. Alm
disso, de acordo com Filho [20], vrios trabalhos incorporam
agentes de software aos AVAs com a finalidade de acrescentar
caractersticas de iniciativa por parte do ambiente e tornar esses
ambientes mais atrativos aos seus usurios.

5. MODELO ARQUITETURAL DA
APLICAO

A arquitetura do sistema proposto composta inicialmente por


alguns agentes, sendo estes: o agente professor, o agente
sociograma e os agentes de interao que ficam responsveis por
ler, coletar e analisar os dados de interao dos alunos em
mensagens e fruns de discusso, alm de um AVA e por um
banco de dados, onde esto salvas todas as informaes referentes
aos cursos, conforme ilustra a Figura 2.

4. TRABALHOS CORRELATOS

Vrios trabalhos analisam a interao dos usurios dentro do


AVA, e outros alm de realizar tal anlise, tambm incorporam
agentes de software a esses ambientes a fim de torn-los mais
atrativos aos seus usurios. Os trabalhos relacionados so
descritos a seguir.
O trabalho de Cordenonsi et al [1], apresentou uma anlise do
processo de colaborao em pequenos grupos de estudantes que
foram envolvidos em um ambiente virtual tridimensional, onde o

144

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

9
Informaes
Enviadas

Agentes de
Interao

Pedido de
Anlise

10
Sociograma
enviado
Solicita
Sociograma

Agente
Sociograma

Agente
Professor

SMA
Mediador

Obteno e coleta
de informaes

Visualizando a
interao

Interage com o sistema:


elaborando atividades;
formando grupos;
cadastrando alunos, etc/
Solicita Anlise

12

Exibe
anlise

Banco de Dados BD
Todas as informaes
so salvas no BD

11
Curso Especifico

5
2
Interao com
o sistema

Curso 1

Curso 2

...
Curso 3 ... Curso n
Cursos

1
AVA acessados por Dispositivos
Mveis

Alunos

Figura 2. Modelo Arquitetural do MoodleGroups.


De acordo com o modelo arquitetural da Figura 2, pode-se
observar o seguinte:

anlise das interaes dos alunos no AVA. Desta forma, os


agentes so acionados, seguindo a seguinte ordem: o agente
professor o primeiro agente a ser acionado, ele responsvel por
pegar a informao em forma de sociograma e mostr-la ao
mediador, ou seja, o agente professor solicita ao agente
sociograma o visual das interaes, que um sociograma dos
alunos matriculados no curso. Quando o agente sociograma
acionado ele repassa as informaes ao sistema implementado
com o auxlio da biblioteca Javascript D3 [26] usada para
montagem do sociograma. Sendo assim, os agentes de interao
so responsveis por ler, coletar e analisar os dados no banco de
dados, e repassar esses dados ao sistema responsvel, que aps
receber as informaes dos agentes de interao montar o
sociograma e repassar essa montagem de forma grfica para o
aplicativo, onde so vistas as informaes pelo professor.

1. Em um AVA pode-se ter vrios cursos de diferentes reas, que


so utilizados com a finalidade de capacitar as pessoas nos
diversos nveis do conhecimento, em que o AVA no presente
trabalho pode ser acessado por dispositivos mveis;
2. Para exemplificar melhor a proposta do projeto, utilizado um
curso especfico;
3. Este curso assim como os demais possui um mediador que
interage com o sistema elaborando atividades, cadastrando alunos
e formando grupos.
4. No curso tambm existem os alunos, que interagem com o
sistema respondendo as atividades propostas pelo mediador. Tais
atividades necessitam da interao do aluno com o ambiente e
consequentemente com os demais alunos do curso; esses alunos
podem interagir de diversas formas no sistema, como por exemplo
nos fruns de discusses e nas mensagens.

6. FUNCIONAMENTO DO SISTEMA

Os experimentos para a validao do MoodleGroups foram


realizados utilizando duas bases de dados, a primeira consistia de
uma base fictcia e a segunda foi uma base de dados de um curso
de Educao a Distncia de uma Instituio de Ensino Superior
(IES). A plataforma utilizada foi o Moodle [27].

5. As interaes so registradas nas tabelas do banco de dados. Ou


seja, tudo o que os alunos fazem, tal como: acessar o curso,
responder uma atividade, bater papo com outros colegas, e
publicar nos fruns, so registrados no banco de dados.

Os testes iniciais envolviam uma base de dados fictcia, com


apenas 20 alunos cadastrados, sendo um o professor e os demais
alunos participantes. J no segundo teste a base de dados era de

6-13. Se o professor por um acaso desejar saber como est o nvel


de afinidade/interao dos alunos entre si, ele dever solicitar a

145

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Android [28] de verses 4.0 em diante. Para ter acesso ao


aplicativo o usurio deve ser professor de um dos cursos
cadastrados no sistema. Ao acessar o curso atravs de um
dispositivo mvel o professor ter a sua disposio o sociograma
de sua turma, conforme mostra a Figura 3. importante ressaltar
que o Sistema Multiagente foi feito no framework JADE [29].

um curso real e contava com mais de 50 alunos. As figuras dos


testes sero mostradas na subseo 6.1.

6.1 Aplicativo

O aplicativo foi desenvolvido para ser utilizado na plataforma


Moodle, nos dispositivos mveis com o sistema operacional

Figura 3. MoodleGroups apresentado um sociograma.


Na Figura 3, possvel visualizar um menu lateral, onde ficam os
cursos que so ministrados pelo professor que acessou o sistema.
No exemplo, tem-se dois cursos, sendo o primeiro o de Clculo
Numrico (base de dados fictcia), e segundo o curso Ritmo e
Movimento (base de dados real).
O curso de Clculo numrico o curso que est sendo mostrado
pelo sociograma da Figura 3. No exemplo, possvel verificar no
sociograma diversas situaes que foram detectadas e que esto
presentes no curso, tais como:

Os grupos e subgrupos;

As pontes de relacionamento;

Os alunos que possuem o menor ndice de interao ou


nenhuma interao;

E os alunos que mais interagem com o professor.

Figura 4. Disposio dos grupos e subgrupos dentro do curso.


As pessoas que so pontes de relacionamento e os alunos que
mais interagem com o professor so melhores vistos na Figura 3.
Como por exemplo, os alunos {b, d, s}. O aluno {b} interliga os
alunos{m, p, j} ao {s}; e o {s} interliga um subgrupo ao {f}. J o
aluno {d} interliga os alunos {g, c, e} aos alunos {q, o} e ao
professor. Desta forma, os alunos {d, f, n, o, s} poderiam auxiliar
o professor na comunicao com os grupos existentes. Logo,
sabendo o professor quais so os alunos que so pontes de
relacionamento dentro da turma, poderia utilizar essa informao
ao seu favor, a fim de obter uma melhor comunicao e
socializao entre os alunos.

Caracterizando melhor a situao, a Figura 4 mostra os Grupos


representados pela demarcao de cor rosa, e os subgrupos
representados pela cor azul, alm disso tambm existe um grupo
de cor vermelha que representam os alunos que no tiveram
nenhuma interao com os demais participantes ou at mesmo
com o ambiente de ensino. No caso exemplificado, percebe-se que
os subgrupos ficam dentro dos grupos maiores.
O professor, de posse dessa informao visual, pode optar por
diversas aes, tais como integrar o grupo de menor interao (o
que possui demarcao vermelha) com os demais grupos,
auxiliando na socializao de seus alunos, e podendo trabalhar
diretamente com os alunos que no esto interagindo com o
sistema ou com os demais alunos, seja por dificuldade de
comunicao ou outros motivos.

E por fim, pode-se detectar os alunos que mais interagem com o


professor, sendo estes os alunos: {d, f, n, o, r}. Alm disso
possvel verificar as interaes mais intensas, que so
representadas pelas linhas mais grossas, caracterizando assim, um

146

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

nvel mais intenso de interao entre as pessoas que as possuem,


como por exemplo a interao entre os alunos {b, p,m, j}.

Na Figura 5, mostrado o segundo curso, que possui um nmero


maior de alunos, com diversas interaes e uma estrutura diferente
da que foi vista na Figura 3.

Figura 5. MoodleGroups, curso Ritmo e Movimento.


Na Figura 5, h um grande fluxo de interao entre os alunos,
onde possvel visualizar que existe uma grande interao entre
os alunos com o professor. Sendo o professor o lder positivo no
sociograma da Figura 5, isso se d pelo fato dele possuir mais
interaes que os demais participantes, estando o professor no
centro das interaes e tendo ele ligaes de forma direta com
quase todos os estudantes participantes do curso. possvel
verificar tambm que em meio a tantas interaes, existem
alunos no curso que interagem pouco levando em considerao
as interaes dos demais alunos.

Sendo assim, o aplicativo proposto visa auxiliar o professor de


um curso a Distncia, proporcionando ao mesmo uma viso
geral e integrada das interaes, para que seja possvel
acompanhar e adotar aes preventivas, promovendo a insero
social dos alunos dentro do curso.
Atualmente o trabalho encontra-se no estgio de autenticao e
de aprimoramento de interface para o aplicativo, a fim de
proporcionar um melhor design e segurana ao usurio final.
Desta forma, este trabalho se apresenta como um resultado
parcial de uma investigao sobre a utilizao de Sistemas
Multiagentes integrados a Ambientes Virtuais de Aprendizagem
no contexto da Educao a Distncia.

Alm dessas informaes que so obtidas e repassadas ao


professor, o mesmo tambm pode interagir com o sociograma no
dispositivo mvel, ampliando a imagem com os dedos, ou at
mesmo a ao de movimentar o sociograma.

Alm do melhoramento da interface do aplicativo, a continuao


deste trabalho avaliar a eficcia desta proposta em diversas
turmas reais que utilizam frequentemente fruns e troca de
mensagens entre alunos em AVAs.

7. CONCLUSES

Neste artigo foi apresentado o aplicativo MoodleGroups para


auxiliar os professores no processo de mediao de interaes
entre alunos. O aplicativo proposto possui uma camada de
inteligncia, sendo ela responsvel por coletar dados acerca das
interaes sociais dos alunos dentro dos fruns e das mensagens
em AVAs. Essas informaes so repassadas ao sistema e este
responsvel pela montagem do sociograma das interaes dos
alunos matriculados no curso. Por fim, essa informao
disponibilizada ao professor via dispositivos mveis.

8. AGRADECIMENTOS

Agradecemos a SAMSUNG pelo suporte financeiro concedido


para a realizao do projeto no qual o artigo pertence.

9. REFERNCIAS

[1] Cordenonsi, A. Z., Bernardi, G., Muller, F. M., Silva, T.


G., Bos, S. A., e Fleck, R. 2013. Aprendizagem
Colaborativa em Mundos Virtuais 3D: Analisando a
Colaborao sob a Perspectiva do Modelo 3C de
Colaborao. In: X Simpsio Brasileiro de Sistemas
Colaborativos (SBSC2012). Outubro 8-11, 2013, Manaus,
AM, Brasil. Proceedings Full Paper. ISSN 2318-4132.

Assim, o MoodleGroups uma resposta ao problema do


professor ilustrada no cenrio apresentado neste artigo. O
professor visualizando os sociogramas sua disposio pode
promover a socializao dos alunos com pouca interao e
integrar os grupos existentes com os demais grupos da classe.
Alm disso, ele pode perceber situaes diferentes que ocorrem
ao longo do curso, como por exemplo, um aluno que participava
de um grupo e posteriormente saiu, migrando para um outro
grupo da classe. Com isso, o professor alm de tomar aes
preventivas, pode acompanhar a evoluo da turma durante o
curso.

[2] Bremgartner, V., e Netto, J. F. de Magalhes. 2012.


Improving Collaborative Learning by Personalization in
Virtual Learning Environments Using Agents and
Competency Based Ontology. Proc. 42th Frontiers in
Education Conference (FIE), Seattle, WA, 2012. pp.1-6,
Outuber 3-6. DOI: 10.1109/FIE.2012.6462345.

147

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

[3] Almeida, M. E. B. 2001. Formando Professores para Atuar


em Ambientes Virtuais de Aprendizagem. In: Almeida,
Fernando (organizador). Educao a Distncia: Formao
de Professores em Ambientes Virtuais e Colaborativos de
Aprendizagem. So Paulo: MCT/PUC SP.

[18] Wooldridge, M. 2009. An Introduction to MultiAgent


Systems.
Ed
2,
Wiley.
484
pages.
ISBN:
978EUDTE00553.
[19] Jennings, N. R. 1994. Cooperation in Industrial Multiagent System. World Scientific.

[4] Cortelazzo, I. B. C. 2010. Prtica Pedaggica,


Aprendizagem e Avaliao em Educao a Distncia. Ed 2.
Curitiba: Ibpex.

[20] Filho, J. B. S. S. 2007. Agentes de Software para o


Ambiente Virtual de Aprendizagem Moodle: Facilidades de
Gerncia. In: Revista Sistemas de Informao e Gesto de
Tecnologia. Vol. 4 .

[5] Turoff, M. e Hiltz, S. R. 1982. Computer Support for


Group versus Individual Decisions. IEEE Transactions on
Communications (Corn-30:1), pp.82-90, Janeiro 1982.

[21] Bartholo, V. de F., Amaral, M. A. e Cagnin, M. I. 2009.


Uma Contribuio para a Adaptabilidade de Ambientes
Virtuais de Aprendizagem para Dispositivos Mveis. In:
Revista Brasileira de Informtica na Educao (RBIE). Vol
17, No 2.

[6] Valentini, C. B., e Soares, E. M. S. 2010. Aprendizagem


em Ambientes Virtuais: Compartilhando Ideias e
Construindo Cenrios / org. Dados eletrnicos. Caxias
do Sul, RS: Educs, 2010. Vrios autores. Modo de
acesso:http://www.ucs.br/etc/revistas/index.php/aprendizag
em-ambientes-virtuais/index Edio atualizada da verso
impressa publicada em 2005. ISBN 978-85-7061-600-5.

[22] Silva, L. C. N., Neto, F. M. M., e Junior, L. J. 2011.


MobiLE: Um Ambiente Multiagente de Aprendizagem
Mvel para Apoiar a Recomendao Sensvel ao Contexto
de Objetos de Aprendizagem. Anais do XXII Simpsio
Brasileiro de Informtica na Educao XVII Workshop
de Informtica na Escola. (XXII SBIE XVII WIE).
Novembro 21-25, 2011. Aracaju, SE, Brasil. ISSN: 21764301.

[7] Moreno, J. L. 1934. Who Shall Survive? A New Approach


to the Problem of Human Interrelations.With a Foreword
by W. A. White. Washington: Nerv. & Ment. Dis. Publ.
Co., 1934. (Nerv. & Ment. Dis. Monog. Ser. No. 58.) pp.
xvi+440. Reviewed by Gardner Murpht.

[23] Pimentel, M., Gerosa, M. A., Filippo, D., Raposo, A. Fuks,


H., e Lucena, C. J. P. 2006. Modelo 3C de Colaborao
para o Desenvolvimento de Sistemas Colaborativos. In: III
Simpsio
Brasileiro
de
Sistemas
Colaborativos
(SBSC2006). Novembro 20-22, 2006, Natal, RN, Brasil.

[8] Vaz, J. G. 2009. A Construo dos Sociogramas e Teoria


dos Grafos. In: Revista Brasileira de Psicodrama. So
Paulo, Brasil.
[9] NetDraw - Borgatti, S.P., 2002. NetDraw Software for
Network Visualization. Analytic Technologies: Lexington,
KY. https://sites.google.com/site/netdrawsoftware/home

[24] Saltz, J., Hiltz, S., e Turoff, M. 2004. Student Social


Graphs: Visualizing a Students Online Social Network.
Paper Presented at the Meeting of the Proceedings of the
ACM Conference on Computer Supported Cooperative
Work, Illinois, USA, 2004.

[10] Weft QDA - http://www.pressure.to/qda/


[11] NodeXL - A network or graph is dened as a collection of n
nodes. http://nodexl.codeplex.com//

[25] Gerosa, M. A.; Filippo, D., Pimentel, M., Fuks, H. and


Lucena, C. J. P. 2010. Is the Unfolding of the Group
Discussion Off-Pattern? Improving Coordination Sipport in
Educational Forums Using Mobile Devices. In: Computers
& Education. Vol 54, Issues 2, February 2010. DOI:
10.1016/J.compedu.2009.09.004.

[12] Facebook. https://www.facebook.com/


[13] TouchGraph.com: Graph Vizualization and Social Network
Analysis Software/Navigator. http://www.touchgraph.com
/facebook.
[14] Tori, R. 2010. Educao sem Distncia: As Tecnologias
Interativas na Reduo de Distncias em Ensino e
Aprendizagem. So Paulo: Senac.

[26] D3 Data Drive Documents. http://d3js.org/.


[27] Moodle. A Free, Open Source Course Management System
for Online Learning, 2013, http://www.moodle.org

[15] Frigo, L. B., Pozzebon, E., e Bitterncourt, G. 2004. O


Papel dos Agentes Inteligentes nos Sistemas Tutores
Inteligentes. 2004. World Congress on Engineering and
Technology Education (WCETE). Maro 14-17, 2004, So
Paulo, SP, Brasil.

[28] Android. http://www.android.com/


[29] JADE. http://jade.tilab.com/

[16] Jaques, P. A., e Oliveira, F. M. 2000. Um Experimento


com Agentes de Software Para Monitorar a Colaborao
em uma Turma Virtual. In: Revista Brasileira de
Informtica na Educao. Nmero 07.
[17] Krupansky. J. 2005. Agtivity Advancing The Science Of
Software Agente Technology. Definition: Multi-Agent
System (MAS). URL: agtivity.com/def/multi_agent
_system.htm. > Acesso em Janeiro de 2014.

148

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Uma anlise de assortatividade e similaridade para


Artigos Cientficos
Leonardo Maia Barbosa

Romis Attux

Alan Godoy

Departamento de Engenharia de
Departamento de Engenharia de
Departamento de Engenharia de
Computao e Automao Industrial Computao e Automao Industrial Computao e Automao Industrial
Universidade Estadual de Campinas Universidade Estadual de Campinas Universidade Estadual de Campinas
Campinas, SP, Brasil
Campinas, SP, Brasil
Campinas, SP, Brasil

barbosal@dca.fee.unicamp.br

attux@dca.fee.unicamp.br

ABSTRACT

godoy@dca.fee.unicamp.br

General Terms

Complex network is a recent research subject which is related to


multiple application domains, like computer, social, and
biological systems, providing conceptual and numerical tools to
examine the network components and their relationships.
Currently, there are several models and techniques which help to
understand such systems. The assortative mixing is a metric to
measure the tendency for vertices in a network to connect
preferentially to other vertices that are like them in some way.
This work presents assortativeness and similarity analysis for a
network generated from scientific articles, connecting papers,
keywords, authors and countries. The main goal is, given a set of
scientific papers to be analyzed, to investigate how concepts,
institutions and individuals are related and to reflect about the
scientific collaboration in such field. In order to generate the
network basis, a graph database will be used to process the data
from a local article sample.

Human Factors, Measurement

Keywords

Complex Networks, Graph Theory, Social Network Analysis,


Assortativity, Similarity

1. INTRODUO

Uma Rede Complexa pode ser caracterizada como um tipo de


sistema complexo, ou seja, um sistema cuja organizao depende
fortemente da interao de suas partes constituintes. Estas
interaes se do numa perspectiva local, entre vizinhos, ou entre
partes afastadas no sistema, e podem levar a comportamentos de
larga escala os quais no podem ser previstos trivialmente a partir
dos comportamentos individuais. Estes efeitos coletivos so
denominados comportamentos emergentes [1, 2]. Um desafio,
nesse caso, entender a dinmica da rede e a relao entre
comportamento individual e global do sistema para que se possam
extrair padres e inferir modelos.

RESUMO

A teoria de redes complexas deu origem a uma rea de pesquisa


vinculada a mltiplos domnios, como redes de computadores,
redes sociais, redes biolgicas dentre outras, provendo meios para
analisar os componentes da rede e seus relacionamentos.
Atualmente existem modelos e tcnicas baseadas em um conjunto
de regras que ajudam a entender o comportamento destes sistemas
peculiares. Um estudo em especial diz respeito assortatividade
em redes, a qual objetiva identificar tendncias de vrtices se
conectarem a outros vrtices que possuem perfil similar ou
dissimilar considerando alguma caracterstica em comum. Este
trabalho apresenta uma anlise de assortatividade e similaridade
para propriedades extradas de artigos cientficos, empregando
como base um banco de dados orientado a grafos. O propsito
realizar um estudo sobre os relacionamentos das partes e examinar
como se d a colaborao cientfica para uma rea especfica,
utilizando para isso uma amostra local de artigos. Outrossim, as
tcnicas utilizadas sero expostas e os resultados discutidos.

Desde sua origem, h poucas dcadas, o estudo de redes


complexas tem evoludo significativamente, de modo que hoje
existem conceitos bem estabelecidos que se propem a descrever
o comportamento de redes observadas no mundo real. Dentre
estas propriedades algumas podem ser citadas como, por exemplo:

Categories and Subject Descriptors

G.2.2 [Mathematics of Computing]: Graph Theory

Clusterizao: medida para identificar os quo conectados


esto os elementos de uma rede [3].
Centralidade: mede a importncia de um n ou vrtice dentro
da rede [4, 5].
Robustez e Resilincia: analisa a resistncia ou comportamento da rede sob remoo de vrtices ou arestas [6, 7].
Comunidades: identifica subconjuntos de vrtices que esto
conectados mais fortemente entre si do que o resto da rede
[8, 9].
Efeito de mundo pequeno: redes apresentam um pequeno
tamanho mdio de menor caminho entre os vrtices, quando
comparado ao tamanho da rede [3, 10].

J.4 [Computer Applications]: Social and Behavioral Sciences

Refere-se o leitor interessado no estudo mais aprofundado desses


conceitos s referncias [11, 12, 13].

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies
are not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba,
PR, Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

Outra mtrica relevante a assortatividade, que tem o objetivo de


identificar correlaes entre as propriedades de vrtices adjacentes
em redes [14, 15]. Um uso comum da assortatividade no estudo
da correlao entre os graus (nmero de conexes) dos ns que
so vizinhos em uma rede. Neste mbito, alguns estudos
evidenciaram uma assortatividade positiva para redes sociais
online de mundo real, e negativa para redes tecnolgicas e
biolgicas [16], confirmando o resultado exposto por Newman
[14]. Outros estudos mostram que, como consequncia do

149

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

crescimento da rede, redes sociais online passaram de um estado


de assortatividade positiva para negativa [17, 18]. Em [19], foi
destacada uma assortatividade positiva maior para redes de
interao, que consideram interaes reais1 entre usurios, do que
para redes sociais, que consideram apenas o relacionamento social
esttico.

onde o nmero total de arestas, e so respectivamente os


valores de grau para os vrtices que esto nos extremos da i-sima
aresta, com = 1 . Como demonstrado em (1), a
assortatividade de grau, na verdade, o coeficiente de correlao
de Pearson aplicado para os valores de grau dos vrtices das
extremidades das arestas, vigorando, dessa forma, a condio
1 1, sendo que = 1 indica uma perfeita
assortatividade e = 1 uma completa desassortatividade. No
ltimo caso, tem-se que vrtices com graus mais altos tendem a se
relacionar com vrtices com graus mais baixos.

Este trabalho prope uma abordagem para analisar a


assortatividade em redes de relaes entre entidades extradas de
um conjunto de artigos cientficos (os artigos em si, autores, pas
de localizao dos autores, palavras-chave, data de publicao).
Diversas pesquisas j foram realizadas sobre redes de coautoria e
citaes [14, 15, 20, 21], este trabalho, no entanto, prope-se a
realizar uma anlise considerando no apenas a relao entre ns
de um mesmo tipo (autores ou artigos), mas tambm como
entidades representando aspectos diversos se relacionam. O
principal diferencial deste trabalho a aplicao de medidas
bibliomtricas utilizando uma rede complexa mista. Assim, so
avaliados diferentes pontos de vista da colaborao no meio
acadmico, com intuito identificar informaes e padres ocultos
a priori. Esta abordagem permite, por exemplo, avaliar a
correlao entre datas de publicao e palavras-chave,
evidenciando possveis tendncias de pesquisa.

Uma variao da medida de assortatividade de grau surge da


possibilidade de se considerar o direcionamento das arestas, o que
d origem assortatividade de grau direcionada:

2
1

2
] [

" "

2
1

,
2
]

(2)

sendo e , respectivamente, os valores de grau de entrada e


grau de sada dos vrtices extremos da i-sima aresta e o
nmero total de arestas.
Neste trabalho, considerado o valor total de grau para a medida
de assortatividade de grau, que possui o mesmo resultado da
abordagem de graus remanescentes proposta em [20].

Para discusso deste mtodo, foi realizado um estudo de caso


focado em artigos cientficos escritos em ingls e vinculados ao
termo collaborative (em portugus pode ser traduzido como
colaborativo ou que envolve colaborao). Este trabalho em
andamento visa analisar detalhadamente a rede mista composta
por todos estes componentes e seus relacionamentos, destacando
algumas das propriedades observadas.

2.1.2 Assortatividade discreta

Para a medida de assortatividade discreta, so consideradas


algumas caractersticas discretas ou enumerativas, ou seja,
propriedades nominais que permitem uma classificao dos
vrtices em uma rede. Esta medida definida por:

Na seo 2, sero apresentadas as medidas adotadas bem como


suas propriedades. Na seo 3, ser explicada a forma de
implementao e tcnicas utilizadas para alcanar os resultados.
Na seo 4, far-se- um estudo de caso sobre uma amostragem
local de artigos. Na seo 5 os resultados sero expostos e
analisados. Finalmente, a seo 6 traz as concluses e principais
perspectivas.

[ ]
,
[
]

(3)

na qual define a quantidade de arestas na rede que conectam o


vrtice ao vrtice , o termo o trao da matriz quadrada
formada pelos elementos e suas respectivas relaes, o
somatrio dos elementos da coluna j dado por , por fim,
o somatrio dos elementos da linha i dado por . O resultado
de est situado no intervalo 1 1, sendo que valores
mais altos indicam maior assortatividade dos elementos avaliados.

2. MEDIDAS

A seguir, sero apresentadas as medidas de assortatividade e


similaridade, aplicadas neste estudo.

2.2 Similaridade

As medidas de similaridade citadas abaixo foram implementadas


de modo a encontrar padres em comum para elementos do
mesmo tipo sob diferentes perspectivas, ou seja, caractersticas
distintas [23].

2.1 Assortatividade

Conforme mencionado na seo 1, a finalidade da medida de


assortatividade identificar a tendncia de vrtices em uma rede
se associarem com outros vrtices similares. Sero apresentadas e
discutidas, a seguir, algumas formulaes dessa medida [14, 15].

2.2.1 Jaccard

O ndice de Jaccard largamente utilizado em situaes com


atributos binrios assimtricos. Esta medida compara dois vetores
binrios, e desconsidera valores que no so indicativos de
similaridade, ou seja, que so falsos em ambos os casos. Neste
trabalho, cada atributo binrio indicar a ocorrncia ou no de
relacionamento entre determinados vrtices. O coeficiente de
Jaccard definido por:

2.1.1 Assortatividade de grau

A assortatividade de grau independe de outras propriedades


nominais existentes no vrtice, pois o grau uma propriedade
escalar sempre disponvel nas redes se a estrutura destas
conhecida. A partir disso, pode-se determinar, por exemplo, se os
vrtices com elevados valores de grau possuem uma propenso de
se associar com outros vrtices com grau alto. A definio da
assortatividade de grau dada por:
1
1 [1 2 ( + )2 ]
=
,
1
1
1 2 2 + 2 [1 2 ( + )2 ]

=
(1)

11
,
01 + 10 + 11

____________________________
1

Interaes reais entre usurios so atividades verificadas que


relacionam estes, como por exemplo, troca de mensagens.

150

(4)

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

se houver uma colaborao entre autores que esto localizados em


diferentes pases.
Para o armazenamento dos dados e efetivao do modelo de redes
complexas foi adotado o Neo4J [25], que um banco de dados
baseado em grafo. Este banco de dados possui suporte s
propriedades necessrias para a construo da rede mista formada
por todo contedo extrado.

onde M11 o nmero de correspondncias para ambos casos


verdadeiros, M10 apenas o primeiro caso verdadeiro e M01
somente o segundo caso verdadeiro. Assim a definio pode ser
entendida, o nmero de ocorrncias correspondentes sobre o
nmero de correspondncias no relacionadas a termos
absolutamente ausentes M00 .

2.2.2 Correlao de Pearson

O ndice de Pearson uma mtrica comum para definir padres de


similaridades em vetores. O coeficiente definido pelo clculo da
covarincia dos vetores sobre o produto do desvio padro de cada
vetor, como segue abaixo:
=

(, )
=

=1

=1

=1

Por conseguinte, todos os atributos e suas relaes so inseridos


respectivamente como ns e relacionamentos em uma instncia do
banco dedicada especialmente para este estudo. A rede formada
possui as seguintes propriedades de grafo:
Direcionada - permite configurar e identificar o sentido no
qual o relacionamento acontece.

Ponderada - mantm um campo para armazenar o peso do


relacionamento entre vrtices. Neste trabalho, este campo
ser utilizado para identificar mltiplas ocorrncias de um
mesmo relacionamento, armazenando para isso a quantidade
vezes que este ocorre.
Semntica - possui um rtulo de identificao para cada tipo

de relacionamento. A implementao semntica da rede


permite a induo de sub-redes, filtrando vrtices de acordo
com os tipos de relacionamentos desejados. Esta
caracterstica permite o estudo de sub-redes sem a
necessidade de gerar novas instncias de grafo ou banco.
Por fim, as medidas utilizadas foram implementadas em Java de
modo a suportar comandos de interface com o banco de dados.

(5)

onde e so os i-simos elementos dos vetores e


respectivamente e , representam as mdias dos vetores. Os
valores dos vetores sero os pesos dos relacionamentos entre
determinados vrtices, que, neste trabalho, so dados pela soma da
quantidade de ocorrncias da respectiva relao.

3. IMPLEMENTAO

Este trabalho foi realizado tendo como base a tcnica de extrao


de dados esboada em [24]. A partir desta abordagem, possvel
extrair atributos e suas respectivas relaes de artigos cientficos
no formato PDF, que o mais difundido e utilizado pela
comunidade acadmica.
Os seguintes atributos sero utilizados neste trabalho para anlise:

4. ESTUDO DE CASO

Artigo (ttulo da publicao)


Autor (nome)
Pas (localizao dos autores)
Palavras-chave (definidas pelos autores)
Ano de publicao

Para esta anlise, foi considerada uma amostra local contendo 214
artigos selecionados a partir de uma busca na base IEEEXplore
pelo termo collaborative e ordenada por relevncia. Todos os
artigos esto no idioma ingls e so advindos de diferentes
conferncias, revistas, jornais etc. Abaixo seguem alguns dados
sobre a rede formada (ilustrada parcialmente na Figura 1):

J as relaes entre os atributos so definidas de acordo com a


ocorrncia em cada artigo. Os seguintes tipos de relacionamento
so considerados:

Artigo_Pas
Artigo_Palavras-chave
Artigo_AnoDePublicao
Artigo_ReferenciadoPor_Artigo
Autor_Artigo
Autor_Autor
Autor_Palavras-chave
Autor_AnoDePublicao
Pas_Pas
Pas_PalavrasChave
Pas_ AnoDePublicao
Palavras-chave_ Palavras-chave
Palavras-chave_ AnoDePublicao

Assim, por exemplo, existe um relacionamento de colaborao


entre autores, do tipo Autor_Autor, caso o artigo tenha mltiplos
autores. Outro exemplo considerando artigos, existe um
relacionamento do tipo Artigo_ReferenciadoPor_Artigo quando
um artigo for referenciado por outro. Ou ainda, para o
relacionamento Pas_Pas, existe um relacionamento entre pases

1.451 ns ou vrtices
7.626 relacionamentos (arestas)
11.248 propriedades (campo em ns e arestas contendo
informaes adicionais)
13 tipos de relacionamento
29 MB espao ocupado pelo banco de dados em disco

Figura 1. Ilustrao parcial da rede complexa formada2

151

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

( ) = 0.025

5. RESULTADOS

A princpio, so analisados os resultados para assortatividade de


grau e assortatividade discreta, considerando o direcionamento
das relaes quando aplicvel. Posteriormente, algumas
verificaes a respeito da similaridade dos elementos e seus
relacionamentos so evidenciadas. Para estas anlises,
importante considerar a premissa de que apenas os vrtices que
possuem relacionamentos so considerados.

O baixo valor neste caso indica que, para a associao entre


palavras-chave, no verificou-se um padro relacionado ao grau
de cada vrtice. Assim, uma palavra-chave que comumente
utilizada pode estar relacionada outra palavra-chave menos
utilizada. Ainda nesta anlise, possvel destacar o perfil de
alguns vrtices palavras-chave que agem como hubs3 em relao
aos demais. Estes vrtices esto identificados na Tabela 1, e
suscitam as principais classificaes de pesquisa, sendo que os
demais figuram como particularidades.

5.1 Anlise de assortatividade de grau


5.1.1 Colaborao entre autores

Tabela 1. Palavras-chave com maior grau na rede de


palavras-chave

Nesta anlise os autores esto diretamente relacionados com os


co-autores, formando grupos com membros totalmente
interligados (cliques) e, eventualmente, componentes conexos
maiores, como ilustrado na Figura 2. Assim, se o vrtice faz parte
de um componente conexo caracterizado por uma clique, ele vai
ter o mesmo grau que todos seus vizinhos, o que, por sua vez,
aumenta a assortatividade e resulta em valor positivo para a
medida:

collaboration

Quantidade de relacionamentos
entre palavras-chave
60

collaborative filtering

34

coordination

25

cloud computing

24

cscw4

21

awareness

20

human factors

19

collaborative design

16

security

15

Palavra-chave

= 0.788
De modo afim, Newman obteve um resultado de assortatividade
tambm positivo em [15] para colaborao entre autores.

5.1.4 Associao entre artigos

Na anlise de associao de artigos, so consideradas as


referncias entre estes. Para este tipo de relacionamento, o
direcionamento considerado, pois podemos identificar qual
artigo foi referenciado e tambm qual fez referncia. Abaixo
segue o resultado para a medida de assortatividade direcional:
() = 0.327
O valor negativo indica que para esta amostra, artigos com alto
grau de citao no necessariamente esto relacionados apenas
com outros artigos que tem alto grau de citao. Desta maneira,
existe uma propenso de que artigos com alto grau de citao
sejam referenciados por artigos de menor grau, agindo com o
perfil de intermediadores da informao. Isto vai ao encontro de
um recente estudo sobre referncias bibliogrficas na comunidade
acadmica, o qual mostra que, atualmente, apenas uma pequena
parte dos artigos largamente referenciada [26].

Figura 2. Demonstrao da rede de colaborao entre autores

5.1.2 Colaborao entre pases

Para o relacionamento entre pases, a medida de assortatividade


no direcional apresenta o seguinte valor:
() = 0.116
Diferentemente do relacionamento entre autores, o valor
ligeiramente negativo aponta uma propenso de no
assortatividade, ou seja, pases com um alto grau de conexo
tendem a se relacionar (colaborar) com pases que possuem baixo
grau de conexo e vice-versa. Assim pases que colaboram
ativamente na comunidade cientfica no necessariamente
possuem publicaes apenas com outros pases de perfil similar.
Esta assortatividade menor do que a observada entre autores pode
indicar que a constituio de colaboraes entre cientistas est
mais ligada ao desempenho individual de cada autor do que
imagem de seu pas junto comunidade acadmica.

5.2 Anlise de assortatividade discreta


5.2.1 Associao de palavras-chave por ano

Para este resultado, foram exploradas as associaes de palavraschave utilizadas em diferentes artigos e agrupadas por ano. Esta
anlise remete seguinte indagao: na linha do tempo, as
palavras-chave utilizadas em um determinado artigo coincidem
com palavras-chave de outros artigos? Os dados que levam
resposta desta pergunta seguem abaixo.
____________________________
2

5.1.3 Associao entre palavras-chave

http://figshare.com/articles/article_network_sample/1155271

Hubs so os vrtices com maior grau em uma rede que atuam


como intermediadores de conexo.

A anlise para associao entre palavras-chave consiste em


verificar a co-ocorrncia destas nos artigos. O resultado para a
medida de assortatividade no direcional de grau :

152

CSCW a sigla de Computer Supported Cooperative Work.

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Por considerar relacionamentos no direcionais, a matriz descrita


na Tabela 2 possui caracterstica simtrica e mostra relaes de
palavras-chave de acordo com o ano considerando diferentes
artigos, ou seja, relacionamentos de palavras-chave para um
mesmo artigo e ano so ignoradas. Assim, por exemplo, o ano de
2010 possui 68 palavras-chave em comum com o ano de 2011. O
resultado do clculo de assortatividade discreta para palavraschave por ano :

Considerando a amostra estudada, existe uma propenso pequena


favorecendo que pases de um mesmo continente cooperem mais
entre si do que com pases de outros continentes. Isto pode ser um
reflexo da distncia fsica ou at mesmo cultural. Os responsveis
por este resultado so pases originrios da sia e Europa, os
quais contriburam mais intra do que intercontinentalmente. Um
perfil interessante a ser mencionado o da frica, que possui
colaborao apenas com a Europa, o que pode indicar uma
influncia ou cooperaes em pesquisas.

= 0.0425

No caso da Amrica do Norte, a diviso territorial, e o fato de que,


apenas colaboraes entre pases diferentes so consideradas
podem explicar o baixo nmero de contribuies
intracontinentais. Por outro lado, a Amrica do Norte tem um
grande nmero de contribuies intercontinentais, onde os
Estados Unidos (USA) agem como um pas hub, sendo o pas que
mais colabora com outros pases e, consequentemente, um
importante intermediador de troca de informaes. Estes aspectos
podem ser observados na Figura 3.

Considerando a amostra de artigos, no existe uma tendncia


significativa para a associao de palavras-chave agrupadas por
ano. O resultado tende mais para uma miscigenao, com a
adoo de palavras-chave por diferentes artigos ao longo dos
anos. Desta forma, palavras-chave que foram pesquisadas no
passado podem retornar, como acontece nos anos de 2008 e 2013.
Outro exemplo o ano de 2012, que possui mais palavras-chave
em comum com artigos de outros anos do que em comparao ao
prprio ano.

Aprofundando um pouco mais esta anlise especificamente para


pases, a Figura 3 mostra que o Brasil (BRA) aparece em posio
intermediria, ou seja, possui relativamente poucas colaboraes
com outras naes para a rea de pesquisa amostrada.

Tabela 2. Associao de palavras-chave por ano


Ano

2008

2009

2010

2011

2012

2013

2014

2008

92

64

68

54

14

68

2009

64

64

62

40

10

32

2010

68

62

92

68

12

32

2011

54

40

68

28

14

24

2012

14

10

12

14

2013

68

32

32

24

60

2014

5.2.2 Colaborao entre pases por continente

Nesta medida contabilizada a quantidade de relacionamentos


entre pases, na qual apenas colaboraes entre pases diferentes
so levadas em considerao. Assim, considerando a amostra
local de artigos, existe por exemplo, apenas um relacionamento do
tipo Pas_Pas entre a sia e Amrica do Sul. Isto implica que
apenas um artigo foi publicado em conjunto por estes continentes.

Figura 3. Ilustrao da colaborao entre pases

5.2.3 Associao entre artigos por continente

Tabela 3. Associao entre pases por continente

sia

16

11

Austrlia

Europa

30

16

Esta medida visa averiguar a referncia entre artigos do ponto de


vista de continentes, somando, para isso, o nmero de artigos de
um determinado continente que foram referenciados por outros
artigos. Desta forma, considerando apenas os artigos da
amostragem, existem trs artigos provenientes da Europa que
foram referenciados pela Amrica do Norte. O resultado desta
anlise pode apontar o fluxo da informao para os artigos
considerados na amostra.

frica

Tabela 4. Associao entre artigos por continente

Amrica
do Sul
Amrica
do Norte

11

16

sia Austrlia Europa frica

Amrica Amrica
do Sul do Norte

Para a associao entre pases, o relacionamento no direcional portanto a matriz resultante simtrica, conforme mostra a Tabela
3. O resultado desta assortatividade discreta foi o seguinte:
= 0.111

153

sia

Europa

Amrica
do Sul

Amrica
do Norte

sia

15

Europa

Amrica
do Sul
Amrica
do Norte

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

ou seja, as palavras-chave utilizadas em artigos de pases do


mesmo continente tambm so utilizadas em publicaes outros
continentes. Assim, pases de outros continentes podem estar
realizando tambm pesquisas que envolvem aquela mesma
palavra-chave, mesmo que no exista colaborao entre estes.

Por ser tratar de um grafo direcional, a matriz resultante


assimtrica, conforme mostra a Tabela 4. possvel observar que
existe certa tendncia de que artigos provenientes de um mesmo
continente faam referncia para artigos do mesmo continente.
O que traz um valor positivo para esta medida de assortatividade
discreta:

Observando diferentes continentes a partir da tabela anterior,


nota-se que a sia possui vrias palavras-chave em comum com
Amrica do Norte e Europa. Este resultado indica certa sintonia
no contexto de pesquisas. Curiosamente estes so os mesmos
continentes citados no item anterior e ilustrados na Figura 4,
mostrando que existe uma possvel correlao positiva entre o
fluxo da informao e a sintonia das palavras-chave.

= 0.307
A partir desta tabela, pode-se observar o fluxo da informao, no
qual artigos provenientes de pases da sia, Europa e Amrica do
Norte so referenciados ou citados em artigos de outros
continentes.
Para
os
artigos
provenientes
Amrica
do Sul, houve um baixo valor de citao e esta ocorreu apenas
neste continente. Os continentes, Austrlia e frica, no
aparecem, pois no possuem artigos referenciados considerando o
banco de dados da amostragem.

Amrica do Norte e Amrica do Sul apresentam um quadro


interessante, no qual possuem mais palavras-chave em comum
entre os continentes do que se comparado apenas internamente.
Isso tambm pode apontar uma sintonia no contexto de pesquisas
entre pases destes continentes.

A Figura 4, ilustrada abaixo, desconsidera referncias internas e


visa demonstrar os continentes que possuem artigos referenciados
por outros continentes. Neste aspecto apenas Amrica do Norte,
Europa e sia vigoram como fonte de informao.

Para continentes como a frica e Austrlia, que possuem um


nmero menor de cooperao com pases de outros continentes, a
tabela revela que existe alguma harmonia entre pesquisas isoladas
e pesquisas colaborativas considerando a adoo de palavraschave em comum.
Ao realizar um filtro desta anlise para pases, mais
especificamente para o Brasil, possvel verificar que, quando
considerada as palavras-chave existe uma sintonia nas pesquisas:
30% das palavras-chave utilizadas em artigos do Brasil tambm
so utilizadas em pases de outros continentes (ilustradas na
Figura 5).

Figura 4. Referncia de artigos para diferentes continentes

5.2.4 Associao de palavras-chave por continente

Neste item, explorada a sintonia de palavras-chave para


continentes, ou seja, palavras-chave compartilhadas por
continentes. Para este clculo, somado o peso do relacionamento
de palavras-chave que tm relacionamento com mltiplos pases,
agrupando resultado final por continente.
Tabela 5. Associao de palavras-chave por continente
sia Austrlia Europa frica

Amrica Amrica
do Sul do Norte

sia

204

113

64

145

Austrlia

Europa

113

136

16

50

79

frica

16

50

20

59

79

59

36

Amrica
64
do Sul
Amrica
145
do Norte

Figura 5. Interseo entre palavras-chave utilizadas no Brasil


e pases de outros continentes

5.3 Similaridades

Este tipo de anlise foi implementada com o objetivo de


identificar similaridades entre os relacionamentos dos vrtices que
compe a rede dos atributos extrados de artigos.

Os valores descritos na Tabela 5 formam uma matriz simtrica,


pois o tipo de relacionamento considerado no direcional. A
partir disso, o resultado da assertividade :

5.3.1 Similaridade para autores

Neste primeiro ensaio, realizada uma comparao para verificar


se os autores de artigos mais referenciados atuam ativamente na
rede de colaborao de autores. Para isso, foram selecionados
todos os autores dos artigos que possuem valores de referncia

= 0.001
Com um resultado prximo de nulo, a assortatividade de palavraschave para continentes no possui um padro definido. Isto
significa que existe uma mescla para adoo de palavras-chave,

154

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

maior que zero para compor o primeiro vetor. Em seguida foram


coletados relativamente, os valores do relacionamento do tipo
Autor_Autor provenientes da rede de colaborao entre autores,
para constituir ento o segundo vetor. Para o clculo do
coeficiente de Jaccard foi considerado a existncia do respectivo
relacionamento na rede para compor o vetor do tipo binrio, assim
o valor verdadeiro est para o relacionamento existente. J para o
coeficiente de Pearson, o peso do relacionamento foi
contabilizado - neste caso, a respectiva quantidade de vezes que
os relacionamentos ocorrem. Seguem abaixo os valores da
similaridade de Jaccard e Pearson para esta anlise, considerando
apenas os artigos da amostragem.

/ = 0.798
Este resultado comprova que, dado que uma palavra-chave foi
adotada por um autor, quanto maior a probabilidade de este autor
utiliz-la, maior a chance de esta aparecer em outro artigo
diferente e, portanto se associar com as demais palavras-chave.
A segunda parte da anlise verifica se as mesmas palavras-chave
presentes em artigos referenciados so tambm as mais adotadas
por autores em geral. O primeiro vetor mantm as palavras-chave
de artigos os quais possuem valores de referncia maior que zero.
Para o segundo vetor, foram coletados respectivamente os valores
do relacionamento do tipo Autor_Palavra-chave provenientes da
rede de associao entre autores e palavras-chave. O coeficiente
de Pearson considera o peso do relacionamento (quantidade de
vezes que o relacionamento ocorre):

= 0.981
= 0.605
O resultado de Jaccard mostra que grande parte dos autores dos
artigos mais referenciados so colaboradores, ou seja, possuem
pelo menos um relacionamento direto com outro autor
considerando a rede de colaborao entre autores. J o coeficiente
de Pearson mostra que existe uma correlao linear positiva para
os valores considerando o peso, o qual simboliza a quantidade de
ocorrncias dos relacionamentos. Isto quer dizer, dado que um
autor possui uma quantidade de artigos referenciados maior que
zero, quanto maior esta quantidade, maior a colaborao deste
autor para com outros autores e vice-versa.

/ = 0.718
O resultado positivo para a correlao linear mostra que, uma vez
que determinada palavra-chave utilizada em artigos
referenciados, quanto mais esta for utilizada nestes artigos, maior
o valor de utilizao pelos autores. O inverso desta afirmao
tambm verdadeiro. Este valor acompanha o resultado de
mostrado previamente, e pode apontar uma
influncia difundida proveniente de artigos com grande valor de
citao.

5.3.2 Similaridade para pases

6. CONCLUSO

Esta anlise tem o propsito de comprovar se os pases de artigos


mais referenciados so pases colaborativos, ou seja, pases que
possuem publicaes em conjunto com outras naes. O primeiro
vetor constitudo pelos pases que possuem artigos
referenciados. Por sua vez, o segundo vetor composto
respectivamente pelos valores do relacionamento Pas_Pas da
rede de colaborao entre pases. Seguindo o item anterior, para
os artigos da amostra, foram calculados os coeficientes de
similaridade de Jaccard e Pearson:

As redes complexas ajudam a entender os comportamentos


emergentes de elementos e suas relaes, que dificilmente so
identificados a priori ou individualmente. Pesquisas nesta rea
tm trazido promissores resultados para diversas aplicaes. A
partir desta pesquisa, que se encontra em andamento, espera-se
ampliar a base de dados para avaliar como se d a colaborao
cientfica em determinados temas e identificar possveis pontos de
melhorias que permitam enriquecer o ambiente acadmico.
Este trabalho apresentou um estudo de medidas de assortatividade
e similaridade em redes complexas para propriedades extradas de
artigos cientficos. A anlise foi realizada considerando diferentes
variveis e perspectivas acadmicas, ainda no exploradas em sua
plenitude na literatura.

= 1
= 0.933
O resultado de Jaccard mostra que 100% dos pases de artigos
referenciados possuem pelo menos um artigo publicado com outro
pas. O valor final para o coeficiente de Pearson demonstra que
existe uma alta correlao de linearidade positiva para esta
medida, o que evidencia que, dado um pas que possui um nmero
de artigos referenciados maior que zero, quanto maior este
nmero, maior colaborao deste pas com outras naes. A
mesma afirmao vlida para o inverso.

A implementao das tcnicas utilizadas foi vivel devido ao uso


de um banco de dados orientado a grafos, que traz a capacidade de
implementar uma rede complexa e suportar todas suas
propriedades necessrias. Alm disso, possvel manter o estudo
dinmico da rede, pois a tarefa de adicionar os dados simples
uma vez que a base est definida. Outra caracterstica interessante
a possibilidade de padronizar e compartilhar os resultados.

5.3.3 Similaridade para palavras-chave

Contemplando os resultados de assortatividade de grau, o valor


positivo para autores e ligeiramente negativo para pases, pode
demonstrar que a colaborao cientfica est mais ligada ao autor
do que cultura acadmica do pas. Ainda neste contexto, foi
demonstrado um valor negativo para artigos, o que significa que
poucos artigos referenciados esto relacionados com muitos
outros no referenciados. Atravs do clculo da medida de
assortatividade discreta, foi possvel identificar os padres na
dinmica de colaborao internacional, que considera a origem do
continente de artigos referenciados, bem como a sintonia da
pesquisa, que contempla as palavras-chave de artigos de
diferentes pases.

A primeira parte da anlise de similaridade para palavras-chave


procura averiguar se as palavras-chave mais utilizadas pelos
autores so as mesmas que possuem o maior nmero de relaes
na rede formada pelas palavras-chave. Para isso, foram
selecionadas todas as palavras-chave que foram utilizadas pelos
autores, compondo ento o primeiro vetor. J para o segundo
vetor, foram coletados os valores do relacionamento do tipo
Palavra-chave_Palavra-chave provenientes da rede de associao
entre palavras-chave. No clculo da similaridade para palavraschave, aplicado apenas o coeficiente de Pearson, pois conforme
explicado previamente, apenas vrtices com relacionamento
foram considerados. Assim, o valor de Jaccard igual a um, pois
todo autor ou artigo possui um relacionamento com as palavraschave de seu respectivo artigo. Para o resultado de Pearson, temse:

J para os resultados de similaridade, identificou-se que, de certa


forma, os artigos mais referenciados influenciam outros aspectos.
Um exemplo so os autores e pases destes artigos que, possuem

155

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Cognitive Science. Elsevier.


DOI=http://dx.doi.org/10.1016/j.tics.2013.04.010.

alto valor de colaborao em suas respectivas redes e funcionam


como intermediadores da informao. Outro ponto que as
mesmas palavras-chave encontradas nos artigos referenciados
tambm fazem parte do dicionrio de autores em geral.

[12] Brandes, U. and Erlebach, T. 2004. Network Analysis,


Methodological Foundations. Springer. Lecture Notes in
Computer Science.

importante ressaltar que todos os resultados alcanados foram


realizados considerando uma amostra de artigos que, no obstante,
pode ser expandida em estudos posteriores tambm para outras
reas cientficas. Entre as metas para trabalhos futuros esto,
ampliar a base de dados para validao dos resultados e aplicao
de medidas recentes relacionadas a redes complexas,
particularmente redes mistas. Por fim, vale salientar que os
resultados aqui observados corroboram com a ideia de que a
colaborao no mundo cientfico traz grandes impactos para a
difuso da informao e do conhecimento em todo mundo, bem
como para os prprios pesquisadores.

[13] Newman, M. 2003. The structure and function of complex


networks. University of Michigan. Santa Fe Institute.
[14] Newman, M. 2002. Assortative Mixing Networks. University
of Michigan. Santa Fe Institute.
[15] Newman, M. 2003. Mixing patterns in networks. University
of Michigan. Santa Fe Institute.
[16] Catanzaro, M., Caldarelli, G. and Pietronero, L. 2004. Social
network growth with assortative mixing. Physica A:
Statistical Mechanics and its Applications, vol. 338, no. 1,
pp. 119124.

7. AGRADECIMENTOS

[17] Hu, H. and Wang, X. 2009. Disassortative mixing in online


social networks. EPL (Europhysics Letters), vol. 86, no. 1, p.
18003.

Os autores agradecem ao CNPq e a CAPES o apoio financeiro.

8. REFERNCIAS

[1] Mitchell, M. and Newman, M. 2001. Complex Systems


theory and evolution. University of Michigan. Santa Fe
Institute.

[18] Hu, H. and Wang, X. 2009. Evolution of a large online social


network. Physics Letters A, vol. 373, no. 12, pp. 11051110.
[19] Wilson, C., Boe, B., Sala, A., Puttaswamy, K. and Zhao B.
User interactions in social networks and their implications. In
Proc. of the ACM European Conference on Computer
systems (EuroSys09). Nuremberg, Germany: ACM, 2009,
pp. 205218

[2] Godoy, A. 2010. Aplicao de Redes Complexas para a


Definio de Vizinhana na Otimizao por Enxame de
Partculas. Dissertao de Mestrado em Engenharia Eltrica.
Faculdade de Engenharia Eltrica e de Computao.
Universidade Estadual de Campinas. Campinas/SP.

[20] Barabsi, A. L., Jeong, H., Neda, Z., Ravasz, E., Schubert, A.
and Vicsek, T. 2002. Evolution of the social network of
scientific collaborations. Elsevier Science B.V.

[3] Watts, D. J. and Strogatz, S. H. 1998. Collective dynamics of


small-world networks. Nature 393, 440442.
[4] Borgatti, S. P. and Everett, M. G. 2006. A Graph-theoretic
perspective on centrality. Social Networks, 28 (4). pp. 466484.

[21] Andrade, M. T. T., Braga, P., Carneiro, T. K. G., Ribeiro, N.


M., Moret, M. A. and Pereira, H. B. B. 2014. Contextualized
Analysis of Social Networks: Collaboration in Scientific
Communities. Social Networking, 2014, 3, 71-79. DOI=
http://dx.doi.org/10.4236/sn.2014.32009.

[5] Freitas, L. Q. 2010. Medidas de Centralidade em Grafos.


Dissertao de Mestrado. Programa de Ps-graduao em
Engenharia de Produo. Universidade Federal do Rio de
Janeiro.

[22] Steinmacher, I., Aurlio, M., Silva, G., Cgo, F. R. and


Chaves, A. P. 2013. Tpicos de pesquisa e rede de coautoria
no Simpsio Brasileiro de Sistemas Colaborativos. In X
SBSC - Simpsio Brasileiro de Sistemas Colaborativos.
2013. Manaus, AM, Brasil.

[6] Callaway, D. S., Newman, M., Strogatz, S. H. and Watts, D.


J. 2000. Network robustness and fragility: Percolation on
random graphs. Phys. Rev. Lett. 85, 54685471.

[23] Kumar, V., Steinbach, M. and Tan P. 2009. Introduo ao


Data Mining - Minerao de Dados. Cincia Moderna, Rio
de Janeiro.

[7] Barbieri, A. L. 2011. Anlise de robustez em redes


complexas. Dissertao de Mestrado em Fsica Aplicada.
Instituto de Fsica de So Carlos. Universidade de So Paulo.
So Carlos.

[24] Barbosa, L. M. and Attux, R. 2014. Uma Proposta para


Identificar Informao em Artigos Cientficos Utilizando
Redes Complexas. In VII EADCA Encontro dos Alunos e
Docentes do Departamento de Computao e Automao
Industrial. Universidade Estadual de Campinas.

[8] Fortunato, S. 2010. Community detection in graphs. Phys.


Rep. 486 (3-5): 75174.
DOI=http://dx.doi.org/10.1016/j.physrep.2009.11.002.
[9] Porter, M. A., Onnela, J. P. and Mucha, P. J. 2009.
Communities in Networks. Not. Amer. Math. Soc. 56: 1082
1097, 11641166.

[25] Neo4j Graph Database. http://www.neo4j.org. (acessado em


01/05/2014).

[10] Travers, J. and Milgram, S. 1969. An experimental study of


the small world problem. Sociometry 32, 425443.

[26] Barabsi, A. L., Song, C. and Wang, D. 2012. Handful of


papers dominates citation. Nature. Vol 49

[11] Baronchelli, A., Ferrer-i-Cancho, R., Pastor-Satorras, R.,


Chater, N. and Christiansen, M. H. 2013. Networks in

156

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Uma Abordagem para Seleo e Visualizao Colaborativa


de Informaes em Situaes de Emergncia
Bruno S. Nascimento

Marcos R.S. Borges

Adriana S. Vivacqua

PPGI Programa de Ps-Graduao PPGI Programa de Ps-Graduao PPGI Programa de Ps-Graduao


em Informtica
em Informtica
em Informtica
UFRJ Universidade Federal do Rio UFRJ Universidade Federal do Rio UFRJ Universidade Federal do Rio
de Janeiro
de Janeiro
de Janeiro
Rio de Janeiro, Brasil
Rio de Janeiro, Brasil
Rio de Janeiro, Brasil
avivacqua@dcc.ufrj.br
mborges@nce.ufrj.br
bruno.nascimento@ppgi.ufrj.br

ABSTRACT

Categories and Subject Descriptors

Emergency situations are characterized by their complexity and


the heterogeneity of the available information. Often, emergency
managers are confronted with redundant or irrelevant information
causing the problem of information overload. Evidence of this
problem were identified in an exploratory survey conducted in the
Integrated Command and Control Centre of the city of Rio de
Janeiro (CICC-RJ). In this paper we propose an approach that
allows a user to overcome the difficulties of information overload.
Our approach takes into account that from a set of available
information, a manager can select only the information of interest.
This information can be transformed and then mapped to one or
more views to compose a dashboard. The whole process is
interactive, allowing the manager always necessary to redefine
your dashboard. In addition, our approach provides the use of
collaborative mechanisms, because we believe that there are times
that it is no longer possible for a single user to face the immense
data sets available alone.

H.5.3 Information Interfaces and Presentation (e.g., HCI): Group


and Organization Interfaces Computer-supported cooperative
work.

General Terms

Management, Design, Human Factors.

Keywords

Situaes de emergncia, Visualizao Colaborativa, Dashboards.

1. INTRODUO

De acordo com Comes et al. [4] situaes de emergncia so


caracterizadas por sua complexidade e heterogeneidade da
informao disponvel. Frequentemente, os gestores de
emergncia so confrontados com informaes redundantes ou
irrelevantes causando o problema da sobrecarga de informao. A
prpria informao nesse cenrio pode evoluir dinamicamente:
informaes novas ou mais precisas podem se tornar disponveis,
enquanto informaes j conhecidas podem ser confirmadas ou
refutadas.

RESUMO

Situaes de emergncia so caracterizadas por sua complexidade


e heterogeneidade da informao disponvel. Frequentemente, os
gestores de emergncia so confrontados com informaes
redundantes ou irrelevantes causando o problema da sobrecarga
de informao. Evidncias desse problema foram identificadas em
uma pesquisa exploratria realizada no Centro Integrado de
Comando e Controle da cidade do Rio de Janeiro (CICC-RJ).
Neste artigo propomos uma abordagem que permite a um gestor
superar as dificuldades da sobrecarga de informaes. Nossa
abordagem leva em considerao que a partir de um conjunto de
informaes disponveis, um gestor possa selecionar somente as
informaes do seu interesse. Essas informaes podem ser
combinadas/adequadas e ento, mapeadas para uma ou mais
visualizaes a compor um dashboard. Todo o processo
interativo, permitindo ao gestor redefinir sempre que necessrio o
seu dashboard. Alm disso, nossa abordagem prev o uso de
mecanismos de colaborao, pois consideramos que existem
momentos que no mais possvel para um nico usurio
enfrentar os imensos conjuntos de dados isoladamente.

As atividades realizadas em situaes de emergncia so por


natureza colaborativas, vrias equipes e organizaes trabalham
em conjunto, e os seus esforos conjuntos convergem para o
mesmo resultado, fazendo a situao voltar normalidade [19].
Durante uma emergncia, os gestores so frequentemente
sobrecarregados com relatrios e dados ofertados de diversos
sistemas de informao que competem por sua ateno. Alm
disso, relatrios mal concebidos em relao forma de
apresentao da informao podem ser difceis de compreender e
distrair a ateno desses gestores agravando o problema [23].
Evidncias do problema supracitado foram identificadas em uma
pesquisa exploratria realizada no Centro Integrado de Comando
e Controle da cidade do Rio de Janeiro (CICC-RJ). Para superar a
sobrecarga de informaes, sistemas de informao devem ser
concebidos de forma a fornecer a informao certa no momento
certo, na forma de apresentao certa para a pessoa certa [10].
A partir de uma pesquisa exploratria propomos uma abordagem
que permite a um gestor superar as dificuldades da sobrecarga de
informaes. Nossa abordagem leva em considerao que a partir
de um conjunto de informaes disponveis, um gestor possa
selecionar somente as informaes do seu interesse. Essas
informaes podem ser combinadas/adequadas e ento, mapeadas
para uma ou mais visualizaes a compor um dashboard. Todo o

Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

157

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

processo interativo, permitindo ao gestor redefinir sempre que


necessrio o seu dashboard.

2.2 Entrevistas semi-estruturadas

Foram realizadas entrevistas semi-estruturadas com 2 gestores do


CICC-RJ. Comeamos cada entrevista com uma introduo rpida
descrevendo o propsito da entrevista. Nosso objetivo era
entender: a estrutura e proposta do CICC, o dia-a-dia de trabalho
dos operadores de emergncia, suas prticas e quaisquer desafios
que eles enfrentavam. Tambm foi perguntado sobre os sistemas
de visualizao disponveis e quais eram suas limitaes. Cada
entrevista durou cerca de 1 hora.

Caractersticas colaborativas devem estar presentes nessa soluo,


visto que existem momentos que no mais possvel para um
nico usurio enfrentar os imensos conjuntos de dados
disponveis e tomar decises isoladamente. Para isso, buscou-se
na rea de Visualizao Colaborativa formas de transcender os
tradicionais sistemas de visualizao, passando de uma estrutura
monoltica somente um usurio interagindo para uma estrutura
com suporte a colaborao.

A partir dessas entrevistas pde-se listar diversas dificuldades


relacionadas ao problema da sobrecarga de informaes. Dentre as
quais destacamos:

Este artigo est organizado da seguinte maneira: na Seo 2


apresentada uma pesquisa exploratria realizada no Centro
Integrado de Comando e Controle da cidade do Rio de Janeiro
(CICC-RJ). Apresentamos a rea de Visualizao Colaborativa e
o conceito de Dashboards, respectivamente nas Sees 3 e 4. Os
trabalhos relacionados so apresentados na Seo 5. E na Seo 6
apresentado a abordagem. Para finalizar a Seo 7 apresenta as
consideraes finais e os trabalhos que esto sendo realizados.

2. PESQUISA EXPLORATRIA

Uma pesquisa exploratria foi realizada no Centro Integrado de


Comando e Controle da cidade do Rio de Janeiro (CICC-RJ) ao
longo do primeiro semestre de 2014. A pesquisa envolveu
diversas etapas: observao in loco, entrevistas semi-estruturadas
com gestores e levantamento bibliogrfico.

A dificuldade de compreenso de informaes devido as


formas de apresentao mal concebidas.

Estrutura dos
CICCs

A colaborao entre as agncias e os primeiros


socorristas na resposta. Agncias, incluindo os governos
federais, estaduais e locais colaboram e compartilham
informaes atravs de alguns sistemas de informao
disponveis. Entretanto, a integrao dos sistemas de
informaes ainda no significa a abertura completa
dos bancos dados de cada uma das instituies. Esse
ponto crtico pois existem vrias questes quanto a
preservao de informaes sigilosas;

Mesmo com todo o aparato tecnolgico disponvel. O


monitoramento das informaes depende dos
mediadores humanos, do seu olhar e da capacidade
interpretativa.

Tpicos

Dentre as vrias impresses obtidas nas observaes, destacamos:

A falha na habilidade ou falta de recursos para adicionar


valor informao que pode ser perdida ou no
reconhecida ou;

Tabela 1. Descrio do levantamento bibliogrfico

2.1 Observao in loco

Em caso de emergncia, as decises devem ser tomadas


rapidamente usando a melhor informao disponvel;

Foi realizado um levantamento bibliogrfico, que permitiu


estabelecer a fundamentao terica necessria para a pesquisa.
Buscou-se referncias relacionadas aos tpicos de acordo com a
Tabela 1. Alguns desses tpicos sero apresentados brevemente
nas prximas Sees.

Nas observaes nossa preocupao era de no interferir nas


atividades realizadas pelos gestores e operadores de emergncia.
Durante as observaes in loco acompanhamos a ao dos
operadores de emergncia em situaes rotineiras e a preparao
para o monitoramento de situaes de emergncia com alto
impacto social, como megaeventos, catstrofes naturais,
manifestaes sociais, para citar alguns.

A dificuldade em decidir o que deve receber ateno e


obter as principais informaes de interesse de acordo
com o contexto em tempo hbil;

2.3 Levantamento bibliogrfico

A pesquisa nos possibilitou obter evidncias do problema da


sobrecarga de informaes, bem como obter uma maior
compreenso das dificuldades enfrentadas pelos gestores (ou
operadores de emergncia). A partir da pesquisa foi possvel
avaliar quais teorias ou conceitos existentes poderiam ser
aplicados ao problema ou se seriam necessrios desenvolver
novas abordagens para solucionar o problema. Cada uma das
etapas sero apresentadas nas subsees a seguir.

Causas
e
sintomas da
sobrecarga de
informaes

Em nossas anlises foram encontradas


evidncias do problema da sobrecarga de
informaes. Essa sobrecarga faz com que os
gestores de emergncia gastem muito tempo
processando grandes volumes de dados na
tentativa de extrair algum conhecimento
significativo. Logo, tornou-se necessrio o
uso de alguma estratgia para organizar e
representar estas informaes, de modo que os
problemas gerados por sua sobrecarga sejam
minimizados.

Visualizao
Colaborativa

Identificado o problema da sobrecarga de


informao e levando em conta a natureza
colaborativa dos atores envolvidos em uma
situao de emergncia, aprofundamos o
estudo na rea de Visualizao Colaborativa
(Seo 3).

Dashboards

158

Descrio
Foram coletados documentos disponveis da
Secretaria Extraordinria de Segurana para
Grandes Eventos do Ministrio da Justia.
Algumas teses, dissertaes e artigos tambm
serviram como material de pesquisa.

Os gestores de emergncia necessitam de um


sistema de apoio as suas decises.
Dashboards podem oferecer uma soluo ao

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

problema da sobrecarga de informao,


fornecendo um conjunto de indicadores para
gesto de desempenho ou monitoramento,
incorporando vrios conceitos e aplicaes
(Seo 4).

Trabalhos
relacionados

Realizamos um levantamento de trabalhos


inseridos no domnio de emergncia, que
buscam superar o problema da sobrecarga de
informaes
empregando
seleo
e
visualizao como parte da soluo (Seo 5).
Figura 1. Extenso do modelo de visualizao (extrado de
Wood et al. [22])

3. VISUALIZAO COLABORATIVA

De acordo com Hu et al. [12], com os crescentes desafios de


anlise de dados e visualizao, a resoluo de problemas que
envolvem colaborao tem atrado o interesse de pesquisadores de
visualizao. O campo de pesquisa que envolve visualizao e
aspectos de colaborao denominado Visualizao
Colaborativa. Este termo refere-se a um subconjunto de
aplicaes da rea de Computer-Supported Cooperative Work
(CSCW) no qual o controle de parmetros ou produtos do
processo de visualizao so compartilhados [16]. Segundo
Isenberg et al. [14], uma definio mais ampla para visualizao
colaborativa :

3.1 Correntes de Pesquisa em Visualizao


Colaborativa

Em diversos trabalhos [2, 12, 14, 15] so descritos duas grandes


correntes de pesquisa no qual retratam o cenrio de visualizao
colaborativa: distribuda e colocado.

O uso compartilhado de representaes visuais de


dados, suportadas por computador e interativas, com o
objetivo comum de contribuir para as atividades de
processamento de informao em conjunto.
Visualizao Colaborativa facilita o desenvolvimento de sistemas
que permitem aos colaboradores visualizar e analisar o mesmo
conjunto de dados, ou imagens, destacando os seus elementos. De
acordo com Isenberg e Carpendale [15], em muitos domnios o
aumento da colaborao levou a mais inovao, promovendo a
partilha de conhecimentos, habilidades e ideias. A anlise
compartilhada no s eleva a capacidade de processamento de
informao, mas tambm permite a uma equipe negociar e discutir
os seus pontos de vista e interpretaes sobre um conjunto de
dados e contribuir perspectivas nicas sobre um determinado
problema.

Figura 2. Visualizao Colaborativa distribuda e colocada


(extrado de Isenberg [14])
A visualizao colaborativa distribuda (imagem esquerda da
Figura 2) tem seu foco nas arquiteturas e mecanismos de
sincronizao para permitir o trabalho remoto e eficiente,
permitindo a colaborao tanto a nvel de sistema quanto a nvel
de usurio. Um ambiente distribudo um cenrio comum para
visualizao colaborativa. Este tipo de ambiente permite que
usurios de diferentes locais acessem dados, compartilham
imagens e anlises dos resultados, interao e cooperao, atravs
de uma rede, sejam por meio de momentos sncronos (veja
exemplo do sistema CoMotion - http://www.gdviz.com/) ou
assncronos (veja exemplos dos sistemas sense.us http://vis.stanford.edu/papers/senseus,
Many
Eyes
http://www.manyeyes.com/ e Swivel - http://www.swivel.com/).

Segundo Hu et al. [12], sistemas de visualizao colaborativa vem


sendo desenvolvidos por grandes projetos cientficos. No trabalho
de Wood et al. [22] apresentado uma extenso do modelo de
visualizao cientfica proposto por Haber e McNabb [11] que
serve como base para o desenvolvimento destes tipos de
aplicaes. O modelo de Haber e McNabb [11] apresenta o
processo de visualizao como um pipeline que iniciado com a
entrada de dados que passam por processos de filtro, mapeamento
e renderizao at a gerao de uma imagem final. J no trabalho
de Wood et al. [22] proposto um pipeline de visualizao para
cada colaborador considerando a atuao de vrios participantes
independentes. Em seu modelo a troca de dados feita em pontos
arbitrrios do pipeline permitindo enviar e receber dados.
Tambm possvel realizar o controle compartilhado, onde a
definio de parmetros deve ser controlada localmente pelo
usurio ou externamente por um colaborador. A colaborao
dinmica requer que os pipelines e o compartilhamento entre eles
sejam um processo interativo, com um modo instrutor permitindo
o lanamento de mdulos e que pipelines inteiros sejam
externamente inicializados.

A visualizao colaborativa colocada (imagem direita da Figura 2)


ocorre quando usurios compartilham o mesmo espao de
trabalho, ou seja, diferentemente da visualizao colaborativa
distribuda onde os usurios esto remotamente dispersos, o
cenrio colocalizado fornece um meio para que usurios
estabeleam comunicao em um mesmo local, por exemplo,
aplicaes em torno de uma mesa multi-touch ou em um ambiente
multi-display. importante ressaltar que apesar desse tipo de
tecnologia se tornar mais acessvel (muitas vezes no h
necessidade de uso de hardware especfico), as entradas sncronas
adicionais podem levar a desafios relacionados a: mecanismo de
apoio a coordenao, percepo das atividades realizadas pelos
demais usurios ou a transferncia de itens originados de diversos

159

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

dispositivos para um mesmo espao de trabalho, para citar alguns.


No caso de considerarmos as entradas assncronas no cenrio
colocado (mesmo local, tempos diferentes), recentemente tem
havido novas pesquisas, principalmente em situaes no qual
desejvel apresentar informaes do ambiente (por exemplo em
hospitais, aeroportos e shopping centers).

Para este trabalho consideraremos a definio proposta por Few


[8], que define um dashboard como:
Uma representao visual das informaes mais
importantes e necessrias para alcanar um ou mais
objetivos, consolidadas e organizadas em uma nica
tela para monitoramento das informaes em um
relance.

4. DASHBOARDS

De acordo Zagorecki et al. [24] a ideia de dashboard evoluiu a


partir do conceito de sistemas de apoio a deciso que surgiram na
dcada de 1970. Em muitos aspectos, Dashboards simplesmente
um novo nome para Executive Information Systems EIS.
Estes sistemas foram particularmente focados em visualizao de
dados para apoio a deciso e foram primeiramente desenvolvidos
entorno de 1985. Seu propsito era mostrar indicadores de
desempenho em uma simples interface para executivos de
empresas que, de fato, raramente o utilizavam. De acordo com
Few [9], nessa poca a ideia no era prtica; principalmente
devido a problemas relacionados a atualizao e ao manuseio da
enorme quantidade de dados disponveis. Segundo o autor os
dados eram por vezes incompletos, no confiveis e espalhados
por diversas fontes. Portanto, na mesma dcada que o EIS surgiu,
ele tambm entrou em um estado de hibernao, aguardando por
uma era onde essas ideias pudessem ser realizadas.

4.1 Princpios Fundamentais

Dashboards podem apoiar uma ampla gama de necessidades para


monitoramento, abrangendo todas as tarefas que se beneficiam de
uma viso imediata do que est acontecendo. Para desenvolver um
dashboard necessrio considerar um conjunto de caractersticas
que afetam a forma como eles sero planejados. A Tabela 2
apresenta sucintamente essas caractersticas.
Tabela 2. Conjunto de caractersticas para o planejamento de
um dashboard
Caractersticas

Frequncia
atualizao

Durante a dcada de 1990, data warehousing, online analytical


processing OLAP e eventualmente business intelligence BI
trabalharam como parceiras na tentativa de domar o avano
selvagem da era da informao. A nfase durante estes anos era
sobre a coleta, a correo, a integrao, o armazenamento e o
acesso a informaes precisas, oportunas e teis. Desde a dcada
de 1980 o esforo foi em grande parte focado em tecnologias e,
em menor grau, em metodologias necessrias para tornar os dados
disponveis e teis. Com isso, os beneficirios diretos, foram em
sua maioria, os usurios com maior grau de proficincia no uso de
computadores, capazes de usar as complicadas ferramentas de
navegao nos grandes e, frequentemente complexos bancos de
dados.

de

Descrio
Diria
De hora em hora
Em tempo real

Experincia do
usurio

Novato
Qualificado
Especialista
Uma pessoa

Tamanho
audincia

Tambm surgiu no incio da dcada de 1990 uma nova abordagem


para gerenciamento que envolveu a identificao e uso de
indicadores de desempenho (Key performance indicators KPIs).
Este mtodo introduzido por Robert S. Kaplan e David P. Norton
conhecido como Balanced Scorecard [5]. De acordo com Few
[9] os avanos em data warehousing e o conjunto de tecnologias
relacionadas configuram o cenrio de interesse atual da gesto
atravs de mtricas (no somente mtricas financeiras). Business
Performance Management BPM tornou-se uma preocupao
internacional. Com essa infraestrutura construda pelo data
warehousing e o interesse do BPM em mtricas que podem ser
facilmente monitorados, impulsionaram novamente a ideia dos
dashboards.

da

Mltiplos usurios
requisies
Mltiplos
monitorar
dados

usurios
diferentes

com

as

mesmas

que
necessitam
subconjuntos dos

Desktop/laptop
Plataforma

Web server/browser
Dispositivos mveis
Telas de grande proporo

Tipo de tela

Telas de tamanho padro


Telas pequenas
Telas de tamanhos variados

No final da dcada de 1990, o conceito de dashboards ressurgiu


de forma atualizada. O mesmo conceito foi replicado para nveis
gerenciais mais baixos e desta vez, provou ser mais til e aceito
pelos usurios potenciais. De acordo com Few [9] dashboards se
tornaram populares aps o escndalo da Enron em 2001,
entretanto, ainda no existe uma definio clara acerca dos
dashboards, nem por fornecedores de software nem mesmo por
acadmicos. Os fornecedores de dashboards os define a partir das
caractersticas que os seus produtos tm. J os pesquisadores
falam sobre diferentes tipos de aplicaes do conceito de
dashboard e em diferentes estgios de seu desenvolvimento [18].

Tipos de dados

Quantitativo
No quantitativo

Essas caractersticas tem uma influncia significativa na forma


como um dashboard deve ser planejado. Portanto, devem ser
consideradas durante as fases de especificao e implementao
do dashboard.

160

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

mais possvel para um nico gestor enfrentar os imensos


conjuntos de dados disponveis e tomar decises isoladamente.

5. TRABALHOS RELACIONADOS

Diferentes trabalhos encontrados na literatura esto inseridos no


domnio de emergncia. Destes, alguns buscam superar o
problema da sobrecarga de informaes empregando seleo e
visualizao.

6. PROPOSTA DE SOLUO

A abordagem proposta visa permitir ao gestor selecionar e


visualizar informaes de interesse de acordo com o seu contexto
e ainda prev mecanismos de colaborao. Nossa abordagem
apresenta um pipeline que vai da seleo a visualizao da
informao como uma transio atravs de uma sequncia,
comeando com a gerao das informaes do domnio e
terminando com as formas de apresentao adequadas para cada
tipo de informao em um dashboard (Figura 3).

Ernst and Ostrovskii [7] e Andrienko and Andrienko [1]


abordaram a visualizao inteligente de informao situacional em
Sistemas de Informao Geogrfica (SIG), porm, com foco na
apresentao especfica para cada papel envolvido e seu contexto.
Ambos utilizam visualizao temtica, interpretao da
necessidade e da inteno do usurio e conhecimento especfico
do domnio, documentado em ontologias.

Nosso pipeline foi inspirado nos modelos de referncia de


visualizao propostos por Card et al [3] e no modelo de
visualizao colaborativa proposto por Wood et al. [22]. O
emprego de um modelo tem como objetivo oferecer referncias
importantes de como criar visualizaes a partir de dados brutos,
identificando-se componentes essenciais a serem considerados na
utilizao de uma determinada tcnica ou no desenvolvimento de
uma nova [20].

Engelbrecht [6] prope um modelo para avaliao da informao


com relao a sua utilidade a cada momento. O modelo obtido
baseia-se em mtodos multicritrio de tomada de deciso e foi
aplicado em uma ferramenta colaborativa desenvolvida para
visualizao em uma mesa multi-touch.
O trabalho de Ibarra et al. [13] apresenta uma estratgia para
selecionar e visualizar os pontos de interesse mais relevantes em
um mapa digital, de acordo com a rea de influncia da
emergncia. Esta estratgia foi implementada na ferramenta
MobileMap, que apoia a tomada de deciso dos bombeiros em
emergncias urbanas.

A Figura 3 contm cinco caixas que vo desde os dados brutos (


esquerda) at a definio do dashboard ( direita). A caixa mais
esquerda representa todos os dados que esto disponveis no
domnio em sua forma bruta, seja ele dinmico ou esttico.
Entende-se por um dado dinmico aquele que muda ao decorrer
do tempo. J o dado esttico permanece constante.

No trabalho de Wampler et al. [21] apresentado uma ferramenta


de visualizao dinmica denominada de Command Post of the
Future (CPOF) - que suporta a tomada de deciso colaborativa em
unidades tticas. O sistema utiliza um espao de trabalho
personalizvel com base nas necessidades do usurio, em vez de
um formato esttico.

Partimos do princpio que todas os dados esto disponveis em um


determinado formato e que no necessariamente obedecem a um
esquema. Esses dados so dos mais diferentes formatos e
provenientes de diversas fontes.

O trabalho de Zagorecki et al. [24] aborda uma investigao sobre


a aplicao de dashboards na gesto de emergncias. A ideia
principal entregar informaes sobre o estado da organizao,
por meio de medidas simples, sumrios de desempenho e
visualizaes intuitivas.

A segunda caixa representa as informaes contextuais, essas


informaes so provenientes dos dados brutos. Estas
informaes so obtidas atravs de seleo explcita. Na transio
da caixa que representa os dados brutos para a caixa que
representa as informaes contextuais, a informao selecionada
de acordo com s necessidades do gestor. Nesse momento o
gestor define quais so as informaes do seu interesse de acordo
com seu contexto, podendo realizar transformaes sobre os
dados brutos, tais como: filtragem, agrupamento, ou gerar novas
informaes (mdia, soma, desvios, etc.). Esta seleo busca
separar a informao relevante entre a irrelevante.

Em todos trabalhos relacionados, observou-se que de fato existe


uma grande preocupao em superar a sobrecarga de informaes.
Se levarmos em considerao que as equipes de emergncia atuam
em ambientes complexos, que se caracterizam pela ao de
diversos tipos de atores, a imprevisibilidade de acontecimentos, a
troca de informaes de diferentes formas e a adaptao ao longo
da evoluo de uma situao [17], este problema se torna ainda
mais difcil de lidar.

A terceira caixa representa o mapeamento visual. Esta caixa


representa as formas de visualizao mais adequadas para cada
tipo de informao. Essas formas de visualizao podem variar
desde o emprego de grficos tradicionais (de pontos, de barras,
circulares e histogramas), tabelas, formas mais elaboradas (com
uso de cores e smbolos geomtricos), imagens reais (figuras ou
vdeos) ou mapeamentos (de um objeto ou espao fsico) at
representaes mais complexas atravs do uso de diagramas
(rvores, redes e grafos) ou metforas visuais, fazendo referncia a
relacionamentos e conceitos abstratos. A transio da caixa que
representa as informaes contextuais para a caixa que representa
o mapeamento visual de carter inteiramente da aplicao. A
relao da informao para uma forma de visualizao de 1...n,
ou seja, a partir de uma informao pode-se ter uma ou mais
visualizaes associadas. Para clarificar isso, imagine uma
informao que represente o ndice pluviomtrico de uma
determinada regio durante um perodo de tempo. Essa
informao pode ser mapeada para uma tabela ou para um grfico.

Tambm observamos que geralmente os trabalhos apresentados


nesse tipo de domnio fazem uso de solues que so definidas em
tempo de projeto. Devido a dinamicidade do ambiente, novos
requisitos de informao podem surgir em tempo de uso, fazendo
com que a seleo de informaes de interesse e o tipo de
visualizao sejam modificados. Esse fato tem se tornado crtico
nos ltimos anos, fazendo com que os gestores encontrem
dificuldades para fazer adaptaes tendo em vista a rigidez das
solues.
Nossa proposta se diferencia das demais abordagens mencionadas,
pelo fato de permitir aos gestores selecionar informaes de
interesse e visualiz-las de acordo seu contexto. Propomos um
processo interativo, que permite ao gestor redefinir sempre que
necessrio suas informaes e o tipo de visualizao, de forma a
compor seu prprio dashboard independentemente do domnio.
Alm disso, nossa abordagem prev o uso de mecanismos de
colaborao, pois consideramos que existem momentos que no

161

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Dashboard

Figura 3. Abordagem para seleo e Visualizao Colaborativa de Informaes


A quarta caixa representa as estruturas visuais contextuais, ou
seja, todas as visualizaes definidas pelo gestor. Para isso, deve
ocorrer transio da caixa que representa o mapeamento visual
para a caixa que representa as estruturas visuais contextuais. Uma
vez que todas as formas de visualizao mapeadas esto
disponveis, o gestor pode escolher qual visualizao a mais
adequada para o contexto dele. Estas visualizaes iro compor
um dashboard, permitindo a ele ter acesso s informaes do seu
interesse de forma consolidadas e organizadas.

gestor interage com o sistema cliente, sendo que todas as etapas


do pipeline so tratadas no servidor. importante ressaltar que
nesse tipo de arquitetura o tempo de feedback suscetvel aos
atrasos de rede, pois o processamento realizado no servidor.
Cabe tambm destacar que todo o processo interativo. Isso til
porque os gestores esto interessados apenas em informaes
relevantes ao desenvolvimento da tarefa atual. Levando em conta
a dinamicidade dos eventos o gestor pode optar por redefinir seu
dashboard sempre que necessrio.

Por fim, a quinta caixa representa as vises. Estas so resultados


de transformaes visuais e definio de eventos. Cada
visualizao pode ter uma viso correspondente. Na transio da
caixa que representa as estruturas visuais contextuais para a caixa
que representa as vises, os gestores podem realizar
transformaes nas visualizaes (ex. modificar o nvel de zoom)
ou criar eventos que os ajudem a identificar mudanas contextuais
que carecem de ateno (ex. fazer a tela piscar ou emitir um sinal
sonoro).

7. CONSIDERAES FINAIS E
TRABALHOS FUTUROS

Neste trabalho foi apresentado uma pesquisa exploratria


realizada no Centro Integrado de Comando e Controle da cidade
do Rio de Janeiro (CICC-RJ). Nesta pesquisa encontramos
evidncias do problema de sobrecarga de informao e
verificamos que o sucesso dos gestores depende de ter a
informao certa disponvel no momento certo, na forma de
apresentao certa.

Com relao aos mecanismos de colaborao, nossa abordagem


suporta diferentes cenrios. Assim como no trabalho de Wood et
al. [22] nossa abordagem contempla um pipeline de visualizao
para cada colaborador considerando a atuao de vrios
participantes independentes. Est previsto a realizao de troca de
dados em pontos arbitrrios do pipeline permitindo enviar e
receber dados, formando um espao de trabalho compartilhado.
Alm disso, possvel realizar o controle compartilhado, onde a
definio de parmetros deve ser controlada localmente pelo
gestor ou externamente por um colaborador.

A pesquisa exploratria permitiu avaliar quais teorias ou


conceitos existentes poderiam ser aplicados ao problema ou se
seriam necessrios desenvolver novas abordagens para solucionar
o problema.
Com base nessa pesquisa foi proposto uma nova abordagem que
visa permitir ao gestor selecionar e visualizar informaes de
interesse de acordo com o seu contexto e ainda prev mecanismos
de colaborao. Nossa abordagem apresenta um pipeline que vai
da seleo a visualizao da informao como uma transio
atravs de uma sequncia, comeando com a gerao das
informaes do domnio e terminando com as formas de
apresentao adequadas para cada tipo de informao em um
dashboard.

Quanto a arquitetura para suporte desses mecanismos de


colaborao nossa recomendao que seja adotado um modelo
de arquitetura centralizado baseado no modelo cliente-servidor.
Visto a complexidade dos tipos de informaes do cenrio de
emergncia relacionadas a: processos de captura das informaes,
seu sigilo, confiabilidade, para citar alguns. Deixamos a cargo do
servidor todo o gerenciamento e processamento. Com isso, o

Um conjunto de caractersticas para o planejamento de um


dashboard foi apresentado. Essas caractersticas devem ser

162

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

levadas em conta durante as fases de especificao e


implementao do dashboard.

[7]

Ernst, V. and Ostrovskii, M. 2007. Intelligent


cartographic presentations for emergency situations.
Mobile Response. (2007), 87105.

[8]

Few, S. 2004. Dashboard


Enterprise. (2004).

[9]

Few, S. 2013. Information Dashboard Design:


Displaying Data for At-a-glance Monitoring. Analytics
Press.

[10]

Fischer, G. 2012. Context-aware systems: the right


information, at the right time, in the right place, in
the right way, to the right person. Proceedings of the
International Working Conference . (2012).

[11]

Haber, R.B. and McNabb, D.A. 1990. Visualization


idioms: A conceptual model for scientific visualization
systems. Visualization in scientific computing. 74,
(1990), 93.

[12]

Hu, X. et al. 2012. Evaluation of co-located and


distributed collaborative visualization. Proceedings of
the 5th . (2012), 95103.

[13]

Ibarra, M.J. et al. 2012. Visualization of relevant


information on mobile devices for emergency situations.
2012 XXXVIII Conferencia Latinoamericana En
Informatica (CLEI). (Oct. 2012), 110.

[14]

Isenberg, P. et al. 2011. Collaborative visualization:


Definition, challenges, and research agenda. Information
Visualization. 10, 4 (Jul. 2011), 310326.

[15]

Andrienko, N. and Andrienko, G. 2007. Intelligent


visualisation and information presentation for civil crisis
management. Transactions in GIS. (2007), 291298.

Isenberg, P. and Carpendale, S. 2007. Interactive tree


comparison for co-located collaborative information
visualization. IEEE transactions on visualization and
computer graphics. 13, 6 (2007), 12329.

[16]

Brodlie, K.W. et al. 2004. Distributed and Collaborative


Visualization. Computer Graphics Forum. 23, 2 (Jun.
2004), 223251.

Johnson, G. and Elvins, T. 1998. Introduction to


collaborative visualization. ACM Siggraph Computer
Graphics. 32, May (1998), 811.

[17]

[3]

Card, S.K. et al. 1999. Readings in information


visualization: using vision to think. Morgan Kaufmann.

Mitchell, M. 2009. Complexity: A guided tour. Oxford


University Press.

[18]

[4]

Comes, T. et al. 2012. Efficient scenario updating in


emergency management. Response and Management
. April (2012), 110.

Pauwels, K. et al. 2009. Dashboards as a Service Why,


What, How, and What Research Is Needed? Journal of
Service Research. 12, 2 (2009), 175189.

[19]

Quintanilha, C.B. et al. 2011. Social networks and


emergency: From society to the command room.
Proceedings of the 2011 15th International Conference
on Computer Supported Cooperative Work in Design
(CSCWD). (Jun. 2011), 538543.

[20]

Valiati, E.R. de A. 2008. Avaliao de Usabilidade de


Tcnicas
de
Visualizao
de
Informaes
Multidimensionais. Universidade Federal do Rio Grande
do Sul.

Espera-se que a soluo ajude aos gestores a identificar


informaes de interesse que caream de ateno imediata. O
dashboard deve manter a percepo da situao com a ltima
informao existente (de acordo com a frequncia de atualizao
definida pelo gestor) e usar mecanismos para uma visualizao de
fcil interpretao.
importante salientar que apesar de uma situao de emergncia
ser por natureza colaborativa, o uso de mecanismos de
colaborao de deciso do gestor, ou seja, ele quem decide
quando e o que compartilhar, e at mesmo quem exerce o controle
local de um conjunto de dados (ou visualizao) quando
compartilhados.
O trabalho apresentado encontra-se em andamento e os seus
objetivos foram apenas parcialmente atingidos. Infelizmente, no
houve possibilidades de implementao, teste e avaliao da
abordagem, ficando para uma prxima fase. No entanto, em
conversas com potenciais usurios a soluo parece ser
promissora. Eles sinalizaram que esse tipo de abordagem novo
para eles e que tais ferramentas sero potencialmente teis na sua
prtica.
Esperamos alcanar resultados que sero aplicveis em uma ampla
gama de domnios. A implementao da abordagem se mostra
factvel e apenas um primeiro passo para depois pensarmos em
outras solues mais sofisticadas como: recomendao de
informao ou visualizao inteligente.

8. AGRADECIMENTOS

Este trabalho foi apoiado parcialmente por recursos da FAPERJ e


do CNPq. Bruno S. Nascimento recebe bolsa de doutorado da
CAPES.

9. REFERNCIAS
[1]

[2]

[5]

Eckerson, W.W. 2010. Performance dashboards:


measuring, monitoring, and managing your business.
John Wiley & Sons.

[6]

Engelbrecht, A.F.F. 2011. Um Modelo De Apoio A


Percepo Situacional Na Resposta A Emergncias.
2011. Dissertao de Mestrado. Programa de PsGrauao em Informtica. Universidade Federal do Rio
de Janeiro.

163

Confusion.

Intelligent

SBSC 2014 Proceedings - Ongoing Research

[21]

Wampler, R. et al. 2009. Determining a Critical-Skill


Hierarchy for Command Post of the Future (CPOF).
(2009).

[22]

Wood, J. et al. 1997. Collaborative visualization.


Visualization97., Proceedings. (1997), 253259.

[23]

Yigitbasioglu, O.M. and Velcu, O. 2012. A review of


dashboards in performance management: Implications for
design and research. International Journal of Accounting
Information Systems. 13, 1 (Mar. 2012), 4159.

October 6-9, 2014 - Curitiba, PR, Brazil

[24]

164

Zagorecki, A. et al. 2012. Executive Dashboard Systems


For Emergency. CommunicationsScientific Letters of
the University of Zilina. 14, 2 (2012), 8289.

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

Desafios para colaborao no atendimento pr-hospitalar


em acidentes de mltiplas vtimas
Rodrigo C. Andrade

Bruno S. Nascimento

Marcos R.S. Borges

Adriana S. Vivacqua

PPGI Programa de PsGraduao em Informtica


UFRJ Universidade Federal do
Rio de Janeiro
Rio de Janeiro, Brasil

PPGI Programa de PsGraduao em Informtica


UFRJ Universidade Federal do
Rio de Janeiro
Rio de Janeiro, Brasil

PPGI Programa de PsGraduao em Informtica


UFRJ Universidade Federal do
Rio de Janeiro
Rio de Janeiro, Brasil

PPGI Programa de PsGraduao em Informtica


UFRJ Universidade Federal do
Rio de Janeiro
Rio de Janeiro, Brasil

mborges@nce.ufrj.br

avivacqua@dcc.ufrj.br

rodrigo.andrade@ppgi.ufrj.br bruno.nascimento@ppgi.ufrj.br

ABSTRACT

Although many researchers have discussed important questions


about medical emergencies management, there are still few
technologies designed to support the aspects of collaboration
(communication, coordination and cooperation) that fulfill the
gaps between prehospital care and the experts inside the
emergency department (medical first responders, surgeons,
radiologists, nurses). In this field, there is few empirical data
available and a sparse vision regarding the factors that could make
easier or harder the collaboration between the stakeholders. In this
article, we present a broad view of the relevant challenges through
an exploratory research. We used the 3C Collaboration model for
organizing the problem domain to shore-up the future
development of a collaborative system.

Keywords
Colaborao,
Emergncias.

Acidentes

de

mltiplas

vtimas

(AMV),

1. INTRODUO

Do ponto de vista de sade, gesto de emergncia uma atividade


ampla e colaborativa cujo foco est em salvar vidas durante e aps
a crise. Em grandes crises, com mltiplas vtimas, dentro de um
cenrio catico tais como inundaes, terremotos, desabamento e
incndios, crucial existir uma colaborao estreita entre os
servios mdicos de atendimento pr-hospitalar e os
departamentos de emergncia mdica hospitalar.
Decises tomadas em situaes de crise sem um modelo de
colaborao bem definido, podem causar atrasos e danos nos
cuidados dos pacientes que em geral esto em srio risco de
morte. Um exemplo disso ocorreu durante os ataques de 11 de
setembro ao WTC em 2001, onde inicialmente, todas as vtimas
foram encaminhadas para os trs hospitais mais prximos, o que
causou uma sobrecarga nessas instituies Segundo Oster et al
[1]. Mais recentemente, temos o caso do resgate do incndio na
boate Kiss, no final de janeiro de 2013, em Santa Maria (RS)
Brasil. No qual as equipes de atendimento pr-hospitalar que
atuaram no resgate tiveram grandes dificuldades nos processos de
triagem, tratamento e transporte para os departamentos de
emergncias hospitalares, devido diversos fatores como a grande
quantidade de vtimas, a velocidade dos acontecimentos, o tempo
disponvel para tomar decises, a disponibilidade de recursos, a
falta de percepo situacional e a presso do tempo [2].

RESUMO

Embora vrios pesquisadores tenham levantado questes


importantes quanto a gesto de emergncias mdicas, ainda
existem poucas tecnologias projetadas para apoiar os aspectos de
colaborao (comunicao, coordenao e cooperao) que
preencham a lacuna entre o atendimento pr-hospitalar e os
especialistas dentro do departamento de emergncia (mdicos
socorristas, cirurgies, radiologistas, enfermeiros). Neste campo
existem poucos dados empricos disponveis e h uma viso
esparsa sobre os fatores que podem dificultar ou facilitar a
colaborao entre os stakeholders. Neste artigo, apresentamos
uma viso geral dos desafios e obstculos relevantes, atravs de
uma pesquisa exploratria. Utilizamos o modelo 3C de
colaborao para organizao das problemticas do domnio, de
modo a embasar a proposta futura de desenvolvimento de um
sistema colaborativo.

Para que se tenha uma gesto de emergncia satisfatria


necessrio desenvolver sistemas que apoiem a colaborao de
forma eficaz e transparente entre as equipes. Embora algumas
iniciativas estejam sendo desenvolvidas para apoiar socorristas e
as equipes de emergncia, ainda existem poucas tecnologias
projetadas para apoiar os aspectos de colaborao, que preencham
a lacuna entre o atendimento pr-hospitalar e os especialistas
dentro do departamento de emergncia (mdicos socorristas,
cirurgies, radiologistas, enfermeiros). Conforme veremos nas
prximas sees, pouco de tecnologia tem sido agregado nessas
situaes no Brasil e em boa parte do mundo. Principalmente,
quando se trata de acidentes de mltiplas vtimas (AMV), os
modelos atuais de triagem, tratamento e transporte empregados no
atendimento pr-hospitalar, ainda utilizam mtodos tradicionais
que so baseados em papel. Entretanto, como o intuito principal
o compartilhamento da informao entre as equipes, seu
funcionamento acaba sendo subutilizado a no ser que diversas
cpias desses papeis sejam feitas e repassados para cada membro

Categories and Subject Descriptors

H.5.3 Information Interfaces and Presentation (e.g., HCI): Group


and Organization Interfaces Computer-supported cooperative
work.

General Terms

Management, Design, Human Factors.


Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee. SBSC 2014 Brazilian
Symposium on Collaborative Systems. October 6-9, 2014. Curitiba, PR,
Brazil. Copyright 2014 SBC. ISSN 2318-4132 (pendrive).

165

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

da equipe, o que torna o processo laborioso e lento, no


permitindo otimizar a visualizao e melhorar a tomada de sentido
das informaes ali contidas.
Nosso objetivo de pesquisa a longo prazo desenvolver sistemas
de informao que apoiem a colaborao entre as equipes no
atendimento pr-hospitalar em acidentes de mltiplas vtimas.
Entretanto, antes de efetivamente projetar estes sistemas, devemos
entender os desafios que as equipes enfrentam ao tentar coordenar
um ao outro durante uma crise. Alm disso, necessrio saber
como se d a comunicao entre as equipes, quais tipos de
informaes lhes so relevantes, e como se d o processo de
cooperao entre especialistas de sade dentro do escopo inicial
do atendimento pr-hospitalar.
Para isso, este trabalho apresenta uma pesquisa exploratria
quanto aos desafios e obstculos relevantes que envolvem
membros das equipes de atendimento pr-hospitalar no que diz
respeito a sua atuao em AMV. Nesta pesquisa, foram realizadas
revises bibliogrficas, observao de vdeos instrucionais e
entrevistas com stakeholders tanto com experincia em
emergncia mdica hospitalar quanto com experincia em regaste
e pronto-atendimento no SAMU.

Figura 1. Diagrama do modelo 3C de colaborao [3]

3. ACIDENTES COM MLTIPLAS


VTIMAS (AMV)

Segundo o protocolo nacional de emergncia [9], o atendimento a


acidentes com mltiplas vtimas um desafio no qual os servios
de atendimentos pr-hospitalares e os hospitais se deparam com
frequncia. Diante dessas situaes ocorre uma incapacidade dos
servios de sade lidarem com esse problema, havendo, desta
forma, necessidade de se estar preparado e treinado para atender
esses acidentes.

Utilizamos o modelo 3C de colaborao para organizao das


problemticas do domnio, de modo a embasar a proposta futura
de desenvolvimento de um sistema colaborativo.
Este artigo est organizado da seguinte forma: a seo seguinte
apresenta uma sucinta apresentao do modelo 3C de
colaborao. A seo 3 descreve o domnio de Acidentes de
Mltiplas Vtimas. A seo 4 apresentam os desafios de
colaborao nesse domnio. A seo 5 apresentam algumas
tecnologias de apoio a AMV. As consideraes finais so
apresentadas na seo 6.

A estrutura bsica no atendimento pr-hospitalar em AMV


basicamente composta pela coordenao operacional, geralmente,
comanda pelo corpo de bombeiros e a coordenao mdica geral.
A coordenao mdica hierarquicamente subdivida em trs
subcoordenaes, isto , coordenao de triagem, coordenao de
tratamento e coordenao de transporte, conforme ilustrado na
figura 2.

2. MODELO 3C DE COLABORAO

De acordo com Pimentel et al. [3] o modelo 3C analisa a


colaborao em trs dimenses: comunicao, coordenao e
cooperao. A comunicao se realiza atravs da troca de
mensagens; pela argumentao e pela negociao entre pessoas.
J a coordenao se realiza atravs do gerenciamento de pessoas,
atividades e recursos; e a cooperao se realiza atravs da atuao
conjunta em um espao compartilhado para a execuo das
tarefas.
O modelo 3C de colaborao foi originalmente proposto no artigo
de Ellis et al. [4] com algumas diferenas de nomenclatura. O
modelo 3C utilizado frequentemente na literatura como um meio
de classificar/organizar sistemas colaborativos, como por exemplo
em Pimentel et al. [3] [7], Borghoff e Schlichter [5] e Sauter [6].
Segundo Pimentel et al. [3] no modelo 3C, esquematizado na
figura 1, a separao em dimenses foca nos aspectos relevantes
para a anlise da colaborao, entretanto, os Cs se interrelacionam para que a colaborao ocorra.
De acordo com Brna [8] o suporte computacional colaborao
melhorado se houver um aumento de conscincia do modelo de
colaborao que est sendo utilizado. O modelo 3C, como todo
modelo, uma simplificao da realidade e, portanto, no deve
ser usado indistintamente em todas as situaes.

Figura 2. Hierarquia da Coordenao Mdica Geral [10]


Durante um evento de emergncia com mltiplas vtimas, o
agrupamento mdico contando com mdicos socorristas,
enfermeiros, socorristas e voluntrios chegam ao local e ocorre
nos primeiros 20 minutos a evacuao por parte dos bombeiros e
equipes de apoio das vtimas de menor gravidade e primeiros

166

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

A triagem pelo mtodo Start, realizada pelo Corpo de Bombeiros,


uma tcnica simples usada para triagem rpida de um grande
nmero de pacientes e deve ser utilizada em situaes em que a
triagem deve ser dinmica. Esse mtodo o mais difundido no
meio mdico, e busca identificar trs problemas que vo levar
morte dentro de uma hora, se no tratados: insuficincia
respiratria, hemorragia significativa e traumatismo craniano [13].

socorros aleatrios (sem triagem) dos mais urgentes. Em geral


nesse momento a coordenao pouca e a chegada dos recursos
so desorganizadas [14].
Neste caso, o conceito do melhor esforo, ou seja, o melhor
atendimento para a vtima mais grave deve dar lugar ao conceito
de melhor atendimento para o maior nmero possvel de vtimas,
no momento que elas mais precisam e no menor tempo possvel.
Nas subsees seguintes, so detalhadas os trs princpios bsicos
no atendimento dessas situaes: triagem, tratamento e transporte.

Com o objetivo de facilitar o estabelecimento de prioridades


entres os diferentes casos de urgncia, foi-se estabelecido os
seguintes nveis de gravidades e cores respectivas:

3.1 Triagem

- Nvel 0 (Preto): Urgncia de prioridade mnima Compreende


situaes onde a vtima se encontra em bito. Onde h um
desequilbrio entre os recursos mdicos e o nmero de vtimas,
todos os pacientes com traumatismos severos, com poucas
chances de sobrevida, tambm vo para essa rea de prioridade.

O processo de triagem dos traumatizados durante uma situao de


crise considerado de grande importncia, pois inicialmente por
meio dele que as principais informaes sero geradas e
consumidas em tempo real pela equipe de coordenao e controle
no local, equipe de sade e posteriormente pela equipe mdica
hospitalar.

- Nvel 1 (Vermelho): Socorro imediato, primeira prioridade ou


prioridade imediata so vtimas que requerem ateno imediata
no local ou tem prioridade no transporte.

O processo de triagem uma tarefa eticamente complicada para


os agentes de sade, pois nela necessrio decidir como utilizar
recursos limitados de maneira mais eficiente possvel, a fim de
fornecer auxilio a um nmero mximo de pessoas feridas. Na
triagem dos pacientes os casos extremos devem ser rapidamente
observados. Tanto aqueles que esto em risco de morte to
eminente que qualquer tentativa de cuidados no ser suficiente
para reverter o quadro, quanto para aqueles que se recuperaro
independente do tratamento [11].

- Nvel 2 (Amarelo): Vtimas com prioridade secundria, no qual,


o socorro deve ser rpido, mas pode aguardar vtimas com maior
prioridade. So vtimas sem indicativo de que viro a morrer nos
prximos minutos, se no forem socorridas.
- Nvel 3 (Verde): Com prioridade tardia, so vtimas
deambulando, com leses menores e que no requerem
atendimento imediato. No devem ser consideradas isentas de
leso. Apenas no so prioritrias naquele momento. Podendo ser
atendidas no local e posteriormente encaminhadas a hospitais.

Esse um momento crtico, pois com base nos dados gerados na


triagem que os gestores tero subsdios para o processo de tomada
de deciso que afetar os resultados dos cuidados das vtimas,
minimizao de danos e transporte daqueles com necessidades
urgentes.

Em seguida, as vtimas so encaminhadas ao local indicado pelo


agente de sade durante a fase inicial da anlise de risco,
conforme ilustrado na figura 4 (a) e so dispostas em marcaes
para a incio / continuidade do tratamento e transporte, no caso
figura 4 (b) prioridade vermelha.

Durante o processo de triagem os agentes de sade vo at as


vtimas e realizam um conjunto de procedimentos e ao final destes
eles determinam o nvel de gravidade da vtima. Em seguida,
colocado em cada vtima uma etiqueta (figura 3) que determina
seu nvel de gravidade.

Figure 4. Fluxo de vtimas para triagem. (a) modelo de fluxo


das vtimas; (b) foto de simulao da triagem de uma vtima
com prioridade 1 [14]

3.2 Tratamento

A fase de tratamento visa estabilizar os pacientes que esto


aguardando transporte e realizar as manobras de primeiros
socorros. Geralmente compostos por mdicos, socorristas,
enfermeiros e voluntrios.
Sabe-se que o atendimento nos primeiros minutos aps o trauma
visa o no agravamento do quadro clnico do paciente,
influenciando na sobrevida do politraumatizado [15].

Figure 3. Etiqueta de identificao em triagem[12]

167

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

federais e estaduais do Ministrio de Sade e da


Corporao de Bombeiros. As palavras-chaves
utilizadas na reviso foram emergency management,
collaboration, MCI, mass casualty incidents,
triage,
IT
health,
pre-hospital
disaster
management e seus correspondentes em portugus.
(b) Observao de materiais instrucionais: tivemos acesso
aos vdeos de treinamento dos bombeiros, estudos de
casos e discusses.
(c) Entrevistas no-estruturadas: foram conduzidas
entrevistas com 2 pessoas da rea mdica atuantes em
emergncia hospitalar, 1 enfermeiro militar do corpo de
bombeiros e 1 enfermeiro no-militar. Todos com
experincia em acidentes com mltiplas vtimas.
Com base nessa pesquisa identificamos alguns importantes
desafios que foram organizados de acordo com as dimenses do
modelo 3C de colaborao, a fim de embasar possveis solues
para o desenvolvimento de sistemas colaborativos.

Em geral, o tratamento das vtimas na cena do acidente iniciado


aps a realizao da triagem e o conhecimento das necessidades
de cuidados mdicos de cada uma delas. As reas de tratamento
ou de prioridades so definidas conforme a gravidade das vtimas
em prioridade Vermelha, Amarela, Verde e Preto. Essas reas de
prioridades sero identificadas por lonas ou bandeiras coloridas
nas cores das prioridades.
Por fim, durante o desastre, a triagem deve ser considerada um
processo contnuo, ou seja, constantemente deve ser repetida em
cada vtima, mesmo para as que j receberam um socorro inicial,
pois a situao pode alterar-se e uma vtima considerada de baixa
prioridade pode, alguns minutos depois, necessitar cuidados
imediatos para que se mantenha viva.

3.3 Transporte

Durante uma situao de desastre, imprescindvel que vtimas


com determinados tipos de ferimentos sejam encaminhas para
hospitais corretos, ou seja, hospitais s podem receber pacientes
cujo tipo de ferimento pode ser atendido. Assim, os pacientes em
estado grave e que possuem alto risco de morte, necessitam de
transporte rpido em unidade de suporte avanado para centro
especializado de atendimento ao trauma [16]. Os demais casos,
podem ser transportados em unidade de suporte bsica medida
que estes recursos estejam disponveis.

4.1 Quanto a comunicao

Em cada uma das reas de prioridades, equipes de mdicos,


enfermeiros e socorristas atuam realizando os procedimentos
necessrios para estabilizao e posterior transporte das vtimas ao
hospital. Alm dessas tarefas, essas equipes fazem a identificao,
com anotao de dados em carto que fica preso a cada uma das
vtimas, preparando-as para o transporte.

No atendimento em situaes de desastres, essencial que a


viatura de transporte conte com os equipamentos indispensveis
para oferecer a assistncia necessria vtima de forma a
estabiliz-la at que a mesma chegue ao hospital. Para isso, o
sistema conta com 6 tipos de unidades mveis, conforme Portaria
Ministerial 2048. So elas, Ambulncia de Transporte destinado
ao transporte de vtimas que no apresentam risco de morte;
Ambulncia de Suporte Bsico, destinado ao transporte de vtimas
com risco de morte conhecido porm no classificado com
potencial necessidade de interveno medica durante o transporte;
Ambulncias de Resgate destinadas ao atendimento de vtimas em
locais de difcil acesso contendo equipamentos de salvamento
(terrestre, aqutico, altura); Ambulncia de Suporte avanado,
destinado ao transporte de vtimas em prioridade mxima que
necessitam de cuidados intensivos dispondo de equipamentos
mdicos; Aeronave de Transporte mdico, aeronave de asa fixa ou
rotativa utilizada no transporte de pacientes intra-hospitalar ou
aeronave de asa rotativa para resgate; Embarcao de Transporte
mdico, veculo motorizado aquavirio destinado ao transporte de
vtimas por via martima ou fluvial.

Manter o fluxo de informao e comunicao atualizado


essencial para processo de tomada de deciso dos gestores. Desde
a etapa de triagem at o tratamento e transporte dos
traumatizados, as informaes geradas e consumidas em tempo
real so intensas pela equipe de coordenao e controle no local,
equipe de sade e posteriormente pela equipe mdica hospitalar.
Se as informaes crticas para a tomada de decises no so
compartilhadas de forma adequadas ou no esto disponveis para
compartilhamento, as equipes acabam tomando decises erradas.
Por exemplo, gerentes deixam de ativar o plano de desastre no
momento adequado ou o comandante do incidente encaminha
pacientes demais para um nico hospital ao invs de distribuir
entre outros disponveis [17].
Grande parte da comunicao entre equipes de pr-hospitalar e os
departamentos de emergncia mdica hospitalar oral durante a
transferncia da vtima oriundas da emergncia, tais como
procedimentos realizados, medicamentos administrados, feridas,
etc. Dessa forma, devido complexidade do ambiente, boa parte
dessas informaes podem ser perdidas, prejudicando o
atendimento do paciente.
Outro desafio para acidentes com mltiplas vtimas ocorre em
casos que necessitam empregar foras de apoio de outros pases.
Neste caso, problemas na comunicao podem ocorrer entre os
especialistas estrangeiros devido barreira com o idioma. Isso
pode causar transtornos tanto na comunicao entre as equipes
quanto na comunicao entre as vtimas.

4. DESAFIOS DE COLABORAO NO
ATENDIMENTO PR-HOSPITALAR EM
AMV

Para identificar os desafios de colaborao nos servios de


atendimentos pr-hospitalares em AMV realizamos uma pesquisa
exploratria conforme descrito abaixo.
(a) Levantamento bibliogrfico: foram realizadas pesquisas
na ACM Digital Library, IEEE Xplore Digital Library,
alguns proceeding de conferencias ligadas rea de
colaborao e informtica na sade. Alm disso,
pesquisamos em grandes indexadores da rea de sade,
tais como PubMed, Medline, Scopus. A pesquisa foi
conduzida sem uma restrio temporal. Por se tratar de
uma questo nacional, foram revisados os planos

4.2 Quanto a coordenao

Neste ambiente catico e complexo, se tratando de acidentes de


mltiplas vtimas, existem diversos desafios da coordenao
mdica e operacional para resgaste das vtimas. Alguns desses
desafios se encontram na prpria gesto das equipes
multidisciplinares, tais como, mdicos, enfermeiros, socorristas,
bombeiros, motoristas, etc. na definio dos papeis que cada
equipe ir desempenhar.

168

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

complicado obter uma viso geral imediata e precisa da situao


tais como, nmero de vtimas, grau de emergncia, localizao,
tipo de ferimentos, etc. Se essa situao estender para uma escala
maior de mltiplos locais esse processo se torna mais complexo e
trabalhoso, pois para obter essas informaes bsicas, os gestores
no apenas tero que analisar as inmeras listas (papeis) do local,
mas outras inmeras de outros locais de maneira manual.

5. TECNOLOGIAS DE APOIO A AMV

Com base no que foi dito anteriormente, temos percebido que os


sistemas de informao por meio de seus artefatos tecnolgicos
podem em muito auxiliar no processo de resposta ao atendimento
pr-hospitalar em AMV. Como nosso objetivo futuro de
desenvolver sistemas de informao que apoiem a colaborao
entre as equipes no atendimento pr-hospitalar, realizamos um
levantamento de trabalhos que vem sendo utilizados no domnio
mdico e de emergncia e que em geral apresentam bons
resultados.

Desenvolver tecnologias de informao e comunicao que


apoiem a coordenao requer que os desenvolvedores entendam o
fluxo de trabalho e de informao entre as equipes de resposta
crise a fim de apoiar a coordenao entre as mesmas. Sem
entender esse fluxo de trabalho, dentro de cada equipe, no seria
possvel identificar as potenciais reas de ruptura na coordenao
entre essas equipes.

Inampudi [18] implementou um sistema de triagem que utiliza


Tags RFID passivas substituindo o papel. Nesse sistema, os
primeiros atuadores localizavam as vtimas e realizavam a triagem
utilizando um PDA e gravavam as informaes na tag. A figura 5
ilustra a interface do sistema baseado em PDA.

O trabalho da coordenao envolve a compreenso da situao,


elaborao do plano de aes, mobilizao de equipes de
diferentes organizaes, avaliao de riscos, priorizao de
objetivos, decises rpidas e coordenao de recursos. Sua
execuo bastante dinmica, pois o desdobramento de eventos
externos e das prprias aes das equipes modifica a evoluo da
situao. Isto faz com que seja necessrio ao comando atualizar
constantemente suas informaes sobre as mudanas no contexto
para, a partir disso, dar continuidade ao entendimento da situao
e tomar novas decises.
Pelo fato da equipe mdica ser formada pelos indivduos
responsveis pela realizao da triagem e tratamento, este grupo
trabalha na linha de frente da emergncia, resgatando vtimas,
realizando atendimentos mdicos e orientando as pessoas. Suas
atividades so intensamente colaborativas e precisam de alto grau
de coordenao a fim de se obter os resultados almejados sem
comprometer a segurana prpria.
Alm disso, distribuir e organizar recursos tambm acaba sendo
um desafio, ainda mais que as informaes contextuais para essa
tomada de deciso em geral no esto disponveis de maneira
eficaz.
Outras questes que surgem que uma boa parte das foras
auxiliares de resposta consiste tambm de voluntrios que apesar
de terem boas habilidades, possuem poucas experincias com
situaes de emergncia em larga escala e no operam com o
rigor hierrquico como as foras armadas, bombeiros, etc.

Figura 5. Aplicao (client) PDA [19]


Huang e Chu [19] implementou um sistema com a tecnologia
RFID dentro do departamento de emergncia mdica para
realizao de triagem e diminuio no tempo de espera e
monitoramento dos pacientes dentro do hospital. Como discusso
o autor afirma que apesar do sistema impor uma curva de
aprendizado inicial, posteriormente o sistema introduz uma
segurana maior e menores perdas tanto de informao quanto de
tempo.

4.3 Quanto a cooperao

No processo de cooperao cada uma das outras dimenses


(comunicao e coordenao) se inter-relacionam a fim de
promover a colaborao em si.
Na cooperao em AMV cada equipe realiza o trabalho
individualmente (triagem, tratamento e transporte) e depois
combina os resultados para obter o resultado final. O modelo atual
empregado neste tipo de atendimento oferece pouco suporte
cooperao entre as equipes, restringindo o fluxo de informao e
assim oferecendo poucos subsdios claros para um melhor suporte
deciso dos gestores. Tendo em vista que esse domnio
dinmico e o tempo utilizado possui relao direta com a
qualidade do atendimento, para que haja cooperao necessria
uma abordagem que promova uma visualizao coerente e pontual
das informaes compartilhadas de forma a no causar uma
sobrecarga de informao e minimizar o esforo cognitivo do
usurio. Porm importante que a abordagem oferea suporte
para maiores informaes caso o agente de sade / coordenao
necessite.

Outro desafio observado so os aspectos de interao entre os


agentes de sade e os sistemas computacionais, visto que
incialmente ser imposto uma curva de aprendizado e mudanas
no processo atual aos quais os agentes de sade esto
acostumados. Nem sempre essas mudanas so bem recebidas,
portanto necessrio que os usurios sejam motivados e que, se
possvel, sejam consultados durante a fase de projeto da interface.
Alm disso, para que o sistema atenda as reais necessidades dos
agentes, o desenvolvimento da interao do sistema deve ocorrer
de maneira que os stakeholders sejam extensivamente
consultados, que compartilhem da mesma linguagem (jarges),
mtodos e modelos semelhantes aos em uso (informaes do

169

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

pronturio, whiteboards e etc.) de forma que ao interagirem com o


sistema os agentes de sade no tenham maiores dificuldades em
comunicar com o software. Estudos sugerem que ao adotar essas
medidas diminui a barreira inicial na utilizao efetiva da
ferramenta [20] [21].

Completude e confiabilidade da
informao
Panorama geral no progresso do
tratamento da vtima (desde o momento
de identificao at a chegada ao
hospital)

Segundo Ibarra et al. [22] nos ltimos anos, o uso de tecnologia


mvel nos processos de resposta a emergncia urbana tem
crescido, especialmente, devido a importncia de se ter dados para
realizar uma deciso mais bem informada no processo. Assim, a
visualizao de dados em pequenos dispositivos mveis, tais
como PDA, tablets e smartphones, um aspecto crtico para tomar
decises em tempo real.

6. CONSIDERAES FINAIS

No escopo deste trabalho apresentamos uma investigao quanto


aos desafios e obstculos relevantes que envolvem membros das
equipes de atendimento pr-hospitalar no que diz respeito a sua
atuao para AMV. Na tabela 1 extramos concisamente os
desafios discutidos na seo 4.
Tabela 1 Desafios de comunicao, coordenao e cooperao
em um evento AMV.
Comun
icao

Coorde
nao

Captura de dados durante todo processo

Definio de rota de transporte para o


hospital de designado

Definio de estratgias de triagem

Diferentes formas de visualizao


informaes baseadas no perfil / papel

Negociao com hospital de destino

Implementao do plano de ao

Manter comunicao aberta e


redundante entre a cadeia de comando
e hospitais

Atualizao em tempo real de


informaes

Barreiras lingusticas / idiomas

Pouco espao disponvel para descrever


informaes relacionadas aos
ferimentos na etiqueta de triagem, tais
como, medicamentos administrados,
parmetros, alergias, sinais vitais etc.

Pouco suporte para compartilhamento


de dados e imagens entre equipes locais
e comando e controle

Fornecer informao durante a


transferncia do socorrista ao mdico de
forma clara e compreensiva

Fornecer dados coletados da vtima ao


hospital

Identificao rpida dos recursos


disponveis

Esses trabalhos do subsdios para que possamos pensar possveis


solues no atendimento pr-hospitalar em AMV que englobem a
coordenao, cooperao e comunicao de forma a promover a
colaborao.

Desafios

Coope
rao

Reportar mudana de estado das vtimas


durante o processo de AMV

Reportar estado de transferncia ao


Comando e Controle

Alocao de recursos (pessoal,


etiquetas, equipamentos, material de
tratamento)

Gesto de risco

Percepo situacional

Compreender caligrafia no modelo de


etiquetas de triagem manualmente
escritas

Embora, tenhamos utilizado o modelo 3C de colaborao para


organizar os desafios do domnio quanto as dimenses de
comunicao, coordenao e cooperao, as mesmas no so
realizadas de maneira estanque e isolada.

Com a pesquisa exploratria realizada evidenciou-se que a falta


de qualquer um dos aspectos relevantes para a anlise da
colaborao, entre as equipes de atendimento pr-hospitalar e o
departamento de emergncia hospitalar altamente prejudicial na
resposta eficiente crise. Neste cenrio complexo, as equipes
enviadas para trabalhar no atendimento local, sofrem
consequncias da falta de organizao e, na nsia de ajudar as
vtimas, as equipes acabam permanecendo mais tempo que o
permitido em protocolos, ficando sob a influncia de diversas
intempries.

Os trabalhos relacionados mostram uma variedade de tecnologias


que se forem adotadas podem contribuir para o processo de
atendimento pr-hospitalar em AMV.

Como trabalhos futuros, pretendemos desenvolver um sistema de


informao para apoio colaborao entre as equipes atuantes no
atendimento pr-hospitalar em AMV. Com esse artefato
tecnolgico, espera-se melhorar a percepo situacional da equipe
de coordenao mdica e operacional de forma a poder ampliar a
capacidade de tomada de deciso dos stakeholders.
X

Manter overviews atualizados do evento

Gerenciar e alocar recursos humanos


entre as fases de triagem para
tratamento

Gerenciar equipes multidisciplinares

7. AGRADECIMENTOS

Este trabalho foi apoiado parcialmente por recursos da FAPERJ e


do CNPq. Bruno S. Nascimento recebe bolsa de doutorado da
CAPES. Rodrigo Andrade recebe bolsa de mestrado da CAPES.

170

SBSC 2014 Proceedings - Ongoing Research

October 6-9, 2014 - Curitiba, PR, Brazil

atendimento pr-hospitalar. So Paulo: Atheneu; 2007. p.


497-506.

8. REFERNCIAS

[1] N. Oster, R. Nierenberg, S. Menlove, K. Chason, J. Pruden,


Reflections: September 11, 2001what we learned,
Academic Emergency Medicine 9 (3) (2002) 216.

[13] Cone DC, MacMillan DS. Mass-casualty triage systems: a


hint of science. Acad Emerg Med. 2005;12(8):739-41.

[2] Arigony, M. Meinerz, S. Vianna, M. Zanella, G. Sousa, L.


Relatrio Final. Inquerito Policial N. 94/2013/150501. 1.
Delegacia de Polcia de Santa Maria RS. 2013

[14] Ribeiro C. Acidentes com Multiplas Vtimas Um Novo


conceito para um velho problema. Seo Desastres /
Grupamento de Socorro de Emergencia. CBM-RJ. 2004.

[3] Pimentel, M., Gerosa, M. A., Filippo, D., Raposo, A., Fuks,
H., & Lucena, C. J. P. (2006). Modelo 3C de Colaborao
para o desenvolvimento de Sistemas Colaborativos. Anais do
III Simpsio Brasileiro de Sistemas Colaborativos, 58-67.

[15] MALVESTIO, Marisa Aparecida Amaro; SOUSA, Regina


Marcia Cardoso de. Sobrevivncia aps acidentes de trnsito:
impacto das variveis clnicas e pr-hospitalares. Rev. Sade
Pblica, So Paulo, v. 42, n. 4, Aug. 2008

[4] Ellis, C.A., Gibbs, S.J. & Rein, G.L. Groupware - Some
Issues and Experiences. In: Communications of the ACM, v.
34, n. 1. 1991, p. 38-58.

[16] Simes RL, Duarte Neto C, Maciel GSB, Furtado TP, Paulo
DNS. Atendimento pr-hospitalar mltiplas vtimas com
trauma simulado em Vitria-ES. Rev Col Bras Cir. 2012;
39(3). Disponvel em URL: http://www.scielo.br/rcbc

[5] Borghoff, U.M. & Schlichter, J.H. (2000) ComputerSupported Cooperative Work: Introduction to Distributed
Applications. Springer, USA.

[17] C.D. Cramton, The mutual knowledge problem and its


consequences for dispersed collaboration, Organization
Science 12 (3) (2001) 346371.

[6] Sauter, C., Morger, O., M uhlherr, M., Thutchytson, A. &


Teusel, S. (1995) CSCW for Strategic Management in Swiss
Enterprises: an Empirical Study. Proceedings of the 4 th
European Conference on Computer Supported Cooperative
Work (ECSCW95), Stockholm, Sweden, 117-132.

[18] VS Inampudi. A real time web based electronic triage,


resource allocation and hospital dispatch system for
emergency. Dissertao de mestrado, University of
Massachusetts Amherst. 2011.

[7] Pimentel, M., Fuks, H., & Lucena, C. J. (2008). Um processo


de desenvolvimento de sistemas colaborativos baseado no
Modelo 3C: RUP-3C-Groupware. Anais do IV SBSI. SBSI,
7.

[19] Yen-Chieh Huang; Chih-Ping Chu. RFID Applications in


Hospitals--A Case Study for Emergency Department. Journal
of Communication & Computer; Jul2011, Vol. 8 Issue 7,
p578.

[8] Brna, P. (1998) Modelos de colaborao, Revista


Brasileira de Informtica e Educao, 3, pp. 1-15.

[20] Gosbee JW, Ritchie EM. Human-computer interaction and


medical soft- ware development. interactions 1997;4:13-8.

[9] Brasil. Ministrio da Sade. Secretaria de Ateno Sade.


Departamento de Ateno Especializada. Regulao mdica
das urgncias / Ministrio da Sade, Secretaria de Ateno
Sade, Departamento de Ateno Especializada. Braslia:
Editora do Ministrio da Sade, 2006.

[21] Stahlhut RW, Gosbee JW. A human-centered approach to


medical informatics for medical students, residents, and
practicing clinicians. Acad Med 1997;72:881-7.
[22] Ibarra, M.J.; Monares, A.; Ochoa, S.F.; Pino, J.A.,
"Visualization of relevant information on mobile devices for
emergency situations," Informatica (CLEI), 2012 XXXVIII
Conferencia Latinoamericana En , vol., no., pp.1,10, 1-5 Oct.
2012.

[10] Sousa, RMC et al; Atuao no trauma: Uma abordagem para


a enfermagem So Paulo: Ed.Atheneu. 2009
[11] Sharma BR. 2005. Triage in trauma-care system: a forensic
view.J Clin Forensic Med.12 (2):64-73. Epub
[12] Teixeira Jnior EV. Acidentes com mltiplas vtimas. In:
Oliveira BFM, Parolin MKF, Teixeira Jnior EV. Trauma:

171

Organizao

Patrocnio

Promoo

S-ar putea să vă placă și