Documente Academic
Documente Profesional
Documente Cultură
TRABALHO DE
CONCLUSO DE CURSO
ORIENTAO:
Alexandre Magno de Sousa
Julho, 2015
Joo Monlevade/MG
Monografia apresentada ao curso de Sistemas de Informao do Departamento de Computao e Sistemas da Universidade Federal de
Ouro Preto como requisito parcial para obteno do grau de Bacharel
em Sistemas de Informao aprovada pela Banca Examinadora abaixo
assinada:
abnTeX
OSN
LBSN
GPS
Sumrio
1
1.1
1.2
1.3
INTRODUO . . . . . .
Objetivos . . . . . . . . . .
Resultados e Contribuies
Estrutura da Monografia .
.
.
.
.
11
11
11
11
2
2.1
13
2.5
TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . .
You Are Your Check-In: Understanding the Behavior of Tourists
and Residents Using Data from Foursquare . . . . . . . . . . . . . .
O Uso de uma Rede Geossocial nas Cidades Brasileiras e sua Relao com Fatores Socioeconmicos . . . . . . . . . . . . . . . . . . . .
Estudo de Hbitos Alimentares e de Bebida Usando Mdia Social .
We Know Where You Live: Privacy Characterization of Foursquare
Behavior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3.1
3.2
3.3
3.4
3.5
3.6
3.7
FUNDAMENTAO TERICA . . . . . . . . . . . . . . . . . . . .
Redes Sociais Online . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Redes Sociais Baseadas em Localizao . . . . . . . . . . . . . . . . .
Porque Pessoas Utilizam Redes Sociais Baseadas em Localizao .
Principais Componentes de uma Rede Social Baseada em Localizao
Privacidade em Redes Sociais Georreferenciadas . . . . . . . . . . .
Popularidade de Locais . . . . . . . . . . . . . . . . . . . . . . . . . .
Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
21
22
23
24
25
26
26
4
4.1
4.2
4.3
OBJETIVO DO TRABALHO
Definio do Problema . . .
Metodologia Aplicada . . . .
Consideraes Finais . . . . .
27
27
27
27
RESULTADOS E CONTRIBUIES
CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2
2.3
2.4
REFERNCIAS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
E METODOLOGIA
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
16
18
19
20
. . . . . . . . . . . . . . . . . 29
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
11
1 Introduo
1.1 Objetivos
O objetivo geral deste trabalho avaliar o comportamento social urbano da cidade de
Belo Horizonte a partir de informaes pblicas disponibilizadas em redes sociais baseadas
em localizao. O Foursquare foi a rede social escolhida para realizar este trabalho. Para
se concluir o objetivo geral, foram realizados os seguintes objetivos especficos:
Definir os dados disponibilizados pelo usurio que sero utilizados para alcanar o
objetivo geral.
Desenvolver um coletor de dados para obter os dados definidos.
Analisar os dados obtidos e chegar a concluses.
13
2 Trabalhos Relacionados
EDITAR - EDITAR - EDITAR Neste captulo apresentado trabalhos relacionados,
em que diz respeito a coleta e anlise de dados de redes sociais baseadas em localizao.
Este captulo possui a seguinte estrutura. A seo 2.1 . Em seguida, a seo 2.2. Logo
aps, a seo 2.3 . Na seo 2.4 .Posteriormente, na seo ?? .Finalmente, na seo 2.5
apresentada as consideraes finais.
2.1 You Are Your Check-In: Understanding the Behavior of Tourists and Residents Using Data from Foursquare
Em seu trabalho (FERREIRA; SILVA; LOUREIRO, 2014) apresentaram a utilizao dos sinais emitidos pelos usurios da rede social Foursquare, os chamados check-ins,
para ser realizado o entendimento entre as diferenas existentes entre o comportamento
de turistas e residentes. Possuindo o objetivo de ressaltar: Metodologia para a separao
de turistas e residentes utilizando dados de redes sociais baseadas em localizao; Anlise de aspectos espao-temporais do comportamento de turistas e residentes em quatro
cidades populares ao redor do mundo: Londres, Nova Iorque, Rio de Janeiro e Tquio;
Uso de mtricas de centralidade de rede para entender melhor a interao dos turistas e
residentes com a cidade. No estudo foram utilizados check-ins do Foursquare. Os dados
foram coletados a partir do Twitter, onde os check-ins estavam disponveis de maneira
pblica. A coleta foi feita a partir da API de streaming fornecida pelo Twitter para busca
de tweets em tempo real. Esta coleta foi realizada em uma semana do ms de abril de
2012, nas cidades de Londres (15,671 check-ins), Nova Iorque (86,867 check-ins), Rio de
Janeiro (27,222 check-ins) e Tquio (118,788 check-ins).
Foi feita uma anlise nos dados obtidos que demonstrou que nos usurios turistas
a presena de locais tursticos maior que nos usurios residentes. Entretanto, a diferena
da porcentagem do tipo turista e da porcentagem de residente varia em cada cidade,
refletindo a quantidade que turistas e residentes frequentam os mesmos locais. A cidade do
Rio de Janeiro possui uma diferena de 4 porcento, indicando que existe uma concentrao
maior de turistas em locais tursticos. Em Tquio a diferena de 1 porcento, coincidindo
com a menor concentrao de locais tursticos, comparada com as outras cidades. Os
autores perceberam que comum a transio de turistas entre locais populares segundo
o nmero de curtidas, seguido da preferncia por locais tursticos, demonstrando que
os turistas movimentam-se no apenas em locais tursticos mas tambm em locais de
preferncia mista.
14
2.1. You Are Your Check-In: Understanding the Behavior of Tourists and Residents Using Data from
Foursquare
15
Engenho noite porm h transies durante o dia, provavelmente para visitas tursticas
No grafo de residentes tambm possvel visualizar a ida e a volta de alguns bairros
para o Engenho. Um local popular entre os residentes (100 porcento dos check-ins feitos
por essa classe), o Caf du Lage. Este caf encontra-se no parque Henrique Lage, mesmo
local da Escola de Artes Visuais e frequentado por moradores. Em um determinado
local, pode-se inferir se ele turstico ou no pelo horrio ou locais que antecederam ou
sucederam o check-in. O Sambdromo da Marques de Sapuca, no Rio de Janeiro, teve
transies feitas predominantemente por residentes, em horrios de ensaios de escola de
samba (entre 20 e 22 horas). Os locais de origem ou destino so em sua maioria relacionados
a ruas e bairros, todos intermedirios a estadia no local.
Outro destaque a favela Pavo-Pavozinho, popular no ranking de transies, que
possui check-ins feitos apenas por residentes. Embora algumas favelas do Rio j tenham
visitas guiadas para turistas, como a Rocinha, a Pavo-Pavozinho tem movimentao
apenas por parte de residentes.
A partir do degree centrality os autores perceberam que tais locais so caractersticos
de pessoas que moram na cidade e priorizam locais relacionados a atividades cotidianas.
A partir do degrre centrality dos turistas da cidade de Nova Iorque, foi observado
um perfil diferente, concentrando locais de alimentao e visitao. Dos 10 locais listados,
alguns possuem relao mais forte com a classe de turistas, por exemplo, aeroporto e locais
para visitao, como Central Park, Manhattan Bridge, Union Square Park e US Post
Office. O US Post Office, apesar de estar na categoria Post Office, aparece em listas de
visitao turstica devido arquitetura das suas instalaes. Alm destes, outras categorias
como Coffee Shop e Supermarket so populares durante a noite, provavelmente em funo
do jantar. O local ShopRite, por exemplo, funciona 24 horas e indicado como local para
alimentao rpida nas dicas deixadas pelos usurios no Foursquare. Estes locais refletem
o comportamento turstico na cidade pois so atividades relacionadas ao entretenimento
combinado com necessidades bsicas, como alimentao.
A ponte de Manhattan aparece tanto no ranking do grafo de turistas quanto do
grafo de residentes, pois atrai as duas classes de usurios. Para os turistas um dos cartes
postais de Nova Iorque e para os residentes passagem que liga Manhattan ao Brooklyn.
No ranking do grafo de residentes os vrtices de maior grau tem maior apario durante a
noite, enquanto no ranking do grafo de turistas os horrios so diversificados.
Atravs do estudo apresentado foi observado as diferenas no comportamento
entre as classes de usurios turistas e residentes, e tambm entender melhor a dinmica
das cidades com as tcnicas utilizadas. Existem inmeras possibilidades para trabalhos
futuros, por exemplo, a utilizao de outras mtricas de redes complexas para auxiliar no
entendimento do comportamento dos usurios sob outras perspectivas.
16
2.2. O Uso de uma Rede Geossocial nas Cidades Brasileiras e sua Relao com Fatores Socioeconmicos
17
18
19
uma caracterstica j conhecida do hbito dos brasileiros: dar maior importncia ao almoo.
Esse resultado tambm est de acordo com o apresentado em [10].
Para realizar a identificao de fronteiras culturais os autores utilizao a clusterizao de regies com hbitos alimentares e de bebida similares, utilizaram tambm
a mesma metodologia proposta em [10]. O resultado foi de acordo com o esperado, as
cidades dos Estados Unidos, Brasil, Europa e sia foram clusterizadas separadamente.
Esses resultados so idnticos aos encontrados por [10].
Considerando um dataset ainda no analisado anteriormente, nossos resultados
preliminares indicam que hbitos alimentares e bebida dos usurios so bastante similares
aos hbitos observados anteriormente por [10]. Isso sugere que os resultados observados
naquele trabalho, mesmo considerando apenas uma semana de dados, podem sim explicar
os hbitos culturais dos usurios das regies analisadas. Alm disso, estudamos duas
novas abordagens para clusterizao de regies, que inicialmente foram piores do que a
abordagem apresentada por [10].
20
km, indicando distncias muito curtas (dentro de poucos metros). Alm disso, 70% dos
utilizadores tm uma mdia de deslocamento de no mximo 150 quilmetros, que poderiam
ser caracterizadas como dentro da rea metropolitana de uma grande cidade, tambm
60% dos usurios possuem um deslocamento mximo de 100 quilmetros, possivelmente, a
distncia entre cidades vizinhas. Cerca de 10% dos usurios possuem um deslocamento
mximo de, pelo menos, 6.000 quilmetros.
Os usurios tendem a ter prefeituras, Tip e Dones em Venues no mesmo local
onde eles vivem. Num primeiro momento, pode-se pensar que as prefeituras so talvez a
pea mais forte de evidncias sobre a cidade de um usurio. No entanto, Tips tambm
revelam lugares onde o usurio tem ido. Finalmente, Dones pode tambm fornecer algumas
evidncias sobre a localizao casa de um usurio, embora talvez no to forte como Tips e
prefeituras. Atravs dos resultados obtidos as prefeituras so o melhor atributo para inferir
local de origem, embora, talvez surpreendentemente, Tips so apenas marginalmente pior.
Dones, por sua vez, produzem os piores resultados entre os trs atributos, quando utilizado
isoladamente. a combinao de atributos faz mal a preciso, em comparao com o modelo
Prefeitura, na maioria dos casos, possivelmente devido Tips e Dones adicionar algum
rudo. Se pode inferir corretamente a cidade de cerca de 78% dos usurios no prazo de
50 quilmetros de distncia. Para o estado do usurio, atingiu uma preciso em torno de
75%. Para o pas precises acima de 90%.
Atravs dos resultados se pode destacar o comportamento do usurio em termos de
mobilidade. Em nvel municipal, por exemplo, alguns usurios que vivem nas proximidades
das cidades inferidas, o que pode indicar que eles provavelmente vivem em um lugar
e mudam frequentemente para outro. No nvel estadual, a frao mais baixa, mas no
desprezvel de erros indica que existem alguns usurios que tm mobilidade interestadual.
No nvel de pas, que h uma alta concentrao de atividades consideradas (prefeituras,
Tips e Dones). Isto pode ser verificado pela maior preciso obtidas nos modelos. No
entanto, erros de inferncia ainda so possveis uma vez que alguns usurios podem ter
sua localizao atual desatualizada, ou podem viajar muito em torno do mundo.
21
3 Fundamentao Terica
Est captulo aborda a fundamentao terica do trabalho sendo organizada deste
modo. A Seo 3.1 descreve as principais caractersticas e importncia de redes sociais
online. Principais caractersticas e importncia em redes sociais baseadas em localizao
so apresentadas na seo 3.2. Em seguida descrito o porque de pessoas utilizarem
redes sociais baseadas em localizao na 3.3. Na seo 3.4 apresentado os principais
componentes de uma rede social baseada em localizao.Posteriormente, a seo 3.5
descreve sobre a privacidade em redes sociais georreferenciadas.Logo aps, a popularidade
de locais apresentado na seo 3.6.Finalmente, na seo 3.7 apresenta as consideraes
finais.
22
23
pesquisar avaliaes, possvel utilizar o Yelp para encontrar listas e para conversar
com outros usurios;
Facebook Places: Funciona a partir de um smartphone com GPS integrado, ele
mostra uma lista de lugares prximos ao usurio. Todos os lugares possuem suas
prprias pginas no Facebook. Onde possvel fazer um check-in nestes locais, a
partir disso feito o compartilhamento para o grupo de amigos no Facebook do
usurio permitindo que eles visualizam onde o usurio esteve;
Apontador: Tem o objetivo de permitir o usurio encontrar lugares, servios e
facilidades online em determinada cidade. O Apontador permite o usurio filtrar as
avaliaes de acordo com o que deseja achar: Melhor Contedo, Menores, Recentes,
Mais Antigas, Mais curtidas, Negativas e Positivas.1 a cada 5 brasileiros que usa
internet passa pelo Apontador procurando um lugar ou servio. 16 milhes de pessoas
acessam o site Apontador todo ms. Mais de 7.5 milhes de locais cadastrados.
TABELA DE REDES SOCIAIS BASEADAS EM LOCALIZAO
24
bancos. Com isso foi afirmando que h lugares onde certas pessoas teriam vergonha de
dizer onde estavam. Em relao a usos diferentes do Foursquare, utilizao do check-in
para avisar que chegou em casa em segurana ou para informar disponibilidade.
25
26
27
29
5 Resultados e Contribuies
31
6 Concluso
33
Referncias
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 6028 : Resumo apresentao. Rio de Janeiro, 2003. 2 p. Nenhuma citao no texto.
BENEVENUTO, F.; ALMEIDA, J.; SILVA, A. Coleta e anlise de grandes bases de
dados de redes sociais online. In: Jornadas de Atualizao em Informtica (JAI). [S.l.:
s.n.], 2012. Citado na pgina 21.
FERREIRA, A. P. G.; SILVA, T. H.; LOUREIRO, A. A. F. You are your check-in:
Understanding the behavior of tourists and residents using data from foursquare. In:
Proceedings of the 20th Brazilian Symposium on Multimedia and the Web. New York, NY,
USA: ACM, 2014. (WebMedia 14), p. 103110. ISBN 978-1-4503-3230-9. Disponvel em:
<http://doi.acm.org/10.1145/2664551.2664562>. Citado na pgina 13.
GAMBS, S.; HEEN, O.; POTIN, C. A comparative privacy analysis of geosocial networks.
In: Proceedings of the 4th ACM SIGSPATIAL International Workshop on Security and
Privacy in GIS and LBS. New York, NY, USA: ACM, 2011. (SPRINGL 11), p. 3340.
Citado na pgina 22.
GUHA, S.; BIRNHOLTZ, J. Can you see me now?: Location, visibility and the
management of impressions on foursquare. In: Proceedings of the 15th International
Conference on Human-computer Interaction with Mobile Devices and Services. New York,
NY, USA: ACM, 2013. (MobileHCI 13), p. 183192. Citado 2 vezes nas pginas 22 e 25.
LI, N.; CHEN, G. Sharing location in online social networks. IEEE Network, 2010. Citado
2 vezes nas pginas 21 e 22.
LINDQVIST, J. et al. Im the mayor of my house: Examining why people use foursquare a social-driven location sharing application. In: Proceedings of the SIGCHI Conference on
Human Factors in Computing Systems. New York, NY, USA: ACM, 2011. (CHI 11), p.
24092418. Citado 3 vezes nas pginas 22, 23 e 25.
PONTES, T. et al. We know where you live: Privacy characterization of foursquare
behavior. In: Proceedings of the 2012 ACM Conference on Ubiquitous Computing. New
York, NY, USA: ACM, 2012. (UbiComp 12), p. 898905. ISBN 978-1-4503-1224-0.
Disponvel em: <http://doi.acm.org/10.1145/2370216.2370419>. Citado na pgina 19.
SALES, A. et al. O uso de uma rede geossocial nas cidades brasileiras e sua relao
com fatores socioeconmicos. In: Proceedings of the 12th Brazilian Symposium
on Human Factors in Computing Systems. Porto Alegre, Brazil, Brazil: Brazilian
Computer Society, 2013. (IHC 13), p. 142147. ISBN 978-85-7669-278-2. Disponvel em:
<http://dl.acm.org/citation.cfm?id=2577101.2577130>. Citado na pgina 16.
SILVA, T. H. et al. Estudo de hbitos alimentares e de bebida usando mdia
social. In: Proceedings of the 13th Brazilian Symposium on Human Factors
in Computing Systems. Porto Alegre, Brazil, Brazil: Sociedade Brasileira de
Computação, 2014. (IHC 14), p. 337340. ISBN 978-85-7669-291-1.
Disponvel em: <http://dl.acm.org/citation.cfm?id=2738055.2738110>. Citado na
pgina 18.