Sunteți pe pagina 1din 14

Anlisis de contenido en Twitter

UDLAP

Twitter
Twitter puede ser interpretado como un grafo de intereses.

Twitter
El grado de influencia de un tweet puede ser determinado por:
El nmero de seguidores El nmero de retweets (compartir) El nmero de favoritos (me gusta)

Qu se puede minar?
Los tpicos (temas o palabras) de los que ms habla la gente. Los hashtags ms usados Los usuarios ms mencionados

Qu se pretende inferir?
Nmero de usuarios pasivos o activos Si se habla positiva, negativa o neutralmente Si se habla sujetiva u objetivamente

Twitter

Tweepy Python-twitter

Metodologa
Pre-procesamiento Procesamiento Anlisis lxico Anlisis sintctico Anlisis semntico Clasificacin

Pre-procesamiento
Creacin de vocabulario Determinacin de usuarios y hashtags

Anlisis Lxico-Sintctico
Asignacin de relevancia de acuerdo a RT y nmero de seguidores Frecuencia de: Palabras, hashtags y usuarios Colocaciones Trigramas Palabras de longitud 10 Uso y combinacin de vocales

Anlisis semntico y clasificacin


Machine Learning: Support Vector Machine Naive Bayes Redes Neuronales

Resultados
Pre-procesamiento Ya se tienen vocabularios: general, por tpico, por da. Ya se tienen hashtags y usuarios Anlisis semntico Frecuencia de palabras, hashtags y usuarios

S-ar putea să vă placă și