Resumen:
Ante la abundancia de información que nos llega a través de los medios de comunicación y de las redes sociales, es muy importante detectar y poder seguir en el tiempo distintos tópicos o ejes temáticos en los cuales se organiza la discusión pública. Hacerlo de manera automatizada a partir de analizar grandes cantidades de datos es una linea de investigación que se viene desarrollando en los últimos años. En este trabajo de tesis de licenciatura, se comparan dos métodos de detección de ejes temáticos de la agenda pública analizando la red social Twitter. El primer método se basa en la hipótesis que un conjunto de tweets hablan del mismo tema porque están etiquetados con un conjunto de hasthags que co-ocurren entre ellas. Para poder detectar estos tópicos, representamos esta co-ocurrencia mediante una red compleja y realizamos sobre la misma una detección de comunidades que nos permitió encontrar grupos de hashtags fuertemente entrelazados. Estos grupos de hashtags se asocian a cada eje temático de la agenda. El segundo método se basa en la hipótesis que un conjunto de tweets hablan del mismo tema porque ellos son muy parecidos entre sí. Para desarrollarlo representamos los textos de los tweets usando métodos Procesamiento de Lenguaje Natural (NLP) que usan herramientas de machine learning para representar dichos textos como vectores en un espacio n-dimensional. La principal fortaleza de estos métodos es que textos similares semánticamente se encuentran cercanos en el espacio embebido en el cual se representan. Utilizando estas herramientas, representamos el conjunto de tweets mediante una red compleja pesada donde los enlaces entre ellos representan la medida de similaridad entre ambos. En esta red, también identificamos los tópicos emergentes mediante un proceso de detección de comunas. Una vez determinados el conjunto de tópicos (o agenda) en el cual se representa el conjunto de tweets analizado, analizamos el volumen de interés en cada eje temático obteniendo la serie temporal de cantidad de tweets asociado a cada uno. Los resultados obtenidos nos muestran que ambas metodologías muestran resultados consistentes, aunque no necesariamente similares, pero que permiten una descripción temporal adecuada de los ejes de discusión que dominan la conversación pública en una red social.
Citación:
---------- APA ----------
Eskinazi, Franco. (2024). Análisis comparativo de métodos para detección de tópicos en la agenda social. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nFIS000208_Eskinazi
---------- CHICAGO ----------
Eskinazi, Franco. "Análisis comparativo de métodos para detección de tópicos en la agenda social". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2024.https://hdl.handle.net/20.500.12110/seminario_nFIS000208_Eskinazi
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nFIS000208_Eskinazi.pdf
Distrubución geográfica