Registro:
| Documento: | Tesis de Grado |
| Título: | Cuantificando la diversidad cultural en redes sociales : un enfoque de embeddings de comunidades |
| Título alternativo: | Quantifying cultural diversity in social networks : a community embedding approach |
| Autor: | Oppenheim, Abi |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-08-04 |
| Fecha de defensa: | 2024-12-20 |
| Fecha en portada: | 2024 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Feuerstein, Esteban Zindel |
| Director Asistente: | Albanese, Federico |
| Jurado: | Cicchini, Tomás; Lombardi, Leandro Ezequiel |
| Idioma: | Español |
| Palabras clave: | DIVERSIDAD SOCIAL; TOXICIDAD; REDDIT; EMBEDDING DE COMUNIDADES; MACHINE LEARNINGSOCIAL DIVERSITY; TOXICITY; REDDIT; COMMUNITY EMBEDDING; MACHINE LEARNING |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000820_Oppenheim |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000820_Oppenheim.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000820_Oppenheim |
| Ubicación: | Dep.COM 000820 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Oppenheim, Abi. (2024). Cuantificando la diversidad cultural en redes sociales : un enfoque de embeddings de comunidades. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000820_Oppenheim |
Resumen:
Los avances en el análisis de redes sociales y técnicas de procesamiento de lenguaje natural (PLN) han mejorado nuestra comprensión de las dinámicas intercomunitarias y sus impactos. Este trabajo introduce una métrica novedosa que cuantifica la diversidad social y cultural dentro de comunidades online, con el propósito de examinar su relación con la toxicidad en las interacciones de los usuarios. Nuestro método se diferencia de enfoques previos al emplear embeddings de usuarios y comunidades generados a partir de vastos volúmenes de datos de Reddit, capturando dimensiones culturales e ideológicas de manera precisa. Asignamos un puntaje de diversidad tanto a nivel individual como comunitario, y lo comparamos con el puntaje de Generalismo-Especialismo (GS), mostrando cómo cada uno aporta información complementaria sobre las interacciones y la diversidad temática en el ecosistema digital. La métrica de diversidad propuesta tiene valor intrínseco, ya que permite caracterizar y segmentar comunidades según su composición social, identificando patrones de homogeneidad o heterogeneidad que impactan en la cohesión y resiliencia comunitaria. Este puntaje de diversidad se convierte en una herramienta valiosa para la investigación y la gesti ́on de comunidades, ya que posibilita la evaluación comparativa de grupos, incluso en ausencia de indicadores de toxicidad, y puede informar políticas de moderación y estrategias de dise ̃no de plataformas. Nuestro an ́alisis emplea modelos PLN para evaluar el contenido conversacional y correlacionarlo con los puntajes de diversidad, aportando un enfoque integral al estudio de las interacciones en entornos digitales. Este trabajo contribuye tanto a la teor ́ıa de la interacci ́on online como a la pr ́actica, proporcionando bases para mejorar la moderaci ́on y fomentar espacios digitales m ́as inclusivos y respetuosos.
Abstract:
Recent advances in social network analysis and natural language processing (NLP) techniques have allowed for a better understanding of inter-community dynamics and their impacts. In this work, we propose a novel metric to quantify social and cultural diversity in online communities, aiming to study its relationship with toxicity in user interactions. Unlike previous approaches, our method employs user and community embeddings generated from large volumes of Reddit data, which accurately capture cultural and ideological dimensions. We assign a social diversity score to both users and communities, comparing this diversity with the Generalism-Specialism (GS) score to demonstrate how each provides complementary information about interaction dynamics and thematic diversity. Finally, our analysis utilizes NLP models to evaluate the content of conversations and correlate it with diversity scores. This work contributes not only to research on digital interactions but also to the implementation of better moderation strategies, helping to create more inclusive and respectful online spaces.
Citación:
---------- APA ----------
Oppenheim, Abi. (2024). Cuantificando la diversidad cultural en redes sociales : un enfoque de embeddings de comunidades. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000820_Oppenheim
---------- CHICAGO ----------
Oppenheim, Abi. "Cuantificando la diversidad cultural en redes sociales : un enfoque de embeddings de comunidades". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2024.https://hdl.handle.net/20.500.12110/seminario_nCOM000820_Oppenheim
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000820_Oppenheim.pdf
Distrubución geográfica