Registro:
| Documento: | Tesis de Grado |
| Título: | Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto |
| Autor: | Pérez Bianchi, Paula |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-08-04 |
| Fecha de defensa: | 2024-12-20 |
| Fecha en portada: | 2024 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Fernández Slezak, Diego |
| Director Asistente: | Riera, Pablo Ernesto |
| Jurado: | Turjanski, Pablo Guillermo; Iarussi, Emmanuel |
| Idioma: | Español |
| Palabras clave: | IA GENERATIVA; HUMAN-MACHINE INTERACTION; EVALUACION DE MODELOS; FINE-TUNING; STABLE DIFFUSIONGENERATIVE AI; HUMAN-MACHINE INTERACTION; MODEL EVALUATION; FINE-TUNNING; STABLE DIFFUSION |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000830_PerezBianchi.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000830_PerezBianchi |
| Ubicación: | Dep.COM 000830 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Pérez Bianchi, Paula. (2024). Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi |
Resumen:
Frente a la evolución de los modelos generativos, persisten preguntas sobre sus capacidades en comparación con las de los humanos. En esta tesis se propone una tarea innovadora para abordar este problema, evaluar modelos de texto a imagen mediante un experimento de neurociencia inspirado en el juego del “teléfono descompuesto”. Este experimento, realizado con humanos, se planteó en el contexto de las ciencias cognitivas con el objetivo de identificar los elementos descriptivos que influyen en la comunicación del conocimiento. Dado que los modelos generativos pueden estar involucrados en múltiples fases dentro del experimento, inicialmente se concentró el análisis en la fase que incluye la generación de imágenes a partir de descripciones textuales. Esto permitió comparar directamente el rendimiento de los modelos de texto a imagen con la capacidad humana. Se exploraron dos modelos Stable Diffusion v1.5 y DALL·E 3 y varias técnicas de alignment para generar imágenes de composiciones geométricas utilizando las descripciones humanas recolectadas durante el experimento anterior. Finalmente se realizo una evaluación crowdsourced de las imágenes generadas, encontrándose que los humanos superan tanto a DALL·E 3 como a Stable Diffusion v1.5 en esta tarea.
Abstract:
In light of the evolving capabilities of generative models, questions persist regarding their performance compared to humans. In this thesis, an innovative task is proposed to address this issue, evaluating text-to-image models through a neuroscience experiment inspired by the game “Chinese whispers”. This experiment, conducted with humans, was designed within the context of cognitive sciences to identify the descriptive elements that influence knowledge communication. Since generative models can participate in multiple phases of the experiment, the initial analysis focused on the generation of images from textual descriptions. This allowed for a direct comparison between the performance of text-to-image models and human capabilities. Two main models, Stable Diffusion v1.5 and DALL·E 3, were explored, along with various alignment techniques to generate images of geometric compositions using human-generated textual descriptions collected during a prior experiment. Finally, a crowdsourced evaluation of the generated images was conducted, revealing
Citación:
---------- APA ----------
Pérez Bianchi, Paula. (2024). Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi
---------- CHICAGO ----------
Pérez Bianchi, Paula. "Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2024.https://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000830_PerezBianchi.pdf
Distrubución geográfica