Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto

Pérez Bianchi, Paula

Registro:

Documento:	Tesis de Grado
Título:	Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto
Autor:	Pérez Bianchi, Paula
Editor:	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Publicación en la web:	2025-08-04
Fecha de defensa:	2024-12-20
Fecha en portada:	2024
Grado Obtenido:	Grado
Título Obtenido:	Licenciado en Ciencias de la Computación
Departamento Docente:	Departamento de Computación
Director:	Fernández Slezak, Diego
Director Asistente:	Riera, Pablo Ernesto
Jurado:	Turjanski, Pablo Guillermo; Iarussi, Emmanuel
Idioma:	Español
Palabras clave:	IA GENERATIVA; HUMAN-MACHINE INTERACTION; EVALUACION DE MODELOS; FINE-TUNING; STABLE DIFFUSIONGENERATIVE AI; HUMAN-MACHINE INTERACTION; MODEL EVALUATION; FINE-TUNNING; STABLE DIFFUSION
Formato:	PDF
Handle:	http://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi
PDF:	https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000830_PerezBianchi.pdf
Registro:	https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000830_PerezBianchi
Ubicación:	Dep.COM 000830
Derechos de Acceso:	Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Pérez Bianchi, Paula. (2024). Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi

Resumen:

Frente a la evolución de los modelos generativos, persisten preguntas sobre sus capacidades en comparación con las de los humanos. En esta tesis se propone una tarea innovadora para abordar este problema, evaluar modelos de texto a imagen mediante un experimento de neurociencia inspirado en el juego del “teléfono descompuesto”. Este experimento, realizado con humanos, se planteó en el contexto de las ciencias cognitivas con el objetivo de identificar los elementos descriptivos que influyen en la comunicación del conocimiento. Dado que los modelos generativos pueden estar involucrados en múltiples fases dentro del experimento, inicialmente se concentró el análisis en la fase que incluye la generación de imágenes a partir de descripciones textuales. Esto permitió comparar directamente el rendimiento de los modelos de texto a imagen con la capacidad humana. Se exploraron dos modelos Stable Diffusion v1.5 y DALL·E 3 y varias técnicas de alignment para generar imágenes de composiciones geométricas utilizando las descripciones humanas recolectadas durante el experimento anterior. Finalmente se realizo una evaluación crowdsourced de las imágenes generadas, encontrándose que los humanos superan tanto a DALL·E 3 como a Stable Diffusion v1.5 en esta tarea.

Abstract:

In light of the evolving capabilities of generative models, questions persist regarding their performance compared to humans. In this thesis, an innovative task is proposed to address this issue, evaluating text-to-image models through a neuroscience experiment inspired by the game “Chinese whispers”. This experiment, conducted with humans, was designed within the context of cognitive sciences to identify the descriptive elements that influence knowledge communication. Since generative models can participate in multiple phases of the experiment, the initial analysis focused on the generation of images from textual descriptions. This allowed for a direct comparison between the performance of text-to-image models and human capabilities. Two main models, Stable Diffusion v1.5 and DALL·E 3, were explored, along with various alignment techniques to generate images of geometric compositions using human-generated textual descriptions collected during a prior experiment. Finally, a crowdsourced evaluation of the generated images was conducted, revealing

Citación:

---------- APA ----------

Pérez Bianchi, Paula. (2024). Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi

---------- CHICAGO ----------

Pérez Bianchi, Paula. "Evaluación de rendimiento de humanos y modelos generativos en tareas de generación de imágenes a partir de texto". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2024.https://hdl.handle.net/20.500.12110/seminario_nCOM000830_PerezBianchi

Estadísticas:

Descargas mensuales

Total de descargas desde :

https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000830_PerezBianchi.pdf

Navegar

Colección

Tesis de Grado