Registro:
Documento: | Tesis Doctoral |
Título: | Técnicas y modelos del lenguaje del pensamiento para el aprendizaje automático a partir de cuerpos de datos ralos |
Título alternativo: | Language of thought models and techniques for machine learning from sparse data |
Autor: | Romano, Sergio Gastón |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Lugar de trabajo: | Universidad de Buenos Aires - CONICET. Instituto de Investigación en Ciencias de la Computación (ICC)
|
Publicación en la Web: | 2022-07-05 |
Fecha de defensa: | 2021-12-20 |
Fecha en portada: | 2021 |
Grado Obtenido: | Doctorado |
Título Obtenido: | Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación |
Departamento Docente: | Departamento de Computación |
Director: | Figueira, Santiago |
Director Asistente: | Sigman, Mariano |
Consejero: | Fernández Slezak, Diego |
Jurado: | Maguitman, Ana Gabriela; Benotti, Luciana; Kruszewski Martel, Germán David |
Idioma: | Español |
Palabras clave: | LENGUAJE DEL PENSAMIENTO; INFERENCIA BAYESIANA; COMPLEJIDAD DE KILMOGOROV; LONGITUD MINIMA DE DESCRIPCIONLANGUAGE OF THOUGHT; BAYESIAN INFERENCE; KOLMOGOROV COMPLEXITY; MINIMUM DESCRIPTION LENGTH |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n7059_Romano |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7059_Romano.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n7059_Romano |
Ubicación: | COM 007059 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Romano, Sergio Gastón. (2021). Técnicas y modelos del lenguaje del pensamiento para el aprendizaje automático a partir de cuerpos de datos ralos. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n7059_Romano |
Resumen:
En las últimas dos décadas, distintas técnicas de ingeniería reversa del aprendizaje en humanos han influenciado el éxito de los algoritmos de aprendizaje automático. Técnicas como el aprendizaje profundo han alcanzado resultados notables en varios dominios como la detección visual de objetos, el reconocimiento de voz, o las traducciones automáticas, entre otros. Sin embargo, pese a que aprender a partir de pocos datos es una capacidad cotidiana de la mente humana, las técnicas actuales de aprendizaje automático no dan las mismas garantías al respecto. Investigaciones previas sobre modelos computacionales de la cognición humana han propuesto la idea de que la habilidad ubicua del ser humano para hacer predicciones sobre cuerpos ralos de datos se basa en el uso de modelos probabilísticos donde el conocimiento se representa en espacios adecuadamente estructurados sobre los que se aplican reglas de inferencia. Estos trabajos están revalorizando la hipótesis de Jerry Fodor que explica al pensamiento humano en una suerte de lenguaje mental llamado Lenguaje del Pensamiento compuesto por un conjunto de símbolos atómicos que pueden ser combinados en estructuras más complejas a partir de reglas combinatorias. En este trabajo diseñamos y evaluamos distintos modelos del Lenguaje del Pensamiento para explicar el aprendizaje humano con pocos datos en diversos dominios: secuencias binarias en el dominio visual y auditivo, secuencias geométricas en el campo visual, y conceptos lógicos. En nuestros modelos suponemos que el Lenguaje del Pensamiento actúa como un lenguaje de programación capaz de generar programas para modelar conceptos del mundo, y explicamos el aprendizaje como un proceso de inferencia probabilista sobre estos programas o con un enfoque de longitud mínima de descripción basado en las nociones de complejidad algorítmica. Proponemos, a su vez, distintas técnicas para mejorar el proceso de construcción y validación de los modelos del Lenguaje del Pensamiento con el objetivo de hacerlos más dinámicos y robustos
Abstract:
In the last two decades, different techniques to reverse engineer the human brain have successfully inspired artificial intelligence algorithms. Recent advances in deep learning have achieved remarkable results in many domains such as visual object recognition, speech recognition and automated translation. However,although learning from sparse data is a common ability of the human mind, current machine learning techniques have not been able to mimic such ability with the same success. Previous computational cognitive research has proposed the idea that the ubiquitous ability of the human being to make predictions from sparse data can be represented by models of probabilistic inference over symbolically structured representation spaces. These proposals are revamping Jerry Fodor’s hypothesis which states that thinking takes form in a sort of mental Language of Thought composed of a limited set of atomic symbols that can be combined to form more complex structures following combinatorial rules. In this work we design and evaluate different Language of Thought models to explain human learning from sparse data in various domains: binary sequences in the visual and auditory domain, geometric sequences in the visual domain, and logical concepts. In our models we assume that the Language of Thought acts as a programming language capable of generating programs to model concepts in the world, and we explain learning as a process of probabilistic inference over these programs or with a minimum length of description approach based on the notions of algorithmic complexity. Finally, we propose different techniques to improve the process of construction and validation of the Language of Thought models in order to make them more dynamic and reliable.
Citación:
---------- APA ----------
Romano, Sergio Gastón. (2021). Técnicas y modelos del lenguaje del pensamiento para el aprendizaje automático a partir de cuerpos de datos ralos. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n7059_Romano
---------- CHICAGO ----------
Romano, Sergio Gastón. "Técnicas y modelos del lenguaje del pensamiento para el aprendizaje automático a partir de cuerpos de datos ralos". Tesis Doctoral, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2021.https://hdl.handle.net/20.500.12110/tesis_n7059_Romano
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7059_Romano.pdf