Registro:
| Documento: | Tesis de Grado |
| Título: | Aprendizaje por refuerzo en robots autónomos con percepción basada en visión |
| Autor: | Pedre, Sol; De Cristóforis, Pablo Esteban |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2024-08-30 |
| Fecha de defensa: | 2007 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Santos, Juan Miguel |
| Director Asistente: | Bendersky, Diego Ariel |
| Idioma: | Español |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000293_Pedre |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000293_Pedre.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000293_Pedre |
| Ubicación: | Dep.COM 000293 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Pedre, Sol; De Cristóforis, Pablo Esteban. (2007). Aprendizaje por refuerzo en robots autónomos con percepción basada en visión. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000293_Pedre |
Resumen:
Un modelo de aprendizaje que ha impactado en el campo de los robots autónomos es el Aprendizaje por Refuerzo. En este trabajo estudiamos la utilización de Aprendizaje por Refuerzo en problemas para los cuales se tiene una percepción basada en visión. El espacio de estados de las imágenes es demasiado grande para poder aplicar técnicas de Aprendizaje por Refuerzo directamente. Surge entonces la necesidad de mapear el espacio de imágenes a una representación cuyo cardinal haga factible el uso de técnicas de Aprendizaje por Refuerzo como Q-Learning. Para solucionar este problema propusimos un método que utiliza la transformada lineal de Hough para detectar las rectas de las imágenes sensadas. A partir de una representación basada en una cantidad pequeña de rectas inferidas de las imágenes, obtenemos la información necesaria del entorno y reducimos el cardinal de estados lo suficiente, como para poder aplicar el algoritmo de Q-Learning. Además, para tratar el problema de la alta cardinalidad del espacio estado-acción durante la exploración propusimos una técnica de exploración dirigida libre de modelo. Para verificar el método propuesto realizamos varias experiencias. Primero, desarrollamos un entorno de simulación para poner a prueba el método y ajustar los valores de los parámetros involucrados. Luego, realizamos experiencias con un robot real. Los resultados obtenidos en ambos casos fueron muy satisfactorios. Por último, presentamos las conclusiones y las posibles líneas de investigación que permitirían continuar este trabajo en el futuro.
Citación:
---------- APA ----------
Pedre, Sol; De Cristóforis, Pablo Esteban. (2007). Aprendizaje por refuerzo en robots autónomos con percepción basada en visión. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000293_Pedre
---------- CHICAGO ----------
Pedre, Sol; De Cristóforis, Pablo Esteban. "Aprendizaje por refuerzo en robots autónomos con percepción basada en visión". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2007.https://hdl.handle.net/20.500.12110/seminario_nCOM000293_Pedre
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000293_Pedre.pdf
Distrubución geográfica