Registro:
Documento: | Tesis de Grado |
Disciplina: | computacion |
Título: | Aprendizaje por refuerzo en robots modulares autoreconfigurables : el aprendizaje como metodología para resolver tareas de locomoción y reconfiguración |
Autor: | Kirkner, Ricardo Martín |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la web: | 2022-07-05 |
Fecha de defensa: | 2007-03 |
Fecha en portada: | 2007-03-01 |
Grado Obtenido: | Grado |
Título Obtenido: | Licenciado en Ciencias de la Computación |
Director: | Santos, Juan Miguel |
Idioma: | Español |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000324_Kirkner |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000324_Kirkner.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000324_Kirkner |
Ubicación: | Dep.COM 000324 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Kirkner, Ricardo Martín. (2007). Aprendizaje por refuerzo en robots modulares autoreconfigurables : el aprendizaje como metodología para resolver tareas de locomoción y reconfiguración. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000324_Kirkner |
Resumen:
La metodología del Aprendizaje por Refuerzo se ha visto reiteradamente ignorada en la literatura que abarca el estudio de las tareas de locomoción y reconfiguración en Robots Modulares Autoreconfigurables. Sin embargo, esta metodología ha demostrado poseer beneficios importantes en los casos en los que se la utilizó para resolver problemas asociados a entornos dinámicos e impredecibles. Esta característica resulta muy adecuada a los problemas habitualmente encontrados en el campo de los Robots Modulares Autoreconfigurables. En el presente trabajo se informa acerca del estado del arte en el campo de los Robots Modulares Autoreconfigurables, para determinar los problemas aún no resueltos y las posibles vetas de investigación presentes en dicho campo. Luego se implementa un simulador con el fin de estudiar la aplicación de la metodología de Aprendizaje por Refuerzo para obtener comportamientos que resuelvan eficientemente las tareas de locomoción y reconfiguración en un robot autoreconfigurable M-TRAN. Finalmente se plantean diversos experimentos que involucran las mencionadas tareas, para los cuales se estudia la representación más adecuada del espacio de estados y acciones, la forma de discretizar el mismo de manera que los experimentos sean computacionalmente factibles, y el impacto de distintos aspectos involucrados en un problema de aprendizaje (definición de episodio, velocidad de aprendizaje, evaluación de la política aprendida). Como este tipo de estudio tiene un componente experimental importante, luego de diseñar los experimentos y llevarlos a cabo, se evalúan los resultados obtenidos y se extraen conclusiones acerca de la efectividad y posibilidades que tiene el Aprendizaje por Refuerzo en este tipo de robots.
Abstract:
Reinforcement Learning has been found repeatedly missing in the literature about reconfiguration and locomotion tasks in Self-Reconfigurable Modular Robots. This methodology, however, has been proved to produce significant benefits in those cases where it was used to solve problems related to dynamic and unpredictable environments. This kind of environments is very common when dealing with Self-Reconfigurable Modular Robots. In this work, we rst survey the state of the art in the field of Self- Reconfigurable Modular Robots, in order to determine what the yet unsolved problems and the possible niches of research are. We then develop a simulator in order to study the Reinforcement Learning methodology applied to the generation of behaviours that efficiently solve reconfiguration and locomotion tasks using the M-TRAN Self-Reconfigurable Modular Robot. Finally, several experiments are suggested in order to test this methodology. For those experiments it is necessary to define the best representation for the stateaction space, and the way to discretize it in order to make those experiments computationally feasible. Another issue analyzed is the impact of several aspects involved in Reinforcement Learning problems, such as the definition of an episode, the learning velocity and policy evaluation. Since this kind of study involves a significant experimental component, after designing and performing the experiments, the results are analyzed and conclusions are then drawn about the effectiveness and possibilities of Reinforcement Learning when applied to these kind of robots.
Citación:
---------- APA ----------
Kirkner, Ricardo Martín. (2007). Aprendizaje por refuerzo en robots modulares autoreconfigurables : el aprendizaje como metodología para resolver tareas de locomoción y reconfiguración. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000324_Kirkner
---------- CHICAGO ----------
Kirkner, Ricardo Martín. "Aprendizaje por refuerzo en robots modulares autoreconfigurables : el aprendizaje como metodología para resolver tareas de locomoción y reconfiguración". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2007.https://hdl.handle.net/20.500.12110/seminario_nCOM000324_Kirkner
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000324_Kirkner.pdf
Distrubución geográfica