Registro:
Documento: | Tesis de Maestría |
Título: | Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
Título alternativo: | Handwritten text segmentation and recognition with deep learning |
Autor: | Pilorget, Juan Pablo |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la Web: | 2024-04-19 |
Fecha de defensa: | 2023-05-31 |
Fecha en portada: | 31 de mayo de 2023 |
Grado Obtenido: | Maestría |
Título Obtenido: | Magíster de la Universidad de Buenos Aires en el área de Explotación de Datos y Descubrimiento del Conocimiento |
Departamento Docente: | Departamento de Computación |
Director: | Buemi, María Elena |
Jurado: | Delrieux, Claudio Augusto; Seijas, Leticia María; Risk, Marcelo Raúl |
Idioma: | Español |
Palabras clave: | RECONOCIMIENTO DE CARACTERES; REDES NEURONALES; SEGMENTACIÓN SEMANTICA; TEXTO MANUSCRITO; APRENDIZAJE PROFUNDOCHARACTER RECOGNITION; NEURAL NETWORKS; SEMANTIC SEGMENTATION; HANDWRITTEN TEXT; DEEP LEARNING |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n7456_Pilorget |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7456_Pilorget.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n7456_Pilorget |
Ubicación: | DMI 007456 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Pilorget, Juan Pablo. (2023). Segmentación y reconocimiento de textos manuscritos utilizando redes profundas. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n7456_Pilorget |
Resumen:
El reconocimiento de caracteres es un campo de investigación y desarrollo aplicado que ha tenido numerosos avances en los últimos años. Las técnicas tradicionales de reconocimiento óptico de caracteres, con una alta carga de trabajo manual para lograr su correcto funcionamiento, han comenzado a ser reemplazadas por abordajes inteligentes utilizando redes neuronales profundas. Los nuevos modelos permiten no sólo automatizar los procesos de reconocimiento sino mejorar la calidad de un tipo específico: el texto escrito a mano. La cantidad creciente de documentos manuscritos digitalizados presentan a la vez un desafío, por la imposibilidad de los métodos tradicionales para reconocer adecuadamente ese tipo de texto, y una oportunidad, por el impacto que podrían generar para el acervo público el desarrollo de modelos que detecten y reconozcan correctamente caracteres escritos a mano. El presente trabajo profundiza en las arquitecturas de redes neuronales que pueden utilizarse para detectar texto y reconocer caracteres de forma inteligente, analizando cuantitativamente el desempeño de modelos de segmentación y reconocimiento. Asimismo, evalúa cualitativamente los modelos en el acervo de la Biblioteca Digital de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, aplicando las técnicas a la correspondencia digitalizada de Mario Bunge. La información obtenida es sistematizada y puesta a disposición para futuros trabajos y líneas de investigación.
Abstract:
Character recognition is an applied research field that has gone through numerous advances in recent years. Traditional optical character recognition techniques, requiring several manual steps in order to work properly, are being gradually replaced by new intelligent approaches leveraging deep neural networks. These new models allow not only to automate the processes but also enable improving the quality of a specific type of document: handwritten text. The increasing volume of handwritten documents that are being digitized pose both a challenge, given the struggle of traditional methods on correctly identifying text, and an opportunity, for the impact the development of detection and recognition models might have in the public archive. The present work dives deep in the neural network architectures that can be used for detecting text and intelligently recognizing characters, performing a quantitative analysis of performance on the segmentation and recognition models. It also evaluates qualitatively the models by applying them to the digital assets of the Library of the Faculty of Exact and Natural Sciences of the University of Buenos Aires, using the techniques on the correspondence of Mario Bunge. The resulting information is thus systematized and made available for future works and researches.
Citación:
---------- APA ----------
Pilorget, Juan Pablo. (2023). Segmentación y reconocimiento de textos manuscritos utilizando redes profundas. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n7456_Pilorget
---------- CHICAGO ----------
Pilorget, Juan Pablo. "Segmentación y reconocimiento de textos manuscritos utilizando redes profundas". Tesis de Maestría, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2023.https://hdl.handle.net/20.500.12110/tesis_n7456_Pilorget
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7456_Pilorget.pdf