Registro:
| Documento: | Tesis de Grado |
| Título: | Preprocesamiento y normalización del texto de un sistema de conversión Texto a Habla |
| Autor: | Saudino, Ezequiel Pablo |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-06-12 |
| Fecha de defensa: | 2015 |
| Fecha en portada: | Marzo 2015 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Gravano, Agustín |
| Jurado: | Fernández Slezak, Diego |
| Idioma: | Español |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000721_Saudino |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000721_Saudino.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000721_Saudino |
| Ubicación: | Dep.COM 000721 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Saudino, Ezequiel Pablo. (2015). Preprocesamiento y normalización del texto de un sistema de conversión Texto a Habla. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000721_Saudino |
Resumen:
Esta tesis consiste en el desarrollo e implementación de módulos que realizan el preprocesamiento y normalización de texto (front-end) de un sistema de conversión de Texto a Habla o TTS (Text-to-Speech) y su integración con sistemas Generadores de Habla (backends) existentes, logrando un sistema Texto a Habla completo para el español. El alcance definido para el sistema es el conjunto de artículos de Wikipedia en español. Se construyeron módulos que realizan las tareas de análisis de texto previas a la generación del habla: extracci´on del texto del artículo HTML de Wikipedia, separación del texto en oraciones, transformación de palabras en inglés para que se pronuncien adecuadamente en español (ej.: “green” a “grin”), normalización de números, abreviaturas, siglas y otros símbolos (ej.:“$3” a “tres pesos”) e interacción con los sistemas generadores del habla (Festival y MARY TTS) para obtener el audio de cada oración y reproducirlo en forma fluida. Para el módulo de separación del texto en oraciones se obtuvo una tasa de error de 1,27 % sobre una muestra de diez artículos, comparable a las que encontramos en la literatura para el español y otros idiomas. Para el procesamiento de palabras del inglés se logró generar un procedimiento que construye su pronunciación en español, se evaluaron las 200 palabras del inglés con mayor frecuencia en Wikipedia en español con una tasa de aciertos del 90,5 % o 94,4 % si se pondera por la frecuencia. Para el módulo de normalización se obtuvo una tasa de aciertos de 97,3 % sobre una muestra de cinco artículos. También se alcanzó el objetivo de integración con los sistemas back-end logrando un sistema completo de Texto a Habla con una salida fluida del audio resultante.
Citación:
---------- APA ----------
Saudino, Ezequiel Pablo. (2015). Preprocesamiento y normalización del texto de un sistema de conversión Texto a Habla. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000721_Saudino
---------- CHICAGO ----------
Saudino, Ezequiel Pablo. "Preprocesamiento y normalización del texto de un sistema de conversión Texto a Habla". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2015.https://hdl.handle.net/20.500.12110/seminario_nCOM000721_Saudino
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000721_Saudino.pdf
Distrubución geográfica