Resumen:
La conversión del texto al habla (TTS, del inglés text-to-speech), consiste en transformar un texto escrito en su equivalente oral. Un sistema usado con este propósito recibe el nombre de sistema TTS. La primera fase de un sistema TTS es el preprocesamiento o normalización del texto de entrada, proceso que convierte el texto en palabras pronunciables como serían leídas por un hablante humano (Ej.: el 16/12/2012 = el dieciséis de diciembre de dos mil doce). Esta tesis busca implementar la normalización del texto de entrada para textos en español para un sistema TTS. En este contexto es posible encontrar numerosos problemas a resolver, como por ejemplo la expansión de números (124 = ciento veinticuatro) y abreviaturas (etc. = etcétera). Para las múltiples tareas de la normalización del texto se utilizaron traductores de estados finitos con peso (en inglés weighted finite-state transducers o WFST). El objetivo fue construir un WFST para que reciba cualquier texto de entrada y devuelva otro texto escrito con un conjunto de traducciones posibles como serían leídas en su forma oral para seleccionar la que mejor aplique. Esta solución se selecciona en base al peso, beneficiándose con el uso de marcas (tags) que permitieron indicar según información de contexto cuál sería la traducción correcta (Ej.: 1° de temperatura = un grado de temperatura). El sistema fue evaluado utilizando fuentes de textos en español, como diarios on-line, artículos de la Web y Wikipedia, comparando los resultados obtenidos con textos de referencias donde las traducciones fueron realizadas por humanos. Una aplicación futura de este sistema es que forme parte de un sistema TTS en desarrollo en la UBA, el cual permitirá la lectura de páginas Web para personas con problemas visuales, brindando la posibilidad a dichas personas de acceder a los contenidos de las páginas en español.
Citación:
---------- APA ----------
Pechersky, Verónica. (2012). Normalización del texto de entrada para un sistema de síntesis del habla. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000731_Pechersky
---------- CHICAGO ----------
Pechersky, Verónica. "Normalización del texto de entrada para un sistema de síntesis del habla". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2012.https://hdl.handle.net/20.500.12110/seminario_nCOM000731_Pechersky
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000731_Pechersky.pdf
Distrubución geográfica