Registro:
| Documento: | Tesis de Grado |
| Título: | Keyword spotting en idiomas sin datos |
| Autor: | Brusco, Pablo Daniel |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-06-12 |
| Fecha de defensa: | 2014 |
| Fecha en portada: | Mayo 2014 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director Asistente: | Gravano, Agustín |
| Jurado: | Fernández Slezak, Diego; Pelle, Patricia Alejandra |
| Idioma: | Español |
| Palabras clave: | DETECCION DE PALABRAS CLAVES; KEYWORD SPOTTING; SPEECH RECOGNITION; FILLERS; MODELOS OCULTOS DE MARKOV; WORD SPOTTING |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000705_Brusco.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000705_Brusco |
| Ubicación: | Dep.COM 000705 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Brusco, Pablo Daniel. (2014). Keyword spotting en idiomas sin datos. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco |
Resumen:
En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.
Citación:
---------- APA ----------
Brusco, Pablo Daniel. (2014). Keyword spotting en idiomas sin datos. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco
---------- CHICAGO ----------
Brusco, Pablo Daniel. "Keyword spotting en idiomas sin datos". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2014.https://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000705_Brusco.pdf
Distrubución geográfica