Registro:
| Documento: | Tesis de Grado |
| Título: | Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
| Autor: | Rodríguez, Fernando Jorge |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-06-12 |
| Fecha de defensa: | 2013 |
| Fecha en portada: | 2013 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Castaño, José Manuel |
| Jurado: | Cotik, Viviana Erica; Gravano, Agustín |
| Idioma: | Español |
| Palabras clave: | LENGUAJE NATURAL; ETIQUETADOR GRAMATICALTAGGING |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000710_Rodriguez.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000710_Rodriguez |
| Ubicación: | Dep.COM 000710 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Rodríguez, Fernando Jorge. (2013). Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez |
Resumen:
El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.
Citación:
---------- APA ----------
Rodríguez, Fernando Jorge. (2013). Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez
---------- CHICAGO ----------
Rodríguez, Fernando Jorge. "Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2013.https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000710_Rodriguez.pdf
Distrubución geográfica