Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales

Rodríguez, Fernando Jorge

Navegar

Documento Últimos publicados Autor Año Título Obtenido - Año Departamento - Año Director y Director Asistente Jurado Consejero de Estudios Palabras Clave

Colección

Datos Estadísticas

Tesis de Grado

Rodríguez, Fernando Jorge. "Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales" . (2013). Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.

Registro Resumen Citación Estadísticas

Registro:

Documento:	Tesis de Grado
Título:	Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
Autor:	Rodríguez, Fernando Jorge
Editor:	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Publicación en la web:	2025-06-12
Fecha de defensa:	2013
Fecha en portada:	2013
Grado Obtenido:	Grado
Título Obtenido:	Licenciado en Ciencias de la Computación
Departamento Docente:	Departamento de Computación
Director:	Castaño, José Manuel
Jurado:	Cotik, Viviana Erica; Gravano, Agustín
Idioma:	Español
Palabras clave:	LENGUAJE NATURAL; ETIQUETADOR GRAMATICALTAGGING
Formato:	PDF
Handle:	https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez
PDF:	https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000710_Rodriguez.pdf
Registro:	https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000710_Rodriguez
Ubicación:	COM 000710
Derechos de Acceso:	Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Rodríguez, Fernando Jorge. (2013). Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez

Resumen:

El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.

Citación:

---------- APA ----------

Rodríguez, Fernando Jorge. (2013). Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez

---------- CHICAGO ----------

Rodríguez, Fernando Jorge. "Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2013.https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez

Estadísticas:

Descargas mensuales

Total de descargas desde :

https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000710_Rodriguez.pdf