Registro:
Documento: | Tesis de Grado |
Título: | Question answering de dominio abierto y de dominio cerrado |
Título alternativo: | Open and closed domain question answering |
Autor: | Peller, Julián |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la web: | 2025-06-12 |
Fecha de defensa: | 2016 |
Fecha en portada: | 2016 |
Grado Obtenido: | Grado |
Título Obtenido: | Licenciado en Ciencias de la Computación |
Departamento Docente: | Departamento de Computación |
Director: | Castaño, José Manuel |
Jurado: | Mislej, Ernesto Marcelo; Tolosa, Gabriel Hernán |
Idioma: | Español |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000662_Peller.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000662_Peller |
Ubicación: | Dep.COM 000662 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Peller, Julián. (2016). Question answering de dominio abierto y de dominio cerrado. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller |
Resumen:
Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
Abstract:
Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.
Citación:
---------- APA ----------
Peller, Julián. (2016). Question answering de dominio abierto y de dominio cerrado. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller
---------- CHICAGO ----------
Peller, Julián. "Question answering de dominio abierto y de dominio cerrado". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2016.https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000662_Peller.pdf
Distrubución geográfica