Registro:
| Documento: | Tesis de Grado |
| Título: | Clasificación automática de papers de ciencias de la computación |
| Título alternativo: | Automatic classification of papers of computer science |
| Autor: | Scherz, Alejandro |
| Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| Publicación en la web: | 2025-06-12 |
| Fecha de defensa: | 2018 |
| Fecha en portada: | 2018 |
| Grado Obtenido: | Grado |
| Título Obtenido: | Licenciado en Ciencias de la Computación |
| Departamento Docente: | Departamento de Computación |
| Director: | Castaño, Jose Manuel |
| Jurado: | Jacobo Berlles, Julio César Alberto; Rodríguez, Ricardo Oscar |
| Idioma: | Español |
| Palabras clave: | CLASIFICACION JERARQUICA DE TEXTOS; MACHINE LEARNING; DATA MINING; ACMHIERARCHICAL TEXT CLASSIFICATION |
| Formato: | PDF |
| Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000635_Scherz |
| PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000635_Scherz.pdf |
| Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000635_Scherz |
| Ubicación: | Dep.COM 000635 |
| Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Scherz, Alejandro. (2018). Clasificación automática de papers de ciencias de la computación. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000635_Scherz |
Resumen:
El presente trabajo consiste en el desarrollo de un sistema de clasificación automática de papers, que permite asignarles la categoría adecuada de acuerdo al contenido de los mismos mediante la aplicación de técnicas de machine learning. Una herramienta de estas características puede ahorrar a los publicadores de papers el tiempo significativo que implica atravesar un proceso de selección de categorías jerárquicas para clasificarlos correctamente, y de esta manera facilitar su búsqueda una vez que se han publicado en los repositorios bibliográficos online. Para la implementación de este sistema se obtuvo una colección de artículos de todo tipo del sitio web de la Librería Digital de la ACM (Association for Computing Machinery) [ws@a] a partir de la cual se generaron los datasets de entrenamiento que se utilizarán junto con una herramienta llamada MALLET [ws@c] para determinar la categoría´ıa de papers que aún no han sido clasificados, estudiando el caso particular de las últimas taxonomías que presenta dicho sitio (versiones de 1998 y 2012). El sistema, que se encuentra implementado en Python 2.7 [ws@d] e interactúa con la API de Java [ws@b] de la herramienta MALLET, provee una interfaz interactiva (tanto gráfica como en consola), en la cual se puede seleccionar diversas opciones, entre ellas la etapa de clasificación a ejecutar, los campos del paper tenidos en cuenta para el entrenamiento, los algoritmos de clasificación a utilizar, y la taxonomía a considerar para la predicción de las categorías.
Abstract:
The present work consists in the development of a system of automatic classification of papers, which allows them to be assigned the appropriate category according to their content through the application of machine learning techniques. Such a tool can save paper publishers the significant time it takes to go through a process of selecting hierarchical categories to sort them correctly, and thus facilitate their search once they have been published in online bibliographic repositories. For the implementation of this system, a collection of articles of all kind was obtained from the website of the Digital Library of the ACM (Association for Computing Machinery) [ws@a] , from which the training datasets were generated that will be used together with a tool called MALLET [ws@c] to determine the category of papers that have not yet been classified, studying the particular case of the latest taxonomies presented by the site (1998 and 2012 versions). The system, which is implemented in Python 2.7 [ws@d] and interacts with the Java [ws@b] API of the MALLET tool, provides an interactive interface (both graphical and console mode), in which various options can be selected, including the classification stage to execute, the paper fields taken into account for the training, the classification algorithms to use, and the taxonomy to consider for the prediction of the categories.
Citación:
---------- APA ----------
Scherz, Alejandro. (2018). Clasificación automática de papers de ciencias de la computación. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000635_Scherz
---------- CHICAGO ----------
Scherz, Alejandro. "Clasificación automática de papers de ciencias de la computación". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2018.https://hdl.handle.net/20.500.12110/seminario_nCOM000635_Scherz
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000635_Scherz.pdf
Distrubución geográfica