Resumen:
En este trabajo se muestra cómo pueden utilizarse métodos de reducción de dimensionalidad basados en matrices para el análisis y clasificación de autores de discursos presidenciales. La representación de textos como matrices de frecuencias, en la cual cada columna es una palabra del vocabulario, suele presentar el desaf ́ıo de la alta dimensionalidad, por lo cual es preciso utilizar técnicas para reducir dicha dimensión. En este estudio, se emplean 1073 discursos de los presidentes Alberto Fernández, Cristina Fernández de Kirchner y Mauricio Macri, obtenidos mediante técnicas de scraping de páginas oficiales. Se utilizan dos métodos matriciales de reducción de dimensionalidad: el Análisis de Componentes Principales (PCA) y la Factorización No Negativa de Matrices (NMF). Esto nos permitirá, en primer lugar, asignar tópicos o temáticas a los presidentes con conjuntos términos que identifiquen sus discursos. En segunda instancia, las matrices resultantes de los métodos serán utilizadas para entrenar un modelo de clasificación con K vecinos más cercanos, cuyos resultados serán analizados y comparados en el trabajo.
Abstract:
In this work, we demonstrate how matrix-based dimensionality reduction methods can be employed for the analysis and classification of presidential speech authors. Representing texts as frequency matrices, where each column represents a word from the vocabulary, often poses the challenge of high dimensionality. Hence, it is necessary to employ techniques to reduce this dimension. In this study, we use 1073 speeches from Presidents Alberto Fern ́andez, Cristina Fern ́andez de Kirchner, and Mauricio Macri, obtained through web scraping from official websites. We utilize two matrix-based dimensionality reduction methods: Principal Component Analysis (PCA) and Non-Negative Matrix Factorization (NMF). Firstly, this allows us to assign topics or themes to the presidents using sets of terms that identify their speeches. Secondly, the resulting matrices from these methods are used to train a K-Nearest Neighbors classification model, the results of which will be analyzed and compared in the study.
Citación:
---------- APA ----------
Bounos, Ian Evangelos. (2023). Técnicas matriciales para el análisis y clasificación de discursos presidenciales. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nMAT000663_Bounos
---------- CHICAGO ----------
Bounos, Ian Evangelos. "Técnicas matriciales para el análisis y clasificación de discursos presidenciales". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2023.https://hdl.handle.net/20.500.12110/seminario_nMAT000663_Bounos
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nMAT000663_Bounos.pdf
Distrubución geográfica