Registro:
Documento: | Tesis de Maestría |
Título: | Características basadas en agrupamiento de series temporales para predicción de valores de bolsa |
Título alternativo: | Features based on the clustering of time series for prediction of stock market values |
Autor: | Vásquez Sáenz, Javier |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la Web: | 2024-01-09 |
Fecha de defensa: | 2023-12-02 |
Fecha en portada: | 2 de octubre 2023 |
Grado Obtenido: | Maestría |
Título Obtenido: | Magíster de la Universidad de Buenos Aires en el área de Explotación de Datos y Descubrimiento del Conocimiento |
Departamento Docente: | Departamento de Computación |
Director: | Quiroga, Facundo Manuel |
Director Asistente: | Bariviera, Aurelio Fernández |
Jurado: | Martínez, Lisana Belén; Sorrosal Forradellas, María Teresa; Denicolay Pacheco, Gustavo Fernando |
Idioma: | Español |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n7448_VasquezSaenz |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7448_VasquezSaenz.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n7448_VasquezSaenz |
Ubicación: | DMI 007448 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Vásquez Sáenz, Javier. (2023). Características basadas en agrupamiento de series temporales para predicción de valores de bolsa. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n7448_VasquezSaenz |
Resumen:
En esta tesis proponemos la hipótesis que incluir información de acciones relacionadas a la acción a predecir mejora la calidad de dicha predicción. Estas acciones relacionadas pueden obtenerse mediante distintos métodos de agrupamiento sobre información de precios, rendimientos y ratios derivados de los balances trimestrales. En la figura 1.1 se representa el proceso completo. Nuestro conjunto de datos se basó en las acciones de las empresas de que cotizan en los mercados de valores de los Estados Unidos, dentro de las 3000 empresas con mayor capitalización bursátil, listadas en el índice Russell 3000. Dentro de dichas empresas, se han impuesto dos condiciones: (i) que hayan cotizado y (ii) que haya presentado balances en el período de enero de 2017 a junio de 2022, representando un total de 2359 acciones para trabajar. Utilizamos los balances trimestrales para generar 10 ratios financieros y los convertimos en series temporales. También utilizamos las series habituales de precios de cierre y rendimientos diarios. Con estos conjuntos de series temporales agrupamos las acciones representadas con estas características utilizando K-Means o K-Medoids con distancias basadas en Dynamic Time Warping, Extended Frobenius Norm y en la distancia euclidiana de los coeficientes generados por transformadas rápidas de Fourier. La información derivada de estos agrupamientos permitió seleccionar las características a proporcionar a modelos de ARIMA y Redes Neuronales, utilizando no solo los datos de la acción a predecir, sino la correspondiente al conjunto de acciones presentes en el grupo al cual pertenece la acción, para cada tipo de agrupamiento. El objetivo de este proceso es mejorar la predicción de precios o rendimientos y generar a partir de ello recomendaciones de inversión. Para validar la estrategia propuesta, comparamos el efecto de los diferentes modelos de agrupamiento y predicción sobre los rendimientos generados por una estrategia de inversión. Comparamos asimismo estos resultados con los obtenidos a través de métodos tradicionales de inversión en los mercados de valores. Nuestros resultados muestran una ventaja en el uso de la información adicional proporcionada por los métodos de agrupación. Además, los métodos basados en Redes Neuronales resultan en una mayor tasa de rendimiento que aquellos basados en métodos tradicionales como ARIMA. Las principales contribuciones de esta tesis fueron introducir las series temporales derivadas de los balances financieros para realizar agrupamientos de datos y usar los resultados de estas agrupaciones para seleccionar así la información más útil para los modelos de ARIMA y Redes Neuronales.
Abstract:
In this thesis we propose the hypothesis that including information on stocks related to the stock to be predicted improves the quality of said prediction. These related stocks can be obtained through different clustering methods using information on prices, returns and ratios derived from quarterly balance sheets. The complete process is represented in figure 1.1. Our data set was based on the shares of companies listed on the US stock markets, within the 3000 companies with the largest market capitalization, listed in the Russell 3000 index. Within these companies, we have imposed two conditions: (i) that they have been listed and (ii) that they have presented balance sheets in the period from January 2017 to June 2022, giving us a total of 2,359 shares to work with. We use the quarterly balance sheets to generate 10 financial ratios and convert them into time series. We also use the usual series of closing prices and daily returns. With these sets of time series we cluster the companies represted with these characteristics using K-Means or K-Medoids with distances based on Dynamic Time Warping, Extended Frobenius Norm and on the Euclidean distance of the coefficients generated by fast Fourier transforms. The information derived from these clusterings allowed us to select the characteristics to provide to ARIMA and Neural Network models, using not only the data of the stock to be predicted, but also that corresponding to the set of stockss present in the cluster to which the stock belongs, for each type of clustering. The objective of this process is to improve the prediction of prices or returns and generate investment recommendations from it. To validate the proposed strategy, we compare the effect of different clustering and prediction models on the returns generated by an investment strategy. We also compare these results with those obtained through traditional investment methods in the stock markets. Our results show an advantage in using the additional information provided by clustering methods. Furthermore, methods based on Neural Networks result in a higher performance rate than those based on traditional methods such as ARIMA. The main contributions of this thesis were to introduce time series derived from financial balances to cluster stocks and use the results of these clusterings to select the most useful information for ARIMA and Neural Network models.
Citación:
---------- APA ----------
Vásquez Sáenz, Javier. (2023). Características basadas en agrupamiento de series temporales para predicción de valores de bolsa. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n7448_VasquezSaenz
---------- CHICAGO ----------
Vásquez Sáenz, Javier. "Características basadas en agrupamiento de series temporales para predicción de valores de bolsa". Tesis de Maestría, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2023.https://hdl.handle.net/20.500.12110/tesis_n7448_VasquezSaenz
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7448_VasquezSaenz.pdf