Registro:
Documento: | Tesis de Maestría |
Título: | Escalado multidimensional métrico en problemas con grandes datos |
Título alternativo: | Multidimensional scaling in big data |
Autor: | Cosatto Ammann, Pedro Camilo |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la Web: | 2023-11-09 |
Fecha de defensa: | 2023-07-31 |
Fecha en portada: | 31 de julio de 2023 |
Grado Obtenido: | Maestría |
Título Obtenido: | Magíster de la Universidad de Buenos Aires en el área de Estadística Matemática |
Departamento Docente: | Departamento de Matemáticas |
Director: | Rodríguez, Daniela Andrea |
Jurado: | Forzani, Liliana María; Laplagne, Santiago Jorge; Martínez, Alejandra Mercedes |
Idioma: | Español |
Palabras clave: | ESCALADO MULTIDIMENSIONAL; ESCALADO CLASICO; GRANDES DATOS; REDUCCION DE LA DIMENSION; TRANSFORMACIONES DE PROCRUSTES; INTERPOLACION; APRENDIZAJE NO SUPERVISADOMULTIDIMENSIONAL SCALING; CLASSICAL SCALING; BIG DATA; DIMENSIONALITY REDUCCION; PROCRSUTES TRANSFORMATIONS; INTERPOLATION; UNSUPERVISED LEARNING |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7398_CosattoAmmann.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n7398_CosattoAmmann |
Ubicación: | EST 007398 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Cosatto Ammann, Pedro Camilo. (2023). Escalado multidimensional métrico en problemas con grandes datos. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann |
Resumen:
En este trabajo describimos y aplicamos métodos de escalado multidimensional (MDS) para muestras con gran cantidad de datos. El escalado multidimensional es un conjunto de técnicas de representación de objetos basadas en las distancias, similaridades o disimilaridades entre ellos. Estos métodos tienen severas limitaciones cuando el tamaño de la muestra aumenta, debido a las dificultades de cómputo. Analizamos tres algoritmos distintos para sortear este problema: dos de ellos basados en la idea de división y conquista, y uno de ellos basado en un método de interpolación. Luego, aplicamos uno de ellos a un problema de agrupamiento. Los métodos estudiados logran reproducir con gran exactitud y precisión la solución que se obtendría con los métodos clásicos, aunque se descubrieron algunos aspectos a mejorar, especialmente con la aparición de datos atípicos. Por lo realizado en el problema de aplicación, creemos que estas variantes aportan ventajas al MDS como método de reducción de la dimensión, poniéndolo al mismo nivel que otras técnicas comúnmente usadas en el tratamiento de muestras grandes, como el análisis de Componentes Principales o t-SNE.
Abstract:
In this work, we describe and apply multidimensional scaling (MDS) methods with large samples. Multidimensional scaling is a set of object representation techniques based on distances, similarities, or dissimilarities between them. These methods have severe limitations when the sample size increases, due to computational difficulties. We analyze three different algorithms to overcome this problem: two of them based on the idea of ’divide and conquer’, and one of them based on an interpolation method. Then, we apply one of them to a clustering problem. The studied methods accurately and precisely reproduce the solution that would be obtained with classic methods, although some aspects to improve were discovered, especially with the appearance of outliers. Based on the application problem, we believe that these variants provide advantages to MDS as a dimension reduction method, putting it at the same level as other techniques commonly used in the treatment of large samples, such as Principal Component Analysis or t-SNE.
Citación:
---------- APA ----------
Cosatto Ammann, Pedro Camilo. (2023). Escalado multidimensional métrico en problemas con grandes datos. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann
---------- CHICAGO ----------
Cosatto Ammann, Pedro Camilo. "Escalado multidimensional métrico en problemas con grandes datos". Tesis de Maestría, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2023.https://hdl.handle.net/20.500.12110/tesis_n7398_CosattoAmmann
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7398_CosattoAmmann.pdf