Registro:
Documento: | Tesis Doctoral |
Título: | Una medida de profundidad local para datos en espacios de Banach |
Título alternativo: | A local depth measure for data in Banach spaces |
Autor: | Fernández Piana, Lucas Raúl |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Lugar de trabajo: | Universidad de Buenos Aires - CONICET. Instituto de Investigaciones Matemáticas "Luis A. Santaló" (IMAS)
|
Publicación en la Web: | 2022-04-05 |
Fecha de defensa: | 2018-03-12 |
Fecha en portada: | 2018 |
Grado Obtenido: | Doctorado |
Título Obtenido: | Doctor de la Universidad de Buenos Aires en el área de Ciencias Matemáticas |
Departamento Docente: | Departamento de Matemáticas |
Director: | Svarc, Marcela |
Consejero: | Boente Boente, Graciela Lina |
Jurado: | Armendáriz, María Inés; Forzani, Liliana María; Cuevas, Antonio |
Idioma: | Español |
Palabras clave: | MEDIDAS DE PROFUNDIDAD; ANALISIS DE CLUSTER; DATOS FUNCIONALES; PROCEDIMIENTOS BASADOS EN PROYECCIONESDATA DEPTH; CLUSTER ANALYSIS; FUNCTIONAL DATA; PROJECTION PROCEDURES |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6983_FernandezPiana.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n6983_FernandezPiana |
Ubicación: | MAT 006983 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Fernández Piana, Lucas Raúl. (2018). Una medida de profundidad local para datos en espacios de Banach. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana |
Resumen:
Las profundidades juegan un rol importante cuando analizamos conjuntos de datos complejos, como datos funcionales o datos en dimensión alta. El principal objetivo de una medida de profundidad es dar un orden del centro hacia afuera generalizando el concepto de mediana. Además son útiles para describir distintas características de la distribución subyacente de los datos. Inclusive son utilizadas como herramientas en distintos problemas de inferencia como tests de posición y simetría, clasificación, detección de datos atípicos, etc. Sin embargo, dado que una de sus principales características es que el valor de la profundidad decrece sobre cada semirrecta con origen en el centro, no pueden capturar información relevante cuando la distribución estudiada es multimodal o no tiene soporte convexo. Con el objetivo de captar estas características locales, en los últimos años, se han introducido distintas definiciones de profundidad local: Agostinelli y Romanazzi (2), Paindaveine y Van Bever (44) y Agostinelli (1). La idea es restringir la profundidad global a un entorno de cada punto del espacio. En este sentido una profundidad local debe comportarse como una profundidad global condicionada al entorno. Nuestro objetivo es dar una definición general de profundidad local para elementos aleatorios en una espacio de Banach extendiendo la definición de profundidad global dada por Cuevas y Fraiman (14), donde proponen la Profundidad Dual Integrada (IDD). Nosotros definiremos la Profundidad Local Dual Integrada (IDLD). Estudiaremos cómo las propiedades clásicas, introducidas por Zuo y Serfling (57), deben ser adaptadas en este nuevo contexto. Probaremos que bajo condiciones de regularidad nuestra propuesta cumple esas propiedades. Además, mostraremos resultados de consistencia fuerte para la versión empírica de la IDLD y para las regiones de profundidad local. La mayor ventaja de nuestra propuesta es su flexibilidad para lidiar con datos en contextos generales y su bajo costo computacional, lo cual la vuelve apta para el análisis de datos en alta dimensión. Como una aplicación natural, propondremos un procedimiento de clusters basado en profundidades locales y mostraremos su muy buen desempeño con datos simulados y datos reales para distintas clases de los mismos: multivariados, funcionales, funcionales multidimensionales y mixtos.
Abstract:
Data depth measures play an important role when analyzing complex data, such as functional or high dimensional data. The main goal of depth measures is to a give center-outer order of the data, generalizing the concept of median to general settings. Depth measures are also useful to describe different features of the underlying distribution of the data. Moreover, they are powerful tools to deal with several inference problems such as location and symmetry tests, classification, outlier detection, etc. Nonetheless, since one of their major characteristics is that the depth values decrease along any half-line ray from the center, they are not suitable to capture distribution characteristics when data are multimodal or have non-convex support. Hence, with the aim of revealing local features of the underlying distribution in the last few years several definitions of local depths have been introduced: Agostinelli and Romanazzi (2), Paindaveine and Van Bever (44) and Agostinelli (1). The basic idea is to restrict a global depth measure to a neighborhood of every point of the space. In that way, a local depth measure should behave as a global depth measure conditional to neighborhoods of the different points. Our goal is to give a general definition of local depth for random elements in a Banach space, extending the definition of global depth given by Cuevas and Fraiman (14), where they introduce the Integrated Dual Depth (IDD). We define the Integrated Dual Local Depth (IDLD). We study how the classical properties, introduced by Zou and Serfling (57), should be analyzed within the framework of local depth. We prove, under mild regularity conditions, that our proposal enjoys those properties. Moreover, uniform strong consistency results are exhibited for the definition of the empirical local depth of to the population counterpart, and also for the local depth regions. The main advantages of our proposals are its flexibility in dealing with general data and also its low computational cost, which enables it to work with high-dimensional data. As a natural application, we propose a clustering procedure based on local depths, and illustrate its promising performance with synthetic and real data, for different kind of data: multivariate, functional, functional multidimensional and mixed.
Citación:
---------- APA ----------
Fernández Piana, Lucas Raúl. (2018). Una medida de profundidad local para datos en espacios de Banach. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana
---------- CHICAGO ----------
Fernández Piana, Lucas Raúl. "Una medida de profundidad local para datos en espacios de Banach". Tesis Doctoral, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2018.https://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6983_FernandezPiana.pdf