Registro:
Documento: | Tesis Doctoral |
Disciplina: | matematica |
Título: | Métodos robustos en correlación canónica funcional |
Título alternativo: | Robust inference in functional canonical correlation |
Autor: | Alvarez, Agustín |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Lugar de trabajo: | Departamento de Matemática
|
Publicación en la Web: | 2017-07-25 |
Fecha de defensa: | 2017-03-22 |
Fecha en portada: | 2017-01 |
Grado Obtenido: | Doctorado |
Título Obtenido: | Doctor de la Universidad de Buenos Aires en el área de Ciencias Matemáticas |
Departamento Docente: | Departamento de Matemáticas |
Director: | Boente Boente, Graciela Lina |
Director Asistente: | Kudraszow, Nadia Laura |
Jurado: | Agostinelli, Claudio; Svarc, Marcela; Yohai, Víctor |
Idioma: | Español |
Palabras clave: | CORRELACION CANONICA; DATOS FUNCIONALES; ESPACIOS APROXIMANTES; ROBUSTEZCANONICAL CORRELATION; FUNCTIONAL DATA; ROBUSTNESS; SIEVES |
Tema: | matemática/estadística y probabilidad
|
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6188_Alvarez.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n6188_Alvarez |
Ubicación: | MAT 006188 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Alvarez, Agustín. (2017). Métodos robustos en correlación canónica funcional. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez |
Resumen:
En diversas aplicaciones, resulta de interés poder medir la asociación entre dos características que se observan sobre los individuos de una población. Por otra parte, muchas vecesestas características se registran sobre un período de tiempo o corresponden a imágenes. Poresta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar dediscretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamenteutilizado para lograr este objetivo es el análisis de correlación canónica funcional. Leurgans et al. (1993) prueban que la extensión natural de los estimadores utilizados en elcaso multivariado al funcional no resulta consistente para la primera correlación canónica. Poresta razón, dichos autores proponen estimadores que penalizan la rugosidad de las direccionesy prueban que resultan consistentes. Por otro lado, He et al. (2003) dan condiciones quegarantizan la buena definición de las correlaciones y direcciones canónicas para elementosaleatorios (X; Y )^t a valores en el espacio de Hilbert L²(0, 1) x L² (0, 1). Los trabajos mencionados consideran como medida de asociación la correlación de Pearson. Sin embargo, es bien sabido, que esta medida es muy sensible a la presencia de datosatípicos. Con el fin de lidiar con este problema, en el caso multivariado, Branco et al. (2005)y Alfons et al. (2016) proponen estimadores utilizando un enfoque de projection-pursuit, esdecir, maximizando funcionales de asociación robustos de proyecciones de los datos. En esta tesis, consideramos espacios de Hilbert separables H1 y H2 y elementos aleatorios (X, Y )^t Є H = H1 x H2 y medidas de asociación bivariadas robustas. Para mostrarque la extensión natural del caso multivariado al caso funcional falla cuando se utiliza laextensión de los estimadores de projection-pursuit de Branco et al. (2005) al caso funcional,extendemos el resultado de Leurgans et al. (1993) al caso de medidas de asociación generales. Por otra parte, para proponer estimadores robustos y consistentes consideramos un enfoqueque combina projection-pursuit con el método de Sieves que aproxima el espacio infinito-dimensional H por subespacios de dimensión finita que crecen con el tamaño de muestra. Bajo condiciones de regularidad, obtenemos que los estimadores de las primeras direccionesy de la primera correlación canónica son consistentes al funcional asociado. Para identificarque representa dicho funcional, se muestra la consistencia Fisher de éstos cuando se utilizanmedidas de asociación que cumplan ciertas condiciones. En particular, las medidas de correlación robustas de uso habitual permiten obtener estimadores consistentes a la cantidadde interés en el caso de procesos Gaussianos o de procesos elípticos. Mediante un estudio desimulación, se compara el comportamiento de los estimadores robustos con los estimadoresbasados en la correlación de Pearson, para muestras finitas Gaussianas y contaminadas. Seproponen asimismo un procedimiento de convalidación cruzada robusta para elegir las dimensionesde los subespacios aproximantes y métodos para la detección de datos atípicos. Finalmente, se ilustra en un conjunto de datos reales las ventajas de los estimadores robustosya que permiten identificar los datos atípicos y proveen estimaciones confiables.
Abstract:
In many applications, measuring the association between two individual features is animportant issue. Besides, in many practical situations data are recorded over a period of timeor may correspond to images. In these situations, it is preferable to consider them as samplesof an stochastic process instead of working with the discretized trajectories as multivariatedata samples. A technique widely used to study the dependence between the two functionsrecorded for a sample of subjects is the functional canonical correlation analysis. Leurgans etal. (1993) demonstrated the need for regularization in functional canonical correlation analysis,since the natural extension of the multivariate estimators are not consistent. Leurgans etal. (1993) also derived the consistency of the estimators obtained penalizing the roughness. These results are complemented with those obtained in He et al. (2003) who provide conditionsensuring the existence and proper definition of the canonical directions and correlationswhen the random element belongs to L² (0, 1) x L² (0; 1). The aforementioned papers consider as association measure the Pearson correlation. However,it is well known that the Pearson correlation is not robust, being sensitive to outliersand this sensitivity is inherited by the canonical directions and correlations. In the multivariatecase, a robust approach was given by Branco et al. (2005) and Alfons et al. (2016)who proposed estimators using projection-pursuit, that is, maximizing a robust bivariateassociation measure over the projected data. In this thesis, we consider separable Hilbert spaces H1 and H2 and random elements (X, Y ) Є H = H1 x H2 as well as robust bivariate measures of association. To show thatthe natural extension from the multivariate case to the functional case fails when using theprojection-pursuit estimators of Branco et al. (2005), we generalize the result of Leurgans etal. (1993) to the case of general measures of association. On the other hand, to obtain robustand consistent estimators in a functional framework, we consider an approach that com6bines projection-pursuit with Sieves which approximate the infinite-dimensional space Hby means of finite-dimensional linear spaces growing with the sample size. Under regularityconditions, consistency results for the first canonical correlation and directions are derived. An important point to highlight is what the functional related to the proposed estimatorsrepresent, at least in some situations. For that purpose, Fisher consistency is obtained whenthe bivariate measure of association may be transformed to a Fisher-consistent bivariateassociation functional. In particular, the usual robust correlations allow to obtain consistentestimators of the quantities of interest when (X, Y )^t is a Gaussian or an elliptical process. Through a simulation study, we compare the performance of the robust proposals with theestimators based on the Pearson correlation, for clean and contaminated data. Furthermore,a robust cross-validation procedure is also proposed to select the dimension of the approximatinglinear spaces and outlier detection rules are studied. Finally, we illustrate on a realdata set the advantages of the robust estimators which allow identify outliers and providereliable estimates.
Citación:
---------- APA ----------
Alvarez, Agustín. (2017). Métodos robustos en correlación canónica funcional. (Tesis Doctoral. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez
---------- CHICAGO ----------
Alvarez, Agustín. "Métodos robustos en correlación canónica funcional". Tesis Doctoral, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2017.https://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6188_Alvarez.pdf