Ir al contenido

Documat


Resumen de Local depth functions and applications to clustering

Giacomo Francisci

  • español

    En la primera parte de esta tesis revisamos las funciones de profundidad y de los cuantiles multidimensionales. Complementamos los resultados existentes en la literatura con nuevos conocimientos matemáticos sobre la teoría general de las funciones estadísticas de profundidad. Mientras que las funciones de profundidad se utilizan para describir las características globales de distribuciones multidimensionales, las funciones de profundidad local (FPL) también detectan características locales como las modas y las zonas de baja probabilidad. Presentamos una clase general de funciones de profundidad local y estudiamos sus propiedades. En particular, mostramos que, a medida que el parámetro de localización diverge hacia el infinito, las FPL convergen a las funciones de profundidad, mientras que, cuando el parámetro de localización converge a cero, bajo la escala adecuada, las FPL convergen a la función de densidad correspondiente. Bajo ciertas hipótesis de diferenciabilidad, también obtenemos convergencia de sus derivadas. Esto abre la puerta a una serie de aplicaciones que incluyen la clasificación no supervisada, estimación de modas y de conjuntos de nivel. En particular, proponemos un nuevo algoritmo de clasificación no supervisada haciendo uso de FPL escalados. Finalmente, ilustramos el comportamiento muestral, finito, de las metodologías propuestas mediante experimentos numéricos y análisis de datos.

  • English

    In the first part of this thesis we review depth functions and multidimensional quantiles. We complement results from the literature with new mathematical insights into the general theory of statistical depth functions. While depth functions are used to describe the global features of multidimensional distributions, local depth functions (LDFs) can also detect local features such as modes and regions with low probability mass. We introduce a general class of local depth functions and study its properties. Specifically, we show that, as the localizing parameter diverges to infinity, LDFs converge to depth functions, whereas, as the localizing parameter converges to zero and under appropriate scaling, LDFs converge to the underlying density. Under appropriate differentiability assumptions, we also obtain convergence of its derivatives. This opens the door to a series of applications including clustering, mode estimation, and upper level set estimation. In particular, we propose a new clustering algorithm via scaled LDFs. Finally, we illustrate the finite sample behavior of the proposed methods via numerical experiments and data analyses.


Fundación Dialnet

Mi Documat