Local depth functions and applications to clustering
Funciones de profundidad local y aplicaciones a clasificación no supervisada
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/24367Registro completo
Mostrar el registro completo DCAutoría
Francisci, GiacomoFecha
2022-02-04Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Estadística no paramétrica
Clasificación no supervisada
Profundidad estadística de datos
Estadística multivariante
Nonparametric Statistic
Clustering
Statistical data depth
Multivariate statistics
Resumen/Abstract
RESUMEN En la primera parte de esta tesis revisamos las funciones de profundidad y de los cuantiles multidimensionales. Complementamos los resultados existentes en la literatura con nuevos conocimientos matemáticos sobre la teoría
general de las funciones estadísticas de profundidad. Mientras que las funciones de profundidad se utilizan para describir las características globales de distribuciones multidimensionales, las funciones de profundidad local (FPL) también detectan características locales como las modas y las zonas de baja probabilidad. Presentamos una clase general de funciones de profundidad local y estudiamos sus propiedades. En particular, mostramos que, a medida que el parámetro de localización diverge hacia el infinito, las FPL convergen a las funciones de profundidad, mientras que, cuando el parámetro de localización converge a cero, bajo la escala adecuada, las FPL convergen a la función de densidad correspondiente. Bajo ciertas hipótesis de diferenciabilidad, también obtenemos convergencia de sus derivadas. Esto abre la puerta a una serie de aplicaciones que incluyen la clasificación no supervisada, estimación de modas y de conjuntos de nivel. En particular, proponemos un nuevo algoritmo de clasificación no supervisada haciendo uso de FPL escalados. Finalmente, ilustramos el comportamiento muestral, finito, de las metodologías propuestas mediante experimentos numéricos y análisis de datos.
ABSTRACT In the first part of this thesis we review depth functions and multidimensional
quantiles. We complement results from the literature with new mathematical insights
into the general theory of statistical depth functions. While depth functions are used
to describe the global features of multidimensional distributions, local depth
functions (LDFs) can also detect local features such as modes and regions with low
probability mass. We introduce a general class of local depth functions and study its
properties. Specifically, we show that, as the localizing parameter diverges to infinity,
LDFs converge to depth functions, whereas, as the localizing parameter converges
to zero and under appropriate scaling, LDFs converge to the underlying density.
Under appropriate differentiability assumptions, we also obtain convergence of its
derivatives. This opens the door to a series of applications including clustering,
mode estimation, and upper level set estimation. In particular, we propose a new
clustering algorithm via scaled LDFs. Finally, we illustrate the finite sample behavior
of the proposed methods via numerical experiments and data analyses.
Colecciones a las que pertenece
- D21 Tesis [20]
- EDUC Tesis [544]