Belen Pulido
El análisis de datos funcionales ha ganado relevancia en los últimos años debido al aumento de los datos que se generan y que son susceptibles de ser considerados funciones. Esta rama de la estadística se centra en el análisis de datos que evolucionan de forma continua, representados generalmente como funciones. Sus aplicaciones son amplias, abarcando áreas como la medicina, el medio ambiente, las finanzas y el análisis de imágenes. Muchas técnicas de análisis de datos, muy estudiadas para datos multivariantes, han sido extendidas al ámbito funcional, existiendo en la literatura muchos trabajos dedicados a este respecto. Cuando cada observación tiene asociada más de una función, se habla de datos funcionales multivariantes. El análisis de este tipo de datos es más complejo debido a la necesidad de tener en cuenta la dependencia entre las distintas dimensiones de los datos. En esta tesis se desarrollan técnicas no supervisadas para datos funcionales univariantes y multivariantes, basadas en los índices epigraph e hypograph. Se introducen nuevas formulaciones de estos índices en una y varias dimensiones, y se presentan dos metodologías novedosas: EHyClus, para clustering, y EHyOut, para detección de outliers. La idea principal detrás de las metodologías propuestas en esta tesis se puede resumir en cuatro puntos clave: (i) suavizar los datos, (ii) reducir la dimensión, utilizando para ello los índices epigraph e hypograph, (iii) aplicar técnicas multivariantes para el problema que se aborde y (iv) elegir la mejor opción dentro de las distintas combinaciones de métodos e índices posibles. Finalmente, se aplican estas metodologías a conjuntos de datos reales y simulados y se comparan sus resultados, tanto en la bondad de la clasificación como en los tiempos de ejecución, resultando una buena alternativa a otros métodos disponibles en la literatura por sus buenos resultados.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados