Javier Palarea Albaladejo
La mayoría de problemas de análisis de datos conllevan la estimación de los parámetros desconocidos de un modelo probabilístico a partir de la observación de variables que representan las características medidas por el investigador para distintos casos, Por diversas razones, es habitual en la práctica que algunos vectores de características se observen de forma parcial o incompleta. El problema que se plantea entonces es cómo realizar la inferencia basándose en información parcialmente observada.
Considerando un contexto multivariante con variables continuas y con un patrón de no respuesta arbitrario, en este trabajo de investigación se estudian las principales alternativas, tanto heurísticas como aquellas apoyadas en modelos, para abordar el análisis de datos incompletos, destacando el papel relevante que en este ámbito juegan los métodos de Monte Carlo basados en cadenas de Markov (algoritmos MCMC). La parte final se centra en una clase especial de datos incompletos que surge en el análisis de datos de tipo composicional mediante la metodología log-cociente: los ceros por redondeo.
El capítulo 1 sirve como introducción al análisis de datos multidimensionales incompletos y establece el marco teórico. El capítulo 2 se ocupa de los algoritmos MCMC y en él se fundamentan y desarrollan los dos esquemas MCMC básicos: el algoritmo de Metropolis-Hastings y el muestreador de Gibbs; al tiempo que se presentan algunos de los recientes avances en este campo. En el capítulo 3 se estudian en profundidad los métodos paramétricos basados en verosimilitudes: el algoritmo EM y el método de imputación múltiple. Con el objetivo de evaluar el rendimiento de las diferentes estrategias analizadas bajo distintas hipótesis, se diseña y ejecuta un experimento de simulación que pone de manifiesto la conveniencia de emplear métodos paramétricos basados en verosimilitudes.
Por último, el capítulo 4 de esta memoria se dedica al análisis de datos com
© 2008-2024 Fundación Dialnet · Todos los derechos reservados