Ir al contenido

Documat


Small area estimation methods based on multivariate mixture models

  • Autores: Agne Bikauskaite
  • Directores de la Tesis: Domingo Morales González (dir. tes.) Árbol académico, Isabel Molina Peralta (dir. tes.) Árbol académico
  • Lectura: En la Universidad Complutense de Madrid ( España ) en 2025
  • Idioma: inglés
  • Número de páginas: 164
  • Títulos paralelos:
    • Métodos de estimación en áreas pequeñas basados en modelos de mixtura multivariantes
  • Tribunal Calificador de la Tesis: Leandro Pardo Llorente (presid.) Árbol académico, Alba María Franco Pereira (secret.) Árbol académico, Tomás Goicoa Mangado (voc.) Árbol académico, Ewa Strzalkowska-Kominiak (voc.) Árbol académico, María del Mar Rueda García (voc.) Árbol académico
  • Enlaces
  • Resumen
    • español

      Para estimar en áreas o dominios de una población, los estimadores directos ponderados por los pesos muestrales, que utilizan únicamente los datos del dominio en cuestión, no requieren hipótesis de modelos y son consistentes incluso bajo diseños muestrales complejos. Sin embargo, son apropiados solo para dominios o áreas con un tamaño de muestra lo suficientemente grande. Por ejemplo, al estimar una tasa de pobreza en un dominio con un tamaño de muestra pequeño (área pequeña), la volatilidad de un estimador directo podría hacer que esa área parezca muy pobre en un período y muy rica en el siguiente. Los estimadores de áreas pequeñas (o indirectos) se han desarrollado para reducir la inestabilidad de los estimadores directos, mediante la incorporación de información de otras áreas. Los estimadores de áreas pequeñas más populares se basan en modelos de regresión con efectos aleatorios de las áreas, como el modelo de regresión lineal con errores anidados. Sin embargo, las hipótesis habituales, que incluyen algún tipo de homogeneidad entre áreas, pueden no verificarse en la práctica, lo que conduciría a estimadores sesgados. Se propone un modelo más flexible para la estimación de parámetros generales en áreas pequeñas, basado en mixturas multivariantes de distribuciones normales que generaliza el modelo de regresión lineal con errores anidados. Esta flexibilidad hace que el modelo se adapte a situaciones reales más complejas, en las que puede haber áreas con un comportamiento diferente al de las otras, haciendo que el modelo sea menos restrictivo (por lo tanto, más cercano a un modelo no paramétrico) y más robusto frente a áreas atípicas. Adicionalmente, usando una mixtura con dos componentes (lo que puede interpretarse como la existencia de dos grupos latentes de áreas), se propone un procedimiento de selección de los efectos aleatorios de las áreas en el modelo con errores anidados específico para cada área, basado en los datos. Se asume que las áreas en uno de los grupos están generadas por un modelo de errores anidados coon efectos aleatorios de las áreas, y en otro grupo, por el modelo de regresión análogo que no incluye efectos aleatorios. Se consideran dos especificaciones diferentes del modelo de mixtura: una con los mismos coeficientes de regresión y varianza del error para las dos componentes de la mixtura, y otra con estos parámetros diferentes para cada componente. Se diseña un método expectation-maximization (E-M) para ajustar cada uno de los modelos propuesto. Bajo los modelos de mixtura propuestos, se introducen dos nuevos predictores alternativos de indicadores generales en áreas pequeñas. Se utiliza un método bootstrap paramétrico para estimar los errores cuadráticos medios de los predictores propuestos. Mediante estudios de simulación, se analizan las propiedades de los nuevos predictores y del procedimiento bootstrap, y la nueva metodología se ilustra a través de una aplicación a la estimación de indicadores de pobreza por localidades en Palestina.

    • English

      When estimating in areas or domains of a population, the usual survey-weighed direct estimators, which use only the domain-specific survey data, require no model assumptions and are consistent even under complex survey designs. Nevertheless, they are appropriate only for domains or areas with sufficiently large sample size. For example, when estimating a poverty rate in a domain with a small sample size (small area), the volatility of a direct estimator might make that area seem like very poor in one period and very rich in thenext one. Small area (or indirect) estimators have been developed to reduce the instability of direct estimators by borrowing strength from the other areas. Very popular small area estimators are those based on regression models with random area effects, such as the nested error linear regression model...


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno