Ir al contenido

Documat


Generalized Poisson Hidden Markov Model for Overdispersed or Underdispersed Count Data

  • Autores: Sebastian George, Ambily Jose
  • Localización: Revista Colombiana de Estadística, ISSN-e 2389-8976, ISSN 0120-1751, Vol. 43, Nº. 1, 2020, págs. 71-82
  • Idioma: inglés
  • DOI: 10.15446/rce.v43n1.77542
  • Títulos paralelos:
    • Modelo oculto de Markov de Poisson generalizado para datos de recuento sobredispersados o subdispersos
  • Enlaces
  • Resumen
    • español

      Resumen El método estadístico más adecuado para explicar la dependencia serial en los datos de recuento de series de tiempo se basan en los modelos ocultos de Markov (HMM). Estos modelos suponen que las observaciones se generan a partir de un finito mezcla de distribuciones regidas por el principio de la cadena de Markov (MC). El modelo de Markov oculto de Poisson (P-HMM) puede ser el método ms utilizado para modelar las situaciones mencionadas anteriormente. Sin embargo, en el escenario de la vida real, este modelo no puede considerarse como la mejor opción. Teniendo en cuenta este hecho, nosotros, en este artículo, apostamos por la distribución generalizada de Poisson (GPD) para modelar datos de conteo. Este método puede rectificar la sobredispersión y subdispersión en el modelo de Poisson. Aqu desarrollamos Poisson generalizado Modelo de Markov oculto (GP-HMM) combinando GPD con HMM para modelando tales datos. Los resultados del estudio sobre datos simulados y una aplicación de datos reales, casos mensuales de leptospirosis en el estado de Kerala en South India, muestra buenas propiedades de convergencia, lo que demuestra que el GP-HMM Es un método mejor en comparación con P-HMM.

    • English

      Abstract The most suitable statistical method for explaining serial dependency in time series count data is that based on Hidden Markov Models (HMMs). These models assume that the observations are generated from a finite mixture of distributions governed by the principle of Markov chain (MC). Poisson-Hidden Markov Model (P-HMM) may be the most widely used method for modelling the above said situations. However, in real life scenario, this model cannot be considered as the best choice. Taking this fact into account, we, in this paper, go for Generalised Poisson Distribution (GPD) for modelling count data. This method can rectify the overdispersion and underdispersion in the Poisson model. Here, we develop Generalised Poisson Hidden Markov model (GP-HMM) by combining GPD with HMM for modelling such data. The results of the study on simulated data and an application of real data, monthly cases of Leptospirosis in the state of Kerala in South India, show good convergence properties, proving that the GP-HMM is a better method compared to P-HMM.

  • Referencias bibliográficas
    • Baum, L. E. (1972). An Inequality and Associated Maximization Technique in Statistical Estimation for Probabilistic Functions of Markov Processes....
    • Cepeda-Cuervo, E.,Cifuentes-Amado, M. V. (2017). Double Generalized Beta-Binomial and Negative Binomial Regression Models. Revista Colombiana...
    • Consul, P. C. (1989). Generalized Poisson Distributions: Properties and Applications. Dekker. New York.
    • Consul, P. C.,Jain, G. C. (1973). A Generalization of Poisson Distribution. Technometrics. 15. 791
    • Consul, P. C.,Shoukri, M. M. (1984). Maximum likelihood estimation for the generalized Poisson distribution. Communication in Statistics -...
    • Dempster, A. P.,Laird, N. M.,Rubin, D. B. (1977). Maximum Likelihood from Incomplete Data via the EM Algorithm. Journal of the Royal Statistical...
    • Greenwood, M. G.,Yule, G. U. (1920). An inquiry into the nature of frequency distributions representative of multiple happenings, with particular...
    • Joe, H.,Zhu, R. (2005). Generalized Poisson Distribution: the Property of Mixture of Poisson and Comparison with Negative Binomial Distribution....
    • Kendall, M.,Stuart, A. (1963). The Advanced Theory of Statistics. Hafner Publishing Co.. New York.
    • Neyman, J. (1931). On a new class of contagious distributions, applicable in entomology and bacteriology. Technometrics. 10. 35-57
    • Pereira, J. R.,Marques, L. A.,da Costa, J. M. (2012). An Empirical Comparison of EM Initialization Methods and Model Choice Criteria for Mixtures...
    • Sebastian, T.,Jeyaseelan, V.,Jeyaseelan, L.,Anandan, S.,George, S.,Bangdi-wala, S. (2019). Decoding and modelling of time series count data...
    • Tuenter, H. J. H. (2000). On the generalized Poisson distribution. Statistica Neerlandica. 54. 374
    • Wang, W.,Famoye, F. (1997). Modelling household fertility decisions with generalized Poisson regression. Journal of Population Economics....
    • Witowski, V.,Foraita, R. (2013). HMMpa: Analysing accelerometer data using hidden markov models.
    • Witowski, V.,Foraita, R.,Pitsiladis, Y.,Pigeot, I.,Wirsik, N. (2014). Using hidden Markov models to improve quantifying physical activity...
    • Zucchini, W.,MacDonald, I. L. (2009). Hidden Markov Models for Time Series: An Introduction Using R. Chapman and Hall. Boca Raton.
Los metadatos del artículo han sido obtenidos de SciELO Colombia

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno