Ir al contenido

Documat


Sobre la agrupación de niveles del factor explicativo en el modelo logit binario

  • ERNESTO PONSOT BALAGUER [1] ; SURENDRA SINHA [1] ; ARNALDO GOITÍA [1]
    1. [1] Universidad de Los Andes

      Universidad de Los Andes

      Colombia

  • Localización: Revista Colombiana de Estadística, ISSN-e 2389-8976, ISSN 0120-1751, Vol. 32, Nº. 2, 2009, págs. 157-187
  • Idioma: español
  • Títulos paralelos:
    • About joining explanation factor levels in the binary logit model
  • Enlaces
  • Resumen
    • español

      Se discute el efecto que se produce sobre el modelo logit binario con un único factor explicativo cuando el investigador decide agrupar algunos niveles de dicho factor. Con base en la parametrización de referencia y el modelo saturado se sugiere un procedimiento que, aprovechando los cómputos de un primer ajuste logit y corrigiendo el supuesto distribucional sobre la varianza, produce estimaciones más eficientemente y con mayor precisión que las que se producen si solo se decide reiterar un ajuste logit. Una vez colocado el tema en perspectiva, se desarrollan las ecuaciones que sustentan el procedimiento sugerido, apelando a la teoría asintótica. Se ilustra mediante un ejemplo la diferencia entre el procedimiento sugerido y el habitual y, con base en una extensa simulación, se muestran tendencias sólidas a favor del primero, en la medida en que las probabilidades de éxito de la variable respuesta (Y=1), asociadas con las categorías del factor explicativo incluidas en la agrupación, sean más disímiles entre sí.

    • English

      We discuss the effect that is produced on the binary logit model with one explanatory factor, when the researcher decides to join some levels of the factor. Based on the reference parametrization and the saturated model a procedure is suggested, that takes advantage of the calculations of the first adjustment and corrects the distribucional supposition around the variance. As a result, it produces estimations more efficiently and with more precision, than those which take place if it is decided to repeat the usual logit fit. Once placed the topic in perspective, we develop the equations that support the suggested procedure, based on asymptotic theory. We illustrate with an example the difference between the suggested procedure and the usual one. By developing an extensive simulation, some solid trends appear in favour of the first one, especially when the probabilities of success of the response (Y=1), associated with the categories of the explanatory factor included in the group, are less similar each other.

  • Referencias bibliográficas
    • Agresti, A.. (2007). An Introduction to Categorical Data Analysis. 2. John Wiley & Sons, Inc.. New Jersey.
    • Christensen, R.. (1997). Log-Linear Models and Logistic Regression. 2. Springer-Verlag. New York.
    • Christensen, R.. (2002). Plane Answers to Complex Questions. The Theory of Linear Models. 3. Springer-Verlag. New York.
    • Collett, D.. (2002). Modelling binary data. 2. Chapman & Hall/CRC. Boca Raton.
    • Cox, D. R.. (1970). Analysis of Binary Data. 1. Methuen and Co Ltd.. London.
    • Feller, W.. (1968). An Introduction to Probability Theory and Its Applications. 3. John Wiley & Sons. Inc.. New York.
    • Grizzle, J. E.,Starmer, C. F.,Koch, G. G.. (1969). 'Analysis of Categorical Data by Linear Models'. Biometrics. 25. 489-504
    • Hilbe, J. M.. (2009). Logistic Regression Models. 1. Chapman & Hall. Florida.
    • Hodges, J. L.,Le Cam, L.. (1960). 'The Poisson Approximation to the Poisson Binomial Distribution'. The Annals of Mathematical Statistics....
    • Hosmer, D. W.,Lemeshow, S.. (2000). Applied Logistic Regression. 2. John Wiley & Sons. New York.
    • Lehmann, E. L.. (1999). Elements of Large-Sample Theory. 1. Springer-Verlag. New York.
    • McCullagh, P.,Nelder, J.. (1989). Generalized Linear Models. 2. Chapman & Hall. London.
    • McCulloch, C. E.,Searle, S. R.. (2001). Generalized, Linear, and Mixed Models. 1. John Wiley & Sons, Inc.. New York.
    • Neammanee, K.. (2005). 'A refinement of Normal approximation to Poisson Binomial'. International Journal of Mathematics and Mathematical...
    • Nedelman, J.,Wallenius, T.. (1986). 'Bernoulli Trials, Poisson Trials, Surprising Variances, and Jensen's Inequality'. The American...
    • Nelder, J. A.,Wedderburn, R. W. M.. (1972). 'Generalized Linear Models'. Journal of the Royal Statistical Society. Serie A. 370-384
    • Neyman, J.. (1939). 'On a new class of contagious distributions, applicable in entomology and bacteriology'. The Annals of Mathematical...
    • Ollero, H. J.,Ramos, R. H. M.. (1991). 'La distribución hipergeométrica como binomial de poisson'. Trabajos de Estadística. 6. 35-43
    • Ponsot, E.. (2009). Estudio de la agrupación de niveles en el modelo logit.
    • Powers, D. A.,Xie, Y.. (1999). Statistical Methods for Categorical Data Analysis. 1. Academic Press.
    • R Development Core Team. (2007). 'R: a language and environment for statistical computing'.
    • Rodríguez, G.. (2008). 'Lectures notes about generalized linear models'.
    • Rohatgi, V.,Ehsanes, A.. (2001). An Introduction to Probability and Statistics. 2. John Wiley & Sons, Inc.. New York.
    • Roos, B.. (1999). 'Asymptotics and Sharp Bounds in the Poisson Approximation to the Poisson-Binomial Distribution'. Bernoulli. 5....
    • Sprott, D. A.. (1958). 'The Method of Maximum Likelihood Applied to the Poisson Binomial Distribution'. Biometrics. 14. 97-106
    • Wang, Y. H.. (1993). 'On the Number of Successes in Independent Trials'. Statistica Sinica. 3. 295-312
    • Weba, M.. (1999). 'Bounds for the Total Variation Distance between the Binomial and the Poisson Distribution in case of Medium-Sized Success...
    • Wedderburn, R. W. M.. (1974). 'Quasi-Likelihood Functions, Generalized Linear Models, and the Gauss-Newton Method'. Biometrika. 61....
Los metadatos del artículo han sido obtenidos de SciELO Colombia

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno