Ir al contenido

Documat


Aggregation of Explanatory Factor Levels in a Binomial Logit Model: Generalization to the Multifactorial Unsaturated Case

  • ERNESTO PONSOT-BALAGUER [1] ; SURENDRA SINHA [2] ; ARNALDO GOITÍA [2]
    1. [1] Universidad de Los Andes

      Universidad de Los Andes

      Colombia

    2. [2] FACES-ULA Instituto de Estadística Aplicada y Computación (IEAC) Programa de Doctorado en Estadística
  • Localización: Revista Colombiana de Estadística, ISSN-e 2389-8976, ISSN 0120-1751, Vol. 35, Nº. 1, 2012, págs. 139-166
  • Idioma: inglés
  • Títulos paralelos:
    • La agregación de niveles en un factor explicativo del modelo logit binomial: generalización al caso multifactorial no saturado
  • Enlaces
  • Resumen
    • español

      Se discute la situación en la que, una vez ajustado un modelo logit a los datos contenidos en una tabla de contingencia, se selecciona un factor cualquiera de los participantes y se agregan algunos de sus niveles. Generalmente los investigadores proceden a postular nuevamente un modelo logit sobre los datos agrupados, sin embargo, este proceder conduce a la violación del supuesto distribucional original, cuando las probabilidades de éxito de las variables aleatorias de la agregación, son disímiles. En este trabajo se sugiere un procedimiento alternativo que opera en el marco del modelo logit binomial no saturado, multifactorial. Con base en la teoría asintótica y aprovechando la disminución en la varianza cuando se postula el modelo distribucional correcto, el procedimiento sugerido mejora apreciablemente las estimaciones, reduce el error estándar, produce valores residuales más cercanos al cero y menores probabilidades de rechazo en la prueba de bondad del ajuste del modelo. Sustentan tales afirmaciones tanto los desarrollos teóricos necesarios, como los resultados de una extensa simulación diseñada al efecto. También se expone el procedimiento sugerido contrastado con el habitual, mediante un ejemplo numérico completo.

    • English

      We discuss a situation in which, once a logit model is fitted to the data in a contingency table, some factor levels are grouped. Generally, researchers reapply a logit model on the pooled data, however, this approach leads to the violation of the original distributional assumption, when the probabilities of success of the random variables of aggregation differ. In this paper we suggest an alternative procedure that operates under the unsaturated, multifactorial, binomial, logit model. Based on asymptotic theory and taking advantage of the decrease in the variance when the correct distributional assumption is made, the suggested procedure significantly improves the estimates, reduces the standard error, produces lower residuals and is less likely to reject the goodness of fit test on the model. We present the necessary theory, the results of an extensive simulation designed for this purpose, and the suggested procedure contrasted with the usual approach, through a complete numerical example.

  • Referencias bibliográficas
    • Christensen, R.. (2002). Plain Answers to Complex Questions. The Theory of Linear Models. 3. Springer-Verlag. Nueva York.
    • Graybill, F.. (1969). Introduction to Matrices with Applications in Statistics. 1. Wadsworth Publishing. California.
    • Hilbe, J. M.. (2009). Logistic Regression Models. 1. Chapman & Hall. Florida.
    • Hosmer, D. W.,Lemeshow, S.. (2000). Applied Logistic Regression. 2. John Wiley & Sons. Nueva York.
    • Lehmann, E. L.. (1999). Elements of Large-Sample Theory. 1. Springer-Verlag. Nueva York.
    • McCullagh, P.,Nelder, J.. (1989). Generalized Linear Models. 2. Chapman & Hall. London.
    • Menard, S.. (2010). Logistic Regression: From Introductory to Advanced Concepts and Applications. 1. SAGE Publications, Inc.. California.
    • Nelder, J. ..,Wedderburn, R. W. M.. (1972). 'Generalized Linear Models'. Journal of the Royal Statistical Society. Serie A. 370-384
    • Ponsot, E.. (2011). Estudio de la Agrupación de Niveles en el Modelo Logit.
    • Ponsot, E.,Sinha, S.,Goitía, A.. (2009). 'Sobre la agrupación de niveles del factor explicativo en el modelo logit binario'. Revista...
    • (2007). R Development Core Team, R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. Vienna.
    • Rodríguez, G.. (2008). 'Lectures notes about generalized linear models'.
    • (2004). SAS Institute Inc., SAS/STAT(R) 9.1 User's Guide. SAS Institute Inc.. Carolina del Norte.
    • Searle, S.,Casella, G.,McCulloch, C.. (2006). Variance Components. 1. John Wiley and Sons, Inc.. Nueva Jersey.
Los metadatos del artículo han sido obtenidos de SciELO Colombia

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno