Ir al contenido

Documat


Estrategia de imputación con la media bajo el uso de árboles de regresión

  • Autores: Victor Ernesto Marquez Perez, Lelly Maria Useche Castro, Dulce María Mesa Avila, Ana Ides Chacon Contreras
  • Localización: Comunicaciones en Estadística, ISSN 2027-3355, ISSN-e 2339-3076, Vol. 10, Nº. 1, 2017, págs. 9-40
  • Idioma: español
  • DOI: 10.15332/s2027-3355.2017.0001.01
  • Títulos paralelos:
    • Imputation strategy with media using regression trees
  • Enlaces
  • Resumen
    • español

      Se presenta un diseño de imputacion en el que conjuga la clasicacion y la imputación con el fin de mejorar la calidad del dato imputado. La imputacion se lleva acabo para datos cuantitativos bajo perdida completamente aleatoria con el uso de arboles de regresion, comparando la tecnica de imputacion con la media teorica y empricamente con el uso de los arboles de regresion, con ello se busca desarrollar una estrategia integral de clasicacion e imputacion.Se obtuvieron estimadores insesgados desarrollando el valor esperado del estimador,se evaluaron las propiedades de los estimadores mediante el desarrollo de sus varianzas y sesgos, en el que se observo insesgamiento. En cuanto a la varianza del estimador insesgado de la media, no se probo suciencia para el estimador de la media.

    • English

       An imputation design is presented to combine classication and imputation in order to improve the quality of imputed datum. Imputation is done with completely randomized missing quantitative data and using regression trees. Media imputation techniques is compared, theoretical and empirically, using regression trees, in order to develop an integral classication and imputation strategy.Unbiased estimators were obtained developing the expected value of the estimator. Estimators proprieties were evaluated trough their variance and bias development, which showed non bias. as for the unbiased estimator variance of the media, suficiency was not proved for the media estimator. 

  • Referencias bibliográficas
    • Borgoni, R y Berrington, A. (2004). A sequential tree-based procedure for multivariate imputation of complex missing data structure. Recuperado...
    • Box, G.E.P. (1949), “A General Distribution theory for a class of likelihood Criteria”, Biometrika, 36, 317-346.
    • Breiman, L., Freidman, J.H., Olshen, R.A. & Stone, C.J. (1984) Classification and Regression Tree Pacific Grove, CA: Wadsworth.
    • Censo Agricola 1998 INE
    • Hansen, M., Hurwits, W., y Madow, W (1953) Sample survey Methods and Theory, vol 2 New York; J. Wiley & Sons, Inc. [139-141].
    • Lee, J.C., Chang, T.C., and Krishnaiah, P.R.(1977). “Approximations to the Distributions of the likelihood Ratio Statistics for testing certain...
    • Little, R y Rubin, D (1987): Statistical Analysis with Missing Data. Series in Probability and Mathematical Statistics. John Wiley & Sons,...
    • Mesa, D (2004). Imputación y Árboles de Decisión. Caracas, Venezuela. Guía práctica. Postgrado en Estadística, Universidad Central de Venezuela.
    • Rencher, A. 2002. Methods oh Multivariate Analysis. 2da ed. Wiley-Interscience. England.
    • Schafer, J. (1997) Analysis of incomplete multivariate data. Chapman & Hall, London
    • Useche, L y Mesa, D (2006). Una introducción a la imputación de valores perdidos. Revista Terra. No. 31-Vol XXII. 127-151.

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno