Ir al contenido

Documat


Resumen de Mejoras en reglas de clasificación mediante incorporación de información adicional

David Conde del Río

  • Las aportaciones contenidas en esta tesis (compendio de publicaciones) se enmarcan dentro del análisis discriminante cuando se dispone de información adicional sobre los parámetros.

    En Conde et al. (2005) consideramos una regla de clasificación para poblaciones exponenciales cuando hay un orden entre los parámetros, y probamos que se comporta mejor que la basada en la verosimilitud sin restricciones. Estudiamos su comportamiento en cada una de las poblaciones, consideramos la incorporación de datos con censura de tipo II, y evaluamos la regla para más de dos poblaciones.

    En Conde et al. (2012) presentamos reglas de clasificación con restricciones para más de dos poblaciones normales, y ofrecemos evidencia empírica que demuestra que la metodología con restricciones propuesta se comporta mejor que la metodología sin restricciones existente.

    En Conde et al. (2013) comprobamos que estas reglas con restricciones compiten bien en escenarios de alta dimensionalidad bajo varios de los criterios más utilizados en la actualidad, y completamos su estudio mediante la evaluación de su rendimiento para una muestra de entrenamiento dada, proponiendo 4 nuevos estimadores de la tasa de error verdadero.

    La mejora de estas reglas con restricciones puede ser muy significativa cuando la muestra de entrenamiento no verifica varias de las restricciones. Se recomienda su uso en la práctica, así como incorporar cuanta información se disponga.

    -Conde, D., Fernández, M. A., Salvador, B. (2005). A classification rule for ordered exponential populations. Journal of Statistical Planning and Inference 135 (2), 339-356.

    -Conde, D., Fernández, M. A., Rueda, C., Salvador, B. (2012). Classification of samples into two or more ordered populations with application to a cancer trial. Statistics in Medicine 31, 3773-3786.

    -Conde, D., Salvador, B., Rueda, C., Fernández, M. A. (2013). Performance and estimation of the true error rate of classification rules built with additional information. An application to a cancer trial. Statistical Applications in Genetics and Molecular Biology 12 (5), 583-602.

    -Fernández, M. A., Rueda, C., Salvador, B. (2006). Incorporating additional information to normal linear discriminant rules. Journal of the American Statistical Association 101 (474), 569-577.

    -Salvador, B., Fernández, M. A., Martín, I., Rueda, C. (2008). Robustness of classification rules that incorporate additional information. Computational Statistics & Data Analysis 52, 2489-2495.


Fundación Dialnet

Mi Documat