Ir al contenido

Documat


Curvas ROC y Vecinos Cercanos, Propuesta de un Nuevo Algoritmo de Condensación

  • Jiménez Padilla, Raquel [1] ; Cuevas Covarrubias, Carlos [1]
    1. [1] Universidad Anáhuac

      Universidad Anáhuac

      México

  • Localización: Revista de Matemática: Teoría y Aplicaciones, ISSN 2215-3373, ISSN-e 2215-3373, Vol. 18, Nº. 1, 2011, págs. 21-32
  • Idioma: español
  • DOI: 10.15517/rmta.v18i1.2112
  • Enlaces
  • Resumen
    • español

      Los criterios k-NN son algoritmos no paramétricos de clasificación estadística. Son precisos, versátiles y libres de distirbució. Sin embargo su costo computacional puede ser demasiado alto; especialmente con tamaños de muestra grandes. Presentamos un nuevo algoritmo de condensación que, basado en el modelo Binormal para curvas ROC, permite transformar la base de entrenamiento en un conjunto pequeño de vectores de baja dimensión. A diferencia de otras técnicas escritas en la literatura, nuestra propuesta permite controlar el intercambio de precisión por reducción de la base de entrenamiento. Un estudio de Monte Carlo muestra que el desempeño del método popuesto puede ser muy competente, superando en diversos escenarios realistas al de otros métodos frecuentemente utilizados.

    • English

      k-NN criteria are non parametric methods of statistical classificaction. They are accurate, versatile and distribution free. However,  their computational cost may be too expensive; especially for large sample sizes. We present a new condensation algorithm based on the Binormal model for ROC curves. It transforms the training sample into a small set of low dimensional vetors. Contrasting with other condensation techniques described in the literature, our proposal helps to control the exchange of accuracy for condensation onthe training sample. The results of a Monte Carlo study show that its performance can be very competitive in different realistic scenarios, resulting in better training samples than other frequently used methods.

  • Referencias bibliográficas
    • Bamber, D. (1975) “The area above the ordinal dominance graph and the area below the receiver operating characteristic graph”, Journal of...
    • Cuevas-Covarrubias, C. (2003) Statistical Inference for ROC Curves. Tesis de Doctorado, Departamento de Estadística, Universidad de Warwick,...
    • Cuevas-Covarrubias, C.; Monroy, V.; Ortega, V. (2008) “Aplicación de un algoritmo k -NN para la gestión del capital humano. Predicción...
    • Dorfman, D.D.; Alf, E. Jr. (1969) “Maximum likelihood estimation of parameters of signal-detection theory and determination of confidence...
    • 3): 487–496.
    • Guo, G.; Wang, H.; Bell, D.; Bi, Y.; Greer, K. (2003) “KNN model-based approach in classification”, in: On The Move to Meaningful Internet...
    • Hand, D.J. (1994) “Assessing classification rules”, Journal of Applied Statistics 21: 3–16.
    • Hanley, J.A.; McNeil, B.J. (1982) “The meaning and use of the area under the under a receiver operating characteristic (ROC) curve”, Radiology...
    • Henley, W.E.; Hand, D.J. (1996) “A k-nearest-neighbour classifier for assessing consumer credit risk”, The Statistician, 45(1): 77–95.
    • Krzanowski, W.J.; Hand, D.J. (2009) ROC Curves for Continuous Data. Chapman & Hall/CRC, Londres, Reino Unido.
    • Zweig, M.H.; Campbell, G. (1993) “Receiver operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine”, Clin....

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno