Ir al contenido

Documat


PLS Generalized Linear Regression and Kernel Multilogit Algorithm (KMA) for Microarray Data Classification Problem

  • Autores: Adolphus Wagala, Graciela González Farías, Rogelio Ramos, Oscar Dalmau
  • Localización: Revista Colombiana de Estadística, ISSN-e 2389-8976, ISSN 0120-1751, Vol. 43, Nº. 2, 2020, págs. 233-249
  • Idioma: inglés
  • DOI: 10.15446/rce.v43n2.81811
  • Títulos paralelos:
    • Regresión lineal generalizada por MCP y algoritmo kernel multilogit para la clasificación de datos de microarreglos
  • Enlaces
  • Resumen
    • español

      Resumen Este estudio combina el modelo de regresión lineal generalizado por mínimos cuadrado parciales (RLGMCP), con regresión logística y análisis discriminante lineal, para obtener los modelos de regresión logística generalizada por mínimos cuadrados parciales, (RLGMCP) y regresión logística generalizada-discriminante por mínimos cuadrados parciales (RLGDMCP). Se realiza un estudio comparativo con clasificadores clásicos como, fc-vecinos más cercanos (KVC), análisis discriminante lineal (ADL), análisis discriminante de por mínimos cuadrados parciales (ADMCP), regresión por mínimos cuadrados parciales (RMCP) y máquinas de vectores de soporte de soporte vectorial (MSV). Además, se implementa una nueva metodología conocida como algoritmo de kernel multilogit (AKM). Su desempeño es comparado con los de los otros clasificadores. De acuerdo con las tasas de error de clasificación obtenidas a partir de los diferentes tipos de datos, el KMA es el de mejor resultado.

    • English

      Abstract This study involves the implentation of the extensions of the partial least squares generalized linear regression (PLSGLR) by combining it with logistic regression and linear discriminant analysis, to get a partial least squares generalized linear regression-logistic regression model (PLSGLR-log), and a partial least squares generalized linear regression-linear discriminant analysis model (PLSGLRDA). A comparative study of the obtained classifiers with the classical methodologies like the fc-nearest neighbours (KNN), linear discriminant analysis (LDA), partial least squares discriminant analysis (PLSDA), ridge partial least squares (RPLS), and support vector machines(SVM) is then carried out. Furthermore, a new methodology known as kernel multilogit algorithm (KMA) is also implemented and its performance compared with those of the other classifiers. The KMA emerged as the best classifier based on the lowest classification error rates compared to the others when applied to the types of data are considered; the un-preprocessed and preprocessed.

  • Referencias bibliográficas
    • Alon, U.,Barkai, N.,Notterman, D. A.,Gish, K.,Ybarra, S.,Mack, D.,Levine, A. J.. (1999). 'Broad patterns of gene expression revealed by...
    • Alshamlan, H. M.,Badr, G.,Alohali, Y.. (2013). A study of cancer microarray gene expression profile: Objectives and approaches. 'Proceedings...
    • Awada, W.,Khoshgoftaar, T. M.,Dittman, D.,Wald, R.,Napolitano, A.. (2012). A review of the stability of feature selection techniques for bioinformatics...
    • Bastien, P.,Vinzi, E. V.,Tenenhaus, M.. (2005). 'PLS generalised linear regression'. Computational Statistics and Data Analysis. 48....
    • Boulesteix, A. L.,Strobl, C.,Augustin, T.,Daumer, M.. (2008). 'Evaluating microarray-based classifiers: an overview'. Cancer informatics....
    • Chun, H.,Keles, S.. (2009). 'Sparse partial least squares regression for simultaneous dimension reduction and variable selection'....
    • Chung, D.,Keles, S.. (2010). 'Sparse partial least squares classification for high dimensional data'. Statistical Applications in...
    • Dalmau, O.,Alarcón, T. E.,González, G.. (2015). 'Kernel multilogit algorithm for multiclass classification'. Computational Statistics...
    • Dong, K.,Zhang, F.,Zhu, Z.,Wang, Z.,Wang, G.. (2014). 'Partial least squares based gene expression analysis in posttraumatic stress disorder'....
    • Dudoit, S.,Fridlyand, J.,Speed, T.. (2002). 'Comparison of discrimination methods for the classification of tumors using gene expression...
    • Fort, G.,Lambert-Lacroix, S.. (2005). 'Classification using partial least squares with penalized logistic regression'. Bioinformatics....
    • Gagnon-Bartsch, J. A.,Speed, T. P.. (2011). 'Using control genes to correct for unwanted variation in microarray data'. Biostatistics....
    • Gromski, S.,Muhamadali, H.,Ellis, D.,Xu, Y.,Correa, E.,Turner, M.,Goodcare, R.. (2015). 'A tutorial review: Metabolomics and partial least...
    • Gusnanto, A.,Ploner, A.,Shuweihdi, F.,Pawitan, Y.. (2013). 'Partial least squares and logistic regression random-effects estimates for...
    • Höskuldsson, A.. (1988). 'PLS regression methods'. Journal of Chemometrics. 2. 211
    • Huang, C. C.,Tu, S. H.,Huang, C. H.,Lien, H. H.,Lai, L. H.,Chuang, E.. (2013). 'Multiclass prediction with partial least square regression...
    • Lê Cao, K.,Rossouw, D.,Robert-Granieé, C.,Besse, P.. (2008). 'A Sparse PLS for variable selection when integrating omics data'. Statistical...
    • Lee, D.,Lee, W.,Lee, Y.,Pawitan, Y.. (2011). 'Sparse partial least-squares regression and its applications to high-throughput data analysis'....
    • Nguyen, D. V.,Rocke, D. M.. (2002). 'Multi-class cancer classification via partial least squares with gene expression profiles'. Bioinformatics....
    • Nguyen, D. V.,Rocke, D. M.. (2002). 'Tumor classification by partial least squares using microarray gene expression data'. Bioinformatics....
    • Telaar, A.,Liland, K.,Repsilber, D.,Nürnberg, G.. (2013). 'An extension of PPLS-DA for classification and comparison to ordinary PLS-DA'....
    • Wagala, A.. (2018). Problems in Statistical Genetics: Classification and Testing for Network Changes. Centro de Investigación en Matemáticas...
    • Wang, A.,An, N.,Chen, G.,Li, L.,Alterovitz, G.. (2015). 'Improving plsrfe based gene selection for microarray data classification'....
    • Wold, S.,Ruhe, A.,Wold, W.,Dunn III, W. J.. (1984). 'The collinearity problem in linear regression, the partial least squares approach...
    • Wold, S.,Sjöström, M.,Erikson, L.. (2001). 'PLS-regression: A basic tool of chemometrics.'. Chemometrics and Intelligent Laboratory...
    • Xi, B.,Gu, H.,Baniasadi, H.,Raftery, D.. (2014). 'Statistical analysis and modeling of mass spectrometry-based metabolomics data'....
Los metadatos del artículo han sido obtenidos de SciELO Colombia

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno