Ir al contenido

Documat


Predictor de interacciones entre estructuras secundarias de proteínas

  • Julio César Quintana-Zaez [2] ; Nicolás Quintana-Bernabé [2] ; Raúl Giráldez Rojo [1] Árbol académico ; Reinaldo Molina-Ruiz [1] ; Cosme E. Santiesteban-Toca [3]
    1. [1] Universidad Central de Las Villas

      Universidad Central de Las Villas

      Cuba

    2. [2] Universidad Máximo Gómez Báez de Ciego de Ávila Facultad de Informática
    3. [3] Centro de Bioplantas Departamento de Informática
  • Localización: Revista Cubana de Ciencias Informáticas, ISSN-e 2227-1899, Vol. 11, Nº. 3, 2017
  • Idioma: español
  • Títulos paralelos:
    • Predictor of interactions between secondary protein structures
  • Enlaces
  • Resumen
    • English

      Los métodos de predicción de mapas de contacto son un paso intermedio para la predicción de estructuras de proteínas. A pesar de los avances logrados la precisión de las predicciones continúa por debajo del umbral deseado. Una vía mediante la cual el desempeño de estos métodos puede ser elevado es realizando la predicción de las interacciones entre estructuras secundarias. En este artículo se realiza un estudio de la influencia de las interacciones en el plegamiento de las proteínas. Donde, se propone un novedoso meta multiclasificador basado en árboles de decisión para predecir dichas interacciones. El método consiste en un esquema que combina el resultado de diferentes multiclasificadores especializados en las interacciones en el mapa de contacto final. El conjunto de proteínas empleado para validar el modelo contó con 2020 elementos y fue dividido en cuatro particiones, con respecto a su tamaño. La capacidad de generalización promedio alcanzada para los cuatro grupos de proteínas es de 51% de precisión, con una sensibilidad de 74%. El mejor desempeño del algoritmo se logró en proteínas de tamaño medio donde se alcanzó un 55% de precisión.

    • English

      The methods for the prediction of contact maps are an intermediate step for the prediction of protein structures. Despite the progress made, the accuracy of the predictions continues below the desired threshold. One way in which the performance of these methods can be heightened is by predicting the interactions between secondary structures. In this paper, we study the influence of interactions in the folding of proteins where we propose a novel multi-class goal based on decision trees to predict such interactions. The method consists of a scheme that combines the result of different specialized multiclassifiers into the interactions in the final contact map. The set of proteins used to validate the model counted on 2020 elements and were divided into four partitions, with respect to their size. The average generalization capacity achieved for all four protein groups is 51% accuracy, with a sensitivity of 74%. The best performance of the algorithm was attained in medium-sized proteins where 55% accuracy was achieved.

  • Referencias bibliográficas
    • ABU-DOLEH, A.A,AL-JARRAH, O.M,ALKHATEEB, A. Protein contact map prediction using multi-stage hybrid intelligence inference systems..
    • ANDONOV, R,MALOD-DOGNIN, N,YANEV, N. Maximum Contact Map Overlap Revisited. 27-41
    • ASHKENAZY, H,UNGER, R,KLIGER, Y. Hidden conformations in protein structures. 1941-1947
    • CHAMORRO, A.E.M,DIVINA, F,AGUILAR-RUIZ, J.S,CORTÉS, G.A. (2011). A multi-objective genetic algorithm for the Protein Structure Prediction.....
    • CHEN, P,LI, J. Prediction of protein long-range contacts using an ensemble of genetic algorithm classifiers with sequence profile centers.
    • CHENG, J,BALDI, P. Improved residue contact prediction using support vector machines and a large feature set.
    • COHEN, J. Bioinformatics-an introduction for computer scientists..
    • DI LENA, P,MARGARA, L,VASSURA, M,FARISELLI, P,CASADIO, R. (2008). A new protein representation based on fragment contacts: towards an improvement...
    • DI LENA, P,NAGATA, K,BALDI, P. Deep architectures for protein contact map prediction. 2449-2457
    • DING, W,XIE, J,DAI, D,ZHANG, H,XIE, H,ZHANG, W. CNNcon: Improved Protein Contact Maps Prediction Using Cascaded Neural Networks.
    • FRANCIA, S.S,GARCÍA, M.N.M. (2006). Multiclasificadores: Métodos y Arquitecturas. Universidad de Salamanca.
    • GARCÍA, S,FERNÁNDEZ, A,LUENGO, J,HERRERA, F. Advanced nonparametric tests for multiple comparisons in the design of experiments in computational...
    • GROMIHA, M.M. Multiple Contact Network Is a Key Determinant to Protein Folding Rates..
    • HOWE, C.W,MOHAMAD, M.S. (2011). Protein Residue Contact Prediction using Support Vector Machine.. 1985-1990
    • KALMEGH, S. Analysis of WEKA data mining algorithm REPTree, Simple CART and RandomTree for classification of Indian news..
    • KARAKAŞ, M,WOETZEL, N,MEILER, J. BCL::Contact-Low Confidence Fold Recognition Hits Boost Protein Contact Prediction and De Novo Structure...
    • KUNCHEVA, L.I. (2004). Combining pattern classifiers: methods and algorithms. Hoboken, NJ: J. Wiley.
    • MÁRQUEZ-CHAMORRO, A.E,ASENCIO-CORTES, G,DIVINA, F,AGUILAR-RUIZ, J.S. Evolutionary decision rules for predicting protein contact maps. 725-737
    • MÁRQUEZ-CHAMORRO, A.E,ASENCIO-CORTÉS, G,SANTIESTEBAN-TOCA, C.E,AGUILAR-RUIZ, J.S. (2015). Soft computing methods for the prediction of protein...
    • MITRA, S,HAYASHI, Y. Bioinformatics with soft computing. 616-635
    • MONASTYRSKYY, B,D’ANDREA, D,FIDELIS, K,TRAMONTANO, A,KRYSHTAFOVYCH, A. (2014). Evaluation of residue-residue contact prediction in CASP10:...
    • RANDALL, A,CHENG, J,SWEREDOSKI, M,BALDI, P. TMBpro: secondary structure, -contact and tertiary structure prediction of transmembrane -barrel...
    • ROSE, P.W,YOUNG, J,ZARDECKI, C,BERMAN, H.M,BOURNE, P.E. The RCSB Protein Data Bank: new resources for research and education.
    • SANTIESTEBAN-TOCA, C.E,ASENCIO-CORTÉS, G,MÁRQUEZ-CHAMORRO, A.E,AGUILAR-RUIZ, J.S. (2012). Short-Range interactions and decision tree-based...
    • TEGGE, A.N,WANG, Z,EICKHOLT, J,CHENG, J. NNcon: improved protein contact map prediction using 2D-recursive neural networks.
    • WANG, C.-Y,ZHU, H.-D,CAI, L. (2009). A new prediction protein structure method based on genetic algorithm and coarse-grained protein model.
    • WU, X,KUMAR, V. (2009). The top ten algorithms in data mining. CRC Press.
    • XIE, J,DING, W,CHEN, L,GUO, Q,ZHANG, W. Advances in Protein Contact Map Prediction Based on Machine Learning. 265-270
    • ZAKI, M.J,SHAN, JIN,BYSTROFF, C. Mining residue contacts in proteins using local structure predictions.. 789-801
Los metadatos del artículo han sido obtenidos de SciELO Cuba

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno