La predicción de estructuras de proteínas involucra varios y muy complejos pasos, entre los que se incluye la predicción de mapas de contactos. En los últimos años se han explorado métodos basados en algoritmos de aprendizaje automático, técnicas estadísticas, bioinspiradas, combinación de clasificadores, entre otras, sin lograr aún los niveles de efectividad deseados. El objetivo de la presente investigación es diseñar un algoritmo, a partir de la información brindada por la secuencia de aminoácidos, que posea capacidad explicativa y permita predecir mapas de contactos de proteínas con una efectividad similar o superior a los algoritmos del estado del arte. Éste se sustenta sobre la base del supuesto de que el análisis de la correlación entre la estructura de residuos covalentes de una proteína y su secuencia de aminoácidos permitiría obtener un algoritmo capaz de predecir los mapas de contactos de una proteína, con una precisión aceptable. Como resultado, se obtuvo el multiclasificador FoDT, el cual es capaz de asignar contactos con una efectividad del 55% reduciendo significativamente el costo computacional. FoDT propone una codificación donde se analizan por separado cada una de las 400 parejas de aminoácidos que pueden formarse. Además, implementa un nuevo algoritmo de re-muestreo basado en una estrategia genética, capaz de reducir el nivel de desbalance que existe en la predicción de mapas de contactos. La comparación con algoritmos del estado del arte, empleando proteínas del CASP9 y el CASP10, muestra que no existen diferencias significativas con éstos, sin embargo, es capaz de brindar un mecanismo de interpretación de su base de conocimiento.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados