Ir al contenido

Documat


Resumen de Computación de Altas Prestaciones para la Resolución deProblemas de Optimización en Bioinformática

Savins Puertas Martín

  • El descubrimiento de fármacos es un proceso que consume mucho tiempo y recursos. Además, se convierte de especial interés cuando aparecen enfermedades nuevas con una alta letalidad, como ha ocurrido recientemente con el COVID-19. En esta tesis, se proponen un conjunto de nuevas herramientas y metodologías para reducir estos costes. Estas se han aplicado al cribado virtual, una de las etapas iniciales en el proceso de descubrimiento donde la cantidad de compuestos moleculares a analizar es enorme. Y es que, el cribado virtual consiste precisamente en obtener un subconjunto de moléculas con una alta probabilidad de actuación contra una enfermedad, de entre todas las que se encuentran en una base de datos, que pueden llegar a ser millones. Ese subconjunto será el que se analice en el laboratorio en fases posteriores del desarrollo.

    Las aportaciones de esta tesis se han centrado en el cribado virtual basado en ligandos donde se buscan aquellos compuestos con el mayor valor de similitud de forma y potencial electrostático utilizando enfoques mono y multiobjetivo. La reducción del espacio de búsqueda mediante procedimientos dinámicos, la combinación de algoritmos de optimización global con métodos de búsqueda local y la ejecución paralela son algunas de las técnicas utilizadas para optimizar de forma eficaz y eficiente los problemas abordados. El conjunto de estas técnicas ha permitido analizar bases de datos que contienen hasta millones de compuestos y ofrecer nuevas y diferentes predicciones respecto a las de la literatura. Así pues, se han encontrado nuevos compuestos químicos que de otra forma seguirían esperando ser encontrados.

    La primera contribución de esta tesis ha sido el desarrollo de un nuevo algoritmo memético evolutivo, denominado OptiPharm. Este se ha diseñado para poder explorar todo el espacio de búsqueda pero a su vez centrarse en las zonas más prometedoras. Además, es independiente de la función objetivo siempre que esta esté relacionada con la posición 3D de los compuestos. Asimismo, dada la gran cantidad de compuestos diferentes, OptiPharm se puede configurar dependiendo del problema y las necesidades de este. En consecuencia, puede ejecutarse para obtener resultados rápidamente pero reduciendo ligeramente la calidad de las soluciones o, por el contrario, aplicar una configuración más robusta donde siempre encuentre el mejor resultado a expensas de necesitar más tiempo de ejecución. Igualmente, dados los diferentes tamaños de los compuestos, OptiPharm se adapta dinámicamente a cada pareja a evaluar de estos.

    Este algoritmo se ha aplicado a dos problemas: la optimización de la similitud de forma y la del potencial electrostático. Para el primero, se ha comparado con WEGA, el software referente en la bibliografía, evaluando diferentes bases de datos conocidas como son la FDA, DUD, DUD-E y Maybridge. Los resultados han mostrado la capacidad de OptiPharm para encontrar soluciones de calidad similar a WEGA en menor tiempo o por el contrario, soluciones mucho mejores con un coste mayor de tiempo. Estas comparaciones se han hecho en igualdad de condiciones y para ello, no se han considerado los hidrógenos en OptiPharm pues WEGA, como el resto de los algoritmos de la bibliografía, los elimina. No obstante, hemos demostrado mediante un estudio realizado únicamente con nuestro algoritmo, que los hidrógenos influyen de manera importante en la similitud de forma y, por tanto, deben de ser considerados.

    El segundo problema que se ha abordado con OptiPharm es la similitud del potencial electrostático. En este caso, se ha realizado una comparación entre la actual metodología de la literatura y una nueva que proponemos en esta tesis. La diferencia entre ambas reside en que si bien la metodología de la literatura optimiza primero los compuestos en similitud de forma para después evaluar un subconjunto de ellos en base al potencial electrostático seleccionando el de mayor valor de esta última propiedad, nosotros proponemos una directa optimización del potencial electrostático. Los resultados de los experimentos realizados sobre la base de datos FDA han reforzado nuestra hipótesis. Pero no solo eso, otro inconveniente de la metodología tradicional es que al seleccionar solo un subconjunto, muchos compuestos prometedores no son evaluados electrostáticamente y por tanto se descartan. Un estudio realizado sobre el porcentaje de compuestos que debe ser evaluado ha demostrado que considerar todos los compuestos aumenta las posibilidades de encontrar compuestos más similares electrostáticamente.

    Finalmente, hemos abordado también el problema del cribado virtual desde una perspectiva multiobjetivo. Para ello, hemos considerado la optimización simultánea de la similitud de forma y de potencial electrostático. Para evaluar la calidad de esta nueva propuesta se comparó esta con las soluciones monoobjetivo anteriores utilizando la base de datos DrugBank. Los resultados obtenidos han demostrado que mediante esta nueva propuesta, se puede obtener compuestos que de otra forma serían ignorados al solo considerarse una de las dos propiedades.


Fundación Dialnet

Mi Documat