Ir al contenido

Documat


Resumen de Algoritmos computacionales para la generación de redes genéticas e identificación de biomarcadores

Dulcenombre de María del Saz Navarro

  • Las redes biológicas han sido esenciales en biología para comprender cómo se relacionan los diferentes elementos celulares en vías de señalización y rutas metabólicas. Estas redes, inicialmente centradas en procesos celulares independientes, dieron origen a las redes de proteínas y las redes genéticas, que abordan los procesos biológicos como un sistema integrado en el que los distintos procesos interactúan en varios niveles. Debido a su gran potencial, las redes genéticas se han convertido en una herramienta más en estudios clínicos, particularmente en la identificación de biomarcadores. La continua generación de algoritmos de redes genéticas es un tema de investigación activo, ya que la calidad de las relaciones entre los nodos en estas redes influye directamente en su topología y en el conocimiento biológico que se puede extraer de ellas.

    Las redes genéticas suelen derivarse de fuentes de datos de expresión genéticas, como microarrays, la secuenciación de ARN (RNA-Seq) y la secuenciación de ARN de single-cell (scRNA-Seq), y su inferencia se basa en distintos criterios estadísticos, como son medidas de correlación, distancia o similitud, entre otros. Los algoritmos de generación de redes genéticas siguen evolucionando con el objetivo principal de predecir interacciones robustas. Sin embargo, a los retos inherentes a la identificación de relaciones biológicamente relevantes en estudios específicos, se suman los desafíos actuales derivados del incremento masivo de datos de expresión genética en diversas bases de datos biológicas. Esto ha aumentado las demandas computacionales y ha consolidado a la bioinformática como una herramienta indispensable en múltiples áreas en biología. La necesidad de familiarización con herramientas que a menudo requieren conocimientos de programación limita, sin embargo, su adopción generalizada de estas herramientas dentro de la comunidad científica, especialmente entre investigadores de perfil clínico.

    En esta tesis se presentan tres aportaciones en la generación de redes de co-expresión genéticas. pyEnGNet presenta una mejora del algoritmo EnGNet donde se aceleran significativamente los tiempos de ejecución del algoritmo para grandes volúmenes mediante el uso de GPU, ofreciendo una mejora sustancial en el rendimiento computacional y permitiendo obtener resultados en un tiempo razonable. CyEnGNet una aplicación, integrada en Cytoscape, enfocada en facilitar la usabilidad para la comunidad científica, integra la aplicación en un entorno de visualización de redes que evita procesos de instalación complejos y permite el ajuste intuitivo de parámetros. Por último, se presenta un nuevo algoritmo ensemble para generar redes de co-expresión genéticas a partir de diversas medidas de correlación (Pearson, Spearman y Kendall), utilizado para el estudio de biomarcadores en cáncer estromal de próstata y pecho. La red de co-expresión generada por este método ensemble ofrece una mayor fiabilidad en comparación con el uso de un único coeficiente de correlación.

    Gracias a los trabajos propuestos en esta tesis, se aporta a la comunidad científica un nuevo enfoque para la generación de redes de co-expresión genética confiables, facilitando la identificación de biomarcadores. Además, se optimiza la computación mediante GPU para la ejecución de estos algoritmos tiempo de computación para mejorar el tiempo de computación en la ejecución de los algoritmos, y se adaptan herramientas que simplifican el uso de redes de co-expresión en grupos de investigación de perfil clínico, lo que impulsa el desarrollo de nuevas líneas de estudio en la biomedicina.


Fundación Dialnet

Mi Documat