Understanding disease mechanisms with statistical models of signaling pathway activities

Loading...
Thumbnail Image
Publication date
2016
Reading date
05-02-2016
Journal Title
Journal ISSN
Volume Title
Publisher
Metrics
Abstract
Hoy en día, uno de los temas más candentes en la investigación biomédica es entender los procesos que producen enfermedades. En el pasado, la mayor parte las enfermedades génicas fueron asociadas al mal funcionamiento de un solo gen, pero hay muchas enfermedades que sólo pueden ser explicadas por el mal funcionamiento de un conjunto de genes. Una vez el genoma humano fue secuenciado, se hizo evidente que los genes no actúan solos en la célula, si no que están unidos por una intrincada red de interacciones que determinan su actividad. Este descubrimiento dio lugar al inicio de la biología de sistemas, que trata de entender cómo los componentes celulares se relacionan entre ellos para dar lugar a la vida. En biología de sistemas, las redes que describen las relaciones que se establecen entre genes se llaman rutas de señalización. Por otra parte, el auge de nuevas tecnologías de alto rendimiento, ha permitido en los últimos años medir simultáneamente miles de componentes celulares, incluyendo la expresión génica. Esto ha producido la creación de nuevas metodologías para el estudio del comportamiento diferencial de las rutas de señalización entre dos condiciones experimentales dados los niveles de expresión de cada uno de los genes contenidos en la ruta. En esta tesis, presentamos una nueva metodología para analizar los datos de expresión en el contexto de las rutas de señalización. Primero, las rutas de señalización fueron modeladas y divididas en subestructuras más pequeñas, que llamaremos subrutas, que recogen las diferentes funciones biológicas individuales incluidas en la ruta completa. Este modelado tiene en cuenta la diferente naturaleza tanto de los nodos como de las aristas que forman la red, permitiendo que sean evaluadas de acuerdo con el concepto biológico que representan. Además, se modelaron las distribuciones de niveles de expresión de las sondas de diversos chips the expresión génica. Concretamente, la distribución de cada sonda fue ajustada a una mixtura de distribuciones (gamma o normal) asociadas con los estados activo e inactivo de la sonda, respectivamente. Estas distribuciones fueron usadas para estimar la probabilidad de que una sonda esté activa en una determinada muestra. La probabilidad de activación estimada fue propagada a continuación a lo largo de las subrutas, teniendo en cuenta las diferentes relaciones que se pueden establecer entre los nodos, obteniendo una estimación de la actividad de cada una de las subrutas. Por lo tanto, dado un experimento que compara dos condiciones biológicas, la metodología propuesta estima la actividad de cada una de las subrutas, y las compara para obtener las subrutas significativamente activas o inhibidas entre ambas condiciones. Esta metodología supera la mayor parte de las limitaciones presentadas por los métodos anteriores y proporciona a la comunidad científica una herramienta web de fácil manejo que permite analizar los datos de expresión obtenidos en un experimento comparando dos condiciones dentro del contexto de las rutas de señalización. En consecuencia, la estrategia propuesta en esta tesis nos permite entender los mecanismos que dan lugar a una enfermedad en términos de la biología de sistemas, ya que permite obtener como resultado de nuestro análisis un conjunto de genes, biológicamente relacionados y que conjuntamente producen una determinada función génica, en vez de un gene o conjunto de genes sin ninguna relación entre ellos.
Description
Bibliographic reference