Gestión de volúmenes masivos de datos genéticos y análisis de la influencia de su interacción en el desarrollo de cáncer

Palazuelos Calderón, Camilo

Fecha

2019-06-28

Director/es

Llorca Díaz, Francisco Javier

Zorrilla Pantaleón, Marta E.

Derechos

Atribución-CompartirIgual 3.0 España

Palabras clave

Análisis multivariante

Técnicas de inferencia estadística

Bioestadística

Multivariate analysis

Statistical inference techniques

Biostatistics

Resumen/Abstract

RESUMEN: Los modelos o patrones en las asociaciones entre una variante genética (o una interacción de estas) y una enfermedad, a pesar de la información que propor-cionan, se han ignorado en casi todos los estudios de asociación del genoma completo. Aunque no todas las variantes genéticas, ni mucho menos todas sus interacciones, presentan un modelo en su relación con la enfermedad, la hipó-tesis de partida de esta tesis doctoral era que no son tan reducidas en número como parece, por lo que su estudio podía dar lugar a la generación de hipótesis biológicas susceptibles de ser comprobadas experimentalmente. Para demos-trarlo, (i) se desarrolló un marco de trabajo que permitió evaluar y comparar los niveles de adecuación e incertidumbre de distintos patrones a volúmenes masivos de variables que analizar simultáneamente; (ii) se diseñó e implemen-tó una prueba estadística en el marco de trabajo anterior que permitió decidir qué modelo genético le correspondía a variantes genéticas e interacciones de estas; y (iii) se confeccionó un protocolo de construcción de redes de interac-ciones con que se analizaron los datos del estudio MCC-Spain. Las asociacio-nes encontradas han podido refrendarse con descubrimientos científicos de los últimos 5 años, lo que pone de manifiesto tanto la viabilidad del método como su potencial para revelar información oculta en las redes de interaccio-nes de variantes genéticas que conducen a la aparición de enfermedades co-munes.

ABSTRACT: The presence of a model or a pattern in the association between a genetic vari-ant (or a variant–variant interaction) and a disease, despite the fact that it pro-vides a wealth of information, has been ignored by genome-wide association studies. Although these models do not underlie every variant–disease (let alone every interaction–disease) association, the working hypothesis of this doctoral dissertation, contrary to what intuition would indicate, was that they are abundant, which might give rise to biological hypotheses to be tested ex-perimentally. In order to confirm it, (i) we developed a framework that al-lowed us to evaluate and compare the patterns in massive datasets with vari-ables to be analyzed simultaneously; (ii) we designed and implemented a sta-tistical test that allowed us to decide which genetic model corresponded with each genetic variant and interaction; and (iii) we composed a protocol for gen-erating interaction networks and analyzing the data from the MCC-Spain study. The associations found are supported by scientific discoveries in the past 5 years, which demonstrates both the viability of the method and its abil-ity to reveal the information hidden in variant–variant interaction networks leading to the development of common diseases.

Colecciones a las que pertenece

D06 Tesis [126]
EDUC Tesis [548]

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-CompartirIgual 3.0 España