Ir al contenido

Documat


Resumen de New tools to protein interaction networks alignment and prediction

Adriá Alcalá Mena

  • español

    Introducción Las proteínas son las encargadas de llevar a cabo las funciones moleculares y los procesos biológicos de las células, y para hacerlo, se organizan en grupos que interactúan entre sí. Estas interacciones se modelan con grafos o redes llamadas redes de interacción proteína-proteína (PPIN), donde los nodos son las proteínas y las aristas son las interacciones proteína-proteína (PPI). Las PPIN, se han convertido en un modelo ampliamente aceptado para modelar las relaciones funcionales de las proteínas y su análisis es un ingrediente clave en el estudio de las funciones moleculares de las proteínas.

    De manera similar al caso del alineamiento de secuencias, el alineamiento de redes proporciona un método de comparación de dos o más redes biológicas. Pero en este caso, se consideran tanto las funciones biológicas como la similitud topológica de los nodos alineados, por lo que una aplicación directa del alineamiento de estas redes es transferir conocimientos biológicos de especies ya estudiadas a otras especies nuevas.

    En los últimos 20 años han surgido varios algoritmos de alineamiento de PPIN. La mayoría de estos alineadores se basan en la definición de una "similitud" entre los nodos a alinear, donde se considera tanto la topología de la red como las características biológicas de los nodos. Ahora bien, obtener un buen balance entre similitud topológica y similitud biológica es una tarea difícil que no se ha logrado todavía, y que incluso algunos alineadores dejan en manos de los mismos usuarios. Además, los alineadores requieren un esfuerzo considerable por parte del usuario para su utilización, por lo que muchos investigadores se ven obligados a seleccionar un alineador sin saber si es el más conveniente y sobre todo sin poder comparar los resultados con otros alineadores.

    En cuanto a las redes de interacción de proteínas, su obtención de forma experimental es una tarea muy costosa, por lo que últimamente la comunidad científica ha optado por el diseño de métodos computacionales que predigan dichas interacciones. Estos predictores, para ser útiles, deben predecir la interacción de las proteínas con la información disponible de estas, que suele ser la secuencia de las proteínas.

    Contenido de la tesis Por este motivo, en esta tesis hemos diseñado un nuevo alineador, AligNet, sin parámetros a escoger por parte del usuario. Además, hemos desarrollado PINAWeb, una herramienta web que proporciona, compara y analiza los alineamientos obtenidos por los cinco alineadores mejor considerados por ahora.

    Bajo el requisito de predecir las interacciones a partir únicamente de la información de la secuencia de la proteína, junto con la idea de explotar también la información de las PPI disponible en las diferentes bases de datos, en esta tesis hemos diseñado Prots2Net, un predictor de PPI. Este modelo de predicción utiliza, para su entrenamiento, las PPI de dos especies conocidas obtenidas de la base de datos STRING y las secuencias de las proteínas.

    Conclusiones En esta tesis se presenta un alineador de redes de interacción de proteínas, AligNet, que consigue un buen equilibrio entre la coincidencia topológica de las redes a alinear y la biológica de los nodos alineados. Una herramienta web, PINAWeb, que facilita el uso y la comparación de cinco alineadores de redes de interacción de proteínas existentes. Y, una herramienta para la predicción de interacción de proteínas, Prots2Net, que da mejores resultados que los métodos conocidos, ya que, además de la información de las secuencias de las proteínas, usa información de interacción de otras proteínas de la base de datos de STRING.

  • English

    Introduction All molecular functions and biological processes are carried out by groups of proteins that interact with each other. Proteins interactions are modeled by simple networks called protein-protein interaction networks (PPINs) whose nodes are proteins and whose edges are the protein-protein interactions. PPINs are broadly accepted to model the protein's functional relations, and their analysis has become a key ingredient in the study of protein functions.

    Similar to the sequence alignment scenario, network alignment presents a comprehensive way to compare two or more biological networks. It considers not only biological interactions but also topological similarity of the neighborhood of biological nodes, and a most straightforward application of network alignment is to transfer known biological knowledge from well-studied species to unknown ones. With this purpose, several pairwise alignment algorithms have been proposed in the last years. Most PPINs aligners take into account both, the network topology and the biological features of the proteins, in the definition of “similarity”. However, this is a trade-off that is hard to achieve. In addition, most aligners are quite complicated and time-consuming to use in practice, and many researchers are faced with selecting an aligner without being able to compare its performance with other aligners.

    Regarding the protein-protein interactions (PPIs) information, it must be obtained with high-throughput technology from metaproteomic data. Retrieving protein-protein interaction data experimentally is a very high time-consuming and labor-intensive task. Consequently, in the last years, the biological community has been looking for computational methods to correctly predict PPIs. The amount of new sequence data that is created every day, and its lack of a priori information, makes those methods that predict PPIs based on protein sequence information very popular.

    Content Motivated by this lack of well-balanced and efficient algorithms, we have designed AligNet, a parameter-free PPINs aligner. Besides AligNet, and motivated by the lack of a “one-size-fits all" PPINs aligner, we have developed PINAWeb, a user-friendly web-based tool that obtains and compares the results produced by five different aligners.

    Finally, under the requirement of predicting interactions based only on protein sequence information together with the idea to also exploit the PPIs information stored in the databases, we have designed Prots2Net, a PPIs predictor. To train the model, Prots2Net explores the PPIs retrieved from the STRING database of two selected species.

    Conclusions In this thesis a new PPIN aligner, AligNet, is presented, capable to achieve a good balance between topological and biological matching. A “user-friendly” web tool, PINAWeb, that allows to execute and compare five different aligners. And, a tool for the protein interaction prediction, Prots2Net, which performs better than the known prediction methods, since, in addition to protein sequence data, protein interaction data from the STRING database is considered.

  • català

    Introducció Les proteïnes són les encarregades de dur a terme les funcions moleculars i els processos biològics de les cèl·lules, i per fer-ho, s'organitzen en grups que interactuen entre si. Aquestes interaccions es modelen amb grafs o xarxes anomenades xarxes d'interacció proteïna-proteïna (PPIN), on els nodes són les proteïnes i les arestes són les interaccions proteïna-proteïna (PPI). Les PPIN, s'han convertit en un model àmpliament acceptat per modelar les relacions funcionals de les proteïnes i la seva anàlisi és un ingredient clau en l'estudi de les seves funcions moleculars.

    De manera similar al cas de l'alineament de seqüències, l'alineament de xarxes proporciona un mètode de comparació de dues o més xarxes biològiques. Però en aquest cas, es consideren tant les funcions biològiques dels nodes alineats com la seva similitud topològica, per la qual cosa una aplicació directa de l'alineament d'aquestes xarxes és transferir coneixements biològics d'espècies ja estudiades a altres espècies noves.

    En els darrers vint anys han sorgit diversos algorismes d'alineament de PPIN. La majoria d'aquests alineadors es basen en la definició d'una "similitud" entre els nodes a alinear on es considera tant la topologia de la xarxa com les característiques biològiques de les proteïnes. Ara bé, obtenir un bon balanç entre similitud topològica i similitud biològica és una tasca molt difícil que encara no s'ha assolit, i que a més, alguns alineadors deixen en mans dels mateixos usuaris en forma de paràmetres a escollir. Això, juntament amb l'esforç considerable per a la seva utilització que requereixen alguns alineadors, fa que molts d'investigadors es vegin abocats a seleccionar un alineador sense saber si és el més convenient i sobretot sense poder comparar-ne els resultats amb altres alineadors.

    Finalment, i pel que fa a l’obtenció de les xarxes d’interacció de proteïnes, l’obtenció d’aquestes de manera experimental és una tasca molt costosa, i per això en els darrers anys, la comunitat científica ha optat pel disseny de mètodes computacionals que prediguin aquestes interaccions. Ara bé, aquests predictors per ser d'utilitat, han de predir la interacció de les proteïnes a partir de la informació disponible d'aquestes, que normalment és la seva seqüència.

    Contingut de la investigació Per tot això, en aquesta tesi hem dissenyat un nou alineador, AligNet, sense paràmetres a escollir per part de l'usuari. A més, hem desenvolupat PINAWeb, una eina web que proporciona, compara i analitza els alineaments obtinguts pels cinc alineadors més ben considerats ara com ara.

    Sota el requisit de predir les interaccions a partir únicament de la informació de la seqüència de la proteïna juntament amb la idea d'explotar també la informació de les PPI disponible en les diferents bases de dades, hem dissenyat Prots2Net, un predictor de PPI. Aquest model de predicció utilitza les PPI de dues espècies conegudes obtingudes de la base de dades STRING i les seqüències de les proteïnes en el seu entrenament.

    Conclusions En aquesta tesi es presenta un alineador de xarxes d’interacció de proteïnes, AligNet, capaç d’aconseguir un bon equilibri entre la coincidència topològica de les xarxes a alinear i la biològica dels nodes alineats. Una eina web, PINAWeb, que facilita l’ús i la comparació de cinc alineadors de xarxes d’interacció de proteïnes existents. I una eina per a la predicció d'interacció de proteïnes, Prots2Net, que funciona millor que els mètodes de predicció coneguts, ja que afegeix, a més de la informació de les seqüències de les proteïnes, informació d’interacció d’altres proteïnes de la base de dades de STRING.


Fundación Dialnet

Mi Documat