Ir al contenido

Documat


Metaheurísticas, optimización multiobjetivo y paralelismo para descubrir motifs en secuencias de ADN

  • Autores: David Lesmes González Álvarez
  • Directores de la Tesis: Miguel Ángel Vega Rodríguez (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Extremadura ( España ) en 2013
  • Idioma: español
  • Número de páginas: 223
  • Tribunal Calificador de la Tesis: Julio Ortega Lopera (presid.) Árbol académico, Ricardo Aler Mur (secret.) Árbol académico, Ignacio Rojas Ruiz (voc.) Árbol académico, Sebastián Ventura Soto (voc.) Árbol académico, Juan Antonio Gómez Pulido (voc.) Árbol académico
  • Enlaces
    • Tesis en acceso abierto en: Dehesa
  • Resumen
    • español

      La resolución de problemas complejos mediante técnicas evolutivas es uno de los aspectos más investigados en Informática. El objetivo principal de esta tesis doctoral es desarrollar nuevos algoritmos capaces de resolver estos problemas con el menor tiempo computacional posible, mejorando la calidad de los resultados obtenidos por los métodos ya existentes. Para ello, combinamos tres conceptos importantes: metaheurísticas, optimización multiobjetivo y paralelismo. Con este fin, primero buscamos un problema de optimización importante que aún no fuese resuelto de forma eficiente y encontramos el Problema del Descubrimiento de Motifs (PDM). El PDM tiene como objetivo descubrir pequeños patrones repetidos (motifs) en conjuntos de secuencias de ADN que puedan poseer cierto significado biológico. Para abordarlo, definimos una formulación multiobjetivo adecuada a los requerimientos del mundo real, implementamos un total de diez algoritmos de distinta naturaleza (población, trayectoria, inteligencia colectiva...), analizando aspectos como la capacidad de escalar y converger. Finalmente, diseñamos diversas técnicas paralelas, haciendo uso de entornos de programación como OpenMP y MPI, que tratan de combinar las propiedades de varias metaheurísticas en una única aplicación. Los resultados obtenidos son estudiados en detalle a través de la aplicación de numerosos test estadísticos, y las predicciones son comparadas con las descubiertas por un total de trece herramientas biológicas bien conocidas en la literatura. Las conclusiones obtenidas demuestran que la utilización de la optimización multiobjetivo en técnicas metaheurísticas favorece el descubrimiento de soluciones de calidad y que el paralelismo es útil para combinar las propiedades evolutivas de diferentes algoritmos.

    • English

      The resolution of complex problems by using evolutionary algorithms is one of the most researched issues in Computer Science. The main goal of this thesis is directly related with the development of new algorithms that can solve this kind of problems with the least possible computational time, improving the results achieved by the existing methods. To this end, we combine three important concepts: metaheuristics, multiobjective optimization, and parallelism. For doing this, we first look for a significant optimization problem that had not been solved in an efficient way and we find the Motif Discovery Problem (MDP). MDP aims to discover over-represented short patterns (motifs) in a set of DNA sequences that may have some biological significance. To address it, we defined a multiobjective formulation adjusted to the real-world biological requirements, we implemented a total of ten algorithms of different nature (population, trajectory, collective intelligence...), analyzing aspects such as the ability to scale and converge. Finally, we designed parallel techniques, by using parallel and distributed programming environments as OpenMP and MPI, which try to combine the properties of several metaheuristics in a single application. The obtained results are discussed in detail through numerous statistical tests, and the achieved predictions are compared with those discovered by a total of thirteen well-known biological tools. The drawn conclusions demonstrate that using multiobjective optimization in metaheuristic techniques favors the discovery of quality solutions, and that parallelism is useful for combining the properties of different evolutionary algorithms.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno