Ir al contenido

Documat


Resumen de New balance indices and metrics for phylogenetic trees

Lucía Rotger García

  • español

    La creencia que la forma de un árbol filogenético es un reflejo de las propiedades de los procesos evolutivos subyacentes ha motivado el estudio de índices que cuantifiquen las propiedades gráficas de un árbol filogenético y de las métricas que permitan la comparación de árboles filogenéticos. La principal contribución de esta tesis doctoral es entonces la incorporación al conjunto de técnicas disponibles para el análisis y la comparación de árboles filogenéticos del índice de balance cofenético total, la familia de índices de balance Colless-like y la familia de métricas cofenéticas.

    Contenido de la investigación El índice cofenético total resulta ser una buena alternativa a otros índices populares de balance como los índices de Sackin y Colless. Este índice está definido para árboles no binarios, y alcanza su valor máximo exactamente en los árboles de tipo peine y su valor mínimo entre los árboles arbitrarios exactamente en los árboles estrella y entre los árboles binarios en los máximo balanceados, siendo el primer índice de balance publicado que satisface esta última propiedad.

    La familia de los índices Colless-like proporciona la primera extensión sólida a árboles filogenéticos arbitrarios del índice de Colless clásico para árboles binarios, en el sentido de que cuando se restringen a árboles binarios coinciden con el índice de Colless clásico salvo un factor constante y, para cualquier número de hojas, los únicos árboles que alcanzan su valor mínimo son exactamente los totalmente simétricos. Estos índices dependen de la elección de una función de disimilitud y de un tamaño de árboles, y mostramos que esta elección puede afectar la forma en que miden el balance del árbol.

    Finalmente, hemos definido la familia de las métricas cofenéticas d_(φ,p), con p∈\{0\}∪[1,∞[ , para árboles filogenéticos con, posiblemente, nodos interiores etiquetados y pesos en las aristas.

    Conclusión Hemos calculado fórmulas explícitas para el valor esperado del índice cofenético total bajo los modelos de Yule y uniforme de crecimiento de árboles filogenéticos binarios y una recurrencia simple para su varianza bajo el modelo uniforme. En el decurso de este estudio, hemos obtenido una fórmula explícita para el valor esperado del índice de Sackin bajo el modelo uniforme, un problema que aún permanecía abierto.

    En relación con los índices Colles-like, presentamos en esta tesis nuestro paquete de R “CollessLike”, disponible en la CRAN, que permite realizar pruebas de bondad de ajuste de un árbol filogenético con cualquier modelo α-γ para árboles no binarios como modelo nulo.

    Para diferentes tipos de espacios de árboles filogenéticos sin pesos en las aristas, hemos calculado el valor mínimo estrictamente positivo de estas métricas, el orden de magnitud de su diámetro y los entornos de los árboles. Además, hemos obtenido fórmulas explícitas para el valor esperado bajo los modelos de Yule y uniforme del cuadrado de la métrica de d_(φ,2).

  • English

    Introduction The belief that the shape of a phylogenetic tree reflects the properties of the evolutionary processes underlying it has motivated the study of indices quantifying the graph-theoretical properties of phylogenetic trees and of metrics allowing for their comparison. The main contribution of this PhD Thesis is then the addition to the set of available techniques for the analysis and comparison of phylogenetic trees of the total cophenetic balance index, the family of Colless-like balance indices, and the family of cophenetic metrics.

    Research content The total cophenetic index turns out to be a good alternative to other popular balance indices like Sackin's and Colless' indices. This index is defined for multifurcating trees and it achieves its maximum value exactly at the combs and its minimum value among the multifurcating trees exactly at the star trees and among the bifurcating trees at the maximally balanced trees, being the first balance index published in the literature satisfying this last property.

    The Colless-like indices provide the first sound extension to multifurcating trees of the Colless index for bifurcating trees, in the sense that, when restricted to bifurcating trees, they give the classical Colless index up to a constant factor, and, for any given number of leaves, the only multifurcating trees that yield their minimum value are exactly the fully symmetric. These Colless-like indices depend on the choice of a dissimilarity function and of a size of rooted trees, and we show that this choice may affect how they measure the balance of a tree.

    Finally, we have defined the family of cophenetic metrics d_(φ,p), with p∈\{0\}∪[1,∞[, for phylogenetic trees with possibly nested taxa and weights on the arcs.

    Conclusion We have computed closed formulas for the expected value of the total cophenetic index under the Yule and the uniform models of bifurcating phylogenetic tree growth and a simple recurrence for its variance under the uniform model. As a by-product of this study, we have obtained a closed formula for the expected value of the Sackin index under the uniform model, a problem that remained open so far.

    In connection with the Colless-like indices, we introduce in this Thesis our R package “CollessLike”, available on the CRAN, that allows to perform goodness of fit tests of a phylogenetic tree with null model any α-γ model.

    On different types of spaces of non-weighted trees, we have computed their least non-zero value, the order of their diameter, and the neighborhood of any given tree. Moreover, we have obtained closed formulas for the expected value under the Yule and the uniform models of the square of the metric d_(φ,2).

  • català

    La creença que la forma d'un arbre filogenètic és un reflex de les propietats dels processos evolutius que hi ha al darrere ha motivat l'estudi d'índexs que quantifiquin les propietats gràfiques dels arbres filogenètics i de mètriques que permetin la seva comparació. La contribució principal d'aquesta tesi doctoral és aleshores la incorporació al conjunt de tècniques disponibles per a l'anàlisi i la comparació d'arbres filogenètics de l'índex de balanç cofenètic total, la família d'índexs Colless-like i la família de mètriques cofenètiques.

    Contingut de la investigació L'índex cofenètic total és una bona alternativa a altres índexs de balanç populars com ara els de Sackin i de Colless. Aquest índex està definit per a arbres no binaris, i assoleix el seu valor màxim exactament als arbres de tipus pinta i el seu valor mínim entre els arbres arbitraris exactament als arbres estrella (no binaris) i entre els arbres binaris exactament als arbres màxim balancejats, sent el primer índex de balanç publicat que satisfà aquesta darrera propietat.

    Els índexs Colless-like són la primera extensió sòlida publicada per a arbres no binaris de l'índex de Colless, en el sentit que quan es restringeixen a arbres binaris coincideixen amb l'índex de Colless clàssic llevat d'un factor constant i, per a cada nombre de fulles, els arbres que assoleixen el seu valor mínim són exactament els totalment simètrics. Aquests índexs depenen de l'elecció d'una funció de dissimilitud i d'una mida d'arbres, i mostrem que aquesta tria pot afectar la forma com mesuren el balanç.

    Finalment, hem definit les mètriques cofenètiques d_(φ,p), amb p∈\{0\}∪[1,∞[ , per a arbres filogenètics amb, potser, nodes interiors etiquetats i pesos a les arestes.

    Conclusió Hem calculat fórmules explícites per valor esperat del índex cofenètic total sota els models de creixement d'arbres filogenètics binaris de Yule i uniforme i una recurrència simple per a la seva variància sota el model uniforme. Com a part d'aquest estudi, hem obtingut una fórmula explícita per al valor esperat de l'índex de Sackin sota el model uniforme, un problema que romania obert.

    En relació amb els índexs Colless-like, presentem en aquesta tesi el nostre paquet de R “CollessLike”, disponible a la CRAN, que permet realitzar proves de bondat d'ajust d'un arbre filogenètic amb qualsevol model α-γ per a arbres no binaris com a model nul.

    Per a alguns tipus d'espais d'arbres filogenètics sense pesos a les arestes, hem calculat el valor mínim no nul de les mètriques cofenètiques, l'ordre de magnitud del seu diàmetre i els entorns dels arbres. A més, donem fórmules explicites per a l'esperança sota els models de Yule i uniforme del quadrat de d_(φ,2).


Fundación Dialnet

Mi Documat