New balance indices and metrics for phylogenetic trees

  1. Rotger García, Lucía
Dirigida por:
  1. Arnau Mir Torres Director/a
  2. Francesc Andreu Rosselló Llompart Codirector/a

Universidad de defensa: Universitat de les Illes Balears

Fecha de defensa: 13 de julio de 2020

Tribunal:
  1. Josep Maria Miret Biosca Presidente/a
  2. Maria de la Mercè Llabrés Segura Secretario/a
  3. Anna Rio Vocal

Tipo: Tesis

Resumen

La creencia que la forma de un árbol filogenético es un reflejo de las propiedades de los procesos evolutivos subyacentes ha motivado el estudio de índices que cuantifiquen las propiedades gráficas de un árbol filogenético y de las métricas que permitan la comparación de árboles filogenéticos. La principal contribución de esta tesis doctoral es entonces la incorporación al conjunto de técnicas disponibles para el análisis y la comparación de árboles filogenéticos del índice de balance cofenético total, la familia de índices de balance Colless-like y la familia de métricas cofenéticas. Contenido de la investigación El índice cofenético total resulta ser una buena alternativa a otros índices populares de balance como los índices de Sackin y Colless. Este índice está definido para árboles no binarios, y alcanza su valor máximo exactamente en los árboles de tipo peine y su valor mínimo entre los árboles arbitrarios exactamente en los árboles estrella y entre los árboles binarios en los máximo balanceados, siendo el primer índice de balance publicado que satisface esta última propiedad. La familia de los índices Colless-like proporciona la primera extensión sólida a árboles filogenéticos arbitrarios del índice de Colless clásico para árboles binarios, en el sentido de que cuando se restringen a árboles binarios coinciden con el índice de Colless clásico salvo un factor constante y, para cualquier número de hojas, los únicos árboles que alcanzan su valor mínimo son exactamente los totalmente simétricos. Estos índices dependen de la elección de una función de disimilitud y de un tamaño de árboles, y mostramos que esta elección puede afectar la forma en que miden el balance del árbol. Finalmente, hemos definido la familia de las métricas cofenéticas d_(φ,p), con p∈\{0\}∪[1,∞[ , para árboles filogenéticos con, posiblemente, nodos interiores etiquetados y pesos en las aristas. Conclusión Hemos calculado fórmulas explícitas para el valor esperado del índice cofenético total bajo los modelos de Yule y uniforme de crecimiento de árboles filogenéticos binarios y una recurrencia simple para su varianza bajo el modelo uniforme. En el decurso de este estudio, hemos obtenido una fórmula explícita para el valor esperado del índice de Sackin bajo el modelo uniforme, un problema que aún permanecía abierto. En relación con los índices Colles-like, presentamos en esta tesis nuestro paquete de R “CollessLike”, disponible en la CRAN, que permite realizar pruebas de bondad de ajuste de un árbol filogenético con cualquier modelo α-γ para árboles no binarios como modelo nulo. Para diferentes tipos de espacios de árboles filogenéticos sin pesos en las aristas, hemos calculado el valor mínimo estrictamente positivo de estas métricas, el orden de magnitud de su diámetro y los entornos de los árboles. Además, hemos obtenido fórmulas explícitas para el valor esperado bajo los modelos de Yule y uniforme del cuadrado de la métrica de d_(φ,2).