New balance indices and metrics for phylogenetic trees

  1. Rotger García, Lucía
Dirigida per:
  1. Arnau Mir Torres Director/a
  2. Francesc Andreu Rosselló Llompart Codirector/a

Universitat de defensa: Universitat de les Illes Balears

Fecha de defensa: 13 de de juliol de 2020

Tribunal:
  1. Josep Maria Miret Biosca President/a
  2. Maria de la Mercè Llabrés Segura Secretari/ària
  3. Anna Rio Vocal

Tipus: Tesi

Resum

La creença que la forma d'un arbre filogenètic és un reflex de les propietats dels processos evolutius que hi ha al darrere ha motivat l'estudi d'índexs que quantifiquin les propietats gràfiques dels arbres filogenètics i de mètriques que permetin la seva comparació. La contribució principal d'aquesta tesi doctoral és aleshores la incorporació al conjunt de tècniques disponibles per a l'anàlisi i la comparació d'arbres filogenètics de l'índex de balanç cofenètic total, la família d'índexs Colless-like i la família de mètriques cofenètiques. Contingut de la investigació L'índex cofenètic total és una bona alternativa a altres índexs de balanç populars com ara els de Sackin i de Colless. Aquest índex està definit per a arbres no binaris, i assoleix el seu valor màxim exactament als arbres de tipus pinta i el seu valor mínim entre els arbres arbitraris exactament als arbres estrella (no binaris) i entre els arbres binaris exactament als arbres màxim balancejats, sent el primer índex de balanç publicat que satisfà aquesta darrera propietat. Els índexs Colless-like són la primera extensió sòlida publicada per a arbres no binaris de l'índex de Colless, en el sentit que quan es restringeixen a arbres binaris coincideixen amb l'índex de Colless clàssic llevat d'un factor constant i, per a cada nombre de fulles, els arbres que assoleixen el seu valor mínim són exactament els totalment simètrics. Aquests índexs depenen de l'elecció d'una funció de dissimilitud i d'una mida d'arbres, i mostrem que aquesta tria pot afectar la forma com mesuren el balanç. Finalment, hem definit les mètriques cofenètiques d_(φ,p), amb p∈\{0\}∪[1,∞[ , per a arbres filogenètics amb, potser, nodes interiors etiquetats i pesos a les arestes. Conclusió Hem calculat fórmules explícites per valor esperat del índex cofenètic total sota els models de creixement d'arbres filogenètics binaris de Yule i uniforme i una recurrència simple per a la seva variància sota el model uniforme. Com a part d'aquest estudi, hem obtingut una fórmula explícita per al valor esperat de l'índex de Sackin sota el model uniforme, un problema que romania obert. En relació amb els índexs Colless-like, presentem en aquesta tesi el nostre paquet de R “CollessLike”, disponible a la CRAN, que permet realitzar proves de bondat d'ajust d'un arbre filogenètic amb qualsevol model α-γ per a arbres no binaris com a model nul. Per a alguns tipus d'espais d'arbres filogenètics sense pesos a les arestes, hem calculat el valor mínim no nul de les mètriques cofenètiques, l'ordre de magnitud del seu diàmetre i els entorns dels arbres. A més, donem fórmules explicites per a l'esperança sota els models de Yule i uniforme del quadrat de d_(φ,2).