| Titre : | Méthodes Efficaces pour Reconstruire de Grandes Phylogénies | | Type de document : | texte imprimé | | Auteurs : | V. RANWEZ, Auteur | | Année de publication : | 2002 | | Langues : | Français (fre) | | Tags : | FS: RECONSTRUCTION PHYLOGENETIQUE MAXIMUM DE VRAISEMBLANCE DISTANCE EVOLUTIVE QUADRUPLET TRIPLET SIMULATIONS INFORMATIQUES ALGORITHMES HEURISTIQUES OPTIMISATION NUMERIQUE PHYLOGENETIC RECONSTRUCTION MAXIMUM LIKELIHOOD EVOLUTIONARY DISTANCE QUARTET TRIPLET COMPUTER SIMULATIONS HEURISTIC ALGORITHMS NUMERICAL OPTIMIZATION | | Index. décimale : | THE Thèses de doctorat | | Résumé : | La reconstruction de phylogénies moléculaires consiste à retrouver l'arbre évolutif (ou phylogénie) d'un ensemble de séquences homologues. La méthode de reconstruction la plus fiable actuellement, semble être la méthode du maximum de vraisemblance. Cependant, trouver la phylogénie de vraisemblance maximale est un problème NP-difficile et les heuristiques qui visent à résoudre directement ce problème d'optimisation ont une complexité élevée. Elles ne peuvent donc pas inférer de grandes phylogénies. Actuellement, deux types de méthodes permettent de reconstruire de grandes phylogénies suivant le principe du maximum de vraisemblance : les méthodes de distances et les méthodes de quadruplets. Toutes deux divisent le problème initial en sous-problèmes contenant peu de séquences. Elles peuvent alors les résoudre rapidement, suivant le principe du maximum de vraisemblance, et combiner les solutions obtenues pour proposer une phylogénie de l'ensemble des séquences. Après avoir présenté les principales méthodes de reconstruction phylogénétique, nous décrivons une nouvelle méthode de quadruplets : Weight Optimization. Cette méthode est une amélioration de Quartet Puzzling (méthode de quadruplets très populaire), dont elle réduit la complexité, assure la consistance, et évite l'important biais topologique. Nous analysons ensuite les résultats de simulations informatiques qui confirment que notre méthode est plus fiable et plus rapide que Quartet Puzzling. Malheureusement, ces simulations montrent également que les performances des méthodes de quadruplets sont encore peu satisfaisantes. Enfin, nous décrivons TripleML, une approche qui combine de manière originale méthodes de distances et maximum de vraisemblance. TripleML améliore la fiabilité de différentes méthodes de distances, sans augmenter leur complexité, en remplaçant les distances qu'elles utilisent par des distances estimées en optimisant localement la vraisemblance de triplets de séquences (ou groupes de séquences).
Molecular phylogenetic reconstruction aims at recovering the evolutionary tree (or phylogeny) of a set of homologous sequences. The maximum likelihood method seems to be the most reliable approach. However, finding the phylogeny of maximum likelihood is a NP-hard problem, and heuristics that try to directly tackle this optimization problem have a high complexity. Therefore, such methods cannot deal with large data sets. Two kinds of methods are available for reconstructing large phylogenies according to the maximum likelihood principle: distance based methods and quartet methods. Both divide the original problem in sub-problems made of few sequences that they can rapidly solve (according to the maximum likelihood principle). They then combine the solutions of these sub-problems in a solution to the original one. After a presentation of main phylogenetic reconstruction methods, we describe a new quartet method: Weight Optimization. This method improves Quartet Puzzling (a widely used quartet method), by reducing its complexity, insuring consistency and avoiding its strong topological bias. We then analyze the results of computer simulations which confirm that our method is faster and more accurate than Quartet Puzzling. Finally, we propose an approach combining distance methods and maximum likelihood in an original way. This approach, called TripleML, improves the reliability of distance-based methods, without increasing their complexity, by replacing the distance they use by distances obtained via a local optimization of the likelihood of triplets of taxa (or set of taxa). | | Directeur(s) de thèse : | GASCUEL O. | | Président du jury : | JEAN-MARIE A. | | Rapporteur(s) : | GOUY M.;GUENOCHE A. | | Examinateur(s) : | BENHABILES N.;GALTIER N. | | Date de soutenance : | 06/11/2002 |
Méthodes Efficaces pour Reconstruire de Grandes Phylogénies [texte imprimé] / V. RANWEZ, Auteur . - 2002. Langues : Français ( fre) | Tags : | FS: RECONSTRUCTION PHYLOGENETIQUE MAXIMUM DE VRAISEMBLANCE DISTANCE EVOLUTIVE QUADRUPLET TRIPLET SIMULATIONS INFORMATIQUES ALGORITHMES HEURISTIQUES OPTIMISATION NUMERIQUE PHYLOGENETIC RECONSTRUCTION MAXIMUM LIKELIHOOD EVOLUTIONARY DISTANCE QUARTET TRIPLET COMPUTER SIMULATIONS HEURISTIC ALGORITHMS NUMERICAL OPTIMIZATION | | Index. décimale : | THE Thèses de doctorat | | Résumé : | La reconstruction de phylogénies moléculaires consiste à retrouver l'arbre évolutif (ou phylogénie) d'un ensemble de séquences homologues. La méthode de reconstruction la plus fiable actuellement, semble être la méthode du maximum de vraisemblance. Cependant, trouver la phylogénie de vraisemblance maximale est un problème NP-difficile et les heuristiques qui visent à résoudre directement ce problème d'optimisation ont une complexité élevée. Elles ne peuvent donc pas inférer de grandes phylogénies. Actuellement, deux types de méthodes permettent de reconstruire de grandes phylogénies suivant le principe du maximum de vraisemblance : les méthodes de distances et les méthodes de quadruplets. Toutes deux divisent le problème initial en sous-problèmes contenant peu de séquences. Elles peuvent alors les résoudre rapidement, suivant le principe du maximum de vraisemblance, et combiner les solutions obtenues pour proposer une phylogénie de l'ensemble des séquences. Après avoir présenté les principales méthodes de reconstruction phylogénétique, nous décrivons une nouvelle méthode de quadruplets : Weight Optimization. Cette méthode est une amélioration de Quartet Puzzling (méthode de quadruplets très populaire), dont elle réduit la complexité, assure la consistance, et évite l'important biais topologique. Nous analysons ensuite les résultats de simulations informatiques qui confirment que notre méthode est plus fiable et plus rapide que Quartet Puzzling. Malheureusement, ces simulations montrent également que les performances des méthodes de quadruplets sont encore peu satisfaisantes. Enfin, nous décrivons TripleML, une approche qui combine de manière originale méthodes de distances et maximum de vraisemblance. TripleML améliore la fiabilité de différentes méthodes de distances, sans augmenter leur complexité, en remplaçant les distances qu'elles utilisent par des distances estimées en optimisant localement la vraisemblance de triplets de séquences (ou groupes de séquences).
Molecular phylogenetic reconstruction aims at recovering the evolutionary tree (or phylogeny) of a set of homologous sequences. The maximum likelihood method seems to be the most reliable approach. However, finding the phylogeny of maximum likelihood is a NP-hard problem, and heuristics that try to directly tackle this optimization problem have a high complexity. Therefore, such methods cannot deal with large data sets. Two kinds of methods are available for reconstructing large phylogenies according to the maximum likelihood principle: distance based methods and quartet methods. Both divide the original problem in sub-problems made of few sequences that they can rapidly solve (according to the maximum likelihood principle). They then combine the solutions of these sub-problems in a solution to the original one. After a presentation of main phylogenetic reconstruction methods, we describe a new quartet method: Weight Optimization. This method improves Quartet Puzzling (a widely used quartet method), by reducing its complexity, insuring consistency and avoiding its strong topological bias. We then analyze the results of computer simulations which confirm that our method is faster and more accurate than Quartet Puzzling. Finally, we propose an approach combining distance methods and maximum likelihood in an original way. This approach, called TripleML, improves the reliability of distance-based methods, without increasing their complexity, by replacing the distance they use by distances obtained via a local optimization of the likelihood of triplets of taxa (or set of taxa). | | Directeur(s) de thèse : | GASCUEL O. | | Président du jury : | JEAN-MARIE A. | | Rapporteur(s) : | GOUY M.;GUENOCHE A. | | Examinateur(s) : | BENHABILES N.;GALTIER N. | | Date de soutenance : | 06/11/2002 |
|