Recherche
Mes travaux actuels portent sur la classification et l'identification de données génomiques provenant d'organismes pathogènes et de virus,
notament le virus du Sida (VIH).
Sujet de M2 proposé
Titre: Calcul de distances pour l'inférence de grandes phylogénies dans le cadre d'analyses d'épidémies virales
Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)
Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)
Plus de détails
ici.
Sujet de thèse proposé
Titre: Étude phylogénétique des données de VIH
Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)
Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)
Plus de détails
ici.
Titre: Calcul de distances pour l'inférence de grandes phylogénies dans le cadre d'analyses d'épidémies virales
Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)
Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)
Résumé:
Une étape de l'étude de donnée génomiques est l'étude de l'évolution de ces données. Pour cela l'analyse phylogénétique est une des méthodes
utilisées pour reconstruire l'histoire évolutive de séquences. Les virus évoluant très vite, il est possible de suivre cette évolution au cours
du temps afin d'améliorer la surveillance de l'évolution des pathogènes connus et l'apparition de nouveaux virus. Étant donné l'augmentation exponentielle
de la quantité de données génomiques à traiter, notamment celles provenant d'organismes microbiens et pathogènes comme le virus de la grippe ou du sida,
les méthodes actuelles ne suffisent plus pour reconstruire les arbres phylogénétiques dans des temps corrects. Ces méthodes sont basées, la plupart du
temps, sur le calcul de distances entre séquences et la reconstruction de l'arbre à partir de ces distances car ce sont les plus rapides. Une première
étape serait donc d'améliorer le calcul de distances afin de réduire la compléxité algorithmique et ainsi optimiser le temps de calcul et la place mémoire
utilisée. Dans le cadre de ce stage, on s'intéressera à la mise en place d'un algorithme de calcul de distances rapides et efficaces permettant l'analyse
de grands jeux de données. Cette méthode mettra en jeu de l'algortithmique fine, pour dépasser l'état de l'art actuel avec une complexité typiquement en
O(n^2s) où n est le nombre de séquences et s la longueur de ces séquences, complexité qui limite les analyses à environ 10.000 séquences, tandis que les
données à venir devraient rapidement atteindre les 100.000 séquences et plus.
Collaborations:
Nous avons actuellement des collaborations sur ce même sujet avec Tulio de Oliveira de l'université du Kwazulu-Natal (Africa Centre for Health and
Population Studies, the Nelson R Mandela School of Medicine, Afrique du Sud), qui est un spécialiste du HIV et de son évolution. Et ce projet rejoint
celui plus vaste de l'étude de l'origine et de l'épidémiologie du HIV, sujet dans lequel est particulièrement impliquée l'équipe de Martine Peeters à l'IRD de Montpellier
avec laquelle nous collaborons également.
Quelques articles liés à ce sujet de M2 :
- Elias I and Lagergren J, Fast computation of distance estimators. BMC Bioinformatics. 2007; 8: 89.
voir l'article
- Holmes EC, Grenfell BT., Discovering the phylodynamics of RNA viruses. PLoS Comput Biol. 2009 Oct;5(10):e1000505. Epub 2009 Oct 26.
voir l'article
- Desper R., Gascuel O., Fast and Accurate Phylogeny Reconstruction Algorithms Based on the Minimum-Evolution Principle. Journal of Computational Biology 9(5): 687-706 (2002)
voir l'article
- Arigon A.M., Perriere G., Gouy M., HoSeqI: automated homologous sequence identification in gene family databases. Bioinformatics. 2006 Jul 15; 22(14):1786-7.
voir l'article
Titre: Étude phylogénétique des données de VIH
Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)
Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)
Résumé:
L'infection par le VIH est devenue une pandémie qui infecte environ 40 millions de personnes. Les virus évoluant très vite, il est possible de suivre cette évolution au cours du temps en effectuant des inférences phylodynamiques qui partagent des informations relatives à l'épidémiologie et à l'évolution. Une meilleure compréhension de la phylodynamique des virus permettrait une amélioration de la surveillance de l'évolution des pathogènes connus et de l'apparition de nouveaux virus. Chaque année, la communauté des chercheurs sur le VIH produit une très grande quantité de données qui ne sont pas exploitées complètement. Des problèmes de datation, d'identification, de typage apparaissent et des modèles et méthodes efficaces sont nécessaires pour exploiter ces données. Dans le cadre de la thèse, on s'intéressera à l'étude de nouvelles méthodes algorithmiques rapides et efficaces permettant l'analyse de ces grands jeux de données. Le candidat sera amené à travailler notamment sur des problématiques liées à l'algorithmique combinatoire, la complexité algorithmique et la modélisation de problèmes biologiques.
Collaborations:
Nous avons actuellement des collaborations sur ce même sujet avec Tulio de Oliveira de l'université du Kwazulu-Natal (Africa Centre for Health and
Population Studies, the Nelson R Mandela School of Medicine, Afrique du Sud), qui est un spécialiste du HIV et de son évolution. Et ce projet rejoint
celui plus vaste de l'étude de l'origine et de l'épidémiologie du HIV, sujet dans lequel est particulièrement impliquée l'équipe de Martine Peeters à l'IRD de Montpellier
avec laquelle nous collaborons également.
Quelques articles liés à ce sujet de thèse :
- Holmes EC, Grenfell BT., Discovering the phylodynamics of RNA viruses. PLoS Comput Biol. 2009 Oct;5(10):e1000505. Epub 2009 Oct 26.
voir l'article
- Rambaut A, Posada D, Crandall KA, Holmes EC. The causes and consequences of HIV evolution. Nat. Rev. Genet. 2004;5:52-61.