Anne-Muriel Arigon Chifolleau

Recherche

Mes travaux actuels portent sur la classification et l'identification de données génomiques provenant d'organismes pathogènes et de virus, notament le virus du Sida (VIH).

Sujet de M2 proposé

Titre: Calcul de distances pour l'inférence de grandes phylogénies dans le cadre d'analyses d'épidémies virales
Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)
Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)
Plus de détails ici.

Sujet de thèse proposé

Titre: Étude phylogénétique des données de VIH
Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)
Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)
Plus de détails ici.





Sujet de M2 proposé



Titre: Calcul de distances pour l'inférence de grandes phylogénies dans le cadre d'analyses d'épidémies virales

Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)

Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)

Résumé:
Une étape de l'étude de donnée génomiques est l'étude de l'évolution de ces données. Pour cela l'analyse phylogénétique est une des méthodes utilisées pour reconstruire l'histoire évolutive de séquences. Les virus évoluant très vite, il est possible de suivre cette évolution au cours du temps afin d'améliorer la surveillance de l'évolution des pathogènes connus et l'apparition de nouveaux virus. Étant donné l'augmentation exponentielle de la quantité de données génomiques à traiter, notamment celles provenant d'organismes microbiens et pathogènes comme le virus de la grippe ou du sida, les méthodes actuelles ne suffisent plus pour reconstruire les arbres phylogénétiques dans des temps corrects. Ces méthodes sont basées, la plupart du temps, sur le calcul de distances entre séquences et la reconstruction de l'arbre à partir de ces distances car ce sont les plus rapides. Une première étape serait donc d'améliorer le calcul de distances afin de réduire la compléxité algorithmique et ainsi optimiser le temps de calcul et la place mémoire utilisée. Dans le cadre de ce stage, on s'intéressera à la mise en place d'un algorithme de calcul de distances rapides et efficaces permettant l'analyse de grands jeux de données. Cette méthode mettra en jeu de l'algortithmique fine, pour dépasser l'état de l'art actuel avec une complexité typiquement en O(n^2s) où n est le nombre de séquences et s la longueur de ces séquences, complexité qui limite les analyses à environ 10.000 séquences, tandis que les données à venir devraient rapidement atteindre les 100.000 séquences et plus.

Collaborations:
Nous avons actuellement des collaborations sur ce même sujet avec Tulio de Oliveira de l'université du Kwazulu-Natal (Africa Centre for Health and Population Studies, the Nelson R Mandela School of Medicine, Afrique du Sud), qui est un spécialiste du HIV et de son évolution. Et ce projet rejoint celui plus vaste de l'étude de l'origine et de l'épidémiologie du HIV, sujet dans lequel est particulièrement impliquée l'équipe de Martine Peeters à l'IRD de Montpellier avec laquelle nous collaborons également.

Quelques articles liés à ce sujet de M2 :
- Elias I and Lagergren J, Fast computation of distance estimators. BMC Bioinformatics. 2007; 8: 89. voir l'article
- Holmes EC, Grenfell BT., Discovering the phylodynamics of RNA viruses. PLoS Comput Biol. 2009 Oct;5(10):e1000505. Epub 2009 Oct 26. voir l'article
- Desper R., Gascuel O., Fast and Accurate Phylogeny Reconstruction Algorithms Based on the Minimum-Evolution Principle. Journal of Computational Biology 9(5): 687-706 (2002) voir l'article
- Arigon A.M., Perriere G., Gouy M., HoSeqI: automated homologous sequence identification in gene family databases. Bioinformatics. 2006 Jul 15; 22(14):1786-7. voir l'article

Sujet de thèse proposé


Titre: Étude phylogénétique des données de VIH

Encadrants: Anne-Muriel Arigon (arigon AT lirmm.fr) et Olivier Gascuel (gascuel AT lirmm.fr)

Equipe: Méthodes et Algorithmes pour la Bioinfomatique (MAB)

Résumé:
L'infection par le VIH est devenue une pandémie qui infecte environ 40 millions de personnes. Les virus évoluant très vite, il est possible de suivre cette évolution au cours du temps en effectuant des inférences phylodynamiques qui partagent des informations relatives à l'épidémiologie et à l'évolution. Une meilleure compréhension de la phylodynamique des virus permettrait une amélioration de la surveillance de l'évolution des pathogènes connus et de l'apparition de nouveaux virus. Chaque année, la communauté des chercheurs sur le VIH produit une très grande quantité de données qui ne sont pas exploitées complètement. Des problèmes de datation, d'identification, de typage apparaissent et des modèles et méthodes efficaces sont nécessaires pour exploiter ces données. Dans le cadre de la thèse, on s'intéressera à l'étude de nouvelles méthodes algorithmiques rapides et efficaces permettant l'analyse de ces grands jeux de données. Le candidat sera amené à travailler notamment sur des problématiques liées à l'algorithmique combinatoire, la complexité algorithmique et la modélisation de problèmes biologiques.

Collaborations:
Nous avons actuellement des collaborations sur ce même sujet avec Tulio de Oliveira de l'université du Kwazulu-Natal (Africa Centre for Health and Population Studies, the Nelson R Mandela School of Medicine, Afrique du Sud), qui est un spécialiste du HIV et de son évolution. Et ce projet rejoint celui plus vaste de l'étude de l'origine et de l'épidémiologie du HIV, sujet dans lequel est particulièrement impliquée l'équipe de Martine Peeters à l'IRD de Montpellier avec laquelle nous collaborons également.

Quelques articles liés à ce sujet de thèse :
- Holmes EC, Grenfell BT., Discovering the phylodynamics of RNA viruses. PLoS Comput Biol. 2009 Oct;5(10):e1000505. Epub 2009 Oct 26. voir l'article
- Rambaut A, Posada D, Crandall KA, Holmes EC. The causes and consequences of HIV evolution. Nat. Rev. Genet. 2004;5:52-61.
Accueil Recherche Publications Enseignenment