Actualité : Un outil bioinformatique pour les génomes de virus !

Un outil bioinformatique pour les génomes de virus !

Résumé : Durant une épidémie, les virus qui infectent des humains (ou d'autres hôtes) doivent échapper au système immunitaire de l'hôte. Pour cela, leur génome (leur ARN) mute rapidement et cela engendre une diversité des virus dont le comportement évolue – on parle alors de quasi-espèces de virus. Grâce à ces mutations génomiques, certains de ces virus pourront mieux échapper au système immunitaire ou mieux résister à un traitement. On ne sait pas quelles quasi-espèces s'adaptent le mieux à l'hôte, ni lesquelles deviennent majoritaires dans la population de virus (la fréquence relative des quasi-espèces est une inconnue importante du point de vue biologique et médical). Pour lutter contre une épidémie, suivre les effets d'un traitement, savoir quelles quasi-espèces acquièrent des mutations avantageuses, il est important d'obtenir les séquences de leurs génomes et d'estimer leurs proportions dans la population virale. On peut aujourd'hui séquencer les génomes viraux présents chez l'hôte, ce qui produit des millions de petits fragments de séquences. Il faut ensuite assembler ces fragments pour obtenir la séquence du génome. Bien que de nombreux outils bioinformatiques d'assemblage de génome existent, ils sont inadaptés au cas des quasi-espèces pour lequel le logiciel doit deviner combien de quasi-espèces sont présentes, puis reconstruire partiellement ou entièrement le génome de chacune, afin d'identifier leurs différences. Généralement les outils existant distinguent mal les différentes quasi-espèces. En relation avec une équipe du CWI d'Amsterdam, nous proposons une méthode nommée SAVAGE pour assembler les génomes de quasi-espèces virales lorsque l'on ne dispose pas déjà d'un génome de référence (le cas le plus difficile d'assemblage). Les tests sur des données de HIV, des virus de l'hépatite C, des virus de Zika et d'Ebola démontrent la capacité de SAVAGE à reconstruire les quasi-espèces et à estimer leur fréquence relative. Ce travail offre des perspectives nouvelles pour le suivi des infections chez les patients par des approches basées sur le séquençage à haut débit.

Contact: Eric Rivals, LIRMM & IBC, rivals@lirmm.fr, http://www.lirmm.fr/~rivals/
Référence: http://genome.cshlp.org/content/early/2017/04/10/gr.215038.116
De novo assembly of viral quasispecies using overlap graphs
Jasmijn Baaijens, Amal Zine El Aabidine, Eric Rivals*, Alexander Schoenhuth*
Advance Access online in Genome Research on April 10, 2017.
*co-corresponding authors

CNRS_20090001_0601

© Greg CIRADE/www.gregcirade.com/CNRS Photothèque

Infographie montrant le processus de contamination du virus du sida.