Équipe MAB
Méthodes et algorithmes pour la bio informatique
À la croisée de la biologie et de l’informatique, la bioinformatique cherche à résoudre des questions biologiques par le calcul. Celles-ci couvrent un large spectre, de la biologie fondamentale à l’agronomie en passant par la santé et l’environnement. L’équipe MAB poursuit des travaux méthodologiques (algorithmique du texte et des arbres, combinatoire, optimisation, modélisation probabiliste, apprentissage statistique) pour répondre à des questions biologiques essentielles (évolution, phylogénie, génomique comparative, annotation fonctionnelle des gènes et des protéines, paludisme, HIV, cancer).
Permanents
Fabio Pardi, Chargé de recherche, CNRS
Krister Swenson, Chargé de recherche, CNRS
Kevin Yauy, , UM
Alban Mancheron, Maître de conférences, UM
Sylvain Milanesi, Ingénieur d’étude, CNRS
Vincent Berry, Professeur des universités, UM
Anne-Muriel Arigon, Maître de conférences, UM
Eric Rivals, Directeur de recherche, CNRS
Stéphane Guindon, Chargé de recherche, CNRS
Annie Chateau, Professeur des universités, UM
Laurent Brehelin, Chargé de recherche, CNRS
Doctorants
Julien Raynal, CNRS
Pengfei Wang, CNRS
Jordan Moutet, UM
Elliot Butz, CNRS
Autres personnels
Sanjana Govindaswamy, CDD Ingénieur-Technicien, UM
Mathilde Robin, Invité longue durée Mission longue, ICM
Nadine Jacquet, CDD Ingénieur-Technicien, CNRS
Amelie Ngo, Doctorant externe, CNRS
Chiria Jorotiana, Doctorant externe, Université de Fianarantsoa
Christophe Vroland, CDD Chercheur, CNRS
Océane Cassan, CDD Chercheur, UM
Collaborateurs réguliers :
Olivier Gascuel (MNHN, Paris)
Charles Lecellier (IGMM, Montpellier)
Sophie Lèbre (IMAG, Montpellier)
Les thématiques de recherche sont organisées en trois axes :
- Algorithmique du texte et méthodes pour l’analyse du séquençage à haut débit
- Méthodes pour l’inférence évolutive
- Outils pour l’annotation fonctionnelle
Les logiciels développés dans l’équipe sont disponibles sur la plateforme ATGC.
La plateforme ATGC, labellisée par IBiSA en 2010, est soutenue par des Projets d’Investissement d’Avenir : l’IFB (Institut Français de Bioinformatique), France Génomique et le Labex NUMEV. La plateforme est adossée à l’équipe de recherche MAB (Méthodes et Algorithmes pour la Bioinformatique) et bénéficie également des recherches réalisées au sein de l’IBC (Institut de Biologie Computationelle).
La plateforme a la triple vocation de diffuser les outils bioinformatiques développés au sein de la communauté montpelliéraine, de favoriser les collaborations entre partenaires informaticiens et biologistes, et d’apporter une aide à ces chercheurs en mettant en place des services bioinformatiques en lien direct avec leurs travaux.
Les outils qu’elle propose sont accessibles en ligne gratuitement. Ils peuvent être téléchargés et/ou exécutés sur les clusters du LIRMM. Cette activité vise donc la communauté régionale, nationale et internationale. Les outils distribués sur ATGC ont une très grande visibilité internationale. Par exemple, le logiciel PhyML (développé au sein de l’équipe MAB, et classé « Current Classic » depuis Octobre 2007 par Science Watch) a été cité plus de 15 000 fois (cf. Web of Science).
Un axe majeur de la plateforme concerne les études évolutives. Nous développons des algorithmes de reconstruction phylogénétique (par exemple PhyML) et des outils d’analyse et de visualisation d’arbres. Ces travaux sont implémentés dans des logiciels que nous diffusons grâce à la plateforme. Ceux-ci peuvent être téléchargés et/ou exécutés en ligne. Un effort d’intégration de ces outils a été réalisé (en collaboration avec la plateforme de bioinformatique de Marseille) afin de les rendre accessibles au sein d’un pipeline d’analyse phylogénétique en ligne particulièrement convivial (http://www.phylogeny.fr : 300 analyses par jour).
Un autre axe concerne le traitement des données issues du séquençage à haut débit. Nous développons des algorithmes de traitement rapide de ces données, pour identifier les transcrits et les replacer sur le génome. Par exemple, nous avons développés le logiciel LorDEC qui est le premier à proposer de corriger les erreurs de séquençage issues de la dernière génération de séquenceurs. Ce projet se place dans un contexte régional très favorable en collaboration avec la plateforme Montpellier Genomix.
Les séminaires MAB sont centrés sur des thématiques math-info-bio. Les sujets présentés abordent des problèmatiques méthodologiques et leurs applications en biologie.
Les séminaires ont lieu au LIRMM – Bâtiment 5 (860, rue de St Priest, 34095 Montpellier).
Projets en cours – portés ou auxquels l’équipe participe :
- Projet MUSE BAPTISM on alignment-free phylogenetic identification of eDNA (2018-2019),
- Projet Région Occitanie COALAB on approximation algorithms for bioinformatics (2018-2019),
- Projet CNRS Osez l’interdisciplinarité! (2017-2018),
- Projet inter-LABEX (NUMEV-CEMEB-AGRO) ORTHOLOGAP on homology/orthology (2018-2019),
- Projet LABEX NUMEV on the bioinformatics platform phylogenomics.fr (2018-2019),
- Projet LABEX NUMEV on graphical representation of molecular evolution processes (2017-2019),
- Laboratoire International Associé (LIA) avec l’IGMM et l’Université de Vancouver : Regulation of microRNA genes (miREGEN) (2017-2021),
- Projet ANR Genospace sur l’analyse de séquences génétiques géo-referencées (2016-2019),
- Projet IFB 3GENSEQ (2016-2018),
- Projet IFB NGPhylogeny.fr (2016-2018),
- Projet Étendard NUMEV : « Information fuelled biophysical models for the control of gene expression » (2016-2019),
- Projet Plan Cancer LIONS sur la régulation de la transcription dans le cancer de la vessie (2016-2019),
- Projet GenomeHarvest de la Fondation Agropolis sur l’organisation des génomes de plantes (2016-2019),
- Projet IFB Evolutionary Bioinformatics (2015-2018),
- Projet H2020 VIROGENESIS sur la métagénomique virale (2015-2018),
- Projet PIA Institut de Biologie Computationnelle (Investissement d’Avenir, appel Bioinformatique, accepté en 2012),
- Projet PIA Institut Français de Bioinformatique (Investissement d’Avenir, appel Infrastructure en Biologie-Santé, accepté en 2012). Porteur de l’axe Bioinformatique Evolutive,
- Projet PIA France Génomique (Investissement d’Avenir, appel Infrastructure en Biologie-Santé, accepté en 2011). Porteur du workpackage RNAseq,
- Projet PIA Labex NUMEV (Investissement d’Avenir, accepté en 2011). Porteur de l’axe Algorithmes et Calculs,
Projet passés:
- Projet FRM sur la régulation de la traduction (2014-2017),
- Projet NUMEV AC-DC on modeling orthology relationships (2016-2017),
- Projet PEPS “Comprendre les maladies émergentes et les épidémies : modélisation, évolution, histoire et société” : Mécanismes évolutifs et conservation de la protéine anti-sens (ASP) du VIH-1 (2013-2016),
- Projet NUMEV : Portail web collaboratif de visualisation et comparaison de phylogénies (2015-2016),
- Projet NUMEV : Identification des motifs impliqués dans la régulation des microRNA (2015-2016),
- Projet ANR Colib’read sur les données NGS (2013-2016),
- PlasmoExpress ‘’Méthodes bioinformatiques pour l’analyse de la régulation transcriptionnelle chez Plasmodium falciparum’’ (2011-2013),
- ATCG “Accélération du Traitement Comparatif des données Génomiques” (2010-2013),
- Projet Chercheur d’Avenir, Région Languedoc Roussillon (2010-2013),
- Projet “Défis computationnels des séquençage et phénotypage haut-débit en science de la vie“ appel MASTODONS (2012 – 2015),
- PEPS CNRS/UM2/UM1 “Comprendre les maladies émergentes et les épidémies : modélisation, évolution, histoire et société“,
- Phylospace (Projet ANR).
Enseignements à l’Université de Montpellier
L’équipe est impliquée dans différents enseignements à l’Université de Montpellier (Faculté des Sciences et Polytech), à différents niveaux pour différents publics, et notamment en master :
- Master Informatique – Faculté des Sciences : étudiants avec une Licence d’Informatique
- Master Mathématiques, parcours Biostatistique – Faculté des Sciences : étudiants avec une Licence de Mathématiques
Les membres de l’équipe sont responsables de plusieurs UE (Unité d’Enseignement) en informatique (Licence et Master) et en bioinformatique (Master). Certaines, fortement liées à nos thématiques de recherche, font intervenir plusieurs chercheurs et enseignants-chercheurs de l’équipe :
- Algorithmique et optimisation pour la Bioinformatique avancées (M2 BCD, M2 Informatique)
- Analyse des séquences biologiques (M2 Biostat)
Formation permanente et écoles thématiques
- Formations continues CNRS Phylogénie moléculaire (1 fois par an)
- Formations continues CNRS Bioinformatique pour le traitement de données de séquençage (NGS) (1 fois par an)
Formations passées
- Organisation de la formation « Galaxy4Bioinformatics » à Montauban en novembre 2015 (financement NUMEV).
- École internationale de Bioinformatique Tunis, sep. 2014 organisée par l’Institut Pasteur et l’European Molecular Biology Organisation
- École de Printemps d’Informatique Théorique, ile d’Oléron, mai 2014
- Next Generation Sequencing, Bioinformatics Spring School from NOVA network (The Nordic Forestry, Veterinary and Agricultural University Network) march 2012, Enaforsholm Sweden
Nous nous impliquons dans les comités éditoriaux de 6 revues internationales, de nombreuses conférences d’algorithmique et de bioinformatique. En outre, nous exerçons des responsabilités dans les instances scientifiques telles que le GdR de “Bioinformatique Moléculaire” et les réseaux de plateformes nationales ( France Génomique et Institut Français de Bioinformatique IFB). Au plan local, outre les responsabilités d’enseignement, nous sommes responsables de l’Institut de Biologie Computationnelle, et impliqués dans les conseil de département scientifique de l’Université ou la Plateforme de Bioinformatique ATGC.
Comités éditoriaux de revues – Editorial boads
- Systematic Biology (associate editor),
- BMC Bioinformatics,
- BMC Evolutionary Biology,
- Algorithms for Molecular Biology,
- Evolutionary Bioinformatics,
- Dataset Papers in Biology.
Comités de sélection de conférences internationales
- 24th International Symposium on String Processing and Information Retrieval SPIRE 2017,
- 28th Annual Symposium on Combinatorial Pattern Matching, CPM 2017,
- NGS Conference – Structural variation and population genomics 2017,
- ECCB European Conference on Computational Biology: 2012, 2014, 2016,
- RECOMB-SEQ RECOMB Satellite Workshop on Massively Parallel Sequencing: 2016,
- NGS Conference – Genome Annotation: 2016,
- IEEE BIBM International Conference on Bioinformatics and Biomedicine: 2015-2016,
- WABI (Workshop on Algorithms in Bioinformatics) 2012-2017,
- RECOMB-CG (RECOMB Satellite Workshop on Comparative Genomics) 2010-2017,
- ISMB (International Conference on Intelligent Systems for Molecular Biology) 2015-2016,
- ACM-BCB (ACM Conference on Bioinformatics, Computational Biology and Biomedical Informatics) 2016,2013,
- APBC (Asian Pacific Biocomputing Conference) 2016-2015,
- 27th Annual Workshop on Mathematical and Statistical Aspects of Molecular Biology, MASAMB 2017.
Responsabilités nationales ou internationales
- Directeur du GdR de “Bioinformatique Moléculaire” 2010-2015,
- Président et membre de la Commission Interdisciplinaire du CoNRS : Modélisation des systèmes biologiques, bioinformatique,
- Membre du Conseil Scientifique de l’Institut des Sciences de l’Information et leurs Interactions (CSI INS2I),
- Membre du Management Committee de l’Action COST “SeqAhead” (2011-2015) (nom complet: Next Generation Sequencing Data Analysis Network), sur la Bioinformatique pour le Séquençage Haut-débit, et responsable des Séjours Jeunes Chercheurs (STSM),
- Membre de la Society of Systematic Biology,
- Co-responsabilité WorkPackage dans le réseau France Génomique depuis 2012,
- Membre de Executive Board et plateforme fondatrice de l’Institut Français de Bioinformatique (IFB) depuis sa création.
Responsabilités et implications régionales
- Direction de l’Institut de Biologie Computationnelle 2012-2017,
- Direction Plateforme de Bioinformatique ATGC depuis 2001,
- Conseil du Département Scientifique MIPS, de l’université de Montpellier,
- Labex Numev, membre du comité et co-responsable du Projet Intégré “ADN et génomes” depuis sa création,
- Responsable des formations “Bioinformatique pour les NGS” , “Phylogénie” et “Linux et script pour la bioinformatique“,
- Responsable et co-responsable du Département-Informatique du LIRMM 2007-2010 puis 2012-2014,
- Membre du Conseil Scientifique du LIRMM de 2012 à 2014,
- Membre du Conseil de Laboratoire du LIRMM depuis 2015.
Responsabilités en enseignement
- Directrice adjointe du département d’enseignement Informatique de la Faculté des Sciences de l’Université de Montpellier depuis 2015,
- Directeur du pôle Informatique Transversale à Polytech de 2010 à 2015,
- Responsable du parcours Bioinformatique, Connaissances et Données (BCD) du Master Sciences & Numériques pour la Santé (SNS) de 2012 à 2016,
- Responsable du parcours Informatique Pour les Sciences du Master Informatique de 2011 à 2015,
- Responsable de la cellule numérique de Polytech depuis 2015.
Organisation congrès et conférences
- Mathematical and Computational Evolutionary Biology 2012-2017,
- Workshop Colib’read, 7-8 novembre 2016 à Paris,
- France Génomique Workshop WetLab and Bioinformatics in Montpellier, 9-10th May 2016,
- Workshop international “Data Structures in Bioinformatics” Bielefeld, Allemagne, February 23-24, 2016,
- Colloque de Bioinformatique du GdR BIM, Paris, 2013 & 2015
- First international Workshop “Data Structures in Bioinformatics” Montpellier 8-9 Dec. 2014,
- Colloquium “Indexing for scientific big data“, Paris 15th Jan 2014,
- Workshop international VARIAHTON 2013 Udine Italie, 21 May 2013,
- Workshop SeqBio, Montpellier, 2013 & 2014.
- 31 janvier 2019, 14:00 AM (Room BAT5 02/022)
Vincent Berry “Balade en pays phylogénétique 2” - 18 décembre 2018, 14:00 AM (Room BAT5 02/022)
Vincent Berry “Balade en pays phylogénétique 1” - 15 novembre 2018, 14:00 AM (Room BAT5 02/022)
Krister Swenson “An overview of a some projects on phylogenetic tree analysis and genome comparison” - 22 juin 2018, 10:00 AM (Room BAT5 02/022)
Marc Chakiachvili, “Why and how to choose your IDE (integrated development environment)” - 14 juin 2018, 13:30 AM (Room BAT5 02/022)
Eric Rivals, “Hierarchical Overlap Graph” - 28 avril 2018, 10:00 AM (Room BAT5 02/022)
Sylvain Pulicani, ” Should we mine for Bitcoin in MAB ?” - 30 mars 2018, 10:00 AM (Room BAT5 01/156)
François Chevenet, “Phylogenies et Annotations : à la recherche de scenarios évolutifs. L’éditeur PAELA” - 27 février 2018, 13:30 PM (Room BAT5 01/156)
Laurent Bréhélin, “Domaines de régulation vs. motifs de régulation.” - 15 février 2018, 10:00 AM (Room BAT5 02/022)
Denis Bourget, “Peer Community in : un système de recommandation public et gratuit de preprints” - 25 janvier 2018, 10:00 AM (Room BAT5 01/156)
Stéphane Guindon - 14 décembre 2017, 10:00 AM (Room BAT5 0/156)
Alban Mancheron, “Comparaison de pipelines d’analyse de variants génomiques” - 30 november 2017, 10:00 AM (Room BAT5 02/156)
Marie-Cécile Robert, “Presentation of the CRISPR/CAs9 system” - 12 october 2017, 10:00 AM (Room BAT5 01/156)
Eric Rivals, “Presentation of the LIRMM survival toolkit” - 22 june 2017, 10:00 AM (Room BAT5 2/022)
Marc Chakiachvili, “Why and how to choose your IDE (integrated development environment)” - 18 may 2017, 10:00 AM (Room BAT5 1/056 )
Emma Saulnier, “Zombie apocalypse and epidemiological modeling” - 20 april 2017, 10:00 AM (Room: BAT5 01/124)
Krister Swenson, “Gluing computation experiments together with Snakemake” - 16 march 2017, 10:00 AM (Room: BAT5 02/022)
Rodrigo-antonio Canovas-barroso, “Debate about Compressed Structures” - 9 february 2016, 10:00 AM (Room: BAT5 02/022)
Clément Agret, “MARIANA: the cutest deep learning framework” - 8 december 2016, 10:00 AM (Room: BAT5 02/022)
Laurent bréhélin, “Cell biology by the numbers” - 24 november 2016, 10:00 AM (Room: BAT5 01/124)
Fabio Pardi, “SIMONS human diversity project” - 20 october 2016, 10:00 AM (Room: BAT5 02/022)
Benjamin Linard, “Science and social networking”
Titre : Des chevauchements entre mots
Doctorant : Pengfei Wang
Date de soutenance : 2024-12-13
Directeur de thèse :
Eric Rivals
Titre : Calcul de k-mers informatifs pour le placement phylogénétique
Doctorant : Nikolai Romashchenko
Date de soutenance : 2021-12-14
Directeur de thèse :
Eric Rivals
Titre : Étude de l’impact des répétitions d’ADN sur la dynamique des génomes : Vers un focus sur les génomes de moustiques
Doctorant : Yasmine Mansour
Date de soutenance : 2021-12-10
Directeur de thèse :
Annie Chateau
Titre : Élaboration d’une méthode d’identification et de quantification de spécimens en mélange.
Doctorant : Quentin Delorme
Date de soutenance : 2021-11-22
Directeur de thèse :
Annie Chateau
Titre : A la recherche de léchafaudage parfait : efficace, de qualité, et garanti
Doctorant : Tom Davot
Date de soutenance : 2020-10-05
Directeurs de thèse :
Rodolphe Giroudeau,
Annie Chateau
Titre : scénarios évolutifs pondérés de réarrangements génomiques
Doctorant : Pijus Simonaitis
Date de soutenance : 2020-07-10
Directeur de thèse :
Annie Chateau
Titre : Méthodes pour la découverte de nouveaux domaines dans les séquences biologiques : application à Plasmodium falciparum
Doctorant : Christophe Menichelli
Date de soutenance : 2019-11-26
Directeur de thèse :
Olivier Gascuel
Titre : Etude de la relation entre les réarrangements chromosomiques et la structure 3D de la chromatine chez la Drosophile
Doctorant : Sylvain Pulicani
Date de soutenance : 2018-11-28
Directeur de thèse :
Eric Rivals
Titre : Approximation de superchaîne, indexation et assemblage de génome
Doctorant : Bastien Cazaux
Date de soutenance : 2016-12-07
Directeur de thèse :
Eric Rivals
Titre : Inférences phylogénomiques basées sur les distances
Doctorant : Manuel Binet
Date de soutenance : 2015-12-15
Directeur de thèse :
Olivier Gascuel