L’annotation fonctionnelle vise à identifier les éléments d’un génome impliqués dans une fonction cellulaire particulière. Nos travaux dans ce cadre s’articulent autour de deux axes.
Le premier axe vise à identifier les signaux génomiques responsable de la régulation de l’expression des gènes dans une condition donnée (un type cellulaire ou un traitement particulier). L’expression des gènes d’une cellule est un processus finement contrôlé. Ces contrôles prennent place à différents niveaux (transcriptionnel, post-transcriptionnel, …) et font intervenir différentes séquences régulatrices (promoters, enhancers, UTR, …). Dans ce cadre, nous développons des méthodes informatiques et statistiques pour identifier et modéliser, dans un type de séquence régulatrice donné, les sites de fixation des facteurs de transcription responsables d’un profil d’expression particulier (Lajoie et al., 2012). Une autre partie de nos travaux vise à construire un modèle statistique global pour prédire l’expression d’un gène en fonction de l’ensemble de ses séquences régulatrices (Bessière et al., 2017).
Le second axe de recherche a pour objectif l’amélioration de la sensibilité des outils d’annotation de protéines, et notamment des domaines, qui constituent les unités fonctionnelles de ces molécules. Pour cela nous développons des méthodes pour améliorer la sensibilité des outils d’annotation basés sur les HMMs (Hidden Markov Models), ou pour identifier de manière automatique des nouvelles familles de domaines non encore référencées dans les bases de domaines protéiques (Terrapon et al. 2009, Ghouila et al. 2014, Menichelli et al. 2017). Une autre partie de nos travaux concernent les méthodes de prédiction de sites de fixation aux ligands des séquences protéiques, grâce à la prédiction de la structure 3D de la protéine cible (Roche et al. 2016).