Menu Fermer

Méthodes pour l’étude de la régulation de l’expression

Bien que toutes les cellules d’un organisme contiennent une copie du même génome, leur programme d’expression—c.‐à‐d. quels gènes sont actifs ou réprimés— est très différent d’un type cellulaire à l’autre. Caractériser le code régulateur, c’est‐à‐dire la grammaire génomique qui régule l’expression des gènes, est un domaine de recherche intense, avec de nombreuses applications en génétique et en cancérologie. Dans cette optique, l’équipe développe différentes approches suivant deux axes principaux.

Machine Learning pour l’étude de la régulation transcriptionnelle

Notre stratégie repose sur le développement de modèles statistiques capables de prédire un signal transcriptionnel sur la base uniquement de la séquence ADN. L’idée est que si le modèle est suffisamment précis (ce que l’on évalue) c’est qu’il a vraisemblablement capturé les éléments (motifs ou séquences) qui régulent le signal étudié. Nous avons donc le souci de développer des modèles à la fois précis et interprétables, pour lesquels nous pouvons extraire les combinaisons de motifs expliquant la prédiction. Ces travaux sont au coeur de l’équipe PRIME ML4RegGen.

Traduction des ARN, épitranscriptome et cancer

Deux enjeux majeurs de la prise en charge du cancer sont 1/ la détection précoce, et 2/ l’adaptation et l’acquisition de résistance aux traitements par les cellules cancéreuses. Par exemple, les rechutes et la résurgence de la tumeur après une chimiothérapie pour le cancer colorectal sont bien documentées, mais les mécanismes moléculaires restent flous. Dans l’expression génique, la transcription des gènes en ARN a été fort étudiée dans divers cancers sans expliquer l’acquisition de résistance ; en revanche, la seconde phase qui est réalisée par les ribosomes, la traduction des ARN en protéines, reste à explorer. Pour cela, l’équipe développe différentes approches alliant algorithme du texte et IA