La fouille pour la santé

L’équipe a souhaité, depuis 2008, illustrer les travaux réalisés sur des applications associées à la santé et à l’environnement.

Le domaine de la santé ouvre des perspectives de recherche motivantes. Nos travaux se sont intéressés à l’extraction de motifs (au sens large) à partir de données de puces ADN pour obtenir des connaissances inattendues pour les biologistes. Ainsi, via des collaborations avec le MMDN-UM2 et dans le cas de l’ANR Pradnet de la Fondation de Coopération Scientifique Maladie d’Alzheimer et Maladies Apparentées, nous avons reconsidéré le problème en organisant les données en tenant compte du degré d’expression des différents gènes (Thèse Paola Salle). Cette nouvelle approche a permis aux biologistes de faire apparaître de nouvelles corrélations qui n’étaient pas connues. En outre, afin d’aider le biologiste dans l’analyse des motifs extraits, nous avons défini et mis en œuvre un outil de visualisation mettant en lien les articles de PubMed qui traitent les différents gènes impliqués dans les motifs extraits (article sélectionné pour la revue « Journal of Biomedical Informatics »).

La découverte de nouvelles connaissances via les motifs pose le problème de leur généralisation : sont-ils représentatifs d’un contexte donné ou bien plus généraux ? Ces questions nous ont poussé à définir de nouvelles approches de classification de motifs (Master de Mickael Fabregue). Ces travaux, en partenariat avec l’INSERM Val d’Aurelle, sont prometteurs pour caractériser les différents grades de cancers du sein. Les résultats obtenus améliorent significativement les résultats des travaux existants (précision et rappel de 96%) (autre article sélectionné pour la revue « Journal of Biomedical Informatics »).

Dans le cadre d’un PEPS avec l’IGMM, nous travaillons actuellement sur la problématique des différentes souches de HIV. Outre l’application de motifs, nous avons étendus nos travaux à la prise en compte de trajectoires de gènes qui s’expriment de la même manière au cours du temps. Des expériences biologiques sont en cours afin de valider les nouvelles connaissances ainsi obtenues.

A une autre échelle, l’équipe s’est intéressée aux cellules rares dans le sang. La problématique est de déterminer parmi des millions de cellules, celles (5 à 10) correspondant au début d’une maladie ou d’une infection (cancer, AVC). Dans le cadre du Labex Numev, nos travaux ont permis de définir une nouvelle approche de détection innovante d’outliers. Il est ainsi possible pour le médecin d’extraire un sous-ensemble minimal de clusters dans lequel les cellules rares apparaissent. Un brevet Européen a été déposé et une demande de création d’entreprise via la SATT régionale et gérée par les médecins du LCCRH - Institut de Recherche en Biothérapie est en cours. Récemment, via des techniques de visual analytics, nous avons prouvé qu’il était possible de n’extraire que les vraies cellules rares. Ce résultat, limitant ainsi les faux positifs, offre de nouvelles perspectives thérapeutiques pour les médecins.

Afin de mieux appréhender les évolutions d’une maladie, nous nous sommes intéressés aux données échangées entre les patients dans les médias. Dans ce cadre et en collaboration avec l’équipe Texte du LIRMM et l’INVS, nous avons étudié les échos du H1N1 sur le web afin de mieux appréhender comment les nouvelles de maladies se propagent au sein des médias, à partir d’une classification de données adaptées à ce contexte et intégrant des techniques issues du traitement automatique du langage. Ces travaux nous ont poussé à mieux appréhender l’impact des nouveaux médias et de déterminer les possibilités d’acquérir les signaux faibles à partir de gros volumes de données. Dans ce cadre nous avons proposé une nouvelle approche de cube de textes, i.e. pour pouvoir analyser les tendances, les pics de maladie, etc. Nous avons définis de nouvelles fonctions d’agrégation (article sélectionné dans Emerging Trends in Knowledge Discovery and Data Mining, 2013). Ces travaux se poursuivent dans le cadre d’une collaboration avec l’Université d’Alberta et d’un financement de la MSH-M, avec notamment le Centre d'investigation clinique du CHU de Montpellier pour identifier les sentiments et émotions exprimés dans les forums de santé.

Dernière mise à jour le 01/12/2014