De 1996 à 2001, mes activités de recherche ont
été réalisées dans le Laboratoire LIRMM
(Univ. Montpellier II) dans l'équipe Bases de Données et
Système d'Information. De 2001 à 2008, j'ai travaillé dans
le Centre de Recherche LGI2P de l'Ecole
des Mines d'Alès où j'étais responsable du projet KDD du LGI2P. Depuis
2009, je suis responsable de l'équipe Tatoo sur la thématique de la
Fouille de Données au LIRMM. Dernièrement ce projet s'est focalisé sur
des approches complémentaires d'analyses de gros volumes de données
dans un contexte de Big Data et est devenu le projet Advanse (ADVanced ANalytics for data SciencE).
Si vous êtes intéressés par un projet industriel,
un transfert de technologies, des activités de recherches autour
de la fouille de données que vous souhaitez mener,
n'hésitez pas à me contacter (mon adresse mail est en
haut de la page).
Si vous êtes intéressés par des sujets de
thèse (en partenariat ou non avec une entreprise), des sujets de
masters, des propositions de stages autour de la fouille de
données, n'hésitez pas à me contacter.
Le projet Advanse
Les
activités de recherche menées par l’équipe projet ADVANSE s’inscrivent
dans le domaine des grandes bases de données, i.e. Big Data, et plus
particulièrement dans le domaine de l’Extraction de Connaissances, de
la Fouille de Données et du Visual Analytics. Elles concernent les
principaux axes suivants :
Fouille de données dans des bases de données complexes : données
structurées, semi structurées, multidimensionnelles, qualitatives,
quantitatives, textuelles, spatio-temporelles, approximatives, bruitées
ou disponibles sous la forme d’entrepôts (données multidimensionnelles,
agrégées, hiérarchisées) dans un contexte d’aide à la décision ;
Fouille de données dans des bases de données dynamiques, i.e. dont les
données sont exprimées sous la forme d’un flot de données continu, à
grande vitesse et qu’il n’est pas possible de stocker ;
Visualisation pour aider le décideur à comprendre ses données ou à mieux appréhender les connaissances extraites ;
Fort d’une expertise reconnue depuis de nombreuses années dans le
domaine de la fouille de données, ADVANSE se focalise particulièrement
sur les données liées à la santé et à l’environnement. (ADVanced ANalytics for data SciencE).
Projets
Le résultat de nos travaux est souvent utilisés dans un
grand nombre de projets industriels, de transfert de technologies ou plus académiques.
Responsable LIRMM du
Projet CNES (2012-2013). Caractérisation des systèmes de cultures et de
leur productivité par télédétection multi sources et fouille de
données, pour la sécurité alimentaire. Partenaires : CNES, UMR Tetis,
CIRAD, UR-SCA.
Partenaire LIRMM du Projet CNRS-Défi Masse de Données
Scientiques Mastodons - AMADEUS (2012). L'objectif est de fournir à la
communauté des scientifiques en Sciences de la Terre et de l’Univers,
de nouvelles techniques efficaces de découverte et d’analyse des
données issues des campagnes d’observation avec des instruments sol ou
satellites. Montant du projet : 70 K€ - Part du LIRMM : 18 K€.
Partenaires : Labri, LIF, ESPACE-DEV, CEREGE, LAM.
Co-responsable du projet de recherche VIPP 2011-2012. Ce
projet qui rentre dans le cadre du Labex Numev a pour objectif de
rechercher de nouvelles approches de détection de cellules rares
apparaissant dans différentes pathologies (cancer, AVC, …) dans un
échantillon sanguin.
Co-responsable du projet de transfert de technologie
Itesoft 2012-2015. L’objectif du projet est de proposer des solutions
de détections d’entité nommées et de sentiments dans des documents
issus d’OCR.
Partenaire de l’ANR Fresqueau (2011-2013). L’objectif du
projet est de proposer des méthodes d’analyse des cours d’eau et
d’étudier l’impact environnemental associé.
Partenaire et responsable LIRMM de l’EQUIPEX Géosud «
Infrastructure d’Information Spatiale sur les Territoires et
l’Environnement » autour des approches de fouilles de données
appliquées aux images de télédétection 2011-2016. L’EQUIPEX Géosud fait
partie des 2 projets retenus dans la région Languedoc Roussillon lors
du premier appel Initiative d’Excellence.
Responsable du projet de transfert de technologie LRI-
Octipas 2011. L’objectif du projet est de proposer des solutions
d’analyse des achats d’internautes.
Partenaire du FUI RIDER (Réseau et Inter Connectivité des
Energies Classiques et renouvelables) 2009-2012. L’objectif du projet
est la compréhension et l’influence des comportements humains ayant un
impact sur l’efficacité énergétique des groupes de bâtiments.
Partenaires : Université Montpellier 2 et Perpignan – Laboratoires du
LIRMM, IES et ELIAUS, IBM, Cofely, coronis. « Obtention du 1er prix de
la croissance verte numérique dans la catégorie recherche – 29/11/2010
».
Responsable du projet de transfert de technologie dans le
cadre d’OSEO avec la société Expernova en 2011. L’objectif de ce projet
est de poursuivre les travaux menés précédemment autour la cartographie
de laboratoires et l’extension de requêtes.
Responsable du projet de transfert de technologie Satin-Ip
2008-2011. L’objectif du projet est de proposer des approches de
recherche d’information dans des fichiers logs hétérogènes. Ce
transfert est en complément d’une bourse Cifre.
Responsable du projet de transfert de technologie Tecnalia
(Spain) 2008-2011. L’objectif du projet est de proposer des approches
d’aide à la maintenance. Ce transfert est en complément d’une bourse
Cifre.
Partenaire de l’ANR AAP PRADNET (PRIMATE ALZHEIMER'S
DISEASE NETWORK) – Plan Alzheimer 2008-2012. L’objectif de ce projet
est de proposer une aide à la détermination des gènes impliqués dans la
maladie d’Alzheimer en utilisant des techniques de fouilles de données.
Responsable du projet de transfert de technologie avec la
société Nevantropic en 2009. L’objectif de ce projet est de réaliser un
démonstrateur de suivi du virus de la grippe A(H1N1) à l’aide de
dépêche de presse.
Responsable du projet de transfert de technologie avec la
société Expernova en 2009. L’objectif de ce projet est de réaliser la
cartographie de laboratoires et l’extension de requêtes.
Responsable scientifique de l’ANR Masse de Données MIDAS
(2008-2011). L’objectif est de proposer de nouveaux résumés pour les
flots de données et de mettre en place une approche générique pour
différents domaines d’applications : médical, télécommunication et santé. Partenaires : LIRMM, LGI2P, INRIA,
ENST, Université Antilles Guyanes, EDF R&D, FT R&D.
Le projet KDD (Knowledge Discovery for
Decision making) 2001-2008
Le
projet KDD (Knowledge Discovery for Decision making) mené au sein du
Centre de Recherche LGI2P de l'Ecole des Mines d'Alès avait pour
objectif
de définir de nouveaux algorithmes (basées principalement
sur des règles d'association, des motifs séquentiels, du
clustering et de la classification) pour la fouille de données
en fonction des domaines d'applications visés (Text
Mining, Web Usage Mining, DNA Array Mining, Privacy Mining, Data
Streams mining). Il s'intéressait également à la
visualisation et la représentation des connaissances extraites.