ADVANSE: ADVanced Analytics for data SciencE

Les activités de recherche menées par l’équipe projet ADVANSE s’inscrivent dans le domaine des grandes bases de données, i.e. Big Data, et plus particulièrement dans le domaine de l’Extraction de Connaissances et de la Fouille de Données. Elles concernent les principaux axes suivants :

  • Fouille de données dans des bases de données complexes : données structurées, semi structurées, multidimensionnelles, qualitatives, quantitatives, textuelles, spatio-temporelles, approximatives, bruitées ou disponibles sous la forme d’entrepôts (données multidimensionnelles, agrégées, hiérarchisées) dans un contexte d’aide à la décision ;
  • Fouille de données dans des bases de données dynamiques, i.e. dont les données sont exprimées sous la forme d’un flot de données continu, à grande vitesse et qu’il n’est pas possible de stocker ;
  • Visualisation pour aider le décideur à comprendre ses données ou à mieux appréhender les connaissances extraites ;

Fort d’une expertise reconnue depuis de nombreuses années dans le domaine de la fouille de données, ADVANSE se focalise particulièrement sur les données liées à la santé et à l’environnement.

Membres

Permanents

Non permanents

Collaborateurs réguliers

  • Dino Ienco, Chargé de Recherche

Thématiques de recherche

Faits marquants

  • Responsable scientifique de l’équipex Géosud sur le WP3.1 fouilles de données à partir d’images satellitaires
  • Des articles acceptés dans des revues ou conférences majeures : ACM Transactions on Knowledge Discovery from Data (TKDD), Transactions on Fuzzy Systems, International Journal of BioMedical Informatics, Expert Systems with Applications, Data Mining and Knowledge Discovery, Pattern Recognition, Fuzzy Systems, Journal of Intelligent Information Systems, Intelligent Data Analysis, ICDM, VLDB, PKDD, PAKDD, IDA, ACM SigSpatial, Graph Drawing
  • Participation à la création d’entreprises : Expernova, Satin-IP, Namae Concepts. Chacune de ces sociétés ayant été lauréate du concours national d’aide à la création de technologies innovantes (OSEO).

Collaborations externes

Au cours de ces années, Tatoo a établi de nombreuses collaborations qui ont donné lieu à publications ou projets en commun. Ainsi au niveau national, nous avons des collaborations principalement avec les laboratoires suivants : LIRIS (Lyon), GRAEC (Caen), LORIA (Nancy), INRIA (Paris/Sophia Antipolis), IRISA (Rennes), Saint Etienne, CEREGMIA (Martinique), LIP6 (Paris), LSTT (Strasbourg), ETIS (Cergy), LI (Blois), ENST (Paris), IRIT (Toulouse), Univ. Nouvelle Calédonie (Nouméa).

Les collaborations internationales ont permis à Tatoo de pouvoir ouvrir de nouvelles perspectives. Ainsi, à l’heure actuelle Tatoo collabore avec : Univ. Aalborg (Denmark), Univ. Alberta (Canada), Univ. Barcelona (Spain), University of Bari (Italia), Univ. Eindhoven (The Netherlands), Univ. Ottawa (Canada), Univ. Bristol (UK), Univ. Marburg (Germany), Help Univ. (Malaisia), ITB Bandung (Indonesia), Univ. Torino (Italy), Univ. Tunis (Tunisie), Univ. Alberta (Canada), Univ. Singapore (Singapore), Univ. Waikato (Nouvelle-Zélande) et Yahoo Research (Barcelona), Univ. California at Davis (USA).

Projets de recherche

  • Projet CNES (2012-2013). Caractérisation des systèmes de cultures et de leur productivité par télédétection multi sources et fouille de données, pour la sécurité alimentaire. Partenaires : CNES, UMR Tetis, CIRAD, UR-SCA.
  • Projet CNRS-Défi Masse de Données Scientiques Mastodons - AMADEUS (2012). L'objectif est de fournir à la communauté des scientifiques en Sciences de la Terre et de l’Univers, de nouvelles techniques efficaces de découverte et d’analyse des données issues des campagnes d’observation avec des instruments sol ou satellites. Montant du projet : 70 K€ - Part du LIRMM : 18 K€. Partenaires : Labri, LIF, ESPACE-DEV, CEREGE, LAM.
  • Projet de recherche VIPP (2011-2012). Ce projet qui rentre dans le cadre du Labex Numev a pour objectif de rechercher de nouvelles approches de détection de cellules rares apparaissant dans différentes pathologies (cancer, AVC, …) dans un échantillon sanguin. Montant du projet : 1 post-doc pour un an. Partenaires : Zenith, I3M, CHU UM1
  • Projet de transfert de technologie Itesoft (2012-2015). L’objectif du projet est de proposer des solutions de détections d’entité nommées et de sentiments dans des documents issus d’OCR. Montant du projet : 150 K€. Partenaires : ITESOFT, Equipe Text.
  • ANR Fresqueau (2011-2013). L’objectif du projet est de proposer des méthodes d’analyse des cours d’eau et d’étudier l’impact environnemental associé. Montant du projet 814 K€ – part du LIRMM: 65 K€. Partenaires : LHYGES, LSIIT, TETIS, AQUASCOP, AQUABIO
  • Projet ANR Datalift (2010-2013). Un ascenseur pour le Web de données. Projet ANR CONTINT plateforme pour la publication de données sur le Web. http://datalift.org. Montant du projet : 3 M€, subvention LIRMM : 150 K€. Partenaires : INRIA, Eurécom, Mondeca, Atos, IGN, INSEE, FING.
  • EQUIPEX Géosud « Infrastructure d’Information Spatiale sur les Territoires et l’Environnement » autour des approches de fouilles de données appliquées aux images de télédétection 2011-2016. L’EQUIPEX Géosud fait partie des 2 projets retenus dans la région Languedoc Roussillon lors du premier appel Initiative d’Excellence. Montant du projet total : 11,5 M€ - Part du LIRMM : 90 K€.
  • Planet Data (2010-2014), EU FP7 Network of Excellence. Projet Web sémantique. Montant du projet : 8 M€. http://planet-data.eu
  • Projet de transfert de technologie Octipas 2011. L’objectif du projet est de proposer des solutions d’analyse des achats d’internautes. Montant du projet : 8 K€.
  • FUI RIDER (Réseau et Inter Connectivité des Energies Classiques et renouvelables) 2009-2012. L’objectif du projet est la compréhension et l’influence des comportements humains ayant un impact sur l’efficacité énergétique des groupes de bâtiments. Partenaires : Université Montpellier 2 et Perpignan – Laboratoires du LIRMM, IES et ELIAUS, IBM, Cofely, coronis.Montant total du projet : 5 M€. « Obtention du 1er prix de la croissance verte numérique dans la catégorie recherche – 29/11/2010 ».
  • Projet Expernova 2 (2011-2012). L’objectif de ce projet est de poursuivre les travaux menés précédemment autour la cartographie de laboratoires et l’extension de requêtes. Montant du projet : 35 K€.
  • Projet de transfert de technologie Satin-Ip (2008-2011). L’objectif du projet est de proposer des approches de recherche d’information dans des fichiers logs hétérogènes. Ce transfert est en complément d’une bourse Cifre. Montant du projet : 30 K€.
  • Projet de transfert de technologie Tecnalia (Spain) 2008-2011. L’objectif du projet est de proposer des approches d’aide à la maintenance. Ce transfert est en complément d’une bourse Cifre. Montant du projet : 30 K€.
  • ANR AAP PRADNET (PRIMATE ALZHEIMER'S DISEASE NETWORK) – Plan Alzheimer 2008-2012. L’objectif de ce projet est de proposer une aide à la détermination des gènes impliqués dans la maladie d’Alzheimer en utilisant des techniques de fouilles de données. Montant du projet : 500 K€.
  • Projet de transfert de technologie avec la société Nevantropic (2009). L’objectif de ce projet est de réaliser un démonstrateur de suivi du virus de la grippe A(H1N1) à l’aide de dépêche de presse. Montant du projet : 10 K€.
  • Projet de transfert de technologie avec la société Expernova (2009). L’objectif de ce projet est de réaliser la cartographie de laboratoires et l’extension de requêtes. Montant du projet : 35 K€.
  • Projet de transfert de technologie avec la société Ibiskus (2009). L’objectif de ce projet est de réaliser une approche d’extraction de connaissances basées sur les règles graduelles dans un contexte d’entrepôt de données. Montant du projet : 18 K€.
  • ANR Masse de Données MIDAS (2008-2011). L’objectif est de proposer de nouveaux résumés pour les flots de données et de mettre en place une approche générique pour différents domaines d’applications. Partenaires : LIRMM, LGI2P, INRIA, ENST, Université Antilles Guyanes, EDF R&D, FT R&D. Montant du projet : 723  K€.
  • Projet de transfert de technologie avec la société WebReport (2010) : Détection automatique de catastrophes via les tweets. Montant du projet : 21  K€.

Prototypes

Liste des séminaires invités (archives)

Publications de l'équipe à partir de 2008

Les anciens

  • Hugo Alatrista-Salas. Actuellement, Post-Doc à l'Université Pontificia Universidad Católica, Peru
  • Phan Nhat Hai. Actuellement, Post-Doc à l'Université d'état de l'Oregon, USA
  • Benjamin Duthil. Actuellement, Post Doc à l'Université de La Rochelle.
  • Sarrah Ayouni. Actuellement, Maître de conférences à l'Université de Tunis, Tunisie.
  • Hassan Saneifar. Actuellement, Ingénieur Recherche et Développement dans la société Satin Technologies.
  • Julien Rabatel. Actuellement, Post Doc au LIRMM.
  • Yoann Pitarch. Actuellement, Maître de conférences à l'Université de Toulouse.
  • Lisa Di Jorio. Actuellement, Consultant en informatique
  • Paola Salle. Actuellement, Responsable du département recherche dans la société Expertise Radiologie, Montpellier
  • Haoyuan Li. Actuellement, Maître de conférences à l'Université François Rabelais Tours, France.
  • Chedy Raissi. Actuellement, Chercheur à l'Institut National de Recherche en Informatique et en Automatique (INRIA), LORIA, Nancy, France.
  • Marc Plantevit. Actuellement, Maître de conférences à l'Université de Lyon 1.

Ressources

Mots-clés

Extraction et gestion de connaissances, fouille de données, motifs séquentiels, entrepôts de données, logique floue, ontologies, annotation automatique, bases de données

Dernière mise à jour le 07/03/2017