Menu Fermer

Équipe ZENITH: Gestion de données scientifiques

Reza AKBARINIA
Reza AKBARINIA
Responsable

Équipe ZENITH

Gestion de données scientifiques

Les trois principaux défis de la gestion des données scientifiques peuvent être résumés ainsi : (1) l’échelle (grandes données, grandes applications) ; (2) la complexité (données incertaines, multi-échelles, avec beaucoup de dimensions), (3) l’hétérogénéité (en particulier, l’hétérogénéité sémantique des données). Ce sont également celles de la science des données, dont l’objectif est de donner un sens aux données en combinant la gestion des données, l’apprentissage machine, les statistiques et d’autres disciplines.

L’objectif général de Zenith est de relever ces défis, en proposant des solutions innovantes présentant des avantages significatifs en termes d’évolutivité, de fonctionnalité, de facilité d’utilisation et de performances. Pour produire des résultats génériques, ces solutions sont en termes d’architectures, de modèles et d’algorithmes qui peuvent être mis en œuvre en termes de composants ou de services dans des clusters ou le cloud.

Nous concevons et validons nos solutions en travaillant en étroite collaboration avec nos partenaires d’application scientifique tels que l’INRAe et le CIRAD en France, ou le MACC au Brésil. Pour valider davantage nos solutions et étendre la portée de nos résultats, nous encourageons également les collaborations industrielles, même dans des applications non scientifiques, à condition qu’elles présentent des défis similaires.

Permanents
Esther Pacitti, Professeur des universités, UM
Florent Masseglia, Directeur de recherche, INRIA
Alexis Joly, Directeur de recherche, INRIA
Reza Akbarinia, Chargé de recherche, INRIA
Cathy Desseaux, Assistant ingénieur, INRIA
Benjamin Bourel, Chargé de recherche, INRIA
Christophe Botella, Chargé de recherche, INRIA
Jean-Christophe Lombardo, Ingénieur de recherche, INRIA
Antoine Affouard, Ingénieur d’étude, INRIA

Doctorants
Matteo Contini, IFREMER
Tanguy Lefort, UM
Kawtar Zaher, INA (Institut National de l’Audiovisuel)
Guillaume Coulaud, UM
Cesar Leblanc, INRIA
Ananthu Aniraj, INRIA

Autres personnels
Thomas Paillot, CDD Ingénieur-Technicien, INRIA
Julien Thomazo, CDD Ingénieur-Technicien, CNRS
Nadine Jacquet, CDD Ingénieur-Technicien, CNRS
Maxime Ryckewaert, CDD Chercheur, INRIA
Rebecca Pontes Salles, CDD Chercheur, INRIA
Konstantinos Panousis, CDD Chercheur, INRIA
Pierre Leroy, CDD Ingénieur-Technicien, INRIA
Jules Vandeputte, CDD Chercheur, INRIA
Hugo Gresse, CDD Ingénieur-Technicien, INRIA
Théo Larcher, CDD Ingénieur-Technicien, INRIA
Camille Garcin, CDD Chercheur, INRIA
Lukas Picek, CDD Chercheur, INRIA
Patrick Valduriez, Invité longue durée Eméritat, INRIA
Maxime Fromholtz, CDD Ingénieur-Technicien, INRIA
Raphael De Freitas Saldanha, CDD Chercheur, INRIA

Notre approche consiste à capitaliser sur les principes de la gestion des données distribuées et parallèles. En particulier, nous exploitons : les langages de haut niveau comme base pour l’indépendance des données et l’optimisation automatique ; la sémantique des données pour améliorer la recherche d’informations et automatiser l’intégration des données ; les langages déclaratifs (algèbre, calcul) pour manipuler les données et les flux de travail ; et les environnements hautement distribués et parallèles tels que P2P, cluster et cloud. Pour refléter notre approche, nous organisons notre programme de recherche en cinq thèmes complémentaires

  • Intégration des données, notamment dans les polystores ;
  • Traitement des requêtes, y compris l’indexation et la confidentialité ;
  • Gestion des workflows scientifiques ;
  • Analyse des données, y compris l’exploration des données et les statistiques ;
  • Apprentissage automatique pour le traitement et la recherche de données en haute dimension.