Menu Fermer

Équipe ZENITH: Gestion de données scientifiques

Patrick VALDURIEZ
Responsable
Florent MASSEGLIA
Adjoint

Équipe ZENITH

Gestion de données scientifiques

Les trois principaux défis de la gestion des données scientifiques peuvent être résumés ainsi : (1) l’échelle (grandes données, grandes applications) ; (2) la complexité (données incertaines, multi-échelles, avec beaucoup de dimensions), (3) l’hétérogénéité (en particulier, l’hétérogénéité sémantique des données). Ce sont également celles de la science des données, dont l’objectif est de donner un sens aux données en combinant la gestion des données, l’apprentissage machine, les statistiques et d’autres disciplines.

L’objectif général de Zenith est de relever ces défis, en proposant des solutions innovantes présentant des avantages significatifs en termes d’évolutivité, de fonctionnalité, de facilité d’utilisation et de performances. Pour produire des résultats génériques, ces solutions sont en termes d’architectures, de modèles et d’algorithmes qui peuvent être mis en œuvre en termes de composants ou de services dans des clusters ou le cloud.

Nous concevons et validons nos solutions en travaillant en étroite collaboration avec nos partenaires d’application scientifique tels que l’INRAe et le CIRAD en France, ou le MACC au Brésil. Pour valider davantage nos solutions et étendre la portée de nos résultats, nous encourageons également les collaborations industrielles, même dans des applications non scientifiques, à condition qu’elles présentent des défis similaires.

Permanents
Esther Pacitti, Professeur des universités, UM
Florent Masseglia, Directeur de recherche, INRIA
Alexis Joly, Directeur de recherche, INRIA
Antoine Liutkus, Chargé de recherche, INRIA
Reza Akbarinia, Chargé de recherche, INRIA
Patrick Valduriez, Directeur de recherche, INRIA
Jean-Christophe Lombardo, Ingénieur de recherche, INRIA

Doctorants
Lamia Djebour, Gouv. Algérien
Tanguy Lefort, UM
Joaquim Estopinan, INRIA
Camille Garcin, UM
Quentin Leroy, INA (Institut National de l’Audiovisuel)
Benjamin Deneu, INRIA

Autres personnels
Shamprikta Mehreen, CDD Ingénieur-Technicien, INRIA
Mathias Chouet, CDD Ingénieur-Technicien, INRIA
Titouan Lorieul, CDD Chercheur, INRIA
Pierre Leroy, CDD Ingénieur-Technicien, INRIA
François Munoz, Invité longue durée Chaire INRIA, INRIA
Hugo Gresse, CDD Ingénieur-Technicien, INRIA
Baldwin Dumortier, CDD Chercheur, UM
Cathy Desseaux, CDD Ingénieur-Technicien, INRIA
Ondrej Cifka, , UM
Antoine Affouard, CDD Ingénieur-Technicien, INRIA

Notre approche consiste à capitaliser sur les principes de la gestion des données distribuées et parallèles. En particulier, nous exploitons : les langages de haut niveau comme base pour l’indépendance des données et l’optimisation automatique ; la sémantique des données pour améliorer la recherche d’informations et automatiser l’intégration des données ; les langages déclaratifs (algèbre, calcul) pour manipuler les données et les flux de travail ; et les environnements hautement distribués et parallèles tels que P2P, cluster et cloud. Pour refléter notre approche, nous organisons notre programme de recherche en cinq thèmes complémentaires

  • Intégration des données, notamment dans les polystores ;
  • Traitement des requêtes, y compris l’indexation et la confidentialité ;
  • Gestion des workflows scientifiques ;
  • Analyse des données, y compris l’exploration des données et les statistiques ;
  • Apprentissage automatique pour le traitement et la recherche de données en haute dimension.