Menu Fermer

Équipe ZENITH: Gestion de données scientifiques

Reza AKBARINIA
Reza AKBARINIA
Responsable

Équipe ZENITH

Gestion de données scientifiques

Les trois principaux défis de la gestion des données scientifiques peuvent être résumés ainsi : (1) l’échelle (grandes données, grandes applications) ; (2) la complexité (données incertaines, multi-échelles, avec beaucoup de dimensions), (3) l’hétérogénéité (en particulier, l’hétérogénéité sémantique des données). Ce sont également celles de la science des données, dont l’objectif est de donner un sens aux données en combinant la gestion des données, l’apprentissage machine, les statistiques et d’autres disciplines.

L’objectif général de Zenith est de relever ces défis, en proposant des solutions innovantes présentant des avantages significatifs en termes d’évolutivité, de fonctionnalité, de facilité d’utilisation et de performances. Pour produire des résultats génériques, ces solutions sont en termes d’architectures, de modèles et d’algorithmes qui peuvent être mis en œuvre en termes de composants ou de services dans des clusters ou le cloud.

Nous concevons et validons nos solutions en travaillant en étroite collaboration avec nos partenaires d’application scientifique tels que l’INRAe et le CIRAD en France, ou le MACC au Brésil. Pour valider davantage nos solutions et étendre la portée de nos résultats, nous encourageons également les collaborations industrielles, même dans des applications non scientifiques, à condition qu’elles présentent des défis similaires.

Permanents
Esther Pacitti, Professeur des universités, UM
Florent Masseglia, Directeur de recherche, INRIA
Alexis Joly, Directeur de recherche, INRIA
Reza Akbarinia, Chargé de recherche, INRIA
Cathy Desseaux, Assistant ingénieur, INRIA
Benjamin Bourel, Chargé de recherche, INRIA
Christophe Botella, Chargé de recherche, INRIA
Jean-Christophe Lombardo, Ingénieur de recherche, INRIA
Antoine Affouard, Ingénieur d’étude, INRIA


Doctorants
Matteo Contini, IFREMER
Kawtar Zaher, INA (Institut National de l’Audiovisuel)
Raphael Benerradi, UM
Guillaume Coulaud, UM
Théo Larcher, UM
Cesar Leblanc, INRIA
Loai Gandeel, INRIA


Autres personnels
Benoit Lange, CDD Ingénieur-Technicien, INRIA
Thomas Paillot, CDD Ingénieur-Technicien, INRIA
Jean Baptiste Fermanian, CDD Chercheur, UM
Julien Thomazo, CDD Ingénieur-Technicien, CNRS
Mathias Chouet, Invité longue durée Mission longue, CIRAD
Nadine Jacquet, CDD Ingénieur-Technicien, CNRS
Maxime Ryckewaert, CDD Chercheur, INRIA
Fabio Machado Porto, CDD Chercheur, INRIA
Axel Vaillant, CDD Ingénieur-Technicien, INRIA
Rebecca Pontes Salles, CDD Chercheur, INRIA
Pierre Leroy, CDD Ingénieur-Technicien, INRIA
Hugo Gresse, CDD Ingénieur-Technicien, INRIA
Lukas Picek, CDD Chercheur, INRIA
Patrick Valduriez, Invité longue durée Eméritat, INRIA
Joseph Salmon, Invité longue durée Délégation, INRIA
Maxime Fromholtz, CDD Ingénieur-Technicien, INRIA
Raphael De Freitas Saldanha, CDD Chercheur, INRIA

Notre approche consiste à capitaliser sur les principes de la gestion des données distribuées et parallèles. En particulier, nous exploitons : les langages de haut niveau comme base pour l’indépendance des données et l’optimisation automatique ; la sémantique des données pour améliorer la recherche d’informations et automatiser l’intégration des données ; les langages déclaratifs (algèbre, calcul) pour manipuler les données et les flux de travail ; et les environnements hautement distribués et parallèles tels que P2P, cluster et cloud. Pour refléter notre approche, nous organisons notre programme de recherche en cinq thèmes complémentaires

  • Intégration des données, notamment dans les polystores ;
  • Traitement des requêtes, y compris l’indexation et la confidentialité ;
  • Gestion des workflows scientifiques ;
  • Analyse des données, y compris l’exploration des données et les statistiques ;
  • Apprentissage automatique pour le traitement et la recherche de données en haute dimension.

Titre : Une approche prédictive de la détermination du statut de conservation conjoint des espèces
Doctorant : Joaquim Estopinan
Date de soutenance : 2023-11-28
Directeurs de thèse : François Munoz, Alexis Joly

Titre : Interprétabilité des modèles de distribution d’espèces basés sur des réseaux de neurones convolutifs
Doctorant : Benjamin Deneu
Date de soutenance : 2022-11-24
Directeurs de thèse : François Munoz, Alexis Joly

Titre : Techniques de segmentation adaptative pour une représentation efficace des séries temporelles
Doctorant : Lamia Djebour
Date de soutenance : 2022-09-13
Directeurs de thèse : Reza Akbarinia, Florent Masseglia

Titre : Gestion distribuée de workflows scientifiques pour le phénotypage des plantes à haut débit
Doctorant : Gaetan Heidsieck
Date de soutenance : 2020-12-09
Directeur de thèse : Esther Pacitti

Titre : Incertitude des prédictions dans les modèles d’apprentissage profonds appliqués à la classification fine
Doctorant : Titouan Lorieul
Date de soutenance : 2020-12-02
Directeur de thèse : Alexis Joly

Titre : Clustering Massivement Distribué via Mélange de Processus de Dirichlet
Doctorant : Khadidja Meguelati
Date de soutenance : 2020-03-13
Directeur de thèse : Florent Masseglia

Titre : préservation de la confidentialité des données externalisées dans le traitement des requêtes top-k
Doctorant : Sakina Mahboubi
Date de soutenance : 2018-11-21
Directeur de thèse : Patrick Valduriez

Titre : Indexation et analyse de très grandes masses de séries temporelles
Doctorant : Djamel Yagoubi
Date de soutenance : 2018-03-19
Directeur de thèse : Florent Masseglia

Titre : Traitement de requêtes dans les systèmes multistores
Doctorant : Paule Carlyna Celnare Bondiombouy
Date de soutenance : 2017-07-12
Directeur de thèse : Patrick Valduriez

Titre : Representations basées sur les voisins partagés pour la classification fine
Doctorant : Valentin Leveau
Date de soutenance : 2016-11-09
Directeurs de thèse : Patrick Valduriez, Alexis Joly

Titre : Gestion multisite de workflows scientifiques dans le cloud
Doctorant : Ji Liu
Date de soutenance : 2016-11-03
Directeurs de thèse : Esther Pacitti, Patrick Valduriez

Titre : Parallel Itemset Mining in Massively Distributed Environments
Doctorant : Saber Salah
Date de soutenance : 2016-04-20
Directeurs de thèse : Florent Masseglia, Reza Akbarinia