Activités scientifiques

FADO s’intéresse à un ensemble de problématiques autour des données ouvertes et liées. 

Les données ouvertes peuvent être définies comme des données disponibles sur le Web de manière gratuite à toute personne qui souhaiterait les accéder et les traiter. Le mouvement d’ouverture des données est croissant, les institutions et organisations rendent de plus en plus de données accessibles, pour des raisons réglementaires, éthiques ou politiques et modifient le paysage socio-économique en permettant la création de nouveaux services. 

Cependant, l’ouverture des données pose plusieurs défis scientifiques dont l’articulation est spécifique à ce contexte. 

Tout d’abord, les données sont très hétérogènes en termes de format, de protocoles et de services, de qualité, etc. 

De plus, le volume de données à traiter croit de manière très importante, le passage à l’échelle devient donc un défi important. 

Nous avons donc pour objectif de définir de nouvelles méthodes et outils pour assurer l’interopérabilité des données ouvertes en prenant en compte les différents niveaux d’hétérogénéité (sémantique, linguistique, etc.) ainsi que l'hétérogénéité des métadonnées qui y sont associées.

Ces travaux portent plus particulièrement sur l’alignement d’ontologies qui est une tache cruciale pour l’intégration de données et la publication de données interconnectées sur le Web. L’un des problèmes posés est de pouvoir aligner d’une façon incrémentale de nouvelles ontologies et d’intégrer leur évolution (croissance, fusion) dans le contexte dynamique du web sémantique. De manière synthétique, les défis sont liés à : la prise en compte de l’imprécision des données, la prise en compte de données multi-langues, la production d’alignements complexes (many to many), la prise en compte des niveaux de granularités hétérogènes, etc. 

L'équipe FADO porte de plus une attention particulière aux données liées (Linked Open Data) qui repose sur des standards du Web pour augmenter l’accessibilité des données publiées et créer le Web des données. 

De même qu’exposé précédemment, la quantité de données à traiter et leurs spécificités requièrent des méthodes et outils puissants. Nous explorons ainsi l’exploitation des bases de données NoSQL en graphes ainsi que les outils de découverte et de recommandation de sources de données.

Dernière mise à jour le 28/06/2017