Sujet de TER.

Responsable : Zohra Bellahsene

Algorithme de recherche de correspondances entre schémas

Le principe de médiation de données consiste à fournir à un utilisateur un accès uniforme et transparent à la localisation et l'hétérogénéité des données. Quelle que soit l'architecture adoptée, "entrepôt de données" ou "virtuelle", la définition d'un schéma médiateur est nécessaire pour jouer le rôle d'interface uniforme sur lequel l'utilisateur peut formuler ses requêtes. Pour cela, les relations de correspondance (ou mapping) entre les sources de données et le schéma médiateur doivent être spécifiées ou de préférence automatiquement générées afin que les requêtes exprimées sur le schéma médiateur puissent être traduites automatiquement sur les schémas des sources. Nous nous intéressons ici à la recherche de correspondances (mapping) entre arbres dans le contexte XML.

Travail à faire

Plusieurs méthodes de recherche de mappings ont été proposées, ce sujet de stage vise à étendre nos propres travaux pour prendre en compte l’existence d’ontologies de domaines pour optimiser la recherche de mappings dans un contexte de grande échelle où le nombre de schéma est très grand. Les algorithmes proposés doivent être implémentés et testées sur des exemples concrets et pertinents pour validé la grande échelle qui est le contexte de l’étude.