| Titre : | Intégration de Schémas Large Echelle | | Type de document : | texte imprimé | | Auteurs : | Khalid SALEEM, Auteur | | Année de publication : | 2008 | | Langues : | Français (fre) | | Tags : | DATA INTEROPERABILITY XML SCHEMA TREE SCHEMA MATCHING SCHEMA MAPPING SCHEMA INTEGRATION SCHEMA MEDIATION MINI-TAXONOMIES TREE MINING LARGE SCALE ONTOLOGY LEARNING COLLABORATIVE ONTOLOGY CONSTRUCTION | | Index. décimale : | THE Thèses de doctorat | | Résumé : | Le besoin d'intégrer et d'analyser des grands ensembles de données issus des bases de données publiées sur le web est présent dans de nombreux domaines d'applications comme la génomique, l'environnement, la médecine et le commerce électronique. Nous avons proposé une méthode automatique PORSCHE (Performance ORiented SCHEma Mediation) qui permet d'intégrer plusieurs schémas simultanément et de fournir un schéma médiateur. Cette méthode utilise un algorithme basé sur la fouille d'arbres (tree mining) a été implémentée et expérimentée sur un grand nombre de schémas disponibles sur le web. Nous nous intéressons aussi à la construction d'ontologie à partir de schemas XML disponible sur le web. Nous proposons une approche automatique et collaborative pour la construction d'ontologie sans interaction directe avec les utilisateurs du domaine, des experts ou des développeurs. Une des caractéristiques très importante d'une ontologie est sa structure hiérarchique des concepts. Nous considérons des grands ensembles de schémas pour un domaine spécifique comme étant des arbres et leur appliquons des algorithmes d'extraction de sous-arbres fréquents pour découvrir des motifs (patterns) hiérarchiques en vue de construire une ontologie. Enfin, nous présentons un technique pour découvrir et proposer des correspondances complexes entre deux schemas. Ces correspondances sont ensuite validées à l'aide des mini-taxonomies qui sont les sous-arbres fréquents. Schema Matching and Integration in Large Scale Scenarios
Semantic matching of schemas in heterogeneous data sharing systems is time consuming and error prone. The dissertation presents a new robust automatic method, PORSCHE (Performance ORiented SCHEma Mediation), which integrates a large set of domain specific schemas, represented as tree structures, based upon semantic correspondences among them. The method also creates the mappings from source schemas to the integrated schema. The dissertation also gives a detail discussion about the state of the art in schema matching. We summarize the deficiencies in the currently available tools and techniques for meeting the requirements of large scale schema matching scenarios. Our approach is juxtaposed to these shortcomings and its advantages are highlighted with sound experimental support. Moreover, we present a technique for discovering complex match (1:n, n:1 and n:m) propositions between two schemas, validated by mini-taxonomies. These mini-taxonomies are extracted from the large set of domain specific metadata instances represented as tree structures. We propose a framework, called ExSTax (Extracting Structurally Coherent Mini-Taxonomies) based on frequent sub-tree mining, to support our idea. We further extend the ExSTax framework for extracting a reliable domain specific taxonomy. | | Directeur(s) de thèse : | BELLAHSENE Z. | | Rapporteur(s) : | SOULE-DUPUY C.;VALDURIEZ C. | | Examinateur(s) : | HACID M.S.;HERIN D.;HUNT E. | | Date de soutenance : | 27/11/2008 |
Intégration de Schémas Large Echelle [texte imprimé] / Khalid SALEEM, Auteur . - 2008. Langues : Français ( fre) | Tags : | DATA INTEROPERABILITY XML SCHEMA TREE SCHEMA MATCHING SCHEMA MAPPING SCHEMA INTEGRATION SCHEMA MEDIATION MINI-TAXONOMIES TREE MINING LARGE SCALE ONTOLOGY LEARNING COLLABORATIVE ONTOLOGY CONSTRUCTION | | Index. décimale : | THE Thèses de doctorat | | Résumé : | Le besoin d'intégrer et d'analyser des grands ensembles de données issus des bases de données publiées sur le web est présent dans de nombreux domaines d'applications comme la génomique, l'environnement, la médecine et le commerce électronique. Nous avons proposé une méthode automatique PORSCHE (Performance ORiented SCHEma Mediation) qui permet d'intégrer plusieurs schémas simultanément et de fournir un schéma médiateur. Cette méthode utilise un algorithme basé sur la fouille d'arbres (tree mining) a été implémentée et expérimentée sur un grand nombre de schémas disponibles sur le web. Nous nous intéressons aussi à la construction d'ontologie à partir de schemas XML disponible sur le web. Nous proposons une approche automatique et collaborative pour la construction d'ontologie sans interaction directe avec les utilisateurs du domaine, des experts ou des développeurs. Une des caractéristiques très importante d'une ontologie est sa structure hiérarchique des concepts. Nous considérons des grands ensembles de schémas pour un domaine spécifique comme étant des arbres et leur appliquons des algorithmes d'extraction de sous-arbres fréquents pour découvrir des motifs (patterns) hiérarchiques en vue de construire une ontologie. Enfin, nous présentons un technique pour découvrir et proposer des correspondances complexes entre deux schemas. Ces correspondances sont ensuite validées à l'aide des mini-taxonomies qui sont les sous-arbres fréquents. Schema Matching and Integration in Large Scale Scenarios
Semantic matching of schemas in heterogeneous data sharing systems is time consuming and error prone. The dissertation presents a new robust automatic method, PORSCHE (Performance ORiented SCHEma Mediation), which integrates a large set of domain specific schemas, represented as tree structures, based upon semantic correspondences among them. The method also creates the mappings from source schemas to the integrated schema. The dissertation also gives a detail discussion about the state of the art in schema matching. We summarize the deficiencies in the currently available tools and techniques for meeting the requirements of large scale schema matching scenarios. Our approach is juxtaposed to these shortcomings and its advantages are highlighted with sound experimental support. Moreover, we present a technique for discovering complex match (1:n, n:1 and n:m) propositions between two schemas, validated by mini-taxonomies. These mini-taxonomies are extracted from the large set of domain specific metadata instances represented as tree structures. We propose a framework, called ExSTax (Extracting Structurally Coherent Mini-Taxonomies) based on frequent sub-tree mining, to support our idea. We further extend the ExSTax framework for extracting a reliable domain specific taxonomy. | | Directeur(s) de thèse : | BELLAHSENE Z. | | Rapporteur(s) : | SOULE-DUPUY C.;VALDURIEZ C. | | Examinateur(s) : | HACID M.S.;HERIN D.;HUNT E. | | Date de soutenance : | 27/11/2008 |
|