A partir de cette page vous pouvez :
| Retourner au premier écran avec les dernières notices... |
Résultat de la recherche
3 résultat(s) recherche sur le tag 'schema matching'
Affiner la recherche Interroger des sources externesContributions à l'IDM : Reconstruction et Alignement de Modèles de Classes / Jean-Rémy FALLERI
Titre : Contributions à l'IDM : Reconstruction et Alignement de Modèles de Classes Type de document : texte imprimé Auteurs : Jean-Rémy FALLERI, Auteur Année de publication : 2009 Langues : Français (fre) Tags : SOFTWARE ENGINEERING MODEL DRIVEN ENGINEERING UML CLASS MODELS OBJECT-ORIENTED DESIGN SOFTWARE MAINTENANCE SCHEMA MATCHING META-MODELING Index. décimale : THE Thèses de doctorat Résumé : Avec l'émergence du paradigme Ingénierie Dirigée par les Modèles (IDM) pour la conception de logiciels, la phase de modélisation des domaines devient de plus en plus primordiale. Lors de cette phase, les concepteurs modélisent, souvent à l'aide d'un langage à classes, un domaine particulier créant ainsi des méta-modèles. Des modèles dérivés de ces méta-modèles sont utilisés ultérieurement lors de la conception, par exemple pour générer du code source. Comme les domaines à modéliser sont de plus en plus volumineux et complexes, la maintenance des méta-modèles risque de vite devenir problématique. En outre, des outils complexes sont développés pour manipuler les modèles. Malheureusement, il est fréquent que des développeurs différents développent plusieurs méta-modèles représentant un même domaine. Les concepteurs d'outils doivent donc gérer des transformations de modèles entre ces méta-modèles similaires, ce qui est une tâche fastidieuse. Dans cette thèse, nous proposons deux contributions visant à faciliter la maintenance de logiciels développés en suivant le paradigme IDM. La première de ces contributions est une approche qui permet d'éliminer toutes les redondances (attributs et méthodes dupliquées) d'un modèle de classes, en y introduisant de nouvelles super-classes. Notre approche utilise un dérivé de l'Analyse Formelle de Concepts ainsi que plusieurs techniques de traitement automatique des langues. En plus de l'élimination des redondances et de la découverte de nouvelles super-classes, cette approche est capable de découvrir des attributs et méthodes abstraits qui facilitent la réutilisation et améliorent le niveau d'abstraction du modèle. Notre approche est validée par une étude de cas sur un logiciel réel. La deuxième contribution est une approche qui permet de détecter de manière automatique les correspondances entre les éléments de deux méta-modèles similaires. Ces correspondances peuvent être utilisées pour faciliter ou partiellement automatiser l'écriture d'une transformation de modèles entre ces deux méta-modèles. Notre approche est basée sur les travaux effectués par les communautés travaillant sur l'alignement de schémas relationnels et d'ontologies. Notre approche est validée sur un corpus d'alignements réalisés manuellement sur des méta-modèles réels. Directeur(s) de thèse : HUCHARD M. Co-directeur(s) de thèse : LAFOURCADE M.;NEBUT C. Rapporteur(s) : DUCASSE S.;JEZEQUEL J.M. Examinateur(s) : DAO M.;LEPAGE Y.;PRINCE V. Date de soutenance : 28/10/2009 Contributions à l'IDM : Reconstruction et Alignement de Modèles de Classes [texte imprimé] / Jean-Rémy FALLERI, Auteur . - 2009.
Langues : Français (fre)
Tags : SOFTWARE ENGINEERING MODEL DRIVEN ENGINEERING UML CLASS MODELS OBJECT-ORIENTED DESIGN SOFTWARE MAINTENANCE SCHEMA MATCHING META-MODELING Index. décimale : THE Thèses de doctorat Résumé : Avec l'émergence du paradigme Ingénierie Dirigée par les Modèles (IDM) pour la conception de logiciels, la phase de modélisation des domaines devient de plus en plus primordiale. Lors de cette phase, les concepteurs modélisent, souvent à l'aide d'un langage à classes, un domaine particulier créant ainsi des méta-modèles. Des modèles dérivés de ces méta-modèles sont utilisés ultérieurement lors de la conception, par exemple pour générer du code source. Comme les domaines à modéliser sont de plus en plus volumineux et complexes, la maintenance des méta-modèles risque de vite devenir problématique. En outre, des outils complexes sont développés pour manipuler les modèles. Malheureusement, il est fréquent que des développeurs différents développent plusieurs méta-modèles représentant un même domaine. Les concepteurs d'outils doivent donc gérer des transformations de modèles entre ces méta-modèles similaires, ce qui est une tâche fastidieuse. Dans cette thèse, nous proposons deux contributions visant à faciliter la maintenance de logiciels développés en suivant le paradigme IDM. La première de ces contributions est une approche qui permet d'éliminer toutes les redondances (attributs et méthodes dupliquées) d'un modèle de classes, en y introduisant de nouvelles super-classes. Notre approche utilise un dérivé de l'Analyse Formelle de Concepts ainsi que plusieurs techniques de traitement automatique des langues. En plus de l'élimination des redondances et de la découverte de nouvelles super-classes, cette approche est capable de découvrir des attributs et méthodes abstraits qui facilitent la réutilisation et améliorent le niveau d'abstraction du modèle. Notre approche est validée par une étude de cas sur un logiciel réel. La deuxième contribution est une approche qui permet de détecter de manière automatique les correspondances entre les éléments de deux méta-modèles similaires. Ces correspondances peuvent être utilisées pour faciliter ou partiellement automatiser l'écriture d'une transformation de modèles entre ces deux méta-modèles. Notre approche est basée sur les travaux effectués par les communautés travaillant sur l'alignement de schémas relationnels et d'ontologies. Notre approche est validée sur un corpus d'alignements réalisés manuellement sur des méta-modèles réels. Directeur(s) de thèse : HUCHARD M. Co-directeur(s) de thèse : LAFOURCADE M.;NEBUT C. Rapporteur(s) : DUCASSE S.;JEZEQUEL J.M. Examinateur(s) : DAO M.;LEPAGE Y.;PRINCE V. Date de soutenance : 28/10/2009 Réservation
Réserver ce document
Exemplaires
Cote Support Localisation Section Notes Disponibilité THE-09 / 13761 Non renseigné THESES NON CLASSES Disponible Intégration de Schémas Large Echelle / Khalid SALEEM
Titre : Intégration de Schémas Large Echelle Type de document : texte imprimé Auteurs : Khalid SALEEM, Auteur Année de publication : 2008 Langues : Français (fre) Tags : DATA INTEROPERABILITY XML SCHEMA TREE SCHEMA MATCHING SCHEMA MAPPING SCHEMA INTEGRATION SCHEMA MEDIATION MINI-TAXONOMIES TREE MINING LARGE SCALE ONTOLOGY LEARNING COLLABORATIVE ONTOLOGY CONSTRUCTION Index. décimale : THE Thèses de doctorat Résumé : Le besoin d'intégrer et d'analyser des grands ensembles de données issus des bases de données publiées sur le web est présent dans de nombreux domaines d'applications comme la génomique, l'environnement, la médecine et le commerce électronique. Nous avons proposé une méthode automatique PORSCHE (Performance ORiented SCHEma Mediation) qui permet d'intégrer plusieurs schémas simultanément et de fournir un schéma médiateur. Cette méthode utilise un algorithme basé sur la fouille d'arbres (tree mining) a été implémentée et expérimentée sur un grand nombre de schémas disponibles sur le web. Nous nous intéressons aussi à la construction d'ontologie à partir de schemas XML disponible sur le web. Nous proposons une approche automatique et collaborative pour la construction d'ontologie sans interaction directe avec les utilisateurs du domaine, des experts ou des développeurs. Une des caractéristiques très importante d'une ontologie est sa structure hiérarchique des concepts. Nous considérons des grands ensembles de schémas pour un domaine spécifique comme étant des arbres et leur appliquons des algorithmes d'extraction de sous-arbres fréquents pour découvrir des motifs (patterns) hiérarchiques en vue de construire une ontologie. Enfin, nous présentons un technique pour découvrir et proposer des correspondances complexes entre deux schemas. Ces correspondances sont ensuite validées à l'aide des mini-taxonomies qui sont les sous-arbres fréquents. Schema Matching and Integration in Large Scale Scenarios
Semantic matching of schemas in heterogeneous data sharing systems is time consuming and error prone. The dissertation presents a new robust automatic method, PORSCHE (Performance ORiented SCHEma Mediation), which integrates a large set of domain specific schemas, represented as tree structures, based upon semantic correspondences among them. The method also creates the mappings from source schemas to the integrated schema. The dissertation also gives a detail discussion about the state of the art in schema matching. We summarize the deficiencies in the currently available tools and techniques for meeting the requirements of large scale schema matching scenarios. Our approach is juxtaposed to these shortcomings and its advantages are highlighted with sound experimental support. Moreover, we present a technique for discovering complex match (1:n, n:1 and n:m) propositions between two schemas, validated by mini-taxonomies. These mini-taxonomies are extracted from the large set of domain specific metadata instances represented as tree structures. We propose a framework, called ExSTax (Extracting Structurally Coherent Mini-Taxonomies) based on frequent sub-tree mining, to support our idea. We further extend the ExSTax framework for extracting a reliable domain specific taxonomy.Directeur(s) de thèse : BELLAHSENE Z. Rapporteur(s) : SOULE-DUPUY C.;VALDURIEZ C. Examinateur(s) : HACID M.S.;HERIN D.;HUNT E. Date de soutenance : 27/11/2008 Intégration de Schémas Large Echelle [texte imprimé] / Khalid SALEEM, Auteur . - 2008.
Langues : Français (fre)
Tags : DATA INTEROPERABILITY XML SCHEMA TREE SCHEMA MATCHING SCHEMA MAPPING SCHEMA INTEGRATION SCHEMA MEDIATION MINI-TAXONOMIES TREE MINING LARGE SCALE ONTOLOGY LEARNING COLLABORATIVE ONTOLOGY CONSTRUCTION Index. décimale : THE Thèses de doctorat Résumé : Le besoin d'intégrer et d'analyser des grands ensembles de données issus des bases de données publiées sur le web est présent dans de nombreux domaines d'applications comme la génomique, l'environnement, la médecine et le commerce électronique. Nous avons proposé une méthode automatique PORSCHE (Performance ORiented SCHEma Mediation) qui permet d'intégrer plusieurs schémas simultanément et de fournir un schéma médiateur. Cette méthode utilise un algorithme basé sur la fouille d'arbres (tree mining) a été implémentée et expérimentée sur un grand nombre de schémas disponibles sur le web. Nous nous intéressons aussi à la construction d'ontologie à partir de schemas XML disponible sur le web. Nous proposons une approche automatique et collaborative pour la construction d'ontologie sans interaction directe avec les utilisateurs du domaine, des experts ou des développeurs. Une des caractéristiques très importante d'une ontologie est sa structure hiérarchique des concepts. Nous considérons des grands ensembles de schémas pour un domaine spécifique comme étant des arbres et leur appliquons des algorithmes d'extraction de sous-arbres fréquents pour découvrir des motifs (patterns) hiérarchiques en vue de construire une ontologie. Enfin, nous présentons un technique pour découvrir et proposer des correspondances complexes entre deux schemas. Ces correspondances sont ensuite validées à l'aide des mini-taxonomies qui sont les sous-arbres fréquents. Schema Matching and Integration in Large Scale Scenarios
Semantic matching of schemas in heterogeneous data sharing systems is time consuming and error prone. The dissertation presents a new robust automatic method, PORSCHE (Performance ORiented SCHEma Mediation), which integrates a large set of domain specific schemas, represented as tree structures, based upon semantic correspondences among them. The method also creates the mappings from source schemas to the integrated schema. The dissertation also gives a detail discussion about the state of the art in schema matching. We summarize the deficiencies in the currently available tools and techniques for meeting the requirements of large scale schema matching scenarios. Our approach is juxtaposed to these shortcomings and its advantages are highlighted with sound experimental support. Moreover, we present a technique for discovering complex match (1:n, n:1 and n:m) propositions between two schemas, validated by mini-taxonomies. These mini-taxonomies are extracted from the large set of domain specific metadata instances represented as tree structures. We propose a framework, called ExSTax (Extracting Structurally Coherent Mini-Taxonomies) based on frequent sub-tree mining, to support our idea. We further extend the ExSTax framework for extracting a reliable domain specific taxonomy.Directeur(s) de thèse : BELLAHSENE Z. Rapporteur(s) : SOULE-DUPUY C.;VALDURIEZ C. Examinateur(s) : HACID M.S.;HERIN D.;HUNT E. Date de soutenance : 27/11/2008 Réservation
Réserver ce document
Exemplaires
Cote Support Localisation Section Notes Disponibilité THE-08 / 13627 Non renseigné THESES INFORMATIQUE Disponible Towards a Generic Approach for Schema Matcher Selection: Leveraging User Pre- and Post-match Effort for Improving Quality and Time Performance / Fabien DUCHATEAU
Titre : Towards a Generic Approach for Schema Matcher Selection: Leveraging User Pre- and Post-match Effort for Improving Quality and Time Performance Type de document : texte imprimé Auteurs : Fabien DUCHATEAU, Auteur Année de publication : 2009 Langues : Français (fre) Tags : DATA INTEGRATION DATA INTEROPERABILITY XML SCHEMA SCHEMA MATCHING SCHEMA MAPPING CLASSIFIER BENCHMARK SIMILARITY MEASURE Index. décimale : THE Thèses de doctorat Résumé : Interoperability between applications or bridges between data sources are required to allow optimal information exchanges. Yet, some processes needed to bring this integration cannot be fully automatized due to their complexity. One of these processes is called matching and it has now been studied for years. It aims at discovering semantic correspondences between data sources elements and is still largely performed manually. Thus, deploying large data sharing systems requires the (semi-)automatization of this matching process. Many schema matching tools were designed to discover mappings between schemas. However, some of these tools intend to fulfill matching tasks with specific criteria, like a large scale scenario or the discovery of complex mappings. And contrary to ontology alignment research field, there is no common platform to evaluate them. The abundance of schema matching tools, added to the two previously mentioned issues, does not facilitate the choice, by an user, of the most appropriate tool to match a given scenario. In this dissertation, our first contribution deals with a benchmark, XBenchMatch, to evaluate schema matching tools. It consists of several schema matching scenarios, which features one or more criteria. Besides, we have designed new measures to evaluate the quality of integrated schemas and the user post-match effort. This study and analysis of existing matching tools enables a better understanding of the matching process. Without external resources, most matching tools are mainly not able to detect a mapping between elements with totally dissimilar labels. On the contrary, they cannot infirm a mapping between elements with similar labels. Our second contribution, BMatch, is a matching tool which includes a structural similarity measure and it aims at solving these issues by only using the schema structure. Terminological measures enable the discovery of mappings whose schema elements share similar labels. Conversely, structural measures, based on cosine measure, detects mappings when schema elements have the same neighbourhood. BMatch's second aspect aims at improving the time performance by using an indexing structure, the B-tree, to accelerate the schema matching process. We empirically demonstrate the benefits and the limits of our approach. Like most schema matching tools, BMatch uses an aggregation function to combine similarity values, thus implying several drawbacks in terms of quality and performance. Tuning the parameters is another burden for the user. To tackle these issues, MatchPlanner introduces a new method to combine similarity measures by relying on decision trees. As decision trees can be learned, parameters are automatically tuned and similarity measures are only computed when necessary. We show that our approach provides an increase in terms of matching quality and better time performance with regards to other matching tools. We also present the possibility to let users choose a preference between precision and recall. Even with tuning capabilities, schema matching tools are still not generic enough to provide acceptable quality results for most schema matching scenarios. We finally extend MatchPlanner by proposing a factory of schema matchers, named YAM (for Yet Another Matcher). This tool brings more flexibility since it generates an 'a la carte' matcher for a given schema matching scenario. Indeed, schema matchers can be seen as machine learning classifiers since they classify pairs of schema elements either as relevant or irrelevant. Thus, the best matcher in terms of matching quality is built and selected from a set of different classifiers. We also show impact on the quality when user provides some inputs, namely a list of expert mappings and a preference between precision and recall. Directeur(s) de thèse : BELLAHSENE Z. Rapporteur(s) : AMANN B.;EUZENAT J. Examinateur(s) : BONIFATI A.;COLETTA R.;LIBOUREL T. Date de soutenance : 20/11/2009 Towards a Generic Approach for Schema Matcher Selection: Leveraging User Pre- and Post-match Effort for Improving Quality and Time Performance [texte imprimé] / Fabien DUCHATEAU, Auteur . - 2009.
Langues : Français (fre)
Tags : DATA INTEGRATION DATA INTEROPERABILITY XML SCHEMA SCHEMA MATCHING SCHEMA MAPPING CLASSIFIER BENCHMARK SIMILARITY MEASURE Index. décimale : THE Thèses de doctorat Résumé : Interoperability between applications or bridges between data sources are required to allow optimal information exchanges. Yet, some processes needed to bring this integration cannot be fully automatized due to their complexity. One of these processes is called matching and it has now been studied for years. It aims at discovering semantic correspondences between data sources elements and is still largely performed manually. Thus, deploying large data sharing systems requires the (semi-)automatization of this matching process. Many schema matching tools were designed to discover mappings between schemas. However, some of these tools intend to fulfill matching tasks with specific criteria, like a large scale scenario or the discovery of complex mappings. And contrary to ontology alignment research field, there is no common platform to evaluate them. The abundance of schema matching tools, added to the two previously mentioned issues, does not facilitate the choice, by an user, of the most appropriate tool to match a given scenario. In this dissertation, our first contribution deals with a benchmark, XBenchMatch, to evaluate schema matching tools. It consists of several schema matching scenarios, which features one or more criteria. Besides, we have designed new measures to evaluate the quality of integrated schemas and the user post-match effort. This study and analysis of existing matching tools enables a better understanding of the matching process. Without external resources, most matching tools are mainly not able to detect a mapping between elements with totally dissimilar labels. On the contrary, they cannot infirm a mapping between elements with similar labels. Our second contribution, BMatch, is a matching tool which includes a structural similarity measure and it aims at solving these issues by only using the schema structure. Terminological measures enable the discovery of mappings whose schema elements share similar labels. Conversely, structural measures, based on cosine measure, detects mappings when schema elements have the same neighbourhood. BMatch's second aspect aims at improving the time performance by using an indexing structure, the B-tree, to accelerate the schema matching process. We empirically demonstrate the benefits and the limits of our approach. Like most schema matching tools, BMatch uses an aggregation function to combine similarity values, thus implying several drawbacks in terms of quality and performance. Tuning the parameters is another burden for the user. To tackle these issues, MatchPlanner introduces a new method to combine similarity measures by relying on decision trees. As decision trees can be learned, parameters are automatically tuned and similarity measures are only computed when necessary. We show that our approach provides an increase in terms of matching quality and better time performance with regards to other matching tools. We also present the possibility to let users choose a preference between precision and recall. Even with tuning capabilities, schema matching tools are still not generic enough to provide acceptable quality results for most schema matching scenarios. We finally extend MatchPlanner by proposing a factory of schema matchers, named YAM (for Yet Another Matcher). This tool brings more flexibility since it generates an 'a la carte' matcher for a given schema matching scenario. Indeed, schema matchers can be seen as machine learning classifiers since they classify pairs of schema elements either as relevant or irrelevant. Thus, the best matcher in terms of matching quality is built and selected from a set of different classifiers. We also show impact on the quality when user provides some inputs, namely a list of expert mappings and a preference between precision and recall. Directeur(s) de thèse : BELLAHSENE Z. Rapporteur(s) : AMANN B.;EUZENAT J. Examinateur(s) : BONIFATI A.;COLETTA R.;LIBOUREL T. Date de soutenance : 20/11/2009 Réservation
Réserver ce document
Exemplaires
Cote Support Localisation Section Notes Disponibilité THE-09 / 13780 Non renseigné THESES NON CLASSES Disponible

