| Titre : | Données Semi Structurées : Découverte, Maintenance et Analyse de Tendances | | Type de document : | texte imprimé | | Auteurs : | P.A. LAUR, Auteur | | Année de publication : | 2004 | | Langues : | Français (fre) | | Tags : | DONNEES SEMI STRUCTUREES FOUILLE DE DONNEES EXTRACTION DE CONNAISSANCES EVOLUTION DES SOURCES DE DONNEES ANALYSE DE TENDANCE DONNEES SEMI STRUCTUREES FOUILLE DE DONNEES EXTRACTION DE CONNAISSANCES EVOLUTION DES SOURCES DE DONNEES ANALYSE DE TENDANCE SEMI STRUCTURED DATA: DISCOVERY UPDATE AND TREND ANALYSIS SEMI STRUCTURED DATA DATA MINING KNOWLEDGE EXTRACTION DATA SOURCES EVOLUTION TREND ANALYSIS | | Index. décimale : | THE Thèses de doctorat | | Résumé : | Avec la popularité du web, les sources d'informations sont multiples et les formats de données hétérogènes n'obéissent plus à une structure rigide. La cohabitation est rendue possible par les données semi structurées incluant leur schéma et pour lesquelles les contraintes d'une représentation relationnelle sont relaxées. C'est dans ce contexte que se situe notre proposition : "identifier des structures typiques, par le biais de méthodes adaptées de fouilles de données, au sein d'une collection de données semi structurées". Nous proposons une nouvelle approche appelée PSPtree, inspirée des motifs séquentiels, ainsi que sa généralisation PSPtree-GENERALISE. Ces algorithmes ont été intégrés au sein du système AUSMS (Automatic Update Schema Mining System) afin de collecter les données, de rechercher les sous-structures fréquentes et de maintenir les connaissances extraites suite aux évolutions des sources mais également d'analyser les tendances ainsi que visualiser les résultats.
With the growing popularity of the World Wide Web, information sources are numerous and heterogeneous data type doesn't follow a strict structure. The living together is allowed with semi structured data that include their schema and for which relational representation constraints have been released. Within this here is our proposal: "identify typical structures, by the way of fitted data mining methods, within a collection of semi structured data". We suggest a new approach named PSPtree, inspired by sequential patterns, and it generalization named PSPtree-GENERALISE. These algorithms have been fitted within the AUSMS system (Automatic Update Schema Mining System) in order to collect data, research frequent sub structures and maintain extracted know ledges following sources evolutions but also trends analysis and results visualization. | | Directeur(s) de thèse : | PONCELET P. | | Co-directeur(s) de thèse : | TEISSEIRE M. | | Président du jury : | PRINCE V. | | Rapporteur(s) : | MOHAND-SAID H.;LAURENT D. | | Date de soutenance : | 30/08/2004 |
Données Semi Structurées : Découverte, Maintenance et Analyse de Tendances [texte imprimé] / P.A. LAUR, Auteur . - 2004. Langues : Français ( fre) | Tags : | DONNEES SEMI STRUCTUREES FOUILLE DE DONNEES EXTRACTION DE CONNAISSANCES EVOLUTION DES SOURCES DE DONNEES ANALYSE DE TENDANCE DONNEES SEMI STRUCTUREES FOUILLE DE DONNEES EXTRACTION DE CONNAISSANCES EVOLUTION DES SOURCES DE DONNEES ANALYSE DE TENDANCE SEMI STRUCTURED DATA: DISCOVERY UPDATE AND TREND ANALYSIS SEMI STRUCTURED DATA DATA MINING KNOWLEDGE EXTRACTION DATA SOURCES EVOLUTION TREND ANALYSIS | | Index. décimale : | THE Thèses de doctorat | | Résumé : | Avec la popularité du web, les sources d'informations sont multiples et les formats de données hétérogènes n'obéissent plus à une structure rigide. La cohabitation est rendue possible par les données semi structurées incluant leur schéma et pour lesquelles les contraintes d'une représentation relationnelle sont relaxées. C'est dans ce contexte que se situe notre proposition : "identifier des structures typiques, par le biais de méthodes adaptées de fouilles de données, au sein d'une collection de données semi structurées". Nous proposons une nouvelle approche appelée PSPtree, inspirée des motifs séquentiels, ainsi que sa généralisation PSPtree-GENERALISE. Ces algorithmes ont été intégrés au sein du système AUSMS (Automatic Update Schema Mining System) afin de collecter les données, de rechercher les sous-structures fréquentes et de maintenir les connaissances extraites suite aux évolutions des sources mais également d'analyser les tendances ainsi que visualiser les résultats.
With the growing popularity of the World Wide Web, information sources are numerous and heterogeneous data type doesn't follow a strict structure. The living together is allowed with semi structured data that include their schema and for which relational representation constraints have been released. Within this here is our proposal: "identify typical structures, by the way of fitted data mining methods, within a collection of semi structured data". We suggest a new approach named PSPtree, inspired by sequential patterns, and it generalization named PSPtree-GENERALISE. These algorithms have been fitted within the AUSMS system (Automatic Update Schema Mining System) in order to collect data, research frequent sub structures and maintain extracted know ledges following sources evolutions but also trends analysis and results visualization. | | Directeur(s) de thèse : | PONCELET P. | | Co-directeur(s) de thèse : | TEISSEIRE M. | | Président du jury : | PRINCE V. | | Rapporteur(s) : | MOHAND-SAID H.;LAURENT D. | | Date de soutenance : | 30/08/2004 |
|