Bruno Defude est
actuellement directeur d'études au GET-Institut National des
Télécommunications. Il a travaillé successivement
sur les systèmes de recherche d'informations (projet IOTA
à Grenoble), les SGBD objets et répartis. En 2002, il a
effectué un séjour sabbatique au LIP6, où il a
collaboré avec A. Doucet dans le cadre du projet ACI GRID
Padoue. Depuis 2003 il dirige le projet GET SIMBAD qui porte sur
l'interopérabilité sémantique de ressources
(données, procédés/services) et leur
personnalisation.
Gestion de données dans les systèmes pair-à-pair
Les systèmes pair-à-pair (Peer-to-Peer computing ou P2P)
se sont popularisés ces dernières années avec les
systèmes de partage de fichiers sur Internet.
Ils adoptent une approche complètement
décentralisée au partage des ressources. En distribuant
données et traitements sur tous les pairs du réseau,
ils peuvent passer à très grande échelle sans
recourir à des serveurs très puissants. Par exemple, les
systèmes populaires comme Gnutella et Kaaza supportent des
millions d'utilisateurs partageant des pétaoctets de
données sur Internet. Bien que très utiles (c’est
ce qui fait leur succès), ces systèmes, dits
non-structurés, sont simples (par ex. partage de fichiers),
offrent des fonctions limitées (par ex. recherche par
mot-clé), et mettent en œuvre des techniques simples (par ex.
routage des messages par inondation du réseau) ce qui conduit
à des problèmes de performance.
Dans la première partie de ce tuturiel, nous allons
présenter les principes des systèmes
non-structurés ainsi que leur évolution vers les
systèmes structurés,
basés sur des tables de hachage distribuées (DHT), ou les
systèmes hybrides, dits aussi super-pairs, basés sur des
nœuds super-pairs qui indexent des sous-ensembles de pairs.
Dans la deuxième partie, nous allons montrer les directions de
recherche qui s'ouvrent à l'intersection du domaine des bases de
données et des systèmes P2P et les premiers
résultats obtenus.