Sujet :
Découverte de règles séquentielles
Encadrants : Anne
Laurent, Pascal Poncelet
Lieu : LIRMM
La recherche de motifs séquentiels permet de
découvrir des motifs du type « beaucoup de clients ont
acheté les articles A et B simultanément puis les
articles A et C simultanément puis l'article B. »
Si ces motifs permettent de décrire les données, ils ne
contiennent en aucune manière l'idée de causalité.
Or il paraît primordial, dans beaucoup d'applications, de
connaître les relations causales qui lient les occurrences
d'items. Il serait ainsi possible de découvrir les règles
du type : « quand les clients achètent les articles A et B
simultanément puis les articles A et C simultanément
alors ils achètent ensuite l'article B. ». Il s'agit donc
d'élargir les définitions et méthodes
étudiées pour les règles d'association au contexte
temporel.
Le travail à réaliser est donc axé sur les points
suivants :
− Identifier les concepts nécessaires et les
définitions associées
− Mettre en évidence les mesures pertinentes
pour évaluer la notion de causalité,
− Définir les algorithmes associées
capables de passer à l'échelle face aux gros volumes de
données,
− Evaluer ces algorithmes sur des données
synthétiques et des données réelles.
Références bibliographiques :
• R. Agrawal
and R. Srikant. « Mining Sequential Patterns ». Proc. of
the 11th International Conference on Data Engineering, pages 3—14,
March 1995.
• Chang-Hung
Lee, Philip S. Yu , and Ming-Syan Chen. « Mining Relationship
between Triggering and Consequential Events in a Short Transaction
Database ». SIAM International Conference on Data Mining. SDM
2002. http://www.siam.org/meetings/sdm02/proceedings/sdm02-24.pdf