Sujet : Découverte de règles séquentielles

Encadrants :
Anne Laurent, Pascal Poncelet

Lieu :
LIRMM

La recherche de motifs séquentiels permet de découvrir des motifs du type « beaucoup de clients ont acheté les articles A et B simultanément puis les articles A et C simultanément puis l'article B. »

Si ces motifs permettent de décrire les données, ils ne contiennent en aucune manière l'idée de causalité. Or il paraît primordial, dans beaucoup d'applications, de connaître les relations causales qui lient les occurrences d'items. Il serait ainsi possible de découvrir les règles du type : « quand les clients achètent les articles A et B simultanément puis les articles A et C simultanément alors ils achètent ensuite l'article B. ». Il s'agit donc d'élargir les définitions et méthodes étudiées pour les règles d'association au contexte temporel.

Le travail à réaliser est donc axé sur les points suivants :
−    Identifier les concepts nécessaires et les définitions associées
−    Mettre en évidence les mesures pertinentes pour évaluer la notion de causalité,
−    Définir les algorithmes associées capables de passer à l'échelle face aux gros volumes de données,
−    Evaluer ces algorithmes sur des données synthétiques et des données réelles.



Références bibliographiques :

•    R. Agrawal and R. Srikant. « Mining Sequential Patterns ». Proc. of the 11th International Conference on Data Engineering, pages 3—14, March 1995.


•    Chang-Hung Lee, Philip S. Yu , and Ming-Syan Chen. « Mining Relationship between Triggering and Consequential Events in a Short Transaction Database ». SIAM International Conference on Data Mining. SDM 2002.  http://www.siam.org/meetings/sdm02/proceedings/sdm02-24.pdf