Sujet : Détection de fraudes et Extraction de Connaissances

 

Encadrants : Chedy Raissi, Gérard Dray, Pascal Poncelet

Lieu : EMA - LIRMM



Le développement d'Internet et des nouvelles applications de type « Web Services » augmentent considérablement la probabilité de risques de fraudes sur un réseau. En outre, étant donné la vitesse à laquelle les données arrivent, il devient de plus en plus difficile de maîtriser et de détecter les opérations malveillantes qui peuvent intervenir. Pour faire face aux nouvelles approches proposées par les pirates informatiques qui se livrent à des intrusions réseaux, à des dénis de service (Denial of Service – DoS), à des modifications dynamiques  de sites, il devient indispensable d’offrir de nouvelles approches d’extraction de connaissances qui soient :
•    capables d’extraire les fraudes dans des logs de comportements sur Internet,  
•    capables d’apprendre en temps réel les fraudes qui peuvent intervenir,
•    capables de reconnaître les fraudes dans un flux continu.


L’objectif de ce stage est d’étudier l’adéquation des propositions issues des techniques de fouille de données (clustering, classification, règles d’association, motifs séquentiels, …) à un contexte de détection de fraudes (détection d’anomalies, extraction d’itemsets infréquents, …). Puis, il s’agit de proposer une approche de recherche de motifs séquentiels rares adaptée aux nouveaux types d’attaques (temps réel, plusieurs opérations dans une ou plusieurs sessions, combinées, …) dans un flux de données.

De manière à valider la proposition, des expérimentations seront menées sur des jeux de données réelles associés à des comportements corrects et des attaques. Un des objectifs à atteindre est d’être en mesure de détecter les attaques en temps réel.


•    Lazarevic, A. Ozgur, L. Ertoz, J. Srivastava, V. Kumar. “A Comparative Study of Anomaly Detection Schemes in Network Intrusion Detection”. Proceedings of the SIAM International Conference on Data Mining (2003)

•    S. Terry Brugger. “Data Mining Methods for Network Intrusion Detection”. ACM Computing Surveys, 2005.

•    K. Sequeira, M. J. Zaki. “ADMIT: Anomaly-base Data Mining for Intrusions”. Proceedings of the  8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, July 2002.

•    G. J. Simon, H. Xiong, E. Eilertson, V. Kumar. “Scan Detection: A Data Mining Approach”. Proceedings of the 2006 SIAM Conference on Data Mining (SDM 06).

•    "Clustering Data Streams: Theory and Practice" - Sudipto Guha, Adam Meyerson, Nina Mishra, Rajeev Motwani, Liadan O'Callaghan IEEE Transactions on Knowledge and Data Engineering - May/June 2003 (Vol. 15, No. 3) pp. 515-528.