Sujet :
Détection de fraudes
et Extraction de Connaissances
Encadrants : Chedy
Raissi, Gérard
Dray, Pascal Poncelet
Lieu : EMA -
LIRMM
Le développement d'Internet et des nouvelles applications de
type « Web Services » augmentent considérablement la
probabilité de risques de fraudes sur un réseau. En
outre, étant donné la vitesse à laquelle les
données arrivent, il devient de plus en plus difficile de
maîtriser et de détecter les opérations
malveillantes qui peuvent intervenir. Pour faire face aux nouvelles
approches proposées par les pirates informatiques qui se livrent
à des intrusions réseaux, à des dénis de
service (Denial of Service – DoS), à des modifications
dynamiques de sites, il devient indispensable d’offrir de
nouvelles approches d’extraction de connaissances qui soient :
• capables d’extraire les fraudes dans des logs de
comportements sur Internet,
• capables d’apprendre en temps réel les
fraudes qui peuvent intervenir,
• capables de reconnaître les fraudes dans un
flux continu.
L’objectif de ce stage est d’étudier l’adéquation des
propositions issues des techniques de fouille de données
(clustering, classification, règles d’association, motifs
séquentiels, …) à un contexte de détection de
fraudes (détection d’anomalies, extraction d’itemsets
infréquents, …). Puis, il s’agit de proposer une approche de
recherche de motifs séquentiels rares adaptée aux
nouveaux types d’attaques (temps réel, plusieurs
opérations dans une ou plusieurs sessions, combinées, …)
dans un flux de données.
De manière à valider la proposition, des
expérimentations seront menées sur des jeux de
données réelles associés à des
comportements corrects et des attaques. Un des objectifs à
atteindre est d’être en mesure de détecter les attaques en
temps réel.