Stégananalyse d’algorithmes +-1 embeddingpar classification
Encadrant : Marc Chaumont Laboratoire d'Informatique, de
Robotique et de Microélectronique de Montpellier sujet (pdf)
La compétition BOSS [BOSS 2010] se
déroule du 9 septembre au 15 décembre 2010 et consiste à déterminer parmi 1000
images lesquelles contiennent un message (ce sont les images
« stégo » [HUGO 2010])
et lesquelles ne contiennent pas de message (ce sont les images
« cover »). Le 1 novembre, au moins une équipe a réussi à obtenir une
précision dans la classification de 75%. L’objectif du stage n’est pas de participer à la compétition (puisqu’elle sera terminée lors du stage) mais plutôt d’étudier les toutes récentes approches d’analyse (stéganalyse, attaque) permettant de classer les images en « stego / non-stego » pour les algorithmes stéganographiques de type LSB matching (+-1 embeding). Pour le moment, la classification des algorithmes stéganographiques est effectuée par analyse statistique. Un vecteur caractérisant est extrait pour chaque image et ensuite un algorithme de classification (qui a préalablement appris) classe l’image en « stego / non-stego ». Pour
ce stage, il faudra dans un premier temps prendre en main les techniques listées
ci-dessous [COM 2005], [WAM 2006], [ALE 2008], [SPAM 2009], [CDF 2010] (et même
d’autres), les mixer pour obtenir un vecteur encore plus caractérisant mais
également proposer des nouveaux vecteurs caractérisant. D’autre part, il est
nécessaire de prendre en main un « bon classifieur ». Actuellement au
sein de la communauté de la stéganographie le « Support Vector
Machine » est reconnu comme l’un des plus performants. Il sera peut-être
nécessaire d’adapter la phase d’apprentissage du SVM pour que celui-ci puisse
gérer les apprentissages sur des vecteurs caractérisant de grande dimension et
sur de très grandes bases d’images. Un autre angle d’attaque est de réduire la
dimension par ACP ou toute autre méthode supportant les grandes dimensions [OPAST
2000]. On pourra également transférer les algorithmes sur des
super-calculateurs du centre de calcul de haute performance HPC Montpellier (http://www.hpc-project.com/) et ainsi
manier plus facilement les algorithmes complexes en coût de calcul. On pourra se
servir des outils de visualisation scientifique. Enfin, on pourra également
envisager de tester la résistance sur d’autres algorithmes que l’algorithme
Hugo [HUGO 2010] comme par exemple l’algorithme
adaptive ternary LSB matching [WAM 2006] ou MPSteg [MPSteg 2006]. Références : [BOSS 2010] Break Our
Steganography System, 2010, http://boss.gipsa-lab.grenoble-inp.fr/BOSSRank/. [HUGO
2010] “Using High-Dimensional Image Models to Perform Highly Undetectable
Steganography”,
[WAM 2006] Wavelet
Absolute Moment, « New blind steganalysis and its implications”. M.
Goljan, J. Frodroch, T. Holotyak, In: Proceedings SPIE, EI, Security,
Steganography, and Watermarking of Multimedia Contents VIII. Vol. 6072, pp.
1-13. San Jose, CA, 2006.
|