.......
Module Image .......![]() Le module image vous est proposé par le projet ICAR (image et interaction) ![]() |
![]() |
![]() |
![]() ![]() |
![]() |
sur le module image en
envoyant un e-mel (cliquez sur le penseur). |
L’algèbre
linéaire est un outil fondamental en vision par ordinateur, car de
nombreux problèmes s’écrivent de manière élégante sous forme
matricielle. De même, une bonne maîtrise des outils de calcul matriciel
est indispensable pour résoudre ces problèmes. Dans cet exposé, nous nous intéressons aux méthodes de décomposition matricielle. | ![]() |
Dans une première partie, nous rappellerons quelques propriétés et résultats importants tels que le calcul de valeurs/vecteurs propres, la décomposition en valeurs singulières (SVD), puis l’analyse en composantes principales (ACP), ainsi que quelques applications dans le domaine de l’analyse d’images. | Dans une seconde partie, nous aborderons les méthodes plus récentes de représentation des images, à savoir les méthodes de type « sac de mots » et les représentations parcimonieuses. Nous analyserons dans le détail ces méthodes et présenterons quelques exemples d’applications liées à nos travaux de recherche récents. |
L’apprentissage
artificiel dans sa formulation supervisée est omniprésent dans les
travaux actuels pour le traitement d’images, la vision et l’analyse de
contenus multimédia : il permet de détecter, reconnaître et même, c’est
la promesse récente du deep-learning, de segmenter des contenus. Il est
bon de se souvenir que la supervision est due à l’humain dans cette
approche : de nombreuses personnes annotent des images ou des régions
d’images en amont ! Que peut apporter l’humain en amont de
mécanismes d’apprentissage ? Combien et quels annotateurs choisir ?
Peut-on utiliser des mécanismes semi-automatiques pour résoudre des
problèmes d’interprétation très complexes ? Comment un humain peut-il
aider la machine à apprendre en même temps que la machine tente de
minimiser l’effort d’annotation requis ? Comment interroger
efficacement un opérateur humain ? | ![]() |
![]() ![]() |
Le cours tentera de répondre au moins partiellement à ces questions au travers d’une visite rapide de l’état de l’art et de l’exposé de résultats récents obtenus à l’IRIT de Toulouse. |
When
observing a visual content on a web site, often people do not realize
that such media have undergone a long series of transformations before
appearing in their current form. In particular, the authenticity of
visual contents is often overestimated: just by looking around, it is
evident that creating fake digital contents is very common today, since
many commercial and open-source software allow to inexpert users
editing images and videos in a few minutes. A fake information content could have dramatic consequences in medical imaging for example. Multimedia forensics is a relatively new discipline that seeks to demonstrate the authenticity of a given multimedia content: the basic idea behind it is that any processing applied to a digital content leaves subtle traces, that can be analyzed to uncover the digital history of the object. In the context of medical images, those techniques may able to distinguish results have undergone a deliberate alteration. In the first part of the lesson, a general introduction to the field of multimedia forensics will be given. Then, the most useful traces that can be used for image tampering detection, and the main forensic techniques that are based on them, will be described. Due to the ubiquitous diffusion of compressed images, major focus will be given to traces relying on specific properties of the compression process. |
Feature (or descriptor) extraction from images and videos is a very crucial task in almost all computer vision systems. It consists of extracting characteristics describing important information in the images and videos. For example, in precision agriculture, such an extraction would help to optimizing returns on inputs while preserving resources. Different global (or holistic) methods such as Principal Component Analysis (PCA) have been widely studied and applied but lately local descriptors (such as LBP, SIFT and Gabor) have gained more attention due to their robustness to challenges such as pose and illumination changes. This presentation gives an overview of different image and video descriptors with an emphasis on the most recent developments in the field. The presentation will then focus on one popular descriptor, namely Local Binary Patterns (LBP), to demonstrate step by step how to successfully apply the operator to various computer vision problems. This talk will be illustrated by a face analysis application. |
![]() |