Avec l'émergence du Web, de plus en plus de documents
textuels contenant des
informations exprimant des opinions
ou des sentiments sont disponibles (e.g. commentaires ou
évaluations de produits par des clients, forums, groupe de
discussion, blogs). La détection ou l'extraction automatique
d'opinions est un domaine de recherche en plein essor. Elle
devient essentielle, par exemple pour le développement de
tâches de veille (technologique, marketing, concurrentielle,
sociétale) qui peuvent se révéler cruciales pour les entreprises
et trouve de très nombreux domaines d'applications.
Nous pouvons citer, par exemple, les clients qui souhaitent
connaître comment évaluer un produit avant de l’acheter,
l'image que les clients peuvent se faire d’une entreprise, la
détection de rumeurs (buzz) sur le web.
Cependant, les approches traditionnelles de
fouilles de
données ne sont plus adaptées à un contexte dans lequel il
faut appréhender non seulement de gros volumes de données
mais s’intéresser à la qualité des données : comment déterminer
des avis négatifs dans des documents aussi divers
que des blogs ou des journaux ? Comment valider/évaluer
les résultats obtenus ? quel type de données utiliser ? Une
approche pluridisciplinaire regroupant différentes communautés
d'
INFORSID (fouille de données, aide à la décision, modélisation
des connaissances, TAL, Linguistique, etc) parait
aujourd'hui essentielle au développement rigoureux de cette
thématique.
En 2007, le défi
DEFT (DEfi Fouille de Textes) avait
pour objectif la classification de textes en fonction du jugement
favorable ou défavorable qu’ils expriment. Nous
souhaitons, dans cet atelier, étendre cette problématique
afin de proposer une réflexion globale sur les approches de
traitement automatique des données d'opinion à mettre en
oeuvre.
Les défis internationaux tel que
TREC Blog
proposent également des tâches propres aux traitements de textes d'opinions.
Ainsi, notre objectif est de rassembler les chercheurs
intéressés par une telle thématique, de présenter les travaux
réalisés dans ce domaine et de confronter les points de vue
de différentes disciplines.
- Catégorisation automatique de textes d'opinion
- Ontologies et données d'opinion
- Aide à la décision pour les données d'opinion
- Visualisation pour une analyse des données d'opinion
- Interrogation des données d'opinion
- Acquisition de bases de données d'opinion
- Veille technologique pour l'analyse des opinions
- Détection de tendances dans les opinions
- Fouille du Web pour acquérir et/ou analyser des textes d'opinion
- TAL à partir de textes d'opinion
- Analyse de discours
Design: Thomas Heitz - Update: Mathieu Roche & Pascal Poncelet