Site

Ressources

Lexique des sentiments et des émotions français

L’analyse automatique de textes pour y détecter la présence d’états affectifs, leur polarité (positif, négatif ou neutre), les émotions associées (joie, colère, tristesse, etc.) et leur intensité a suscité de nombreux travaux ces dernières années. Les méthodes appliquées sont très nombreuses et généralement, spécifiques aux types des textes : aux tweets (Roberts et al., 2012), aux titres de presse (Strapparava et Mihalcea, 2008), etc. et aux domaines d’application : l’analyse de media sociaux (Balahur, 2013), l’impact du genre dans les négociations (Boneva et al., 2001), l’identification de mails suicidaires (Pestian et al., 2012), etc. Ces méthodes sont généralement basées sur des techniques statistiques ou de traitement automatique du langage.

A l’heure actuelle, la plupart des lexiques existants ont été crées pour l’anglais et la polarité comme le GeneralInquirer (Stone & Hunt, 1963), le Linguistic Inquiry andWord Count (Tausczik & Pennebaker, 2010), etc. Toutefois, des ressources plus spécifiques, comme le WordNet Affect (Strapparava and Valitutti, 2004) ou le lexique de (Mohammad & Turney, 2010) ont été créées pour les mots chargés d’émotions. Dans cette page nous proposons un lexique libre pour la langue française, conçu de manière semi-automatique et décrivant plus de 14,000 mots distincts selon leur polarité et les émotions associées.

La méthode d’acquisition appliquée repose sur la mise en cohérence de la ressource anglaise de (Mohammad & Turney, 2010), sa traduction semi-automatique supervisée par un traducteur humain expérimenté et son extension en anglais et en français via l’étude des synonymes et des antonymes. L’extension de la ressource a été validée en terme d’impact sur une tâche de classification automatique pour les deux catégories de sentiment (polarité et émotion) et différents jeux de données classiques de la littérature. Notre démarche est générique et peut être adaptée à d’autres langues et à d’autres ressources utilisées en entrée du processus.

Téléchargement de la ressource

Merci de citer la ressource pour toute utilisation : Amine Abdaoui, Jérome Azé, Sandra Bringay et Pascal Poncelet. FEEL: French Extended Emotional Lexicon. 2014. ISLRN: 041-639-484-224-2

Pointeurs vers les ressources du CLLE

  1. Glàff, le gros lexique à tout faire du français sous creative commons, ainsi que d'autres ressources lexicales sont dispo ici (notamment le wiktionnaire dont est issu Glaff mais qui contient également les définitions)
  2. Wisigoth, version enrichie du wiktionnaire
  3. Talismane, outils opensource paramétrable de POStagging et d'analyse syntaxique
  4. http://redac.univ-tlse2.fr/corpus/annodis/, corpus du français écrit enrichi d'annotations discursives