Menu Fermer

Équipe TEXTE: Exploration et exploitation de donnees textuelles

Richard MOOT
Responsable

Équipe TEXTE

Exploration et exploitation de donnees textuelles

Nous développons des modèles et des outils pour analyse automatique, syntaxique et sémantique, du langage naturel ainsi que pour la constitution des ressources nécessaires.

Permanents
Richard Moot, Chargé de recherche, CNRS
Violaine Prince, Professeur des universités, UM
Mathieu Lafourcade, Maître de conférences, UM
Christian Retoré, Professeur des universités, UM

Doctorants
Hani Guenoune, EMVISTA
Camille Gosset, Berger-Levrault

Autres personnels
Claire Cardie, Invité longue durée Professeur invité, Cornell University

L’équipe TEXTE développe des méthodes, des outils et des ressources pour le traitement automatique du langage naturel, surtout écrit.  Ces travaux portent plus particulièrement sur sa syntaxe et sur sa sémantique aussi bien logique que lexicale. Nous utilisons plutôt des méthodes symboliques, le plus souvent logiques,  d’où notre rattachement au pôle Intelligence artificielle.  Bien qu’elles soient toutes reliées entre elles, distinguons dans Texte les activités suivantes: 

  • Construction, acquisition de ressources pour le traitement automatique des langues (lexique, grammaire)
  • Analyse automatique de la syntaxe et de la sémantique du langage naturel.

Ces travaux nécessitent des recherches fondamentales,  souvent fédérées par la logique:

  • Programmation logique par contraintes pour la syntaxe guidée par les modèles
  • Analyse syntaxique et  sémantique en théorie des types.
  • Règles d’inférence dans un réseau lexical.
  • Représentation des connaissances.

D’autres méthodes sont aussi utilisées: jeux sérieux collaboratifs, algorithmique distribuée sur des graphes (fourmis), algèbre linéaire (vecteurs de mots), statistiques (suppression du bruit, étiquetage grammatical).