Équipe TEXTE: Exploration et exploitation de donnees textuelles

Richard MOOT

Responsable d'équipe

Équipe TEXTE

Exploration et exploitation de donnees textuelles

Nous développons des modèles et des outils pour analyse automatique, syntaxique et sémantique, du langage naturel ainsi que pour la constitution des ressources nécessaires.

Membres

Permanents
Imen Ben Sassi, Maître de conférences, UM
Richard Moot, Chargé de recherche, CNRS
Mathieu Lafourcade, Maître de conférences, UM

Doctorants
Jérémie Roux, UM
Maximos Skandalis, CNRS
Loic Allegre, UM
Nicolas Boffo, Ministère de l’intérieur
Alexandre Fleury, SAS CHARLATHAN CLUB

Autres personnels
Vincent Blazy, ATER, UM
Jeanne Gauthier, Doctorant externe, UM
Violaine Prince, Invité longue durée Eméritat, UM
Hani Guenoune, CDD Enseignant-Chercheur, UM
Christian Retoré, Invité longue durée Eméritat, UM

Thématiques de recherche

L’équipe TEXTE développe des méthodes, des outils et des ressources pour le traitement automatique du langage naturel, surtout écrit. Ces travaux portent plus particulièrement sur sa syntaxe et sur sa sémantique aussi bien logique que lexicale. Nous utilisons plutôt des méthodes symboliques, le plus souvent logiques, d’où notre rattachement au pôle Intelligence artificielle. Bien qu’elles soient toutes reliées entre elles, distinguons dans Texte les activités suivantes:

Construction, acquisition de ressources pour le traitement automatique des langues (lexique, grammaire)
Analyse automatique de la syntaxe et de la sémantique du langage naturel.

Ces travaux nécessitent des recherches fondamentales, souvent fédérées par la logique:

Programmation logique par contraintes pour la syntaxe guidée par les modèles
Analyse syntaxique et sémantique en théorie des types.
Règles d’inférence dans un réseau lexical.
Représentation des connaissances.

D’autres méthodes sont aussi utilisées: jeux sérieux collaboratifs, algorithmique distribuée sur des graphes (fourmis), algèbre linéaire (vecteurs de mots), statistiques (suppression du bruit, étiquetage grammatical).

Thèses soutenues

curlGET failed, http-code: 502