|
Responsables
Mathieu LAFOURCADE
LIRMM - 161, rue ADA - 34392 Montpellier Cedex 5 - France - Tel : (33) 04 67 41 85 71 - Fax : 33 (0)4 67 41 85 00 - courriel : lafourca@lirmm.fr
intervenant
Jacques CHAUCHE, Mathieu LAFOURCADE, Violaine PRINCE
Objectif
Donner une vue d'ensemble des enjeux du Traitement automatique du language naturel en mettant l'accent sur les modèles, méthodes et techniques permettant d'aborder les applications et les problémes de recherche à court et long terme. Le domaine d'application servant à illustrer le cours seront :
- l'indexaction et la recherche de documents multilingues (moteur de recherche Web)
- traduction automatique.
Durée
Plan
- grammaire formelle
classification de Chomsky
grammaire régulières et automates. Application aux correcteurs orthographiques.
- grammaires hors-contexte.
algorithmes classiques (LR, LALR, Cocke, etc.)
- systèmes transformationnels
illustration avec le Langage Spécialisé pour le Programmation Linguistique (LSPL) TELESI
- Algorithmes de Markov.
- approches dérivationnelle, flexionnelle, etc.
- grammaire à saturation et validation
illustration avec le système PILAF
- présentation du LSPL OPALE
- traitement des formes figées
- représentations syntaxiques
arbres de dépendance, arbres de constituants, etc.
application avec le LSPL TELESI-
- sous-grammaires
- traitement des lexies non figées
- notions sur le transfert et la génération
- formes pivot
- sémantique lexicale
approches statistiques
approches par graphes conceptuels
approche par vecteurs conceptuels.
- sémantique textuelle
algorithme de propagation
algorithmes par fourmis
Indexation de textes et recherche d'informations
- Requêtes et calcul de vecteurs (Salton, LSI, vecteurs conceptuels)
- Pb des nom propres
- Pb des mots inconnus
- présentation de grands systèmes
ARIANE, METEO, METAL, KBMT
- dictionnaires et bases de données lexicales
approches statistiques, structurées, mixtes
illustration avec le DEC
documents multilingues
- codage, représentation, structure.
MCC
Bibliographie
Principles of Compile Design Aho, Ullman
L'analyse syntaxique des langues naturelles Wehrli
Traitement Automatique du Langage Naturel Bouillon
An introduction to Machine Translation Hutchins, Somers
Support de cours
Sémantique lexicale et vecteurs conceptuel (ppt / html)
|