** Recup url : http://www.lirmm.fr/form/deaInfo/ModTALN.html DEA Informatique, U. Montpellier II, Module Traitement linguistique des documents
Option 2 :
Interaction, Coopération,
Systèmes hétérogènes, Web
DEA & FD Informatique
Ecole doctoraleInformation, Structures, Systèmes
Université Montpellier II

Formation doctorale Informatique
DEA Informatique
Tronc commun
Complexité, Algorithmique
Information Interaction Coopération Web
Représentations et leur mise en oeuvre
Options
Algorithmique Optimisation Réseaux, Images
Interaction Cooperation Systèmes & Web
Objets
Données
Connaissances
Informations pratiques
Rentrée, lieu
Bourses
Candidatures
Calendrier
Intranet
 
 Module
 "Traitement linguistique des documents"

Durée : 20h

Responsable

Jacques Chauche et Mathieu Lafourcade

Objectif

Donner une vue d'ensemble du Traitement automatique du language naturel en mettant l'accent sur les modèles, méthodes et techniques permettant d'aborder les problèmes de recherche à court et long terme. Le domaine d'application servant à illustrer le cours sera la traduction automatique.

Plan

  • Langage Naturel et Langage formel
    • grammaire formelle
      • —classification de Chomsky
        —Grammaire régulières et automates. Application aux correcteurs orthographiques.
    • grammaires hors-contexte
      • —algorithmes classiques (LR, LALR, Cocke, etc.)
    • systèmes transformationnels
      • —illustration avec le Langage Spécialisé pour le Programmation Linguistique (LSPL) TELESI
        —Algorithmes de Markov
  • Analyse morphologique
    • approches dérivationnelle, flexionnelle, etc.
      • —grammaire à saturation et validation
        —illustration avec le système PILAF
    • présentation du LSPL OPALE
      • —traitement des formes figées
  • Analyse syntaxique
    • représentations syntaxiques
      • —arbres de dépendance, arbres de constituants, etc.
    • application avec le LSPL TELESI
      • —sous-grammaires
        —traitement des lexies non figées
        —notions sur le transfert et la génération
        —formes pivot
  • Analyse sémantique
    • sémantique lexicale
      • —approches statistiques
        —approches par graphes conceptuels
        —approche par vecteurs conceptuels
    • Titre de sous-chapitre
    • Titre de sous-chapitre
  • Problèmatiques spécifiques au multilinguisme et à la Traduction Automatique
    • présentation de grands systèmes
      • —ARIANE, METEO, METAL, KBMT
    • dictionnaires et bases de données lexicales
      • —approches statistiques, structurées, mixtes
        —illustration avec le DEC
    • documents multilingues
      • —codage, représentation, structure

Bibliographie

  • Principles of Compile Design Ñ Aho, Ullman.
  • L'analyse syntaxique des langues naturelles Ñ Wehrli.
  • Traitement Automatique du Langage Naturel Ñ Bouillon
  • An introduction to Machine Translation Ñ Hutchins, Somers
  • Méthode

    Cours magistral / lecture d’articles.
    Le contrôle des connaissance fait appel à l'étude d'articles et la présentation orale (transparents — 15 mn)


     
    Modules de l'option 2
    Intégration de données et Extraction de Connaissances dans les Bases de DonnéesInteraction médiatisée et WebTraitement linguistique des documentsSystèmes répartis, transactionnels et collaboratifsInteraction sur le Web et Dialogue

     

    Page
    d'accueil
    Début
    de page
    DEA Informatique, 161, Rue Ada, 34392 Montpellier cedex 5
    WWW: http://www.lirmm.fr/form/deaInfo
    Mise à jour :JN   le 3/3/2003