DESS IAOannée 1999-2000Proposition de sujets en option TAL (Traitement Automatique des Langages)Responsables
|
|||||||||||||
SUJET 1 - Prototype de système de traduction automatique Français-Anglais
Lorsqu'une phrase est correctement analysée, nous pourrons déterminer la fonction et le sens des mots. Si cette phrase est interrogative, elle peut correspondre à une requête SQL. Par exemple : Quel est l'âge du capitaine ? --> Select Person.age from personne where Personne.grade = Capitaine Cette traduction utilise un transducteur de structure syntaxique :
Cette traduction ne présuppose rien sur l'organisation de la base. Elle ne peut être utilisable que si elle correspond à une requette possible sur cette base. Il s'agit de construire un transducteur qui tienne compte d'un schéma d'une base de données. Il faut donc déterminer comment définir ce schéma dans un dictionnaire de termes et écrire un transducteur qui tienne compte de ces informations. En d'autres termes, le schéma de la base consitute l'ontologie du domaine sur lequel on travaille. Travail demandé : construire un système de traduction LN -> SQL qui utilise le schéma d'une base de donnée comme ontologie. Seuls des énnoncés interrogatifs sont considérés. L'analyse du problème doit être menée à bien. L'inplémentation ce fera en SYGMART et en C ou Java sous Système UNIX.
Parcourir l'arbre d'analyse résultat afin d'extraite les élements lexicaux identifiés lors de l'analyse ; Rechercher dans les dictionnaires les informations lexicales asscoiés aux éléments lexicaux ; Fusionner et formater à l'attention de l'utilisateur les informations lexicales (produire un résultat sous forme HTML). Travail demandé : il s'agit d'augmenter une analyse du Français existante afin d'autoriser la reconnaissance de locutions. A partir de l'arbre d'analyse du texte (ou de segments de textes), une recherche d'information doit être effectuée dans un ou plusieurs dictonnaires (selon les préférences de l'utilisateur). Les infortmations trouvées doivent être affichées sous forme lisibles à l'utilisateur. L'analyse du problème doit être menée à bien. L'inplémentation se fera en SYGMART et en C ou Java sous Système UNIX. On ne s'autorisera, a priori, que le developpement de modules CGI limités pour la partie serveur (pas de page HTML avec du Java).
|
|||||||||||||
Contact : mathieu lafourcade LIRMM - 161, rue ADA - 34392 Montpellier Cedex 5 - France - Tél : (33) 04 67 41 85 71 - Fax : (33) 04 67 41 85 00 - courriel : lafourca@lirmm.fr
|