Utilisation de LSA comme première étape pour la classification des termes d'un corpus spécialisé
Mathieu Roche et Yves Kodratoff
Résumé
La classification des termes issus de textes spécialisés est une tâche essentielle pour plusieurs applications (extraction de connaissances dans les textes, des règles d'association, par exemple). Cette étude présente quelques résultats expérimentaux relatifs au regroupement deux à deux des termes issus d'un corpus spécialisé (corpus des « Ressources Humaines »). Un tel regroupement est une première étape cruciale dans le but d'effectuer une classification des termes d'un corpus. Dans cet article, nous présentons un certain nombre d'expérimentations en utilisant la méthode automatique appelée « Latent Semantic Analysis » (LSA).
Mots-clés
Traitement Automatique du Langage Naturel, Terminologie, Classification conceptuelle