Extraction paramétrée de la terminologie du domaine

Mathieu Roche


Résumé

Suite à l'abondance des textes spécialisés, une demande accrue de leur traitement automatique est souhaitée. L'extraction terminologique, c-à-d. l'extraction de groupes de mots significatifs pour le domaine, est une information communément recherchée dans les domaines spécialisés. Dans cet article, nous proposons une méthode d'extraction automatique des termes spécifiques. Dans notre approche, nous avons en entrée un corpus spécialisé à partir duquel nous effectuons des traitements préliminaires : nettoyage et étiquetage. Lorsque ces pré-traitements sont effectués, nous nous appuyons sur des mesures d'association classiques pour extraire la terminologie du domaine. Notre principale contribution est le fait d'ajouter différents paramètres afin d'améliorer la recherche des termes du domaine.

Mots-clés

Taxonomie, Terminologie.