Extraction de la Terminologie du Domaine : Etude de Mesures sur un Corpus Spécialisé Issu du Web

Mathieu Roche, Oriane Matte-Tailliez, Jérome Azé, Yves Kodratoff


Résumé

Le Web recèle de nombreuses données textuelles spécialisées qui peuvent être exploitées. Une des tâches intéressantes à effectuer est la construction d'ontologies spécialisées à partir des textes disponibles sur le Web. La première étape d'un tel travail consiste à déterminer la terminologie du domaine. Il existe de nombreuses mesures qui peuvent être utilisées afin d'extraire les termes pertinents d'un corpus. Les travaux que nous présentons dans cet article consistent à étudier la qualité des termes que l'on peut extraire en utilisant différentes mesures.