LIRMM
Équipe TAL
Université Montpellier 2
Faculté des Sciences





Extraction des Connaissances à partir des Données (ECD)
Master 2 IFPRU

Enseignants
Mathieu Roche (resp)
Anne Laurent (resp)
Jacques Chauché
Pascal Poncelet
Violaine Prince
Maguelonne Teisseire


Planning
Cours (Fouille de Textes)
Cours 1 de Fouille de Textes (1h30)
- Processus Global de Fouille de Textes :
- Processus FdT : Etiquetage grammatical :

Cours 2 de Fouille de Textes (3h)
- Processus FdT : Extraction de la terminolgie (approche non supervisée) :
- Processus FdT : Extraction de la terminolgie (approche supervisée) :
- Processus FdT : Classification conceptuelle :

Cours de Fouille de Textes et Recherche d'Information (1h30)
- LSA :
- Généralités en Recherche d'Information (RI) :
- Chaînes des caractères et RI :


TP (Fouille de Textes)
TP1 : Etiqueteur de Brill (une séance)
Enoncé du TP :
Ressources nécessaires pour le TP :
- Etiqueteur d'Eric Brill en anglais : brill.zip (616Ko)
- Liste des étiquettes : étiquettes en anglais et en français

TP2 : Extraction de la terminologie (trois séances)
Enoncé du TP :
Ressources nécessaires pour le TP :
- Corpus normalisé à partir duquel la terminologie devra être extraite : corpusNormalise.txt (28Ko)
TP2 à envoyer par mail à M. Roche au plus tard le lundi 02 novembre 2009


Projet
Projet (à faire en binômes) : Classification de texes d'opinions

Les soutenances du projet sont prévues la dernière semaine de décembre 2009 (voir planning)


Stages Recherche 2008/2009
Exemple de stages en fouille de textes proposés les années précédentes : listes stages Recherche