Extraction des Connaissances à partir des Données (ECD)
Master 2 IFPRU
Enseignants
Mathieu Roche (resp)
Anne Laurent (resp)
Jacques Chauché
Pascal Poncelet
Violaine Prince
Maguelonne Teisseire
Planning
Cours (Fouille de Textes)
Cours 1 de Fouille de Textes (1h30)
- Processus Global de Fouille de Textes :

- Processus FdT : Etiquetage grammatical :
Cours 2 de Fouille de Textes (3h)
- Processus FdT : Extraction de la terminolgie (approche non supervisée) :

- Processus FdT : Extraction de la terminolgie (approche supervisée) :

- Processus FdT : Classification conceptuelle :
Cours de Fouille de Textes et Recherche d'Information (1h30)
- LSA :

- Généralités en Recherche d'Information (RI) :

- Chaînes des caractères et RI :
TP (Fouille de Textes)
TP1 : Etiqueteur de Brill (une séance)
Enoncé du TP :
Ressources nécessaires pour le TP :
- Etiqueteur d'Eric Brill en anglais :
brill.zip (616Ko)
- Liste des étiquettes :
étiquettes en anglais et en français
TP2 : Extraction de la terminologie (trois séances)
Enoncé du TP :
Ressources nécessaires pour le TP :
- Corpus normalisé à partir duquel la terminologie devra être extraite :
corpusNormalise.txt (28Ko)
TP2 à envoyer par mail à M. Roche au plus tard le lundi 02 novembre 2009
Projet
Projet (à faire en binômes) : Classification de texes d'opinions
Les soutenances du projet sont prévues la dernière semaine de décembre 2009 (voir planning)
Stages Recherche 2008/2009
Exemple de stages en fouille de textes proposés les années précédentes : listes stages Recherche