Fouille de Données (UMINP406)
Master Pro
| Planning |
Le planning des cours de Fouille de Données est disponible ici
La liste des des groupes est disponible ici 
(si un échange de groupe est souhaité entre deux étudiants, veuillez envoyer un mail à Mathieu Roche en précisant de manière précise les échanges de groupes désirés)
| Cours |
Cours 1 - 25 janvier 2007
- Généralités sur la fouille de donnée : 
- Processus Global de Fouille de Textes : 
- Etiquetage grammatical :
Cours 2 - 1er février 2007
- Extraction de la terminolgie (approche non supervisée) :
Cours 3 - 8 février 2007
- Extraction de la terminolgie (approche supervisée) : 
- Classification Conceptuelle : 
| TP de Fouille de Textes |
TP1 : Etiqueteur de Brill (une séance)
Enoncé du TP :
Ressources nécessaires pour le TP :
- Etiqueteur d'Eric Brill en anglais : brill.zip (616Ko)
- Liste des étiquettes : étiquettes en anglais et en français
TP2 : Extraction de la terminologie (trois séances)
Enoncé du TP : 
Ressources nécessaires pour le TP :
- Corpus normalisé à partir duquel la terminologie devra être extraite : corpusNormalise.txt (28Ko)
TP noté (TP2) à remettre au plus tard le vendredi 23 février à 18h (cf modalités décrites dans l'énoncé)