This page is out-of-date
Projets DUT A2
Corporatique
Développement de bibliothèques (API) et d'une appli de gestion associée (archi type plugin) pour la manipulation de documents textuels dans divers formats numériques d'origine : texte, pdf, rtf, docx, odf, csv, etc.
Les données textuelles (c'est-à-dire lisibles par l'oeil humain) peuvent se présenter de façon numérique sous un nombre de formats considérable : texte, pdf, rtf, docx, odf, csv, etc.. Chacun de ces formats nécessite un traitement qui lui est propre avant que les données textuelles à proprement parler puissent être manipulées. L'objectif de ce projet est de développer une application qui permette d'extraire les données textuelles brutes à partir d'un fichier dans n'importe quel format. Plus précisément, il s'agira de développer un ensemble de bibliothèques (API) ainsi qu'une appli de gestion associée (archi type plugin), pour la manipulation de documents textuels dans divers formats numériques d'origine.
Backend application web de crowdsourcing
Backend d'appli web de crowdsourcing. Dev. par approche expérimentale d'une stratégie de choix d' éléments dans un ensemble, qui optimise certaines mesures statistiques.
Ce projet consiste à développer la partie applicative (serveur) d'une application web de crowdsourcing. Le crowdsourcing fait référence à la constitution d'une ressource de façon collaborative (par ex., wikipedia). Dans le cas présent, il s'agit d'une ressource de linguistique computationnelle, mais le domaine d'application est secondaire. L'interface graphique existe déjà, et sera utilisée pour les tests. Vue depuis le serveur, l'application consiste à présenter des informations à chaque utilisateur, collecter les réponses, puis effectuer quelques calculs statistiques sur les données récoltées. La difficulté intéressante à surmonter sera d'élaborer, tester et comparer différentes stratégies de choix des données présentées à chaque utilisateur, de façon à optimiser les résultats statistiques globaux attendus.
Assitant pour expérimentation scientifique
Interface web pour tester un prog. de recherche en traitement du langage naturel en analyse syntaxique.
Des chercheurs du laboratoire de recherche en informatique de Montpellier (LIRMM) développent une application d'analyse syntaxique pour le langage naturel, avec laquelle ils ont besoin d'effectuer de nombreux tests et expériences. L'objet de ce projet est de développer une application web qui facilite ces expérimentations. L'application devra avoir, en priorité, une interface web. En complément, elle pourra également disposer d'une interface programmable (bibliothèque/script(s)). Les fonctionnalités attendues incluent notamment :
- la saisie des données d'entrée (texte) selon plusieurs modes possibles (saisie en direct dans formulaire, ou lecture depuis fichier à importer) ;
- la saisie des paramètres d'entrée nécessaires à l'exécution du programme ;
- la présentation graphique de certains éléments du résultat obtenu par l'exécution du programme (structures arborescentes) ;
- la présentation de résultats numériques (tableaux, camemberts, etc.).
Master 2, Traitement Automatique des Langues (TAL)
- Duchier et al., 2009. A Model-Theoretic
Framework for Grammaticality Judgements, in proceedings of
FG'09, Springer. [pdf]
[slides]
- Hiroshi Maruyama. Structural disambiguation with
constraint propagation. In Proceedings of the 28th annual
meeting on Association for Computational Linguistics (ACL),
1990, pp. 31-38 [pdf]
- Grammaires d'unification [pdf]
Master 1, Traitement Automatique des Langues (TAL)
- Sylvain Schmitz, 2013. Notes on Computational
Aspects of Syntax. LSV, ENS Cachan & CNRS & INRIA. [pdf]
- Syntaxe, cours 1 [pdf] (crédit : Antoine Rozenknop, LIPN, U. Paris 13)
M2103 : DUT A1, Programmation Orientée Objet (POO)
- Une version temporaire et incomplète des transparents
du cours (en date du 31 mars 2015) [pdf]
- Voir ENT pour les sujets de TD, et une version plus à
jour du CM