TER de semestre 2 de Master (année 2007-08)

16 sujets DIWEB

Mention : Informatique

Spécialité : Informatique professionnelle et Recherche en Informatique

Représentation des résultats de recherche Web sur carte géographique GoogleMaps

Résumé : L'objectif de ce projet est de développer un système permettant l'insertion automatiquement de liens hypertextuels dans des cartes géographiques (GoogleMaps). Les cartes seront produites dynamiquement, en réponse à des recherches de l'utilisateur.

Parcours concerné : DIWEB, GL, I2A

Remarques (UE conseillées, langage…) : l'expérience des systèmes d'information géographique (SIG) est un atout.

Mise en oeuvre d'une plateforme logicielle d'évaluation des sigles

Mathieu Roche et Violaine Prince

Résumé : Le travail consiste à évaluer un ensemble de mesures de qualité pour déterminer le choix de la meilleure définition pour un sigle non défini dans une page Web. The work consists in evaluating a set of quality measures to determine the choice of the best expansion for an acronym not defined in a Web page.

Parcours concerné : DIWEB, I2A

Remarques (UE conseillées, langage…) : Intérêt pour le TAL

Environnement de démos pour Choco

Eric Bourreau

Résumé : La librairie Choco possède déjà quelques démos, nous souhaitons homogénéiser et mettre en valeur les différentes contributions (tant visuellement que programmatiquement) à partir d’une librairie de problèmes : la CSPLIB.

Parcours concerné : CASAR, DIWEB, GL, I2A

Remarques (UE conseillées, langage…) : Langages de programmation : Java

Cartographie de mots : application à la visualisation de noms de marque

Mountaz Hascoët, Mathieu Roche, Anne Laurent

Résumé : De plus en plus souvent, les utilisateurs cherchent des moyens visuels d'organiser leurs connaissances. En particulier, les utilisateurs désireux de connaître comment s'articulent un grand nombre de données souhaitent souvent les voir affichées sous forme de graphes. Dans ce projet, il s'agit d'aider les créateurs de noms de marque à visualiser les noms existants les plus proches. Il faudra donc concevoir et développer des méthodes de visualisation des similitudes entre un nom de marque saisi par un utilisateur et les noms les plus proches, sous la forme d'une cartographie.

Parcours concerné : DIWEB, GL, I2A

Remarques (UE conseillées, langage…) : Conception et Développement des IHM

Visualisation de Graphe

Anne-Elisabeth Baert et Vincent Boudet

Résumé : Le but de ce TER est de développer une application de visualisation 2D des graphes et de leurs propriétés.

Parcours concerné : CASAR, DIWEB

Remarques (UE conseillées, langage…) : Algorithmique/Complexité/Calculabilité, Conception et développement IHM

Modélisation et implémentation d'un robot joueur à JeuxDeMots

Mathieu Lafourcade

Résumé : concevoir un programme autonome (dit "bot") capable de jouer aussi correctement que possible à JeuxDeMots (http://www.lirmm.fr/jeuxdemots). Le bot a accès à la base de relations de JeuxDeMots, mais doit trouver des stratégies (évolutives) pour maximiser le nombre de points et sa position dans le classement. Le bot doit non seulement finir des parties proposées par les autres joueurs, mais aussi proposer des parties intéressantes (à la fois pour les autres joueurs, mais aussi pour la pertinence de la base de relations). Pour un aperçu de la base de relations voir http://www.lirmm.fr/jeuxdemots/rezo.php.

Parcours concerné : DIWEB, I2A

Remarques (UE conseillées, langage…) :

Modélisation et implémentation d'un jeu de type devinette à JeuxDeMots

Mathieu Lafourcade

Résumé : Le jeu de devinette est un jeu asymétrique ou le joueur A compose une devinette à partir d'un terme cible proposé par le système. Le joueur B doit lui trouvé le mot cible le plus rapidement possible au fur et à mesure de l'affichage des indices. La conception de la devinette ce fait à partir de shémas de fonctions lexicales à completer (par exemple : est produit par xxx, contient yyy, se trouve souvent avec zzz). Il faudra tenter de déterminer sur n parties quelles sont les indices pertienents, ceux-ci alimentant la base de relations de JeuxDeMots (http://www.lirmm.fr/jeuxdemots) avec des relations spécifiques pour lesquelles la lexicalisation est faible. Le jeu ne doit pas être aisément falsifiable (c'est-à-dire qu'il existe une stratégie pour que les joueurs gagnent qui ne soit pas pertienente pour la base).

Parcours concerné : DIWEB, I2A

Remarques (UE conseillées, langage…) :

Modélisation et implémentation de stratégies d'identification d'usage de termes devant être validé par les joueurs

Mathieu Lafourcade

Résumé : Il s'agit de concevoir un module pour JeuxDeMots (http://www.lirmm.fr/jeuxdemots) permettant à partir de la base de relations entre termes d'identifier les termes polysémiques ou ayant des usages multiples. Il est nécessaire de faire valider les hypothèse via l'activité des joueurs, mais sans pour autant leur demander directement. Les hypothèses validées induisent la création de nouveaux usages du termes qui sont introduits dans la base de relations. Des hypothèses qui s'avèrerait finalement fausses peuvent conduire à une opération de fusion de sens. On pensera à une approche de type "hystéresis" afin que le système ne soit pas amené à séparer et fusionner en boucle un même terme. Pour un aperçu de la base de relations voir http://www.lirmm.fr/jeuxdemots/rezo.php.

Parcours concerné : DIWEB, I2A

Remarques (UE conseillées, langage…) :

Calcul de vecteurs conceptuels à partir d'un réseau lexical étiqueté pondéré

Mathieu Lafourcade

Résumé : Pour chaque terme et sens du réseau de JeuxDeMots (http://www.lirmm.fr/jeuxdemots et http://www.lirmm.fr/jeuxdemots/rezo.php), on souhaite calculer de façon itérative un vecteur conceptuel. Pour le vecteur d'un noeud donné du réseau, son calcul se fait comme une fonction des vecteurs des termes auxquels ce noeud est relié (les relations étant orientées, étiquetées et pondérées). Si aucun vecteur n'est disponible pour un noueud voisin, ce dernier est tiré au hasard. Une opération de séparation (sur la base d'un modèle de particules se repoussant via une force en 1/d**2) est ensuite appliqué de façon à "écarter" les vecteurs accidentellement proches. Il s'agira de modéliser précisément ce modèle et de l'expérimenter en grandeur réelle.

Parcours concerné : DIWEB, I2A

Remarques (UE conseillées, langage…) :

Fouille de données floue : règles séquentielles

Anne Laurent et Maguelonne Teisseire

Résumé : La fouille de données vise à extraire de manière la plus efficace possible des règles pertinentes à partir de bases de données volumineuses. Cette discipline connaît de très nombreuses applications, notamment dans le domaine marketing ou pour l'analyse du comportement utilisateur (sites web par exemple). Typiquement, les règles trouvées sur les sites marchands du type « les internautes ayant été intéressés par cet article ont également regardé tel et tel autre produit » permettent de guider les clients tout en optimisant le rendement des sociétés commerciales. Cependant, les comportements trouvés dans la vie réelle sont rarement « blancs ou noirs », et on se trouve par exemple souvent confrontés à des cas où un internaute a par exemple été « plutôt intéressé ». La modélisation de ces comportements intermédiaires est alors assez facilement représentable en utilisant la théorie des sous-ensembles flous, qui a déjà été appliquée pour la recherche de règles. Dans ce TER, nous visons à étendre ces méthodes au contexte des règles séquentielles où la relation de causalité est accompagnée par une relation temporelle. Par exemple, on étudiera les règles du type « les internautes ayant été plutôt intéressés par cet article ont plus tard été très intéressés par tel autre ». Cette extension s'effectuera en utilisant les implications floues. Il sera également possible de réfléchir à la recherche de règles graduelles permettant de rendre compte d'une influence positive ou négative continue d'un attribut sur un autre, pour par exemple exhiber des règles du type : « plus les internautes ont été intéressés par ce produit, plus/moins ils ont été intéressés par tel autre ».

Parcours concerné : DIWEB, GL, I2A

Remarques (UE conseillées, langage…) : BD, Programmation

Fouille de données médicales basée sur une ontologie

Paola Salle et Sandra Bringay

Résumé : La fouille de données médicales s'avère complexe et difficile. En effet, ces données sont particulières car hétérogènes, imprécises et complexes. Dans ce contexte, la fouille de données classique donne des résultats imprécis et en trop grande quantité. L'objectif de ce TER est de mettre en oeuvre une méthode d'extraction de connaissances qui soit pertinente et adaptée aux utilisateurs experts de ce domaine. De façon plus précise, il s'agit de mettre en œuvre un algorithme proposé au sein de notre équipe de recherche mettant en correspondance les informations d'une ontologie de référence et les données médicales réelles. Il s'agira de réaliser des évaluations aussi bien en terme de performance qu'en terme de qualité.

Parcours concerné : DIWEB, GL, I2A

Remarques (UE conseillées, langage…) : BD, Programmation

Plug-in Eclipse pour l’aide à la spécification de montages vidéo

Marc Nanard

Résumé : Prolongement d’un excellent travail de l’an dernier qui servira de point de départ, il s’agit de compléter un environnement de spécification de règles expertes pour le montage audiovisuel.

Parcours concerné : DIWEB, GL

Remarques (UE conseillées, langage…) : langage Java, très intéressant pour ceux qui veulent connaître l'intérieur d'Eclipse

Editeur XML

Michel Meynard

Résumé : Concevoir un éditeur XML modulaire permettant d'effectuer les différentes actions (édition, validation, transformation, dtd, ..) depuis un même outil.

Parcours concerné : DIWEB, GL

Remarques (UE conseillées, langage…) : langage Java

Visualisation de graphes dynamiques

Rémi Coletta et Fabien Duchateau

Résumé : Un outil d'intégration de données permet actuellement de trouver des correspondances entre éléments de plusieurs schémas de bases de données. La liste de ces correspondances est affichée textuellement à l'utilisateur en sortie. Cependant, nous souhaiterions visualiser cette liste de correspondances sous forme de graphe. Le TER consiste à développer (en Java) la visualisation d'un graphe à 2 étapes : (i) lors de la construction (visualisation dynamique des nouveaux éléments du graphe), (ii) lors de la phase de post-match, pendant laquelle les éléments fortement similaires ont tendance à se rapprocher (réorganisation visuelle des éléments du graphe). Le développement se fera en JAVA, et pourra se baser sur un des outils existants de visualisation de graphes (graphviz, jgraph, ....)

Parcours concerné : CASAR, DIWEB, GL, I2A

Remarques (UE conseillées, langage…) : Bonne connaissance Java (La connaissance de Swing serait un plus)

Simulation de la vison humaine

Marc Nanard

Résumé : Les limites physiologiques du système oculaire humain (champ de vision, vision centrale vs. périphérique, etc.) sont rarement prises en compte dans la conception de postes de travail (aviation, automobile, industrie). Le travail consistera à développer des transformations paramétrables d’images permettant de simuler ce que voit réellement un opérateur en situation de travail. Travail proposé en partenariat avec un industriel canadien, poursuite éventuelle en stage.

Parcours concerné : DIWEB, GL

Remarques (UE conseillées, langage…) : langage de preference C, C++, openGL

Annotateur de ressources web basé sur COGUI (outil graphes conceptuels)

Marie-Laure Mugnier avec la participation d'Alain Gutierrez, ingénieur et concepteur de COGUI

Résumé : COGUI (http://www.lirmm.fr/cogui) est un outil java qui permet de construire interactivement une base de connaissances (ontologie, bases de faits, de règles, de contraintes ...) et de l'interroger. Les divers types de connaissances sont représentés par des graphes conceptuels. Cogui comporte plusieurs outils, notamment l'outil "Cogui Annotator" permettant de construire des annotations (cet outil n'est pas disponible sur le site de Cogui à l'heure actuelle). Cogui Annotator est un plugin Eclipse. Le but du TER est de développer une application autonome autour de ce plugin. Cette application permettra d'annoter des ressources du web et d'interroger ces annotations. Il faudra également construire une ontologie et des annotations sur un domaine "exemple" qui servira de démonstration de cette application.

Parcours concerné : DIWEB, I2A, GL (avec une coloration représentation de connaissances)

Remarques (UE conseillées, langage…) : programmation en Java, architecture de plugin Eclipse, représentation de connaissances