| SéminDoc 2004-2005 |
Ce séminaire a lieu chaque semaine, le jeudi après-midi à 16h en salle des séminaires (sauf mention du contraire).
Un e-mail sera envoyé au moins 24h à l'avance à l'alias [di-di] afin de prévenir les éventuels intéressés.
Les orateurs sont principalement des doctorants en informatique du LIRMM.
Les exposés concernent les travaux de l'orateur ou bien peuvent être des états de l'art sur un sujet donné.
| Date | Orateur | Exposé |
|---|---|---|
|
|
||
| 31 mars 2005 | Robin Passama |
- |
| | ||
| 7 avril 2005 | Thomas Plantard |
|
| | ||
| 14 avril 2005 | Benoit Darties |
- |
| | ||
| 21 avril 2005 | |
|
| | ||
| 28 avril 2005 | |
|
| | ||
| 5 mai 2005 | Thomas Plantard |
- |
| | ||
| Date | Orateur | Exposé |
|---|---|---|
|
|
||
| 25 novembre 2004 | Criscuolo Alexis
|
Application des techniques algorithmiques de la reconstruction phylogénétique à la combinaison de diverses données génomiques Il fut une époque lointaine où on se faisait une idée du génome et de son évolution au cours du temps. On y pensait des modèles, des critères et des algorithmes que l'on appliquait parfois sur des petits jeux de données. Ensuite arriva le temps où les nouvelles technologies offrirent la possibilité de séquencer des segments de gènes de plus en plus grands. Durant ces années, on constata que certains modèles étaient insatisfaisant et on en proposa de plus représentatifs. Les progrès techniques s'améliorant, les ordinateurs devinrent plus rapides, les bases de données génomiques on-line plus riches et les biologistes commencèrent à se dire que si un gène contient en son sein l'information sur son histoire évolutive, alors on doit pouvoir obtenir celle d'un organisme à partir d'un ensemble de gène (voire d'un génome complet). De là à rêver de représenter l'histoire évolutive de tout le vivant contemporain, il n'y a qu'un pas... Après une introduction aux techniques de reconstruction phylogénétique à partir de l'alignement de sequences d'un gène, je décrirai les différents niveaux de combinaison de données génomiques. La combinaison basse séduira les biologistes qui aiment à travailler directement sur les caractères des séquences. La combinaison haute intéressera les informaticiens par ses aspects fortement ancrés dans l'algorithmique et l'optimisation. La combinaison moyenne pourra plaire aux mathématiciens car j'y présenterai une nouvelle méhode mathématique permettant d'amalgamer des matrices de distances d'évolution de manière optimale sans modifier l'information topologique qui y est contenue. Et quand un biologiste, un informaticien et un mathématicien ont usé leurs arguments pour défendre leur propre technique, il ne reste plus que les simulations pour se faire une idée des performances de chacune. En conclusion, fort de preuves et d'observations sur la validité des phylogénies que nous pouvons obtenir par combinaison de gènes, je présenterai une application effectuée sur un jeu de données de 38 gènes permettant de définir la place de l'homme dans l'histoire évolutive des mammifères. Sommes nous plus proches du rat, du chat ou du cheval? |
| | ||
| 2 décembre 2004 | Frédéric Comte
|
Transformation d'ontologies OWL en graphes conceptuels On distingue, en représentation des connaissances, deux familles de langages: les langages d'échange et les langages d'opérationnalisation. Les langages du Web sont les principaux langages d'échange (RDF,OWL). Ils servent à représenter formellement et à échanger des connaissances. Les langages d'opérationnalisation eux sont nombreux et disposent de services inférentiels capables de raisonner sur les connaissances représentées. Deux formalismes parmi eux sont remarquables: les logiques de description et les graphes conceptuels. OWL, le langage recommandé par le W3C pour l'écriture d'ontologies, est inspiré des logiques de description SHIF(D) et SHION(D) suivant si on utilise la syntaxe lite ou DL et peut ainsi prétendre à être opérationnaliser avec des moteurs d'inférences utilisant ces logiques de description. Je présenterai au cour de ce séminaire une autre façon d'opérationnaliser OWL dans le formalisme des graphes conceptuels, grâce à une transformation des ontologies d'un sous langage d'OWL en GC, afin de disposer des mécanismes d'inférences disponibles dans ce formalisme. |
| | ||
| 9 décembre 2004 | Olivier Gandouet
|
Initiation au comptage probabiliste Il ressort d'un certain nombres de domaines (réseaux, base de donnée) que parfois il n'est pas utile, et voir même trop coûteux, de compter les éléments d'un multi-ensemble (ensemble ou les répétitions comptent) de façon exacte, et bien sur c'est là que peuvent intervenir les algorithmes de comptages probabilistes. Le comptage probabiliste (et par extension les algorithmes de comptage probabiliste) vise à extraire une information stochastique, un estimateur, de quelques paramètres d'un multi-ensemble. On en fera donc une présentation rapide ainsi qu'un survol des outils mathématiques mis en jeu dans l'étude de tels algorithmes en illustrant ceux-ci par des exemples: - LogLog (Flajolet,Durand) - Comptage par collisions (Whang,Vander-Zanden,Taylor) |
| | ||
| 16 décembre 2004 | Jérome Chapelle
|
Apprentissage social dans les systèmes multi-agents situés hétérogènes L'objectif est de développer des méthodes d'apprentissage social dans les systèmes multi-agents situés hétérogènes. Ces méthodes d'apprentissage sont développées dans l'optique de leur application au domaine de la robotique collective. Dans cette problématique d'apprentissage non supervisé je me suis inspiré de différentes techniques de l'informatique comme les architectures à base de comportements, l'apprentissage par renforcement. J'ai également utilisé des idées provenant d'autres domaines comme les neurosciences, ainsi que des méthodes empruntées au monde du vivant comme les « émotions » (qui sont les motivations de l'apprentissage). Jeudi prochain, je présenterais donc rapidement l'architecture qui a été retenue ainsi que le fonctionnement de l'apprentissage, et les deux phases qui le constituent. |
| | ||
| 23 décembre 2004 | |
|
| | ||
| 30 décembre 2004 | |
|
| | ||
| 6 janvier 2005 | |
|
| | ||
| 13 janvier 2005 | Samuel Blanquart
|
Reconstruction Phylogénétique par Analyse Bayésienne des Séquences La technique des "Chaines de Markov Monte Carlo" (MCMC) permet d'échantillonner des distributions de probabilités inconnues a priori. Le programme PhyloBayes (Nicolas Lartillot, 2004) implémente une MCMC échantillonnant la distribution de probabilité a posteriori induite sur les paramètres d'un modèle d'évolution par les données (alignements de séquences). Cette méthodes permet d'estimer les relations phylogénétiques entre les espèces représentées par les séquences. Lors du séminaire, on présentera les principes de l'échantillonnage par MCMC, l'algorithme de Metropolis-Hastings, les modèles d'évolution couramment utilisés, l'ajout à Phylobayes d'un nouveau modèle et les premiers résultats obtenus pour ce modèle. |
| | ||
| 20 janvier 2005 | Gilles Raymond |
      Le domaine des réseaux de contraintes est une approche nouvelle (relativement) de la résolution des problèmes complexes. Elle permet, avec une efficacité tout à fait satisfaisante, de s'attaquer à des problèmes de haut niveau en séparant la description du problème (spécifique) de sa réalisation (générique).       Je travaille sur la modélisation des problèmes sous forme de RC. Mon but est qu'elle soit semi-automatique et utlisable sans faire appel à des personnes connaissant les méthodes de résolution (Solver RC, contraintes,...).       Je présenterai jeudi la démarche générale de la modélisation ainsi que l'approche automatique permettant à partir d'un historique de solution d'un problème d'extraire l'ensemble des variables du réseau de contraintes recherché. |
| | ||
| 27 janvier 2005 | - |
|
| | ||
| 3 février 2005 | Céline Fiot
|
Motifs séquentiels et base de données incomplètes La plupart des bases de données issues du monde réel sont constituées de données numériques et historisées (données de capteurs, données scientifiques, données démographiques). Dans ce cadre, les algorithmes d'extraction de motifs séquentiels, s'ils sont adaptés au caractère temporel des données, ne permettent pas le traitement de données numériques. Ces données contiennent également un grand nombre de données incomplètes qui sont alors inutilisables pour la recherche de séquences fréquentes. Mon travail consiste donc à élaborer des techniques qui permettraient d'extraire des motifs séquentiels sur des données quantitatives, tout d'abord. Puis d'utiliser ces motifs afin de compléter des bases de données incomplètes. Enfin, trouver des techniques pour extraire directement les motifs séquentiels de bases comportant des données manquantes. Ma présentation sera axée essentiellement sur le premier point, l'extraction de motifs séquentiels pour des données quantitatives, à partir de trois algorithmes (SpeedyFuzzy, MiniFuzzy et TotallyFuzzy). |
| | ||
| 10 février 2005 | Jean-Luc Toutant
|
Sécurisation de documents numériques par tatouage La multiplication des échanges et l'utilisation grandissante de données partagées renforcent l'intérêt pour la confidentialité, la sécurité ou encore l'authentification des documents. La stéganographie apporte des solutions intéressantes à ces problématiques. Intégration de droits d'auteurs au sein des données, échanges discrets d'informations sensibles, authentification de documents sont autant de possibilités qu'elle offre. Proche de la cryptographie, elle se base plus sur la dissimulation de l'information. Aujourd'hui, différentes approches avec des capacités, des résistances et une invisibilité variables existent. Les méthodes de tatouage robuste à la compression JPEG sont particulièrement intéressantes puisque c'est le format d'image le plus utilisé. Nous effectuerons un survol du domaine avant de nous intéresser à ses limites et aux perspectives que nous envisageons de développer dans notre thèse. |
| | ||
| 17 février 2005 | ||
| | ||
| 24 février 2005 | ||
| | ||
| 3 mars 2005 | Lylia Abrouk |
Règles de propagation pour la création d'ontologies d'annotation de ressources L'annotation se distingue de l'indexation par l'utilisation d'une ou plusieurs ontologies qui définissent un domaine global de référence permettant de cadrer et de normaliser les annotations effectuées, par ailleurs une ressource annotée doit l'être non pas par une liste de mots-clefs, mais bien par une ou plusieurs ontologies. Malheureusement, il est peu réaliste de penser que les centaines de millions de ressources mises à disposition sur le Web puissent être annotées par leurs auteurs. Pour résoudre ce problème, notre démarche consiste à indexer les documents en se basant sur l'ontologie globale et ensuite propager les annotations en utilisant des documents déjà annotés pour annoter d'autres documents référencés par ceux-ci. La propagation des annotations suit des règles que nous proposons. |
| | ||
| 10 mars 2005 | Grégory Beurier |
Emergence de structures multi-niveaux La compréhension des mécanismes de structuration des systèmes complexes est fondamentale dans les sciences modernes ; que ce soit en informatique, pour caractériser par exemple la nature, le fonctionnement et les résultats des interactions entre agents d'un système multi-agents, dans une approche vie artificielle, pour comprendre les mécanismes intrinsèques des structures biologiques ou plus généralement dans une approche systèmes auto-organisés pour interpréter les organisations inhérentes aux interdépendances des parties d'un système. Nous abordons cette problématique en proposant deux modèles de systèmes capables de s'auto-organiser. Le premier modèle met en oeuvre des agents aux comportements récursifs qui produisent des structurations multi-émergentes par attraction/répulsion. Le deuxième modèle s'inspire de modèles biologiques (les homéoboxes) pour définir une population d'HoméoAgents. Les HoméoAgents utilisent les principes de la programmation génétique et des lois morphogénétiques des homéoboxes (lois de croissance d'un organisme) pour produire des organismes composés d'entités auto-organisées spatialement et fonctionnellement. Je présenterai au cours de ce séminaire les outils mis en oeuvre dans ces modèles (algorithmes génétiques, modèles biologiques, tropismes, etc.) ainsi que les modèles eux-mêmes et leurs simulations. PS: avec des schémas, les termes de biologie sont beaucoup plus simples. |
| | ||
| 17 mars 2005 | Sylvain Guillemot |
|
| | ||
| 24 mars 2005 | Sylvain Guillemot |
Quelques problèmes en analyse phylogénétique L'analyse phylogénétique se donne pour but la reconstruction de l'histoire évolutive des organismes à partir de données biologiques. La notion centrale est celle d'arbre phylogénétique : il s'agit d'un arbre, dont les feuilles sont les espèces actuelles, dont les noeuds internes sont les espèces ancestrales, et dont la topologie décrit les évènements de spéciation passés. Dans cet exposé, on abordera deux questions d'importance en analyse phylogénétique : les méthodes de distance, et les problèmes de consensus d'arbres. Les méthodes de distance permettent d'inférer un arbre phylogénétique à partir de données biologiques (alignement de séquences), en utilisant comme étape intermédiaire le calcul d'une matrice de distances inter-espèces. Le consensus d'arbres permet de répondre à la question suivante : étant donné un ensemble d'arbres, correspondant à autant de scénarios d'évolution possibles pour les espèces considérées, quelles sont les espèces pour lesquels tous ces arbres prédisent la même histoire ? On présentera quelques questions théoriques portant sur les problèmes étudiés, ainsi que les résultats obtenus. |
| | ||
Les séminaires constituent un module de l'école doctorale. Les modalités d'obtention de ce module sont les suivantes :
Pour toutes suggestions, commentaires ou remarque, envoyez un mail au comité d'organisation.
Le comité d'organisation est pour le moment constitué de :
| Denis Bertrand |
Alexis Criscuolo |
Didier Schwab |
Toute nouvelle personne est la bienvenue.