Sujet de thèse dans l'équipe MAB pour 2009-2010
ARBRES MULTI- LABELS EN PHYLOGENOMIQUE
Présentation
Telecharger la presentation
Résumé
Les arbres sont un formalisme utilisé pour modéliser de nombreux phénomenes réels. Entre autres, ils sont utilisés en bioinformatique pour représenter les relations de parenté entre espèces vivantes. Un tel arbre a ses feuilles étiquetées par des noms d'espèces actuelles, et ses noeuds internes correspondent aux espèces ancestrales disparues.
En général, de tels arbres sont construits depuis des genes (des sortes de chaînes de caracteres) collectés dans le génome des espèces actuelles ou disparues. Parfois plusieurs exemplaires du même gene sont présents chez la même espèce. L'arbre reconstruit comporte alors certaines étiquettes en double, en triple, etc. On parle dans ce cas d'arbres multi-labels.
Ce sujet de these concerne l'écriture d'algorithmes pour les arbres multi-labels.
On étudiera particulierement des algorithmes de construction ainsi que des algorithmes de comparaison.
On s'appuiera en particulier sur les techniques de complexité paramétrique.
Cette these s'effectuera dans le cadre du projet ANR PhylAriane, piloté par l'équipe MAB du LIRMM, ce qui constituera un contexte stimulant pour l'étudiant.
Recommandations ministérielles
Le sujet se situe dans les axes prioritaires suivants définis par le ministère pour 2009-2010 :
1 MATHEMATIQUES, STIC, NANOTECHNOLOGIES ET LEURS INTERACTIONS
1.d Recherches fondamentales en science informatique
Nouveaux paradigmes de linformatique : ..., approches novatrices pour franchir les barrières de complexité des problèmes combinatoires
4 SCIENCES DE LA VIE : AGROSCIENCES, BIOLOGIE ET SANTE
4.a Biologie intégrative, génomique
Génomique
4.g : Interface santé / STIC, mathématiques
Modélisation du vivant
Quelques articles liés à ce sujet de thèse
-
From Gene Trees to Species Trees through a Supertree Approach. Scornavacca C., V. Berry, and V. Ranwez. Conférence LATA 2009 (Language
and Automata Theory and Applications), actes publiés dans la série LNCS, Springer.
- PhySIC_IST : healing source trees to infer healthy supertrees. Scornavacca C., V. Berry, E. J. P. Douzery and V. Ranwez. BMC Bioinformatics 9:413, 2008.
- PhySIC : A Veto Supertree Method with Desirable Properties. Ranwez V., Berry V., Criscuolo A., Fabre P.H., Guillemot S, Scornavacca C., Douzery E.J.P. Systematic Biology, 56(5), pp 798-817, 2007
Pour plus de détails sur le sujet et l'environnement, contactez-nous par email :
vberry à lirmm.fr
vincent.ranwez à univ-montp2.fr.