Treatment of sequencing data

Le volume de séquences à traiter croît exponentiellement grâce au HD. Les analyses bioinformatiques requièrent des algorithmes nouveaux qui passent à l'échelle. Nous avons conçu de nouvelles structures de données d'index de séquences qui respectent ces exigences [Philippe et al. 2011] tout en permettant des requêtes pertinentes. Nous exploitons ces index dans l’ensemble de nos logiciels bioinformatiques. Pour analyser les lectures d'ARN (read), nous avons conçu et implanté le programme CRAC [Philippe et al. 2013]. Comparativement aux autres logiciels, CRAC offre la capacité de prédire des mutations, des jonctions d'épissage et des ARN de fusion en une seule analyse. Les ARN de fusion servent de marqueurs dans le diagnostic des cancers. Egalement, pour une formulation souple de la comparaison de génomes complets, nous avons proposé un algorithme quasi linéaire et développé le logiciel QOD (dépôt APP). Il a permis la découverte de 92 gènes nouveaux chez une bactérie pathogène des ruminants africains [Mancheron et al. 2011].

Last update on 17/03/2017