Python for bioinformatics (Overview)

OBJECTIFS

  • Connaître les principes et les avantages du système Linux
  • Connaître et savoir utiliser les commandes de base permettant de lancer des programmes sous Linux
  • Comprendre et savoir lancer des scripts
  • Etre capable d’écrire des scripts en en Python
  • Acquérir de l’autonomie pour effectuer des analyses bioinformatiques qui combinent plusieurs outils

CONTENU

Pour la plupart des tâches communes, le système Linux (libre et gratuit) peut avantageusement remplacer les systèmes d’exploitation propriétaires tels que Windows ou MacOS. Les énormes avantages de Linux sont sa gratuité, son évolution constante et la quasi inexistence des virus. Ce stage est une initiation à l’utilisation du système d’exploitation Linux et des lignes de commande pour les non informaticiens, ainsi qu’une initiation à l’écriture et l’emploi de scripts (petits programmes) pour faciliter l’analyse de données. Il s’agit pour des débutants ou quasi débutants Linux d’utiliser le système et d’acquérir l’autonomie nécessaire pour résoudre les besoins communs simples d’analyse par la combinaison des méthodes à travers des scripts.

  • Linux, lignes de commandes, principales commandes, redirection
  • Lancer, créer et modifier des scripts
  • Notions de variables, de boucle, de choix
  • Programmation de scripts : utilisation de paramètres et de variables, combinaison d’outils et de logiciels, écriture des résultats dans un ou plusieurs fichiers
  • Créer un pipeline d’outils

Programme aperçu

  • matin 1: linux et commande, script
  • aprem 1 : base de python
  • matin 2 : script python ; librairie biopython
  • aprem 2 : exploiter biopython
  • matin 3 : suite exercices; présentation outil de gestion de pipeline : snakemake

Programme jour 1: shell / python

notions de bases

  • script
  • variable
  • structures controle: if, for, while, foreach
  • paramètres
  • modules et import
  • structure de données complexes: liste, dictionnaire

script et librairies

  • lancement
  • appel de librairies
  • fonctions

librairie BioPython

  • introduction
  • traitement de séquences

Programme jour 2 : pipeline snakemake

  • Biopython: alignement de séquence
  • Extraction des résultats d’alignement
  • Utilisation d’outils externes