v2.11.0 (5790)

Programme d'approfondissement - PA-BIOINFO : PA-Bioinformatique

Domaine > Biologie, Informatique.

Descriptif

En une cinquantaine d'années, l'informatique est devenue une composante essentielle dans beaucoup de secteurs de la recherche et de l'ingénierie en biologie.

De nouveaux domaines se sont imposés qui, sans informatique, n'existeraient pas, du simple fait de la masse de données à traiter: par exemple, le séquençage des génomes et donc la génomique comparée, la classification des protéines et des ARN, la prédiction et l'ingénierie des structures qui ouvrent des voies nouvelles en biologie, pharmacologie et médecine, avec les enjeux nouveaux de la médecine génomique. Réciproquement, les questions soulevées par la biologie et les singularités des données biologiques induisent de nouveaux problèmes en algorithmique, combinatoire et apprentissage.

Si le séquençage à haute vitesse atteint maintenant des débits spectaculaires, certaines analyses restent encore longues, délicates et coûteuses. Les données « -omiques » et cliniques peuvent aussi être rares pour certaines pathologies et l'exception est souvent la règle. Le recours systématique à l'apprentissage massif touche ainsi ses limites. Enfin, le biologiste et le médecin attendent des explications. La modélisation, l'algorithmique et la science des données prennent donc une importance croissante. On s'attache à la construction de modèles informatiques et mathématiques pour prédire mais aussi expliquer les phénomènes biologiques qui se produisent au niveau de la cellule et de ses composants, et aussi pour des groupes de cellules, voire des organismes complexes. Il s'agit souvent de concevoir des outils dédiés à des phénomènes très particuliers.

Mais les techniques de l’information seules ne sauraient résoudre les problèmes et de larges connaissances en biologie restent indispensables en amont et en aval pour une contribution certaine aux sciences du vivant. La Bioinformatique, à l'interface entre Biologie et Informatique, est ainsi une discipline très diversifiée et qui évolue rapidement, tant les questions posées se renouvellent vite au fur-et-à-mesure des découvertes en biologie et du progrès des outils d'observation du monde vivant.

Les Neurosciences constituent un domaine encore plus vaste. Les compétences acquises dans le Programme d'Approfondissement Bioinformatique constituent aussi une bonne introduction pour aborder les Neurosciences avant une spécialisation dans ce domaine en quatrième année.

Durant les deux premières périodes, l’accent est mis sur la consolidation des connaissances dont l’utilisation transversale sera développée au cours du stage de recherche.
Les règles imposées veillent à maintenir un certain équilibre entre biologie et informatique, avec quelques compléments possibles en statistique, afin d'acquérir la compétence étendue qui fait la spécificité du bioinformaticien, et qui lui permettra de s'insérer facilement dans des équipes pluridisciplinaires. Ces règles visent aussi à éviter la dispersion, tout en permettant à chacun de consolider ses points faibles et d'approfondir le domaine pressenti pour un début de carrière.

Objectifs

Le programme d'approfondissement en Bioinformatique est une introduction aux concepts et enjeux de cette discipline, à travers quelques cours généraux en biologie et en informatique et quelques autres modules qui peuvent constituer un début de spécialisation. Il s’agit de se donner la compétence double qui permettra d’interagir au plus haut niveau avec des informaticiens, des biologistes et des médecins, au sein des équipes pluridisciplinaires qui structurent maintenant la recherche et le développement dans ce domaine. Un choix de cours relativement vaste, théoriques ou appliqués, donne la possibilité de se construire un parcours individualisé, pour compléter sa formation au cas par cas et préparer un projet de carrière adapté, en fonction de ses centres d'intérêts.

Cette spécialisation se poursuivra en quatrième année, avant une orientation aussi bien vers le monde académique que vers le monde de l'entreprise. Dans ce dernier cas aussi, s'agissant le plus souvent de sociétés internationales, la thèse est toujours une étape conseillée pour une carrière de haut niveau.

 

À l'issue du programme d'approfondissement, il est possible de continuer un cursus en bioinformatique. Il est possible aussi de se réorienter vers l'informatique ou la biologie, en conservant un bénéfice de ce début de double formation bioinformatique. La poursuite dans un cursus monodisciplinaire suppose bien entendu que cette discipline soit restée une majeure du cursus de 2A et 3A, étayant ainsi cette motivation.

Comme formations relativement équilibrées entre les deux disciplines, on peut citer, par exemple,

  • le « MSc in Computer Science with option in Bioinformatics » de McGill,
  • le « MSc in Computational Biology and Quantitative Genetics » de Harvard,
  • le « MSc in Computer Science with track in Computational Biology » de Columbia,
  • le « MSc in Bioinformatics » de University of Copenhagen avec deux spécialisations « Computational Biology » et « Computer Science »,
  • le « MPhil in Computational Biology » de Cambridge,
  • le « MSc in Bioinformatics and Theoretical Systems Biology » de Imperial College London,
  • le « Master in Computational Biology and Bioinformatics » de ETH Zürich...

On peut ajouter, en France, des M2 comme « AMI2B » de Paris-Saclay, le parcours BIM « BioInformatique et Modélisation » du master d'Informatique de Sorbonne Université, et d'autres à Bordeaux, Aix-Marseille, Toulouse, ... La durée de ces formations est variable, de un an pour un M2 en France ou certains MSc, à deux ans pour des programmes plus complets. Elles proposent en général une voie recherche qui prépare à la poursuite en thèse.

Les débouchés en recherche académique, après une thèse, sont en laboratoires universitaires ou dans les grands centres de recherche français (INRA, Institut Pasteur, Institut Curie, Inserm...) ou internationaux (ex. EBI, SIB, NCBI...). Les activités exercées peuvent concerner notamment la conception d'algorithmes d'analyse ou de prédiction, mais également le développement, le nettoyage et l'enrichissement des grandes bases de données qui sont mises à disposition de la communauté, ainsi que l’ingénierie des plateformes qui les hébergent.

Les débouchés en entreprise, de préférence après une thèse, peuvent être en Recherche et Développement dans les industries pharmaceutique et agroalimentaire, l'agrochimie, l'ingénierie pour la santé, l'environnement, ou les biotechnologies.

Il existe aussi des débouchés en gestion et valorisation de la R&D et en conseil ou management de l'innovation technologique.

 

Pré-requis

• au moins un cours de Biologie, de préférence, BIO452 - « Biologie moléculaire et information génétique », • au moins deux cours d’Informatique (hors modal), de préférence, INF421 – « Conception et analyse d’algorithmes » et INF442 – « Traitement des données massives », • au moins un projet de programmation (soit intégré dans un cours d’informatique, soit comme le modal d’Informatique, • il est également conseillé d’avoir suivi MAP433 « Statistiques » ou à défaut, MAP432 « Modélisation des phénomènes aléatoires ».

Composition du parcours

Unités d'enseignement

UE Type d'enseignement Domaines Catégorie d'UE Volume horaire Responsables Site pédagogique
BIO/INF588 Projet en bioinformatique PA - C7 Biologie, Informatique UE d'approfondissement. Thomas Gaillard,
SEBASTIAN WILL
BIO511 Projet de 3e année de Biologie - Période 1 PA - C8 Biologie UE de projet. Yves Mechulam,
Olivier Tenaillon
BIO511B Projet de 3e année de Biologie - Période 2 PA - C8 Biologie UE de projet. Yves Mechulam,
Olivier Tenaillon
BIO551 Immunologie et agents infectieux PA - C3B Biologie David Ribet
BIO553 Biotechnologies pour la médecine et l'agriculture PA - C6B Biologie Loïc Lepiniec,
Alice Meunier
BIO556 Génomes : diversité, environnement et santé humaine PA - C2B Biologie Hannu Myllykallio,
Olivier Tenaillon
BIO557 Neurosciences PA - C4B Biologie Valérie Ego-Stengel,
Xavier Nicol
BIO562 Biologie des systèmes moléculaires PA - C1B Biologie Meriem El Karoui
BIO563 Epigénétique et ARN non-codants PA - C5B Biologie UE d'approfondissement. Claire Rougeulle,
Stéphan Vagner
BIO566 Biologie computationnelle PA - C3B Biologie Thomas Gaillard,
Thomas Simonson
BIO571A Travaux expérimentaux de génie génétique PA - C7 Biologie UE d'approfondissement. Pierre-Damien Coureux,
Roxane Lestini,
Yves Mechulam,
Anna Polesskaya
BIO571B Travaux expérimentaux en imagerie quantitative PA - C7 Biologie UE d'approfondissement. Anatole Chessel,
Yves Mechulam
BIO572 Reconstitution Personnalisée du Processus Tumoral (RPPT) ... PA - C7 Biologie UE d'approfondissement. Alexis Gautreau
BIO572B Reconstitution Personnalisée du Processus Tumoral (RPPT) ... PA - C7 Biologie UE d'approfondissement. Alexis Gautreau
BIO583 Sciences des données en imagerie biologique PA - C7 Biologie UE d'approfondissement. Anatole Chessel
BIO591 Biologie et écologie Stage Biologie Yves Mechulam
GEN502 Présentation du PA Bioinformatique Programme d'approfondissement Philippe Chassignet
INF511A Projet de Bioinformatique - période 1 PA - C7 Informatique UE de projet. Philippe Chassignet
INF511B Projet de Bioinformatique - période 2 PA - C8 Informatique UE de projet. Philippe Chassignet
INF550 Algorithmique avancée PA - C4B Informatique UE de base, UE d'approfondissement. Gilles Schaeffer
INF552 Data Visualization PA - C1B Informatique UE d'approfondissement, UE de base. Emmanuel Pietriga
INF554 Machine and Deep learning PA - C2B Mathématiques appliquées, Informatique UE d'approfondissement, UE de base. Michalis Vazirgiannis
INF555 Constraint-based Modeling and Algorithms for Decision-making PA - C4B Informatique UE d'approfondissement, UE de base. François Fages,
Sylvain Soliman
INF556 Topological Data Analysis PA - C5B Informatique UE de base, UE d'approfondissement. Steve Oudot
INF573 Image Analysis and Computer Vision PA - C3B Informatique UE de base, UE d'approfondissement. Mathieu Bredif
INF580 Large scale mathematical optimization PA - C6B Informatique UE d'approfondissement. Leo Liberti
INF581 Advanced Machine Learning and Autonomous Agents PA - C4B Informatique UE de base, UE d'approfondissement. Jesse Read
INF591 Informatique Stage Informatique Olivier Bournez
MAP566 Statistics in Action PA - C5 Mathématiques appliquées UE de base. Marc Lavielle
MAP569 Machine Learning II PA - C2 Mathématiques appliquées Erwan Le Pennec
MAP573 Data Analysis and Unsupervised Learning PA - C7 Mathématiques appliquées UE d'approfondissement. Julien Chiquet
Veuillez patienter