Descriptif
En une quarantaine d’années, l’informatique est devenue une composante essentielle dans beaucoup de secteurs de larechercheetdel’ingénierieenbiologie.
De nouveaux domaines se sont imposés qui, sans informatique, n’existeraient pas, du simple fait de la masse de données à traiter : par exemple, le séquençage des génomes et donc la génomique comparée, la classification des protéines et des ARN, la prédiction et l’ingénierie des structures qui ouvrent des voies nouvelles en biologie, pharmacologie et médecine.
Réciproquement, les questions soulevées par la biologie et les singularités des don- nées biologiques induisent de nouveaux problèmes algorithmiques.
Si le séquençage à haute vitesse atteint maintenant des débits spectaculaires, certaines expériences restent encore longues, délicates et coûteuses. Les données peuvent aussi être rares et l’exception est souvent la règle. Le recours systématique à l’apprentissage statistique touche ainsi ses limites.
La modélisation, l’algorithmique et la science des données prennent une importance croissante. On s’attache à la construction de modèles informatiques et mathématiques pour prédire mais aussi expliquer les phénomènes biologiques qui se produisent au niveau de la cellule et de ses composants, et aussi pour des groupesdecellules,voiredesorganismes complexes.Ils’agitsouventdeconcevoir des outils dédiés à des phénomènes très particuliers.
Mais les traitements informatiques seuls ne sauraient résoudre les problèmes et de larges connaissances en biologie restent indispensables en amont et en aval pour une contribution certaine aux sciences du vivant.
La Bioinformatique, à l’interface entre Biologie et Informatique, est une donc discipline très diversifiée et qui évolue rapidement, tant les questions posées se renouvellent vite au fur-et-à-mesure des découvertes en biologie et du progrès des outils d’observation du monde vivant.
Les Neurosciences constituent un domaine encore plus vaste.
Les thèmes traités dans le Programme d’Approfondissement Bioinformatique constituent une bonne introduction pour aborder les Neurosciences avant une spécialisation dans ce domaine en quatrième année.
Si l’on envisage une telle voie, un complément par le cours HSS524 – Sciences cognitives, sciences naturelles de l’esprit est alors indiqué.
La plupart des cours de Biologie concernent assez directement l’étude du système nerveux, plusieurs cours d’Informatique s’appliquent naturellement à l’analyse des données en Neurosciences, et d’autres aux techniques de simulation des mécanismes neuronaux.
Objectifs
Le programme d’approfondissement en Bioinformatique constitue une introduction aux concepts et enjeux de cette discipline, à travers quelques cours généraux en biologie et en informatique et quelques autres modules qui peuvent constituer un début de spécialisation.
Un choix de cours relativement vaste, théoriques ou appliqués, donne la possibilité de se construire un parcours individualisé, pour compléter sa formation au cas par cas et préparer un projet de carrière adapté, en fonction de ses centres d’intérêts.
Cette spécialisation se poursuivra en quatrième année, avant une orientation aussi bien vers le monde académique que vers le monde de l’entreprise. Dans ce dernier cas aussi, s’agissant le plus souvent de sociétés internationales, la thèse est toujours une étape conseillée pour une carrière de haut niveau.
Débouchés
À l’issue du programme d’approfondissement, il est possible de continuer un cursusenbioinformatique.Ilestpossible aussideseréorienterversl’informatique oulabiologie,enconservantunbénéfice de ce début de double formation bioinformatique. La poursuite dans un cursus monodisciplinaire suppose bien entendu quecettedisciplinesoit restéeunemajeure ducursusde2Aet3A,étayantainsicette motivation.
Comme formations relativement équilibrées entre les deux disciplines, on peut citer, par exemple,
■ le « MSc in Computer Science with option in Bioinformatics » de McGill,
■ le « MSc in Computational Biology and Quantitative Genetics » de Harvard,
■ le « MSc in Computer Science with track in Computational Biology » de Columbia,
■ le « MSc in Bioinformatics » de Univer- sity of Copenhagen avec deux spécia- lisations « Computational Biology » et « Computer Science »,
■ le « MPhil in Computational Biology » de Cambridge,
■ le « MSc in Bioinformatics and Theo- retical Systems Biology » de Imperial College London,
■ le « Master in Computational Biology and Bioinformatics » de ETH Zürich…
On peut ajouter, en France, des M2 comme
« AMI2B » de Paris-Saclay,
le parcours BIM « BioInformatique et Modélisation » du master d’Informatique de Sorbonne Université, et d’autres à Bordeaux, Aix-Marseille, Toulouse…
La durée de ces formations est variable, de un an pour un M2 en France ou certains MSc, à deux ans pour des programmes plus complets. Elles proposent en général une voie recherche qui prépare à la poursuite en thèse.
Les débouchés en recherche académique, après une thèse, sont en laboratoires universitaires ou dans les grands centres de recherche français (INRA, Institut Pas- teur, Institut Curie, Inserm…) ou internationaux (ex. EBI, SIB, NCBI…).
Les activités exercées peuvent concerner notamment la conception d’algorithmes d’analyse ou de prédiction, mais également le développement, le nettoyage et l’enrichissement des grandes bases de données qui sont mises à disposition de la communauté.
Les débouchés en entreprise, de préférence après une thèse, peuvent être en Recherche et Développement dans les industries pharmaceutique et agroalimentaire, l’agrochimie, l’ingénierie pour la santé, l’environnement, ou les biotechnologies.
Il existe aussi des débouchés en gestion et valorisation de la R&D et en conseil ou management de l’innovation technologique.
Diplômes concernés
Niveau requis
Les règles imposées veillent à maintenir un certain équilibre entre biologie et informatique, avec quelques compléments possibles en statistique, afin d’acquérir la compétence multiple qui fait la spécificité du bioinformaticien, et qui lui permettra de s’insérer facilement dans des équipes pluridisciplinaires. Ces règles visent aussi à éviter la dispersion, tout en permettant à chacun de consolider ses points faibles et d’approfondir le domaine pressenti pour un début de carrière.Pré-requis
• au moins un cours de Biologie, de préférence, BIO452 - « Biologie moléculaire et information génétique » • au moins deux cours d’Informatique (hors modal), de préférence, INF421 – « Conception et analyse d’algorithmes » et INF442 – « Traitement des données massives » • au moins un projet de programmation (soit intégré dans un cours d’informatique, soit comme le modal d’Informatique Il est également conseillé d’avoir suivi MAP433 « Statistiques » ou à défaut, MAP432 « Modélisation des phénomènes aléatoires ».Composition du parcours
-
BIO561 INF591 BIO591 BIO/INF588 MAP566 MAP569 BIO566 INF581 INF580 BIO562 BIO571B BIO512 BIO511 BIO571A INF554 BIO551 BIO553 BIO556 INF550 INF555 INF556 INF573 INF552 BIO555 INF511