Descriptif
En une cinquantaine d'années, l'informatique est devenue une composante essentielle dans beaucoup de secteurs de la recherche et de l'ingénierie en biologie.
De nouveaux domaines se sont imposés qui, sans informatique, n'existeraient pas, du simple fait de la masse de données à traiter : par exemple, le séquençage des génomes et donc la génomique comparée, la classification des protéines et des ARN, la prédiction et l'ingénierie des structures qui ouvrent des voies nouvelles en biologie, pharmacologie et médecine, avec les enjeux nouveaux de la médecine génomique. Réciproquement, les questions soulevées par la biologie et les singularités des données biologiques induisent de nouveaux problèmes en algorithmique, combinatoire et apprentissage.
Si le séquençage à haute vitesse atteint maintenant des débits spectaculaires, certaines analyses restent encore longues, délicates et coûteuses. Les données « -omiques » et cliniques peuvent aussi être rares pour certaines pathologies et l'exception est souvent la règle. Le recours systématique à l'apprentissage massif touche ainsi ses limites. Enfin, le biologiste et le médecin attendent des explications qui permettent d'augmenter la compréhension des phénomènes sous-jacents et pas simplement une optimisation statistique.
La modélisation, l'algorithmique et la science des données prennent donc une importance croissante. On s'attache à la construction de modèles informatiques et mathématiques pour prédire mais aussi expliquer les phénomènes biologiques qui se produisent au niveau de la cellule et de ses composants, et aussi pour des groupes de cellules, voire des organismes complexes. Il s'agit souvent de concevoir des outils dédiés à des phénomènes très particuliers.
Mais les techniques de l'information seules ne sauraient résoudre les problèmes et de larges connaissances en biologie restent indispensables en amont et en aval pour une contribution certaine aux sciences du vivant. La Bioinformatique, à l'interface entre Biologie et Informatique, est ainsi une discipline très diversifiée et qui évolue rapidement, tant les questions posées
se renouvellent vite au fur et à mesure des découvertes en biologie et du progrès des outils d'observation du monde vivant.
Les Neurosciences constituent un domaine encore plus vaste. Les compétences acquises dans le Programme d'Approfondissement Bioinformatique constituent aussi une bonne introduction pour aborder les Neurosciences avant une spécialisation dans ce domaine en quatrième année. Si l'on envisage une telle voie, un complément par le cours HSS_51C24_EP – « Sciences cognitives, sciences naturelles de l'esprit » est alors indiqué.
La plupart des cours de Biologie concernent assez directement l'étude du système nerveux, plusieurs cours d'Informatique s'appliquent naturellement à l'analyse des données en Neurosciences, et d'autres aux algorithmes de simulation des mécanismes neuronaux.
Objectifs
Le programme d'approfondissement en Bioinformatique est une introduction aux concepts et enjeux de cette discipline, à travers quelques cours généraux en biologie et en informatique et quelques autres modules qui peuvent constituer un début de spécialisation. Il s'agit de se donner la compétence double qui permettra d'interagir au plus haut niveau avec des informaticiens, des biologistes et des médecins, au sein des équipes pluridisciplaires qui structurent maintenant la recherche et le développement dans ce domaine. Un choix de cours relativement vaste, théoriques ou appliqués, donne la possibilité de se construire un parcours individualisé, pour compléter sa formation au cas par cas et préparer un projet de carrière adapté, en fonction de ses centres d'intérêts.
Cette spécialisation se poursuivra en quatrième année, avant une orientation aussi bien vers le monde académique que vers le monde de l'entreprise. Dans ce dernier cas aussi, s'agissant le plus souvent de sociétés internationales, la thèse est toujours une étape conseillée pour une carrière de haut niveau.
Diplômes concernés
Pré-requis
au moins un cours de Biologie, de préférence, BIO452, au moins deux cours d’Informatique (hors modal), de préférence INF421 et INF442, au moins un projet de programmation (intégré cours ou modal d’Informatique), MAP433 est également conseilléComposition du parcours
- PA-BIOINFO P1 Bioinformatiques
- BIO_51051_EP Immunologie et maladies infectieuses
- BIO_51053_EP Biotechnologies pour la médecine et l'agriculture
- BIO_51056_EP Génomes : diversité, environnement et santé humaine
- BIO_51057_EP Neurosciences
- CSC_51050_EP Algorithmique avancée
- CSC_51052_EP Visualisation des Données
- CSC_51055_EP IA formelle en programmation logique avec contraintes
- CSC_51056_EP Analyse topologique de données
- BIO_51171_EP Travaux expérimentaux en génie génétique
- CSC_51054_EP Apprentissage profond
- CSC_51073_EP Analyse d'Image et Vision par Ordinateur
- CSC_50P11_EP Projet de Bioinformatique
- BIO_50P11_EP Projet de biologie
- BIO_50P72_EP Biomédecine de précision du cancer
- PA-BIOINFO P2 Bioinformatiques
- CSC_52089_EP Computational analysis of high-throughput sequencing data
- BIO_52001_EP Biologie des systèmes moléculaires et Biologie synthétique
- BIO_52002_EP Epigénétique et ARN non-codants
- CSC_52080_EP Optimisation mathématique à large échelle
- CSC_52081_EP Apprentissage Automatique Avancé et Agents Autonomes
- APM_52066_EP Statistique en Action
- BIO_52101_EP Sciences des données de l'imagerie biologique
- MDC_52P88_EP Projet en bioinformatique
- BIO_50P11_EP Projet de biologie
- BIO_50P72_EP Biomédecine de précision du cancer
- CSC_50P11_EP Projet de Bioinformatique
- PA-BIOINFO P3 Bioinformatiques
- BIO_52991_EP Stage Biologie et écologie
- CSC_52991_EP Stage de recherche en science informatique
- CSC_52992_EP Stage en Data Science et Intelligence Artificielle