v1.16.1

Cours courts - INF472B : Modal d’Informatique - Algorithmes pour le séquences Biologiques

Domaine > Informatique.

Descriptif

Les expérimentations en biologie, en particulier les techniques modernes de séquençage, produisent un volume énorme d'informations. Ces informations sont de natures très diverses, par exemple, éléments de séquences, structures 3D, contacts entre molécules de type ARN ou protéines, chaînes de réactions métaboliques. Seul l'usage de l'informatique et d'une algorithmique adaptée permettent de mener correctement le traitement à grande échelle de ces données. Ces traitements permettent ensuite de construire les modèles descriptifs ou explicatifs des phénomènes biologiques.

Le but de ce modal est de s'initier à ces problèmes informatiques actuels posés par la biologie. On s’intéressera plus particulièrement au traitement algorithmique des séquences. Ce sera l'occasion d'utiliser et développer ses connaissances en informatique dans un domaine d'application original. On appréhendera ainsi des problématiques qui seront développées dans le parcours de 3A en Bioinformatique, si l'on souhaite poursuivre dans cette voie.

On partira d'algorithmes simples et intuitifs que l'on apprendra à affiner pour passer à l'échelle sur des exemples réels. On pourra notamment revoir et appliquer très concrètement un certain nombre des algorithmes vus en INF421.

Puis on travaillera plus en détail sur un projet de programmation qui visera, par exemple, à :

  • reconstruire une séquence d'ADN à partir des fragments issus du séquençage,
  • effectuer la recherche de motifs ou de gènes pathologiques,
  • observer des anomalies de fréquence de certains motifs,
  • établir les similitudes dans un ensemble de séquences provenant d'espèces plus ou moins voisines,
  • proposer une structure pour des ARN ou pour des protéines,
  • évaluer des interactions.

La programmation se fera en Python sur ordinateur portable personnel.
Attention, ce modal n'a lieu qu'en période 2.

Niveau requis : INF321, INF411 ou un équivalent suffisent pour aborder ce cours.
Des connaissances supplémentaires en biologie (BIO452), en algorithmique (INF421) ou en statistiques (MAP433) seront facilement valorisées dans le choix et la réalisation du projet.

Langue : français.

Modalités d'évaluation : La note sera basée sur la réalisation et la présentation d'un projet dont le sujet est à définir durant les premières semaines du modal.

nombre de blocs

10

effectif maximal

24

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Numérique sur 20

Pour les étudiants du diplôme Diplôme d'ingénieur de l'Ecole polytechnique

Veuillez patienter