Descriptif
Syllabus: This 20-hour course provides an introduction to reinforcement learning. It is based on the new edition of the book "Reinforcement Learning: An Introduction" by R. Sutton and A. Barto. Barto (available online at http://incompleteideas.net/book/the-book-2nd.html).
Outline:
- Introduction to reinforcement learning and Markov decision processes
- The bandit case
- Tabular methods: prediction by dynamic programming, Monte Carlo method and TD Learning
- Planning and learning for tabular methods
- approximate methods: prediction, planning and learning
Grading: Project based on a research article
Diplôme(s) concerné(s)
- Echanges PEI
- M2 MSV - Mathématiques pour les Sciences du Vivant
- Data Sciences
- Master 2 Mathématiques et Applications - Mathématiques pour les Sciences du Vivant
Parcours de rattachement
Format des notes
Numérique sur 20Littérale/grade réduitPour les étudiants du diplôme M2 MSV - Mathématiques pour les Sciences du Vivant
Le rattrapage est autorisé (Max entre les deux notes)- Crédits ECTS acquis : 6 ECTS
Pour les étudiants du diplôme Echanges PEI
Pour les étudiants du diplôme Master 2 Mathématiques et Applications - Mathématiques pour les Sciences du Vivant
Le rattrapage est autorisé (Max entre les deux notes)- Crédits ECTS acquis : 6 ECTS
Pour les étudiants du diplôme Data Sciences
Le rattrapage est autorisé (Max entre les deux notes)- Crédits ECTS acquis : 3 ECTS