UE MAP670C | Catalogue 2021-2022

Descriptif

Syllabus: This 20-hour course provides an introduction to reinforcement learning. It is based on the new edition of the book "Reinforcement Learning: An Introduction" by R. Sutton and A. Barto. Barto (available online at http://incompleteideas.net/book/the-book-2nd.html).

Outline:

Introduction to reinforcement learning and Markov decision processes
The bandit case
Tabular methods: prediction by dynamic programming, Monte Carlo method and TD Learning
Planning and learning for tabular methods
approximate methods: prediction, planning and learning

Grading: Project based on a research article

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Numérique sur 20

Littérale/grade réduit

Pour les étudiants du diplôme M2 MSV - Mathématiques pour les Sciences du Vivant

Le rattrapage est autorisé (Max entre les deux notes)

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 6 ECTS

Pour les étudiants du diplôme Echanges PEI

Pour les étudiants du diplôme Master 2 Mathématiques et Applications - Mathématiques pour les Sciences du Vivant

Le rattrapage est autorisé (Max entre les deux notes)

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 6 ECTS

Pour les étudiants du diplôme Data Sciences

Le rattrapage est autorisé (Max entre les deux notes)

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 3 ECTS

PA - C5 - MAP670C : Reinforcement Learning

Domaine > Mathématiques appliquées.

Descriptif

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Pour les étudiants du diplôme M2 MSV - Mathématiques pour les Sciences du Vivant

Pour les étudiants du diplôme Echanges PEI

Pour les étudiants du diplôme Master 2 Mathématiques et Applications - Mathématiques pour les Sciences du Vivant

Pour les étudiants du diplôme Data Sciences

Plan du site