UE APM_53670_EP | Catalogue 2025-2026

Descriptif

Contenu:

e cours est une introduction à l'apprentissage par renforcement orientée vers les mathématiques. L'objectif est de présenter les fondements de l'apprentissage par renforcement afin que les étudiants soient capables de lire et d'appliquer des articles de recherche. L'accent sera mis sur les mathématiques sous-jacentes afin de faciliter la compréhension de l'heuristique des algorithmes.

21 heures en présentiel

Diplôme(s) concerné(s)

Parcours de rattachement

AUDITEURS - IP Paris - Non diplomant - ENSTA

Format des notes

Numérique sur 20

Littérale/grade américain

Pour les étudiants du diplôme AUDITEURS - IP Paris

Le rattrapage est autorisé (Max entre les deux notes)

le rattrapage est obligatoire si :
Note initiale < 10
le rattrapage peut être demandé par l'étudiant si :
Note initiale < 10

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 3 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme M2 DS - Data Science

Vos modalités d'acquisition :

Projet basé sur un article de recherche (étude théorique et/ou implémentation)

Le rattrapage est autorisé (Note de rattrapage conservée)

le rattrapage est obligatoire si :
Note initiale < 7
le rattrapage peut être demandé par l'étudiant si :
Note initiale < 7

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 3 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme M2 MSV - Mathématiques pour les Sciences du Vivant

Vos modalités d'acquisition :

Projet basé sur un article de recherche (étude théorique et/ou implémentation)

Le rattrapage est autorisé (Note de rattrapage conservée)

le rattrapage est obligatoire si :
Note initiale < 7
le rattrapage peut être demandé par l'étudiant si :
Note initiale < 7

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 3 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Programme détaillé

Syllabus:

Sequential Decisions, MDP and Policies
Operations Research: Prediction and Planning
Reinforcement Learning: Prediction and Planning in the Tabular Setting
Reinforcement Learning: Advanced Techniques in the Tabular Setting
Reinforcement Learning: Approximation of the Value Functions
Reinforcement Learning: Policy Approach

Cours scientifiques - APM_53670_EP : Apprentissage par renforcement

Domaine > Mathématiques appliquées.

Descriptif

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Pour les étudiants du diplôme AUDITEURS - IP Paris

Pour les étudiants du diplôme M2 DS - Data Science

Vos modalités d'acquisition :

Pour les étudiants du diplôme M2 MSV - Mathématiques pour les Sciences du Vivant

Vos modalités d'acquisition :

Programme détaillé

Plan du site