UE APM_52070_EP | Catalogue 2025-2026

Descriptif

This delves into the theoretical underpinnings of sequential decision-making in artificial intelligence (AI), focusing on the rigorous mathematical frameworks that govern online learning, multi-armed bandits, and Markov Decision Processes (MDPs). It begins with a study of online learning through the lens of regret minimization in adversarial and stochastic settings, including the analysis of follow-the-leader, follow-the-regularized-leader, and mirror descent methods. It then transitions to multi-armed bandits, where students will analyze the trade-offs between exploration and exploitation and derive guarantees for algorithms such as UCB, Thompson sampling, and exp3. The final part covers MDPs, emphasizing dynamic programming, value iteration, and policy gradient methods with special attention to the theoretical guarantees of these approaches.

Diplôme(s) concerné(s)

Parcours de rattachement

M1MATHJHADA - Semestre 1 - Electifs hors maquette

Format des notes

Numérique sur 20

Littérale/grade américain

Pour les étudiants du diplôme M1 MJH - Mathématiques Jacques Hadamard

Le rattrapage est autorisé (Note de rattrapage conservée)

le rattrapage est obligatoire si :
Note initiale < 7
le rattrapage peut être demandé par l'étudiant si :
Note initiale < 7

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Programmes d'échange internationaux

Vos modalités d'acquisition :

Examen final écrit sans calculatrice.

Le rattrapage est autorisé (Max entre les deux notes)

le rattrapage est obligatoire si :
Note initiale < 10
le rattrapage peut être demandé par l'étudiant si :
Note initiale < 10

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique

Vos modalités d'acquisition :

Examen final écrit sans calculatrice.

Le rattrapage est autorisé (Max entre les deux notes)

le rattrapage est obligatoire si :
Note initiale < 10
le rattrapage peut être demandé par l'étudiant si :
Note initiale < 10

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

La note obtenue est classante.

Programme d'approfondissement - APM_52070_EP : Mathematical Foundations of Decision Theory in AI

Domaine > Mathématiques appliquées.

Descriptif

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Pour les étudiants du diplôme M1 MJH - Mathématiques Jacques Hadamard

Pour les étudiants du diplôme Programmes d'échange internationaux

Vos modalités d'acquisition :

Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique

Vos modalités d'acquisition :

Plan du site