UE APM_53673_EP | Catalogue 2024-2025

Descriptif

La majorité des problèmes d'apprentissage sont formulés comme des problèmes d'optimisation,
à partir de l'observation d'un échantillon de données (ensemble d'entraînement). L'optimisation
d'un objectif défini à partir de cet échantillon permet de proposer un estimateur qui a une bonne
performance sur l'ensemble d'apprentissage. Cependant, on s'intéresse généralement à la
capacité de généralisation de cet estimateur, c'est à dire sa performance sur une nouvelle
observation. Avec l'émergence des grandes quantités de données depuis les années 2000, le
lien entre l'algorithme utilisé et la capacité de généralisation de l'estimateur associé est devenu
un sujet majeur.
Aujourd'hui, la question de la généralisation est encore une problématique de recherche
majeure, tant pour ses aspects théoriques que pratiques.
Dans ce cours, on s'intéresse à l'ensemble des résultats tant théoriques que heuristiques qui
permettent d'aborder ce problème. Plus précisément, on étudiera dans un premier temps les
différentes approches qui permettent d'obtenir des garanties théoriques quant à la
généralisation des algorithmes, en particulier les approches liées à la complexité, à la stabilité
et aux méthodes d'arrêt anticipé (Early stopping, approximation stochastique). Dans une
seconde partie, on étudiera les approches heuristiques et les différences (expliquées ou
constatées) dans le cadre du deep learning (non convexe et over-parametrized).
Prérequis : connaissances élémentaires en optimisation convexe et statistiques. Avoir suivi le
cours d'optimisation pour les data-sciences permettra de mieux cerner les différents algorithmes
en jeu.
Liste de références (non exhaustive) : - Rademacher and Gaussian Complexities: Risk
Bounds and Structural Results, P. Bartlett, S. Mendelson - The Tradeoffs of Large Scale
Learning, L. Bottou, O. Bousquet - Stability and Generalization, O. Bousquet, A. Elisseef - Train
faster, generalize better: Stability of stochastic gradient descent, M. Hardt, B. Recht, Y. Singer -
Non-strongly-convex smooth stochastic approximation with convergence rate O(1/n), F. Bach,
E. Moulines - Understanding deep learning requires rethinking generalization, C. Zhang, S.
Bengio, M. Hardt, B. Recht, O. Vinyals - On early stopping in gradient descent learning, Y Yao,
L. Rosasco, and A. Caponnetto - Generalization properties of multiple passes stochastic
gradient method, S. Villa - Competing with the empirical risk minimizer in a single pass, R.
Frostig, R. Ge, S. M. Kakade, A. Sidford - Deep Learning and Generalization, O. Bousquet

Objectifs pédagogiques

Comprendre les fondements théoriques de la généralisation : en particulier, expliquer les concepts théoriques clés liés à la généralisation en apprentissage automatique, notamment la complexité, la stabilité, et les méthodes telles que l’arrêt anticipé (early stopping) et l’approximation stochastique.

Maîtriser les techniques d’optimisation classiques : l'objectif est d'acquérir une compréhension approfondie des méthodes d'optimisation classiques, telles que l’optimisation convexe, la descente de gradient et leurs propriétés de convergence, ainsi que la manière dont ces techniques contribuent au développement des modèles d'apprentissage automatique.

20 heures en présentiel

effectifs minimal / maximal:

/40

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Numérique sur 20

Littérale/grade réduit

Pour les étudiants du diplôme M2 MdA - Mathématiques de l'Aléatoire

Le rattrapage est autorisé (Note de rattrapage conservée)

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 5 ECTS

Pour les étudiants du diplôme M2 OPT - Optimisation

Le rattrapage est autorisé (Note de rattrapage conservée)

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 6 ECTS

Pour les étudiants du diplôme M2 DS - Data Science

Vos modalités d'acquisition :

La note sera composée d'une partie sur les quizz, de la note au mid-term, et d'un examen final. Le mid-term et l'examen finaux seront des examens écrits, sans documents autorisés.

Le rattrapage est autorisé (Note de rattrapage conservée)

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 6 ECTS

Programme détaillé

Voir syllabus moodle

Mots clés

Optimization, généralisation, learning

Programme d'approfondissement - APM_53673_EP : Propriétés de généralisation des algorithmes en ML

Domaine > Mathématiques appliquées.

Descriptif

Objectifs pédagogiques

effectifs minimal / maximal:

Diplôme(s) concerné(s)

Parcours de rattachement

Format des notes

Pour les étudiants du diplôme M2 MdA - Mathématiques de l'Aléatoire

Pour les étudiants du diplôme M2 OPT - Optimisation

Pour les étudiants du diplôme M2 DS - Data Science

Vos modalités d'acquisition :

Programme détaillé

Mots clés

Plan du site