2.12.13 (672)

Cours scientifiques - APM_3F004_EP : Asymptotic Statistics

Domaine > Mathématiques appliquées.

Descriptif

Le cours MAA304 débute par une présentation détaillée des notions de convergence, à la fois en probabilité et en loi, ainsi que par un rappel de deux théorèmes fondamentaux en statistique : la loi des grands nombres et le théorème central limite. Nous examinerons ensuite en détail la statistique asymptotique, en abordant des thèmes essentiels tels que les propriétés asymptotiques des estimateurs du maximum de vraisemblance (EMV), la construction d’intervalles de confiance asymptotiques, ainsi que les principes fondamentaux de la théorie des tests asymptotiques.

Nous mettrons ensuite en lumière le rôle crucial de la théorie de l’information en statistique, en insistant notamment sur les notions d’efficacité, la théorie de Cramér-Rao et la suffisance. En abordant la régression linéaire multivariée, l’accent sera mis sur l’inférence dans les modèles gaussiens ainsi que sur la validation des modèles, afin de fournir aux étudiants une compréhension approfondie de ce paradigme statistique majeur.

Nous nous tournerons ensuite vers la régression non linéaire et proposerons une étude approfondie de la régression logistique. Le cours s’achève enfin par une brève introduction à la statistique non paramétrique, en soulignant l’importance des tests sans hypothèse de distribution.

Objectifs pédagogiques

L’objectif pédagogique de ce cours est de doter les étudiants d’une compréhension approfondie des fondements théoriques et des méthodes avancées de la statistique inférentielle. Il vise à développer leur capacité à analyser rigoureusement les propriétés asymptotiques des estimateurs et des tests, à maîtriser les outils essentiels de l’inférence statistique dans des cadres paramétriques et non paramétriques, ainsi qu’à appliquer ces concepts à des modèles classiques tels que la régression linéaire et logistique.

Plus spécifiquement, le cours a pour ambition de permettre aux étudiants de :

  • comprendre et interpréter les différents modes de convergence en statistique ;
  • maîtriser les résultats fondamentaux tels que la loi des grands nombres et le théorème central limite ;
  • analyser les propriétés des estimateurs, en particulier ceux du maximum de vraisemblance ;
  • construire et évaluer des intervalles de confiance et des tests asymptotiques ;
  • appréhender le rôle de la théorie de l’information (efficacité, borne de Cramér-Rao, suffisance) ;
  • conduire des analyses de régression linéaire et non linéaire, incluant la régression logistique ;
  • s’initier aux méthodes de la statistique non paramétrique.

L’ensemble vise à renforcer à la fois la rigueur théorique et l’autonomie dans la mise en œuvre des outils statistiques.

Pour les étudiants du diplôme Bachelor of Science de l'Ecole polytechnique

Vous devez avoir validé l'équation suivante : UE FMA_2F002_EP Et UE APM_2F010_EP

Prérequis du cours : Une solide base en théorie des probabilités et en statistique mathématique est requise. Les étudiants doivent maîtriser les variables aléatoires et leurs lois, les notions d’espérance et de variance, les théorèmes limites de base (notamment les concepts de convergence), ainsi que les éléments fondamentaux de l’inférence statistique. Des connaissances en algèbre linéaire (vecteurs et matrices) et en analyse multivariée sont également nécessaires, en particulier pour comprendre les modèles de régression et les méthodes d’optimisation utilisées en théorie de l’estimation.

Pour les étudiants du diplôme Programmes d'échange internationaux

Prérequis du cours : Une solide base en théorie des probabilités et en statistique mathématique est requise. Les étudiants doivent maîtriser les variables aléatoires et leurs lois, les notions d’espérance et de variance, les théorèmes limites de base (notamment les concepts de convergence), ainsi que les éléments fondamentaux de l’inférence statistique. Des connaissances en algèbre linéaire (vecteurs et matrices) et en analyse multivariée sont également nécessaires, en particulier pour comprendre les modèles de régression et les méthodes d’optimisation utilisées en théorie de l’estimation.

Format des notes

Numérique sur 20

Littérale/grade américain

Pour les étudiants du diplôme Bachelor of Science de l'Ecole polytechnique

Vos modalités d'acquisition :

Examen intermédiaire – 2 heures, sans documents, examen écrit

Examen final – 3 heures, sans documents, examen écrit

Devoirs : 2 ou 3 devoirs à la maison

Le rattrapage est autorisé (Note de rattrapage conservée écrêtée à une note seuil de 10)
  • le rattrapage est obligatoire si :
    Note initiale < 10
  • le rattrapage peut être demandé par l'étudiant si :
    Note initiale < 10
L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Pour les étudiants du diplôme Programmes d'échange internationaux

Vos modalités d'acquisition :

Examen intermédiaire – 2 heures, sans documents, examen écrit

Examen final – 3 heures, sans documents, examen écrit

Devoirs : 2 ou 3 devoirs à la maison

Le rattrapage est autorisé (Note de rattrapage conservée écrêtée à une note seuil de 10)
  • le rattrapage est obligatoire si :
    Note initiale < 10
  • le rattrapage peut être demandé par l'étudiant si :
    Note initiale < 10
L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 5 ECTS

La note obtenue rentre dans le calcul de votre GPA.

Programme détaillé

 

  • Introduction à la statistique asymptotique : Définir et expliquer les concepts clés, l’historique et l’importance de la statistique asymptotique.
  • Notions de convergence : Présenter la convergence en probabilité, la convergence presque sûre, la convergence en loi et la convergence en moyenne quadratique.
  • Rappels de théorie des probabilités : Explorer les fondements probabilistes nécessaires à la compréhension de la statistique asymptotique.
  • Loi des grands nombres : Présenter la loi des grands nombres, sa démonstration et ses applications en statistique.
  • Théorème central limite : Expliquer le théorème central limite, sa démonstration et ses implications pour l’analyse statistique.
  • Propriétés asymptotiques des estimateurs du maximum de vraisemblance (EMV) : Présenter la normalité asymptotique et l’efficacité, avec des exemples illustratifs.
  • Intervalles de confiance asymptotiques : Dériver des intervalles de confiance asymptotiques et les comparer aux intervalles classiques.
  • Théorie asymptotique des tests : Présenter les bases de la théorie asymptotique des tests, notamment les tests du rapport de vraisemblance, de Wald et du score.
  • Théorie de Cramér-Rao : Étudier la borne de Cramér-Rao et l’efficacité des estimateurs.
  • Synthèse et applications : Récapituler les concepts clés et discuter des applications pratiques de la statistique asymptotique dans divers domaines.
  • Introduction à la régression linéaire : Présenter les bases de la régression linéaire, ses hypothèses, l’interprétation des coefficients et ses applications concrètes.
  • Régression linéaire simple : Étudier la régression linéaire simple avec une seule variable explicative, incluant l’ajustement du modèle, l’interprétation et la vérification des hypothèses.
  • Régression linéaire multiple : Explorer la régression linéaire multiple, y compris le traitement des variables qualitatives et des effets d’interaction.
  • Sélection et validation des modèles : Examiner les stratégies de sélection de modèles (sélection progressive, élimination rétrograde, validation croisée), ainsi que les diagnostics et les problèmes tels que la multicolinéarité et l’hétéroscédasticité.
  • Thèmes avancés et applications : Étudier l’utilisation de la régression linéaire dans des contextes plus complexes, tels que la régression polynomiale et logistique, les techniques de régularisation (Ridge, Lasso) et leurs applications en apprentissage automatique.
  • Compréhension de la régression logistique : Introduire la régression logistique, son rôle dans l’analyse de variables dépendantes catégorielles (notamment binaires) et ses applications dans divers domaines.
  • Modélisation en régression logistique : Présenter les bases de la modélisation logistique, incluant les rapports de cotes (odds ratios), la fonction logit et l’interprétation des résultats.
  • Introduction aux tests non paramétriques sans hypothèse de distribution : Introduire les tests non paramétriques, en insistant sur leur utilisation lorsque les données ne suivent pas une distribution spécifique ou lorsque les hypothèses des tests paramétriques sont violées.
  • Tests usuels sans hypothèse de distribution : Présenter des tests non paramétriques courants, tels que les tests de Mann-Whitney, de Kruskal-Wallis et de Kolmogorov-Smirnov, en expliquant leur objectif, leur application et leur interprétation.

 

 

Mots clés

Statistique asymptotique Inférence statistique Convergence Régression (linéaire et logistique) Statistique non paramétrique

Méthodes pédagogiques

Cours Magistraux et Travaux Dirigés (1/1 par semaine)
Veuillez patienter