Descriptif
Day 1: Data wrangling
- Advanced course on Pandas
- Tidy data
- Lab on MovieLens dataset
- Challenge and getting started with RAMP
Day 2: ML Pipelines and hyperparameter search
- Column transformer and pipelines
- Bayesian optimization and hyper parameter search
- Learning curves
Day 3: Metrics and dealing with unbalanced data
- Presentation of the different ML metrics
- Problem of the metric with unbalanced data
- ML approaches to deal with imbalanced data
Day 4: Ensemble methods and feature engineering
- Gradient Boosting
- Stacking
- feature engineering
Day 5: Model inspection
- partial dependence plots
- feature importance
Challenges
Besides the students will compete during the week on a data challenge.
Diplôme(s) concerné(s)
Parcours de rattachement
Format des notes
Numérique sur 20Littérale/grade américainPour les étudiants du diplôme AUDITEURS - IP Paris
Le rattrapage est autorisé (Max entre les deux notes)- le rattrapage est obligatoire si :
- Note initiale < 10
- le rattrapage peut être demandé par l'étudiant si :
- Note initiale < 10
La note obtenue rentre dans le calcul de votre GPA.
Pour les étudiants du diplôme M2 DS - Data Science
Le rattrapage est autorisé (Note de rattrapage conservée)- le rattrapage est obligatoire si :
- Note initiale < 7
- le rattrapage peut être demandé par l'étudiant si :
- Note initiale < 7
- Crédits ECTS acquis : 3 ECTS
La note obtenue rentre dans le calcul de votre GPA.