Descriptif
L'analyse de données moderne s'appuie sur des langages de haut niveau comme Python ou R pour la manipulation et le traitement des données. Toutefois, derrière les bibliothèques standard comme Scikit-Learn se cachent des implémentations dans des langages de bas niveau comme C ou C++ pour une exécution optimisée et une gestion efficace des ressources mémoire ou de calcul. D'où l'intérêt de ce cours, dont l'objectif est double : d'une part, se familiariser avec certaines des techniques standard d'analyse de donnéés et d'apprentissage machine ; d'autre part, acquérir une compétence en programmation C/C++ qui permette à terme aux élèves d'adapter les implémentations bas niveau existantes à leurs besoins spécifiques. A noter que les paradigmes de programmation abordés lors du cours sont quasi-exclusivement séquentiels, la programmation concurrente étant tout juste effleurée lors de la dernière séance et réservée pour d'autres cours.
Détail des séances (analyse de données / C++):
1. Introduction brève à l'analyse de données / C++ comme du C (1/2)
2. Recherche de plus proches voisins et extraction dans les bases de données / C++ comme du C (2/2)
3. k-means / structs et classes (1/2)
4. Clustering hiérarchique / structs et classes (2/2)
5. Estimation de densité / héritage
6. Classification et régression k-NN / généricité
7. Modèles linéaires pour la régression / STL
8. Modèles linéaires pour la classification / -
9. Extraction de features / C++11
10. Réseaux de neurones / multithreading
Références:
En analyse de données :
- Hastie, Tibshirani, Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Springer, 2017.
- Bishop: Pattern Recognition and Machine Learning. Springer, 2006.
En C++ :
- Weiss: C++ for Java Programmers. Prentice Hall, 2003.
- Stroustrup. The C++ Programming Language (4th ed.). Addison-Wesley, 2013.
Prérequis : INF321 ou INF411
effectifs minimal / maximal:
/192Diplôme(s) concerné(s)
Parcours de rattachement
Format des notes
Numérique sur 20Littérale/grade réduitPour les étudiants du diplôme Diplôme d'ingénieur de l'Ecole polytechnique
Le rattrapage est autorisé (Max entre les deux notes écrêté à une note seuil)- Crédits ECTS acquis : 5 ECTS
Le coefficient de l'UE est : 10
La note obtenue rentre dans le calcul de votre GPA.
La note obtenue est classante.