UE INF442 | Catalogue 2018-2019

Descriptif

L'analyse de données moderne s'appuie sur des langages de haut niveau comme Python ou R pour la manipulation et le traitement des données. Toutefois, derrière les bibliothèques standard comme Scikit-Learn se cachent des implémentations dans des langages de bas niveau comme C ou C++ pour une exécution optimisée et une gestion efficace des ressources mémoire ou de calcul. D'où l'intérêt de ce cours, dont l'objectif est double : d'une part, se familiariser avec certaines des techniques standard d'analyse de donnéés et d'apprentissage machine ; d'autre part, acquérir une compétence en programmation C/C++ qui permette à terme aux élèves d'adapter les implémentations bas niveau existantes à leurs besoins spécifiques. A noter que les paradigmes de programmation abordés lors du cours sont quasi-exclusivement séquentiels, la programmation concurrente étant tout juste effleurée lors de la dernière séance et réservée pour d'autres cours.

Détail des séances (analyse de données / C++):

1. Introduction brève à l'analyse de données / C++ comme du C (1/2)

2. Recherche de plus proches voisins et extraction dans les bases de données / C++ comme du C (2/2)

3. k-means / structs et classes (1/2)

4. Clustering hiérarchique / structs et classes (2/2)

5. Estimation de densité / héritage

6. Classification et régression k-NN / généricité

7. Modèles linéaires pour la régression / STL

8. Modèles linéaires pour la classification / -

9. Extraction de features / C++11

10. Réseaux de neurones / multithreading

Références:

En analyse de données :

Hastie, Tibshirani, Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Springer, 2017.
Bishop: Pattern Recognition and Machine Learning. Springer, 2006.

En C++ :

Weiss: C++ for Java Programmers. Prentice Hall, 2003.
Stroustrup. The C++ Programming Language (4th ed.). Addison-Wesley, 2013.

Prérequis : INF321 ou INF411

10 blocs ou créneaux

effectifs minimal / maximal:

/192

Diplôme(s) concerné(s)

Diplôme d'ingénieur de l'Ecole polytechnique

Parcours de rattachement

Diplôme d'ingénieur de l'Ecole Polytechnique - 2ème année

Format des notes

Numérique sur 20

Littérale/grade réduit

Pour les étudiants du diplôme Diplôme d'ingénieur de l'Ecole polytechnique

Le rattrapage est autorisé (Max entre les deux notes écrêté à une note seuil)

L'UE est acquise si note finale transposée >= C

Crédits ECTS acquis : 5 ECTS

Le coefficient de l'UE est : 10

La note obtenue rentre dans le calcul de votre GPA.

La note obtenue est classante.

Cours courts - INF442 : Algorithmes pour l'analyse de données en C++

Domaine > Informatique.