Descriptif
De nos jours, nous avons accès à de vastes ensembles de données, dont beaucoup sont créés et publiés par les gouvernements. Par exemple, ici en France, nous avons le portail data.gouv.fr.
Nous étudierons différentes manières de représenter ces jeux de données, et notamment le pouvoir expressif des graphes. Ces ensembles de données offrent un excellent aperçu de nos sociétés et peuvent aider à repérer les tendances sociales ou les problèmes sociaux.
Au cours des années précédentes, les étudiants ont étudié les tendances de vote des lois au Parlement européen, les tendances dans la collaboration entre les pays, la manière dont le changement climatique est discuté sur les réseaux sociaux, et bien d'autres sujets intéressants !
Au cours de ce modale, vous vous familiariserez avec les notions et les outils d'exploration des données. Nous discuterons d’articles de recherche qui utilisent des méthodes informatiques pour découvrir des problèmes sociaux.
Ce cours présente également les différentes étapes importantes qu'un ingénieur en science des données doit connaître pour extraire des connaissances à partir de grands volumes de données.
Les cinq premières séances sont consacrées à la présentation de concepts et d'outils, tandis que dans les séances suivantes, vous réaliserez des projets en binôme avec l'aide du tuteur. Vous aurez toute liberté pour choisir le sujet de votre projet.
Prérequis : Python
Langue : Le matériel est en anglais, mais le cours peut être en anglais ou en français, selon les étudiants.
effectifs minimal / maximal:
1/18Diplôme(s) concerné(s)
Pour les étudiants du diplôme Programmes d'échange internationaux
Python
Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique
Python
Format des notes
Numérique sur 20Littérale/grade réduitPour les étudiants du diplôme Programmes d'échange internationaux
Vos modalités d'acquisition :
Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 5 dernières séances du cours. A noter que lors des 5 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 30h pendant les 5 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 15h supplémentaires.
L'UE est acquise si note finale transposée >= C- Crédits ECTS acquis : 6 ECTS
Le coefficient de l'UE est : 13
Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique
Vos modalités d'acquisition :
Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 5 dernières séances du cours. A noter que lors des 5 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 30h pendant les 5 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 15h supplémentaires.
L'UE est acquise si note finale transposée >= C- Crédits ECTS acquis : 6 ECTS
Le coefficient de l'UE est : 13
La note obtenue rentre dans le calcul de votre GPA.
La note obtenue est classante.
Pour les étudiants du diplôme Non Diplomant
L'UE est acquise si note finale transposée >= C- Crédits ECTS acquis : 6 ECTS
Programme détaillé
Ce que vous apprendrez :
1. Comment représenter les données : le pouvoir expressif des différentes représentations
2. Réseaux sociaux : notions avancées sur la détection de communauté
3. Correspondance des entités entre differentes ensembles de données
4. Traitement du langage naturel pour extraire et classer des informations à partir de sources textuelles
5. Une introduction aux statistiques dans la recherche sociale