v2.11.0 (5518)

Modal - CSC_43M02_EP : Modal d'informatique - Exploration et apprentissage sur les graphes du Web

Domaine > Informatique.

Descriptif

De nos jours, nous avons accès à de vastes ensembles de données, dont beaucoup sont créés et publiés par les gouvernements. Par exemple, ici en France, nous avons le portail data.gouv.fr.

Nous étudierons différentes manières de représenter ces jeux de données, et notamment le pouvoir expressif des graphes. Ces ensembles de données offrent un excellent aperçu de nos sociétés et peuvent aider à repérer les tendances sociales ou les problèmes sociaux. 

Au cours des années précédentes, les étudiants ont étudié les tendances de vote des lois au Parlement européen, les tendances dans la collaboration entre les pays, la manière dont le changement climatique est discuté sur les réseaux sociaux, et bien d'autres sujets intéressants !

Au cours de ce modale, vous vous familiariserez avec les notions et les outils d'exploration des données. Nous discuterons d’articles de recherche qui utilisent des méthodes informatiques pour découvrir des problèmes sociaux. 

Ce cours présente également les différentes étapes importantes qu'un ingénieur en science des données doit connaître pour extraire des connaissances à partir de grands volumes de données.

Les cinq premières séances sont consacrées à la présentation de concepts et d'outils, tandis que dans les séances suivantes, vous réaliserez des projets en binôme avec l'aide du tuteur. Vous aurez toute liberté pour choisir le sujet de votre projet. 

Prérequis : Python
Langue : Le matériel est en anglais, mais le cours peut être en anglais ou en français, selon les étudiants.

60 heures en présentiel (10 blocs ou créneaux)

effectifs minimal / maximal:

1/18

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Programmes d'échange internationaux

Python

Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique

Python

Format des notes

Numérique sur 20

Littérale/grade réduit

Pour les étudiants du diplôme Programmes d'échange internationaux

Vos modalités d'acquisition :

Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 5 dernières séances du cours. A noter que lors des 5 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 30h pendant les 5 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 15h supplémentaires.

L'UE est acquise si note finale transposée >= C
  • Crédits ECTS acquis : 6 ECTS

Le coefficient de l'UE est : 13

Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique

Vos modalités d'acquisition :

Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 5 dernières séances du cours. A noter que lors des 5 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 30h pendant les 5 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 15h supplémentaires.

L'UE est acquise si note finale transposée >= C
  • Crédits ECTS acquis : 6 ECTS

Le coefficient de l'UE est : 13

La note obtenue rentre dans le calcul de votre GPA.

La note obtenue est classante.

Pour les étudiants du diplôme Non Diplomant

L'UE est acquise si note finale transposée >= C
  • Crédits ECTS acquis : 6 ECTS

Programme détaillé

Ce que vous apprendrez :
1. Comment représenter les données : le pouvoir expressif des différentes représentations
2. Réseaux sociaux : notions avancées sur la détection de communauté
3. Correspondance des entités entre differentes ensembles de données
4. Traitement du langage naturel pour extraire et classer des informations à partir de sources textuelles
5. Une introduction aux statistiques dans la recherche sociale

Mots clés

métriques de graphes, détection de communauté, correspondance de graphes, clustering, extraction d'informations

Méthodes pédagogiques

TP et cours
Veuillez patienter