v2.11.0 (5518)

Modal - INF473G : Modal d'informatique - Fouille, Apprentissage et Raisonnement sur les Graphes du Web

Domaine > Informatique.

Descriptif

Le Web regorge de sources de données que l'on souhaite manipuler à grande echelle. L'approche actuelle est de représenter ces données sous la forme d'un graphe de données ou de connaissance; par exemple les données ouvertes et connectées (open data), les réseaux sociaux, des encyclopedies en lignes. Cette approche est même présente dans les grandes industries du Web, Alphabet (dans Google) et Meta (Facebook).


L'avantage des graphes de connaissances est de pouvoir les interroger à l'aide de langages logiques mais aussi de pouvoir apprendre des propriétés structurelles sur ceux-ci.

Si les graphes de connaissances sont des outils très importants pour la gestion de données sur le Web, toutes les données sur le Web ne sont pas éditées dans un tel model. Il est alors nécessaire de fouiller et d'apprendre dans les textes et autres contenus moins structurés pour construire de nouveaux graphes.


Ce cours introduit les différentes grandes étapes qu'un ingénieur en data science a besoin d'opérer pour extraire des connaisssances de grand volumes de données.
Il vous familiarisera avec des outils concrets pour:

 

Sample graph

Manipuler et visualiser des graphes.
 

Classification des noeuds et des sous-graphes à l'aide des graph embeddings.

 
Raisonner dans des graphes de connaissances, utilisant les technologies du Web Sémantique.
 
Tisser des graphes de connexions entre des textes et des concepts, à l’aide de la sémantique.
 
Fouiller des données textuelles.
 
 
Les 6 premières séances seront destinées à la présentation des concepts et outils, puis vous réaliserez des projets en binôme.
 

 

60 heures en présentiel (10 blocs ou créneaux)

effectifs minimal / maximal:

/24

Diplôme(s) concerné(s)

Parcours de rattachement

Pour les étudiants du diplôme Programmes d'échange internationaux

Python

Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique

Python

Format des notes

Numérique sur 20

Littérale/grade réduit

Pour les étudiants du diplôme Programmes d'échange internationaux

Vos modalités d'acquisition :

Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 4 dernières séances du cours. A noter que lors des 6 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 24h pendant les 4 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 24h supplémentaires.

L'UE est acquise si note finale transposée >= C
  • Crédits ECTS acquis : 6 ECTS

Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique

Vos modalités d'acquisition :

Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 4 dernières séances du cours. A noter que lors des 6 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 24h pendant les 4 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 24h supplémentaires.

L'UE est acquise si note finale transposée >= C
  • Crédits ECTS acquis : 6 ECTS

Le coefficient de l'UE est : 13

La note obtenue rentre dans le calcul de votre GPA.

La note obtenue est classante.

Pour les étudiants du diplôme Non Diplomant

L'UE est acquise si note finale transposée >= C
  • Crédits ECTS acquis : 6 ECTS

Mots clés

métriques de graphes, détection de communauté, correspondance de graphes, clustering, extraction d'informations
Veuillez patienter