Descriptif
Le Web regorge de sources de données que l'on souhaite manipuler à grande echelle. L'approche actuelle est de représenter ces données sous la forme d'un graphe de données ou de connaissance; par exemple les données ouvertes et connectées (open data), les réseaux sociaux, des encyclopedies en lignes. Cette approche est même présente dans les grandes industries du Web, Alphabet (dans Google) et Meta (Facebook).
L'avantage des graphes de connaissances est de pouvoir les interroger à l'aide de langages logiques mais aussi de pouvoir apprendre des propriétés structurelles sur ceux-ci.
Si les graphes de connaissances sont des outils très importants pour la gestion de données sur le Web, toutes les données sur le Web ne sont pas éditées dans un tel model. Il est alors nécessaire de fouiller et d'apprendre dans les textes et autres contenus moins structurés pour construire de nouveaux graphes.
Ce cours introduit les différentes grandes étapes qu'un ingénieur en data science a besoin d'opérer pour extraire des connaisssances de grand volumes de données.
Il vous familiarisera avec des outils concrets pour:
Classification des noeuds et des sous-graphes à l'aide des graph embeddings.
effectifs minimal / maximal:
/24Diplôme(s) concerné(s)
Parcours de rattachement
Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique
Python
Format des notes
Numérique sur 20Littérale/grade réduitPour les étudiants du diplôme Programmes d'échange internationaux
Vos modalités d'acquisition :
Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 4 dernières séances du cours. A noter que lors des 6 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 24h pendant les 4 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 24h supplémentaires.
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 6 ECTS
Pour les étudiants du diplôme Titre d’Ingénieur diplômé de l’École polytechnique
Vos modalités d'acquisition :
Les étudiants devront réaliser un projet en binôme. Ils travailleront sur le projet au cours des 4 dernières séances du cours. A noter que lors des 6 premières séances ils disposeront d'exercices pratiques qui constitueront les éléments de base de leur projet. Le temps nécessaire est d'au moins 24h pendant les 4 séances (6h/séance), en plus du temps supplémentaire hors cours, que nous estimons à 24h supplémentaires.
L'UE est acquise si Note finale >= 10- Crédits ECTS acquis : 6 ECTS
Le coefficient de l'UE est : 13
La note obtenue rentre dans le calcul de votre GPA.
La note obtenue est classante.
Pour les étudiants du diplôme Non Diplomant
L'UE est acquise si note finale transposée >= C- Crédits ECTS acquis : 6 ECTS