v2.3.2 (2676)

PA - C8 - DS-UPSUD-2 : Graphical models for large scale content access

Descriptif

L’objectif de ce cours est de fournir une introduction aux modèles probabilistes utilisés dans
des applications de traitement automatique d’informations non structurées (textes,
enregistrements audio), ainsi qu’aux principales méthodes d’estimation et d’inférence pour
ces modèles.

Diplôme(s) concerné(s)

Format des notes

Numérique sur 20

Pour les étudiants du diplôme Data Sciences

Le rattrapage est autorisé (Max entre les deux notes)
    L'UE est acquise si Note finale >= 10
    • Crédits ECTS acquis : 2.5 ECTS

    Programme détaillé

    1. Introduction
    Classification de documents
    Modèles graphiques orientés
    2. Les modèles de thèmes
    Mélange de lois multinomiales
    Algorithme EM
    Modèle PLSA
    Modèle LDA
    3. Les modèles structurés
    Dépendances linguistiques, structures dans les modèles graphiques
    Retour sur les HMM
    Modèles d’alignements IBM1, IBM2
    4. Les modèles conditionnels
    Régression logistique et maximum d’entropie
    Champs Aléatoires Conditionnels : CRF
    5. Inférence exacte
    Elimination des variables
    Passage de messages
    Algorithme de l’arbre de jonction
    6. Inférence approchée: méthodes variationnelles
    Propagation de croyances dans des graphes cycliques
    Principes de l’inférence variationnelle
    Application à LDA
    7. Inférence approchée: échantillonnage
    Principe des méthodes d’échantillonnage
    Application au mélange de lois multinomiales
    Application à LDA

    Veuillez patienter