Teaching - TAL

Page principale de l'UE


Traitement Automatique de la Langue

Les nouveaux supports sont en haut de page, les vieilles versions en dessous (je les laisse pour palier le fait que les versions 2022 seront probablement mise à disposition en retard)

Séance 1: Intro et sacs de mots

Organisation du cours : lien

Différentes tâches en TAL, à différents niveaux : lien

Sacs de mots : lien

TP: lien

Séance 2: Apprentissage non supervisé, du clustering à la sémantique des mots

PLSA / Word2Vec : lien

Sacs de mots avancés/transfert + opinion mining : lien

TP clustering: lien notebook

TP word2vec: lien notebook

Séance 3: Traitement des séquences et deep-learning

Apprentissage sur des séquences : lien

Introduction au deep learning : lien

TP sur la classification de sequences: lien

Après ces approches de base, nous continuerons le cours deep learning + le notebook sur les réseaux récurrents.

Séance 4: TP seulement

Bouclage & question sur le deep learning

Avance sur le projet



Oldies (utiles pour regarder les anciens supports)

Programme de l'examen

L'examen portera essentiellement sur les séances d'apprentissage statistique. Les questions porteront sur:

  • Formulation mathématique d'un problème d'apprentissage en TAL
  • Méthodologie pour l'apprentissage et l'évaluation des modèles
  • Traitements possibles sur les corpus de textes
  • Vocabulaire statistique + TAL

Intro sur le TAL et l'apprentissage statistique - Méthodes séquentielles HMM, CRF

  • Idées générales
  • Organisation de l'UE
  • Méthodes séquentielles : HMM, CRF

Cours: lien

TME: lien

Classification de documents

Cours 1: chaine de traitements lien

Cours 2: classification de sentiments lien prezi

TME sur donnée réelles : lien

Sémantique et catégorisation thématique

Cours : lien

Introduction : pré-processing manuel: lien

TME : outils de ségmentation thématique lien

Intermède sur feuille : lien

Représentation vectorielle des mots et documents

Cours 8 : suite du cours sur l'analyse de sentiments Cours W2V: lien

Cours : NLP et deep learning: lien

Discussion autour de l'algorithme word2vec.

TME 8: notebook

Annale(s)

2015 : lien