Cliquez sur Cours pour accéder directement au descriptif des enseignements

  • Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 18h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

  • Histoire de la traduction automatique et paradigmes : À base de règles, statistique et neuronale.
  • Évaluation : mesures manuelles et automatiques, intrinsèques et extrinsèques
  • Corpus alignés et corpus comparables.
    • Alignement de phrases et de segments
    • Extraction d'un corpus aligné à partir de sites web bi- ou multilingues
  • Extraction de ressources linguistiques lexicales ou grammaticales à partir de corpus comparables et alignés.
    • Extraction de lexiques bilingues
    • Extraction de paraphrases
  • Traduction statistique (SMT)
    • Systèmes à base de segments (PBMT)
    • Systèmes factorisés
    • Pratique avec l'outil Moses
  • Deep learning et réseaux de neurones pour la traduction automatique
    • Introduction au TAL neuronal
    • Introduction a la traduction neuronale
      • Modèles encodeur-décodeur : sequence to sequence (seq2seq) avec attention
        • Exemples avec plusieurs librairies : Keras, TensorFlow, OpenNMT
        • Le modèle Transformer

 

Compétences à acquérir

  • Maîtriser les outils d’alignement de corpus
  • Maîtriser les outils d’extraction de ressources linguistiques à partir de corpus alignés
  • Maîtriser les outils d’exploration de corpus parallèles et comparables
  • Développer un modèle de traduction automatique neuronale

Parcours : Technologies des langues - Traitement automatique des langues, informatique et traduction