• Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 12h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

LT41GM23 – Outils d’annotation automatique
Mme TODIRASCU
Annotation automatique vs annotation manuelle. Accord inter-annotateurs. Annotations morphosyntaxiques, syntaxiques, sémantiques : définition, enjeux, problèmes. Outils d’annotation morphosyntaxique : étiquetage (TreeTagger, Unitex), lemmatisation (Flemm). Outils d’annotation syntaxique (analyse en dépendances par Bohnet, Talismane, ou Mind the Gap). Projets d’annotation : Multext, Universal POS, Universal Dependencies.
 

Compétences à acquérir

  • Maîtrise des outils d'étiquetage et d'annotation syntaxique automatique;
  • savoir créer des corpus annotés fiables (accord inter-annotateurs);
  • connaître des projets d'annotations récents (Universal Dependency, Multext).

Contact

Responsable

Amalia Todirascu


Parcours : Technologies des langues - Traitement automatique des langues, informatique et traduction