Cliquez sur Cours pour accéder directement au descriptif des enseignements

  • Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 24h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

Cet enseignement aborde le traitement des documents numériques (définition, formats divers, encodage et manipulation), la définition et les critères de constitution d'un corpus, les bases textuelles et les corpus disponibles sur Internet. Dans ce cours seront présentés les outils d'exploration de corpus (concordanciers) disponibles en ligne (Frantext, FrWaC, SketchEngine), mais également indépendants (AntConc, TXM). Les mesures statistiques utilisées par les outils d'exploration de corpus seront abordés (information mutuelle, Loglikelihood). Une dernière partie du cours présente des outils d'exploitation des corpus étiquetés et annotés (TXM).

Compétences à acquérir

- Maîtriser les outils d’exploration de corpus
- Connaître les principes de base de la constitution de corpus

Contact

Responsable

Amalia Todirascu

Intervenants

Daniela Capin


Parcours : Technologies des langues - Traitement automatique des langues, informatique et traduction