Cliquez sur Cours pour accéder directement au descriptif des enseignements

  • Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 18h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

  • Historique des moteurs de recherche.
  • Mode de fonctionnement (crawling, pré-traitement et indexation des documents, traitement des requêtes utilisateur)
  • Paradigmes de recherche :
    • Recherche booléenne
    • Modèles vectoriels : pondération des termes, calculs de similarité entre requête et document
    • Modèles probabilistes (notions)
    • Evaluation en recherche d'information
  • Création d'un moteur de recherche avec la librairie Solr
    • Configuration de l'index
      • Options linguistiques pour le français (lemmatisation)
    • Indexation
    • Affichage des résultats de recherche
  • Enrichissement de la recherche avec des métadonnées obtenues par le TAL (entités nommées, motifs lexicaux, …)
  • Exploitation d'annotations obtenues par le TAL pour la recherche par facettes dans Solr
  • Recherche web
    • Référencement naturel (SEO) et critères de positionnement.
    • Algorithme PageRank
    • Chatbots et agents conversationnels :
      • À base de règles, à base de corpus, agents conversationnels à base de frames
      • Pratique d'entraînement d'un chatbot

Compétences à acquérir

  • Connaître le mode de fonctionnement des moteurs de recherche
  • Développer un moteur de recherche pour données textuelles en utilisant des bibliothèques existantes
  • Connaître les principes de base du référencement naturel (SEO)

Parcours : Technologies des langues - Traitement automatique des langues, informatique et traduction