Parcours Traitement du langage naturel (NLP)

Durée
65 heures
Formule d'enseignement
En ligne
Formation publique

Clientèle cible

S’adresse aux professionnels de l’industrie œuvrant dans des postes liés à la programmation ou à l’exploitation de données, principalement des développeurs amenés à développer des outils de traitement automatique du langage.

Préalables

Description

Ce parcours vise à permettre au professionnel de l’industrie d’être en mesure d'utiliser des techniques statistiques, de préparer des données textuelles pour un projet et d'utiliser des techniques d'apprentissage profond du traitement automatique de la langue naturelle (TALN). Le parcours est axé sur la pratique, afin d’outiller le professionnel et le rendre opérationnel rapidement.

Le traitement automatique de la langue naturelle (TALN), un sous-domaine de l'intelligence artificielle, est de plus en plus utilisé dans l’industrie, pour analyser des documents, extraire de l’information dans des textes ou créer des assistants virtuels (chatbots) par exemple.

Ce parcours en intelligence artificielle (IA) comprend trois formations (voir plus bas les détails de celles-ci).

Stratégies pédagogiques

  • Formations autonomes en mode asynchrone par lectures, démonstration et exercices sur une plateforme d’apprentissage expérientielle (PAX)

Plateforme d'Apprentissage eXpérientielle (PAX)

PAX est une plateforme unique d’apprentissage novatrice, dite intelligente, qui regroupe des outils d’apprentissage adaptatifs et interactifs. Elle agit véritablement comme un tuteur intelligent permettant à l’apprenant d’apprendre par déduction en connaissant la nature et la source de ses erreurs.

Avantages distinctifs de PAX :

  • La théorie est exposée sous forme de modules multimédias interactifs
  • Des exercices interactifs permettent l'approfondissement des notions théoriques enseignées. Ceux-ci sont analysé par PAX, qui offre une rétroaction immédiate et individuelle afin d'aider le participant à corriger ses erreurs par déduction
  • Des quiz chronométrés permettent au participant de tester ses acquis autant de fois qu’il le désire
  • Un forum contextuel où les fils de discussions sont liés aux contenus (modules-exercices et quiz)
  • Un forum animé par des experts en Python

Objectifs

  • Départager des problèmes de classification de texte des problèmes de classification de séquence et de modélisation de langue
  • Expliquer un problème un problème de classification de séquence à l’aide de l’algorithme HMM
  • Utiliser une librairie utilisant l’apprentissage profond pour résoudre un problème de classification de séquence
  • Appliquer une technique statistique pour entraîner un modèle de langue et de normalisation de texte
  • Appliquer des techniques de préparation et de visualisation de données textuelles
  • Créer une procédure de nettoyage et de visualisation de données textuelles
  • Définir une procédure d’entrainement d’un modèle d’apprentissage profond
  • Utiliser les algorithmes de représentation de texte à l’aide d’encodeurs neuronaux
  • Sélectionner, selon le contexte, les architectures de type transformer applicables pour la génération de texte
  • Configurer les paramètres de génération de texte d’une architecture de type transformer