> Formations > Technologies numériques > Développement logiciel > Python > Formation Python pour le traitement du langage naturel (NLP) > Formations > Technologies numériques > Formation Python pour le traitement du langage naturel (NLP)
Nouvelle formation

Formation : Python pour le traitement du langage naturel (NLP)

Natural Language Processing avec les outils et bibliothèques Python

Python pour le traitement du langage naturel (NLP)

Natural Language Processing avec les outils et bibliothèques Python
Télécharger au format pdf Partager cette formation par e-mail 2


Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.


Inter
Intra
Sur mesure

Cours pratique

Réf. PTS
Prix : 1860 € H.T.
  3j - 21h00
Pauses-café et
déjeuners offerts




Ce cours enseigne l'utilisation de Python pour le traitement du langage naturel : la préparation des données, la représentation de textes et leur modélisation. Le participant utilise des outils et bibliothèques Python pour effectuer des tâches courantes de NLP, met en œuvre et applique des modèles de NLP.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Utiliser python pour traiter des données textuelles
  • Choisir les outils et bibliothèques Python nécessaires au traitement
  • Mettre en place les différentes étapes de préprocessing et de vectorisation
  • Utiliser les techniques appropriées en fonction des objectifs : classification / topic modelling / analyse de sentiment
  • Appliquer et évaluer des modèles sur des données réelles

Prérequis
Connaissances de programmation en Python.

Programme de la formation

Environnement Python pour le NLP

  • L'environnement de développement Python / Anaconda / Jupyter Notebook.
  • Les principaux types de données : chaînes, booléennes, nombres, listes, tuples et dictionnaires.
  • Les structures de contrôles : les boucles for et while, le test if/elif/else.
  • Les fonctions : création, passage de paramètres, valeurs par défaut, arguments variables.
  • Numpy : vecteurs, matrices, slicing, concaténation.
  • Pandas : l’analyse de données tabulaires (CSV, Excel...), statistiques, pivots, jointures, filtres.
Travaux pratiques
Manipulation de Python dans un notebook Jupyter. Exercice de mise en pratique avec pandas et numpy.

Prétraitement des données textuelles

  • Identifier ce que sont des données textuelles et présentation des librairies spaCy et nltk.
  • Tokenisation des mots.
  • Suppression des stop-words, de la ponctuation et des éléments non essentiels à l’analyse.
  • Lemmatisation vs racinisation (stemming).
Travaux pratiques
Preprocessing sur des corpus de textes avec les 2 librairies, comparaison des résultats et des façons d’implémenter. Création de listes de stop-words, comparaison lemmatisation et de racinisation.

Extraction d'informations

  • Identification de la nature grammatical des mots à l’aide du Part Of Speech Tagging.
  • Identifier des personnes, lieux etc avec le Named Entity Recognition.
Travaux pratiques
Mettre en place le Part Of Speech Tagging et le Named Entity Recognition. Analyse des résultats, filtres sur certaines catégories grammaticales, sur les noms propres.

Représentation vectorielle des données textuelles

  • Bag of words.
  • Pondération tf-idf.
  • Approche avec des n-grams.
  • Les embeddings : word2vec, gloVe, fastTesxt..
Travaux pratiques
Transformation d’un corpus de texte en utilisant différentes approches : bag of words, tf-idf, word2vec, gloVe. Comparaison des vecteurs.

Machine learning sur des données textuelles

  • Rappels sur les étapes de construction d'un modèle prédictif.
  • Classification.
  • Analyse de sentiment.
  • Topic modelling.
Travaux pratiques
Modélisation en utilisant différents types de vecteurs (bag of words vs embeddings). Analyse de sentiment sur des tweets.

Procédures d'évaluation de modèles

  • Les techniques de rééchantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion.
Travaux pratiques
Construire et évaluer un modèle NLP de façon appliquée..


Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.

Avis clients
5 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
HUSEY K.
06/12/23
5 / 5

le contenu de la formation était parfait et la pédagogie était aussi parfait
LAURENT N.
06/12/23
5 / 5

Je suis très satisfait de la formation. Le sujet est particulièrement riche en plus d’être d’actualité. Le formateur est très pédagogue et agréable. Il prend le temps de répondre aux questions malgré la densité du programme. Par la force des choses, la théorie est beaucoup plus présente que la pratique, car il y a énormément de concepts à apprendre qui sont de surcroît difficiles à comprendre car pointus.




Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 15h30 le dernier jour.

Dates et lieux
Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.
Classe à distance