Ce que vous devez savoir avant
Vous commencez

Débute 5 June 2026 10:56

Se termine 5 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

NLP : Adapter et Prétraiter le Texte

Maîtrisez le fine-tuning de BERT et les pipelines de prétraitement de spaCy pour transformer le texte non structuré en informations exploitables pour des applications PNL spécifiques à un domaine.
Coursera via Coursera

Coursera

2874 Cours


1 hour 40 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Did you know that 80% of the world's data is unstructured text? Yet most organizations struggle to extract actionable insights from this goldmine of information.

This Short Course was created to help machine learning and AI professionals accomplish domain-specific natural language processing through systematic model adaptation and robust text preprocessing workflows. By completing this course, you'll be able to fine-tune BERT models on specialized datasets, build automated spaCy pipelines for text standardization, and deploy production-ready NLP solutions that deliver measurable performance improvements in your next project.

By the end of this course, you will be able to:

- Create fine-tuned transformer language models for domain-specific applications - Apply text preprocessing techniques to build a pipeline for cleaning and standardizing raw text This course is unique because it combines hands-on fine-tuning with Hugging Face Trainer and practical pipeline construction using spaCy, giving you immediately applicable skills for real-world NLP challenges. To be successful in this project, you should have a background in Python programming, basic machine learning concepts, and familiarity with transformer architectures.

Programme

  • Module 1 : Affinage des modèles de langage Transformer
  • Les apprenants maîtriseront le processus d'adaptation des modèles BERT pré-entraînés pour des domaines spécialisés en utilisant Hugging Face Transformers, atteignant ainsi des performances prêtes pour la production sur des tâches propres à un domaine.
  • Module 2 : Développement de pipeline de prétraitement de texte
  • Les apprenants construiront des pipelines de prétraitement de texte complets en utilisant spaCy qui transforment le texte brut en formats prêts pour l'analyse grâce à des flux de travail systématiques de tokenisation, de normalisation et de codage.

Enseigné par

Hurix Digital


Matières

Artificial Intelligence