What You Need to Know Before
You Start

Starts 14 July 2026 12:39

Ends 14 July 2026

00 Days

00 Hours

00 Minutes

00 Seconds

Exploitez des données textuelles

Bienvenue dans ce cours de traitement du langage naturel ! L’objectif de ce cours est de comprendre les méthodes qui permettent de transformer le texte en features exploitables par des algorithmes de machine learning classiques, et les architectures et modèles qui correspondent le mieux à ce type de données. En l’occurence un ensemble de documen.

via OpenClassrooms

Not Specified

Optional upgrade avallable

All Levels

Progress at your own speed

Free

Optional upgrade avallable

Overview

En l’occurence un ensemble de documents texte non-structurés.

Ce cours est donc divisé en 3 parties :

une première qui traite de l'exploration, du nettoyage et de la normalisation du texte. Une seconde partie est dédiée aux différents types de transformations qui vont nous permettre de mieux comprendre nos données textuelles et de créer des features que nous pourrons utiliser dans les algorithmes classiques de machine learning.

La dernière partie sera consacrée à la classification du texte à l'aide de l'apprentissage automatique.

Prérequis :

Ce cours fait partie du parcours Data Scientist. Il se situe au croisement des mathématiques et de l'informatique.

Pour en profiter pleinement, n'hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :

Python pour le calcul numérique (numpy) et la création de graphiques (pyplot), que nous utiliserons dans les parties TP du cours,
Quelques notions d'algèbre linéaire :
manipulation de vecteurs, multiplications de matrices, normes, et valeurs/vecteurs propres,
Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance
Les modèles non-supervisées permettront de modéliser des features automatiquement à partir du texte
Les modèles supervisées non-linéaires sont indispensables au traitement du texte, notamment les réseaux de neurones séquentiels

Taught by

Yannis Chaouche

What You Need to Know Before You Start

Exploitez des données textuelles

Not Specified

All Levels

Free

Overview

Taught by

Subjects

CodeCloak: A DRL-Based Method for Mitigating Code Leakage by LLM Code Assistants

Generative AI for NLP with PyTorch

Machine Learning Engineer: ML and Deep Learning Models

Data Preparation & Applied Machine Learning

Building an AI Cooking Helper with Django

Feature Engineering and Feature Stores for AI and ML

What You Need to Know Before
You Start