Qué necesitas saber antes de
comenzar

Inicio 14 July 2026 12:45

Fin 14 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

Exploitez des données textuelles

¡Bienvenido a este curso de procesamiento de lenguaje natural! El objetivo de este curso es entender los métodos que permiten transformar el texto en características utilizables por algoritmos de aprendizaje automático clásicos y las arquitecturas y modelos que mejor se corresponden con este tipo de datos. En este caso, un conjunto de documentos.

via OpenClassrooms

No especificado

Actualización opcional disponible

Todos los niveles

Avanza a tu propio ritmo

Free

Actualización opcional disponible

Resumen

Bienvenue dans ce cours de traitement du langage naturel ! L’objectif de ce cours est de comprendre les méthodes qui permettent de transformer le texte en features exploitables par des algorithmes de machine learning classiques, et les architectures et modèles qui correspondent le mieux à ce type de données.

En l’occurence un ensemble de documents texte non-structurés.

Ce cours est donc divisé en 3 parties :

une première qui traite de l'exploration, du nettoyage et de la normalisation du texte. Une seconde partie est dédiée aux différents types de transformations qui vont nous permettre de mieux comprendre nos données textuelles et de créer des features que nous pourrons utiliser dans les algorithmes classiques de machine learning.

La dernière partie sera consacrée à la classification du texte à l'aide de l'apprentissage automatique.

Prérequis :

Ce cours fait partie du parcours Data Scientist. Il se situe au croisement des mathématiques et de l'informatique.

Pour en profiter pleinement, n'hésitez pas à vous rafraîchir la mémoire, avant ou pendant le cours, sur :

Python pour le calcul numérique (numpy) et la création de graphiques (pyplot), que nous utiliserons dans les parties TP du cours,
Quelques notions d'algèbre linéaire :
manipulation de vecteurs, multiplications de matrices, normes, et valeurs/vecteurs propres,
Quelques notions de probabilités et statistiques, telles que distribution de loi de probabilité et variance
Les modèles non-supervisées permettront de modéliser des features automatiquement à partir du texte
Les modèles supervisées non-linéaires sont indispensables au traitement du texte, notamment les réseaux de neurones séquentiels

Impartido por

Yannis Chaouche

Qué necesitas saber antes de comenzar

Exploitez des données textuelles

No especificado

Todos los niveles

Free

Resumen

Impartido por

Materias

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Preparación de Datos y Aprendizaje Automático Aplicado

Construyendo un Asistente de Cocina con IA usando Django

Ingeniería de características y almacenes de características para IA y ML

Qué necesitas saber antes de
comenzar