Aperçu
Utilisez Python et Google CoLab pour l'extraction de données des médias sociaux, l'analyse de texte et le traitement du langage naturel (NLP).
Programme
-
- Introduction à l'analyse de texte et NLP
-- Aperçu du traitement automatique du langage naturel (NLP)
-- Importance de l'analyse de texte dans les applications modernes
-- Python pour le NLP : Un aperçu
- Configuration de l'environnement Python
-- Installation de Python et des IDE
-- Utilisation des notebooks Jupyter
-- Bibliothèques clés : NLTK, spaCy, scikit-learn
- Techniques de traitement de texte de base
-- Tokenisation
-- Suppression des mots vides
-- Expressions régulières
- Prétraitement du texte
-- Normalisation des majuscules
-- Stemming et lemmatisation
-- Gestion de la ponctuation, des chiffres et des symboles
- Extraction de caractéristiques
-- Modèle Bag of Words
-- Fréquence de terme-Inverse Fréquence de Document (TF-IDF)
-- Word Embeddings : Word2Vec, GloVe
- Analyse de sentiment
-- Introduction à l'analyse de sentiment
-- Utilisation de NLTK pour l'analyse de sentiment
-- Création d'un classificateur de sentiment avec scikit-learn
- Classification de texte
-- Compréhension de la classification de texte
-- Apprentissage automatique supervisé pour le texte
-- Construction et évaluation de classificateurs
- Sujets avancés en NLP
-- Reconnaissance d'entités nommées (NER)
-- Modélisation de sujets avec LDA
-- Introduction aux modèles transformateurs et BERT
- Analyse des données des médias sociaux
-- Collecte de données à partir des API des médias sociaux
-- Analyse de texte dans le contexte des médias sociaux
-- Études de cas et applications
- Projets pratiques et études de cas
-- Analyse de sentiment sur les données de Twitter
-- Création d'un chatbot
-- Classification de texte pour des articles de presse
- Conclusion et apprentissage continu
-- Récapitulation des concepts clés
-- Ressources pour l'apprentissage continu en NLP
-- Présentation finale du projet et retour d'information
Enseigné par
Étiquettes