Ce que vous devez savoir avant
de commencer

Débute 4 July 2025 10:01

Se termine 4 July 2025

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Sélection de Données - Défis de Données lors de l'Entraînement de Modèles Génératifs

Scalable Parallel Computing Lab, SPCL @ ETH Zurich via YouTube

Scalable Parallel Computing Lab, SPCL @ ETH Zurich

2765 Cours


1 hour

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Programme

  • Introduction à la sélection de données dans l'apprentissage des modèles génératifs
  • Importance de la sélection des données
    Aperçu des modèles génératifs
  • Méthodes de filtrage pour le pré-entraînement
  • Évaluation de la qualité des données
    Techniques de déduplication des données
    Stratégies de réduction du bruit
  • Techniques de sélection stratégique des données
  • Échantillonnage d'importance
    Approches d'optimisation sous-modulaire
    Apprentissage actif pour la curation des données
  • Approches de transport optimal pour le raffinement
  • Principes du transport optimal
    Applications dans le raffinage du modèle
    Études de cas sur la réduction des besoins en données
  • Équilibrer l'efficacité des données et la performance des modèles
  • Compromis dans la sélection des données
    Indicateurs de performance et évaluation
  • Études de cas et applications industrielles
  • Exemples concrets
    Histoires de succès et leçons apprises
  • Outils et cadres pour la sélection des données
  • Aperçu des outils disponibles
    Exercices pratiques et tutoriels
  • Tendances futures et orientations de recherche
  • Techniques émergentes dans la sélection des données
    Opportunités pour l'innovation
  • Conclusion et récapitulatif
  • Points clés à retenir
    Réflexions finales sur la sélection des données pour les modèles génératifs
  • Projet pratique
  • Concevoir un pipeline de sélection de données
    Mettre en œuvre des stratégies de filtrage et de raffinement

Sujets

Informatique