What You Need to Know Before
You Start

Starts 6 June 2025 10:40

Ends 6 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Sélection de Données - Défis de Données lors de l'Entraînement de Modèles Génératifs

Explorez des techniques de sélection de données stratégiques pour un entraînement efficace des modèles d'IA générative, en couvrant les méthodes de filtrage pour le pré-entraînement et les approches de transport optimal pour le réglage fin qui réduisent les besoins en données tout en maintenant la performance.
Scalable Parallel Computing Lab, SPCL @ ETH Zurich via YouTube

Scalable Parallel Computing Lab, SPCL @ ETH Zurich

2484 Cours


1 hour

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Explorez des techniques de sélection de données stratégiques pour un entraînement efficace des modèles d'IA générative, en couvrant les méthodes de filtrage pour le pré-entraînement et les approches de transport optimal pour le réglage fin qui réduisent les besoins en données tout en maintenant la performance.

Programme

  • Introduction à la sélection de données dans l'apprentissage des modèles génératifs
  • Importance de la sélection des données
    Aperçu des modèles génératifs
  • Méthodes de filtrage pour le pré-entraînement
  • Évaluation de la qualité des données
    Techniques de déduplication des données
    Stratégies de réduction du bruit
  • Techniques de sélection stratégique des données
  • Échantillonnage d'importance
    Approches d'optimisation sous-modulaire
    Apprentissage actif pour la curation des données
  • Approches de transport optimal pour le raffinement
  • Principes du transport optimal
    Applications dans le raffinage du modèle
    Études de cas sur la réduction des besoins en données
  • Équilibrer l'efficacité des données et la performance des modèles
  • Compromis dans la sélection des données
    Indicateurs de performance et évaluation
  • Études de cas et applications industrielles
  • Exemples concrets
    Histoires de succès et leçons apprises
  • Outils et cadres pour la sélection des données
  • Aperçu des outils disponibles
    Exercices pratiques et tutoriels
  • Tendances futures et orientations de recherche
  • Techniques émergentes dans la sélection des données
    Opportunités pour l'innovation
  • Conclusion et récapitulatif
  • Points clés à retenir
    Réflexions finales sur la sélection des données pour les modèles génératifs
  • Projet pratique
  • Concevoir un pipeline de sélection de données
    Mettre en œuvre des stratégies de filtrage et de raffinement

Sujets

Informatique