Aperçu
Amazon SageMaker aide les data scientists à préparer, créer, entraîner, déployer et superviser des modèles d'apprentissage automatique (ML). SageMaker réunit un large ensemble de capacités, y compris l'accès à des bibliothèques de formation distribuée, modèles open source et modèles fondamentaux. Ce cours présente aux data scientists expérimentés les défis de la création de modèles linguistiques et les différentes options de stockage, ingestion et formation pour traiter un corpus de texte de grande taille. Le cours aborde également les défis du déploiement de modèles de grande taille et de la personnalisation de modèles fondamentaux pour des tâches d'intelligence artificielle générative en utilisant Amazon SageMaker Jumpstart.
- Niveau du cours : avancé
- Durée : 5,5 heures
Remarque : Ce cours dispose de transcriptions ou sous-titres localisés. La narration est en anglais. Pour afficher les sous-titres, cliquez sur le bouton CC dans le coin inférieur droit du lecteur.
Activités
Ce cours inclut des instructions textuelles, des graphiques illustratifs, des questions d'évaluation des connaissances et des démonstrations vidéo de laboratoires que vous pouvez exécuter sur votre propre compte Amazon Web Services (AWS).
Objectifs du cours
Après avoir terminé ce cours, les data scientists pourront construire, entraîner et régler avec confiance des modèles linguistiques performants sur AWS avec SageMaker.
Dans ce cours, vous apprendrez à :
- Appliquer les meilleures pratiques de stockage et ingestion d'une grande quantité de données textuelles pour supporter la formation distribuée
- Explorer les bibliothèques de parallélisation de données et de modèles pour supporter la formation distribuée sur SageMaker
- Expliquer les options disponibles sur SageMaker pour améliorer les performances de la formation, telles que le compilateur de formation d'Amazon et l'Elastic Fabric Adapter (EFA)
- Explorer les techniques d'optimisation des grands modèles linguistiques pour un déploiement efficace des modèles
- Démontrer comment ajuster finement les modèles fondamentaux disponibles sur SageMaker Jumpstart.
À qui s'adresse ce cours
Ce cours est destiné aux personnes occupant les rôles suivants :
- Data scientists
- Ingénieurs ML
Pré-requis
Nous recommandons que les participants à ce cours aient les expériences suivantes :
- Plus de 1 an d'expérience en traitement du langage naturel (NLP)
- Plus de 1 an d'expérience en formation et optimisation de modèles linguistiques
- Connaissances intermédiaires en programmation avec le langage Python
- Principes techniques d'AWS
- Amazon SageMaker Studio pour data scientists
Plan du cours
Introduction à la série de coursSection 1 : introduction
- Introduction à la création de modèles de langage sur AWS
Section 2 : notions de base des grands modèles linguistiques
- Types de grands modèles linguistiques
- Cas pratiques courants d'IA générative
Section 3 : aperçu de la série de cours
- Sujets couverts dans les futurs modules
Section 1 : défis communs
- Défis communs des professionnels des grands modèles linguistiques (LLM)
Section 2 : solutions de formation multi-machine
- Extension
Programme
Enseigné par
Étiquettes