What You Need to Know Before
You Start

Starts 7 June 2025 10:21

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Mise en œuvre de l'inférence de grands modèles de langage en C++ pur - Une étude de cas de Llama 2

Plongez dans la mise en œuvre de l'inférence du modèle Llama 2 en utilisant du C++ pur, explorez des solutions sans dépendances et des techniques d'optimisation pour un déploiement efficace des modèles de langage.
code::dive conference via YouTube

code::dive conference

2544 Cours


1 hour 2 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Plongez dans la mise en œuvre de l'inférence du modèle Llama 2 en utilisant du C++ pur, explorez des solutions sans dépendances et des techniques d'optimisation pour un déploiement efficace des modèles de langage.

Programme

  • Introduction aux grands modèles de langage
  • Aperçu des modèles de langage
    Introduction à Llama 2
    Caractéristiques principales de Llama 2
  • Configuration de l'environnement pour le développement C++
  • Outils et compilateurs pour C++
    Configuration de l'environnement de codage
    Introduction aux systèmes de construction
  • Fondamentaux du C++
  • Concepts clés du C++
    Structures de données en C++
    Gestion de la mémoire en C++
  • Comprendre l'architecture de Llama 2
  • Aperçu de l'architecture du modèle
    Structure d'entrée et de sortie
    Graphes computationnels
  • Implémentation de l'inférence du modèle en pur C++
  • Composants clés nécessaires pour l'inférence
    Écriture du code C++ pour les couches du modèle
    Gestion des poids et des biais
  • Techniques d'optimisation
  • Stratégies d'optimisation du code
    Améliorations de l'efficacité de la mémoire
    Utilisation du traitement parallèle
  • Solutions sans dépendance
  • Techniques pour éliminer les dépendances
    Implémentation d'opérations matricielles personnalisées
    Sérialisation et désérialisation
  • Tests et validation
  • Tests unitaires en C++
    Validation de la sortie du modèle
    Tests de performance
  • Stratégies de déploiement
  • Déploiement d'applications C++
    Exemples de déploiements réels
    Surveillance et maintenance
  • Conclusion et perspectives d'avenir
  • Récapitulatif des apprentissages clés
    Tendances futures dans le déploiement des modèles de langage
    Formation continue et ressources

Sujets

Programmation