Ce que vous devez savoir avant
de commencer

Débute 4 July 2025 00:18

Se termine 4 July 2025

00 Jours

00 Heures

00 Minutes

00 Secondes

Mise en œuvre de l'inférence de grands modèles de langage en C++ pur - Une étude de cas de Llama 2

Plongez dans la mise en œuvre de l'inférence du modèle Llama 2 en utilisant du C++ pur, explorez des solutions sans dépendances et des techniques d'optimisation pour un déploiement efficace des modèles de langage.

code::dive conference via YouTube

1 hour 2 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Programme

Introduction aux grands modèles de langage

Aperçu des modèles de langage

Introduction à Llama 2

Caractéristiques principales de Llama 2

Configuration de l'environnement pour le développement C++

Outils et compilateurs pour C++

Configuration de l'environnement de codage

Introduction aux systèmes de construction

Fondamentaux du C++

Concepts clés du C++

Structures de données en C++

Gestion de la mémoire en C++

Comprendre l'architecture de Llama 2

Aperçu de l'architecture du modèle

Structure d'entrée et de sortie

Graphes computationnels

Implémentation de l'inférence du modèle en pur C++

Composants clés nécessaires pour l'inférence

Écriture du code C++ pour les couches du modèle

Gestion des poids et des biais

Techniques d'optimisation

Stratégies d'optimisation du code

Améliorations de l'efficacité de la mémoire

Utilisation du traitement parallèle

Solutions sans dépendance

Techniques pour éliminer les dépendances

Implémentation d'opérations matricielles personnalisées

Sérialisation et désérialisation

Tests et validation

Tests unitaires en C++

Validation de la sortie du modèle

Tests de performance

Stratégies de déploiement

Déploiement d'applications C++

Exemples de déploiements réels

Surveillance et maintenance

Conclusion et perspectives d'avenir

Récapitulatif des apprentissages clés

Tendances futures dans le déploiement des modèles de langage

Formation continue et ressources

Sujets

Programmation

Ce que vous devez savoir avant de commencer

Mise en œuvre de l'inférence de grands modèles de langage en C++ pur - Une étude de cas de Llama 2

1 hour 2 minutes

Not Specified

Free Video

Aperçu

Programme

Sujets

Déverrouiller la sécurité à grande échelle - Comment les fournisseurs de renseignements sur les menaces et les réseaux cloud collaborent

Chaque emploi en cybersécurité expliqué

Cultiver la compassion et la pensée systémique pour transformer la médecine

Démontrer les capacités de Microsoft Power Automate

Démontrer les capacités de Microsoft Power Apps

Démontrer les capacités de Microsoft Power Pages

Ce que vous devez savoir avant
de commencer