Ce que vous devez savoir avant
Vous commencez

Débute 4 June 2026 09:39

Se termine 4 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

RAG De Zéro

Explorez la création de pipelines de génération augmentée par la récupération en Rust, couvrant les étapes encoder-diviser-indexer-fusionner-récupérer, la recherche sémantique de code, la détection de clones avec MinHash et l'indexation d'espaces de travail multi-crates.
Pragmatic AI Labs via Coursera

Pragmatic AI Labs

2868 Cours


7 hours

Amélioration optionnelle disponible

Intermédiaire

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

RAG from Zero is a hands-on two-module course that teaches you to build production Retrieval-Augmented Generation pipelines in Rust by walking two real tools you can use the same day. Module 1 walks the encode-chunk-index-fuse-retrieve pipeline one stage at a time using the published aprender-rag crate — RecursiveChunker(512, 50) with overlap, MockEmbedder(384) for deterministic teaching with candle for production, reciprocal-rank fusion at k=60, and a closing aprender_film_search demo against a 50-row Sakila fixture that asserts four runtime contracts.

Module 2 walks pmat query, a production code-search RAG that ranks by semantic intent plus pagerank plus structural signals — --churn (90-day git volatility), --duplicates (MinHash + Locality-Sensitive Hashing clones), --entropy (pattern diversity), --faults, and -G git-history fusion. The course closes with cross-project search across a sibling-repo workspace via --include-project and --include-source so you can navigate a multi-crate codebase as one indexed corpus.

No toy fixtures, no aspirational APIs — aprender-rag is on crates.io today, pmat ships from paiml/pmat, and the companion paiml/rag-from-zero repo runs end-to-end with cargo run and zero infrastructure.

Programme

  • Module 1 : aprender-rag — RAG de texte en cours de traitement
  • Construisez un pipeline RAG complet en cinq étapes (encoder → fractionner → indexer → fusionner → récupérer) en Rust pur avec aprender-rag. Vous allez configurer RecursiveChunker(512, 50) pour un chevauchement de 50 caractères qui répare les coutures de requête, MockEmbedder(384) pour des embeddings déterministes de qualité enseignement (pas de GPU, pas de téléchargement de modèle, pas de réseau), et FusionStrategy::Rrf { k: 60 } pour une fusion de rang réciproque qui augmente le rappel des longues traînes sans poids appris. La démo de clôture exécute une recherche de films aprender contre une fixture de 50 lignes de films Sakila et émet un top-5 en JSON avec quatre contrats assert! d'exécution qui s'activent si quelque chose dérive.
  • Module 2 : requête pmat — Recherche de code de production RAG
  • Appliquez le même pipeline RAG en cinq étapes à du code source au lieu de texte. L'outil de requête pmat indexe un espace de travail où les morceaux sont des fonctions, puis ajoute un enrichissement de qualité production par-dessus : modes de recherche (--literal pour une correspondance exacte de type ripgrep, --regex pour le motif, sémantique par défaut), indicateurs d'enrichissement (--churn pour la volatilité Git sur 90 jours, --duplicates pour la détection de clones avec MinHash+LSH, --entropy pour la diversité, --faults pour les annotations de Batuta unwrap/panic/unsafe, -G pour la fusion RRF de l'historique git), et le mode --coverage-gaps qui classe chaque fonction par nombre de lignes non couvertes afin de rédiger des tests pour combler les lacunes les plus cruciales.
  • Projet de clôture
  • Construisez un projet final de clôture sur RAG

Enseigné par

Noah Gift


Matières

Artificial Intelligence