Qué necesitas saber antes de
comenzar

Inicio 4 June 2026 08:34

Fin 4 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

RAG Desde Cero

Explora la construcción de líneas de producción de Generación Aumentada por Recuperación en Rust, abarcando las etapas de codificación-división-indexación-fusión-recuperación, búsqueda semántica de código, detección de clones con MinHash y la indexación de espacios de trabajo con múltiples cajas.
Pragmatic AI Labs via Coursera

Pragmatic AI Labs

2868 Cursos


7 hours

Actualización opcional disponible

Intermedio

Avanza a tu propio ritmo

Paid Course

Actualización opcional disponible

Resumen

RAG from Zero is a hands-on two-module course that teaches you to build production Retrieval-Augmented Generation pipelines in Rust by walking two real tools you can use the same day. Module 1 walks the encode-chunk-index-fuse-retrieve pipeline one stage at a time using the published aprender-rag crate — RecursiveChunker(512, 50) with overlap, MockEmbedder(384) for deterministic teaching with candle for production, reciprocal-rank fusion at k=60, and a closing aprender_film_search demo against a 50-row Sakila fixture that asserts four runtime contracts.

Module 2 walks pmat query, a production code-search RAG that ranks by semantic intent plus pagerank plus structural signals — --churn (90-day git volatility), --duplicates (MinHash + Locality-Sensitive Hashing clones), --entropy (pattern diversity), --faults, and -G git-history fusion. The course closes with cross-project search across a sibling-repo workspace via --include-project and --include-source so you can navigate a multi-crate codebase as one indexed corpus.

No toy fixtures, no aspirational APIs — aprender-rag is on crates.io today, pmat ships from paiml/pmat, and the companion paiml/rag-from-zero repo runs end-to-end with cargo run and zero infrastructure.

Programa

  • Módulo 1: aprender-rag — RAG de texto en proceso
  • Construir un pipeline RAG completo de cinco etapas (codificar → fragmentar → indexar → fusionar → recuperar) en puro Rust con aprender-rag. Conectarás RecursiveChunker(512, 50) para una superposición de 50 caracteres que repara las uniones de consulta, MockEmbedder(384) para incrustaciones de grado docente deterministas (sin GPU, sin descarga de modelos, sin red) y FusionStrategy::Rrf { k: 60 } para una fusión de orden recíproco que mejora el recuerdo de larga cola sin pesos aprendidos. La demostración de cierre ejecuta aprender_film_search contra una muestra de película de Sakila de 50 filas y emite top-5 JSON con cuatro contratos assert! en tiempo de ejecución que se activan si algo se desvía.
  • Módulo 2: consulta pmat — Búsqueda de código de producción RAG
  • Aplicar el mismo pipeline RAG de cinco etapas al código fuente en lugar de texto. La herramienta de consulta pmat indexa un espacio de trabajo donde los fragmentos son funciones, luego añade un enriquecimiento de grado de producción encima: modos de búsqueda (--literal para coincidencia exacta estilo ripgrep, --regex para patrones, semántico por defecto), banderas de enriquecimiento (--churn para volatilidad de Git a 90 días, --duplicates para detección de clones MinHash+LSH, --entropy para diversidad, --faults para anotaciones de desempaquetado/pánico/inseguro de Batuta, -G para fusión RRF de historial git), y el modo --coverage-gaps que clasifica cada función por la cuenta de líneas no cubiertas para que escribas pruebas para las brechas de mayor impacto primero.
  • Proyecto Final
  • Construir un Proyecto Final sobre RAG

Impartido por

Noah Gift


Materias

Artificial Intelligence