Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 9 — La tríada de evaluación de RAG
Novena entrega del recorrido de LLM Primer III. Un sistema RAG puede fallar en tres lugares distintos y los fallos parecen idénticos desde fuera — la tríada de evaluación de Relevancia del Contexto, Fidelidad y Relevancia de la Respuesta es el pequeño vocabulario que evita arreglar un bug mientras se mide otro.
2026-03-26Capítulo 11 — Evaluación, calibración e inferencia
Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.
2026-03-13