Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 10 — Matemáticas del post-entrenamiento y la alineación
Capítulo 10 de la serie LLM Primer II. Cómo un predictor de siguiente token genial pero salvaje se civiliza hasta convertirse en un asistente útil — ajuste fino supervisado, modelado de recompensas con Bradley–Terry, RLHF con correa KL y la elegante derivación de DPO que colapsa toda la cañería en una sola pérdida supervisada.
2026-03-12Capítulo 11 — Investigación de vanguardia: MoE, modelos de razonamiento y el nuevo eje de escalado
Capítulo 11 de la serie LLM Primer I. Las fronteras de investigación que ahora son realidad de producción — mixture-of-experts, memoria con recuperación, tokenización multimodal nativa, aprendizaje continuo y el paradigma de escalado en tiempo de inferencia que produjo los modelos de razonamiento de hoy. La mayor adición de contenido de la edición de 2026.
2026-02-28Capítulo 6 — Ajuste fino y adaptación: del modelo crudo al asistente útil
Capítulo 6 de la serie LLM Primer I. La pila completa de adaptación — desde el direccionamiento barato basado en prompts, pasando por el ajuste fino eficiente en parámetros, hasta la alineación completa con RLHF y sus sucesores modernos como DPO. Por qué el post-entrenamiento es ahora donde las APIs de modelos cerrados realmente se diferencian.
2026-02-23Capítulo 5 — Entrenando modelos grandes: qué se necesita realmente para un modelo de frontera
Capítulo 5 de la serie LLM Primer I. Cómo se entrenan realmente los LLM de frontera — la tubería de datos, la función de pérdida, los meses de tiempo de GPU y por qué el "entrenamiento" es ahora un problema de ingeniería a escala industrial más que un problema de investigación. Desmitifica para qué están pagando esas corridas de cientos de millones de dólares.
2026-02-22Capítulo 2 — Probabilidad, tokens y texto: el juego de adivinar la siguiente palabra
Capítulo 2 de la serie LLM Primer I. Cómo los LLM convierten el texto en tokens, por qué el modelado del lenguaje es fundamentalmente un problema de probabilidad y cómo el viejo enfoque de n-gramas dio paso a modelos neuronales capaces de generalizar. Incluye explicaciones en lenguaje sencillo sobre la perplejidad y por qué importan los límites entre tokens.
2026-02-19Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice
Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.
2026-02-17La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen
La Serie LLM Primer — una guía de campo en siete volúmenes sobre IA generativa por Sho Shimoda. Cada volumen cubre una capa distinta del trabajo con modelos de lenguaje grandes, desde los fundamentos hasta el escalado y la seguridad. Esta es la página principal: una visión general de toda la serie, más el recorrido capítulo por capítulo en vivo de los primeros volúmenes.
2026-02-15