Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 11 — Evaluación, calibración e inferencia
Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.
2026-03-13Capítulo 10 — Matemáticas del post-entrenamiento y la alineación
Capítulo 10 de la serie LLM Primer II. Cómo un predictor de siguiente token genial pero salvaje se civiliza hasta convertirse en un asistente útil — ajuste fino supervisado, modelado de recompensas con Bradley–Terry, RLHF con correa KL y la elegante derivación de DPO que colapsa toda la cañería en una sola pérdida supervisada.
2026-03-12Capítulo 4 — La arquitectura Transformer: dentro del motor de la IA moderna
Capítulo 4 de la serie LLM Primer I. Un recorrido por el bloque Transformer — cómo el self-attention, la codificación posicional y las capas apiladas se combinan para producir la arquitectura sobre la que está construido cada LLM moderno. Incluye una explicación clara de por qué escalar Transformers funciona, y cuánto cuesta.
2026-02-21Capítulo 3 — Redes neuronales para el lenguaje: de las RNN al self-attention
Capítulo 3 de la serie LLM Primer I. Por qué las redes feedforward no podían manejar el lenguaje, cómo las RNN chocaron contra un muro y qué cambió la atención. Una progresión conceptual limpia a través de las tres formas de red neuronal que definieron el PLN moderno — sin la ansiedad matemática.
2026-02-20Capítulo 2 — Probabilidad, tokens y texto: el juego de adivinar la siguiente palabra
Capítulo 2 de la serie LLM Primer I. Cómo los LLM convierten el texto en tokens, por qué el modelado del lenguaje es fundamentalmente un problema de probabilidad y cómo el viejo enfoque de n-gramas dio paso a modelos neuronales capaces de generalizar. Incluye explicaciones en lenguaje sencillo sobre la perplejidad y por qué importan los límites entre tokens.
2026-02-19Capítulo 1 — ¿Qué es un modelo de lenguaje grande? (Más allá de los titulares)
Capítulo 1 de la serie LLM Primer I. Desentrañamos lo que realmente significan "grande", "lenguaje" y "modelo", recorremos el paso de los sistemas basados en reglas a las redes neuronales y abordamos los tres mayores conceptos erróneos sobre cómo funcionan los LLM modernos. Una base clara y accesible para todo lo que sigue.
2026-02-18Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice
Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.
2026-02-17