Introducción a LLM

Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.

Total de 17 artículos disponibles. | Actualmente en la página 1 de 1.

Capítulo 14 — Economía del token y precios de API

Decimocuarta entrega del recorrido de LLM Primer VI. Por qué el token es la unidad de precio, por qué la salida cuesta 4–8× más que la entrada, y cómo la acumulación de contexto y los tokens invisibles de razonamiento acaban en la factura.

2026-05-06

Capítulo 9 — Decodificación especulativa

Novena entrega del recorrido de LLM Primer VI. Cómo la decodificación especulativa paga por una suposición barata y una verificación un poco más ancha, y si acierta lo bastante a menudo el modelo objetivo produce varios tokens al coste de reloj de uno. EAGLE, Medusa, la aritmética del speedup.

2026-05-01

Capítulo 2 — El desafío de la caché KV

Segunda entrega del recorrido de LLM Primer VI. La estructura de datos que se come la VRAM de todo sistema de serving antes de que los pesos tengan oportunidad, la fórmula que gobierna su tamaño, las variantes arquitectónicas que la reducen y el problema de fragmentación que arruina la asignación ingenua.

2026-04-24

Capítulo 1 — La mecánica de la generación de tokens

Primera entrega del recorrido de LLM Primer VI. Por qué casi toda pregunta difícil sobre el serving de LLMs desciende de un único hecho — el bucle que produce cada token está limitado por el ancho de banda de memoria, y el cómputo caro por el que pagaste está inactivo el 99,7 % del tiempo.

2026-04-23

Capítulo 10 — Memoria de tareas de horizonte largo

Décima entrega del recorrido de LLM Primer IV. Memoria a corto plazo mediante ventanas y scratchpads ReAct, memoria a largo plazo mediante vectores episódicos y almacenes semánticos, y las técnicas de compactación que mantienen productivo a un agente a lo largo de horas y días.

2026-04-08

Capítulo 8 — Distribuciones arquitectónicas de despliegue

Octava entrega del recorrido de LLM Primer IV. Las tres distribuciones de despliegue que han emergido en el ecosistema MCP — agente reutilizable, pureza estricta, híbrida — y las cuatro restricciones vinculantes que determinan cuál encaja con cada proyecto.

2026-04-06

Capítulo 6 — Estrategias fundamentales de orquestación

Sexta entrega del recorrido de LLM Primer IV. Las dos formas fundacionales de orquestación — pipelines secuenciales y scatter-gather concurrente — y la pregunta previa que todo equipo debería hacerse: ¿es un sistema multi-agente la respuesta correcta?

2026-04-04

Capítulo 4 — Primitivas del cliente: comportamientos agénticos y control

Cuarta entrega del recorrido de LLM Primer IV. Sampling, Roots y Elicitation son los tres pequeños agujeros controlados que MCP abre en el muro host-servidor — cada uno una capacidad otorgada de vuelta, cada uno un riesgo aceptado en nombre del usuario.

2026-04-02

Capítulo 1 — La crisis de integración de la IA y el auge de la arquitectura agéntica

Primera entrega del recorrido de LLM Primer IV. Por qué los agentes monolíticos se deshilachan al crecer el system prompt, el problema de integración N por M que se esconde debajo, y el paso de la ingeniería de prompts a la ingeniería de contexto que MCP vino a habilitar.

2026-03-30

LLM Primer IV — Introducción a la serie e índice

Apertura del recorrido capítulo a capítulo del Libro IV de la serie LLM Primer — Diseñando la cognición de la IA con MCP. Por qué los agentes necesitan una capa de protocolo para escalar más allá de la demo, para quién está escrito, y el calendario de los catorce posts que siguen, del 30 de marzo al 12 de abril.

2026-03-29

Capítulo 11 — Evaluación, calibración e inferencia

Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.

2026-03-13

Capítulo 10 — Matemáticas del post-entrenamiento y la alineación

Capítulo 10 de la serie LLM Primer II. Cómo un predictor de siguiente token genial pero salvaje se civiliza hasta convertirse en un asistente útil — ajuste fino supervisado, modelado de recompensas con Bradley–Terry, RLHF con correa KL y la elegante derivación de DPO que colapsa toda la cañería en una sola pérdida supervisada.

2026-03-12

Capítulo 4 — La arquitectura Transformer: dentro del motor de la IA moderna

Capítulo 4 de la serie LLM Primer I. Un recorrido por el bloque Transformer — cómo el self-attention, la codificación posicional y las capas apiladas se combinan para producir la arquitectura sobre la que está construido cada LLM moderno. Incluye una explicación clara de por qué escalar Transformers funciona, y cuánto cuesta.

2026-02-21

Capítulo 3 — Redes neuronales para el lenguaje: de las RNN al self-attention

Capítulo 3 de la serie LLM Primer I. Por qué las redes feedforward no podían manejar el lenguaje, cómo las RNN chocaron contra un muro y qué cambió la atención. Una progresión conceptual limpia a través de las tres formas de red neuronal que definieron el PLN moderno — sin la ansiedad matemática.

2026-02-20

Capítulo 2 — Probabilidad, tokens y texto: el juego de adivinar la siguiente palabra

Capítulo 2 de la serie LLM Primer I. Cómo los LLM convierten el texto en tokens, por qué el modelado del lenguaje es fundamentalmente un problema de probabilidad y cómo el viejo enfoque de n-gramas dio paso a modelos neuronales capaces de generalizar. Incluye explicaciones en lenguaje sencillo sobre la perplejidad y por qué importan los límites entre tokens.

2026-02-19

Capítulo 1 — ¿Qué es un modelo de lenguaje grande? (Más allá de los titulares)

Capítulo 1 de la serie LLM Primer I. Desentrañamos lo que realmente significan "grande", "lenguaje" y "modelo", recorremos el paso de los sistemas basados en reglas a las redes neuronales y abordamos los tres mayores conceptos erróneos sobre cómo funcionan los LLM modernos. Una base clara y accesible para todo lo que sigue.

2026-02-18

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.

2026-02-17