LLM Primer IV — Diseñando la cognición de la IA con MCP: introducción a la serie e índice

"Un agente vale lo que vale el contexto que ve, las herramientas que alcanza y la memoria que carga." Bienvenido al Libro IV de la serie LLM Primer — y al recorrido que lo acompaña. Durante los próximos catorce días, un post por capítulo, abriremos el Model Context Protocol y la capa de cognición que hace posible, y revisaremos las decisiones que deciden si un sistema de agentes funciona en silencio o falla en silencio.

Por qué existe el Libro IV

Los libros I, II y III de esta serie te dieron el modelo y el aparato de recuperación que lo rodea. El Libro I contó la historia, en lenguaje llano, de qué son los LLM. El Libro II abrió la matemática que tienen debajo. El Libro III recorrió la arquitectura de producción de RAG. El Libro IV trata de lo que rodea al modelo cuando intentas que actúe — que llame a herramientas, que mantenga estado entre turnos, que se coordine con otros agentes, y que haga todo eso sin reescribir el pegamento de integración cada trimestre.

El patrón que se quebró en 2025 fue el del agente monolítico: un system prompt largo, un puñado de herramientas, una sola ventana de contexto a la que se le pedía absorber cada preocupación a la vez. Servía para la demo. Se deshilachaba en producción a medida que los prompts crecían, las superficies de herramientas se expandían, y cada nueva versión de modelo exigía otra ronda de código adaptador hecho a mano. El diagnóstico llegó por varios frentes — dilución de contexto, colisión de instrucciones, la matriz de integración N por M — y apuntaba a la misma respuesta arquitectónica: una capa de protocolo bajo el modelo que dejara a los agentes descubrir capacidades, negociar sesiones y componer herramientas sin que ninguna de las dos partes tuviera que conocer a la otra de antemano.

Esa capa es el Model Context Protocol. Este libro lo recorre con honestidad, capa por capa. La promesa no es que MCP resuelva todos los problemas de los agentes. La promesa es que, al terminar, sepas qué te da el protocolo, qué no, y qué patrones construidos encima sobreviven al contacto con producción.

En una línea: los sistemas agénticos necesitan un protocolo que desacople modelos de herramientas, una disciplina para presupuestar atención y memoria, y un modelo de seguridad que se tome en serio la procedencia de los servidores — y MCP es la capa donde las tres cosas se encuentran.

Para quién lo escribí

Para ingenieros que construyen sistemas de agentes, PMs técnicos que los acotan y arquitectos que tienen que defender las decisiones ante una revisión de seguridad. El libro asume que el lector se mueve con comodidad en la imagen del Libro I sobre cómo se comporta un LLM y la del Libro III sobre cómo se cablea la recuperación; no asume la matemática del Libro II. El centro de gravedad está en la ingeniería: dónde viven los modos de fallo, qué decisiones son reversibles, y cuáles atan al equipo durante años.

Cómo leerlo

Tres modos que les han funcionado a los primeros lectores. De principio a fin, si estás a punto de empezar a construir un sistema de agentes basado en MCP y quieres el protocolo en el orden en que las decisiones aparecen de verdad. Como referencia, si tienes un sistema en marcha y una capa concreta te duele — los capítulos de transporte, de memoria y los de seguridad se sostienen por sí solos. O como material lateral para la revisión de arquitectura, donde los capítulos sirven de guion para la conversación que un equipo necesita tener antes de comprometerse con una topología de despliegue.

El recorrido de los 14 capítulos

30 de marzo — Capítulo 1: La crisis de integración de la IA y el auge de la arquitectura agéntica. Por qué los agentes monolíticos se deshilachan, qué es el problema de integración N por M y el paso de la ingeniería de prompts a la ingeniería de contexto.

31 de marzo — Capítulo 2: Desentrañando el Model Context Protocol. Qué estandariza MCP, los tres roles (Host, Cliente, Servidor), en qué se diferencia el descubrimiento dinámico de REST, y el ciclo de vida de la sesión con negociación de capacidades.

1 de abril — Capítulo 3: Primitivas del servidor: exponer contexto y capacidades. Recursos, Prompts y Herramientas — los tres sustantivos que un servidor puede ofrecer, sus esquemas, sus ciclos de vida y la disciplina de elegir la primitiva correcta para cada cosa.

2 de abril — Capítulo 4: Primitivas del cliente: Sampling, Roots, Elicitation. La superficie inversa — lo que el host devuelve al servidor — y las implicaciones de seguridad de cada capacidad entregada al otro lado de la frontera de confianza.

3 de abril — Capítulo 5: Transporte y descubrimiento. stdio frente a Streamable HTTP, cuándo elegir cada uno, y cómo servidores y clientes se encuentran en despliegues locales y remotos.

4 de abril — Capítulo 6: Patrones fundamentales de orquestación. El bucle del agente, el enrutado de herramientas, la gestión de estado intermedio y los patrones que mantienen legible el razonamiento del agente.

5 de abril — Capítulo 7: Patrones avanzados de orquestación. Planner-executor, coordinación multi-agente, descomposición jerárquica y dónde cada patrón se gana su complejidad.

6 de abril — Capítulo 8: Distribuciones de despliegue. Pureza estricta de MCP frente a Agentes de IA reutilizables frente a distribuciones híbridas, y los compromisos que cada una impone al host.

7 de abril — Capítulo 9: El presupuesto de atención. El contexto como recurso administrado, el coste de las ventanas largas, y las políticas que deciden qué entra en la vista del modelo en cada turno.

8 de abril — Capítulo 10: Memoria de horizonte largo. Memoria episódica frente a semántica, políticas de resumido, y las arquitecturas que permiten a un agente arrastrar estado a lo largo de días.

9 de abril — Capítulo 11: Superficies de ataque en sistemas MCP. El modelo de amenazas — inyección de prompt vía recursos, servidores maliciosos, envenenamiento de herramientas, vías de exfiltración.

10 de abril — Capítulo 12: Endurecimiento del protocolo. Server cards, UI de consentimiento, acotado de capacidades, y los controles operativos que colocan la política donde corresponde.

11 de abril — Capítulo 13: Frameworks y nube. El ecosistema alrededor de MCP — frameworks de agentes, servidores gestionados, registros — y cómo escoger sobre qué construir.

12 de abril — Capítulo 14: Benchmarking de agentes. Las métricas que importan, las que despistan, y cómo construir un arnés de evaluación que sobreviva a un cambio de modelo.

Vale la pena recordar: los Volúmenes I y II trataban del modelo. El Volumen III trataba del aparato de recuperación a su alrededor. Este trata de la capa de cognición — el protocolo, la orquestación, la memoria y la seguridad que convierten un modelo en algo capaz de actuar. La mayoría de los fallos de agentes no son fallos del modelo. Son decisiones tomadas una capa más arriba que ninguna ingeniería de prompts puede recuperar.

Sobre este libro y sobre la serie

La serie LLM Primer es la respuesta larga a la pregunta que me repetían ingenieros, fundadores y, ocasionalmente, algún regulador: ¿cómo funcionan en realidad estos sistemas y qué hace falta para construir uno que aguante carga? El Libro I dio la forma. El Libro II dio la matemática. El Libro III dio la arquitectura de producción de RAG. El Libro IV da la capa de cognición que se sitúa sobre el modelo. El Libro V, en preparación, se ocupa de construir aplicaciones LLM del mundo real de principio a fin.

¿Quieres el panorama completo ahora mismo? LLM Primer IV: Designing AI Cognition with MCP es el libro que esta serie está mapeando — con la referencia completa del protocolo, las recetas de orquestación, los checklists de seguridad y las plantillas de despliegue que el recorrido sólo esboza. Consúltalo en Amazon →

Nos vemos mañana, con el Capítulo 1.

LLM Primer IV — Introducción a la serie e índice