Introducción a LLM

Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.

Total de 19 artículos disponibles. | Actualmente en la página 1 de 1.

Capítulo 14 — Benchmarking, testing y rendimiento

Decimocuarta y última entrega del recorrido de LLM Primer IV. El MCP-Universe Benchmark sobre servidores reales, los dos modos de fallo sistémico que expuso, la brecha de diez veces en throughput entre sesión por petición y pools de sesión compartidos, y el puente al Volumen V.

2026-04-12

Capítulo 13 — Frameworks e integración con la nube

Decimotercera entrega del recorrido de LLM Primer IV. Strands con Bedrock, el patrón de capa de estado de AWS, el Microsoft Agent Framework, LangChain, Semantic Kernel — y las tres formas de integración de producción a las que los equipos llegan de forma independiente.

2026-04-11

Capítulo 12 — Endurecimiento del protocolo y defensas

Duodécima entrega del recorrido de LLM Primer IV. Los cuatro racimos de defensa — atestación criptográfica, disciplina de scopes OAuth con sesiones acotadas, sandboxing en tiempo de ejecución y puertas human-in-the-loop — se componen en una postura que no depende de que el modelo se comporte correctamente bajo condiciones adversarias.

2026-04-10

Capítulo 11 — Superficies de ataque y vulnerabilidades del protocolo

Undécima entrega del recorrido de LLM Primer IV. Los ataques clásicos adaptados a MCP — Confused Deputy, Token Passthrough, Session Hijacking — los defectos a nivel de protocolo de escalado de capacidades y sampling sin autenticar, y la propagación implícita de confianza que vuelve estructural y no de higiene el envenenamiento de contexto.

2026-04-09

Capítulo 10 — Memoria de tareas de horizonte largo

Décima entrega del recorrido de LLM Primer IV. Memoria a corto plazo mediante ventanas y scratchpads ReAct, memoria a largo plazo mediante vectores episódicos y almacenes semánticos, y las técnicas de compactación que mantienen productivo a un agente a lo largo de horas y días.

2026-04-08

Capítulo 9 — Administrando el presupuesto de atención

Novena entrega del recorrido de LLM Primer IV. Context rot, el acantilado de lost-in-the-middle, tool-loadout rot, y las tres respuestas arquitectónicas — MCP, RAG, fine-tuning — a la pregunta de dónde corresponde de verdad el conocimiento que le falta a un modelo.

2026-04-07

Capítulo 8 — Distribuciones arquitectónicas de despliegue

Octava entrega del recorrido de LLM Primer IV. Las tres distribuciones de despliegue que han emergido en el ecosistema MCP — agente reutilizable, pureza estricta, híbrida — y las cuatro restricciones vinculantes que determinan cuál encaja con cada proyecto.

2026-04-06

Capítulo 7 — Patrones colaborativos avanzados y dinámicos

Séptima entrega del recorrido de LLM Primer IV. Consenso en mesa redonda, enrutado por handoff y orquestación magéntica — los patrones que aparecen cuando la topología hay que construirla por petición, con los modos de fallo (no-terminación, mis-routing, planificación descontrolada) que los patrones más simples evitan.

2026-04-05

Capítulo 6 — Estrategias fundamentales de orquestación

Sexta entrega del recorrido de LLM Primer IV. Las dos formas fundacionales de orquestación — pipelines secuenciales y scatter-gather concurrente — y la pregunta previa que todo equipo debería hacerse: ¿es un sistema multi-agente la respuesta correcta?

2026-04-04

Capítulo 5 — Protocolos de transporte y descubrimiento

Quinta entrega del recorrido de LLM Primer IV. Los tres transportes que MCP soporta, la capa de descubrimiento .well-known con Server Cards, y las preocupaciones operativas aburridas — CORS, validación de Origin, caching — que deciden si un servidor es un ciudadano cooperativo de la red o un pasivo.

2026-04-03

Capítulo 4 — Primitivas del cliente: comportamientos agénticos y control

Cuarta entrega del recorrido de LLM Primer IV. Sampling, Roots y Elicitation son los tres pequeños agujeros controlados que MCP abre en el muro host-servidor — cada uno una capacidad otorgada de vuelta, cada uno un riesgo aceptado en nombre del usuario.

2026-04-02

Capítulo 3 — Primitivas del servidor: exponer contexto y capacidades

Tercera entrega del recorrido de LLM Primer IV. Los tres sustantivos que un servidor MCP puede ofrecer — Recursos (estado de lectura), Prompts (andamiajes reutilizables), Herramientas (acciones de escritura) — sus esquemas, sus ciclos de vida, sus modelos de error y la disciplina de elegir la primitiva correcta.

2026-04-01

Capítulo 2 — Desentrañando el Model Context Protocol (MCP)

Segunda entrega del recorrido de LLM Primer IV. Qué estandariza MCP de verdad, la división en tres roles Host, Cliente y Servidor, por qué el descubrimiento dinámico y la mensajería bidireccional se diferencian de REST en los casos que importan, y el ciclo de vida de la sesión que abre con negociación de capacidades.

2026-03-31

Capítulo 1 — La crisis de integración de la IA y el auge de la arquitectura agéntica

Primera entrega del recorrido de LLM Primer IV. Por qué los agentes monolíticos se deshilachan al crecer el system prompt, el problema de integración N por M que se esconde debajo, y el paso de la ingeniería de prompts a la ingeniería de contexto que MCP vino a habilitar.

2026-03-30

LLM Primer IV — Introducción a la serie e índice

Apertura del recorrido capítulo a capítulo del Libro IV de la serie LLM Primer — Diseñando la cognición de la IA con MCP. Por qué los agentes necesitan una capa de protocolo para escalar más allá de la demo, para quién está escrito, y el calendario de los catorce posts que siguen, del 30 de marzo al 12 de abril.

2026-03-29

Capítulo 11 — Actualizaciones continuas y optimización de la pipeline

Undécima y última entrega del recorrido de LLM Primer III. CDC e indexación incremental mantienen el corpus fresco, la caché semántica y la estratificación de modelos mantienen baja la latencia, y un bucle de feedback de cuatro etapas cierra la distancia entre lo que la producción le dice al equipo y lo que el equipo realmente cambia — más un puente al Volumen IV sobre Model Context Protocol.

2026-03-28

LLM Primer III — Introducción a la serie e índice

Inicio del recorrido capítulo por capítulo del Libro III de la serie LLM Primer — Mejorando la IA empresarial con RAG. Por qué la generación aumentada por recuperación parece simple desde fuera y por dentro es una pila de disciplinas, para quién está escrito el libro y el calendario de las once entregas que siguen, del 18 al 28 de marzo.

2026-03-17

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.

2026-02-17

La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

La Serie LLM Primer — una guía de campo en siete volúmenes sobre IA generativa por Sho Shimoda. Cada volumen cubre una capa distinta del trabajo con modelos de lenguaje grandes, desde los fundamentos hasta el escalado y la seguridad. Esta es la página principal: una visión general de toda la serie, más el recorrido capítulo por capítulo en vivo de los primeros volúmenes.

2026-02-15