Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 14 — Benchmarking, testing y rendimiento
Decimocuarta y última entrega del recorrido de LLM Primer IV. El MCP-Universe Benchmark sobre servidores reales, los dos modos de fallo sistémico que expuso, la brecha de diez veces en throughput entre sesión por petición y pools de sesión compartidos, y el puente al Volumen V.
2026-04-12Capítulo 10 — Memoria de tareas de horizonte largo
Décima entrega del recorrido de LLM Primer IV. Memoria a corto plazo mediante ventanas y scratchpads ReAct, memoria a largo plazo mediante vectores episódicos y almacenes semánticos, y las técnicas de compactación que mantienen productivo a un agente a lo largo de horas y días.
2026-04-08Capítulo 9 — Administrando el presupuesto de atención
Novena entrega del recorrido de LLM Primer IV. Context rot, el acantilado de lost-in-the-middle, tool-loadout rot, y las tres respuestas arquitectónicas — MCP, RAG, fine-tuning — a la pregunta de dónde corresponde de verdad el conocimiento que le falta a un modelo.
2026-04-07Capítulo 6 — Estrategias fundamentales de orquestación
Sexta entrega del recorrido de LLM Primer IV. Las dos formas fundacionales de orquestación — pipelines secuenciales y scatter-gather concurrente — y la pregunta previa que todo equipo debería hacerse: ¿es un sistema multi-agente la respuesta correcta?
2026-04-04Capítulo 4 — Primitivas del cliente: comportamientos agénticos y control
Cuarta entrega del recorrido de LLM Primer IV. Sampling, Roots y Elicitation son los tres pequeños agujeros controlados que MCP abre en el muro host-servidor — cada uno una capacidad otorgada de vuelta, cada uno un riesgo aceptado en nombre del usuario.
2026-04-02Capítulo 3 — Primitivas del servidor: exponer contexto y capacidades
Tercera entrega del recorrido de LLM Primer IV. Los tres sustantivos que un servidor MCP puede ofrecer — Recursos (estado de lectura), Prompts (andamiajes reutilizables), Herramientas (acciones de escritura) — sus esquemas, sus ciclos de vida, sus modelos de error y la disciplina de elegir la primitiva correcta.
2026-04-01Capítulo 2 — Desentrañando el Model Context Protocol (MCP)
Segunda entrega del recorrido de LLM Primer IV. Qué estandariza MCP de verdad, la división en tres roles Host, Cliente y Servidor, por qué el descubrimiento dinámico y la mensajería bidireccional se diferencian de REST en los casos que importan, y el ciclo de vida de la sesión que abre con negociación de capacidades.
2026-03-31Capítulo 1 — La crisis de integración de la IA y el auge de la arquitectura agéntica
Primera entrega del recorrido de LLM Primer IV. Por qué los agentes monolíticos se deshilachan al crecer el system prompt, el problema de integración N por M que se esconde debajo, y el paso de la ingeniería de prompts a la ingeniería de contexto que MCP vino a habilitar.
2026-03-30LLM Primer IV — Introducción a la serie e índice
Apertura del recorrido capítulo a capítulo del Libro IV de la serie LLM Primer — Diseñando la cognición de la IA con MCP. Por qué los agentes necesitan una capa de protocolo para escalar más allá de la demo, para quién está escrito, y el calendario de los catorce posts que siguen, del 30 de marzo al 12 de abril.
2026-03-29Capítulo 10 — Frameworks de evaluación líderes
Décima entrega del recorrido de LLM Primer III. Una guía de campo sobre los frameworks que convierten la tríada de evaluación en algo que un equipo puede correr de verdad — RAGAS, TruLens, DeepEval por un lado, Braintrust, LangSmith, Phoenix, Galileo, Opik por el otro, y el Hueco de Evaluación que ninguno ha cerrado aún.
2026-03-27Capítulo 9 — La tríada de evaluación de RAG
Novena entrega del recorrido de LLM Primer III. Un sistema RAG puede fallar en tres lugares distintos y los fallos parecen idénticos desde fuera — la tríada de evaluación de Relevancia del Contexto, Fidelidad y Relevancia de la Respuesta es el pequeño vocabulario que evita arreglar un bug mientras se mide otro.
2026-03-26Capítulo 6 — Modelos de amenazas y vulnerabilidades en RAG
Sexta entrega del recorrido de LLM Primer III. La superficie de ataque ampliada de la recuperación — envenenamiento del corpus, chunks adversariales, inyección indirecta de prompts, inversión de embeddings y el problema del confused deputy en RAG agéntico. Ataques concretos, todos demostrados, todos reproducibles.
2026-03-23Capítulo 5 — Arquitectura de la pipeline de recuperación
Quinta entrega del recorrido de LLM Primer III. Por qué una sola búsqueda vectorial no es una pipeline — recuperación híbrida, reciprocal rank fusion, reranking con cross-encoder y reescritura y HyDE en el lado de la consulta — ensamblado en la arquitectura de producción hacia la que convergen los sistemas RAG maduros.
2026-03-22Capítulo 2 — Parsing inteligente de documentos
Segunda entrega del recorrido de LLM Primer III. Por qué un PDF no es un fichero de texto, qué preserva en realidad un parser consciente del layout, el panorama actual de herramientas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) y la vía multimodal que recupera directamente sobre imágenes de página.
2026-03-19LLM Primer III — Introducción a la serie e índice
Inicio del recorrido capítulo por capítulo del Libro III de la serie LLM Primer — Mejorando la IA empresarial con RAG. Por qué la generación aumentada por recuperación parece simple desde fuera y por dentro es una pila de disciplinas, para quién está escrito el libro y el calendario de las once entregas que siguen, del 18 al 28 de marzo.
2026-03-17Capítulo 10 — Seguridad, ética y confianza: más allá del marketing
Capítulo 10 de la serie LLM Primer I. La imagen honesta de la seguridad de los LLM — por qué las alucinaciones ocurren mecánicamente, dónde realmente vive el sesgo, cómo funcionan las barreras en capas y por qué la gobernanza es la capa institucional que los controles técnicos no pueden reemplazar. Para profesionales que necesitan desplegar de forma segura.
2026-02-27Capítulo 9 — Rendimiento, escalado y costos: los compromisos reales de ingeniería
Capítulo 9 de la serie LLM Primer I. Las realidades operativas de ejecutar LLM a escala — tamaño del modelo vs capacidad, el compromiso latencia–throughput, economía de costos, cuantización y despliegue en el borde. Por qué los modelos de frontera son a menudo la elección equivocada incluso cuando puedes permitírtelos.
2026-02-26Capítulo 7 — Más allá de la predicción del siguiente token: embeddings, recuperación y multimodalidad
Capítulo 7 de la serie LLM Primer I. Las capacidades que convierten a un predictor del siguiente token en algo mucho más — embeddings, búsqueda semántica, generación aumentada con recuperación y la transición a entradas multimodales. Cómo RAG realmente mantiene un LLM anclado en documentos reales en lugar de inventar.
2026-02-24Capítulo 6 — Ajuste fino y adaptación: del modelo crudo al asistente útil
Capítulo 6 de la serie LLM Primer I. La pila completa de adaptación — desde el direccionamiento barato basado en prompts, pasando por el ajuste fino eficiente en parámetros, hasta la alineación completa con RLHF y sus sucesores modernos como DPO. Por qué el post-entrenamiento es ahora donde las APIs de modelos cerrados realmente se diferencian.
2026-02-23Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice
Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.
2026-02-17La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen
La Serie LLM Primer — una guía de campo en siete volúmenes sobre IA generativa por Sho Shimoda. Cada volumen cubre una capa distinta del trabajo con modelos de lenguaje grandes, desde los fundamentos hasta el escalado y la seguridad. Esta es la página principal: una visión general de toda la serie, más el recorrido capítulo por capítulo en vivo de los primeros volúmenes.
2026-02-15