La Serie LLM Primer
Una guía de campo de la IA generativa, construida volumen a volumen. Siete libros, cada uno enfocado en una capa distinta del trabajo con modelos de lenguaje grandes — de los fundamentos al escalado, pasando por las matemáticas, la recuperación, el diseño de la cognición, la ingeniería de producción y la seguridad.
De qué trata esta serie
La Serie LLM Primer es un tratamiento estructurado y centrado en mecanismos sobre los modelos de lenguaje grandes — escrito para ingenieros, gerentes técnicos de producto, profesionales curiosos y cualquier persona dispuesta a leer con atención. Cada volumen aborda una parte distinta del campo en profundidad, conservando la precisión técnica y manteniendo las explicaciones lo bastante claras como para que puedan utilizarse.
La serie está diseñada para funcionar de dos maneras. Puedes leer el Volumen I como una base completa y detenerte ahí. O puedes seguir el recorrido completo — fundamentos, matemáticas, recuperación, diseño de la cognición, ingeniería de producción, escalado y seguridad — y terminar con un conocimiento integral y práctico de cómo construir con LLM de forma responsable.
Todos los volúmenes están escritos por Sho Shimoda, CTO de Receipt Roller Inc., que construye y opera sistemas de IA en producción y escribe sobre ellos en un lenguaje lo bastante claro para que cualquiera pueda seguirlo.
Para quién es: ingenieros y arquitectos que buscan una comprensión duradera. Gerentes de producto y ejecutivos que tienen que decidir qué IA construir. Profesionales curiosos y estudiantes que quieren entender la tecnología detrás de los titulares. La serie está escrita de modo que no necesitas formación matemática para leerla, pero conserva suficiente precisión técnica para que un ingeniero experimentado no pierda el tiempo.
Cómo leer esta página
Cada volumen, más abajo, lista su tabla de contenidos completa, organizada por Parte. Publicaremos un artículo capítulo por capítulo para cada capítulo de la serie. Los capítulos que ya tienen un recorrido aparecen enlazados; los que aún no se han publicado figuran en texto plano.
Los apéndices se listan por transparencia, pero son contenido exclusivo del libro — material de referencia, hojas de cálculo, ejercicios con soluciones y otros bloques que pertenecen al final del libro y no a un recorrido independiente. Para acceder a los apéndices, hay que leer el libro.
Los siete volúmenes
Volumen I — Cómo funciona la IA generativa
Una guía clara y práctica sobre los fundamentos de los modelos de lenguaje grandes.
La rampa de entrada en lenguaje llano a toda la serie. Partiendo de cero — tokens, entrenamiento y el simple acto de predecir la siguiente palabra — construye una imagen honesta y sin jerga de qué es un modelo de lenguaje grande, cómo se entrena y por qué se comporta como lo hace, sin asumir ningún conocimiento previo. Es el cimiento sobre el que se apoyan todos los volúmenes siguientes.
Léelo en Amazon: LLM Primer I — How Generative AI Works
|
|
Introducción a la serie: Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice
Parte I — Conceptos y fundamentos
Parte II — Cómo funcionan los LLM
Parte III — Perspectivas prácticas
Parte IV — Temas avanzados
Apéndices (solo en el libro)
| A — | Glosario LLM |
| B — | Matemáticas detrás de la atención |
| C — | Hoja de referencia de prompting |
| D — | Herramientas y bibliotecas |
| E — | Lecturas recomendadas |
Volumen II — Modelos de lenguaje a través de las matemáticas
Explorando el funcionamiento interno de la IA con visión matemática.
Un recorrido matemáticamente riguroso pero legible por el funcionamiento interno de la IA: atención, dinámica de optimización, paisajes de pérdida y comportamiento al escalar, explicados a través de las matemáticas que los sostienen. Toda ecuación que importa se deriva por completo — cada una envuelta en una historia, una analogía y un ejemplo numérico trabajado. Para lectores que quieren las matemáticas que el primer volumen mantiene en sus recuadros.
Léelo en Amazon: LLM Primer II — Language Models Through Mathematics
|
|
Introducción a la serie: Un recorrido capítulo por capítulo de LLM Primer II — Introducción a la serie e índice
Parte I — Intuición matemática
Parte II — Anatomía de un Transformer
Parte III — Entrenamiento, alineación y evaluación
Parte IV — Aplicaciones, límites y práctica
Apéndices (solo en el libro)
| Hoja de referencia matemática del LLM |
| Una perspectiva estadística de los LLM |
| Preguntas que la gente hace |
| Derivaciones trabajadas |
| Ejercicios con soluciones |
| Índice de símbolos |
| Una pasada hacia adelante completa, en números |
| Una cronología de las ideas |
Volumen III — Potenciando la IA empresarial con RAG
Una guía práctica para construir sistemas de generación aumentada con recuperación para la empresa.
Generación aumentada con recuperación, en términos prácticos — bases de datos vectoriales, estrategias de fragmentación y la arquitectura de anclar un modelo en tus propios documentos para obtener respuestas empresariales fiables y al día. El volumen para leer si tu trabajo es lanzar funciones de IA que tienen que mantenerse actualizadas y citar sus fuentes.
|
|
Parte I — Fundamentos de RAG
| Capítulo 1 — | La evolución de la arquitectura RAG |
Parte II — Ingesta, parsing y fragmentación
| Capítulo 2 — | Parsing inteligente de documentos |
| Capítulo 3 — | Marcos avanzados de fragmentación |
Parte III — Bases de datos vectoriales y optimización de la recuperación
| Capítulo 4 — | Eligiendo la base de datos vectorial adecuada |
| Capítulo 5 — | Arquitectando la tubería de recuperación |
Parte IV — Seguridad, privacidad y control de acceso
| Capítulo 6 — | Modelos de amenazas y vulnerabilidades de RAG |
| Capítulo 7 — | Implementando control de acceso |
| Capítulo 8 — | Anonimización de datos en la tubería RAG |
Parte V — Evaluación, monitoreo y mantenimiento
| Capítulo 9 — | La tríada de evaluación de RAG |
| Capítulo 10 — | Marcos líderes de evaluación |
| Capítulo 11 — | Actualizaciones continuas y optimización de la tubería |
Apéndices (solo en el libro)
| A — | Fórmulas matemáticas esenciales para optimizar RAG |
| B — | Prompts de sistema de ejemplo para anonimización y evaluación |
| C — | Matrices de decisión de bases de datos vectoriales y herramientas |
| D — | Conjuntos de datos de referencia para evaluar RAG |
Volumen IV — Diseñando la cognición de la IA con MCP
Ingeniería del contexto, las herramientas y la memoria para agentes de IA fiables.
Modelado estructurado del contexto y orquestación: cómo dar forma al razonamiento del modelo a través de la ingeniería del contexto y las situaciones que ve, en vez de modificar el modelo mismo. El volumen a leer si estás construyendo sistemas agénticos — inventarios de herramientas, bucles de larga duración, memoria entre sesiones y la disciplina de diseñar lo que el modelo puede mirar.
|
|
Parte I — El cambio de paradigma en la integración con IA
| Capítulo 1 — | La crisis de la integración con IA y el auge de la arquitectura agéntica |
| Capítulo 2 — | Presentando el Model Context Protocol (MCP) |
Parte II — Mecánica central del MCP
| Capítulo 3 — | Primitivas del servidor — exponiendo contexto y capacidades |
| Capítulo 4 — | Primitivas del cliente — comportamientos agénticos y control |
| Capítulo 5 — | Protocolos de transporte y descubrimiento |
Parte III — Patrones de orquestación multi-agente
| Capítulo 6 — | Estrategias fundamentales de orquestación |
| Capítulo 7 — | Patrones colaborativos y dinámicos avanzados |
| Capítulo 8 — | Diseños arquitectónicos de despliegue |
Parte IV — Diseñando la cognición: contexto y memoria
| Capítulo 9 — | Gestionando el presupuesto de atención |
| Capítulo 10 — | Memoria para tareas de largo horizonte |
Parte V — Asegurando los flujos agénticos
| Capítulo 11 — | Superficies de ataque y vulnerabilidades del protocolo |
| Capítulo 12 — | Endurecimiento del protocolo y defensas |
Parte VI — Ingeniería de producción y escala
| Capítulo 13 — | Marcos e integración en la nube |
| Capítulo 14 — | Benchmarking, pruebas y rendimiento |
Apéndices (solo en el libro)
| A — | Referencia rápida y hoja de chuletas de MCP |
| B — | Planos de implementación y ejemplos de código |
| C — | Checklists de preparación para producción y seguridad |
| D — | Especificaciones avanzadas y propuestas de mejora del estándar (SEPs) |
| E — | Benchmarks y datos de rendimiento |
| F — | Recursos oficiales y enlaces al ecosistema |
Volumen V — Construyendo aplicaciones LLM del mundo real
Diseñando, evaluando y operando sistemas LLM en producción.
Una guía centrada en sistemas, del prototipo a la producción — diseño de APIs, bucles de evaluación, monitoreo e integración — para convertir un modelo capaz en un producto fiable. El volumen que convierte la comprensión arquitectónica en servicios desplegados con usuarios reales encima.
|
|
Parte I — Fundamentos de la ingeniería de IA
| Capítulo 1 — | La disciplina de la ingeniería de IA |
| Capítulo 2 — | Modelos fundacionales e ingeniería de prompts |
Parte II — Construyendo capacidades agénticas y de recuperación
| Capítulo 3 — | Generación aumentada con recuperación (RAG) |
| Capítulo 4 — | Agentes de IA y llamada a herramientas |
Parte III — Aseguramiento de calidad y observabilidad
| Capítulo 5 — | Evaluando aplicaciones LLM |
| Capítulo 6 — | Observabilidad y trazabilidad de IA |
Parte IV — Seguridad, escala y optimización
| Capítulo 7 — | Seguridad de LLM y guardrails |
| Capítulo 8 — | Optimización de rendimiento, serving y coste |
Apéndices (solo en el libro)
| A — | Checklists de preparación para producción y seguridad |
| B — | Matrices de selección de herramientas y marcos |
| C — | Protocolos, streaming y salidas estructuradas |
| D — | Arquitectura de limitación de tasa y gestión de costes |
| E — | Glosario de métricas y términos de ingeniería de IA |
Volumen VI — Escalando sistemas de IA
Arquitectando inferencia LLM de baja latencia para escala de producción.
Arquitectando inferencia de alto rendimiento: serving distribuido, optimización de latencia y modelado de costes para sistemas que tienen que responder millones de veces al día. El volumen a leer cuando tu sistema de IA ha crecido más allá de un solo servidor y ahora necesita comportarse como una pieza real de infraestructura.
|
|
Parte I — Fundamentos de la inferencia LLM
| Capítulo 1 — | La mecánica de la generación de tokens |
| Capítulo 2 — | El reto de la caché clave-valor (KV) |
Parte II — El sustrato de hardware
| Capítulo 3 — | GPUs de data center para IA generativa |
| Capítulo 4 — | Silicio especializado de IA y ASICs |
Parte III — Optimización a nivel de modelo (compresión)
| Capítulo 5 — | Desmitificando la cuantización |
| Capítulo 6 — | Pruning y destilación de conocimiento |
Parte IV — Optimizaciones a nivel de sistema y motor
| Capítulo 7 — | Estrategias avanzadas de batching |
| Capítulo 8 — | Gestión de próxima generación de la caché KV |
| Capítulo 9 — | Decodificación especulativa |
Parte V — Frameworks de serving y orquestación
| Capítulo 10 — | La capa del motor LLM |
| Capítulo 11 — | La capa de plataforma y orquestación |
| Capítulo 12 — | Serving desagregado y Kubernetes |
| Capítulo 13 — | Autoscaling y mitigación del cold-start |
Parte VI — Economía a nivel de aplicación y TCO
| Capítulo 14 — | Economía de tokens y precios de API |
| Capítulo 15 — | APIs serverless frente a infraestructura dedicada |
| Capítulo 16 — | Estrategias de reducción de costes en producción |
Apéndices (solo en el libro)
| A — | Referencia de fórmulas matemáticas y modelado de costes |
| B — | Guía de especificaciones de hardware y aceleradores |
| C — | Configuraciones de despliegue y fragmentos de código |
| D — | Metodología de benchmarking y definiciones de métricas |
Volumen VII — Seguridad de la IA
Defendiendo sistemas LLM frente a inyección de prompts, jailbreaks y amenazas adversariales.
Diseñando IA segura y robusta: riesgos adversariales, inyección de prompts, marcos de gobernanza y diseño defensivo para sistemas desplegados en el mundo real. El volumen a leer cuando tu sistema de IA tiene que tratarse como infraestructura relevante para la seguridad.
|
|
Parte I — Fundamentos de la seguridad de IA
| Capítulo 1 — | Por qué la seguridad de IA es diferente |
| Capítulo 2 — | Modelado de amenazas para sistemas LLM |
| Capítulo 3 — | Seguridad de datos y privacidad |
Parte II — Seguridad de prompts e interacción
| Capítulo 4 — | Inyección de prompts y jailbreaks |
| Capítulo 5 — | Validación de entradas y filtrado de salidas |
| Capítulo 6 — | Riesgos de la generación aumentada con recuperación |
Parte III — Robustez y fiabilidad del modelo
| Capítulo 7 — | Alucinaciones y fiabilidad |
| Capítulo 8 — | Ataques adversariales sobre modelos |
| Capítulo 9 — | Integridad del modelo y riesgos de la cadena de suministro |
Parte IV — Arquitectura de seguridad a nivel de sistema
| Capítulo 10 — | Diseñando arquitecturas LLM seguras |
| Capítulo 11 — | Observabilidad, logging y respuesta a incidentes |
| Capítulo 12 — | Control de acceso e identidad |
Parte V — Gobernanza, ética y cumplimiento
| Capítulo 13 — | Panorama regulatorio |
| Capítulo 14 — | Sesgo, equidad e IA responsable |
| Capítulo 15 — | Construyendo una organización de IA segura |
Parte VI — Temas avanzados
| Capítulo 16 — | Ajuste fino seguro y adaptación |
| Capítulo 17 — | Amenazas futuras y defensas emergentes |
Apéndices (solo en el libro)
| A — | Checklist de seguridad de IA para sistemas en producción |
| B — | Plantilla de modelo de amenazas de ejemplo |
| C — | Patrones de diseño de prompts seguros |
| D — | Plantilla de respuesta a incidentes para aplicaciones LLM |
| E — | Herramientas y marcos recomendados |
Cómo crece esta página
Esta página se actualizará a medida que se publique cada volumen de la serie y a medida que vayan saliendo los artículos del recorrido por cada capítulo. Los Volúmenes III a VII tienen ya sus tablas de contenidos completas más arriba; los artículos del recorrido para esos capítulos se irán añadiendo conforme se escriban.
Marca esta página como favorita si quieres seguir la serie a medida que se desarrolla. O suscríbete al feed del canal para recibir cada nueva entrada el día que se publique.
Empieza con el Volumen I. Doce capítulos, totalmente revisados para 2026, con diagramas, recuadros en lenguaje sencillo, ejemplos de código y un tratamiento completo de cómo funciona realmente la IA generativa.
Consigue LLM Primer I en Amazon →
Después profundiza con el Volumen II. Las matemáticas que sostienen la maquinaria — atención, dinámica de optimización, paisajes de pérdida y comportamiento al escalar, derivadas con cuidado y envueltas en historia y ejemplos numéricos.
Consigue LLM Primer II en Amazon →