La Serie LLM Primer

Una guía de campo de siete volúmenes sobre IA generativa por Sho Shimoda, ahora completa.

De qué trata esta serie

La Serie LLM Primer es un tratamiento estructurado y centrado en mecanismos sobre los modelos de lenguaje grandes — escrito para ingenieros, gerentes técnicos de producto, profesionales curiosos y cualquier persona dispuesta a leer con atención. Los siete volúmenes están publicados. Juntos cubren el terreno completo del trabajo con LLM: fundamentos, matemáticas, recuperación, diseño de la cognición, ingeniería de aplicaciones, escalado en producción y seguridad.

La serie está diseñada para funcionar de dos maneras. Puedes leer el Volumen I como una base completa y detenerte ahí. O puedes seguir el recorrido completo — de los fundamentos hasta la seguridad — y terminar con un conocimiento integral y práctico de cómo construir con LLM de forma responsable. Un volumen hermano, Physical AI, extiende el mapa hacia los sistemas incorporados y la robótica; se describe más abajo.

Todos los volúmenes están escritos por Sho Shimoda, CTO de Receipt Roller Inc., que construye y opera sistemas de IA en producción y escribe sobre ellos en un lenguaje lo bastante claro para que cualquiera pueda seguirlo.

Para quién es: ingenieros y arquitectos que buscan una comprensión duradera. Gerentes de producto y ejecutivos que tienen que decidir qué IA construir. Profesionales curiosos y estudiantes que quieren entender la tecnología detrás de los titulares. La serie está escrita de modo que no necesitas formación matemática para leerla, pero conserva suficiente precisión técnica para que un ingeniero experimentado no pierda el tiempo.

Cómo leer esta página

Cada volumen, más abajo, lista su tabla de contenidos completa, organizada por Parte. Cada capítulo enlaza a un recorrido en línea que puedes leer libremente. El libro completo — con las cápsulas In Plain English, los ejercicios trabajados, las derivaciones y los apéndices — está disponible en Amazon; cada sección de volumen incluye el enlace directo.

Los apéndices se listan por transparencia, pero son contenido exclusivo del libro — material de referencia, hojas de cálculo, ejercicios con soluciones y otros bloques que pertenecen al final del libro y no a un recorrido independiente. Para acceder a los apéndices, hay que leer el libro.

Los siete volúmenes

Volumen I — Cómo funciona la IA generativa

Una guía clara y práctica sobre los fundamentos de los modelos de lenguaje grandes.

La rampa de entrada en lenguaje llano a toda la serie. Partiendo de cero — tokens, entrenamiento y el simple acto de predecir la siguiente palabra — construye una imagen honesta y sin jerga de qué es un modelo de lenguaje grande, cómo se entrena y por qué se comporta como lo hace, sin asumir ningún conocimiento previo. Es el cimiento sobre el que se apoyan todos los volúmenes siguientes.

LLM Primer I — Cómo funciona la IA generativa

Disponible ahora en Amazon. Ver LLM Primer I en Amazon →

Introducción a la serie: Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Parte I — Conceptos y fundamentos

Capítulo 1 —	¿Qué es un modelo de lenguaje grande?
Capítulo 2 —	Probabilidad, tokens y texto
Capítulo 3 —	Redes neuronales para el lenguaje

Parte II — Cómo funcionan los LLM

Capítulo 4 —	La arquitectura Transformer
Capítulo 5 —	Entrenando modelos grandes
Capítulo 6 —	Ajuste fino y adaptación
Capítulo 7 —	Más allá de la predicción del siguiente token

Parte III — Perspectivas prácticas

Capítulo 8 —	Usando LLM en aplicaciones
Capítulo 9 —	Rendimiento, escalado y costos
Capítulo 10 —	Seguridad, ética y confianza

Parte IV — Temas avanzados

Capítulo 11 —	Investigación de vanguardia
Capítulo 12 —	Construyendo tu propio sistema LLM

Apéndices (solo en el libro)

A —	Glosario LLM
B —	Matemáticas detrás de la atención
C —	Hoja de referencia de prompting

D —	Herramientas y bibliotecas
E —	Lecturas recomendadas

Volumen II — Modelos de lenguaje a través de las matemáticas

Explorando el funcionamiento interno de la IA con visión matemática.

Un recorrido matemáticamente riguroso pero legible por el funcionamiento interno de la IA: atención, dinámica de optimización, paisajes de pérdida y comportamiento al escalar, explicados a través de las matemáticas que los sostienen. Toda ecuación que importa se deriva por completo — cada una envuelta en una historia, una analogía y un ejemplo numérico trabajado. Para lectores que quieren las matemáticas que el primer volumen mantiene en sus recuadros.

LLM Primer II — Modelos de lenguaje a través de las matemáticas

Disponible ahora en Amazon. Ver LLM Primer II en Amazon →

Introducción a la serie: Un recorrido capítulo por capítulo de LLM Primer II — Introducción a la serie e índice

Parte I — Intuición matemática

Capítulo 1 —	Intuición matemática para los modelos de lenguaje
Capítulo 2 —	Los LLM en contexto
Capítulo 3 —	Herramientas matemáticas

Parte II — Anatomía de un Transformer

Capítulo 4 —	Atención
Capítulo 5 —	Posición, orden y estructura de la secuencia
Capítulo 6 —	Bloques del Transformer
Capítulo 7 —	Eficiencia y variantes del Transformer

Parte III — Entrenamiento, alineación y evaluación

Capítulo 8 —	Cómo aprenden los modelos
Capítulo 9 —	Entrenamiento a escala
Capítulo 10 —	Matemáticas del post-entrenamiento y la alineación
Capítulo 11 —	Evaluación, calibración e inferencia

Parte IV — Aplicaciones, límites y práctica

Capítulo 12 —	Aplicaciones de los LLM en el mundo real
Capítulo 13 —	Limitaciones, riesgos y desafíos abiertos
Capítulo 14 —	Conocimiento práctico para ingenieros

Apéndices (solo en el libro)

Hoja de referencia matemática del LLM

Una perspectiva estadística de los LLM

Preguntas que la gente hace

Derivaciones trabajadas

Ejercicios con soluciones

Índice de símbolos

Una pasada hacia adelante completa, en números

Una cronología de las ideas

Volumen III — Potenciando la IA empresarial con RAG

Una guía práctica para construir sistemas de generación aumentada con recuperación para la empresa.

Generación aumentada con recuperación, en términos prácticos — bases de datos vectoriales, estrategias de fragmentación y la arquitectura de anclar un modelo en tus propios documentos para obtener respuestas empresariales fiables y al día. El volumen para leer si tu trabajo es lanzar funciones de IA que tienen que mantenerse actualizadas y citar sus fuentes.

LLM Primer III — Potenciando la IA empresarial con RAG

Disponible ahora en Amazon. Ver LLM Primer III en Amazon →

Introducción a la serie: LLM Primer III — Introducción de la serie e índice

Parte I — Fundamentos de RAG

Capítulo 1 —

La evolución de la arquitectura RAG

Parte II — Ingesta, parsing y fragmentación

Capítulo 2 —	Parsing inteligente de documentos
Capítulo 3 —	Marcos avanzados de fragmentación

Parte III — Bases de datos vectoriales y optimización de la recuperación

Capítulo 4 —	Eligiendo la base de datos vectorial adecuada
Capítulo 5 —	Arquitectando la tubería de recuperación

Parte IV — Seguridad, privacidad y control de acceso

Capítulo 6 —	Modelos de amenazas y vulnerabilidades de RAG
Capítulo 7 —	Implementando control de acceso
Capítulo 8 —	Anonimización de datos en la tubería RAG

Parte V — Evaluación, monitoreo y mantenimiento

Capítulo 9 —	La tríada de evaluación de RAG
Capítulo 10 —	Marcos líderes de evaluación
Capítulo 11 —	Actualizaciones continuas y optimización de la tubería

Apéndices (solo en el libro)

A —	Fórmulas matemáticas esenciales para optimizar RAG
B —	Prompts de sistema de ejemplo para anonimización y evaluación

C —	Matrices de decisión de bases de datos vectoriales y herramientas
D —	Conjuntos de datos de referencia para evaluar RAG

Volumen IV — Diseñando la cognición de la IA con MCP

Ingeniería del contexto, las herramientas y la memoria para agentes de IA fiables.

Modelado estructurado del contexto y orquestación: cómo dar forma al razonamiento del modelo a través de la ingeniería del contexto y las situaciones que ve, en vez de modificar el modelo mismo. El volumen a leer si estás construyendo sistemas agénticos — inventarios de herramientas, bucles de larga duración, memoria entre sesiones y la disciplina de diseñar lo que el modelo puede mirar.

LLM Primer IV — Diseñando la cognición de la IA con MCP

Disponible ahora en Amazon. Ver LLM Primer IV en Amazon →

Introducción a la serie: LLM Primer IV — Introducción de la serie e índice

Parte I — El cambio de paradigma en la integración con IA

Capítulo 1 —	La crisis de la integración con IA y el auge de la arquitectura agéntica
Capítulo 2 —	Presentando el Model Context Protocol (MCP)

Parte II — Mecánica central del MCP

Capítulo 3 —	Primitivas del servidor — exponiendo contexto y capacidades
Capítulo 4 —	Primitivas del cliente — comportamientos agénticos y control
Capítulo 5 —	Protocolos de transporte y descubrimiento

Parte III — Patrones de orquestación multi-agente

Capítulo 6 —	Estrategias fundamentales de orquestación
Capítulo 7 —	Patrones colaborativos y dinámicos avanzados
Capítulo 8 —	Diseños arquitectónicos de despliegue

Parte IV — Diseñando la cognición: contexto y memoria

Capítulo 9 —	Gestionando el presupuesto de atención
Capítulo 10 —	Memoria para tareas de largo horizonte

Parte V — Asegurando los flujos agénticos

Capítulo 11 —	Superficies de ataque y vulnerabilidades del protocolo
Capítulo 12 —	Endurecimiento del protocolo y defensas

Parte VI — Ingeniería de producción y escala

Capítulo 13 —	Marcos e integración en la nube
Capítulo 14 —	Benchmarking, pruebas y rendimiento

Apéndices (solo en el libro)

A —	Referencia rápida y hoja de chuletas de MCP
B —	Planos de implementación y ejemplos de código
C —	Checklists de preparación para producción y seguridad

D —	Especificaciones avanzadas y propuestas de mejora del estándar (SEPs)
E —	Benchmarks y datos de rendimiento
F —	Recursos oficiales y enlaces al ecosistema

Volumen V — Construyendo aplicaciones LLM del mundo real

Diseñando, evaluando y operando sistemas LLM en producción.

Una guía centrada en sistemas, del prototipo a la producción — diseño de APIs, bucles de evaluación, monitoreo e integración — para convertir un modelo capaz en un producto fiable. El volumen que convierte la comprensión arquitectónica en servicios desplegados con usuarios reales encima.

LLM Primer V — Construyendo aplicaciones LLM del mundo real

Disponible ahora en Amazon. Ver LLM Primer V en Amazon →

Introducción a la serie: LLM Primer V — Introducción de la serie e índice

Parte I — Fundamentos de la ingeniería de IA

Capítulo 1 —	La disciplina de la ingeniería de IA
Capítulo 2 —	Modelos fundacionales e ingeniería de prompts

Parte II — Construyendo capacidades agénticas y de recuperación

Capítulo 3 —	Generación aumentada con recuperación (RAG)
Capítulo 4 —	Agentes de IA y llamada a herramientas

Parte III — Aseguramiento de calidad y observabilidad

Capítulo 5 —	Evaluando aplicaciones LLM
Capítulo 6 —	Observabilidad y trazabilidad de IA

Parte IV — Seguridad, escala y optimización

Capítulo 7 —	Seguridad de LLM y guardrails
Capítulo 8 —	Optimización de rendimiento, serving y coste

Apéndices (solo en el libro)

A —	Checklists de preparación para producción y seguridad
B —	Matrices de selección de herramientas y marcos
C —	Protocolos, streaming y salidas estructuradas

D —	Arquitectura de limitación de tasa y gestión de costes
E —	Glosario de métricas y términos de ingeniería de IA

Volumen VI — Escalando sistemas de IA

Arquitectando inferencia LLM de baja latencia para escala de producción.

Arquitectando inferencia de alto rendimiento: serving distribuido, optimización de latencia y modelado de costes para sistemas que tienen que responder millones de veces al día. El volumen a leer cuando tu sistema de IA ha crecido más allá de un solo servidor y ahora necesita comportarse como una pieza real de infraestructura.

LLM Primer VI — Escalando sistemas de IA

Disponible ahora en Amazon. Ver LLM Primer VI en Amazon →

Introducción a la serie: LLM Primer VI — Introducción de la serie e índice

Parte I — Fundamentos de la inferencia LLM

Capítulo 1 —	La mecánica de la generación de tokens
Capítulo 2 —	El reto de la caché clave-valor (KV)

Parte II — El sustrato de hardware

Capítulo 3 —	GPUs de data center para IA generativa
Capítulo 4 —	Silicio especializado de IA y ASICs

Parte III — Optimización a nivel de modelo (compresión)

Capítulo 5 —	Desmitificando la cuantización
Capítulo 6 —	Pruning y destilación de conocimiento

Parte IV — Optimizaciones a nivel de sistema y motor

Capítulo 7 —	Estrategias avanzadas de batching
Capítulo 8 —	Gestión de próxima generación de la caché KV
Capítulo 9 —	Decodificación especulativa

Parte V — Frameworks de serving y orquestación

Capítulo 10 —	La capa del motor LLM
Capítulo 11 —	La capa de plataforma y orquestación
Capítulo 12 —	Serving desagregado y Kubernetes
Capítulo 13 —	Autoscaling y mitigación del cold-start

Parte VI — Economía a nivel de aplicación y TCO

Capítulo 14 —	Economía de tokens y precios de API
Capítulo 15 —	APIs serverless frente a infraestructura dedicada
Capítulo 16 —	Estrategias de reducción de costes en producción

Apéndices (solo en el libro)

A —	Referencia de fórmulas matemáticas y modelado de costes
B —	Guía de especificaciones de hardware y aceleradores

C —	Configuraciones de despliegue y fragmentos de código
D —	Metodología de benchmarking y definiciones de métricas

Volumen VII — Seguridad de la IA

Defendiendo sistemas LLM frente a inyección de prompts, jailbreaks y amenazas adversariales.

Diseñando IA segura y robusta: riesgos adversariales, inyección de prompts, marcos de gobernanza y diseño defensivo para sistemas desplegados en el mundo real. El volumen a leer cuando tu sistema de IA tiene que tratarse como infraestructura relevante para la seguridad.

Disponible ahora en Amazon. Ver LLM Primer VII en Amazon →

Introducción a la serie: LLM Primer VII — Introducción de la serie e índice

Parte I — Fundamentos de la seguridad de IA

Capítulo 1 —	Por qué la seguridad de IA es diferente
Capítulo 2 —	Modelado de amenazas para sistemas LLM
Capítulo 3 —	Seguridad de datos y privacidad

Parte II — Seguridad de prompts e interacción

Capítulo 4 —	Inyección de prompts y jailbreaks
Capítulo 5 —	Validación de entradas y filtrado de salidas
Capítulo 6 —	Riesgos de la generación aumentada con recuperación

Parte III — Robustez y fiabilidad del modelo

Capítulo 7 —	Alucinaciones y fiabilidad
Capítulo 8 —	Ataques adversariales sobre modelos
Capítulo 9 —	Integridad del modelo y riesgos de la cadena de suministro

Parte IV — Arquitectura de seguridad a nivel de sistema

Capítulo 10 —	Diseñando arquitecturas LLM seguras
Capítulo 11 —	Observabilidad, logging y respuesta a incidentes
Capítulo 12 —	Control de acceso e identidad

Parte V — Gobernanza, ética y cumplimiento

Capítulo 13 —	Panorama regulatorio
Capítulo 14 —	Sesgo, equidad e IA responsable
Capítulo 15 —	Construyendo una organización de IA segura

Parte VI — Temas avanzados

Capítulo 16 —	Ajuste fino seguro y adaptación
Capítulo 17 —	Amenazas futuras y defensas emergentes

Apéndices (solo en el libro)

A —	Checklist de seguridad de IA para sistemas en producción
B —	Plantilla de modelo de amenazas de ejemplo
C —	Patrones de diseño de prompts seguros

D —	Plantilla de respuesta a incidentes para aplicaciones LLM
E —	Herramientas y marcos recomendados

Physical AI — un volumen hermano

Physical AI es un volumen hermano de la Serie LLM Primer que extiende el mapa hacia los sistemas incorporados: robótica, agentes situados y la clase de inteligencia que tiene que actuar en el mundo físico y no solo generar texto. Donde la Serie LLM Primer trata a la IA como una capa cognitiva sobre datos y APIs, Physical AI pregunta qué cambia cuando el mismo tipo de modelos tiene que percibir, planificar y actuar a través de sensores y actuadores — cuando el retraso es continuo, el mundo es ruidoso y el margen de error se traduce en consecuencias físicas. Es un compañero natural para lectores que quieren llevar el pensamiento de la serie más allá de la pantalla, hacia máquinas que se mueven, agarran y navegan.

La Serie LLM Primer

De qué trata esta serie

Cómo leer esta página

Los siete volúmenes

Volumen I — Cómo funciona la IA generativa

Parte I — Conceptos y fundamentos

Parte II — Cómo funcionan los LLM

Parte III — Perspectivas prácticas

Parte IV — Temas avanzados

Apéndices (solo en el libro)

Volumen II — Modelos de lenguaje a través de las matemáticas

Parte I — Intuición matemática

Parte II — Anatomía de un Transformer

Parte III — Entrenamiento, alineación y evaluación

Parte IV — Aplicaciones, límites y práctica

Apéndices (solo en el libro)

Volumen III — Potenciando la IA empresarial con RAG

Parte I — Fundamentos de RAG

Parte II — Ingesta, parsing y fragmentación

Parte III — Bases de datos vectoriales y optimización de la recuperación

Parte IV — Seguridad, privacidad y control de acceso

Parte V — Evaluación, monitoreo y mantenimiento

Apéndices (solo en el libro)

Volumen IV — Diseñando la cognición de la IA con MCP

Parte I — El cambio de paradigma en la integración con IA

Parte II — Mecánica central del MCP

Parte III — Patrones de orquestación multi-agente

Parte IV — Diseñando la cognición: contexto y memoria

Parte V — Asegurando los flujos agénticos

Parte VI — Ingeniería de producción y escala

Apéndices (solo en el libro)

Volumen V — Construyendo aplicaciones LLM del mundo real

Parte I — Fundamentos de la ingeniería de IA

Parte II — Construyendo capacidades agénticas y de recuperación

Parte III — Aseguramiento de calidad y observabilidad

Parte IV — Seguridad, escala y optimización

Apéndices (solo en el libro)

Volumen VI — Escalando sistemas de IA

Parte I — Fundamentos de la inferencia LLM

Parte II — El sustrato de hardware

Parte III — Optimización a nivel de modelo (compresión)

Parte IV — Optimizaciones a nivel de sistema y motor

Parte V — Frameworks de serving y orquestación

Parte VI — Economía a nivel de aplicación y TCO

Apéndices (solo en el libro)

Volumen VII — Seguridad de la IA

Parte I — Fundamentos de la seguridad de IA

Parte II — Seguridad de prompts e interacción

Parte III — Robustez y fiabilidad del modelo

Parte IV — Arquitectura de seguridad a nivel de sistema

Parte V — Gobernanza, ética y cumplimiento

Parte VI — Temas avanzados

Apéndices (solo en el libro)

Physical AI — un volumen hermano

SHO