La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

Publicado el: 2026-02-15 Última actualización el: 2026-06-06 Versión: 5
La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

La Serie LLM Primer

Una guía de campo de la IA generativa, construida volumen a volumen. Siete libros, cada uno enfocado en una capa distinta del trabajo con modelos de lenguaje grandes — de los fundamentos al escalado, pasando por las matemáticas, la recuperación, el diseño de la cognición, la ingeniería de producción y la seguridad.


De qué trata esta serie

La Serie LLM Primer es un tratamiento estructurado y centrado en mecanismos sobre los modelos de lenguaje grandes — escrito para ingenieros, gerentes técnicos de producto, profesionales curiosos y cualquier persona dispuesta a leer con atención. Cada volumen aborda una parte distinta del campo en profundidad, conservando la precisión técnica y manteniendo las explicaciones lo bastante claras como para que puedan utilizarse.

La serie está diseñada para funcionar de dos maneras. Puedes leer el Volumen I como una base completa y detenerte ahí. O puedes seguir el recorrido completo — fundamentos, matemáticas, recuperación, diseño de la cognición, ingeniería de producción, escalado y seguridad — y terminar con un conocimiento integral y práctico de cómo construir con LLM de forma responsable.

Todos los volúmenes están escritos por Sho Shimoda, CTO de Receipt Roller Inc., que construye y opera sistemas de IA en producción y escribe sobre ellos en un lenguaje lo bastante claro para que cualquiera pueda seguirlo.

Para quién es: ingenieros y arquitectos que buscan una comprensión duradera. Gerentes de producto y ejecutivos que tienen que decidir qué IA construir. Profesionales curiosos y estudiantes que quieren entender la tecnología detrás de los titulares. La serie está escrita de modo que no necesitas formación matemática para leerla, pero conserva suficiente precisión técnica para que un ingeniero experimentado no pierda el tiempo.

Cómo leer esta página

Cada volumen, más abajo, lista su tabla de contenidos completa, organizada por Parte. Publicaremos un artículo capítulo por capítulo para cada capítulo de la serie. Los capítulos que ya tienen un recorrido aparecen enlazados; los que aún no se han publicado figuran en texto plano.

Los apéndices se listan por transparencia, pero son contenido exclusivo del libro — material de referencia, hojas de cálculo, ejercicios con soluciones y otros bloques que pertenecen al final del libro y no a un recorrido independiente. Para acceder a los apéndices, hay que leer el libro.


Los siete volúmenes

Volumen I — Cómo funciona la IA generativa

Una guía clara y práctica sobre los fundamentos de los modelos de lenguaje grandes.

La rampa de entrada en lenguaje llano a toda la serie. Partiendo de cero — tokens, entrenamiento y el simple acto de predecir la siguiente palabra — construye una imagen honesta y sin jerga de qué es un modelo de lenguaje grande, cómo se entrena y por qué se comporta como lo hace, sin asumir ningún conocimiento previo. Es el cimiento sobre el que se apoyan todos los volúmenes siguientes.

Léelo en Amazon: LLM Primer I — How Generative AI Works

LLM Primer I — Cómo funciona la IA generativa

Introducción a la serie: Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Parte I — Conceptos y fundamentos

Capítulo 1 —¿Qué es un modelo de lenguaje grande?
Capítulo 2 —Probabilidad, tokens y texto
Capítulo 3 —Redes neuronales para el lenguaje

Parte II — Cómo funcionan los LLM

Capítulo 4 —La arquitectura Transformer
Capítulo 5 —Entrenando modelos grandes
Capítulo 6 —Ajuste fino y adaptación
Capítulo 7 —Más allá de la predicción del siguiente token

Parte III — Perspectivas prácticas

Capítulo 8 —Usando LLM en aplicaciones
Capítulo 9 —Rendimiento, escalado y costos
Capítulo 10 —Seguridad, ética y confianza

Parte IV — Temas avanzados

Capítulo 11 —Investigación de vanguardia
Capítulo 12 —Construyendo tu propio sistema LLM

Apéndices (solo en el libro)

A —Glosario LLM
B —Matemáticas detrás de la atención
C —Hoja de referencia de prompting
D —Herramientas y bibliotecas
E —Lecturas recomendadas

Volumen II — Modelos de lenguaje a través de las matemáticas

Explorando el funcionamiento interno de la IA con visión matemática.

Un recorrido matemáticamente riguroso pero legible por el funcionamiento interno de la IA: atención, dinámica de optimización, paisajes de pérdida y comportamiento al escalar, explicados a través de las matemáticas que los sostienen. Toda ecuación que importa se deriva por completo — cada una envuelta en una historia, una analogía y un ejemplo numérico trabajado. Para lectores que quieren las matemáticas que el primer volumen mantiene en sus recuadros.

Léelo en Amazon: LLM Primer II — Language Models Through Mathematics

LLM Primer II — Modelos de lenguaje a través de las matemáticas

Introducción a la serie: Un recorrido capítulo por capítulo de LLM Primer II — Introducción a la serie e índice

Parte I — Intuición matemática

Capítulo 1 —Intuición matemática para los modelos de lenguaje
Capítulo 2 —Los LLM en contexto
Capítulo 3 —Herramientas matemáticas

Parte II — Anatomía de un Transformer

Capítulo 4 —Atención
Capítulo 5 —Posición, orden y estructura de la secuencia
Capítulo 6 —Bloques del Transformer
Capítulo 7 —Eficiencia y variantes del Transformer

Parte III — Entrenamiento, alineación y evaluación

Capítulo 8 —Cómo aprenden los modelos
Capítulo 9 —Entrenamiento a escala
Capítulo 10 —Matemáticas del post-entrenamiento y la alineación
Capítulo 11 —Evaluación, calibración e inferencia

Parte IV — Aplicaciones, límites y práctica

Capítulo 12 —Aplicaciones de los LLM en el mundo real
Capítulo 13 —Limitaciones, riesgos y desafíos abiertos
Capítulo 14 —Conocimiento práctico para ingenieros

Apéndices (solo en el libro)

Hoja de referencia matemática del LLM
Una perspectiva estadística de los LLM
Preguntas que la gente hace
Derivaciones trabajadas
Ejercicios con soluciones
Índice de símbolos
Una pasada hacia adelante completa, en números
Una cronología de las ideas

Volumen III — Potenciando la IA empresarial con RAG

Una guía práctica para construir sistemas de generación aumentada con recuperación para la empresa.

Generación aumentada con recuperación, en términos prácticos — bases de datos vectoriales, estrategias de fragmentación y la arquitectura de anclar un modelo en tus propios documentos para obtener respuestas empresariales fiables y al día. El volumen para leer si tu trabajo es lanzar funciones de IA que tienen que mantenerse actualizadas y citar sus fuentes.

LLM Primer III — Potenciando la IA empresarial con RAG

Parte I — Fundamentos de RAG

Capítulo 1 —La evolución de la arquitectura RAG

Parte II — Ingesta, parsing y fragmentación

Capítulo 2 —Parsing inteligente de documentos
Capítulo 3 —Marcos avanzados de fragmentación

Parte III — Bases de datos vectoriales y optimización de la recuperación

Capítulo 4 —Eligiendo la base de datos vectorial adecuada
Capítulo 5 —Arquitectando la tubería de recuperación

Parte IV — Seguridad, privacidad y control de acceso

Capítulo 6 —Modelos de amenazas y vulnerabilidades de RAG
Capítulo 7 —Implementando control de acceso
Capítulo 8 —Anonimización de datos en la tubería RAG

Parte V — Evaluación, monitoreo y mantenimiento

Capítulo 9 —La tríada de evaluación de RAG
Capítulo 10 —Marcos líderes de evaluación
Capítulo 11 —Actualizaciones continuas y optimización de la tubería

Apéndices (solo en el libro)

A —Fórmulas matemáticas esenciales para optimizar RAG
B —Prompts de sistema de ejemplo para anonimización y evaluación
C —Matrices de decisión de bases de datos vectoriales y herramientas
D —Conjuntos de datos de referencia para evaluar RAG

Volumen IV — Diseñando la cognición de la IA con MCP

Ingeniería del contexto, las herramientas y la memoria para agentes de IA fiables.

Modelado estructurado del contexto y orquestación: cómo dar forma al razonamiento del modelo a través de la ingeniería del contexto y las situaciones que ve, en vez de modificar el modelo mismo. El volumen a leer si estás construyendo sistemas agénticos — inventarios de herramientas, bucles de larga duración, memoria entre sesiones y la disciplina de diseñar lo que el modelo puede mirar.

LLM Primer IV — Diseñando la cognición de la IA con MCP

Parte I — El cambio de paradigma en la integración con IA

Capítulo 1 —La crisis de la integración con IA y el auge de la arquitectura agéntica
Capítulo 2 —Presentando el Model Context Protocol (MCP)

Parte II — Mecánica central del MCP

Capítulo 3 —Primitivas del servidor — exponiendo contexto y capacidades
Capítulo 4 —Primitivas del cliente — comportamientos agénticos y control
Capítulo 5 —Protocolos de transporte y descubrimiento

Parte III — Patrones de orquestación multi-agente

Capítulo 6 —Estrategias fundamentales de orquestación
Capítulo 7 —Patrones colaborativos y dinámicos avanzados
Capítulo 8 —Diseños arquitectónicos de despliegue

Parte IV — Diseñando la cognición: contexto y memoria

Capítulo 9 —Gestionando el presupuesto de atención
Capítulo 10 —Memoria para tareas de largo horizonte

Parte V — Asegurando los flujos agénticos

Capítulo 11 —Superficies de ataque y vulnerabilidades del protocolo
Capítulo 12 —Endurecimiento del protocolo y defensas

Parte VI — Ingeniería de producción y escala

Capítulo 13 —Marcos e integración en la nube
Capítulo 14 —Benchmarking, pruebas y rendimiento

Apéndices (solo en el libro)

A —Referencia rápida y hoja de chuletas de MCP
B —Planos de implementación y ejemplos de código
C —Checklists de preparación para producción y seguridad
D —Especificaciones avanzadas y propuestas de mejora del estándar (SEPs)
E —Benchmarks y datos de rendimiento
F —Recursos oficiales y enlaces al ecosistema

Volumen V — Construyendo aplicaciones LLM del mundo real

Diseñando, evaluando y operando sistemas LLM en producción.

Una guía centrada en sistemas, del prototipo a la producción — diseño de APIs, bucles de evaluación, monitoreo e integración — para convertir un modelo capaz en un producto fiable. El volumen que convierte la comprensión arquitectónica en servicios desplegados con usuarios reales encima.

LLM Primer V — Construyendo aplicaciones LLM del mundo real

Parte I — Fundamentos de la ingeniería de IA

Capítulo 1 —La disciplina de la ingeniería de IA
Capítulo 2 —Modelos fundacionales e ingeniería de prompts

Parte II — Construyendo capacidades agénticas y de recuperación

Capítulo 3 —Generación aumentada con recuperación (RAG)
Capítulo 4 —Agentes de IA y llamada a herramientas

Parte III — Aseguramiento de calidad y observabilidad

Capítulo 5 —Evaluando aplicaciones LLM
Capítulo 6 —Observabilidad y trazabilidad de IA

Parte IV — Seguridad, escala y optimización

Capítulo 7 —Seguridad de LLM y guardrails
Capítulo 8 —Optimización de rendimiento, serving y coste

Apéndices (solo en el libro)

A —Checklists de preparación para producción y seguridad
B —Matrices de selección de herramientas y marcos
C —Protocolos, streaming y salidas estructuradas
D —Arquitectura de limitación de tasa y gestión de costes
E —Glosario de métricas y términos de ingeniería de IA

Volumen VI — Escalando sistemas de IA

Arquitectando inferencia LLM de baja latencia para escala de producción.

Arquitectando inferencia de alto rendimiento: serving distribuido, optimización de latencia y modelado de costes para sistemas que tienen que responder millones de veces al día. El volumen a leer cuando tu sistema de IA ha crecido más allá de un solo servidor y ahora necesita comportarse como una pieza real de infraestructura.

LLM Primer VI — Escalando sistemas de IA

Parte I — Fundamentos de la inferencia LLM

Capítulo 1 —La mecánica de la generación de tokens
Capítulo 2 —El reto de la caché clave-valor (KV)

Parte II — El sustrato de hardware

Capítulo 3 —GPUs de data center para IA generativa
Capítulo 4 —Silicio especializado de IA y ASICs

Parte III — Optimización a nivel de modelo (compresión)

Capítulo 5 —Desmitificando la cuantización
Capítulo 6 —Pruning y destilación de conocimiento

Parte IV — Optimizaciones a nivel de sistema y motor

Capítulo 7 —Estrategias avanzadas de batching
Capítulo 8 —Gestión de próxima generación de la caché KV
Capítulo 9 —Decodificación especulativa

Parte V — Frameworks de serving y orquestación

Capítulo 10 —La capa del motor LLM
Capítulo 11 —La capa de plataforma y orquestación
Capítulo 12 —Serving desagregado y Kubernetes
Capítulo 13 —Autoscaling y mitigación del cold-start

Parte VI — Economía a nivel de aplicación y TCO

Capítulo 14 —Economía de tokens y precios de API
Capítulo 15 —APIs serverless frente a infraestructura dedicada
Capítulo 16 —Estrategias de reducción de costes en producción

Apéndices (solo en el libro)

A —Referencia de fórmulas matemáticas y modelado de costes
B —Guía de especificaciones de hardware y aceleradores
C —Configuraciones de despliegue y fragmentos de código
D —Metodología de benchmarking y definiciones de métricas

Volumen VII — Seguridad de la IA

Defendiendo sistemas LLM frente a inyección de prompts, jailbreaks y amenazas adversariales.

Diseñando IA segura y robusta: riesgos adversariales, inyección de prompts, marcos de gobernanza y diseño defensivo para sistemas desplegados en el mundo real. El volumen a leer cuando tu sistema de IA tiene que tratarse como infraestructura relevante para la seguridad.

LLM Primer VII — Seguridad de la IA

Parte I — Fundamentos de la seguridad de IA

Capítulo 1 —Por qué la seguridad de IA es diferente
Capítulo 2 —Modelado de amenazas para sistemas LLM
Capítulo 3 —Seguridad de datos y privacidad

Parte II — Seguridad de prompts e interacción

Capítulo 4 —Inyección de prompts y jailbreaks
Capítulo 5 —Validación de entradas y filtrado de salidas
Capítulo 6 —Riesgos de la generación aumentada con recuperación

Parte III — Robustez y fiabilidad del modelo

Capítulo 7 —Alucinaciones y fiabilidad
Capítulo 8 —Ataques adversariales sobre modelos
Capítulo 9 —Integridad del modelo y riesgos de la cadena de suministro

Parte IV — Arquitectura de seguridad a nivel de sistema

Capítulo 10 —Diseñando arquitecturas LLM seguras
Capítulo 11 —Observabilidad, logging y respuesta a incidentes
Capítulo 12 —Control de acceso e identidad

Parte V — Gobernanza, ética y cumplimiento

Capítulo 13 —Panorama regulatorio
Capítulo 14 —Sesgo, equidad e IA responsable
Capítulo 15 —Construyendo una organización de IA segura

Parte VI — Temas avanzados

Capítulo 16 —Ajuste fino seguro y adaptación
Capítulo 17 —Amenazas futuras y defensas emergentes

Apéndices (solo en el libro)

A —Checklist de seguridad de IA para sistemas en producción
B —Plantilla de modelo de amenazas de ejemplo
C —Patrones de diseño de prompts seguros
D —Plantilla de respuesta a incidentes para aplicaciones LLM
E —Herramientas y marcos recomendados

Cómo crece esta página

Esta página se actualizará a medida que se publique cada volumen de la serie y a medida que vayan saliendo los artículos del recorrido por cada capítulo. Los Volúmenes III a VII tienen ya sus tablas de contenidos completas más arriba; los artículos del recorrido para esos capítulos se irán añadiendo conforme se escriban.

Marca esta página como favorita si quieres seguir la serie a medida que se desarrolla. O suscríbete al feed del canal para recibir cada nueva entrada el día que se publique.


Empieza con el Volumen I. Doce capítulos, totalmente revisados para 2026, con diagramas, recuadros en lenguaje sencillo, ejemplos de código y un tratamiento completo de cómo funciona realmente la IA generativa. Consigue LLM Primer I en Amazon →
Después profundiza con el Volumen II. Las matemáticas que sostienen la maquinaria — atención, dinámica de optimización, paisajes de pérdida y comportamiento al escalar, derivadas con cuidado y envueltas en historia y ejemplos numéricos. Consigue LLM Primer II en Amazon →

SHO
SHO
CTO y Fundador de RECEIPTROLLER. Enfocado en datos, impulsado por la innovación, siempre curioso.