Un recorrido capítulo por capítulo de LLM Primer I

Introducción a la serie e índice del recorrido en doce partes de LLM Primer I: How Generative AI Works — publicado un post por día, del 18 de febrero al 1 de marzo de 2026.

Por qué existe esta serie

Escribí LLM Primer I para hacer algo que no encontraba en ningún otro lugar: explicar cómo funcionan realmente los modelos de lenguaje grandes, mecanismo por mecanismo, de una forma que un lector general curioso pudiera seguir pero que un ingeniero también respetara.

La mayoría de las introducciones a los LLM caen en uno de dos extremos. O son narrativas de marketing que apuntan vagamente a la "magia de la IA" sin decirte nada útil, o son artículos de investigación que te lanzan álgebra de matrices en el primer párrafo. El primer tipo te deja sin más información que antes. El segundo no te ayuda realmente a razonar sobre la tecnología — solo te intimida.

El libro toma un camino intermedio. Explica cada concepto importante con claridad, manteniendo la precisión técnica intacta, sin dejar de ser legible. La edición de 2026 añade recuadros "En lenguaje sencillo" a lo largo del libro, de modo que cualquier persona — independientemente de su formación matemática — pueda seguir todo el libro.

Esta serie de doce publicaciones es un recorrido diario. Cada entrada adelanta un capítulo, comparte las ideas centrales y explica por qué estructuré el capítulo como lo hice. Funciona tanto como un recorrido autónomo por el campo, como una guía para decidir si el libro en sí es adecuado para ti.

Cómo leer esta serie: Cada publicación es independiente. Puedes leerlas en orden para hacer un recorrido guiado, o elegir el capítulo que más te importe para lo que estás intentando descifrar. Cada publicación enlaza de vuelta aquí.

Para quién es

Si has usado un chatbot y te has preguntado qué está pasando realmente por debajo, esta serie es para ti. Si eres ingeniero y quieres un entendimiento duradero de los LLM en lugar de otra tanda de trucos de prompts, esta serie es para ti. Si eres gerente o ejecutivo y tienes que tomar decisiones sobre herramientas de IA que no construiste, esta serie es para ti. Si eres estudiante y buscas una entrada accesible a un campo técnico serio, esta serie es para ti.

Lo que no necesitas: formación matemática, formación en programación ni exposición previa al aprendizaje automático. El libro está escrito en dos niveles — un texto principal técnicamente cuidadoso y un recuadro en lenguaje sencillo que corre en paralelo — y esta serie se inclina hacia el lenguaje sencillo.

Los doce capítulos

Parte I — Conceptos y fundamentos

Capítulo 1 — ¿Qué es un modelo de lenguaje grande? (18 de febrero) — Qué significan realmente las palabras "grande", "lenguaje" y "modelo", cómo llegamos hasta aquí históricamente y los tres mitos sobre los LLM que más conducen a malas decisiones.

Capítulo 2 — Probabilidad, tokens y texto (19 de febrero) — Cómo los LLM convierten texto en tokens, por qué el modelado del lenguaje es fundamentalmente un problema de probabilidad y cómo la predicción del siguiente token se convierte en todo lo demás.

Capítulo 3 — Redes neuronales para el lenguaje (20 de febrero) — Por qué las redes feedforward no podían manejar el lenguaje, cómo las RNN chocaron contra un muro y qué cambió con la atención.

Parte II — Cómo funcionan los LLM

Capítulo 4 — La arquitectura Transformer (21 de febrero) — Dentro del motor de la IA moderna. Self-attention, codificación posicional, topologías codificador/decodificador y leyes de escalado.

Capítulo 5 — Entrenando modelos grandes (22 de febrero) — De dónde vienen los datos, qué hace la función de pérdida, cómo funciona el entrenamiento distribuido y por qué entrenar un modelo de frontera cuesta cientos de millones de dólares.

Capítulo 6 — Ajuste fino y adaptación (23 de febrero) — Desde trucos de prompt hasta el ajuste por instrucciones y métodos eficientes en parámetros como LoRA. Y las técnicas de alineación — RLHF y sus sucesores modernos — que convierten modelos crudos en asistentes útiles.

Capítulo 7 — Más allá de la predicción del siguiente token (24 de febrero) — Embeddings, búsqueda semántica, generación aumentada con recuperación y la transición a entradas multimodales.

Parte III — Perspectivas prácticas

Capítulo 8 — Usando LLM en aplicaciones (25 de febrero) — Chatbots, resumen, generación de código, extracción de conocimiento, evaluación y el auge de los sistemas agénticos donde el modelo conduce un bucle de uso de herramientas.

Capítulo 9 — Rendimiento, escalado y costos (26 de febrero) — Tamaño del modelo frente a capacidad, el equilibrio entre latencia y throughput, cuantización, despliegue en el borde y por qué los modelos de frontera son a menudo la elección equivocada incluso cuando puedes permitírtelos.

Capítulo 10 — Seguridad, ética y confianza (27 de febrero) — Por qué ocurren las alucinaciones mecánicamente, dónde realmente vive el sesgo, cómo funcionan las barreras en capas y por qué la gobernanza es la capa institucional que los controles técnicos no pueden reemplazar.

Parte IV — Temas avanzados

Capítulo 11 — Investigación de vanguardia (28 de febrero) — Mixture-of-experts, mecanismos de memoria con recuperación, multimodalidad nativa, aprendizaje continuo y el paradigma de escalado en tiempo de inferencia que produjo los modelos de razonamiento actuales. La mayor adición de contenido de la edición de 2026.

Capítulo 12 — Construyendo tu propio sistema LLM (1 de marzo) — El capítulo final. Conjuntos de datos y licencias, pipelines de entrenamiento, marcos de evaluación, la pila de aplicaciones integrada y los patrones de casos de estudio que distinguen a los despliegues exitosos de los pilotos fallidos.

Lo nuevo en la edición de 2026: El libro ha sido sustancialmente revisado para 2026. Las nuevas secciones cubren alineación y optimización de preferencias (Capítulo 6.6), patrones agénticos y de uso de herramientas (Capítulo 8.6) y escalado en tiempo de inferencia y modelos de razonamiento (Capítulo 11.6). El tratamiento de mixture-of-experts en el Capítulo 11 se reposiciona de investigación a realidad de producción. Los ejemplos de ventana de contexto se actualizan para los modelos de frontera actuales. Y a lo largo del libro, los nuevos recuadros "En lenguaje sencillo" hacen que cada sección sea accesible para lectores generales.

Sobre el libro y la serie

El libro es LLM Primer I: How Generative AI Works — A Clear and Practical Guide to the Foundations of Large Language Models de Sho Shimoda.

Es el primer volumen de la Serie LLM Primer. Otros volúmenes profundizan en temas específicos — generación aumentada con recuperación, diseño de contexto con MCP, construcción de aplicaciones LLM del mundo real, escalado de sistemas de IA y seguridad de la IA. Cada volumen se sostiene por sí solo, pero juntos cubren el panorama completo de ingeniería para trabajar con modelos de lenguaje grandes.

Si LLM Primer I te deja con ganas de más profundidad en un tema específico, los volúmenes complementarios son por donde continuar.

¿Listo para leer el libro? Doce capítulos, totalmente revisados para 2026, con diagramas, recuadros en lenguaje sencillo, ejemplos de código y un tratamiento completo de cómo funciona realmente la IA generativa. Consigue LLM Primer I en Amazon →

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice