Introducción a LLM

Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.

Total de 21 artículos disponibles. | Actualmente en la página 1 de 1.

Capítulo 16 — Ajuste fino y adaptación seguros

Decimosexta entrega del recorrido de LLM Primer VII. El modelo ajustado como artefacto cuyas propiedades de seguridad deben ganarse, no heredarse — porque los mismos pasos de gradiente que enseñan vocabulario de dominio pueden erosionar el alineamiento del modelo base.

2026-05-25

Capítulo 15 — Construir una organización de IA segura

Decimoquinta entrega del recorrido de LLM Primer VII. Cultura de seguridad, red teams, riesgo de proveedores y stewardship a largo plazo como la infraestructura organizacional que sostiene la disciplina a lo largo de los años.

2026-05-24

Capítulo 14 — Sesgo, equidad e IA responsable

Decimocuarta entrega del recorrido de LLM Primer VII. La IA responsable como disciplina de elecciones bajo incertidumbre — donde las herramientas técnicas hacen aflorar las disyuntivas sin resolverlas.

2026-05-23

Capítulo 3 — Seguridad de datos y privacidad

Tercera entrega del recorrido de LLM Primer VII. Los datos como activo con ciclo de vida — desde corpus de entrenamiento memorizados hasta entradas de usuario que ingenieros de Samsung pegaron en ChatGPT antes de que el incidente tuviera nombre.

2026-05-12

Capítulo 2 — Modelado de amenazas para sistemas LLM

Segunda entrega del recorrido de LLM Primer VII. Las cuatro preguntas de Shostack, STRIDE, PASTA y MITRE ATLAS aplicados a un sistema cuyo componente más poderoso lee toda entrada como potencialmente instructiva.

2026-05-11

Capítulo 1 — Por qué la seguridad de la IA es diferente

Primera entrega del recorrido de LLM Primer VII. Por qué la seguridad de la IA no es simplemente la seguridad tradicional con un adjetivo de ML pegado detrás — el sustrato ha cambiado y cada capítulo posterior se deriva de ese cambio.

2026-05-10

LLM Primer VII — Introducción e índice de la serie

Recorrido de LLM Primer VII: Seguridad de la IA. El volumen final, donde el arco de ingeniería de la serie aterriza en la disciplina que decide si algo de lo anterior sobrevive frente a adversarios, reguladores y los modos de fallo cotidianos de los sistemas probabilísticos.

2026-05-09

Capítulo 12 — Serving desagregado y Kubernetes

Duodécima entrega del recorrido de LLM Primer VI. Separar prefill y decode en flotas GPU distintas, y las primitivas de Kubernetes que mantienen los pods del lado correcto de la interconexión. LeaderWorkerSet, Grove PodCliqueSet y el scheduler consciente de topología.

2026-05-04

Capítulo 8 — Gestión de caché KV de nueva generación

Octava entrega del recorrido de LLM Primer VI. Traer la paginación del sistema operativo dentro del motor de inferencia, y convertir la caché KV de una losa de bytes reservados en un recurso compartido, evictable y prefix-cacheable. PagedAttention, H2O, InfiniGen y RadixAttention.

2026-04-30

Capítulo 1 — La mecánica de la generación de tokens

Primera entrega del recorrido de LLM Primer VI. Por qué casi toda pregunta difícil sobre el serving de LLMs desciende de un único hecho — el bucle que produce cada token está limitado por el ancho de banda de memoria, y el cómputo caro por el que pagaste está inactivo el 99,7 % del tiempo.

2026-04-23

Capítulo 12 — Endurecimiento del protocolo y defensas

Duodécima entrega del recorrido de LLM Primer IV. Los cuatro racimos de defensa — atestación criptográfica, disciplina de scopes OAuth con sesiones acotadas, sandboxing en tiempo de ejecución y puertas human-in-the-loop — se componen en una postura que no depende de que el modelo se comporte correctamente bajo condiciones adversarias.

2026-04-10

Capítulo 4 — Primitivas del cliente: comportamientos agénticos y control

Cuarta entrega del recorrido de LLM Primer IV. Sampling, Roots y Elicitation son los tres pequeños agujeros controlados que MCP abre en el muro host-servidor — cada uno una capacidad otorgada de vuelta, cada uno un riesgo aceptado en nombre del usuario.

2026-04-02

Capítulo 4 — Elegir la base de datos vectorial correcta

Cuarta entrega del recorrido de LLM Primer III. La división arquitectónica entre bases de datos vectoriales dedicadas y extensiones tipo Postgres, los líderes gestionados (Pinecone, Vertex), el campo open-source (Qdrant, Milvus, Weaviate), las opciones embebidas, y los tres ejes operativos — residencia, operación, coste — que deciden la elección real.

2026-03-21

Capítulo 2 — Parsing inteligente de documentos

Segunda entrega del recorrido de LLM Primer III. Por qué un PDF no es un fichero de texto, qué preserva en realidad un parser consciente del layout, el panorama actual de herramientas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) y la vía multimodal que recupera directamente sobre imágenes de página.

2026-03-19

Capítulo 10 — Matemáticas del post-entrenamiento y la alineación

Capítulo 10 de la serie LLM Primer II. Cómo un predictor de siguiente token genial pero salvaje se civiliza hasta convertirse en un asistente útil — ajuste fino supervisado, modelado de recompensas con Bradley–Terry, RLHF con correa KL y la elegante derivación de DPO que colapsa toda la cañería en una sola pérdida supervisada.

2026-03-12

Capítulo 11 — Investigación de vanguardia: MoE, modelos de razonamiento y el nuevo eje de escalado

Capítulo 11 de la serie LLM Primer I. Las fronteras de investigación que ahora son realidad de producción — mixture-of-experts, memoria con recuperación, tokenización multimodal nativa, aprendizaje continuo y el paradigma de escalado en tiempo de inferencia que produjo los modelos de razonamiento de hoy. La mayor adición de contenido de la edición de 2026.

2026-02-28

Capítulo 6 — Ajuste fino y adaptación: del modelo crudo al asistente útil

Capítulo 6 de la serie LLM Primer I. La pila completa de adaptación — desde el direccionamiento barato basado en prompts, pasando por el ajuste fino eficiente en parámetros, hasta la alineación completa con RLHF y sus sucesores modernos como DPO. Por qué el post-entrenamiento es ahora donde las APIs de modelos cerrados realmente se diferencian.

2026-02-23

Capítulo 5 — Entrenando modelos grandes: qué se necesita realmente para un modelo de frontera

Capítulo 5 de la serie LLM Primer I. Cómo se entrenan realmente los LLM de frontera — la tubería de datos, la función de pérdida, los meses de tiempo de GPU y por qué el "entrenamiento" es ahora un problema de ingeniería a escala industrial más que un problema de investigación. Desmitifica para qué están pagando esas corridas de cientos de millones de dólares.

2026-02-22

Capítulo 2 — Probabilidad, tokens y texto: el juego de adivinar la siguiente palabra

Capítulo 2 de la serie LLM Primer I. Cómo los LLM convierten el texto en tokens, por qué el modelado del lenguaje es fundamentalmente un problema de probabilidad y cómo el viejo enfoque de n-gramas dio paso a modelos neuronales capaces de generalizar. Incluye explicaciones en lenguaje sencillo sobre la perplejidad y por qué importan los límites entre tokens.

2026-02-19

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.

2026-02-17

La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

La serie LLM Primer — una guía de campo de siete volúmenes ya completa sobre IA generativa por Sho Shimoda. Desde fundamentos hasta seguridad. Incluye Physical AI como volumen hermano. Los 7 volúmenes disponibles en Amazon.

2026-02-15