Introducción a LLM

Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.

Total de 34 artículos disponibles. | Actualmente en la página 1 de 1.

Capítulo 17 — Amenazas futuras y defensas emergentes

Última entrega del recorrido de LLM Primer VII y cierre de la serie. Agentes autónomos, superficies de ataque multimodales, identidad sintética y la carrera armamentística IA-contra-IA de mediados de 2026, con un puente reflexivo hacia el volumen hermano Physical AI.

2026-05-26

Capítulo 16 — Ajuste fino y adaptación seguros

Decimosexta entrega del recorrido de LLM Primer VII. El modelo ajustado como artefacto cuyas propiedades de seguridad deben ganarse, no heredarse — porque los mismos pasos de gradiente que enseñan vocabulario de dominio pueden erosionar el alineamiento del modelo base.

2026-05-25

Capítulo 15 — Construir una organización de IA segura

Decimoquinta entrega del recorrido de LLM Primer VII. Cultura de seguridad, red teams, riesgo de proveedores y stewardship a largo plazo como la infraestructura organizacional que sostiene la disciplina a lo largo de los años.

2026-05-24

Capítulo 14 — Sesgo, equidad e IA responsable

Decimocuarta entrega del recorrido de LLM Primer VII. La IA responsable como disciplina de elecciones bajo incertidumbre — donde las herramientas técnicas hacen aflorar las disyuntivas sin resolverlas.

2026-05-23

Capítulo 12 — Control de acceso e identidad

Duodécima entrega del recorrido de LLM Primer VII. Quién tiene permiso para invocar qué capacidad de una aplicación integrada con LLM, y cómo se estructura la aplicación a lo largo de los componentes del sistema.

2026-05-21

Capítulo 7 — Alucinaciones y fiabilidad

Séptima entrega del recorrido de LLM Primer VII. La fiabilidad como propiedad de seguridad — porque una salida confiadamente incorrecta es un problema de seguridad siempre que las consecuencias dependan de la corrección.

2026-05-16

Capítulo 6 — Riesgos de la generación aumentada por recuperación

Sexta entrega del recorrido de LLM Primer VII. El corpus de recuperación como canal de entrada no confiable — porque cada documento indexado es, desde la perspectiva del modelo, una instrucción en pie de igualdad con la pregunta del usuario.

2026-05-15

LLM Primer VII — Introducción e índice de la serie

Recorrido de LLM Primer VII: Seguridad de la IA. El volumen final, donde el arco de ingeniería de la serie aterriza en la disciplina que decide si algo de lo anterior sobrevive frente a adversarios, reguladores y los modos de fallo cotidianos de los sistemas probabilísticos.

2026-05-09

Capítulo 10 — La capa del motor LLM

Décima entrega del recorrido de LLM Primer VI. La frontera entre motor y plataforma, y los cinco motores que dominan la capa en 2026. vLLM como default Python-nativo, TensorRT-LLM como pipeline de build, SGLang como RadixAttention agéntico, TGI como Hugging Face y Ollama como edge.

2026-05-02

Capítulo 9 — Decodificación especulativa

Novena entrega del recorrido de LLM Primer VI. Cómo la decodificación especulativa paga por una suposición barata y una verificación un poco más ancha, y si acierta lo bastante a menudo el modelo objetivo produce varios tokens al coste de reloj de uno. EAGLE, Medusa, la aritmética del speedup.

2026-05-01

Capítulo 8 — Gestión de caché KV de nueva generación

Octava entrega del recorrido de LLM Primer VI. Traer la paginación del sistema operativo dentro del motor de inferencia, y convertir la caché KV de una losa de bytes reservados en un recurso compartido, evictable y prefix-cacheable. PagedAttention, H2O, InfiniGen y RadixAttention.

2026-04-30

Capítulo 3 — GPUs de centro de datos para IA generativa

Tercera entrega del recorrido de LLM Primer VI. Por qué se compra una GPU de serving por su ancho de banda de HBM y su capacidad de VRAM, no por el número de FLOP/s de la portada de la hoja de especificaciones. H100, H200, B200, L40S y MI300X leídos como perfiles de ancho de banda y capacidad.

2026-04-25

Capítulo 2 — El desafío de la caché KV

Segunda entrega del recorrido de LLM Primer VI. La estructura de datos que se come la VRAM de todo sistema de serving antes de que los pesos tengan oportunidad, la fórmula que gobierna su tamaño, las variantes arquitectónicas que la reducen y el problema de fragmentación que arruina la asignación ingenua.

2026-04-24

Capítulo 1 — La mecánica de la generación de tokens

Primera entrega del recorrido de LLM Primer VI. Por qué casi toda pregunta difícil sobre el serving de LLMs desciende de un único hecho — el bucle que produce cada token está limitado por el ancho de banda de memoria, y el cómputo caro por el que pagaste está inactivo el 99,7 % del tiempo.

2026-04-23

LLM Primer VI — Introducción a la serie e índice

Índice y prólogo del recorrido capítulo por capítulo de LLM Primer VI. Por qué el mismo H100 que sirve un modelo de 70B queda inactivo el 99,7 % del tiempo, y cómo los dieciséis capítulos convierten esa ociosidad en throughput sin romper la latencia que percibe el usuario.

2026-04-22

Capítulo 8 — Optimizar rendimiento, serving y coste

Octava y última entrega del recorrido de LLM Primer V. La llamada más barata es la que nunca se hace: caché semántica y enrutado dinámico arriba, y dentro del servidor de inferencia PagedAttention, continuous batching, decodificación especulativa y prefix caching que ponen el suelo de coste.

2026-04-21

Capítulo 2 — Modelos base e ingeniería de prompts

Segunda entrega del recorrido de LLM Primer V. Selección de modelo como decisión de enrutado, muestreo como perfil deliberado, y prompts defensivos con salidas estructuradas — cuatro superficies de control que el equipo opera con intención o sufre las consecuencias.

2026-04-15

LLM Primer V — Presentación de la serie e índice

Presentación del recorrido capítulo por capítulo de LLM Primer V. Por qué la ingeniería de IA es una disciplina en sí misma — no un truco de prompt — y el índice de los ocho capítulos, publicado un artículo al día del 14 al 21 de abril.

2026-04-13

Capítulo 14 — Benchmarking, testing y rendimiento

Decimocuarta y última entrega del recorrido de LLM Primer IV. El MCP-Universe Benchmark sobre servidores reales, los dos modos de fallo sistémico que expuso, la brecha de diez veces en throughput entre sesión por petición y pools de sesión compartidos, y el puente al Volumen V.

2026-04-12

Capítulo 12 — Endurecimiento del protocolo y defensas

Duodécima entrega del recorrido de LLM Primer IV. Los cuatro racimos de defensa — atestación criptográfica, disciplina de scopes OAuth con sesiones acotadas, sandboxing en tiempo de ejecución y puertas human-in-the-loop — se componen en una postura que no depende de que el modelo se comporte correctamente bajo condiciones adversarias.

2026-04-10

Capítulo 11 — Superficies de ataque y vulnerabilidades del protocolo

Undécima entrega del recorrido de LLM Primer IV. Los ataques clásicos adaptados a MCP — Confused Deputy, Token Passthrough, Session Hijacking — los defectos a nivel de protocolo de escalado de capacidades y sampling sin autenticar, y la propagación implícita de confianza que vuelve estructural y no de higiene el envenenamiento de contexto.

2026-04-09

Capítulo 9 — Administrando el presupuesto de atención

Novena entrega del recorrido de LLM Primer IV. Context rot, el acantilado de lost-in-the-middle, tool-loadout rot, y las tres respuestas arquitectónicas — MCP, RAG, fine-tuning — a la pregunta de dónde corresponde de verdad el conocimiento que le falta a un modelo.

2026-04-07

Capítulo 8 — Distribuciones arquitectónicas de despliegue

Octava entrega del recorrido de LLM Primer IV. Las tres distribuciones de despliegue que han emergido en el ecosistema MCP — agente reutilizable, pureza estricta, híbrida — y las cuatro restricciones vinculantes que determinan cuál encaja con cada proyecto.

2026-04-06

Capítulo 5 — Protocolos de transporte y descubrimiento

Quinta entrega del recorrido de LLM Primer IV. Los tres transportes que MCP soporta, la capa de descubrimiento .well-known con Server Cards, y las preocupaciones operativas aburridas — CORS, validación de Origin, caching — que deciden si un servidor es un ciudadano cooperativo de la red o un pasivo.

2026-04-03

LLM Primer IV — Introducción a la serie e índice

Apertura del recorrido capítulo a capítulo del Libro IV de la serie LLM Primer — Diseñando la cognición de la IA con MCP. Por qué los agentes necesitan una capa de protocolo para escalar más allá de la demo, para quién está escrito, y el calendario de los catorce posts que siguen, del 30 de marzo al 12 de abril.

2026-03-29

Capítulo 11 — Actualizaciones continuas y optimización de la pipeline

Undécima y última entrega del recorrido de LLM Primer III. CDC e indexación incremental mantienen el corpus fresco, la caché semántica y la estratificación de modelos mantienen baja la latencia, y un bucle de feedback de cuatro etapas cierra la distancia entre lo que la producción le dice al equipo y lo que el equipo realmente cambia — más un puente al Volumen IV sobre Model Context Protocol.

2026-03-28

Capítulo 8 — Anonimización de datos en la pipeline RAG

Octava entrega del recorrido de LLM Primer III. Anonimización pre-generación frente a post-generación, las tres familias técnicas — enmascaramiento, reemplazo sintético, privacidad diferencial — y la disyuntiva utilidad-privacidad que determina si el sistema sigue siendo útil.

2026-03-25

Capítulo 11 — Investigación de vanguardia: MoE, modelos de razonamiento y el nuevo eje de escalado

Capítulo 11 de la serie LLM Primer I. Las fronteras de investigación que ahora son realidad de producción — mixture-of-experts, memoria con recuperación, tokenización multimodal nativa, aprendizaje continuo y el paradigma de escalado en tiempo de inferencia que produjo los modelos de razonamiento de hoy. La mayor adición de contenido de la edición de 2026.

2026-02-28

Capítulo 8 — Usando LLM en aplicaciones: chatbots, código, extracción y agentes

Capítulo 8 de la serie LLM Primer I. Los patrones de aplicación que realmente llegan a producción — chatbots, resumen, asistentes de código, extracción estructurada y el auge de los sistemas agénticos donde el modelo conduce un bucle de uso de herramientas. Más los benchmarks que todo ingeniero debería reconocer por su nombre.

2026-02-25

Capítulo 4 — La arquitectura Transformer: dentro del motor de la IA moderna

Capítulo 4 de la serie LLM Primer I. Un recorrido por el bloque Transformer — cómo el self-attention, la codificación posicional y las capas apiladas se combinan para producir la arquitectura sobre la que está construido cada LLM moderno. Incluye una explicación clara de por qué escalar Transformers funciona, y cuánto cuesta.

2026-02-21

Capítulo 3 — Redes neuronales para el lenguaje: de las RNN al self-attention

Capítulo 3 de la serie LLM Primer I. Por qué las redes feedforward no podían manejar el lenguaje, cómo las RNN chocaron contra un muro y qué cambió la atención. Una progresión conceptual limpia a través de las tres formas de red neuronal que definieron el PLN moderno — sin la ansiedad matemática.

2026-02-20

Capítulo 1 — ¿Qué es un modelo de lenguaje grande? (Más allá de los titulares)

Capítulo 1 de la serie LLM Primer I. Desentrañamos lo que realmente significan "grande", "lenguaje" y "modelo", recorremos el paso de los sistemas basados en reglas a las redes neuronales y abordamos los tres mayores conceptos erróneos sobre cómo funcionan los LLM modernos. Una base clara y accesible para todo lo que sigue.

2026-02-18

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.

2026-02-17

La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

La serie LLM Primer — una guía de campo de siete volúmenes ya completa sobre IA generativa por Sho Shimoda. Desde fundamentos hasta seguridad. Incluye Physical AI como volumen hermano. Los 7 volúmenes disponibles en Amazon.

2026-02-15