Introducción a LLM

Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.


Total de 8 artículos disponibles. | Actualmente en la página 1 de 1.

Capítulo 11 — Evaluación, calibración e inferencia

Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.

2026-03-13

Capítulo 8 — Usando LLM en aplicaciones: chatbots, código, extracción y agentes

Capítulo 8 de la serie LLM Primer I. Los patrones de aplicación que realmente llegan a producción — chatbots, resumen, asistentes de código, extracción estructurada y el auge de los sistemas agénticos donde el modelo conduce un bucle de uso de herramientas. Más los benchmarks que todo ingeniero debería reconocer por su nombre.

2026-02-25

Capítulo 7 — Más allá de la predicción del siguiente token: embeddings, recuperación y multimodalidad

Capítulo 7 de la serie LLM Primer I. Las capacidades que convierten a un predictor del siguiente token en algo mucho más — embeddings, búsqueda semántica, generación aumentada con recuperación y la transición a entradas multimodales. Cómo RAG realmente mantiene un LLM anclado en documentos reales en lugar de inventar.

2026-02-24

Capítulo 6 — Ajuste fino y adaptación: del modelo crudo al asistente útil

Capítulo 6 de la serie LLM Primer I. La pila completa de adaptación — desde el direccionamiento barato basado en prompts, pasando por el ajuste fino eficiente en parámetros, hasta la alineación completa con RLHF y sus sucesores modernos como DPO. Por qué el post-entrenamiento es ahora donde las APIs de modelos cerrados realmente se diferencian.

2026-02-23

Capítulo 4 — La arquitectura Transformer: dentro del motor de la IA moderna

Capítulo 4 de la serie LLM Primer I. Un recorrido por el bloque Transformer — cómo el self-attention, la codificación posicional y las capas apiladas se combinan para producir la arquitectura sobre la que está construido cada LLM moderno. Incluye una explicación clara de por qué escalar Transformers funciona, y cuánto cuesta.

2026-02-21

Capítulo 3 — Redes neuronales para el lenguaje: de las RNN al self-attention

Capítulo 3 de la serie LLM Primer I. Por qué las redes feedforward no podían manejar el lenguaje, cómo las RNN chocaron contra un muro y qué cambió la atención. Una progresión conceptual limpia a través de las tres formas de red neuronal que definieron el PLN moderno — sin la ansiedad matemática.

2026-02-20

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.

2026-02-17

La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

La Serie LLM Primer — una guía de campo en siete volúmenes sobre IA generativa por Sho Shimoda. Cada volumen cubre una capa distinta del trabajo con modelos de lenguaje grandes, desde los fundamentos hasta el escalado y la seguridad. Esta es la página principal: una visión general de toda la serie, más el recorrido capítulo por capítulo en vivo de los primeros volúmenes.

2026-02-15