Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 10 — Memoria de tareas de horizonte largo
Décima entrega del recorrido de LLM Primer IV. Memoria a corto plazo mediante ventanas y scratchpads ReAct, memoria a largo plazo mediante vectores episódicos y almacenes semánticos, y las técnicas de compactación que mantienen productivo a un agente a lo largo de horas y días.
2026-04-08Capítulo 9 — La tríada de evaluación de RAG
Novena entrega del recorrido de LLM Primer III. Un sistema RAG puede fallar en tres lugares distintos y los fallos parecen idénticos desde fuera — la tríada de evaluación de Relevancia del Contexto, Fidelidad y Relevancia de la Respuesta es el pequeño vocabulario que evita arreglar un bug mientras se mide otro.
2026-03-26Capítulo 8 — Anonimización de datos en la pipeline RAG
Octava entrega del recorrido de LLM Primer III. Anonimización pre-generación frente a post-generación, las tres familias técnicas — enmascaramiento, reemplazo sintético, privacidad diferencial — y la disyuntiva utilidad-privacidad que determina si el sistema sigue siendo útil.
2026-03-25Capítulo 3 — Frameworks avanzados de chunking
Tercera entrega del recorrido de LLM Primer III. El espectro del chunking desde tamaño fijo hasta consciente de la estructura, el mito del solapamiento, el precipicio de contexto que destruye la recuperación en silencio y las técnicas de recuperación contextual y late chunking que han remodelado la frontera.
2026-03-20Capítulo 2 — Parsing inteligente de documentos
Segunda entrega del recorrido de LLM Primer III. Por qué un PDF no es un fichero de texto, qué preserva en realidad un parser consciente del layout, el panorama actual de herramientas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) y la vía multimodal que recupera directamente sobre imágenes de página.
2026-03-19LLM Primer III — Introducción a la serie e índice
Inicio del recorrido capítulo por capítulo del Libro III de la serie LLM Primer — Mejorando la IA empresarial con RAG. Por qué la generación aumentada por recuperación parece simple desde fuera y por dentro es una pila de disciplinas, para quién está escrito el libro y el calendario de las once entregas que siguen, del 18 al 28 de marzo.
2026-03-17Capítulo 7 — Más allá de la predicción del siguiente token: embeddings, recuperación y multimodalidad
Capítulo 7 de la serie LLM Primer I. Las capacidades que convierten a un predictor del siguiente token en algo mucho más — embeddings, búsqueda semántica, generación aumentada con recuperación y la transición a entradas multimodales. Cómo RAG realmente mantiene un LLM anclado en documentos reales en lugar de inventar.
2026-02-24La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen
La Serie LLM Primer — una guía de campo en siete volúmenes sobre IA generativa por Sho Shimoda. Cada volumen cubre una capa distinta del trabajo con modelos de lenguaje grandes, desde los fundamentos hasta el escalado y la seguridad. Esta es la página principal: una visión general de toda la serie, más el recorrido capítulo por capítulo en vivo de los primeros volúmenes.
2026-02-15