Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 11 — Actualizaciones continuas y optimización de la pipeline
Undécima y última entrega del recorrido de LLM Primer III. CDC e indexación incremental mantienen el corpus fresco, la caché semántica y la estratificación de modelos mantienen baja la latencia, y un bucle de feedback de cuatro etapas cierra la distancia entre lo que la producción le dice al equipo y lo que el equipo realmente cambia — más un puente al Volumen IV sobre Model Context Protocol.
2026-03-28Capítulo 10 — Frameworks de evaluación líderes
Décima entrega del recorrido de LLM Primer III. Una guía de campo sobre los frameworks que convierten la tríada de evaluación en algo que un equipo puede correr de verdad — RAGAS, TruLens, DeepEval por un lado, Braintrust, LangSmith, Phoenix, Galileo, Opik por el otro, y el Hueco de Evaluación que ninguno ha cerrado aún.
2026-03-27Capítulo 9 — La tríada de evaluación de RAG
Novena entrega del recorrido de LLM Primer III. Un sistema RAG puede fallar en tres lugares distintos y los fallos parecen idénticos desde fuera — la tríada de evaluación de Relevancia del Contexto, Fidelidad y Relevancia de la Respuesta es el pequeño vocabulario que evita arreglar un bug mientras se mide otro.
2026-03-26Capítulo 8 — Anonimización de datos en la pipeline RAG
Octava entrega del recorrido de LLM Primer III. Anonimización pre-generación frente a post-generación, las tres familias técnicas — enmascaramiento, reemplazo sintético, privacidad diferencial — y la disyuntiva utilidad-privacidad que determina si el sistema sigue siendo útil.
2026-03-25Capítulo 7 — Implementar el control de acceso
Séptima entrega del recorrido de LLM Primer III. ACLs a nivel de documento como base, RBAC con etiquetas de sensibilidad de Microsoft Purview, ReBAC con Zanzibar y SpiceDB, y la disciplina pre-filter frente a post-filter que corre por debajo de todos ellos.
2026-03-24Capítulo 6 — Modelos de amenazas y vulnerabilidades en RAG
Sexta entrega del recorrido de LLM Primer III. La superficie de ataque ampliada de la recuperación — envenenamiento del corpus, chunks adversariales, inyección indirecta de prompts, inversión de embeddings y el problema del confused deputy en RAG agéntico. Ataques concretos, todos demostrados, todos reproducibles.
2026-03-23Capítulo 5 — Arquitectura de la pipeline de recuperación
Quinta entrega del recorrido de LLM Primer III. Por qué una sola búsqueda vectorial no es una pipeline — recuperación híbrida, reciprocal rank fusion, reranking con cross-encoder y reescritura y HyDE en el lado de la consulta — ensamblado en la arquitectura de producción hacia la que convergen los sistemas RAG maduros.
2026-03-22Capítulo 4 — Elegir la base de datos vectorial correcta
Cuarta entrega del recorrido de LLM Primer III. La división arquitectónica entre bases de datos vectoriales dedicadas y extensiones tipo Postgres, los líderes gestionados (Pinecone, Vertex), el campo open-source (Qdrant, Milvus, Weaviate), las opciones embebidas, y los tres ejes operativos — residencia, operación, coste — que deciden la elección real.
2026-03-21Capítulo 3 — Frameworks avanzados de chunking
Tercera entrega del recorrido de LLM Primer III. El espectro del chunking desde tamaño fijo hasta consciente de la estructura, el mito del solapamiento, el precipicio de contexto que destruye la recuperación en silencio y las técnicas de recuperación contextual y late chunking que han remodelado la frontera.
2026-03-20Capítulo 2 — Parsing inteligente de documentos
Segunda entrega del recorrido de LLM Primer III. Por qué un PDF no es un fichero de texto, qué preserva en realidad un parser consciente del layout, el panorama actual de herramientas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) y la vía multimodal que recupera directamente sobre imágenes de página.
2026-03-19Capítulo 1 — La evolución de la arquitectura RAG
Primera entrega del recorrido de LLM Primer III. Las cuatro posturas arquitectónicas de RAG — Naive, Avanzada, Modular, Agéntica — leídas como una historia sobre ceder cada vez más agencia al LLM, y la respuesta honesta a cuándo el fine-tuning es mejor herramienta que la recuperación.
2026-03-18LLM Primer III — Introducción a la serie e índice
Inicio del recorrido capítulo por capítulo del Libro III de la serie LLM Primer — Mejorando la IA empresarial con RAG. Por qué la generación aumentada por recuperación parece simple desde fuera y por dentro es una pila de disciplinas, para quién está escrito el libro y el calendario de las once entregas que siguen, del 18 al 28 de marzo.
2026-03-17Capítulo 11 — Evaluación, calibración e inferencia
Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.
2026-03-13