Introducción a LLM
Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.
Capítulo 14 — Benchmarking, testing y rendimiento
Decimocuarta y última entrega del recorrido de LLM Primer IV. El MCP-Universe Benchmark sobre servidores reales, los dos modos de fallo sistémico que expuso, la brecha de diez veces en throughput entre sesión por petición y pools de sesión compartidos, y el puente al Volumen V.
2026-04-12Capítulo 12 — Endurecimiento del protocolo y defensas
Duodécima entrega del recorrido de LLM Primer IV. Los cuatro racimos de defensa — atestación criptográfica, disciplina de scopes OAuth con sesiones acotadas, sandboxing en tiempo de ejecución y puertas human-in-the-loop — se componen en una postura que no depende de que el modelo se comporte correctamente bajo condiciones adversarias.
2026-04-10Capítulo 11 — Superficies de ataque y vulnerabilidades del protocolo
Undécima entrega del recorrido de LLM Primer IV. Los ataques clásicos adaptados a MCP — Confused Deputy, Token Passthrough, Session Hijacking — los defectos a nivel de protocolo de escalado de capacidades y sampling sin autenticar, y la propagación implícita de confianza que vuelve estructural y no de higiene el envenenamiento de contexto.
2026-04-09Capítulo 8 — Distribuciones arquitectónicas de despliegue
Octava entrega del recorrido de LLM Primer IV. Las tres distribuciones de despliegue que han emergido en el ecosistema MCP — agente reutilizable, pureza estricta, híbrida — y las cuatro restricciones vinculantes que determinan cuál encaja con cada proyecto.
2026-04-06Capítulo 6 — Estrategias fundamentales de orquestación
Sexta entrega del recorrido de LLM Primer IV. Las dos formas fundacionales de orquestación — pipelines secuenciales y scatter-gather concurrente — y la pregunta previa que todo equipo debería hacerse: ¿es un sistema multi-agente la respuesta correcta?
2026-04-04Capítulo 8 — Anonimización de datos en la pipeline RAG
Octava entrega del recorrido de LLM Primer III. Anonimización pre-generación frente a post-generación, las tres familias técnicas — enmascaramiento, reemplazo sintético, privacidad diferencial — y la disyuntiva utilidad-privacidad que determina si el sistema sigue siendo útil.
2026-03-25Capítulo 7 — Implementar el control de acceso
Séptima entrega del recorrido de LLM Primer III. ACLs a nivel de documento como base, RBAC con etiquetas de sensibilidad de Microsoft Purview, ReBAC con Zanzibar y SpiceDB, y la disciplina pre-filter frente a post-filter que corre por debajo de todos ellos.
2026-03-24Capítulo 5 — Arquitectura de la pipeline de recuperación
Quinta entrega del recorrido de LLM Primer III. Por qué una sola búsqueda vectorial no es una pipeline — recuperación híbrida, reciprocal rank fusion, reranking con cross-encoder y reescritura y HyDE en el lado de la consulta — ensamblado en la arquitectura de producción hacia la que convergen los sistemas RAG maduros.
2026-03-22Capítulo 4 — Elegir la base de datos vectorial correcta
Cuarta entrega del recorrido de LLM Primer III. La división arquitectónica entre bases de datos vectoriales dedicadas y extensiones tipo Postgres, los líderes gestionados (Pinecone, Vertex), el campo open-source (Qdrant, Milvus, Weaviate), las opciones embebidas, y los tres ejes operativos — residencia, operación, coste — que deciden la elección real.
2026-03-21Capítulo 3 — Frameworks avanzados de chunking
Tercera entrega del recorrido de LLM Primer III. El espectro del chunking desde tamaño fijo hasta consciente de la estructura, el mito del solapamiento, el precipicio de contexto que destruye la recuperación en silencio y las técnicas de recuperación contextual y late chunking que han remodelado la frontera.
2026-03-20Capítulo 1 — La evolución de la arquitectura RAG
Primera entrega del recorrido de LLM Primer III. Las cuatro posturas arquitectónicas de RAG — Naive, Avanzada, Modular, Agéntica — leídas como una historia sobre ceder cada vez más agencia al LLM, y la respuesta honesta a cuándo el fine-tuning es mejor herramienta que la recuperación.
2026-03-18LLM Primer III — Introducción a la serie e índice
Inicio del recorrido capítulo por capítulo del Libro III de la serie LLM Primer — Mejorando la IA empresarial con RAG. Por qué la generación aumentada por recuperación parece simple desde fuera y por dentro es una pila de disciplinas, para quién está escrito el libro y el calendario de las once entregas que siguen, del 18 al 28 de marzo.
2026-03-17Capítulo 11 — Evaluación, calibración e inferencia
Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.
2026-03-13Capítulo 8 — Usando LLM en aplicaciones: chatbots, código, extracción y agentes
Capítulo 8 de la serie LLM Primer I. Los patrones de aplicación que realmente llegan a producción — chatbots, resumen, asistentes de código, extracción estructurada y el auge de los sistemas agénticos donde el modelo conduce un bucle de uso de herramientas. Más los benchmarks que todo ingeniero debería reconocer por su nombre.
2026-02-25Capítulo 7 — Más allá de la predicción del siguiente token: embeddings, recuperación y multimodalidad
Capítulo 7 de la serie LLM Primer I. Las capacidades que convierten a un predictor del siguiente token en algo mucho más — embeddings, búsqueda semántica, generación aumentada con recuperación y la transición a entradas multimodales. Cómo RAG realmente mantiene un LLM anclado en documentos reales en lugar de inventar.
2026-02-24Capítulo 6 — Ajuste fino y adaptación: del modelo crudo al asistente útil
Capítulo 6 de la serie LLM Primer I. La pila completa de adaptación — desde el direccionamiento barato basado en prompts, pasando por el ajuste fino eficiente en parámetros, hasta la alineación completa con RLHF y sus sucesores modernos como DPO. Por qué el post-entrenamiento es ahora donde las APIs de modelos cerrados realmente se diferencian.
2026-02-23