Introducción a LLM

Esta página proporciona una guía sencilla sobre los modelos de lenguaje de gran escala (LLM), desde lo básico hasta las aplicaciones para los entusiastas de la IA.

Total de 27 artículos disponibles. | Actualmente en la página 1 de 1.

Capítulo 12 — Control de acceso e identidad

Duodécima entrega del recorrido de LLM Primer VII. Quién tiene permiso para invocar qué capacidad de una aplicación integrada con LLM, y cómo se estructura la aplicación a lo largo de los componentes del sistema.

2026-05-21

Capítulo 8 — Ataques adversariales contra modelos

Octava entrega del recorrido de LLM Primer VII. El linaje de ataques adversariales desde FGSM en 2014 hasta TextFooler, los sufijos universales y el robo de modelos contra APIs de producción.

2026-05-17

Capítulo 5 — Validación de entradas y filtrado de salidas

Quinta entrega del recorrido de LLM Primer VII. La arquitectura de mitigación en cuatro capas convertida en disciplina operativa — etapas de saneamiento, tooling de guardrails, salida estructurada, red teaming y métricas de seguridad que significan algo.

2026-05-14

LLM Primer VII — Introducción e índice de la serie

Recorrido de LLM Primer VII: Seguridad de la IA. El volumen final, donde el arco de ingeniería de la serie aterriza en la disciplina que decide si algo de lo anterior sobrevive frente a adversarios, reguladores y los modos de fallo cotidianos de los sistemas probabilísticos.

2026-05-09

Capítulo 16 — Estrategias de reducción de coste en producción

Última entrega del recorrido de LLM Primer VI. El catálogo de jugadas ortogonales que se acumulan en un tercio o la mitad de la factura del mes pasado. Routing inteligente, compactación, APIs de batch, caché semántica — cómo cuatro movimientos independientes se multiplican en un 80 % de reducción.

2026-05-08

Capítulo 4 — Silicio especializado y ASICs de IA

Cuarta entrega del recorrido de LLM Primer VI. La elección entre GPU y ASIC es una pregunta sobre la forma de la carga. Cuándo ganan Groq, Inferentia, TPU y Gaudi, y por qué las GPUs siguen ganando en la frontera y en la variedad de modelos.

2026-04-26

Capítulo 6 — Observabilidad y trazado en IA

Sexta entrega del recorrido de LLM Primer V. Del log plano de peticiones a la traza causal anidada, las convenciones semánticas GenAI de OpenTelemetry, las métricas — TTFT, TPOT, coste, calidad — que sí importan, y el pipeline de exportación que convierte cada traza de producción en el próximo caso de evaluación.

2026-04-19

Capítulo 5 — Evaluar aplicaciones LLM

Quinta entrega del recorrido de LLM Primer V. Por qué assertEqual está muerto para salidas LLM, cómo se reconstruye el testing alrededor de jueces anclados, el RAG Triad y los tests de trayectoria para agentes, y el bucle donde las trazas de producción alimentan la evaluación que da paso a la siguiente release.

2026-04-18

Capítulo 4 — Agentes de IA y llamada a herramientas

Cuarta entrega del recorrido de LLM Primer V. El bucle ReAct como base y sus tres aumentaciones, los esquemas de herramientas como contrato del que depende toda la fiabilidad, y las tres capas de memoria — a corto plazo, a largo plazo y semántica — que un agente necesita de verdad.

2026-04-17

Capítulo 3 — Generación aumentada por recuperación

Tercera entrega del recorrido de LLM Primer V. El pipeline RAG de cinco etapas — cargar, chunkear, embebir, recuperar, generar — donde casi toda queja de calidad rastreada hasta su raíz resulta ser una queja de chunking disfrazada, y la recuperación híbrida con reranker es la forma en la que converge la producción.

2026-04-16

Capítulo 10 — Memoria de tareas de horizonte largo

Décima entrega del recorrido de LLM Primer IV. Memoria a corto plazo mediante ventanas y scratchpads ReAct, memoria a largo plazo mediante vectores episódicos y almacenes semánticos, y las técnicas de compactación que mantienen productivo a un agente a lo largo de horas y días.

2026-04-08

Capítulo 11 — Actualizaciones continuas y optimización de la pipeline

Undécima y última entrega del recorrido de LLM Primer III. CDC e indexación incremental mantienen el corpus fresco, la caché semántica y la estratificación de modelos mantienen baja la latencia, y un bucle de feedback de cuatro etapas cierra la distancia entre lo que la producción le dice al equipo y lo que el equipo realmente cambia — más un puente al Volumen IV sobre Model Context Protocol.

2026-03-28

Capítulo 10 — Frameworks de evaluación líderes

Décima entrega del recorrido de LLM Primer III. Una guía de campo sobre los frameworks que convierten la tríada de evaluación en algo que un equipo puede correr de verdad — RAGAS, TruLens, DeepEval por un lado, Braintrust, LangSmith, Phoenix, Galileo, Opik por el otro, y el Hueco de Evaluación que ninguno ha cerrado aún.

2026-03-27

Capítulo 7 — Implementar el control de acceso

Séptima entrega del recorrido de LLM Primer III. ACLs a nivel de documento como base, RBAC con etiquetas de sensibilidad de Microsoft Purview, ReBAC con Zanzibar y SpiceDB, y la disciplina pre-filter frente a post-filter que corre por debajo de todos ellos.

2026-03-24

Capítulo 6 — Modelos de amenazas y vulnerabilidades en RAG

Sexta entrega del recorrido de LLM Primer III. La superficie de ataque ampliada de la recuperación — envenenamiento del corpus, chunks adversariales, inyección indirecta de prompts, inversión de embeddings y el problema del confused deputy en RAG agéntico. Ataques concretos, todos demostrados, todos reproducibles.

2026-03-23

Capítulo 5 — Arquitectura de la pipeline de recuperación

Quinta entrega del recorrido de LLM Primer III. Por qué una sola búsqueda vectorial no es una pipeline — recuperación híbrida, reciprocal rank fusion, reranking con cross-encoder y reescritura y HyDE en el lado de la consulta — ensamblado en la arquitectura de producción hacia la que convergen los sistemas RAG maduros.

2026-03-22

Capítulo 4 — Elegir la base de datos vectorial correcta

Cuarta entrega del recorrido de LLM Primer III. La división arquitectónica entre bases de datos vectoriales dedicadas y extensiones tipo Postgres, los líderes gestionados (Pinecone, Vertex), el campo open-source (Qdrant, Milvus, Weaviate), las opciones embebidas, y los tres ejes operativos — residencia, operación, coste — que deciden la elección real.

2026-03-21

Capítulo 3 — Frameworks avanzados de chunking

Tercera entrega del recorrido de LLM Primer III. El espectro del chunking desde tamaño fijo hasta consciente de la estructura, el mito del solapamiento, el precipicio de contexto que destruye la recuperación en silencio y las técnicas de recuperación contextual y late chunking que han remodelado la frontera.

2026-03-20

Capítulo 2 — Parsing inteligente de documentos

Segunda entrega del recorrido de LLM Primer III. Por qué un PDF no es un fichero de texto, qué preserva en realidad un parser consciente del layout, el panorama actual de herramientas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) y la vía multimodal que recupera directamente sobre imágenes de página.

2026-03-19

Capítulo 11 — Evaluación, calibración e inferencia

Capítulo 11 de la serie LLM Primer II. Cómo se mide realmente una máquina que puede decir cualquier cosa: perplejidad como vara de medir intrínseca, calibración como pregunta a menudo más importante que la precisión, barras de error como antídoto al teatro de los benchmarks y la geometría de recuperación como herramienta de producción contra la alucinación.

2026-03-13

Capítulo 8 — Usando LLM en aplicaciones: chatbots, código, extracción y agentes

Capítulo 8 de la serie LLM Primer I. Los patrones de aplicación que realmente llegan a producción — chatbots, resumen, asistentes de código, extracción estructurada y el auge de los sistemas agénticos donde el modelo conduce un bucle de uso de herramientas. Más los benchmarks que todo ingeniero debería reconocer por su nombre.

2026-02-25

Capítulo 7 — Más allá de la predicción del siguiente token: embeddings, recuperación y multimodalidad

Capítulo 7 de la serie LLM Primer I. Las capacidades que convierten a un predictor del siguiente token en algo mucho más — embeddings, búsqueda semántica, generación aumentada con recuperación y la transición a entradas multimodales. Cómo RAG realmente mantiene un LLM anclado en documentos reales en lugar de inventar.

2026-02-24

Capítulo 6 — Ajuste fino y adaptación: del modelo crudo al asistente útil

Capítulo 6 de la serie LLM Primer I. La pila completa de adaptación — desde el direccionamiento barato basado en prompts, pasando por el ajuste fino eficiente en parámetros, hasta la alineación completa con RLHF y sus sucesores modernos como DPO. Por qué el post-entrenamiento es ahora donde las APIs de modelos cerrados realmente se diferencian.

2026-02-23

Capítulo 4 — La arquitectura Transformer: dentro del motor de la IA moderna

Capítulo 4 de la serie LLM Primer I. Un recorrido por el bloque Transformer — cómo el self-attention, la codificación posicional y las capas apiladas se combinan para producir la arquitectura sobre la que está construido cada LLM moderno. Incluye una explicación clara de por qué escalar Transformers funciona, y cuánto cuesta.

2026-02-21

Capítulo 3 — Redes neuronales para el lenguaje: de las RNN al self-attention

Capítulo 3 de la serie LLM Primer I. Por qué las redes feedforward no podían manejar el lenguaje, cómo las RNN chocaron contra un muro y qué cambió la atención. Una progresión conceptual limpia a través de las tres formas de red neuronal que definieron el PLN moderno — sin la ansiedad matemática.

2026-02-20

Un recorrido capítulo por capítulo de LLM Primer I — Introducción a la serie e índice

Introducción e índice del recorrido en doce partes capítulo por capítulo de LLM Primer I: Cómo funciona la IA generativa. Una publicación por día, del 18 de febrero al 1 de marzo de 2026. Léelos en orden o elige el capítulo que más te importe. Los doce están listados y enlazados aquí.

2026-02-17

La Serie LLM Primer — Una guía de campo de la IA generativa, construida volumen a volumen

La serie LLM Primer — una guía de campo de siete volúmenes ya completa sobre IA generativa por Sho Shimoda. Desde fundamentos hasta seguridad. Incluye Physical AI como volumen hermano. Los 7 volúmenes disponibles en Amazon.

2026-02-15