Introdução ao LLM
Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.
Capítulo 6 — Estratégias Fundamentais de Orquestração
Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?
2026-04-04Capítulo 5 — Protocolos de Transporte e Descoberta
Quinta postagem do passeio pelo LLM Primer IV. Os três transportes que o MCP suporta, a camada de descoberta .well-known com Server Cards, e as preocupações operacionais sem glamour — CORS, validação de origem, caching — que decidem se um servidor é cidadão de rede cooperativo ou um passivo.
2026-04-03Capítulo 2 — Revelando o Model Context Protocol (MCP)
Segunda postagem do passeio pelo LLM Primer IV. O que o MCP de fato padroniza, a divisão em três papéis entre Host, Cliente e Servidor, por que descoberta dinâmica e mensageria bidirecional diferem de REST nos casos que importam, e o ciclo de vida de sessão que abre com negociação de capacidades.
2026-03-31Capítulo 11 — Atualizações Contínuas e Otimização do Pipeline
Décimo primeiro e último post do passeio pelo LLM Primer III. CDC e indexação incremental mantêm o corpus fresco, semantic caching e tiering de modelo seguram a latência, e um loop de feedback de quatro estágios fecha o gap entre o que a produção conta para o time e o que o time de fato muda — mais a ponte para o Volume IV sobre Model Context Protocol.
2026-03-28Capítulo 3 — Frameworks Avançados de Chunking
Terceiro post do passeio pelo LLM Primer III. O espectro de chunking de tamanho fixo a consciente de estrutura, o mito do overlap, o penhasco de contexto que destrói a recuperação em silêncio, e as técnicas de recuperação contextual e late chunking que reformularam a fronteira.
2026-03-20Capítulo 2 — Parsing Inteligente de Documentos
Segundo post do passeio pelo LLM Primer III. Por que um PDF não é um arquivo de texto, o que os parsers conscientes de layout de fato preservam, o panorama atual de ferramentas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), e a trilha multimodal que recupera direto sobre imagens de página.
2026-03-19Capítulo 10 — Matemática do Pós-Treinamento e Alinhamento
Décimo post do passeio capítulo a capítulo pelo LLM Primer II. Como um previsor de próximo token brilhante e feral é civilizado em assistente útil — SFT, modelo de recompensa, RLHF na coleira do KL, e a derivação elegante do DPO que colapsa o pipeline inteiro em uma única perda supervisionada.
2026-03-12Capítulo 9 — RAG: costurando informação fresca no contexto
Nono post do passeio capítulo a capítulo pelo LLM Primer I. O que RAG (Retrieval-Augmented Generation) realmente faz, como apoia a lacuna temporal e a exatidão do modelo, e onde começa a diferença entre um RAG bom e um ruim.
2026-02-26Capítulo 3 — Como o texto flui dentro do modelo
Terceiro post do passeio capítulo a capítulo pelo LLM Primer I. Como o token muda de forma dentro do modelo — embeddings, atenção, transformer — sem cair em matrizes nem perder precisão.
2026-02-20