Introdução ao LLM
Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.
Capítulo 12 — Endurecimento do Protocolo e Defesas
Décima segunda postagem do passeio pelo LLM Primer IV. Os quatro clusters de defesa — atestação criptográfica, disciplina de escopo OAuth com sessões limitadas, sandbox em runtime, e portões humano-no-loop — compõem numa postura que não depende do modelo se comportar corretamente sob condições adversárias.
2026-04-10Capítulo 11 — Superfícies de Ataque e Vulnerabilidades de Protocolo
Décima primeira postagem do passeio pelo LLM Primer IV. Os ataques clássicos adaptados ao MCP — Confused Deputy, Token Passthrough, Session Hijacking — os defeitos no nível de protocolo em torno de escalada de capacidade e sampling não-autenticado, e a propagação implícita de confiança que torna envenenamento de contexto problema estrutural em vez de higiene.
2026-04-09Capítulo 10 — Memória de Tarefa de Horizonte Longo
Décima postagem do passeio pelo LLM Primer IV. Memória de curto prazo via janelas e scratchpads ReAct, memória de longo prazo via vetores episódicos e stores semânticos, e as técnicas de compactação que mantêm um agente produtivo ao longo de horas e dias.
2026-04-08Capítulo 9 — Gerenciando o Orçamento de Atenção
Nona postagem do passeio pelo LLM Primer IV. Context rot, o precipício de lost-in-the-middle, tool-loadout rot, e as três respostas arquiteturais — MCP, RAG, fine-tuning — para a pergunta de onde o conhecimento ausente de um modelo de fato pertence.
2026-04-07Capítulo 7 — Padrões Avançados Colaborativos e Dinâmicos
Sétima postagem do passeio pelo LLM Primer IV. Consenso roundtable, roteamento por handoff, e orquestração magentic — os padrões que emergem quando a topologia precisa ser construída por requisição, com os modos de falha (não-terminação, mis-routing, planejamento desbocado) que os padrões mais simples evitam.
2026-04-05Capítulo 6 — Estratégias Fundamentais de Orquestração
Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?
2026-04-04Capítulo 5 — Protocolos de Transporte e Descoberta
Quinta postagem do passeio pelo LLM Primer IV. Os três transportes que o MCP suporta, a camada de descoberta .well-known com Server Cards, e as preocupações operacionais sem glamour — CORS, validação de origem, caching — que decidem se um servidor é cidadão de rede cooperativo ou um passivo.
2026-04-03Capítulo 1 — A Crise de Integração de IA e a Ascensão da Arquitetura Agêntica
Primeira postagem do passeio pelo LLM Primer IV. Por que agentes monolíticos se esfarrapam conforme prompts de sistema crescem, o problema de integração N vezes M escondido por baixo, e o movimento de engenharia de prompt para engenharia de contexto que o MCP foi feito para habilitar.
2026-03-30Capítulo 8 — Anonimização de Dados no Pipeline RAG
Oitavo post do passeio pelo LLM Primer III. Anonimização pré-geração versus pós-geração, as três famílias de técnica — mascaramento, substituição sintética, privacidade diferencial — e o tradeoff utilidade-privacidade que determina se o sistema permanece útil.
2026-03-25Capítulo 6 — Modelos de Ameaça e Vulnerabilidades em RAG
Sexto post do passeio pelo LLM Primer III. A superfície expandida de ataque da recuperação — envenenamento de corpus, chunks adversariais, injection indireta de prompt, inversão de embedding e o problema do deputado confuso em RAG agêntico. Ataques concretos, cada um demonstrado, cada um reprodutível.
2026-03-23Capítulo 5 — Arquitetando o Pipeline de Recuperação
Quinto post do passeio pelo LLM Primer III. Por que uma única busca vetorial não é um pipeline — recuperação híbrida, reciprocal rank fusion, reranking com cross-encoder, e rewriting e HyDE do lado da query — montados na arquitetura de produção para a qual sistemas RAG maduros convergem.
2026-03-22Capítulo 3 — Frameworks Avançados de Chunking
Terceiro post do passeio pelo LLM Primer III. O espectro de chunking de tamanho fixo a consciente de estrutura, o mito do overlap, o penhasco de contexto que destrói a recuperação em silêncio, e as técnicas de recuperação contextual e late chunking que reformularam a fronteira.
2026-03-20Capítulo 1 — A Evolução da Arquitetura RAG
Primeiro post do passeio pelo LLM Primer III. As quatro posturas arquiteturais de RAG — Naive, Avançada, Modular, Agêntica — lidas como uma história de entregar mais agência ao LLM uma decisão por vez, e a resposta honesta para quando fine-tuning é a ferramenta melhor do que recuperação.
2026-03-18Capítulo 11 — Avaliação, Calibração e Inferência
Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer II. Como medir uma máquina que pode dizer qualquer coisa — perplexidade, calibração, barras de erro de benchmark e geometria da recuperação para conter alucinação.
2026-03-13Capítulo 10 — Matemática do Pós-Treinamento e Alinhamento
Décimo post do passeio capítulo a capítulo pelo LLM Primer II. Como um previsor de próximo token brilhante e feral é civilizado em assistente útil — SFT, modelo de recompensa, RLHF na coleira do KL, e a derivação elegante do DPO que colapsa o pipeline inteiro em uma única perda supervisionada.
2026-03-12Capítulo 12 — Construir um sistema LLM, e o que vem depois
Último post do passeio capítulo a capítulo pelo LLM Primer I. Modelo, ferramentas, RAG, avaliação e guarda-fios costurados em um sistema só — e a ponte do Livro 1 para os Livros 2 a 7 da série.
2026-03-01Capítulo 11 — Modelos menores, modelos mais espertos
Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer I. Como reduzir modelos grandes para caber em operações reais — destilação, quantização, MoE — e o §11.6 novo da edição 2026, sobre modelos de raciocínio.
2026-02-28Capítulo 10 — Multimodal: para além do texto
Décimo post do passeio capítulo a capítulo pelo LLM Primer I. Como o mesmo transformer passou a aceitar imagem e áudio — vision transformer e tokenização de áudio — e os limites honestos por trás da ideia de "um modelo que vê tudo".
2026-02-27Capítulo 8 — Quando um modelo não basta: ferramentas e agentes
Oitavo post do passeio capítulo a capítulo pelo LLM Primer I. O terreno onde o modelo ganha braços — uso de ferramentas, chamada de função, agentes — e o §8.6 novo da edição 2026 com padrões agentivos como ReAct, planejador-executor e reflexão.
2026-02-25Capítulo 7 — Engenharia de prompt como ofício de campo
Sétimo post do passeio capítulo a capítulo pelo LLM Primer I. Os quatro padrões de prompt que carregam o peso real — system prompt, few-shot, cadeia de pensamento, papel — e por que cada um funciona, à luz do mecanismo de próximo token.
2026-02-24Capítulo 6 — Segurança, alinhamento, e o que "ser útil" realmente significa
Sexto post do passeio capítulo a capítulo pelo LLM Primer I. Por que fluência e utilidade são coisas diferentes, o que o alinhamento realmente refina, e uma prévia do §6.6 novo na edição 2026 — IA Constitucional, modelos de debate, e o que há de mais recente em pesquisa de alinhamento.
2026-02-23Capítulo 5 — Ainda há pequenos defeitos
Quinto post do passeio capítulo a capítulo pelo LLM Primer I. Por que alucinação, lacunas temporais, problemas de cálculo e oscilações de consistência não são bugs, mas características do mesmo mecanismo de previsão de próximo token.
2026-02-22Capítulo 4 — Como o modelo aprende
Quarto post do passeio capítulo a capítulo pelo LLM Primer I. Por que o pré-treinamento define o teto da capacidade, por que o fine-tuning esculpe a personalidade, e como o RLHF transforma um previsor de tokens no assistente em que confiamos todo dia.
2026-02-21Capítulo 3 — Como o texto flui dentro do modelo
Terceiro post do passeio capítulo a capítulo pelo LLM Primer I. Como o token muda de forma dentro do modelo — embeddings, atenção, transformer — sem cair em matrizes nem perder precisão.
2026-02-20Capítulo 2 — Probabilidade, tokens e texto
Segundo post do passeio capítulo a capítulo pelo LLM Primer I. Como tokens diferem de palavras, o que é a distribuição de probabilidade que o modelo produz a cada passo, e como temperature e top-p mudam o caráter da saída.
2026-02-19Capítulo 1 — O que é, afinal, um Grande Modelo de Linguagem?
Primeiro post do passeio capítulo a capítulo pelo LLM Primer I. O que "grande", "linguagem" e "modelo" realmente significam, como saímos dos sistemas baseados em regras até as redes neurais, e três mitos que vale a pena desfazer logo de cara.
2026-02-18A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez
A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.
2026-02-15