Introdução ao LLM
Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.
Capítulo 14 — Benchmarking, Testes e Desempenho
Décima quarta e última postagem do passeio pelo LLM Primer IV. O MCP-Universe Benchmark em servidores reais, os dois modos de falha sistêmicos que ele expôs, o gap de dez vezes de throughput entre sessão-por-requisição e pools de sessão compartilhados, e a ponte para o Volume V.
2026-04-12Capítulo 13 — Frameworks e Integração com Nuvem
Décima terceira postagem do passeio pelo LLM Primer IV. Strands com Bedrock, o padrão de camada de estado AWS, o Microsoft Agent Framework, LangChain, Semantic Kernel — e os três formatos de integração de produção em que times chegam independentemente.
2026-04-11Capítulo 12 — Endurecimento do Protocolo e Defesas
Décima segunda postagem do passeio pelo LLM Primer IV. Os quatro clusters de defesa — atestação criptográfica, disciplina de escopo OAuth com sessões limitadas, sandbox em runtime, e portões humano-no-loop — compõem numa postura que não depende do modelo se comportar corretamente sob condições adversárias.
2026-04-10Capítulo 11 — Superfícies de Ataque e Vulnerabilidades de Protocolo
Décima primeira postagem do passeio pelo LLM Primer IV. Os ataques clássicos adaptados ao MCP — Confused Deputy, Token Passthrough, Session Hijacking — os defeitos no nível de protocolo em torno de escalada de capacidade e sampling não-autenticado, e a propagação implícita de confiança que torna envenenamento de contexto problema estrutural em vez de higiene.
2026-04-09Capítulo 8 — Layouts Arquiteturais de Deployment
Oitava postagem do passeio pelo LLM Primer IV. Os três layouts de deployment que emergiram no ecossistema MCP — agente reutilizável, pureza estrita, híbrido — e as quatro restrições determinantes que decidem qual encaixa em qual projeto.
2026-04-06Capítulo 7 — Padrões Avançados Colaborativos e Dinâmicos
Sétima postagem do passeio pelo LLM Primer IV. Consenso roundtable, roteamento por handoff, e orquestração magentic — os padrões que emergem quando a topologia precisa ser construída por requisição, com os modos de falha (não-terminação, mis-routing, planejamento desbocado) que os padrões mais simples evitam.
2026-04-05Capítulo 5 — Protocolos de Transporte e Descoberta
Quinta postagem do passeio pelo LLM Primer IV. Os três transportes que o MCP suporta, a camada de descoberta .well-known com Server Cards, e as preocupações operacionais sem glamour — CORS, validação de origem, caching — que decidem se um servidor é cidadão de rede cooperativo ou um passivo.
2026-04-03Capítulo 4 — Primitivas de Cliente: Comportamentos Agênticos e Controle
Quarta postagem do passeio pelo LLM Primer IV. Sampling, Roots e Elicitation são os três pequenos buracos controlados que o MCP abre na parede host-servidor — cada um uma capacidade concedida de volta, cada um um risco aceito em nome do usuário.
2026-04-02Capítulo 3 — Primitivas de Servidor: Expondo Contexto e Capacidades
Terceira postagem do passeio pelo LLM Primer IV. Os três substantivos que um servidor MCP pode oferecer — Resources (estado de leitura), Prompts (andaime reutilizável), Tools (ações de escrita) — seus schemas, seus ciclos de vida, seus modelos de erro, e a disciplina de escolher a primitiva certa.
2026-04-01Capítulo 2 — Revelando o Model Context Protocol (MCP)
Segunda postagem do passeio pelo LLM Primer IV. O que o MCP de fato padroniza, a divisão em três papéis entre Host, Cliente e Servidor, por que descoberta dinâmica e mensageria bidirecional diferem de REST nos casos que importam, e o ciclo de vida de sessão que abre com negociação de capacidades.
2026-03-31LLM Primer IV — Introdução à Série e Índice
Abrindo o passeio capítulo a capítulo pelo Livro IV da série LLM Primer — Projetando a Cognição da IA com MCP. Por que agentes precisam de uma camada de protocolo para escalar além do demoware, para quem este livro foi escrito, e o cronograma das quatorze postagens que se seguem, de 30 de março a 12 de abril.
2026-03-29Capítulo 8 — Anonimização de Dados no Pipeline RAG
Oitavo post do passeio pelo LLM Primer III. Anonimização pré-geração versus pós-geração, as três famílias de técnica — mascaramento, substituição sintética, privacidade diferencial — e o tradeoff utilidade-privacidade que determina se o sistema permanece útil.
2026-03-25Capítulo 7 — Implementando Controle de Acesso
Sétimo post do passeio pelo LLM Primer III. ACLs em nível de documento como fundação, RBAC com rótulos de sensibilidade do Microsoft Purview, ReBAC com Zanzibar e SpiceDB, e a disciplina de pré-filtro versus pós-filtro que corre por baixo de todos eles.
2026-03-24Capítulo 6 — Modelos de Ameaça e Vulnerabilidades em RAG
Sexto post do passeio pelo LLM Primer III. A superfície expandida de ataque da recuperação — envenenamento de corpus, chunks adversariais, injection indireta de prompt, inversão de embedding e o problema do deputado confuso em RAG agêntico. Ataques concretos, cada um demonstrado, cada um reprodutível.
2026-03-23Capítulo 4 — Escolhendo o Banco de Dados Vetorial Certo
Quarto post do passeio pelo LLM Primer III. A separação arquitetural entre bancos vetoriais dedicados e extensões estilo Postgres, as líderes gerenciadas (Pinecone, Vertex), o campo open-source (Qdrant, Milvus, Weaviate), as opções embedded, e os três eixos operacionais — residência, ops, custo — que decidem a escolha real.
2026-03-21LLM Primer III — Introdução da Série e Índice
Abertura do passeio capítulo a capítulo pelo Livro III da série LLM Primer — Aprimorando a IA Empresarial com RAG. Por que a geração aumentada por recuperação parece simples por fora e é uma pilha de disciplinas por dentro, para quem este livro foi escrito, e o cronograma dos onze posts que seguem, de 18 a 28 de março.
2026-03-17Capítulo 11 — Avaliação, Calibração e Inferência
Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer II. Como medir uma máquina que pode dizer qualquer coisa — perplexidade, calibração, barras de erro de benchmark e geometria da recuperação para conter alucinação.
2026-03-13Capítulo 6 — Segurança, alinhamento, e o que "ser útil" realmente significa
Sexto post do passeio capítulo a capítulo pelo LLM Primer I. Por que fluência e utilidade são coisas diferentes, o que o alinhamento realmente refina, e uma prévia do §6.6 novo na edição 2026 — IA Constitucional, modelos de debate, e o que há de mais recente em pesquisa de alinhamento.
2026-02-23Capítulo 5 — Ainda há pequenos defeitos
Quinto post do passeio capítulo a capítulo pelo LLM Primer I. Por que alucinação, lacunas temporais, problemas de cálculo e oscilações de consistência não são bugs, mas características do mesmo mecanismo de previsão de próximo token.
2026-02-22LLM Primer I — passeio capítulo a capítulo: introdução e índice
Introdução do passeio capítulo a capítulo pelo LLM Primer I. Como a série está organizada, o que cada capítulo entrega, e o índice dos doze posts que vêm a seguir entre 18 de fevereiro e 1º de março.
2026-02-17A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez
A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.
2026-02-15