LLM Primer IV — Projetando a Cognição da IA com MCP: Introdução à Série e Índice

"Agentes são tão bons quanto o contexto que enxergam, as ferramentas que conseguem alcançar e a memória que carregam." Bem-vindo ao Livro IV da série LLM Primer — e ao passeio que acompanha o livro. Nos próximos quatorze dias, uma postagem por capítulo, vamos abrir o Model Context Protocol e a camada de cognição que ele torna possível, e olhar para as decisões que determinam se um sistema de agentes funciona em silêncio ou falha em silêncio.

Por que o Livro IV existe

Os Livros I, II e III desta série entregaram o modelo e o aparato de recuperação em volta dele. O Livro I contou a história em linguagem clara do que são os LLMs. O Livro II abriu a matemática por baixo. O Livro III percorreu a arquitetura de produção do RAG. O Livro IV é sobre o que cerca um modelo quando você tenta fazê-lo agir — chamar ferramentas, manter estado entre turnos, coordenar com outros agentes, e fazer tudo isso sem reescrever cola de integração a cada trimestre.

O padrão que quebrou em 2025 foi o agente monolítico: um prompt de sistema longo, um punhado de ferramentas, uma única janela de contexto encarregada de absorver toda preocupação ao mesmo tempo. Funcionava em demos. Esfarrapou em produção conforme prompts cresciam, superfícies de ferramentas expandiam, e cada novo release de modelo exigia mais uma rodada de código adaptador feito sob medida. O diagnóstico convergiu de vários ângulos — diluição de contexto, colisão de instruções, a matriz de integração N vezes M — e apontou para a mesma resposta arquitetural: uma camada de protocolo por baixo do modelo que deixa agentes descobrirem capacidades, negociarem sessões e comporem ferramentas sem que nenhum dos lados precise saber do outro de antemão.

Essa camada é o Model Context Protocol. Este livro o percorre com honestidade, camada por camada. A promessa não é que o MCP resolva todo problema de agente. A promessa é que, no final, você saberá o que o protocolo lhe dá, o que não dá, e quais padrões construídos sobre ele sobrevivem ao contato com produção.

Em uma linha: sistemas agênticos precisam de um protocolo que desacople modelos de ferramentas, uma disciplina para orçar atenção e memória, e um modelo de segurança que leve a proveniência de servidor a sério — e o MCP é a camada onde os três se encontram.

Para quem eu escrevi

Engenheiros construindo sistemas de agentes, PMs técnicos delimitando escopo, e arquitetos que precisam defender as escolhas para uma revisão de segurança. O livro assume que o leitor está confortável com a fotografia do Livro I sobre como um LLM se comporta e com a do Livro III sobre como recuperação é cabeada; não assume a matemática do Livro II. O centro de gravidade é a engenharia: onde moram os modos de falha, quais decisões são reversíveis, e quais prendem o time por anos.

Como ler

Três modos que funcionaram para leitores iniciais. Capa a capa, se você está prestes a começar a construir um sistema de agentes baseado em MCP e quer o protocolo na ordem em que as decisões realmente chegam. Como referência, se você tem um sistema rodando e uma camada específica está doendo — os capítulos sobre transporte, memória e segurança ficam de pé sozinhos. Ou como apoio para a revisão de arquitetura, onde os capítulos viram os disparadores da conversa que um time precisa ter antes de se comprometer com uma topologia de deployment.

O passeio de 14 capítulos

30 de março — Capítulo 1: A Crise de Integração de IA e a Ascensão da Arquitetura Agêntica. Por que agentes monolíticos se esfarrapam, o que é o problema de integração N vezes M, e o movimento de engenharia de prompt para engenharia de contexto.

31 de março — Capítulo 2: Revelando o Model Context Protocol. O que o MCP padroniza, os três papéis (Host, Cliente, Servidor), como a descoberta dinâmica difere de REST, e o ciclo de vida de sessão com negociação de capacidades.

1 de abril — Capítulo 3: Primitivas de Servidor: Expondo Contexto e Capacidades. Resources, Prompts e Tools — os três substantivos que um servidor pode oferecer, seus schemas, seus ciclos de vida, e a disciplina de escolher a primitiva certa para cada coisa.

2 de abril — Capítulo 4: Primitivas de Cliente: Sampling, Roots, Elicitation. A superfície inversa — o que o host devolve ao servidor, e as implicações de segurança de cada capacidade entregue através da fronteira de confiança.

3 de abril — Capítulo 5: Transporte e Descoberta. stdio versus Streamable HTTP, quando escolher cada um, e como servidores e clientes se encontram em deployments locais e remotos.

4 de abril — Capítulo 6: Padrões Fundamentais de Orquestração. O loop de agente, roteamento de ferramentas, gestão de estado intermediário, e os padrões que mantêm o raciocínio de um agente legível.

5 de abril — Capítulo 7: Padrões Avançados de Orquestração. Planner-executor, coordenação multi-agente, decomposição hierárquica, e onde cada padrão paga sua complexidade.

6 de abril — Capítulo 8: Layouts de Deployment. Pureza estrita de MCP versus Agentes de IA Reutilizáveis versus layouts híbridos, e os tradeoffs que cada um impõe ao host.

7 de abril — Capítulo 9: O Orçamento de Atenção. Contexto como recurso gerenciado, o custo de janelas longas, e as políticas que decidem o que entra na visão do modelo a cada turno.

8 de abril — Capítulo 10: Memória de Horizonte Longo. Memória episódica versus semântica, políticas de sumarização, e as arquiteturas que permitem a um agente carregar estado por dias.

9 de abril — Capítulo 11: Superfícies de Ataque em Sistemas MCP. O modelo de ameaça — injeção de prompt via resources, servidores maliciosos, envenenamento de ferramenta, caminhos de exfiltração.

10 de abril — Capítulo 12: Endurecimento do Protocolo. Server cards, UI de consentimento, escopo de capacidades, e os controles operacionais que colocam a política onde ela pertence.

11 de abril — Capítulo 13: Frameworks e Nuvem. O ecossistema em volta do MCP — frameworks de agente, servidores hospedados, registries — e como escolher em que construir.

12 de abril — Capítulo 14: Benchmarking de Agentes. As medições que importam, as que enganam, e como construir um harness de avaliação que sobrevive a uma troca de modelo.

O que muda no Volume IV: os Volumes I e II eram sobre o modelo. O Volume III foi sobre o aparato de recuperação em volta dele. Este é sobre a camada de cognição — o protocolo, a orquestração, a memória, e a segurança que transformam um modelo em algo capaz de agir. A maioria das falhas de agente não são falhas de modelo. São decisões tomadas uma camada acima que nenhuma quantidade de engenharia de prompt recupera.

Sobre este livro e a série

A série LLM Primer é a resposta longa para a pergunta que engenheiros, fundadores e o ocasional regulador me faziam: como esses sistemas de fato funcionam, e o que é preciso para construir um que se segura sob carga? O Livro I deu o formato. O Livro II deu a matemática. O Livro III deu a arquitetura de produção do RAG. O Livro IV dá a camada de cognição que se senta acima do modelo. O Livro V, em curso, vira para construir aplicações LLM de verdade de ponta a ponta.

Quer o panorama completo? LLM Primer IV: Projetando a Cognição da IA com MCP é o livro que esta série está mapeando — com a referência completa do protocolo, playbooks de orquestração, checklists de segurança e templates de deployment que o passeio apenas esboça. LLM Primer IV na Amazon →

Nos vemos amanhã, com o Capítulo 1.

LLM Primer IV — Introdução à Série e Índice