Introdução ao LLM
Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.
Capítulo 14 — Benchmarking, Testes e Desempenho
Décima quarta e última postagem do passeio pelo LLM Primer IV. O MCP-Universe Benchmark em servidores reais, os dois modos de falha sistêmicos que ele expôs, o gap de dez vezes de throughput entre sessão-por-requisição e pools de sessão compartilhados, e a ponte para o Volume V.
2026-04-12Capítulo 10 — Memória de Tarefa de Horizonte Longo
Décima postagem do passeio pelo LLM Primer IV. Memória de curto prazo via janelas e scratchpads ReAct, memória de longo prazo via vetores episódicos e stores semânticos, e as técnicas de compactação que mantêm um agente produtivo ao longo de horas e dias.
2026-04-08Capítulo 9 — Gerenciando o Orçamento de Atenção
Nona postagem do passeio pelo LLM Primer IV. Context rot, o precipício de lost-in-the-middle, tool-loadout rot, e as três respostas arquiteturais — MCP, RAG, fine-tuning — para a pergunta de onde o conhecimento ausente de um modelo de fato pertence.
2026-04-07Capítulo 6 — Estratégias Fundamentais de Orquestração
Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?
2026-04-04Capítulo 4 — Primitivas de Cliente: Comportamentos Agênticos e Controle
Quarta postagem do passeio pelo LLM Primer IV. Sampling, Roots e Elicitation são os três pequenos buracos controlados que o MCP abre na parede host-servidor — cada um uma capacidade concedida de volta, cada um um risco aceito em nome do usuário.
2026-04-02Capítulo 3 — Primitivas de Servidor: Expondo Contexto e Capacidades
Terceira postagem do passeio pelo LLM Primer IV. Os três substantivos que um servidor MCP pode oferecer — Resources (estado de leitura), Prompts (andaime reutilizável), Tools (ações de escrita) — seus schemas, seus ciclos de vida, seus modelos de erro, e a disciplina de escolher a primitiva certa.
2026-04-01Capítulo 2 — Revelando o Model Context Protocol (MCP)
Segunda postagem do passeio pelo LLM Primer IV. O que o MCP de fato padroniza, a divisão em três papéis entre Host, Cliente e Servidor, por que descoberta dinâmica e mensageria bidirecional diferem de REST nos casos que importam, e o ciclo de vida de sessão que abre com negociação de capacidades.
2026-03-31Capítulo 1 — A Crise de Integração de IA e a Ascensão da Arquitetura Agêntica
Primeira postagem do passeio pelo LLM Primer IV. Por que agentes monolíticos se esfarrapam conforme prompts de sistema crescem, o problema de integração N vezes M escondido por baixo, e o movimento de engenharia de prompt para engenharia de contexto que o MCP foi feito para habilitar.
2026-03-30LLM Primer IV — Introdução à Série e Índice
Abrindo o passeio capítulo a capítulo pelo Livro IV da série LLM Primer — Projetando a Cognição da IA com MCP. Por que agentes precisam de uma camada de protocolo para escalar além do demoware, para quem este livro foi escrito, e o cronograma das quatorze postagens que se seguem, de 30 de março a 12 de abril.
2026-03-29Capítulo 10 — Principais Frameworks de Avaliação
Décimo post do passeio pelo LLM Primer III. Guia de campo dos frameworks que transformam a Tríade de Avaliação em algo que um time consegue rodar — RAGAS, TruLens, DeepEval de um lado, Braintrust, LangSmith, Phoenix, Galileo, Opik do outro, e o Gap de Avaliação que nenhum deles ainda fechou.
2026-03-27Capítulo 9 — A Tríade de Avaliação de RAG
Nono post do passeio pelo LLM Primer III. Um sistema RAG pode falhar em três lugares distintos e por fora as falhas parecem iguais — a Tríade de Avaliação de Relevância de Contexto, Fidelidade e Relevância da Resposta é o pequeno vocabulário que impede consertar um bug enquanto se mede outro.
2026-03-26Capítulo 2 — Probabilidade, tokens e texto
Segundo post do passeio capítulo a capítulo pelo LLM Primer I. Como tokens diferem de palavras, o que é a distribuição de probabilidade que o modelo produz a cada passo, e como temperature e top-p mudam o caráter da saída.
2026-02-19A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez
A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.
2026-02-15