Introdução ao LLM
Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.
Capítulo 14 — Benchmarking, Testes e Desempenho
Décima quarta e última postagem do passeio pelo LLM Primer IV. O MCP-Universe Benchmark em servidores reais, os dois modos de falha sistêmicos que ele expôs, o gap de dez vezes de throughput entre sessão-por-requisição e pools de sessão compartilhados, e a ponte para o Volume V.
2026-04-12Capítulo 13 — Frameworks e Integração com Nuvem
Décima terceira postagem do passeio pelo LLM Primer IV. Strands com Bedrock, o padrão de camada de estado AWS, o Microsoft Agent Framework, LangChain, Semantic Kernel — e os três formatos de integração de produção em que times chegam independentemente.
2026-04-11Capítulo 12 — Endurecimento do Protocolo e Defesas
Décima segunda postagem do passeio pelo LLM Primer IV. Os quatro clusters de defesa — atestação criptográfica, disciplina de escopo OAuth com sessões limitadas, sandbox em runtime, e portões humano-no-loop — compõem numa postura que não depende do modelo se comportar corretamente sob condições adversárias.
2026-04-10Capítulo 10 — Memória de Tarefa de Horizonte Longo
Décima postagem do passeio pelo LLM Primer IV. Memória de curto prazo via janelas e scratchpads ReAct, memória de longo prazo via vetores episódicos e stores semânticos, e as técnicas de compactação que mantêm um agente produtivo ao longo de horas e dias.
2026-04-08Capítulo 9 — Gerenciando o Orçamento de Atenção
Nona postagem do passeio pelo LLM Primer IV. Context rot, o precipício de lost-in-the-middle, tool-loadout rot, e as três respostas arquiteturais — MCP, RAG, fine-tuning — para a pergunta de onde o conhecimento ausente de um modelo de fato pertence.
2026-04-07Capítulo 6 — Estratégias Fundamentais de Orquestração
Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?
2026-04-04LLM Primer IV — Introdução à Série e Índice
Abrindo o passeio capítulo a capítulo pelo Livro IV da série LLM Primer — Projetando a Cognição da IA com MCP. Por que agentes precisam de uma camada de protocolo para escalar além do demoware, para quem este livro foi escrito, e o cronograma das quatorze postagens que se seguem, de 30 de março a 12 de abril.
2026-03-29Capítulo 11 — Atualizações Contínuas e Otimização do Pipeline
Décimo primeiro e último post do passeio pelo LLM Primer III. CDC e indexação incremental mantêm o corpus fresco, semantic caching e tiering de modelo seguram a latência, e um loop de feedback de quatro estágios fecha o gap entre o que a produção conta para o time e o que o time de fato muda — mais a ponte para o Volume IV sobre Model Context Protocol.
2026-03-28Capítulo 10 — Principais Frameworks de Avaliação
Décimo post do passeio pelo LLM Primer III. Guia de campo dos frameworks que transformam a Tríade de Avaliação em algo que um time consegue rodar — RAGAS, TruLens, DeepEval de um lado, Braintrust, LangSmith, Phoenix, Galileo, Opik do outro, e o Gap de Avaliação que nenhum deles ainda fechou.
2026-03-27Capítulo 9 — A Tríade de Avaliação de RAG
Nono post do passeio pelo LLM Primer III. Um sistema RAG pode falhar em três lugares distintos e por fora as falhas parecem iguais — a Tríade de Avaliação de Relevância de Contexto, Fidelidade e Relevância da Resposta é o pequeno vocabulário que impede consertar um bug enquanto se mede outro.
2026-03-26Capítulo 8 — Anonimização de Dados no Pipeline RAG
Oitavo post do passeio pelo LLM Primer III. Anonimização pré-geração versus pós-geração, as três famílias de técnica — mascaramento, substituição sintética, privacidade diferencial — e o tradeoff utilidade-privacidade que determina se o sistema permanece útil.
2026-03-25Capítulo 7 — Implementando Controle de Acesso
Sétimo post do passeio pelo LLM Primer III. ACLs em nível de documento como fundação, RBAC com rótulos de sensibilidade do Microsoft Purview, ReBAC com Zanzibar e SpiceDB, e a disciplina de pré-filtro versus pós-filtro que corre por baixo de todos eles.
2026-03-24Capítulo 6 — Modelos de Ameaça e Vulnerabilidades em RAG
Sexto post do passeio pelo LLM Primer III. A superfície expandida de ataque da recuperação — envenenamento de corpus, chunks adversariais, injection indireta de prompt, inversão de embedding e o problema do deputado confuso em RAG agêntico. Ataques concretos, cada um demonstrado, cada um reprodutível.
2026-03-23Capítulo 5 — Arquitetando o Pipeline de Recuperação
Quinto post do passeio pelo LLM Primer III. Por que uma única busca vetorial não é um pipeline — recuperação híbrida, reciprocal rank fusion, reranking com cross-encoder, e rewriting e HyDE do lado da query — montados na arquitetura de produção para a qual sistemas RAG maduros convergem.
2026-03-22Capítulo 4 — Escolhendo o Banco de Dados Vetorial Certo
Quarto post do passeio pelo LLM Primer III. A separação arquitetural entre bancos vetoriais dedicados e extensões estilo Postgres, as líderes gerenciadas (Pinecone, Vertex), o campo open-source (Qdrant, Milvus, Weaviate), as opções embedded, e os três eixos operacionais — residência, ops, custo — que decidem a escolha real.
2026-03-21Capítulo 3 — Frameworks Avançados de Chunking
Terceiro post do passeio pelo LLM Primer III. O espectro de chunking de tamanho fixo a consciente de estrutura, o mito do overlap, o penhasco de contexto que destrói a recuperação em silêncio, e as técnicas de recuperação contextual e late chunking que reformularam a fronteira.
2026-03-20Capítulo 2 — Parsing Inteligente de Documentos
Segundo post do passeio pelo LLM Primer III. Por que um PDF não é um arquivo de texto, o que os parsers conscientes de layout de fato preservam, o panorama atual de ferramentas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), e a trilha multimodal que recupera direto sobre imagens de página.
2026-03-19Capítulo 1 — A Evolução da Arquitetura RAG
Primeiro post do passeio pelo LLM Primer III. As quatro posturas arquiteturais de RAG — Naive, Avançada, Modular, Agêntica — lidas como uma história de entregar mais agência ao LLM uma decisão por vez, e a resposta honesta para quando fine-tuning é a ferramenta melhor do que recuperação.
2026-03-18LLM Primer III — Introdução da Série e Índice
Abertura do passeio capítulo a capítulo pelo Livro III da série LLM Primer — Aprimorando a IA Empresarial com RAG. Por que a geração aumentada por recuperação parece simples por fora e é uma pilha de disciplinas por dentro, para quem este livro foi escrito, e o cronograma dos onze posts que seguem, de 18 a 28 de março.
2026-03-17Capítulo 11 — Avaliação, Calibração e Inferência
Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer II. Como medir uma máquina que pode dizer qualquer coisa — perplexidade, calibração, barras de erro de benchmark e geometria da recuperação para conter alucinação.
2026-03-13Capítulo 9 — RAG: costurando informação fresca no contexto
Nono post do passeio capítulo a capítulo pelo LLM Primer I. O que RAG (Retrieval-Augmented Generation) realmente faz, como apoia a lacuna temporal e a exatidão do modelo, e onde começa a diferença entre um RAG bom e um ruim.
2026-02-26Capítulo 8 — Quando um modelo não basta: ferramentas e agentes
Oitavo post do passeio capítulo a capítulo pelo LLM Primer I. O terreno onde o modelo ganha braços — uso de ferramentas, chamada de função, agentes — e o §8.6 novo da edição 2026 com padrões agentivos como ReAct, planejador-executor e reflexão.
2026-02-25Capítulo 5 — Ainda há pequenos defeitos
Quinto post do passeio capítulo a capítulo pelo LLM Primer I. Por que alucinação, lacunas temporais, problemas de cálculo e oscilações de consistência não são bugs, mas características do mesmo mecanismo de previsão de próximo token.
2026-02-22A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez
A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.
2026-02-15Introdução aos Grandes Modelos de Linguagem (LLMs) - Guia Completo para Engenheiros
Explore os fundamentos dos Grandes Modelos de Linguagem (LLMs), incluindo o treinamento, as aplicações e os desafios. Um guia completo para engenheiros que querem entender o impacto dos LLMs no aprendizado de máquina e no processamento de linguagem natural.
2024-09-01