A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez

A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.


A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez

A Série LLM Primer

Um guia de campo para a IA generativa, escrito um volume por vez — por Shohei Shimoda, para profissionais que precisam trabalhar com LLMs de verdade, não apenas falar sobre eles.


O que esta série é

A IA generativa estĂĄ em toda parte agora, mas a maior parte do que se escreve sobre ela cai em dois extremos. De um lado, manchetes que tratam o assunto como mĂĄgica. Do outro, artigos tĂ©cnicos que exigem ĂĄlgebra linear pesada antes mesmo do parĂĄgrafo dois. Entre esses dois extremos sobra muito pouco — e Ă© justamente nesse vĂŁo que profissionais reais precisam tomar decisĂ”es reais todos os dias.

A SĂ©rie LLM Primer foi pensada para preencher esse vĂŁo. Sete volumes, cada um pegando uma camada diferente do trabalho com grandes modelos de linguagem — dos fundamentos, Ă  matemĂĄtica por baixo, ao RAG, aos agentes, aos sistemas em produção, Ă  escala, Ă  segurança — abrem o capĂŽ de cada camada e mostram como aquilo funciona de um jeito que dĂĄ para usar no dia seguinte. Sem mistificação, mas tambĂ©m sem cair na armadilha de exigir doutorado antes do parĂĄgrafo trĂȘs.

A sĂ©rie Ă© escrita por Shohei Shimoda — engenheiro, fundador e CTO. A voz Ă© a mesma em todos os volumes: clara, direta, com o cuidado de explicar o porquĂȘ antes do como. Um volume puxa o outro, mas cada um se sustenta sozinho. VocĂȘ pode entrar pelo Volume I e seguir a sequĂȘncia, ou pular para o volume que resolve o seu problema agora.

Para quem Ă© esta sĂ©rie: engenheiros que estĂŁo entrando no lado generativo, lĂ­deres tĂ©cnicos que precisam tomar boas decisĂ”es sem fingir entender, profissionais de ĂĄreas vizinhas — dados, segurança, plataforma, suporte — que sentem o terreno mudando sob os pĂ©s, e pessoas curiosas que cansaram das manchetes e querem ver de perto como a coisa de fato funciona.

Como ler esta pĂĄgina

Cada volume abaixo lista o seu sumĂĄrio completo, organizado por Parte. Vamos publicar um artigo de passeio capĂ­tulo a capĂ­tulo para cada capĂ­tulo da sĂ©rie. CapĂ­tulos que jĂĄ tĂȘm passeio publicado aparecem com link; capĂ­tulos cujo passeio ainda estĂĄ por vir aparecem em texto puro.

Os apĂȘndices estĂŁo listados por transparĂȘncia, mas sĂŁo conteĂșdo exclusivo do livro — material de referĂȘncia, cheat sheets, exercĂ­cios com solução, e tudo o que pertence ao fim do livro em vez de um artigo separado. Para ter os apĂȘndices, Ă© ler o livro mesmo.


Volume I — How Generative AI Works

Um guia claro e prĂĄtico para os fundamentos dos Grandes Modelos de Linguagem.

A rampa de acesso, em linguagem comum, para a sĂ©rie inteira. Partindo do zero — tokens, treinamento, e o ato simples de prever o prĂłximo token — ele constrĂłi uma fotografia honesta e sem jargĂŁo do que Ă© um LLM, como ele Ă© treinado, e por que se comporta do jeito que se comporta, sem pressupor base anterior. É a fundação sobre a qual todos os volumes seguintes se erguem.

DisponĂ­vel na Amazon: LLM Primer I: How Generative AI Works

Capa do LLM Primer I

Introdução da sĂ©rie: LLM Primer I — passeio capĂ­tulo a capĂ­tulo: introdução e Ă­ndice

Parte I — Os fundamentos

CapĂ­tulo 1 —O que Ă©, afinal, um Grande Modelo de Linguagem?
Capítulo 2 —Probabilidade, tokens e texto
Capítulo 3 —Como o texto flui dentro do modelo

Parte II — Como o modelo aprende e onde tropeça

Capítulo 4 —Como o modelo aprende
Capítulo 5 —Ainda há pequenos defeitos
CapĂ­tulo 6 —Segurança, alinhamento, e o que "ser Ăștil" realmente significa

Parte III — Trabalhando com o modelo

Capítulo 7 —Engenharia de prompt como ofício de campo
Capítulo 8 —Quando um modelo não basta: ferramentas e agentes
Capítulo 9 —RAG: costurando informação fresca no contexto

Parte IV — O panorama mais amplo

CapĂ­tulo 10 —Multimodal: para alĂ©m do texto
Capítulo 11 —Modelos menores, modelos mais espertos
Capítulo 12 —Construir um sistema LLM, e o que vem depois

ApĂȘndices (apenas no livro)

A —Glossário de LLM
B —A matemática por trás da atenção
C —Cheat sheet de prompting
D —Ferramentas e bibliotecas
E —Leituras recomendadas

Volume II — Language Models Through Mathematics

Explorando o funcionamento interno da IA com olhar matemĂĄtico.

Um passeio matematicamente rigoroso, mas legĂ­vel, pelas entranhas da IA: atenção, dinĂąmica de otimização, paisagem de perda, comportamento sob escala — explicados pela matemĂĄtica que faz tudo aquilo funcionar. Cada equação que importa Ă© derivada por inteiro, e cada uma vem embrulhada em uma histĂłria, uma analogia e um exemplo numĂ©rico trabalhado. Para quem quer a matemĂĄtica que o primeiro volume deixou nas notas laterais.

DisponĂ­vel na Amazon: LLM Primer II: Language Models Through Mathematics

Capa do LLM Primer II

Introdução da sĂ©rie: LLM Primer II — passeio capĂ­tulo a capĂ­tulo: introdução e Ă­ndice

Parte I — Fundamentos e ferramentas

Capítulo 1 —Intuição matemática para modelos de linguagem
Capítulo 2 —Os LLMs em contexto
Capítulo 3 —Ferramentas matemáticas

Parte II — A arquitetura do transformer

Capítulo 4 —Atenção
CapĂ­tulo 5 —Posição, ordem e estrutura de sequĂȘncia
Capítulo 6 —Blocos do transformer
CapĂ­tulo 7 —EficiĂȘncia e variantes do transformer

Parte III — Treinamento, alinhamento e avaliação

Capítulo 8 —Como os modelos aprendem
Capítulo 9 —Treinamento em escala
Capítulo 10 —Matemática do pós-treinamento e alinhamento
CapĂ­tulo 11 —Avaliação, calibração e inferĂȘncia

Parte IV — AplicaçÔes, limites e prĂĄtica

CapĂ­tulo 12 —AplicaçÔes reais dos LLMs
CapĂ­tulo 13 —LimitaçÔes, riscos e desafios em aberto
Capítulo 14 —Conhecimento prático para engenheiros

ApĂȘndices (apenas no livro)

O cheat sheet matemĂĄtico dos LLMs
Uma perspectiva estatĂ­stica sobre LLMs
Perguntas que as pessoas fazem
DerivaçÔes trabalhadas
Exercícios, com soluçÔes
Índice de símbolos
Um forward pass completo, em nĂșmeros
Uma linha do tempo das ideias

Volume III — Enhancing Enterprise AI with RAG

Um guia pråtico para construir sistemas de geração aumentada por recuperação para o ambiente corporativo.

RAG na prĂĄtica — bancos de vetores, estratĂ©gias de chunking, e a arquitetura de ancorar o modelo nos seus prĂłprios documentos para ter respostas corporativas confiĂĄveis, atualizadas e rastreĂĄveis. É o volume que se lĂȘ quando o seu trabalho Ă© entregar funcionalidades de IA que precisam continuar atuais e precisam citar a fonte.

Capa do LLM Primer III

Parte I — Fundamentos do RAG

Capítulo 1 —A evolução da arquitetura RAG

Parte II — Ingestão, parsing e chunking de dados

Capítulo 2 —Parsing inteligente de documentos
Capítulo 3 —Frameworks avançados de chunking

Parte III — Bancos de vetores e otimização de recuperação

Capítulo 4 —Escolhendo o banco de vetores certo
Capítulo 5 —Arquitetando o pipeline de recuperação

Parte IV — Segurança, privacidade e controle de acesso

Capítulo 6 —Modelos de ameaça e vulnerabilidades do RAG
Capítulo 7 —Implementando controle de acesso
Capítulo 8 —Anonimização de dados no pipeline RAG

Parte V — Avaliação, monitoramento e manutenção

Capítulo 9 —A tríade de avaliação do RAG
CapĂ­tulo 10 —Frameworks de avaliação de referĂȘncia
CapĂ­tulo 11 —AtualizaçÔes contĂ­nuas e otimização do pipeline

ApĂȘndices (apenas no livro)

A —Fórmulas matemáticas essenciais para otimização de RAG
B —Exemplos de system prompts para anonimização e avaliação
C —Matrizes de decisão de bancos de vetores e ferramentas
D —Datasets de benchmark para avaliação de RAG

Volume IV — Designing AI Cognition with MCP

Engenharia de contexto, ferramentas e memĂłria para agentes de IA confiĂĄveis.

Modelagem estruturada de contexto e orquestração: como dar forma ao raciocĂ­nio de um modelo desenhando o contexto e as situaçÔes que ele vĂȘ, em vez de mexer no modelo. É o volume que se lĂȘ quando se estĂĄ construindo sistemas agentivos — inventĂĄrios de ferramentas, loops longos, memĂłria entre sessĂ”es, e a disciplina de desenhar com cuidado o que o modelo vai enxergar.

Capa do LLM Primer IV

Parte I — A mudança de paradigma na integração de IA

Capítulo 1 —A crise da integração de IA e o surgimento da arquitetura agentiva
Capítulo 2 —Apresentando o Model Context Protocol (MCP)

Parte II — A mecñnica central do MCP

Capítulo 3 —Primitivas de servidor — expondo contexto e capacidades
Capítulo 4 —Primitivas de cliente — comportamentos agentivos e controle
Capítulo 5 —Protocolos de transporte e descoberta

Parte III — PadrĂ”es de orquestração multi-agente

CapĂ­tulo 6 —EstratĂ©gias fundamentais de orquestração
CapĂ­tulo 7 —PadrĂ”es colaborativos avançados e dinĂąmicos
Capítulo 8 —Topologias de implantação arquitetural

Parte IV — Cognição da IA: contexto e memória

Capítulo 9 —Administrando o orçamento de atenção
Capítulo 10 —Memória para tarefas de longo prazo

Parte V — Segurança de workflows agentivos

Capítulo 11 —Superfícies de ataque e vulnerabilidades do protocolo
Capítulo 12 —Endurecimento de protocolo e defesas

Parte VI — Engenharia de produção e escala

Capítulo 13 —Frameworks e integração com nuvem
Capítulo 14 —Benchmarking, testes e performance

ApĂȘndices (apenas no livro)

A —ReferĂȘncia rĂĄpida e cheat sheet de MCP
B —Blueprints de implementação e exemplos de código
C —Checklists de prontidão de produção e segurança
D —EspecificaçÔes avançadas e Standard Enhancement Proposals (SEPs)
E —Benchmarks e dados de performance
F —Recursos oficiais e links do ecossistema

Volume V — Building Real-World LLM Applications

Projetar, avaliar e operar sistemas LLM em produção.

Um guia focado em sistema, do protótipo à produção — design de API, loops de avaliação, monitoramento e integração — transformando um modelo capaz em um produto confiável. É o volume que transforma a compreensão da arquitetura em serviços que rodam, com usuários reais em cima.

Capa do LLM Primer V

Parte I — Fundamentos da engenharia de IA

Capítulo 1 —A disciplina da engenharia de IA
Capítulo 2 —Modelos de fundação e engenharia de prompt

Parte II — Capacidades agentivas e de recuperação

Capítulo 3 —Geração aumentada por recuperação (RAG)
Capítulo 4 —Agentes de IA e chamada de ferramentas

Parte III — Qualidade e observabilidade

CapĂ­tulo 5 —Avaliando aplicaçÔes LLM
Capítulo 6 —Observabilidade e tracing de IA

Parte IV — Segurança, escala e otimização

Capítulo 7 —Segurança de LLM e guarda-fios
Capítulo 8 —Otimizando performance, serving e custo

ApĂȘndices (apenas no livro)

A —Checklists de prontidão de produção e segurança
B —Matrizes de seleção de ferramentas e frameworks
C —Protocolos, streaming e saídas estruturadas
D —Arquitetura de rate limiting e gestão de custos
E —GlossĂĄrio de mĂ©tricas e termos de engenharia de IA

Volume VI — Scaling AI Systems

Arquitetando inferĂȘncia de LLM com baixa latĂȘncia para a escala de produção.

Arquitetando inferĂȘncia de alta performance: serving distribuĂ­do, otimização de latĂȘncia e modelagem de custo para sistemas que precisam responder milhĂ”es de vezes por dia. É o volume que se lĂȘ quando o seu sistema de IA passou de um Ășnico servidor e agora precisa se comportar como infraestrutura de verdade.

Capa do LLM Primer VI

Parte I — Fundamentos da inferĂȘncia de LLM

Capítulo 1 —A mecñnica da geração de tokens
Capítulo 2 —O desafio da cache de chave-valor (KV)

Parte II — O substrato de hardware

Capítulo 3 —GPUs de data center para IA generativa
Capítulo 4 —Silício especializado e ASICs para IA

Parte III — Otimização de modelo (compressão)

Capítulo 5 —Desmistificando a quantização
Capítulo 6 —Pruning e destilação de conhecimento

Parte IV — OtimizaçÔes de sistema e engine

CapĂ­tulo 7 —EstratĂ©gias avançadas de batching
Capítulo 8 —Gestão de KV cache de próxima geração
Capítulo 9 —Decodificação especulativa

Parte V — Frameworks de serving e orquestração

Capítulo 10 —A camada de engine de LLM
Capítulo 11 —A camada de plataforma e orquestração
Capítulo 12 —Serving desagregado e Kubernetes
Capítulo 13 —Autoscaling e mitigação de cold start

Parte VI — Economia em nível de aplicação e TCO

Capítulo 14 —Economia de tokens e preço de API
Capítulo 15 —APIs serverless vs. infraestrutura dedicada
CapĂ­tulo 16 —EstratĂ©gias de corte de custo em produção

ApĂȘndices (apenas no livro)

A —FĂłrmulas matemĂĄticas e referĂȘncia de modelagem de custo
B —Guia de especificaçÔes de hardware e aceleradores
C —ConfiguraçÔes de deployment e snippets de cĂłdigo
D —Metodologia de benchmarking e definição de mĂ©tricas

Volume VII — AI Security

Defendendo sistemas LLM contra prompt injection, jailbreaks e ameaças adversariais.

Projetando IA segura e robusta: riscos adversariais, prompt injection, frameworks de governança e design defensivo para sistemas que vĂŁo para o mundo real. É o volume que se lĂȘ quando o seu sistema de IA precisa ser tratado como infraestrutura sensĂ­vel Ă  segurança.

Capa do LLM Primer VII

Parte I — Fundamentos de segurança de IA

CapĂ­tulo 1 —Por que segurança de IA Ă© diferente
Capítulo 2 —Modelagem de ameaças para sistemas LLM
Capítulo 3 —Segurança de dados e privacidade

Parte II — Segurança de prompt e interação

Capítulo 4 —Prompt injection e jailbreaks
Capítulo 5 —Validação de entrada e filtragem de saída
Capítulo 6 —Riscos de geração aumentada por recuperação

Parte III — Robustez e confiabilidade do modelo

CapĂ­tulo 7 —AlucinaçÔes e confiabilidade
Capítulo 8 —Ataques adversariais a modelos
Capítulo 9 —Integridade do modelo e riscos de cadeia de suprimentos

Parte IV — Arquitetura de segurança em nível de sistema

Capítulo 10 —Projetando arquiteturas LLM seguras
Capítulo 11 —Observabilidade, logging e resposta a incidentes
Capítulo 12 —Controle de acesso e identidade

Parte V — Governança, Ă©tica e compliance

Capítulo 13 —Panorama regulatório
CapĂ­tulo 14 —ViĂ©s, justiça e IA responsĂĄvel
Capítulo 15 —Construindo uma organização de IA segura

Parte VI — Tópicos avançados

Capítulo 16 —Fine-tuning seguro e adaptação
Capítulo 17 —Ameaças futuras e defesas emergentes

ApĂȘndices (apenas no livro)

A —Checklist de segurança de IA para sistemas em produção
B —Template de modelagem de ameaças
C —PadrĂ”es de design seguro para prompts
D —Template de resposta a incidentes para aplicaçÔes LLM
E —Ferramentas e frameworks recomendados

Como esta pĂĄgina cresce

Esta pĂĄgina vai sendo atualizada Ă  medida que cada volume da sĂ©rie Ă© publicado, e Ă  medida que os artigos de passeio para cada capĂ­tulo vĂŁo ao ar. Os Volumes III a VII jĂĄ tĂȘm o sumĂĄrio completo acima; os artigos de passeio desses capĂ­tulos vĂŁo entrando aqui conforme forem sendo escritos.

Favorite esta pågina se quiser acompanhar a série conforme ela se desenrola. Ou assine o feed do canal para receber cada post novo no dia em que ele estreia.


Comece pelo Volume I. Doze capĂ­tulos com o caminho completo: o que Ă© um LLM, como o texto vira tokens e embeddings, como atenção e transformer movem tudo aquilo, como o modelo Ă© treinado, onde ele tropeça, e como tudo se costura em sistemas reais. Pegue o LLM Primer I na Amazon →
Depois vĂĄ mais fundo com o Volume II. A matemĂĄtica que estĂĄ embaixo de toda essa maquinaria — derivada com cuidado, embrulhada em histĂłria, analogia e exemplo numĂ©rico. Pegue o LLM Primer II na Amazon →

SHO
SHO
CTO e Fundador da RECEIPTROLLER. Focado em dados, movido pela inovação, sempre curioso.