LLM Primer I — passeio capítulo a capítulo: introdução e índice

O que vem nos próximos doze posts, e como tirar o melhor proveito dessa leitura — antes de (talvez) decidir mergulhar no livro inteiro.

O que esta série é, e o que não é

Antes de qualquer coisa, vale deixar uma coisa clara. Os doze posts que começam amanhã não são um substituto do livro. São, antes, uma espécie de mapa — um passeio por cada capítulo, mostrando o que está em jogo, qual é a ideia central, e por que aquela peça importa para o quadro maior.

Se você já lida com LLMs no dia a dia, esta série deve servir como uma forma rápida de ver se há buracos no seu modelo mental que valem a pena tapar. Se você está começando agora, vai ganhar uma base de vocabulário e intuição que torna a leitura do livro completo bem mais leve. Em ambos os casos, o objetivo é o mesmo: deixar o assunto menos misterioso, sem perder a precisão.

Como o Livro 1 está organizado

O LLM Primer I segue uma ordem que foi cuidadosamente pensada, não acidental. Os primeiros três capítulos constroem o vocabulário e os mecanismos — o que é um LLM, como o texto vira tokens e probabilidades, e como o transformer movimenta tudo aquilo internamente.

Os capítulos 4 e 5 abrem o capô do treinamento — pré-treinamento, fine-tuning, RLHF — e em seguida olham, com honestidade, para o que ainda não vai bem: alucinação, lacunas temporais, problemas de cálculo, oscilações de consistência.

O capítulo 6 entra no terreno mais sutil de toda a série: alinhamento, segurança, e o que de fato significa um modelo ser "útil". A edição de 2026 traz aqui uma seção nova (§6.6) com pesquisas recentes em IA Constitucional e modelos baseados em debate.

Do capítulo 7 em diante, o foco muda do como funciona para o como usar. Engenharia de prompt, ferramentas e agentes (com a nova §8.6 sobre padrões agentivos), RAG, multimodalidade, e o capítulo 11 — com a §11.6 nova, dedicada inteiramente a modelos de raciocínio. O capítulo 12 fecha o livro montando tudo em um quadro de sistemas, e apontando o caminho para os Livros 2 a 7.

Como ler estes posts

Cada post traz três coisas: um resumo da pergunta central que o capítulo enfrenta, os principais movimentos conceituais (com os termos técnicos explicados de forma simples), e uma ponte para o próximo capítulo. Vão ser leituras de cinco a oito minutos cada — pensadas para acompanhar um café da manhã, não um fim de semana inteiro.

Se um post fisgar especialmente, o capítulo correspondente do livro vai muito mais fundo, com diagramas, exemplos, e os boxes "Em Linguagem Simples" que reformulam cada ideia técnica em uma frase do cotidiano.

O índice — o que vem quando

A seguir, o calendário completo dos doze posts. Cada um vai aparecer no horário marcado, em ordem, sem pular. Se um deles ainda não estiver no ar quando você ler isto, a data ali na frente diz quando ele entra.

18 de fevereiro — Capítulo 1: O que é, afinal, um Grande Modelo de Linguagem? Por que esta pergunta é menos óbvia do que parece, e os três mitos que vale a pena desfazer logo de cara.

19 de fevereiro — Capítulo 2: Probabilidade, tokens e texto. O que tokens realmente são, por que o modelo sempre produz uma distribuição inteira em vez de "a resposta", e por que mexer em temperature e top-p muda o caráter da saída.

20 de fevereiro — Capítulo 3: Como o texto flui dentro do modelo. Embeddings, atenção, e a arquitetura transformer — sem tropeçar em matrizes nem perder a precisão.

21 de fevereiro — Capítulo 4: Como o modelo aprende. Pré-treinamento, fine-tuning, RLHF — e qual estágio molda o quê.

22 de fevereiro — Capítulo 5: Onde ainda escorrega. Alucinação, tempo, cálculo, consistência — por que essas falhas não são bugs, mas características do mesmo mecanismo.

23 de fevereiro — Capítulo 6: Segurança, alinhamento, e o significado real de "ser útil". Mais a seção nova §6.6 sobre IA Constitucional e modelos de debate.

24 de fevereiro — Capítulo 7: Engenharia de prompt como ofício de campo. Os quatro padrões que carregam o peso real, e por que funcionam.

25 de fevereiro — Capítulo 8: Quando um modelo não basta — uso de ferramentas e agentes. Mais §8.6 com padrões agentivos: ReAct, planejador-executor, reflexão.

26 de fevereiro — Capítulo 9: RAG — como costurar informação fresca no contexto do modelo. O que separa um RAG bom de um ruim.

27 de fevereiro — Capítulo 10: Multimodalidade. Como o mesmo transformer passa a aceitar imagens e áudio, e o que ainda escapa dele.

28 de fevereiro — Capítulo 11: Modelos menores, modelos mais espertos. Destilação, quantização, MoE — e a seção nova §11.6 sobre modelos de raciocínio.

1º de março — Capítulo 12: Construir um sistema LLM — e o que vem depois. O fechamento do livro, e a ponte para os Livros 2 a 7 da série.

Já quer o quadro inteiro de uma vez? LLM Primer I: How Generative AI Works — edição 2026 — é o que esses doze posts estão amostrando. Ver na Amazon →

Até amanhã, com o Capítulo 1.