A Série LLM Primer
Um guia de campo para a IA generativa, escrito um volume por vez â por Shohei Shimoda, para profissionais que precisam trabalhar com LLMs de verdade, nĂŁo apenas falar sobre eles.
O que esta série é
A IA generativa estĂĄ em toda parte agora, mas a maior parte do que se escreve sobre ela cai em dois extremos. De um lado, manchetes que tratam o assunto como mĂĄgica. Do outro, artigos tĂ©cnicos que exigem ĂĄlgebra linear pesada antes mesmo do parĂĄgrafo dois. Entre esses dois extremos sobra muito pouco â e Ă© justamente nesse vĂŁo que profissionais reais precisam tomar decisĂ”es reais todos os dias.
A SĂ©rie LLM Primer foi pensada para preencher esse vĂŁo. Sete volumes, cada um pegando uma camada diferente do trabalho com grandes modelos de linguagem â dos fundamentos, Ă matemĂĄtica por baixo, ao RAG, aos agentes, aos sistemas em produção, Ă escala, Ă segurança â abrem o capĂŽ de cada camada e mostram como aquilo funciona de um jeito que dĂĄ para usar no dia seguinte. Sem mistificação, mas tambĂ©m sem cair na armadilha de exigir doutorado antes do parĂĄgrafo trĂȘs.
A sĂ©rie Ă© escrita por Shohei Shimoda â engenheiro, fundador e CTO. A voz Ă© a mesma em todos os volumes: clara, direta, com o cuidado de explicar o porquĂȘ antes do como. Um volume puxa o outro, mas cada um se sustenta sozinho. VocĂȘ pode entrar pelo Volume I e seguir a sequĂȘncia, ou pular para o volume que resolve o seu problema agora.
Para quem Ă© esta sĂ©rie: engenheiros que estĂŁo entrando no lado generativo, lĂderes tĂ©cnicos que precisam tomar boas decisĂ”es sem fingir entender, profissionais de ĂĄreas vizinhas â dados, segurança, plataforma, suporte â que sentem o terreno mudando sob os pĂ©s, e pessoas curiosas que cansaram das manchetes e querem ver de perto como a coisa de fato funciona.
Como ler esta pĂĄgina
Cada volume abaixo lista o seu sumĂĄrio completo, organizado por Parte. Vamos publicar um artigo de passeio capĂtulo a capĂtulo para cada capĂtulo da sĂ©rie. CapĂtulos que jĂĄ tĂȘm passeio publicado aparecem com link; capĂtulos cujo passeio ainda estĂĄ por vir aparecem em texto puro.
Os apĂȘndices estĂŁo listados por transparĂȘncia, mas sĂŁo conteĂșdo exclusivo do livro â material de referĂȘncia, cheat sheets, exercĂcios com solução, e tudo o que pertence ao fim do livro em vez de um artigo separado. Para ter os apĂȘndices, Ă© ler o livro mesmo.
Volume I â How Generative AI Works
Um guia claro e prĂĄtico para os fundamentos dos Grandes Modelos de Linguagem.
A rampa de acesso, em linguagem comum, para a sĂ©rie inteira. Partindo do zero â tokens, treinamento, e o ato simples de prever o prĂłximo token â ele constrĂłi uma fotografia honesta e sem jargĂŁo do que Ă© um LLM, como ele Ă© treinado, e por que se comporta do jeito que se comporta, sem pressupor base anterior. Ă a fundação sobre a qual todos os volumes seguintes se erguem.
DisponĂvel na Amazon: LLM Primer I: How Generative AI Works
|
|
Introdução da sĂ©rie: LLM Primer I â passeio capĂtulo a capĂtulo: introdução e Ăndice
Parte I â Os fundamentos
Parte II â Como o modelo aprende e onde tropeça
Parte III â Trabalhando com o modelo
Parte IV â O panorama mais amplo
ApĂȘndices (apenas no livro)
| A â | GlossĂĄrio de LLM |
| B â | A matemĂĄtica por trĂĄs da atenção |
| C â | Cheat sheet de prompting |
| D â | Ferramentas e bibliotecas |
| E â | Leituras recomendadas |
Volume II â Language Models Through Mathematics
Explorando o funcionamento interno da IA com olhar matemĂĄtico.
Um passeio matematicamente rigoroso, mas legĂvel, pelas entranhas da IA: atenção, dinĂąmica de otimização, paisagem de perda, comportamento sob escala â explicados pela matemĂĄtica que faz tudo aquilo funcionar. Cada equação que importa Ă© derivada por inteiro, e cada uma vem embrulhada em uma histĂłria, uma analogia e um exemplo numĂ©rico trabalhado. Para quem quer a matemĂĄtica que o primeiro volume deixou nas notas laterais.
DisponĂvel na Amazon: LLM Primer II: Language Models Through Mathematics
|
|
Introdução da sĂ©rie: LLM Primer II â passeio capĂtulo a capĂtulo: introdução e Ăndice
Parte I â Fundamentos e ferramentas
Parte II â A arquitetura do transformer
Parte III â Treinamento, alinhamento e avaliação
Parte IV â AplicaçÔes, limites e prĂĄtica
ApĂȘndices (apenas no livro)
| O cheat sheet matemĂĄtico dos LLMs |
| Uma perspectiva estatĂstica sobre LLMs |
| Perguntas que as pessoas fazem |
| DerivaçÔes trabalhadas |
| ExercĂcios, com soluçÔes |
| Ăndice de sĂmbolos |
| Um forward pass completo, em nĂșmeros |
| Uma linha do tempo das ideias |
Volume III â Enhancing Enterprise AI with RAG
Um guia pråtico para construir sistemas de geração aumentada por recuperação para o ambiente corporativo.
RAG na prĂĄtica â bancos de vetores, estratĂ©gias de chunking, e a arquitetura de ancorar o modelo nos seus prĂłprios documentos para ter respostas corporativas confiĂĄveis, atualizadas e rastreĂĄveis. Ă o volume que se lĂȘ quando o seu trabalho Ă© entregar funcionalidades de IA que precisam continuar atuais e precisam citar a fonte.
|
|
Parte I â Fundamentos do RAG
| CapĂtulo 1 â | A evolução da arquitetura RAG |
Parte II â IngestĂŁo, parsing e chunking de dados
| CapĂtulo 2 â | Parsing inteligente de documentos |
| CapĂtulo 3 â | Frameworks avançados de chunking |
Parte III â Bancos de vetores e otimização de recuperação
| CapĂtulo 4 â | Escolhendo o banco de vetores certo |
| CapĂtulo 5 â | Arquitetando o pipeline de recuperação |
Parte IV â Segurança, privacidade e controle de acesso
| CapĂtulo 6 â | Modelos de ameaça e vulnerabilidades do RAG |
| CapĂtulo 7 â | Implementando controle de acesso |
| CapĂtulo 8 â | Anonimização de dados no pipeline RAG |
Parte V â Avaliação, monitoramento e manutenção
| CapĂtulo 9 â | A trĂade de avaliação do RAG |
| CapĂtulo 10 â | Frameworks de avaliação de referĂȘncia |
| CapĂtulo 11 â | AtualizaçÔes contĂnuas e otimização do pipeline |
ApĂȘndices (apenas no livro)
| A â | FĂłrmulas matemĂĄticas essenciais para otimização de RAG |
| B â | Exemplos de system prompts para anonimização e avaliação |
| C â | Matrizes de decisĂŁo de bancos de vetores e ferramentas |
| D â | Datasets de benchmark para avaliação de RAG |
Volume IV â Designing AI Cognition with MCP
Engenharia de contexto, ferramentas e memĂłria para agentes de IA confiĂĄveis.
Modelagem estruturada de contexto e orquestração: como dar forma ao raciocĂnio de um modelo desenhando o contexto e as situaçÔes que ele vĂȘ, em vez de mexer no modelo. Ă o volume que se lĂȘ quando se estĂĄ construindo sistemas agentivos â inventĂĄrios de ferramentas, loops longos, memĂłria entre sessĂ”es, e a disciplina de desenhar com cuidado o que o modelo vai enxergar.
|
|
Parte I â A mudança de paradigma na integração de IA
| CapĂtulo 1 â | A crise da integração de IA e o surgimento da arquitetura agentiva |
| CapĂtulo 2 â | Apresentando o Model Context Protocol (MCP) |
Parte II â A mecĂąnica central do MCP
| CapĂtulo 3 â | Primitivas de servidor â expondo contexto e capacidades |
| CapĂtulo 4 â | Primitivas de cliente â comportamentos agentivos e controle |
| CapĂtulo 5 â | Protocolos de transporte e descoberta |
Parte III â PadrĂ”es de orquestração multi-agente
| CapĂtulo 6 â | EstratĂ©gias fundamentais de orquestração |
| CapĂtulo 7 â | PadrĂ”es colaborativos avançados e dinĂąmicos |
| CapĂtulo 8 â | Topologias de implantação arquitetural |
Parte IV â Cognição da IA: contexto e memĂłria
| CapĂtulo 9 â | Administrando o orçamento de atenção |
| CapĂtulo 10 â | MemĂłria para tarefas de longo prazo |
Parte V â Segurança de workflows agentivos
| CapĂtulo 11 â | SuperfĂcies de ataque e vulnerabilidades do protocolo |
| CapĂtulo 12 â | Endurecimento de protocolo e defesas |
Parte VI â Engenharia de produção e escala
| CapĂtulo 13 â | Frameworks e integração com nuvem |
| CapĂtulo 14 â | Benchmarking, testes e performance |
ApĂȘndices (apenas no livro)
| A â | ReferĂȘncia rĂĄpida e cheat sheet de MCP |
| B â | Blueprints de implementação e exemplos de cĂłdigo |
| C â | Checklists de prontidĂŁo de produção e segurança |
| D â | EspecificaçÔes avançadas e Standard Enhancement Proposals (SEPs) |
| E â | Benchmarks e dados de performance |
| F â | Recursos oficiais e links do ecossistema |
Volume V â Building Real-World LLM Applications
Projetar, avaliar e operar sistemas LLM em produção.
Um guia focado em sistema, do protĂłtipo Ă produção â design de API, loops de avaliação, monitoramento e integração â transformando um modelo capaz em um produto confiĂĄvel. Ă o volume que transforma a compreensĂŁo da arquitetura em serviços que rodam, com usuĂĄrios reais em cima.
|
|
Parte I â Fundamentos da engenharia de IA
| CapĂtulo 1 â | A disciplina da engenharia de IA |
| CapĂtulo 2 â | Modelos de fundação e engenharia de prompt |
Parte II â Capacidades agentivas e de recuperação
| CapĂtulo 3 â | Geração aumentada por recuperação (RAG) |
| CapĂtulo 4 â | Agentes de IA e chamada de ferramentas |
Parte III â Qualidade e observabilidade
| CapĂtulo 5 â | Avaliando aplicaçÔes LLM |
| CapĂtulo 6 â | Observabilidade e tracing de IA |
Parte IV â Segurança, escala e otimização
| CapĂtulo 7 â | Segurança de LLM e guarda-fios |
| CapĂtulo 8 â | Otimizando performance, serving e custo |
ApĂȘndices (apenas no livro)
| A â | Checklists de prontidĂŁo de produção e segurança |
| B â | Matrizes de seleção de ferramentas e frameworks |
| C â | Protocolos, streaming e saĂdas estruturadas |
| D â | Arquitetura de rate limiting e gestĂŁo de custos |
| E â | GlossĂĄrio de mĂ©tricas e termos de engenharia de IA |
Volume VI â Scaling AI Systems
Arquitetando inferĂȘncia de LLM com baixa latĂȘncia para a escala de produção.
Arquitetando inferĂȘncia de alta performance: serving distribuĂdo, otimização de latĂȘncia e modelagem de custo para sistemas que precisam responder milhĂ”es de vezes por dia. Ă o volume que se lĂȘ quando o seu sistema de IA passou de um Ășnico servidor e agora precisa se comportar como infraestrutura de verdade.
|
|
Parte I â Fundamentos da inferĂȘncia de LLM
| CapĂtulo 1 â | A mecĂąnica da geração de tokens |
| CapĂtulo 2 â | O desafio da cache de chave-valor (KV) |
Parte II â O substrato de hardware
| CapĂtulo 3 â | GPUs de data center para IA generativa |
| CapĂtulo 4 â | SilĂcio especializado e ASICs para IA |
Parte III â Otimização de modelo (compressĂŁo)
| CapĂtulo 5 â | Desmistificando a quantização |
| CapĂtulo 6 â | Pruning e destilação de conhecimento |
Parte IV â OtimizaçÔes de sistema e engine
| CapĂtulo 7 â | EstratĂ©gias avançadas de batching |
| CapĂtulo 8 â | GestĂŁo de KV cache de prĂłxima geração |
| CapĂtulo 9 â | Decodificação especulativa |
Parte V â Frameworks de serving e orquestração
| CapĂtulo 10 â | A camada de engine de LLM |
| CapĂtulo 11 â | A camada de plataforma e orquestração |
| CapĂtulo 12 â | Serving desagregado e Kubernetes |
| CapĂtulo 13 â | Autoscaling e mitigação de cold start |
Parte VI â Economia em nĂvel de aplicação e TCO
| CapĂtulo 14 â | Economia de tokens e preço de API |
| CapĂtulo 15 â | APIs serverless vs. infraestrutura dedicada |
| CapĂtulo 16 â | EstratĂ©gias de corte de custo em produção |
ApĂȘndices (apenas no livro)
| A â | FĂłrmulas matemĂĄticas e referĂȘncia de modelagem de custo |
| B â | Guia de especificaçÔes de hardware e aceleradores |
| C â | ConfiguraçÔes de deployment e snippets de cĂłdigo |
| D â | Metodologia de benchmarking e definição de mĂ©tricas |
Volume VII â AI Security
Defendendo sistemas LLM contra prompt injection, jailbreaks e ameaças adversariais.
Projetando IA segura e robusta: riscos adversariais, prompt injection, frameworks de governança e design defensivo para sistemas que vĂŁo para o mundo real. Ă o volume que se lĂȘ quando o seu sistema de IA precisa ser tratado como infraestrutura sensĂvel Ă segurança.
|
|
Parte I â Fundamentos de segurança de IA
| CapĂtulo 1 â | Por que segurança de IA Ă© diferente |
| CapĂtulo 2 â | Modelagem de ameaças para sistemas LLM |
| CapĂtulo 3 â | Segurança de dados e privacidade |
Parte II â Segurança de prompt e interação
| CapĂtulo 4 â | Prompt injection e jailbreaks |
| CapĂtulo 5 â | Validação de entrada e filtragem de saĂda |
| CapĂtulo 6 â | Riscos de geração aumentada por recuperação |
Parte III â Robustez e confiabilidade do modelo
| CapĂtulo 7 â | AlucinaçÔes e confiabilidade |
| CapĂtulo 8 â | Ataques adversariais a modelos |
| CapĂtulo 9 â | Integridade do modelo e riscos de cadeia de suprimentos |
Parte IV â Arquitetura de segurança em nĂvel de sistema
| CapĂtulo 10 â | Projetando arquiteturas LLM seguras |
| CapĂtulo 11 â | Observabilidade, logging e resposta a incidentes |
| CapĂtulo 12 â | Controle de acesso e identidade |
Parte V â Governança, Ă©tica e compliance
| CapĂtulo 13 â | Panorama regulatĂłrio |
| CapĂtulo 14 â | ViĂ©s, justiça e IA responsĂĄvel |
| CapĂtulo 15 â | Construindo uma organização de IA segura |
Parte VI â TĂłpicos avançados
| CapĂtulo 16 â | Fine-tuning seguro e adaptação |
| CapĂtulo 17 â | Ameaças futuras e defesas emergentes |
ApĂȘndices (apenas no livro)
| A â | Checklist de segurança de IA para sistemas em produção |
| B â | Template de modelagem de ameaças |
| C â | PadrĂ”es de design seguro para prompts |
| D â | Template de resposta a incidentes para aplicaçÔes LLM |
| E â | Ferramentas e frameworks recomendados |
Como esta pĂĄgina cresce
Esta pĂĄgina vai sendo atualizada Ă medida que cada volume da sĂ©rie Ă© publicado, e Ă medida que os artigos de passeio para cada capĂtulo vĂŁo ao ar. Os Volumes III a VII jĂĄ tĂȘm o sumĂĄrio completo acima; os artigos de passeio desses capĂtulos vĂŁo entrando aqui conforme forem sendo escritos.
Favorite esta pågina se quiser acompanhar a série conforme ela se desenrola. Ou assine o feed do canal para receber cada post novo no dia em que ele estreia.
Comece pelo Volume I. Doze capĂtulos com o caminho completo: o que Ă© um LLM, como o texto vira tokens e embeddings, como atenção e transformer movem tudo aquilo, como o modelo Ă© treinado, onde ele tropeça, e como tudo se costura em sistemas reais.
Pegue o LLM Primer I na Amazon â
Depois vĂĄ mais fundo com o Volume II. A matemĂĄtica que estĂĄ embaixo de toda essa maquinaria â derivada com cuidado, embrulhada em histĂłria, analogia e exemplo numĂ©rico.
Pegue o LLM Primer II na Amazon â