Introdução ao LLM

Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.

Total de 27 artigos disponíveis. | Atualmente na página 1 de 1.

Capítulo 12 — Endurecimento do Protocolo e Defesas

Décima segunda postagem do passeio pelo LLM Primer IV. Os quatro clusters de defesa — atestação criptográfica, disciplina de escopo OAuth com sessões limitadas, sandbox em runtime, e portões humano-no-loop — compõem numa postura que não depende do modelo se comportar corretamente sob condições adversárias.

2026-04-10

Capítulo 11 — Superfícies de Ataque e Vulnerabilidades de Protocolo

Décima primeira postagem do passeio pelo LLM Primer IV. Os ataques clássicos adaptados ao MCP — Confused Deputy, Token Passthrough, Session Hijacking — os defeitos no nível de protocolo em torno de escalada de capacidade e sampling não-autenticado, e a propagação implícita de confiança que torna envenenamento de contexto problema estrutural em vez de higiene.

2026-04-09

Capítulo 10 — Memória de Tarefa de Horizonte Longo

Décima postagem do passeio pelo LLM Primer IV. Memória de curto prazo via janelas e scratchpads ReAct, memória de longo prazo via vetores episódicos e stores semânticos, e as técnicas de compactação que mantêm um agente produtivo ao longo de horas e dias.

2026-04-08

Capítulo 9 — Gerenciando o Orçamento de Atenção

Nona postagem do passeio pelo LLM Primer IV. Context rot, o precipício de lost-in-the-middle, tool-loadout rot, e as três respostas arquiteturais — MCP, RAG, fine-tuning — para a pergunta de onde o conhecimento ausente de um modelo de fato pertence.

2026-04-07

Capítulo 7 — Padrões Avançados Colaborativos e Dinâmicos

Sétima postagem do passeio pelo LLM Primer IV. Consenso roundtable, roteamento por handoff, e orquestração magentic — os padrões que emergem quando a topologia precisa ser construída por requisição, com os modos de falha (não-terminação, mis-routing, planejamento desbocado) que os padrões mais simples evitam.

2026-04-05

Capítulo 6 — Estratégias Fundamentais de Orquestração

Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?

2026-04-04

Capítulo 5 — Protocolos de Transporte e Descoberta

Quinta postagem do passeio pelo LLM Primer IV. Os três transportes que o MCP suporta, a camada de descoberta .well-known com Server Cards, e as preocupações operacionais sem glamour — CORS, validação de origem, caching — que decidem se um servidor é cidadão de rede cooperativo ou um passivo.

2026-04-03

Capítulo 1 — A Crise de Integração de IA e a Ascensão da Arquitetura Agêntica

Primeira postagem do passeio pelo LLM Primer IV. Por que agentes monolíticos se esfarrapam conforme prompts de sistema crescem, o problema de integração N vezes M escondido por baixo, e o movimento de engenharia de prompt para engenharia de contexto que o MCP foi feito para habilitar.

2026-03-30

Capítulo 8 — Anonimização de Dados no Pipeline RAG

Oitavo post do passeio pelo LLM Primer III. Anonimização pré-geração versus pós-geração, as três famílias de técnica — mascaramento, substituição sintética, privacidade diferencial — e o tradeoff utilidade-privacidade que determina se o sistema permanece útil.

2026-03-25

Capítulo 6 — Modelos de Ameaça e Vulnerabilidades em RAG

Sexto post do passeio pelo LLM Primer III. A superfície expandida de ataque da recuperação — envenenamento de corpus, chunks adversariais, injection indireta de prompt, inversão de embedding e o problema do deputado confuso em RAG agêntico. Ataques concretos, cada um demonstrado, cada um reprodutível.

2026-03-23

Capítulo 5 — Arquitetando o Pipeline de Recuperação

Quinto post do passeio pelo LLM Primer III. Por que uma única busca vetorial não é um pipeline — recuperação híbrida, reciprocal rank fusion, reranking com cross-encoder, e rewriting e HyDE do lado da query — montados na arquitetura de produção para a qual sistemas RAG maduros convergem.

2026-03-22

Capítulo 3 — Frameworks Avançados de Chunking

Terceiro post do passeio pelo LLM Primer III. O espectro de chunking de tamanho fixo a consciente de estrutura, o mito do overlap, o penhasco de contexto que destrói a recuperação em silêncio, e as técnicas de recuperação contextual e late chunking que reformularam a fronteira.

2026-03-20

Capítulo 1 — A Evolução da Arquitetura RAG

Primeiro post do passeio pelo LLM Primer III. As quatro posturas arquiteturais de RAG — Naive, Avançada, Modular, Agêntica — lidas como uma história de entregar mais agência ao LLM uma decisão por vez, e a resposta honesta para quando fine-tuning é a ferramenta melhor do que recuperação.

2026-03-18

Capítulo 11 — Avaliação, Calibração e Inferência

Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer II. Como medir uma máquina que pode dizer qualquer coisa — perplexidade, calibração, barras de erro de benchmark e geometria da recuperação para conter alucinação.

2026-03-13

Capítulo 10 — Matemática do Pós-Treinamento e Alinhamento

Décimo post do passeio capítulo a capítulo pelo LLM Primer II. Como um previsor de próximo token brilhante e feral é civilizado em assistente útil — SFT, modelo de recompensa, RLHF na coleira do KL, e a derivação elegante do DPO que colapsa o pipeline inteiro em uma única perda supervisionada.

2026-03-12

Capítulo 12 — Construir um sistema LLM, e o que vem depois

Último post do passeio capítulo a capítulo pelo LLM Primer I. Modelo, ferramentas, RAG, avaliação e guarda-fios costurados em um sistema só — e a ponte do Livro 1 para os Livros 2 a 7 da série.

2026-03-01

Capítulo 11 — Modelos menores, modelos mais espertos

Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer I. Como reduzir modelos grandes para caber em operações reais — destilação, quantização, MoE — e o §11.6 novo da edição 2026, sobre modelos de raciocínio.

2026-02-28

Capítulo 10 — Multimodal: para além do texto

Décimo post do passeio capítulo a capítulo pelo LLM Primer I. Como o mesmo transformer passou a aceitar imagem e áudio — vision transformer e tokenização de áudio — e os limites honestos por trás da ideia de "um modelo que vê tudo".

2026-02-27

Capítulo 8 — Quando um modelo não basta: ferramentas e agentes

Oitavo post do passeio capítulo a capítulo pelo LLM Primer I. O terreno onde o modelo ganha braços — uso de ferramentas, chamada de função, agentes — e o §8.6 novo da edição 2026 com padrões agentivos como ReAct, planejador-executor e reflexão.

2026-02-25

Capítulo 7 — Engenharia de prompt como ofício de campo

Sétimo post do passeio capítulo a capítulo pelo LLM Primer I. Os quatro padrões de prompt que carregam o peso real — system prompt, few-shot, cadeia de pensamento, papel — e por que cada um funciona, à luz do mecanismo de próximo token.

2026-02-24

Capítulo 6 — Segurança, alinhamento, e o que "ser útil" realmente significa

Sexto post do passeio capítulo a capítulo pelo LLM Primer I. Por que fluência e utilidade são coisas diferentes, o que o alinhamento realmente refina, e uma prévia do §6.6 novo na edição 2026 — IA Constitucional, modelos de debate, e o que há de mais recente em pesquisa de alinhamento.

2026-02-23

Capítulo 5 — Ainda há pequenos defeitos

Quinto post do passeio capítulo a capítulo pelo LLM Primer I. Por que alucinação, lacunas temporais, problemas de cálculo e oscilações de consistência não são bugs, mas características do mesmo mecanismo de previsão de próximo token.

2026-02-22

Capítulo 4 — Como o modelo aprende

Quarto post do passeio capítulo a capítulo pelo LLM Primer I. Por que o pré-treinamento define o teto da capacidade, por que o fine-tuning esculpe a personalidade, e como o RLHF transforma um previsor de tokens no assistente em que confiamos todo dia.

2026-02-21

Capítulo 3 — Como o texto flui dentro do modelo

Terceiro post do passeio capítulo a capítulo pelo LLM Primer I. Como o token muda de forma dentro do modelo — embeddings, atenção, transformer — sem cair em matrizes nem perder precisão.

2026-02-20

Capítulo 2 — Probabilidade, tokens e texto

Segundo post do passeio capítulo a capítulo pelo LLM Primer I. Como tokens diferem de palavras, o que é a distribuição de probabilidade que o modelo produz a cada passo, e como temperature e top-p mudam o caráter da saída.

2026-02-19

Capítulo 1 — O que é, afinal, um Grande Modelo de Linguagem?

Primeiro post do passeio capítulo a capítulo pelo LLM Primer I. O que "grande", "linguagem" e "modelo" realmente significam, como saímos dos sistemas baseados em regras até as redes neurais, e três mitos que vale a pena desfazer logo de cara.

2026-02-18

A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez

A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.

2026-02-15