Introdução ao LLM

Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.


Total de 29 artigos disponíveis. | Atualmente na página 1 de 1.

Capítulo 11 — Atualizações Contínuas e Otimização do Pipeline

Décimo primeiro e último post do passeio pelo LLM Primer III. CDC e indexação incremental mantêm o corpus fresco, semantic caching e tiering de modelo seguram a latência, e um loop de feedback de quatro estágios fecha o gap entre o que a produção conta para o time e o que o time de fato muda — mais a ponte para o Volume IV sobre Model Context Protocol.

2026-03-28

Capítulo 10 — Principais Frameworks de Avaliação

Décimo post do passeio pelo LLM Primer III. Guia de campo dos frameworks que transformam a Tríade de Avaliação em algo que um time consegue rodar — RAGAS, TruLens, DeepEval de um lado, Braintrust, LangSmith, Phoenix, Galileo, Opik do outro, e o Gap de Avaliação que nenhum deles ainda fechou.

2026-03-27

Capítulo 9 — A Tríade de Avaliação de RAG

Nono post do passeio pelo LLM Primer III. Um sistema RAG pode falhar em três lugares distintos e por fora as falhas parecem iguais — a Tríade de Avaliação de Relevância de Contexto, Fidelidade e Relevância da Resposta é o pequeno vocabulário que impede consertar um bug enquanto se mede outro.

2026-03-26

Capítulo 8 — Anonimização de Dados no Pipeline RAG

Oitavo post do passeio pelo LLM Primer III. Anonimização pré-geração versus pós-geração, as três famílias de técnica — mascaramento, substituição sintética, privacidade diferencial — e o tradeoff utilidade-privacidade que determina se o sistema permanece útil.

2026-03-25

Capítulo 7 — Implementando Controle de Acesso

Sétimo post do passeio pelo LLM Primer III. ACLs em nível de documento como fundação, RBAC com rótulos de sensibilidade do Microsoft Purview, ReBAC com Zanzibar e SpiceDB, e a disciplina de pré-filtro versus pós-filtro que corre por baixo de todos eles.

2026-03-24

Capítulo 6 — Modelos de Ameaça e Vulnerabilidades em RAG

Sexto post do passeio pelo LLM Primer III. A superfície expandida de ataque da recuperação — envenenamento de corpus, chunks adversariais, injection indireta de prompt, inversão de embedding e o problema do deputado confuso em RAG agêntico. Ataques concretos, cada um demonstrado, cada um reprodutível.

2026-03-23

Capítulo 5 — Arquitetando o Pipeline de Recuperação

Quinto post do passeio pelo LLM Primer III. Por que uma única busca vetorial não é um pipeline — recuperação híbrida, reciprocal rank fusion, reranking com cross-encoder, e rewriting e HyDE do lado da query — montados na arquitetura de produção para a qual sistemas RAG maduros convergem.

2026-03-22

Capítulo 4 — Escolhendo o Banco de Dados Vetorial Certo

Quarto post do passeio pelo LLM Primer III. A separação arquitetural entre bancos vetoriais dedicados e extensões estilo Postgres, as líderes gerenciadas (Pinecone, Vertex), o campo open-source (Qdrant, Milvus, Weaviate), as opções embedded, e os três eixos operacionais — residência, ops, custo — que decidem a escolha real.

2026-03-21

Capítulo 3 — Frameworks Avançados de Chunking

Terceiro post do passeio pelo LLM Primer III. O espectro de chunking de tamanho fixo a consciente de estrutura, o mito do overlap, o penhasco de contexto que destrói a recuperação em silêncio, e as técnicas de recuperação contextual e late chunking que reformularam a fronteira.

2026-03-20

Capítulo 2 — Parsing Inteligente de Documentos

Segundo post do passeio pelo LLM Primer III. Por que um PDF não é um arquivo de texto, o que os parsers conscientes de layout de fato preservam, o panorama atual de ferramentas (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), e a trilha multimodal que recupera direto sobre imagens de página.

2026-03-19

Capítulo 1 — A Evolução da Arquitetura RAG

Primeiro post do passeio pelo LLM Primer III. As quatro posturas arquiteturais de RAG — Naive, Avançada, Modular, Agêntica — lidas como uma história de entregar mais agência ao LLM uma decisão por vez, e a resposta honesta para quando fine-tuning é a ferramenta melhor do que recuperação.

2026-03-18

LLM Primer III — Introdução da Série e Índice

Abertura do passeio capítulo a capítulo pelo Livro III da série LLM Primer — Aprimorando a IA Empresarial com RAG. Por que a geração aumentada por recuperação parece simples por fora e é uma pilha de disciplinas por dentro, para quem este livro foi escrito, e o cronograma dos onze posts que seguem, de 18 a 28 de março.

2026-03-17

Capítulo 11 — Avaliação, Calibração e Inferência

Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer II. Como medir uma máquina que pode dizer qualquer coisa — perplexidade, calibração, barras de erro de benchmark e geometria da recuperação para conter alucinação.

2026-03-13

Capítulo 10 — Matemática do Pós-Treinamento e Alinhamento

Décimo post do passeio capítulo a capítulo pelo LLM Primer II. Como um previsor de próximo token brilhante e feral é civilizado em assistente útil — SFT, modelo de recompensa, RLHF na coleira do KL, e a derivação elegante do DPO que colapsa o pipeline inteiro em uma única perda supervisionada.

2026-03-12

Capítulo 12 — Construir um sistema LLM, e o que vem depois

Último post do passeio capítulo a capítulo pelo LLM Primer I. Modelo, ferramentas, RAG, avaliação e guarda-fios costurados em um sistema só — e a ponte do Livro 1 para os Livros 2 a 7 da série.

2026-03-01

Capítulo 11 — Modelos menores, modelos mais espertos

Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer I. Como reduzir modelos grandes para caber em operações reais — destilação, quantização, MoE — e o §11.6 novo da edição 2026, sobre modelos de raciocínio.

2026-02-28

Capítulo 10 — Multimodal: para além do texto

Décimo post do passeio capítulo a capítulo pelo LLM Primer I. Como o mesmo transformer passou a aceitar imagem e áudio — vision transformer e tokenização de áudio — e os limites honestos por trás da ideia de "um modelo que vê tudo".

2026-02-27

Capítulo 9 — RAG: costurando informação fresca no contexto

Nono post do passeio capítulo a capítulo pelo LLM Primer I. O que RAG (Retrieval-Augmented Generation) realmente faz, como apoia a lacuna temporal e a exatidão do modelo, e onde começa a diferença entre um RAG bom e um ruim.

2026-02-26

Capítulo 8 — Quando um modelo não basta: ferramentas e agentes

Oitavo post do passeio capítulo a capítulo pelo LLM Primer I. O terreno onde o modelo ganha braços — uso de ferramentas, chamada de função, agentes — e o §8.6 novo da edição 2026 com padrões agentivos como ReAct, planejador-executor e reflexão.

2026-02-25

Capítulo 7 — Engenharia de prompt como ofício de campo

Sétimo post do passeio capítulo a capítulo pelo LLM Primer I. Os quatro padrões de prompt que carregam o peso real — system prompt, few-shot, cadeia de pensamento, papel — e por que cada um funciona, à luz do mecanismo de próximo token.

2026-02-24

Capítulo 6 — Segurança, alinhamento, e o que "ser útil" realmente significa

Sexto post do passeio capítulo a capítulo pelo LLM Primer I. Por que fluência e utilidade são coisas diferentes, o que o alinhamento realmente refina, e uma prévia do §6.6 novo na edição 2026 — IA Constitucional, modelos de debate, e o que há de mais recente em pesquisa de alinhamento.

2026-02-23

Capítulo 5 — Ainda há pequenos defeitos

Quinto post do passeio capítulo a capítulo pelo LLM Primer I. Por que alucinação, lacunas temporais, problemas de cálculo e oscilações de consistência não são bugs, mas características do mesmo mecanismo de previsão de próximo token.

2026-02-22

Capítulo 4 — Como o modelo aprende

Quarto post do passeio capítulo a capítulo pelo LLM Primer I. Por que o pré-treinamento define o teto da capacidade, por que o fine-tuning esculpe a personalidade, e como o RLHF transforma um previsor de tokens no assistente em que confiamos todo dia.

2026-02-21

Capítulo 3 — Como o texto flui dentro do modelo

Terceiro post do passeio capítulo a capítulo pelo LLM Primer I. Como o token muda de forma dentro do modelo — embeddings, atenção, transformer — sem cair em matrizes nem perder precisão.

2026-02-20

Capítulo 2 — Probabilidade, tokens e texto

Segundo post do passeio capítulo a capítulo pelo LLM Primer I. Como tokens diferem de palavras, o que é a distribuição de probabilidade que o modelo produz a cada passo, e como temperature e top-p mudam o caráter da saída.

2026-02-19

Capítulo 1 — O que é, afinal, um Grande Modelo de Linguagem?

Primeiro post do passeio capítulo a capítulo pelo LLM Primer I. O que "grande", "linguagem" e "modelo" realmente significam, como saímos dos sistemas baseados em regras até as redes neurais, e três mitos que vale a pena desfazer logo de cara.

2026-02-18

LLM Primer I — passeio capítulo a capítulo: introdução e índice

Introdução do passeio capítulo a capítulo pelo LLM Primer I. Como a série está organizada, o que cada capítulo entrega, e o índice dos doze posts que vêm a seguir entre 18 de fevereiro e 1º de março.

2026-02-17

A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez

A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.

2026-02-15

Introdução aos Grandes Modelos de Linguagem (LLMs) - Guia Completo para Engenheiros

Explore os fundamentos dos Grandes Modelos de Linguagem (LLMs), incluindo o treinamento, as aplicações e os desafios. Um guia completo para engenheiros que querem entender o impacto dos LLMs no aprendizado de máquina e no processamento de linguagem natural.

2024-09-01