Introdução ao LLM

Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.


Total de 17 artigos disponíveis. | Atualmente na página 1 de 1.

Capítulo 14 — Benchmarking, Testes e Desempenho

Décima quarta e última postagem do passeio pelo LLM Primer IV. O MCP-Universe Benchmark em servidores reais, os dois modos de falha sistêmicos que ele expôs, o gap de dez vezes de throughput entre sessão-por-requisição e pools de sessão compartilhados, e a ponte para o Volume V.

2026-04-12

Capítulo 12 — Endurecimento do Protocolo e Defesas

Décima segunda postagem do passeio pelo LLM Primer IV. Os quatro clusters de defesa — atestação criptográfica, disciplina de escopo OAuth com sessões limitadas, sandbox em runtime, e portões humano-no-loop — compõem numa postura que não depende do modelo se comportar corretamente sob condições adversárias.

2026-04-10

Capítulo 11 — Superfícies de Ataque e Vulnerabilidades de Protocolo

Décima primeira postagem do passeio pelo LLM Primer IV. Os ataques clássicos adaptados ao MCP — Confused Deputy, Token Passthrough, Session Hijacking — os defeitos no nível de protocolo em torno de escalada de capacidade e sampling não-autenticado, e a propagação implícita de confiança que torna envenenamento de contexto problema estrutural em vez de higiene.

2026-04-09

Capítulo 6 — Estratégias Fundamentais de Orquestração

Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?

2026-04-04

Capítulo 5 — Protocolos de Transporte e Descoberta

Quinta postagem do passeio pelo LLM Primer IV. Os três transportes que o MCP suporta, a camada de descoberta .well-known com Server Cards, e as preocupações operacionais sem glamour — CORS, validação de origem, caching — que decidem se um servidor é cidadão de rede cooperativo ou um passivo.

2026-04-03

Capítulo 3 — Primitivas de Servidor: Expondo Contexto e Capacidades

Terceira postagem do passeio pelo LLM Primer IV. Os três substantivos que um servidor MCP pode oferecer — Resources (estado de leitura), Prompts (andaime reutilizável), Tools (ações de escrita) — seus schemas, seus ciclos de vida, seus modelos de erro, e a disciplina de escolher a primitiva certa.

2026-04-01

Capítulo 11 — Atualizações Contínuas e Otimização do Pipeline

Décimo primeiro e último post do passeio pelo LLM Primer III. CDC e indexação incremental mantêm o corpus fresco, semantic caching e tiering de modelo seguram a latência, e um loop de feedback de quatro estágios fecha o gap entre o que a produção conta para o time e o que o time de fato muda — mais a ponte para o Volume IV sobre Model Context Protocol.

2026-03-28

Capítulo 7 — Implementando Controle de Acesso

Sétimo post do passeio pelo LLM Primer III. ACLs em nível de documento como fundação, RBAC com rótulos de sensibilidade do Microsoft Purview, ReBAC com Zanzibar e SpiceDB, e a disciplina de pré-filtro versus pós-filtro que corre por baixo de todos eles.

2026-03-24

Capítulo 5 — Arquitetando o Pipeline de Recuperação

Quinto post do passeio pelo LLM Primer III. Por que uma única busca vetorial não é um pipeline — recuperação híbrida, reciprocal rank fusion, reranking com cross-encoder, e rewriting e HyDE do lado da query — montados na arquitetura de produção para a qual sistemas RAG maduros convergem.

2026-03-22

Capítulo 4 — Escolhendo o Banco de Dados Vetorial Certo

Quarto post do passeio pelo LLM Primer III. A separação arquitetural entre bancos vetoriais dedicados e extensões estilo Postgres, as líderes gerenciadas (Pinecone, Vertex), o campo open-source (Qdrant, Milvus, Weaviate), as opções embedded, e os três eixos operacionais — residência, ops, custo — que decidem a escolha real.

2026-03-21

Capítulo 3 — Frameworks Avançados de Chunking

Terceiro post do passeio pelo LLM Primer III. O espectro de chunking de tamanho fixo a consciente de estrutura, o mito do overlap, o penhasco de contexto que destrói a recuperação em silêncio, e as técnicas de recuperação contextual e late chunking que reformularam a fronteira.

2026-03-20

Capítulo 1 — A Evolução da Arquitetura RAG

Primeiro post do passeio pelo LLM Primer III. As quatro posturas arquiteturais de RAG — Naive, Avançada, Modular, Agêntica — lidas como uma história de entregar mais agência ao LLM uma decisão por vez, e a resposta honesta para quando fine-tuning é a ferramenta melhor do que recuperação.

2026-03-18

LLM Primer III — Introdução da Série e Índice

Abertura do passeio capítulo a capítulo pelo Livro III da série LLM Primer — Aprimorando a IA Empresarial com RAG. Por que a geração aumentada por recuperação parece simples por fora e é uma pilha de disciplinas por dentro, para quem este livro foi escrito, e o cronograma dos onze posts que seguem, de 18 a 28 de março.

2026-03-17

Capítulo 11 — Avaliação, Calibração e Inferência

Décimo primeiro post do passeio capítulo a capítulo pelo LLM Primer II. Como medir uma máquina que pode dizer qualquer coisa — perplexidade, calibração, barras de erro de benchmark e geometria da recuperação para conter alucinação.

2026-03-13

Capítulo 9 — RAG: costurando informação fresca no contexto

Nono post do passeio capítulo a capítulo pelo LLM Primer I. O que RAG (Retrieval-Augmented Generation) realmente faz, como apoia a lacuna temporal e a exatidão do modelo, e onde começa a diferença entre um RAG bom e um ruim.

2026-02-26

Capítulo 8 — Quando um modelo não basta: ferramentas e agentes

Oitavo post do passeio capítulo a capítulo pelo LLM Primer I. O terreno onde o modelo ganha braços — uso de ferramentas, chamada de função, agentes — e o §8.6 novo da edição 2026 com padrões agentivos como ReAct, planejador-executor e reflexão.

2026-02-25

Capítulo 5 — Ainda há pequenos defeitos

Quinto post do passeio capítulo a capítulo pelo LLM Primer I. Por que alucinação, lacunas temporais, problemas de cálculo e oscilações de consistência não são bugs, mas características do mesmo mecanismo de previsão de próximo token.

2026-02-22