Introdução ao LLM

Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.


Total de 16 artigos disponíveis. | Atualmente na página 1 de 1.

Capítulo 14 — Benchmarking, Testes e Desempenho

Décima quarta e última postagem do passeio pelo LLM Primer IV. O MCP-Universe Benchmark em servidores reais, os dois modos de falha sistêmicos que ele expôs, o gap de dez vezes de throughput entre sessão-por-requisição e pools de sessão compartilhados, e a ponte para o Volume V.

2026-04-12

Capítulo 13 — Frameworks e Integração com Nuvem

Décima terceira postagem do passeio pelo LLM Primer IV. Strands com Bedrock, o padrão de camada de estado AWS, o Microsoft Agent Framework, LangChain, Semantic Kernel — e os três formatos de integração de produção em que times chegam independentemente.

2026-04-11

Capítulo 12 — Endurecimento do Protocolo e Defesas

Décima segunda postagem do passeio pelo LLM Primer IV. Os quatro clusters de defesa — atestação criptográfica, disciplina de escopo OAuth com sessões limitadas, sandbox em runtime, e portões humano-no-loop — compõem numa postura que não depende do modelo se comportar corretamente sob condições adversárias.

2026-04-10

Capítulo 11 — Superfícies de Ataque e Vulnerabilidades de Protocolo

Décima primeira postagem do passeio pelo LLM Primer IV. Os ataques clássicos adaptados ao MCP — Confused Deputy, Token Passthrough, Session Hijacking — os defeitos no nível de protocolo em torno de escalada de capacidade e sampling não-autenticado, e a propagação implícita de confiança que torna envenenamento de contexto problema estrutural em vez de higiene.

2026-04-09

Capítulo 10 — Memória de Tarefa de Horizonte Longo

Décima postagem do passeio pelo LLM Primer IV. Memória de curto prazo via janelas e scratchpads ReAct, memória de longo prazo via vetores episódicos e stores semânticos, e as técnicas de compactação que mantêm um agente produtivo ao longo de horas e dias.

2026-04-08

Capítulo 9 — Gerenciando o Orçamento de Atenção

Nona postagem do passeio pelo LLM Primer IV. Context rot, o precipício de lost-in-the-middle, tool-loadout rot, e as três respostas arquiteturais — MCP, RAG, fine-tuning — para a pergunta de onde o conhecimento ausente de um modelo de fato pertence.

2026-04-07

Capítulo 8 — Layouts Arquiteturais de Deployment

Oitava postagem do passeio pelo LLM Primer IV. Os três layouts de deployment que emergiram no ecossistema MCP — agente reutilizável, pureza estrita, híbrido — e as quatro restrições determinantes que decidem qual encaixa em qual projeto.

2026-04-06

Capítulo 7 — Padrões Avançados Colaborativos e Dinâmicos

Sétima postagem do passeio pelo LLM Primer IV. Consenso roundtable, roteamento por handoff, e orquestração magentic — os padrões que emergem quando a topologia precisa ser construída por requisição, com os modos de falha (não-terminação, mis-routing, planejamento desbocado) que os padrões mais simples evitam.

2026-04-05

Capítulo 6 — Estratégias Fundamentais de Orquestração

Sexta postagem do passeio pelo LLM Primer IV. Os dois formatos fundamentais de orquestração — pipelines sequenciais e scatter-gather concorrente — e a pergunta prévia que todo time deveria fazer: um sistema multi-agente é mesmo a resposta certa?

2026-04-04

Capítulo 5 — Protocolos de Transporte e Descoberta

Quinta postagem do passeio pelo LLM Primer IV. Os três transportes que o MCP suporta, a camada de descoberta .well-known com Server Cards, e as preocupações operacionais sem glamour — CORS, validação de origem, caching — que decidem se um servidor é cidadão de rede cooperativo ou um passivo.

2026-04-03

Capítulo 4 — Primitivas de Cliente: Comportamentos Agênticos e Controle

Quarta postagem do passeio pelo LLM Primer IV. Sampling, Roots e Elicitation são os três pequenos buracos controlados que o MCP abre na parede host-servidor — cada um uma capacidade concedida de volta, cada um um risco aceito em nome do usuário.

2026-04-02

Capítulo 3 — Primitivas de Servidor: Expondo Contexto e Capacidades

Terceira postagem do passeio pelo LLM Primer IV. Os três substantivos que um servidor MCP pode oferecer — Resources (estado de leitura), Prompts (andaime reutilizável), Tools (ações de escrita) — seus schemas, seus ciclos de vida, seus modelos de erro, e a disciplina de escolher a primitiva certa.

2026-04-01

Capítulo 2 — Revelando o Model Context Protocol (MCP)

Segunda postagem do passeio pelo LLM Primer IV. O que o MCP de fato padroniza, a divisão em três papéis entre Host, Cliente e Servidor, por que descoberta dinâmica e mensageria bidirecional diferem de REST nos casos que importam, e o ciclo de vida de sessão que abre com negociação de capacidades.

2026-03-31

Capítulo 1 — A Crise de Integração de IA e a Ascensão da Arquitetura Agêntica

Primeira postagem do passeio pelo LLM Primer IV. Por que agentes monolíticos se esfarrapam conforme prompts de sistema crescem, o problema de integração N vezes M escondido por baixo, e o movimento de engenharia de prompt para engenharia de contexto que o MCP foi feito para habilitar.

2026-03-30

LLM Primer IV — Introdução à Série e Índice

Abrindo o passeio capítulo a capítulo pelo Livro IV da série LLM Primer — Projetando a Cognição da IA com MCP. Por que agentes precisam de uma camada de protocolo para escalar além do demoware, para quem este livro foi escrito, e o cronograma das quatorze postagens que se seguem, de 30 de março a 12 de abril.

2026-03-29

A Série LLM Primer — Um guia de campo para a IA generativa, escrito um volume por vez

A Série LLM Primer — sete volumes de guia de campo para a IA generativa, por Sho Shimoda. Cada volume cobre uma camada diferente do trabalho com grandes modelos de linguagem, dos fundamentos à escala e à segurança. Esta é a página da série: uma visão de conjunto, mais o passeio capítulo a capítulo dos primeiros volumes.

2026-02-15