Introdução ao LLM

Esta página oferece um guia sobre LLMs (Modelos de Linguagem em Grande Escala) desde os conceitos básicos até as aplicações, para entusiastas de IA.


Total de 2 artigos disponíveis. | Atualmente na página 1 de 1.

Capítulo 10 — Matemática do Pós-Treinamento e Alinhamento

Décimo post do passeio capítulo a capítulo pelo LLM Primer II. Como um previsor de próximo token brilhante e feral é civilizado em assistente útil — SFT, modelo de recompensa, RLHF na coleira do KL, e a derivação elegante do DPO que colapsa o pipeline inteiro em uma única perda supervisionada.

2026-03-12

Capítulo 4 — Como o modelo aprende

Quarto post do passeio capítulo a capítulo pelo LLM Primer I. Por que o pré-treinamento define o teto da capacidade, por que o fine-tuning esculpe a personalidade, e como o RLHF transforma um previsor de tokens no assistente em que confiamos todo dia.

2026-02-21