Introduction aux LLM
Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.
Total de 1 articles disponibles. |
Actuellement à la page 1 de 1.
Chapitre 10 — Mathématiques du Post-Entraînement et de l'Alignement
Chapitre 10 de la série LLM Primer II. Le chapitre où un prédicteur du prochain mot brillant mais sauvage est civilisé en assistant utile — affinage supervisé, modélisation de la récompense, RLHF tenu en laisse par KL, et la dérivation élégante de DPO qui fait disparaître tout le pipeline de RL.
2026-03-12