Introduction to LLM
This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.
Total of 1 articles available. |
Currently on page 1 of 1.
제10장 — 사후 학습과 정렬의 수학
LLM Primer II 시리즈 제10장입니다. 똑똑하지만 길들지 않은 다음 토큰 예측기를, 쓸 만한 어시스턴트로 길들이는 자리 — 지도 파인튜닝, 보상 모델, KL 페널티 위의 RLHF, 그리고 강화학습 파이프라인 전체가 하나의 지도학습 손실로 접히는 DPO의 우아한 유도까지 함께 풀어 봅니다.
2026-03-12