Introduction to LLM - LLM Primer II — 수학으로 읽는 언어 모델
This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.
Total of 2 articles available. |
Currently on page 1 of 1.
제11장 — 평가, 보정, 추론
LLM Primer II 시리즈 제11장입니다. 무엇이든 말할 수 있는 기계를 도대체 어떻게 잰단 말인가 — 그리고 "확신에 찬 모델은 거의 늘 보정이 나쁜 모델이라는 사실"을 마주하게 되는 자리. 퍼플렉시티, 보정, 벤치마크의 오차 막대, 환각의 수학을 함께 풀어 봅니다.
2026-03-13제10장 — 사후 학습과 정렬의 수학
LLM Primer II 시리즈 제10장입니다. 똑똑하지만 길들지 않은 다음 토큰 예측기를, 쓸 만한 어시스턴트로 길들이는 자리 — 지도 파인튜닝, 보상 모델, KL 페널티 위의 RLHF, 그리고 강화학습 파이프라인 전체가 하나의 지도학습 손실로 접히는 DPO의 우아한 유도까지 함께 풀어 봅니다.
2026-03-12