Introduction to LLM

This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.


Total of 2 articles available. | Currently on page 1 of 1.

제10장 — 사후 학습과 정렬의 수학

LLM Primer II 시리즈 제10장입니다. 똑똑하지만 길들지 않은 다음 토큰 예측기를, 쓸 만한 어시스턴트로 길들이는 자리 — 지도 파인튜닝, 보상 모델, KL 페널티 위의 RLHF, 그리고 강화학습 파이프라인 전체가 하나의 지도학습 손실로 접히는 DPO의 우아한 유도까지 함께 풀어 봅니다.

2026-03-12

제4장 — 모델은 어떻게 학습되는가

LLM Primer I 시리즈 제4장입니다. 사전학습이 학습 결과를 형성하는 큰 무대인 이유, 파인튜닝이 모델 인격을 조각해 가는 정밀 작업인 이유, 그리고 RLHF가 단순한 "다음 토큰 예측기"를 매일 우리가 신뢰하는 그 어시스턴트로 만들어주는 방식을 풀어 봅니다.

2026-02-21