Introduction to LLM
This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.
제11장 — 평가, 보정, 추론
LLM Primer II 시리즈 제11장입니다. 무엇이든 말할 수 있는 기계를 도대체 어떻게 잰단 말인가 — 그리고 "확신에 찬 모델은 거의 늘 보정이 나쁜 모델이라는 사실"을 마주하게 되는 자리. 퍼플렉시티, 보정, 벤치마크의 오차 막대, 환각의 수학을 함께 풀어 봅니다.
2026-03-13제10장 — 사후 학습과 정렬의 수학
LLM Primer II 시리즈 제10장입니다. 똑똑하지만 길들지 않은 다음 토큰 예측기를, 쓸 만한 어시스턴트로 길들이는 자리 — 지도 파인튜닝, 보상 모델, KL 페널티 위의 RLHF, 그리고 강화학습 파이프라인 전체가 하나의 지도학습 손실로 접히는 DPO의 우아한 유도까지 함께 풀어 봅니다.
2026-03-12제8장 — 모델 한 대로는 부족할 때: 도구 사용과 에이전트
LLM Primer I 시리즈 제8장입니다. 모델을 모델 바깥의 결로 확장하는 자리 — 도구 사용, 함수 호출, 에이전트 — 그리고 2026 에디션의 새 절 §8.6 "에이전트 패턴"의 큰 가닥을 함께 풀어 봅니다.
2026-02-25제5장 — 그래도 작은 결함이 남아 있다
LLM Primer I 시리즈 제5장입니다. 잘 학습된 LLM도 여전히 갖고 있는 결함 — 환각, 시간 감각의 결손, 계산의 약점, 출력의 일관성 흔들림 — 의 정체를 들여다보고, 그것이 왜 "버그"가 아니라 같은 메커니즘에서 함께 나오는 "특성"인지를 풀어 봅니다.
2026-02-22제4장 — 모델은 어떻게 학습되는가
LLM Primer I 시리즈 제4장입니다. 사전학습이 학습 결과를 형성하는 큰 무대인 이유, 파인튜닝이 모델 인격을 조각해 가는 정밀 작업인 이유, 그리고 RLHF가 단순한 "다음 토큰 예측기"를 매일 우리가 신뢰하는 그 어시스턴트로 만들어주는 방식을 풀어 봅니다.
2026-02-21제2장 — 확률, 토큰, 그리고 텍스트
LLM Primer I 시리즈 제2장입니다. 토큰이 단어와 어떻게 다른지, 모델이 매번 만들어내는 "다음 토큰 후보들의 확률 분포"가 정확히 무엇인지, 그리고 같은 모델이 따분한 글과 창의적인 글을 같이 쓸 수 있게 해주는 샘플링 노브 — temperature와 top-p — 의 정체를 풀어냅니다.
2026-02-19LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서
LLM 입문서(LLM Primer) 시리즈 — 시모다 쇼헤이가 쓴, 생성형 AI를 다루기 위한 일곱 권의 현장 가이드입니다. 기초부터 보안까지, 각 권이 대규모 언어 모델을 마주할 때의 서로 다른 층을 다룹니다. 이 페이지는 시리즈 전체의 지도이자, 제1·2권의 챕터별 워크스루를 한자리에 모아 둔 랜딩 페이지입니다.
2026-02-15