Introduction to LLM
This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.
제3장 — 고급 청킹 프레임워크
LLM Primer III 워크스루의 세 번째 글입니다. 고정 크기에서 구조 인지까지 이어지는 청킹 스펙트럼, 오버랩 미신, 검색을 조용히 무너뜨리는 컨텍스트 클리프, 그리고 최전선의 셈을 다시 짠 컨텍스추얼 리트리벌과 레이트 청킹을 함께 살펴봅니다.
2026-03-20제2장 — 지능형 문서 파싱
LLM Primer III 워크스루의 두 번째 글입니다. PDF가 텍스트 파일이 아닌 이유, 레이아웃 인지 파서가 실제로 보존하는 것, 현재 도구 지형(LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), 그리고 페이지 이미지 위에서 직접 검색하는 멀티모달 트랙을 함께 살펴봅니다.
2026-03-19LLM Primer III — 시리즈 소개 및 인덱스
LLM Primer 시리즈 제3권의 챕터별 워크스루를 여는 글입니다. 검색 증강 생성이 밖에서는 단순해 보이지만 안에서는 여러 분야가 겹친 스택임을 짚고, 누구를 위해 이 책을 썼는지, 그리고 3월 18일부터 28일까지 이어질 열한 편의 포스트 일정을 정리합니다.
2026-03-17제3장 — 모델 안에서 텍스트는 어떻게 흐르는가
LLM Primer I 시리즈 제3장입니다. 토큰이 모델 내부에서 어떤 모습으로 변신해 가는지 — 임베딩, 어텐션, 트랜스포머 — 를, 수식의 함정에 빠지지 않으면서 정확함을 잃지 않을 정도로 풀어냅니다.
2026-02-20제2장 — 확률, 토큰, 그리고 텍스트
LLM Primer I 시리즈 제2장입니다. 토큰이 단어와 어떻게 다른지, 모델이 매번 만들어내는 "다음 토큰 후보들의 확률 분포"가 정확히 무엇인지, 그리고 같은 모델이 따분한 글과 창의적인 글을 같이 쓸 수 있게 해주는 샘플링 노브 — temperature와 top-p — 의 정체를 풀어냅니다.
2026-02-19LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스
『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.
2026-02-17LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서
LLM 입문서(LLM Primer) 시리즈 — 시모다 쇼헤이가 쓴, 생성형 AI를 다루기 위한 일곱 권의 현장 가이드입니다. 기초부터 보안까지, 각 권이 대규모 언어 모델을 마주할 때의 서로 다른 층을 다룹니다. 이 페이지는 시리즈 전체의 지도이자, 제1·2권의 챕터별 워크스루를 한자리에 모아 둔 랜딩 페이지입니다.
2026-02-15