Introduction to LLM
This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.
제14장 — 벤치마킹, 테스트, 성능
LLM Primer IV 워크스루의 열다섯 번째이자 마지막 글입니다. 실제 서버 위의 MCP-Universe 벤치마크, 그것이 드러낸 두 가지 시스템적 실패 모드, 세션당 요청과 공유 세션 풀 사이의 10배 처리량 격차, 그리고 제5권으로의 다리를 살핍니다.
2026-04-12제12장 — 프로토콜 하드닝과 방어
LLM Primer IV 워크스루의 열두 번째 글입니다. 네 가지 방어 군집 — 암호화 증명, 유계 세션을 가진 OAuth 범위 규율, 런타임 샌드박싱, 사람-개입 게이트 — 이 적대적 조건에서 모델이 올바르게 행동하는 것에 의존하지 않는 자세로 조합되는 모습을 살핍니다.
2026-04-10제11장 — 공격 표면과 프로토콜 취약성
LLM Primer IV 워크스루의 열한 번째 글입니다. MCP에 적용된 고전적 공격 — Confused Deputy, Token Passthrough, 세션 하이재킹 — , 능력 에스컬레이션과 인증 없는 샘플링을 둘러싼 프로토콜 수준의 결함, 그리고 컨텍스트 오염을 위생 문제가 아니라 구조적 문제로 만드는 암묵적 신뢰 전파를 살핍니다.
2026-04-09제10장 — 장기 호라이즌 작업 메모리
LLM Primer IV 워크스루의 열 번째 글입니다. 윈도와 ReAct 스크래치패드를 통한 단기 메모리, 일화적 벡터와 의미적 저장소를 통한 장기 메모리, 그리고 에이전트가 시간과 일을 가로질러 생산적으로 유지되게 하는 압축 기법을 살핍니다.
2026-04-08제8장 — 아키텍처 배포 레이아웃
LLM Primer IV 워크스루의 여덟 번째 글입니다. MCP 생태계에서 떠오른 세 가지 배포 레이아웃 — 재사용 가능한 에이전트, 엄격한 순수성, 하이브리드 — 과 어느 것이 어느 프로젝트에 맞는지 결정하는 네 가지 묶이는 제약을 살핍니다.
2026-04-06제6장 — 기초 오케스트레이션 전략
LLM Primer IV 워크스루의 여섯 번째 글입니다. 두 기초 오케스트레이션 모양 — 순차 파이프라인과 동시 산-수집 — 과 모든 팀이 먼저 물어야 할 선행 질문을 살핍니다. 다중 에이전트 시스템이 정말 알맞은 답인가?
2026-04-04제5장 — 전송 프로토콜과 발견
LLM Primer IV 워크스루의 다섯 번째 글입니다. MCP가 지원하는 세 가지 전송, 서버 카드를 가진 .well-known 발견 층, 그리고 서버를 협력적 네트워크 시민으로 만들지 부채로 만들지 결정하는 따분한 운영적 관심사들 — CORS, 오리진 검증, 캐싱 — 을 살핍니다.
2026-04-03제3장 — 서버 프리미티브: 컨텍스트와 능력의 노출
LLM Primer IV 워크스루의 세 번째 글입니다. MCP 서버가 내놓을 수 있는 세 개의 명사 — Resources(읽기 상태), Prompts(재사용 가능한 스캐폴드), Tools(쓰기 행동) — 와 그 스키마, 라이프사이클, 오류 모델, 그리고 알맞은 프리미티브를 고르는 규율을 살핍니다.
2026-04-01제2장 — Model Context Protocol(MCP)의 베일 벗기
LLM Primer IV 워크스루의 두 번째 글입니다. MCP가 실제로 무엇을 표준화하는지, Host·Client·Server의 세 역할 분할, 중요한 경우에 동적 발견과 양방향 메시징이 REST와 어떻게 다른지, 그리고 능력 협상으로 열리는 세션 라이프사이클을 봅니다.
2026-03-31제1장 — AI 통합 위기와 에이전트형 아키텍처의 부상
LLM Primer IV 워크스루의 첫 번째 글입니다. 시스템 프롬프트가 자라며 모놀리식 에이전트가 닳아 가는 과정, 그 밑에 숨은 N 곱하기 M 통합 문제, 그리고 MCP가 가능하게 하기 위해 만들어진 프롬프트 엔지니어링에서 컨텍스트 엔지니어링으로의 이행을 살핍니다.
2026-03-30LLM Primer IV — 시리즈 소개 및 인덱스
LLM Primer 시리즈 제4권의 챕터별 워크스루를 여는 글입니다. 에이전트가 데모를 넘어 확장되려면 왜 프로토콜 층이 필요한지, 누구를 위해 이 책을 썼는지, 그리고 3월 30일부터 4월 12일까지 이어질 열네 편의 포스트 일정을 정리합니다.
2026-03-29제4장 — 올바른 벡터 데이터베이스 선택
LLM Primer III 워크스루의 네 번째 글입니다. 목적별 벡터 데이터베이스와 Postgres 류 확장의 아키텍처적 분기, 매니지드의 선두 주자(Pinecone, Vertex), 오픈소스의 진영(Qdrant, Milvus, Weaviate), 임베디드 옵션, 그리고 실제 선택을 가르는 세 운영 축 — 데이터 거주성, 운영, 비용 — 을 함께 살펴봅니다.
2026-03-21제10장 — 사후 학습과 정렬의 수학
LLM Primer II 시리즈 제10장입니다. 똑똑하지만 길들지 않은 다음 토큰 예측기를, 쓸 만한 어시스턴트로 길들이는 자리 — 지도 파인튜닝, 보상 모델, KL 페널티 위의 RLHF, 그리고 강화학습 파이프라인 전체가 하나의 지도학습 손실로 접히는 DPO의 우아한 유도까지 함께 풀어 봅니다.
2026-03-12제7장 — 모델을 더 영리하게 쓰는 방식: 프롬프트 엔지니어링
LLM Primer I 시리즈 제7장입니다. 같은 모델을 두 배쯤 영리하게 만들어주는 프롬프트의 갈래들 — 시스템 프롬프트, 퓨샷 예시, 사고의 사슬, 역할 설정 — 그리고 그 갈래들이 왜 통하는지를, 다음 토큰 예측의 메커니즘과 이어 풀어 봅니다.
2026-02-24제4장 — 모델은 어떻게 학습되는가
LLM Primer I 시리즈 제4장입니다. 사전학습이 학습 결과를 형성하는 큰 무대인 이유, 파인튜닝이 모델 인격을 조각해 가는 정밀 작업인 이유, 그리고 RLHF가 단순한 "다음 토큰 예측기"를 매일 우리가 신뢰하는 그 어시스턴트로 만들어주는 방식을 풀어 봅니다.
2026-02-21LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스
『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.
2026-02-17LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서
LLM 입문서(LLM Primer) 시리즈 — 시모다 쇼헤이가 쓴, 생성형 AI를 다루기 위한 일곱 권의 현장 가이드입니다. 기초부터 보안까지, 각 권이 대규모 언어 모델을 마주할 때의 서로 다른 층을 다룹니다. 이 페이지는 시리즈 전체의 지도이자, 제1·2권의 챕터별 워크스루를 한자리에 모아 둔 랜딩 페이지입니다.
2026-02-15