Introduction to LLM
This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.
제14장 — 벤치마킹, 테스트, 성능
LLM Primer IV 워크스루의 열다섯 번째이자 마지막 글입니다. 실제 서버 위의 MCP-Universe 벤치마크, 그것이 드러낸 두 가지 시스템적 실패 모드, 세션당 요청과 공유 세션 풀 사이의 10배 처리량 격차, 그리고 제5권으로의 다리를 살핍니다.
2026-04-12제13장 — 프레임워크와 클라우드 통합
LLM Primer IV 워크스루의 열세 번째 글입니다. Bedrock과 함께한 Strands, AWS 상태 층 패턴, Microsoft Agent Framework, LangChain, Semantic Kernel — 그리고 팀이 독립적으로 거듭 도착하는 세 가지 프로덕션 통합 모양을 살핍니다.
2026-04-11제12장 — 프로토콜 하드닝과 방어
LLM Primer IV 워크스루의 열두 번째 글입니다. 네 가지 방어 군집 — 암호화 증명, 유계 세션을 가진 OAuth 범위 규율, 런타임 샌드박싱, 사람-개입 게이트 — 이 적대적 조건에서 모델이 올바르게 행동하는 것에 의존하지 않는 자세로 조합되는 모습을 살핍니다.
2026-04-10제11장 — 공격 표면과 프로토콜 취약성
LLM Primer IV 워크스루의 열한 번째 글입니다. MCP에 적용된 고전적 공격 — Confused Deputy, Token Passthrough, 세션 하이재킹 — , 능력 에스컬레이션과 인증 없는 샘플링을 둘러싼 프로토콜 수준의 결함, 그리고 컨텍스트 오염을 위생 문제가 아니라 구조적 문제로 만드는 암묵적 신뢰 전파를 살핍니다.
2026-04-09제10장 — 장기 호라이즌 작업 메모리
LLM Primer IV 워크스루의 열 번째 글입니다. 윈도와 ReAct 스크래치패드를 통한 단기 메모리, 일화적 벡터와 의미적 저장소를 통한 장기 메모리, 그리고 에이전트가 시간과 일을 가로질러 생산적으로 유지되게 하는 압축 기법을 살핍니다.
2026-04-08제9장 — 주의력 예산 관리
LLM Primer IV 워크스루의 아홉 번째 글입니다. 컨텍스트 부패, 가운데에서 잃어버린 절벽, 도구 로드아웃 부패, 그리고 모델의 빠진 지식이 실제로 어디에 속하는지에 대한 세 가지 아키텍처적 답 — MCP, RAG, 파인튜닝 — 을 살핍니다.
2026-04-07제8장 — 아키텍처 배포 레이아웃
LLM Primer IV 워크스루의 여덟 번째 글입니다. MCP 생태계에서 떠오른 세 가지 배포 레이아웃 — 재사용 가능한 에이전트, 엄격한 순수성, 하이브리드 — 과 어느 것이 어느 프로젝트에 맞는지 결정하는 네 가지 묶이는 제약을 살핍니다.
2026-04-06제7장 — 고급 협업 및 동적 패턴
LLM Primer IV 워크스루의 일곱 번째 글입니다. 라운드테이블 합의, 핸드오프 라우팅, 마젠틱 오케스트레이션 — 토폴로지가 요청별로 만들어져야 할 때 떠오르는 패턴들과 더 단순한 패턴이 피하는 실패 모드(비종료, 잘못된 라우팅, 폭주 계획)를 살핍니다.
2026-04-05제6장 — 기초 오케스트레이션 전략
LLM Primer IV 워크스루의 여섯 번째 글입니다. 두 기초 오케스트레이션 모양 — 순차 파이프라인과 동시 산-수집 — 과 모든 팀이 먼저 물어야 할 선행 질문을 살핍니다. 다중 에이전트 시스템이 정말 알맞은 답인가?
2026-04-04제4장 — 클라이언트 프리미티브: 에이전트형 행동과 제어
LLM Primer IV 워크스루의 네 번째 글입니다. 샘플링, 루트, 일리시테이션은 MCP가 호스트-서버 벽에 뚫는 세 개의 작고 제어된 구멍입니다 — 각각 호스트가 서버에 빌려주는 능력이며, 각각 사용자를 대신해 받아들이는 위험입니다.
2026-04-02LLM Primer IV — 시리즈 소개 및 인덱스
LLM Primer 시리즈 제4권의 챕터별 워크스루를 여는 글입니다. 에이전트가 데모를 넘어 확장되려면 왜 프로토콜 층이 필요한지, 누구를 위해 이 책을 썼는지, 그리고 3월 30일부터 4월 12일까지 이어질 열네 편의 포스트 일정을 정리합니다.
2026-03-29제11장 — 지속적 업데이트와 파이프라인 최적화
LLM Primer III 워크스루의 열한 번째이자 마지막 글입니다. 파이프라인은 끝나지 않습니다 — 문서가 바뀌고, 쿼리가 옮겨 가며, 모델이 교체됩니다 — 그리고 그것을 소유한 팀은 세 시간 척도를 한꺼번에 생각하는 법을 배웁니다.
2026-03-28제10장 — 주요 평가 프레임워크
LLM Primer III 워크스루의 열 번째 글입니다. 평가 트라이어드에 도구 모음이 붙은 자리 — 두 진영의 여덟 프레임워크 — 그리고 그중 누구도 아직 풀지 못한 부분에 대한 한 차례 정직한 인정.
2026-03-27제9장 — RAG 평가 트라이어드
LLM Primer III 워크스루의 아홉 번째 글입니다. RAG 시스템은 세 곳에서 다르게 실패할 수 있고 밖에서 보면 그 실패가 똑같이 보입니다 — 컨텍스트 적합도, 근거성, 답변 적합도로 이루어진 평가 트라이어드는, 다른 버그를 고치며 또 다른 것을 측정하는 실수를 막아 주는 작은 어휘입니다.
2026-03-26제8장 — RAG 파이프라인의 데이터 비식별화
LLM Primer III 워크스루의 여덟 번째 글입니다. 모델이 데이터를 보기 전에 비식별화할 것인가, 사용자가 출력을 보기 전에 할 것인가. 답은 파이프라인의 모든 것을 바꾸고, 규제 체계가 보통 그 답을 골라 줍니다.
2026-03-25제7장 — 접근 제어 구현
LLM Primer III 워크스루의 일곱 번째 글입니다. 문서 수준 ACL을 토대로, Microsoft Purview 민감도 레이블과 함께 가는 RBAC, Zanzibar와 SpiceDB로 가는 ReBAC, 그리고 그 모두 아래에서 도는 사전 필터와 사후 필터의 규율을 함께 살펴봅니다.
2026-03-24제6장 — RAG 위협 모델과 취약점
LLM Primer III 워크스루의 여섯 번째 글입니다. 순수 LLM은 단 하나의 신뢰 경계를 가졌습니다. RAG 시스템은 여럿을 갖습니다 — 수집, 파서, 청커, 임베더, 인덱스, 리트리버, 리랭커, 생성기, 도구, 출력 — 그리고 각각이 적대자가 빚을 수 있는 입력에 닿아 있습니다.
2026-03-23제5장 — 검색 파이프라인 설계
LLM Primer III 워크스루의 다섯 번째 글입니다. 단일 벡터 검색이 왜 파이프라인이 아닌지 — 하이브리드 검색, RRF, 크로스 인코더 리랭킹, 그리고 쿼리 측 재작성과 HyDE — 가 어떻게 성숙한 RAG 시스템이 수렴하는 프로덕션 아키텍처로 조립되는지를 함께 살펴봅니다.
2026-03-22제4장 — 올바른 벡터 데이터베이스 선택
LLM Primer III 워크스루의 네 번째 글입니다. 목적별 벡터 데이터베이스와 Postgres 류 확장의 아키텍처적 분기, 매니지드의 선두 주자(Pinecone, Vertex), 오픈소스의 진영(Qdrant, Milvus, Weaviate), 임베디드 옵션, 그리고 실제 선택을 가르는 세 운영 축 — 데이터 거주성, 운영, 비용 — 을 함께 살펴봅니다.
2026-03-21제3장 — 고급 청킹 프레임워크
LLM Primer III 워크스루의 세 번째 글입니다. 고정 크기에서 구조 인지까지 이어지는 청킹 스펙트럼, 오버랩 미신, 검색을 조용히 무너뜨리는 컨텍스트 클리프, 그리고 최전선의 셈을 다시 짠 컨텍스추얼 리트리벌과 레이트 청킹을 함께 살펴봅니다.
2026-03-20제2장 — 지능형 문서 파싱
LLM Primer III 워크스루의 두 번째 글입니다. PDF가 텍스트 파일이 아닌 이유, 레이아웃 인지 파서가 실제로 보존하는 것, 현재 도구 지형(LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), 그리고 페이지 이미지 위에서 직접 검색하는 멀티모달 트랙을 함께 살펴봅니다.
2026-03-19제1장 — RAG 아키텍처의 진화
LLM Primer III 워크스루의 첫 번째 글입니다. RAG의 네 가지 아키텍처 자세 — 나이브, 어드밴스드, 모듈러, 에이전틱 — 를 한 결정씩 LLM에게 권한을 더 넘겨주는 이야기로 읽고, 검색보다 파인튜닝이 더 나은 도구가 되는 자리를 솔직하게 짚습니다.
2026-03-18LLM Primer III — 시리즈 소개 및 인덱스
LLM Primer 시리즈 제3권의 챕터별 워크스루를 여는 글입니다. 검색 증강 생성이 밖에서는 단순해 보이지만 안에서는 여러 분야가 겹친 스택임을 짚고, 누구를 위해 이 책을 썼는지, 그리고 3월 18일부터 28일까지 이어질 열한 편의 포스트 일정을 정리합니다.
2026-03-17제11장 — 평가, 보정, 추론
LLM Primer II 시리즈 제11장입니다. 무엇이든 말할 수 있는 기계를 도대체 어떻게 잰단 말인가 — 그리고 "확신에 찬 모델은 거의 늘 보정이 나쁜 모델이라는 사실"을 마주하게 되는 자리. 퍼플렉시티, 보정, 벤치마크의 오차 막대, 환각의 수학을 함께 풀어 봅니다.
2026-03-13제9장 — RAG: 모델에 최신의 결을 흘려보내는 길
LLM Primer I 시리즈 제9장입니다. 검색 보강 생성(RAG)이 정확히 무엇이고, 모델의 시간 인지의 결손과 사실 정확성의 결을 어떻게 뒷받침해 주는지 — 그리고 좋은 RAG와 나쁜 RAG의 갈림은 어디서 시작되는지를 풀어 봅니다.
2026-02-26제8장 — 모델 한 대로는 부족할 때: 도구 사용과 에이전트
LLM Primer I 시리즈 제8장입니다. 모델을 모델 바깥의 결로 확장하는 자리 — 도구 사용, 함수 호출, 에이전트 — 그리고 2026 에디션의 새 절 §8.6 "에이전트 패턴"의 큰 가닥을 함께 풀어 봅니다.
2026-02-25제5장 — 그래도 작은 결함이 남아 있다
LLM Primer I 시리즈 제5장입니다. 잘 학습된 LLM도 여전히 갖고 있는 결함 — 환각, 시간 감각의 결손, 계산의 약점, 출력의 일관성 흔들림 — 의 정체를 들여다보고, 그것이 왜 "버그"가 아니라 같은 메커니즘에서 함께 나오는 "특성"인지를 풀어 봅니다.
2026-02-22제1장 — 대규모 언어 모델이란 무엇인가 (헤드라인 너머)
LLM Primer I 시리즈 제1장입니다. "대규모", "언어", "모델"이 정말로 가리키는 것이 무엇인지 풀어내고, 룰 기반 시스템에서 뉴럴 네트워크로 옮겨온 과정을 짚고, 현대 LLM의 작동에 대한 세 가지 큰 오해를 다룹니다. 앞으로 이어질 모든 내용의 토대가 될, 명료하고 읽기 쉬운 입구입니다.
2026-02-18LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스
『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.
2026-02-17LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서
LLM 입문서(LLM Primer) 시리즈 — 시모다 쇼헤이가 쓴, 생성형 AI를 다루기 위한 일곱 권의 현장 가이드입니다. 기초부터 보안까지, 각 권이 대규모 언어 모델을 마주할 때의 서로 다른 층을 다룹니다. 이 페이지는 시리즈 전체의 지도이자, 제1·2권의 챕터별 워크스루를 한자리에 모아 둔 랜딩 페이지입니다.
2026-02-15LLM 정의와 개요: 파라미터, 학습 방식, 그리고 확장성 이해
LLM(대규모 언어 모델)은 수억~수조 개의 파라미터로 학습된 신경망 기반 모델입니다. 본 섹션에서는 LLM의 정의와 개요, 파라미터의 역할, 사전 학습과 파인튜닝, 자기 지도 학습, 그리고 확장성에 대해 설명합니다.
2024-09-03