Introduction to LLM

This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.

Total of 38 articles available. | Currently on page 1 of 1.

제11장 — 관측 가능성, 로깅, 사건 대응

확률적 시스템에서 로깅해야 할 것, 시그니처·통계·행동 신호를 조합한 탐지, 그리고 재현 가능성을 확보하는 NIST 800-61 형태의 사건 대응.

2026-05-20

제7장 — 환각과 신뢰성

환각의 두 메커니즘 — 사실성과 충실성 실패, 신경망의 구조적 과신, 그리고 캘리브레이션·RAG 접지·human-in-the-loop로 이루어지는 신뢰성 엔지니어링.

2026-05-16

제6장 — 검색 증강 생성의 위험

RAG 파이프라인의 다섯 신뢰 경계, 인덱스를 통한 인젝션 공격, PoisonedRAG와 BadRAG, 그리고 아키텍처적으로 안전한 검색 패턴.

2026-05-15

제5장 — 입력 검증과 출력 필터링

단계적 위생 처리, 방어로서의 구조화된 출력, Llama Guard와 NeMo Guardrails, 그리고 Garak·PyRIT로 안전을 측정하는 방법.

2026-05-14

제2장 — LLM 시스템의 위협 모델링

Shostack의 네 질문, STRIDE와 PASTA, MITRE ATLAS를 LLM 시스템에 적용. 자산 목록·적대자 카탈로그·위협 등록부를 채우는 작업 템플릿을 걷습니다.

2026-05-11

제1장 — 왜 AI 보안은 다른가

LLM 보안이 코드 보안이 아닌 이유. 확률적 시스템의 행동 포락선이 공격 표면이 되며, 프롬프트·검색·도구·학습·모델·출력의 여섯 표면이 새로운 신뢰 경계를 규정합니다.

2026-05-10

LLM Primer VII — 시리즈 소개 및 목차

LLM Primer VII: AI 보안의 챕터별 워크스루 소개. 위협 모델부터 규제 경계까지, 시리즈의 마지막 권에서 엔지니어링 아크가 적대자와 만나는 지점을 다룹니다.

2026-05-09

제8장 — 차세대 KV 캐시 관리

운영체제의 페이징 통찰을 추론 엔진으로 옮겨 오는 장 — KV 캐시를 예약된 바이트 슬래브에서 공유·축출·프리픽스 캐시가 가능한 자원으로 바꿉니다.

2026-04-30

제7장 — 고급 배칭 전략

배칭은 최적화가 아니라 대역폭에 묶인 디코딩을 감당 가능하게 만드는 하중 지지 수이며, 배치는 명사가 아니라 동사입니다.

2026-04-29

제4장 — 특화 AI 실리콘과 ASIC

GPU와 ASIC의 선택은 워크로드 모양의 문제입니다 — 이 장은 그 모양을 줍니다.

2026-04-26

LLM Primer VI — 시리즈 서문 및 목차

LLM Primer VI — AI 시스템 확장하기의 16개 챕터를 하루 한 편씩 걷는 워크스루의 서문입니다. 메모리 대역폭, 스케줄링, 그리고 청구서가 만나는 지점에서 LLM 추론을 엔지니어링 학문으로 다룹니다.

2026-04-22

제7장 — LLM 보안과 가드레일

LLM 애플리케이션이 새로 들여오는 보안 축을 명명하고, 그 위에 네 층의 완화 매트릭스를 세우는 장. 원리는 하나 — 권한은 신뢰 출처와 일치해야 합니다.

2026-04-20

제5장 — LLM 애플리케이션 평가하기

LLM 출력에는 assertEqual이 죽었음을 인정하고, 앵커된 판정자, RAG 트라이어드, 궤적 테스트를 중심으로 테스트 규율을 다시 세우는 장.

2026-04-18

제4장 — AI 에이전트와 도구 호출

언어 모델을 도구를 상대로 루프 도는 행위자로 바꾸는 엔지니어링을 다루는 장. 스키마, 메모리 층, 그리고 다중 에이전트 배선이 데모를 프로덕션 행위자로 만듭니다.

2026-04-17

제3장 — 검색 증강 생성

RAG 파이프라인을 끝에서 끝까지 걷고, 열 개의 즐겨찾기 문서에서만 잘 돌아가는 데모와 실제 코퍼스와 접촉하고도 살아남는 시스템 사이의 차이를 그리는 장.

2026-04-16

제2장 — 파운데이션 모델과 프롬프트 엔지니어링

프롬프트 엔지니어링을 예술이 아니라 엔지니어링으로 다루는 장. 모델 선택, 샘플링 파라미터, 방어적 프롬프트 해부학, 그리고 스키마를 강제하는 구조화 출력 — 네 개의 제어 표면.

2026-04-15

LLM Primer V — 시리즈 소개 및 목차

LLM Primer V 워크스루 시리즈의 시작. AI 엔지니어링을 프롬프트 트릭이 아니라 하나의 학문 분야로 다루는 제5권을, 8개 장을 따라 하루에 한 편씩 살핍니다.

2026-04-13

제9장 — 주의력 예산 관리

LLM Primer IV 워크스루의 아홉 번째 글입니다. 컨텍스트 부패, 가운데에서 잃어버린 절벽, 도구 로드아웃 부패, 그리고 모델의 빠진 지식이 실제로 어디에 속하는지에 대한 세 가지 아키텍처적 답 — MCP, RAG, 파인튜닝 — 을 살핍니다.

2026-04-07

제8장 — 아키텍처 배포 레이아웃

LLM Primer IV 워크스루의 여덟 번째 글입니다. MCP 생태계에서 떠오른 세 가지 배포 레이아웃 — 재사용 가능한 에이전트, 엄격한 순수성, 하이브리드 — 과 어느 것이 어느 프로젝트에 맞는지 결정하는 네 가지 묶이는 제약을 살핍니다.

2026-04-06

제11장 — 지속적 업데이트와 파이프라인 최적화

LLM Primer III 워크스루의 열한 번째이자 마지막 글입니다. 파이프라인은 끝나지 않습니다 — 문서가 바뀌고, 쿼리가 옮겨 가며, 모델이 교체됩니다 — 그리고 그것을 소유한 팀은 세 시간 척도를 한꺼번에 생각하는 법을 배웁니다.

2026-03-28

제10장 — 주요 평가 프레임워크

LLM Primer III 워크스루의 열 번째 글입니다. 평가 트라이어드에 도구 모음이 붙은 자리 — 두 진영의 여덟 프레임워크 — 그리고 그중 누구도 아직 풀지 못한 부분에 대한 한 차례 정직한 인정.

2026-03-27

제9장 — RAG 평가 트라이어드

LLM Primer III 워크스루의 아홉 번째 글입니다. RAG 시스템은 세 곳에서 다르게 실패할 수 있고 밖에서 보면 그 실패가 똑같이 보입니다 — 컨텍스트 적합도, 근거성, 답변 적합도로 이루어진 평가 트라이어드는, 다른 버그를 고치며 또 다른 것을 측정하는 실수를 막아 주는 작은 어휘입니다.

2026-03-26

제8장 — RAG 파이프라인의 데이터 비식별화

LLM Primer III 워크스루의 여덟 번째 글입니다. 모델이 데이터를 보기 전에 비식별화할 것인가, 사용자가 출력을 보기 전에 할 것인가. 답은 파이프라인의 모든 것을 바꾸고, 규제 체계가 보통 그 답을 골라 줍니다.

2026-03-25

제7장 — 접근 제어 구현

LLM Primer III 워크스루의 일곱 번째 글입니다. 문서 수준 ACL을 토대로, Microsoft Purview 민감도 레이블과 함께 가는 RBAC, Zanzibar와 SpiceDB로 가는 ReBAC, 그리고 그 모두 아래에서 도는 사전 필터와 사후 필터의 규율을 함께 살펴봅니다.

2026-03-24

제6장 — RAG 위협 모델과 취약점

LLM Primer III 워크스루의 여섯 번째 글입니다. 순수 LLM은 단 하나의 신뢰 경계를 가졌습니다. RAG 시스템은 여럿을 갖습니다 — 수집, 파서, 청커, 임베더, 인덱스, 리트리버, 리랭커, 생성기, 도구, 출력 — 그리고 각각이 적대자가 빚을 수 있는 입력에 닿아 있습니다.

2026-03-23

제5장 — 검색 파이프라인 설계

LLM Primer III 워크스루의 다섯 번째 글입니다. 단일 벡터 검색이 왜 파이프라인이 아닌지 — 하이브리드 검색, RRF, 크로스 인코더 리랭킹, 그리고 쿼리 측 재작성과 HyDE — 가 어떻게 성숙한 RAG 시스템이 수렴하는 프로덕션 아키텍처로 조립되는지를 함께 살펴봅니다.

2026-03-22

LLM Primer III 워크스루의 네 번째 글입니다. 목적별 벡터 데이터베이스와 Postgres 류 확장의 아키텍처적 분기, 매니지드의 선두 주자(Pinecone, Vertex), 오픈소스의 진영(Qdrant, Milvus, Weaviate), 임베디드 옵션, 그리고 실제 선택을 가르는 세 운영 축 — 데이터 거주성, 운영, 비용 — 을 함께 살펴봅니다.

2026-03-21

제2장 — 지능형 문서 파싱

LLM Primer III 워크스루의 두 번째 글입니다. PDF가 텍스트 파일이 아닌 이유, 레이아웃 인지 파서가 실제로 보존하는 것, 현재 도구 지형(LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), 그리고 페이지 이미지 위에서 직접 검색하는 멀티모달 트랙을 함께 살펴봅니다.

2026-03-19

제1장 — RAG 아키텍처의 진화

LLM Primer III 워크스루의 첫 번째 글입니다. RAG의 네 가지 아키텍처 자세 — 나이브, 어드밴스드, 모듈러, 에이전틱 — 를 한 결정씩 LLM에게 권한을 더 넘겨주는 이야기로 읽고, 검색보다 파인튜닝이 더 나은 도구가 되는 자리를 솔직하게 짚습니다.

2026-03-18

LLM Primer III — 시리즈 소개 및 인덱스

LLM Primer 시리즈 제3권의 챕터별 워크스루를 여는 글입니다. 검색 증강 생성이 밖에서는 단순해 보이지만 안에서는 여러 분야가 겹친 스택임을 짚고, 누구를 위해 이 책을 썼는지, 그리고 3월 18일부터 28일까지 이어질 열한 편의 포스트 일정을 정리합니다.

2026-03-17

제11장 — 평가, 보정, 추론

LLM Primer II 시리즈 제11장입니다. 무엇이든 말할 수 있는 기계를 도대체 어떻게 잰단 말인가 — 그리고 "확신에 찬 모델은 거의 늘 보정이 나쁜 모델이라는 사실"을 마주하게 되는 자리. 퍼플렉시티, 보정, 벤치마크의 오차 막대, 환각의 수학을 함께 풀어 봅니다.

2026-03-13

제12장 — LLM 시스템을 짓는다는 것, 그리고 이 다음

LLM Primer I 시리즈 마지막 글 — 제12장입니다. 모델 한 대를 넘어, 도구와 RAG와 평가와 가드레일을 한 자리에 엮어 한 시스템으로 짓는 길을 풀어내고, 본책 다음 권으로 이어지는 다리를 함께 놓습니다.

2026-03-01

제9장 — RAG: 모델에 최신의 결을 흘려보내는 길

LLM Primer I 시리즈 제9장입니다. 검색 보강 생성(RAG)이 정확히 무엇이고, 모델의 시간 인지의 결손과 사실 정확성의 결을 어떻게 뒷받침해 주는지 — 그리고 좋은 RAG와 나쁜 RAG의 갈림은 어디서 시작되는지를 풀어 봅니다.

2026-02-26

제8장 — 모델 한 대로는 부족할 때: 도구 사용과 에이전트

LLM Primer I 시리즈 제8장입니다. 모델을 모델 바깥의 결로 확장하는 자리 — 도구 사용, 함수 호출, 에이전트 — 그리고 2026 에디션의 새 절 §8.6 "에이전트 패턴"의 큰 가닥을 함께 풀어 봅니다.

2026-02-25

제5장 — 그래도 작은 결함이 남아 있다

LLM Primer I 시리즈 제5장입니다. 잘 학습된 LLM도 여전히 갖고 있는 결함 — 환각, 시간 감각의 결손, 계산의 약점, 출력의 일관성 흔들림 — 의 정체를 들여다보고, 그것이 왜 "버그"가 아니라 같은 메커니즘에서 함께 나오는 "특성"인지를 풀어 봅니다.

2026-02-22

제3장 — 모델 안에서 텍스트는 어떻게 흐르는가

LLM Primer I 시리즈 제3장입니다. 토큰이 모델 내부에서 어떤 모습으로 변신해 가는지 — 임베딩, 어텐션, 트랜스포머 — 를, 수식의 함정에 빠지지 않으면서 정확함을 잃지 않을 정도로 풀어냅니다.

2026-02-20

LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스

『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.

2026-02-17

LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서

LLM Primer 시리즈 — Sho Shimoda의 생성형 AI 필드 가이드, 이제 완결. 기초부터 보안까지 7권 전권. 자매 볼륨 Physical AI도 포함. 7권 모두 Amazon에서 판매 중.

2026-02-15