Introduction to LLM

This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.

Total of 33 articles available. | Currently on page 1 of 1.

제17장 — 미래의 위협과 새롭게 등장하는 방어

자율 에이전트의 폭발 반경, 멀티모달 표면이 넓히는 인젝션 채널, 합성 신원과 AI 대 AI 동역학, 그리고 LLM Primer 시리즈의 마지막 마무리.

2026-05-26

제16장 — 안전한 파인튜닝과 적응

파인튜닝된 모델을 물려받는 것이 아니라 획득해야 할 아티팩트로 다루기. 정렬 침식, 소규모 데이터 오염, CI 평가 게이트, 그리고 롤백 규율.

2026-05-25

제15장 — 안전한 AI 조직 구축

기술 통제가 시간과의 접촉을 살아남게 하는 층 — 문화, 레드팀, 벤더 위험 평가, 지속 평가, 그리고 장기적 모델 스튜어드십.

2026-05-24

제14장 — 편향, 공정성, 책임 있는 AI

편향의 다섯 근원, 서로 불일치하는 공정성 지표, 안전-유용성 트레이드오프, 그리고 설명 가능성이 규제와 만나지 못하는 간극을 다루는 조직의 AI 정책.

2026-05-23

제12장 — 접근 제어와 신원

OAuth·mTLS·RBAC·ABAC의 LLM 이식, 멀티테넌트 격리의 세 접근, 그리고 SAML·SCIM·감사 로그가 만드는 엔터프라이즈 거버넌스 오버레이.

2026-05-21

제8장 — 모델에 대한 적대적 공격

FGSM에서 TextFooler·보편적 접미사까지의 계보, API 예산이 시사하는 것보다 저렴한 블랙박스 공격, 그리고 블랙박스를 사실상 화이트박스로 바꾸는 모델 탈취.

2026-05-17

제7장 — 환각과 신뢰성

환각의 두 메커니즘 — 사실성과 충실성 실패, 신경망의 구조적 과신, 그리고 캘리브레이션·RAG 접지·human-in-the-loop로 이루어지는 신뢰성 엔지니어링.

2026-05-16

제4장 — 프롬프트 인젝션과 탈옥

프롬프트 인젝션에 파라미터화된 쿼리 같은 구조적 해결책이 없는 이유. 직접·간접 인젝션, 탈옥 분류학, 그리고 네 층의 완화 아키텍처.

2026-05-13

LLM Primer VII — 시리즈 소개 및 목차

LLM Primer VII: AI 보안의 챕터별 워크스루 소개. 위협 모델부터 규제 경계까지, 시리즈의 마지막 권에서 엔지니어링 아크가 적대자와 만나는 지점을 다룹니다.

2026-05-09

제12장 — 분리 서빙과 쿠버네티스

프리필과 디코드를 별도 GPU 풀로 나누고, 파드가 인터커넥트의 올바른 쪽에 안착하도록 하는 쿠버네티스 프리미티브를 걷는 장.

2026-05-04

제9장 — 투기적 디코딩

자기회귀의 순차 병목에 수학적 허점이 있다는 것, 그리고 언제 그 허점이 이득이 되는지의 산수를 보여 주는 장.

2026-05-01

제8장 — 차세대 KV 캐시 관리

운영체제의 페이징 통찰을 추론 엔진으로 옮겨 오는 장 — KV 캐시를 예약된 바이트 슬래브에서 공유·축출·프리픽스 캐시가 가능한 자원으로 바꿉니다.

2026-04-30

제6장 — 프루닝과 지식 증류

가중치 개수를 직접 공격하는 장 — 먼저 중요하지 않은 가중치를 영으로 만들고, 그다음에는 큰 모델의 행동을 더 작은 모델로 옮깁니다.

2026-04-28

제5장 — 양자화의 정체를 풀다

70B 모델은 4비트 양자화에서도 살아남는데 1B 모델은 그렇지 못한 이유, 그리고 레시피를 고르는 법.

2026-04-27

제2장 — KV 캐시라는 과제

KV 캐시는 산술을 메모리와 맞바꿉니다 — 그리고 그 메모리는 배치, 시퀀스 길이, 레이어 수, 헤드 수, 헤드 차원에 동시에 비례합니다. 그래서 서빙 클러스터는 다른 어떤 자원보다 VRAM이 먼저 떨어집니다.

2026-04-24

LLM Primer V — 시리즈 소개 및 목차

LLM Primer V 워크스루 시리즈의 시작. AI 엔지니어링을 프롬프트 트릭이 아니라 하나의 학문 분야로 다루는 제5권을, 8개 장을 따라 하루에 한 편씩 살핍니다.

2026-04-13

제14장 — 벤치마킹, 테스트, 성능

LLM Primer IV 워크스루의 열다섯 번째이자 마지막 글입니다. 실제 서버 위의 MCP-Universe 벤치마크, 그것이 드러낸 두 가지 시스템적 실패 모드, 세션당 요청과 공유 세션 풀 사이의 10배 처리량 격차, 그리고 제5권으로의 다리를 살핍니다.

2026-04-12

제11장 — 공격 표면과 프로토콜 취약성

LLM Primer IV 워크스루의 열한 번째 글입니다. MCP에 적용된 고전적 공격 — Confused Deputy, Token Passthrough, 세션 하이재킹 — , 능력 에스컬레이션과 인증 없는 샘플링을 둘러싼 프로토콜 수준의 결함, 그리고 컨텍스트 오염을 위생 문제가 아니라 구조적 문제로 만드는 암묵적 신뢰 전파를 살핍니다.

2026-04-09

제9장 — 주의력 예산 관리

LLM Primer IV 워크스루의 아홉 번째 글입니다. 컨텍스트 부패, 가운데에서 잃어버린 절벽, 도구 로드아웃 부패, 그리고 모델의 빠진 지식이 실제로 어디에 속하는지에 대한 세 가지 아키텍처적 답 — MCP, RAG, 파인튜닝 — 을 살핍니다.

2026-04-07

제8장 — 아키텍처 배포 레이아웃

LLM Primer IV 워크스루의 여덟 번째 글입니다. MCP 생태계에서 떠오른 세 가지 배포 레이아웃 — 재사용 가능한 에이전트, 엄격한 순수성, 하이브리드 — 과 어느 것이 어느 프로젝트에 맞는지 결정하는 네 가지 묶이는 제약을 살핍니다.

2026-04-06

제5장 — 전송 프로토콜과 발견

LLM Primer IV 워크스루의 다섯 번째 글입니다. MCP가 지원하는 세 가지 전송, 서버 카드를 가진 .well-known 발견 층, 그리고 서버를 협력적 네트워크 시민으로 만들지 부채로 만들지 결정하는 따분한 운영적 관심사들 — CORS, 오리진 검증, 캐싱 — 을 살핍니다.

2026-04-03

제1장 — AI 통합 위기와 에이전트형 아키텍처의 부상

LLM Primer IV 워크스루의 첫 번째 글입니다. 시스템 프롬프트가 자라며 모놀리식 에이전트가 닳아 가는 과정, 그 밑에 숨은 N 곱하기 M 통합 문제, 그리고 MCP가 가능하게 하기 위해 만들어진 프롬프트 엔지니어링에서 컨텍스트 엔지니어링으로의 이행을 살핍니다.

2026-03-30

제11장 — 지속적 업데이트와 파이프라인 최적화

LLM Primer III 워크스루의 열한 번째이자 마지막 글입니다. 파이프라인은 끝나지 않습니다 — 문서가 바뀌고, 쿼리가 옮겨 가며, 모델이 교체됩니다 — 그리고 그것을 소유한 팀은 세 시간 척도를 한꺼번에 생각하는 법을 배웁니다.

2026-03-28

제5장 — 검색 파이프라인 설계

LLM Primer III 워크스루의 다섯 번째 글입니다. 단일 벡터 검색이 왜 파이프라인이 아닌지 — 하이브리드 검색, RRF, 크로스 인코더 리랭킹, 그리고 쿼리 측 재작성과 HyDE — 가 어떻게 성숙한 RAG 시스템이 수렴하는 프로덕션 아키텍처로 조립되는지를 함께 살펴봅니다.

2026-03-22

제12장 — LLM 시스템을 짓는다는 것, 그리고 이 다음

LLM Primer I 시리즈 마지막 글 — 제12장입니다. 모델 한 대를 넘어, 도구와 RAG와 평가와 가드레일을 한 자리에 엮어 한 시스템으로 짓는 길을 풀어내고, 본책 다음 권으로 이어지는 다리를 함께 놓습니다.

2026-03-01

제10장 — 멀티모달: 텍스트를 넘어선 입력

LLM Primer I 시리즈 제10장입니다. 같은 트랜스포머가 어떻게 이미지와 오디오까지 받아들이게 되었는지 — 비전 트랜스포머와 오디오 토큰화의 메커니즘을 풀어내고, "한 모델이 모든 입력을 다 본다"는 그림의 한계와 강점을 정직하게 짚어 봅니다.

2026-02-27

제7장 — 모델을 더 영리하게 쓰는 방식: 프롬프트 엔지니어링

LLM Primer I 시리즈 제7장입니다. 같은 모델을 두 배쯤 영리하게 만들어주는 프롬프트의 갈래들 — 시스템 프롬프트, 퓨샷 예시, 사고의 사슬, 역할 설정 — 그리고 그 갈래들이 왜 통하는지를, 다음 토큰 예측의 메커니즘과 이어 풀어 봅니다.

2026-02-24

제5장 — 그래도 작은 결함이 남아 있다

LLM Primer I 시리즈 제5장입니다. 잘 학습된 LLM도 여전히 갖고 있는 결함 — 환각, 시간 감각의 결손, 계산의 약점, 출력의 일관성 흔들림 — 의 정체를 들여다보고, 그것이 왜 "버그"가 아니라 같은 메커니즘에서 함께 나오는 "특성"인지를 풀어 봅니다.

2026-02-22

제3장 — 모델 안에서 텍스트는 어떻게 흐르는가

LLM Primer I 시리즈 제3장입니다. 토큰이 모델 내부에서 어떤 모습으로 변신해 가는지 — 임베딩, 어텐션, 트랜스포머 — 를, 수식의 함정에 빠지지 않으면서 정확함을 잃지 않을 정도로 풀어냅니다.

2026-02-20

제2장 — 확률, 토큰, 그리고 텍스트

LLM Primer I 시리즈 제2장입니다. 토큰이 단어와 어떻게 다른지, 모델이 매번 만들어내는 "다음 토큰 후보들의 확률 분포"가 정확히 무엇인지, 그리고 같은 모델이 따분한 글과 창의적인 글을 같이 쓸 수 있게 해주는 샘플링 노브 — temperature와 top-p — 의 정체를 풀어냅니다.

2026-02-19

LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스

『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.

2026-02-17

LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서

LLM Primer 시리즈 — Sho Shimoda의 생성형 AI 필드 가이드, 이제 완결. 기초부터 보안까지 7권 전권. 자매 볼륨 Physical AI도 포함. 7권 모두 Amazon에서 판매 중.

2026-02-15

LLM 가이드 (대규모 언어 모델): 생성형 AI의 기초 이해

이 가이드는 GPT, BERT, T5와 같은 대규모 언어 모델(LLM)의 개념과 원리를 쉽게 이해할 수 있도록 정리했습니다. 생성형 AI를支える 핵심 기술인 트랜스포머 구조, 어텐션 메커니즘, 학습 과정, 그리고 실제 응용 사례까지 폭넓게 다룹니다. 머신러닝과 자연어 처리에 관심 있는 독자라면, 이 글을 통해 LLM의 기반을 체계적으로 이해할 수 있습니다.

2024-09-01