Introduction to LLM

This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.

Total of 90 articles available. | Currently on page 1 of 2.

제17장 — 미래의 위협과 새롭게 등장하는 방어

자율 에이전트의 폭발 반경, 멀티모달 표면이 넓히는 인젝션 채널, 합성 신원과 AI 대 AI 동역학, 그리고 LLM Primer 시리즈의 마지막 마무리.

2026-05-26

제16장 — 안전한 파인튜닝과 적응

파인튜닝된 모델을 물려받는 것이 아니라 획득해야 할 아티팩트로 다루기. 정렬 침식, 소규모 데이터 오염, CI 평가 게이트, 그리고 롤백 규율.

2026-05-25

제15장 — 안전한 AI 조직 구축

기술 통제가 시간과의 접촉을 살아남게 하는 층 — 문화, 레드팀, 벤더 위험 평가, 지속 평가, 그리고 장기적 모델 스튜어드십.

2026-05-24

제14장 — 편향, 공정성, 책임 있는 AI

편향의 다섯 근원, 서로 불일치하는 공정성 지표, 안전-유용성 트레이드오프, 그리고 설명 가능성이 규제와 만나지 못하는 간극을 다루는 조직의 AI 정책.

2026-05-23

제13장 — 규제 지형

EU AI 법의 단계적 적용, AI 시스템에도 여전히 구속력을 갖는 GDPR·CCPA·PIPL, 그리고 감사 가능성·모델 카드·위험 분류가 만드는 운영 형태.

2026-05-22

제12장 — 접근 제어와 신원

OAuth·mTLS·RBAC·ABAC의 LLM 이식, 멀티테넌트 격리의 세 접근, 그리고 SAML·SCIM·감사 로그가 만드는 엔터프라이즈 거버넌스 오버레이.

2026-05-21

제11장 — 관측 가능성, 로깅, 사건 대응

확률적 시스템에서 로깅해야 할 것, 시그니처·통계·행동 신호를 조합한 탐지, 그리고 재현 가능성을 확보하는 NIST 800-61 형태의 사건 대응.

2026-05-20

제10장 — 안전한 LLM 아키텍처 설계

격리가 폭발 반경을 제한하는 방식, 계층화된 검증과 선언적 정책, 그리고 모델 호출에 적용된 제로 트러스트로 침해된 프롬프트가 시스템 침해로 상승하지 못하게 하는 아키텍처.

2026-05-19

제9장 — 모델 무결성과 공급망 위험

모델을 서드파티가 배포한 바이너리로 다루기. BadNets에서 Sleeper Agents까지, 피클 대 safetensors, 그리고 SLSA·Sigstore·드리프트 모니터링.

2026-05-18

제8장 — 모델에 대한 적대적 공격

FGSM에서 TextFooler·보편적 접미사까지의 계보, API 예산이 시사하는 것보다 저렴한 블랙박스 공격, 그리고 블랙박스를 사실상 화이트박스로 바꾸는 모델 탈취.

2026-05-17

제7장 — 환각과 신뢰성

환각의 두 메커니즘 — 사실성과 충실성 실패, 신경망의 구조적 과신, 그리고 캘리브레이션·RAG 접지·human-in-the-loop로 이루어지는 신뢰성 엔지니어링.

2026-05-16

제6장 — 검색 증강 생성의 위험

RAG 파이프라인의 다섯 신뢰 경계, 인덱스를 통한 인젝션 공격, PoisonedRAG와 BadRAG, 그리고 아키텍처적으로 안전한 검색 패턴.

2026-05-15

제5장 — 입력 검증과 출력 필터링

단계적 위생 처리, 방어로서의 구조화된 출력, Llama Guard와 NeMo Guardrails, 그리고 Garak·PyRIT로 안전을 측정하는 방법.

2026-05-14

제4장 — 프롬프트 인젝션과 탈옥

프롬프트 인젝션에 파라미터화된 쿼리 같은 구조적 해결책이 없는 이유. 직접·간접 인젝션, 탈옥 분류학, 그리고 네 층의 완화 아키텍처.

2026-05-13

제3장 — 데이터 보안과 프라이버시

LLM 시스템에서 데이터를 수명주기 자산으로 다루기. 학습 코퍼스의 저작권과 PII, 암기와 추출 공격, 그리고 Samsung과 Garante 사건이 규정한 사용자 입력 처리 규율.

2026-05-12

제2장 — LLM 시스템의 위협 모델링

Shostack의 네 질문, STRIDE와 PASTA, MITRE ATLAS를 LLM 시스템에 적용. 자산 목록·적대자 카탈로그·위협 등록부를 채우는 작업 템플릿을 걷습니다.

2026-05-11

제1장 — 왜 AI 보안은 다른가

LLM 보안이 코드 보안이 아닌 이유. 확률적 시스템의 행동 포락선이 공격 표면이 되며, 프롬프트·검색·도구·학습·모델·출력의 여섯 표면이 새로운 신뢰 경계를 규정합니다.

2026-05-10

LLM Primer VII — 시리즈 소개 및 목차

LLM Primer VII: AI 보안의 챕터별 워크스루 소개. 위협 모델부터 규제 경계까지, 시리즈의 마지막 권에서 엔지니어링 아크가 적대자와 만나는 지점을 다룹니다.

2026-05-09

제16장 — 프로덕션의 비용 절감 전략

지난달 청구서의 3분의 1이나 절반으로 복리로 쌓이는 서로 독립적인 수의 카탈로그.

2026-05-08

제15장 — 서버리스 API 대 전용 인프라

손익분기 산수를 테이블에 올리고, 대부분의 팀에게 답을 뒤집는 플랫폼 엔지니어링 라인 아이템에 이름을 붙이는 장.

2026-05-07

제14장 — 토큰 경제학과 API 가격

제1장의 물리를 청구서의 라인 아이템에 연결하고, 첫 달의 청구서가 왜 팀이 모델링한 것과 닮지 않는 경우가 많은지 설명하는 장.

2026-05-06

제13장 — 오토스케일링과 콜드 스타트 완화

기본 쿠버네티스 오토스케일러가 LLM 트래픽에서 왜 장애를 만드는지, 그리고 KEDA·Knative·CRIU가 어떻게 그 해법을 구성하는지 설명하는 장.

2026-05-05

제12장 — 분리 서빙과 쿠버네티스

프리필과 디코드를 별도 GPU 풀로 나누고, 파드가 인터커넥트의 올바른 쪽에 안착하도록 하는 쿠버네티스 프리미티브를 걷는 장.

2026-05-04

제11장 — 플랫폼과 오케스트레이션 계층

플랫폼 선택은 기능이 아니라 어느 운영 모델이 팀의 기존 운영 문화에 맞는가의 문제라고 주장하는 장.

2026-05-03

제10장 — LLM 엔진 계층

엔진과 플랫폼 사이의 경계에 이름을 붙이고, 2026년 그 계층을 지배하는 다섯 엔진을 걷는 장.

2026-05-02

제9장 — 투기적 디코딩

자기회귀의 순차 병목에 수학적 허점이 있다는 것, 그리고 언제 그 허점이 이득이 되는지의 산수를 보여 주는 장.

2026-05-01

제8장 — 차세대 KV 캐시 관리

운영체제의 페이징 통찰을 추론 엔진으로 옮겨 오는 장 — KV 캐시를 예약된 바이트 슬래브에서 공유·축출·프리픽스 캐시가 가능한 자원으로 바꿉니다.

2026-04-30

제7장 — 고급 배칭 전략

배칭은 최적화가 아니라 대역폭에 묶인 디코딩을 감당 가능하게 만드는 하중 지지 수이며, 배치는 명사가 아니라 동사입니다.

2026-04-29

제6장 — 프루닝과 지식 증류

가중치 개수를 직접 공격하는 장 — 먼저 중요하지 않은 가중치를 영으로 만들고, 그다음에는 큰 모델의 행동을 더 작은 모델로 옮깁니다.

2026-04-28

제5장 — 양자화의 정체를 풀다

70B 모델은 4비트 양자화에서도 살아남는데 1B 모델은 그렇지 못한 이유, 그리고 레시피를 고르는 법.

2026-04-27

제4장 — 특화 AI 실리콘과 ASIC

GPU와 ASIC의 선택은 워크로드 모양의 문제입니다 — 이 장은 그 모양을 줍니다.

2026-04-26

제3장 — 생성 AI를 위한 데이터센터 GPU

서빙용 GPU는 스펙 시트 앞면의 FLOP/s 숫자가 아니라 HBM 대역폭과 VRAM 용량으로 사야 한다는 주장을 하는 장입니다.

2026-04-25

제2장 — KV 캐시라는 과제

KV 캐시는 산술을 메모리와 맞바꿉니다 — 그리고 그 메모리는 배치, 시퀀스 길이, 레이어 수, 헤드 수, 헤드 차원에 동시에 비례합니다. 그래서 서빙 클러스터는 다른 어떤 자원보다 VRAM이 먼저 떨어집니다.

2026-04-24

제1장 — 토큰 생성의 기제

LLM 서빙의 거의 모든 어려운 질문은 한 사실에서 내려옵니다 — 각 토큰을 만드는 루프는 메모리 대역폭에 묶여 있고, 비싼 연산 유닛은 99.7퍼센트의 시간을 놀립니다.

2026-04-23

LLM Primer VI — 시리즈 서문 및 목차

LLM Primer VI — AI 시스템 확장하기의 16개 챕터를 하루 한 편씩 걷는 워크스루의 서문입니다. 메모리 대역폭, 스케줄링, 그리고 청구서가 만나는 지점에서 LLM 추론을 엔지니어링 학문으로 다룹니다.

2026-04-22

제8장 — 성능, 서빙, 비용 최적화

프로덕션 LLM 경제학을 층진 규율로 다루는 장. 가장 저렴한 호출은 결코 이루어지지 않는 호출이고, 아래 각 층은 다음 호출을 저렴하게 만들어 주는 층입니다.

2026-04-21

제7장 — LLM 보안과 가드레일

LLM 애플리케이션이 새로 들여오는 보안 축을 명명하고, 그 위에 네 층의 완화 매트릭스를 세우는 장. 원리는 하나 — 권한은 신뢰 출처와 일치해야 합니다.

2026-04-20

제6장 — AI 관측성과 트레이싱

사용자 질의를 요청 로그가 아니라 인과 트리로 다루고, 그 트리가 읽히기 위해 무엇이 트레이스되어야 하는지 보이는 장.

2026-04-19

제5장 — LLM 애플리케이션 평가하기

LLM 출력에는 assertEqual이 죽었음을 인정하고, 앵커된 판정자, RAG 트라이어드, 궤적 테스트를 중심으로 테스트 규율을 다시 세우는 장.

2026-04-18

제4장 — AI 에이전트와 도구 호출

언어 모델을 도구를 상대로 루프 도는 행위자로 바꾸는 엔지니어링을 다루는 장. 스키마, 메모리 층, 그리고 다중 에이전트 배선이 데모를 프로덕션 행위자로 만듭니다.

2026-04-17

제3장 — 검색 증강 생성

RAG 파이프라인을 끝에서 끝까지 걷고, 열 개의 즐겨찾기 문서에서만 잘 돌아가는 데모와 실제 코퍼스와 접촉하고도 살아남는 시스템 사이의 차이를 그리는 장.

2026-04-16

제2장 — 파운데이션 모델과 프롬프트 엔지니어링

프롬프트 엔지니어링을 예술이 아니라 엔지니어링으로 다루는 장. 모델 선택, 샘플링 파라미터, 방어적 프롬프트 해부학, 그리고 스키마를 강제하는 구조화 출력 — 네 개의 제어 표면.

2026-04-15

제1장 — AI 엔지니어링이라는 학문

데모는 잘 돌아가는데 프로덕션 시스템이 무너지는 이유는 모델 문제가 아니라 엔지니어링 문제입니다. 제1장은 확률적 코어 주위를 감싸는 결정적 래퍼를 세우고, 신뢰성·품질·성능·비용·진화라는 다섯 기둥으로 그 학문을 그립니다.

2026-04-14

LLM Primer V — 시리즈 소개 및 목차

LLM Primer V 워크스루 시리즈의 시작. AI 엔지니어링을 프롬프트 트릭이 아니라 하나의 학문 분야로 다루는 제5권을, 8개 장을 따라 하루에 한 편씩 살핍니다.

2026-04-13

제14장 — 벤치마킹, 테스트, 성능

LLM Primer IV 워크스루의 열다섯 번째이자 마지막 글입니다. 실제 서버 위의 MCP-Universe 벤치마크, 그것이 드러낸 두 가지 시스템적 실패 모드, 세션당 요청과 공유 세션 풀 사이의 10배 처리량 격차, 그리고 제5권으로의 다리를 살핍니다.

2026-04-12

제13장 — 프레임워크와 클라우드 통합

LLM Primer IV 워크스루의 열세 번째 글입니다. Bedrock과 함께한 Strands, AWS 상태 층 패턴, Microsoft Agent Framework, LangChain, Semantic Kernel — 그리고 팀이 독립적으로 거듭 도착하는 세 가지 프로덕션 통합 모양을 살핍니다.

2026-04-11

제12장 — 프로토콜 하드닝과 방어

LLM Primer IV 워크스루의 열두 번째 글입니다. 네 가지 방어 군집 — 암호화 증명, 유계 세션을 가진 OAuth 범위 규율, 런타임 샌드박싱, 사람-개입 게이트 — 이 적대적 조건에서 모델이 올바르게 행동하는 것에 의존하지 않는 자세로 조합되는 모습을 살핍니다.

2026-04-10

제11장 — 공격 표면과 프로토콜 취약성

LLM Primer IV 워크스루의 열한 번째 글입니다. MCP에 적용된 고전적 공격 — Confused Deputy, Token Passthrough, 세션 하이재킹 — , 능력 에스컬레이션과 인증 없는 샘플링을 둘러싼 프로토콜 수준의 결함, 그리고 컨텍스트 오염을 위생 문제가 아니라 구조적 문제로 만드는 암묵적 신뢰 전파를 살핍니다.

2026-04-09

제10장 — 장기 호라이즌 작업 메모리

LLM Primer IV 워크스루의 열 번째 글입니다. 윈도와 ReAct 스크래치패드를 통한 단기 메모리, 일화적 벡터와 의미적 저장소를 통한 장기 메모리, 그리고 에이전트가 시간과 일을 가로질러 생산적으로 유지되게 하는 압축 기법을 살핍니다.

2026-04-08

제9장 — 주의력 예산 관리

LLM Primer IV 워크스루의 아홉 번째 글입니다. 컨텍스트 부패, 가운데에서 잃어버린 절벽, 도구 로드아웃 부패, 그리고 모델의 빠진 지식이 실제로 어디에 속하는지에 대한 세 가지 아키텍처적 답 — MCP, RAG, 파인튜닝 — 을 살핍니다.

2026-04-07

1 페이지 중 2 페이지