Introduction to LLM

This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.

Total of 20 articles available. | Currently on page 1 of 1.

제13장 — 규제 지형

EU AI 법의 단계적 적용, AI 시스템에도 여전히 구속력을 갖는 GDPR·CCPA·PIPL, 그리고 감사 가능성·모델 카드·위험 분류가 만드는 운영 형태.

2026-05-22

제3장 — 데이터 보안과 프라이버시

LLM 시스템에서 데이터를 수명주기 자산으로 다루기. 학습 코퍼스의 저작권과 PII, 암기와 추출 공격, 그리고 Samsung과 Garante 사건이 규정한 사용자 입력 처리 규율.

2026-05-12

제2장 — LLM 시스템의 위협 모델링

Shostack의 네 질문, STRIDE와 PASTA, MITRE ATLAS를 LLM 시스템에 적용. 자산 목록·적대자 카탈로그·위협 등록부를 채우는 작업 템플릿을 걷습니다.

2026-05-11

LLM Primer VII — 시리즈 소개 및 목차

LLM Primer VII: AI 보안의 챕터별 워크스루 소개. 위협 모델부터 규제 경계까지, 시리즈의 마지막 권에서 엔지니어링 아크가 적대자와 만나는 지점을 다룹니다.

2026-05-09

제3장 — 생성 AI를 위한 데이터센터 GPU

서빙용 GPU는 스펙 시트 앞면의 FLOP/s 숫자가 아니라 HBM 대역폭과 VRAM 용량으로 사야 한다는 주장을 하는 장입니다.

2026-04-25

제2장 — KV 캐시라는 과제

KV 캐시는 산술을 메모리와 맞바꿉니다 — 그리고 그 메모리는 배치, 시퀀스 길이, 레이어 수, 헤드 수, 헤드 차원에 동시에 비례합니다. 그래서 서빙 클러스터는 다른 어떤 자원보다 VRAM이 먼저 떨어집니다.

2026-04-24

LLM Primer VI — 시리즈 서문 및 목차

LLM Primer VI — AI 시스템 확장하기의 16개 챕터를 하루 한 편씩 걷는 워크스루의 서문입니다. 메모리 대역폭, 스케줄링, 그리고 청구서가 만나는 지점에서 LLM 추론을 엔지니어링 학문으로 다룹니다.

2026-04-22

제3장 — 검색 증강 생성

RAG 파이프라인을 끝에서 끝까지 걷고, 열 개의 즐겨찾기 문서에서만 잘 돌아가는 데모와 실제 코퍼스와 접촉하고도 살아남는 시스템 사이의 차이를 그리는 장.

2026-04-16

제2장 — 파운데이션 모델과 프롬프트 엔지니어링

프롬프트 엔지니어링을 예술이 아니라 엔지니어링으로 다루는 장. 모델 선택, 샘플링 파라미터, 방어적 프롬프트 해부학, 그리고 스키마를 강제하는 구조화 출력 — 네 개의 제어 표면.

2026-04-15

LLM Primer V — 시리즈 소개 및 목차

LLM Primer V 워크스루 시리즈의 시작. AI 엔지니어링을 프롬프트 트릭이 아니라 하나의 학문 분야로 다루는 제5권을, 8개 장을 따라 하루에 한 편씩 살핍니다.

2026-04-13

제3장 — 서버 프리미티브: 컨텍스트와 능력의 노출

LLM Primer IV 워크스루의 세 번째 글입니다. MCP 서버가 내놓을 수 있는 세 개의 명사 — Resources(읽기 상태), Prompts(재사용 가능한 스캐폴드), Tools(쓰기 행동) — 와 그 스키마, 라이프사이클, 오류 모델, 그리고 알맞은 프리미티브를 고르는 규율을 살핍니다.

2026-04-01

제2장 — Model Context Protocol(MCP)의 베일 벗기

LLM Primer IV 워크스루의 두 번째 글입니다. MCP가 실제로 무엇을 표준화하는지, Host·Client·Server의 세 역할 분할, 중요한 경우에 동적 발견과 양방향 메시징이 REST와 어떻게 다른지, 그리고 능력 협상으로 열리는 세션 라이프사이클을 봅니다.

2026-03-31

LLM Primer IV — 시리즈 소개 및 인덱스

LLM Primer 시리즈 제4권의 챕터별 워크스루를 여는 글입니다. 에이전트가 데모를 넘어 확장되려면 왜 프로토콜 층이 필요한지, 누구를 위해 이 책을 썼는지, 그리고 3월 30일부터 4월 12일까지 이어질 열네 편의 포스트 일정을 정리합니다.

2026-03-29

제3장 — 고급 청킹 프레임워크

LLM Primer III 워크스루의 세 번째 글입니다. 고정 크기에서 구조 인지까지 이어지는 청킹 스펙트럼, 오버랩 미신, 검색을 조용히 무너뜨리는 컨텍스트 클리프, 그리고 최전선의 셈을 다시 짠 컨텍스추얼 리트리벌과 레이트 청킹을 함께 살펴봅니다.

2026-03-20

LLM Primer III 워크스루의 두 번째 글입니다. PDF가 텍스트 파일이 아닌 이유, 레이아웃 인지 파서가 실제로 보존하는 것, 현재 도구 지형(LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), 그리고 페이지 이미지 위에서 직접 검색하는 멀티모달 트랙을 함께 살펴봅니다.

2026-03-19

LLM Primer III — 시리즈 소개 및 인덱스

LLM Primer 시리즈 제3권의 챕터별 워크스루를 여는 글입니다. 검색 증강 생성이 밖에서는 단순해 보이지만 안에서는 여러 분야가 겹친 스택임을 짚고, 누구를 위해 이 책을 썼는지, 그리고 3월 18일부터 28일까지 이어질 열한 편의 포스트 일정을 정리합니다.

2026-03-17

제3장 — 모델 안에서 텍스트는 어떻게 흐르는가

LLM Primer I 시리즈 제3장입니다. 토큰이 모델 내부에서 어떤 모습으로 변신해 가는지 — 임베딩, 어텐션, 트랜스포머 — 를, 수식의 함정에 빠지지 않으면서 정확함을 잃지 않을 정도로 풀어냅니다.

2026-02-20

제2장 — 확률, 토큰, 그리고 텍스트

LLM Primer I 시리즈 제2장입니다. 토큰이 단어와 어떻게 다른지, 모델이 매번 만들어내는 "다음 토큰 후보들의 확률 분포"가 정확히 무엇인지, 그리고 같은 모델이 따분한 글과 창의적인 글을 같이 쓸 수 있게 해주는 샘플링 노브 — temperature와 top-p — 의 정체를 풀어냅니다.

2026-02-19

LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스

『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.

2026-02-17

LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서

LLM Primer 시리즈 — Sho Shimoda의 생성형 AI 필드 가이드, 이제 완결. 기초부터 보안까지 7권 전권. 자매 볼륨 Physical AI도 포함. 7권 모두 Amazon에서 판매 중.

2026-02-15