Introduction to LLM

This page provides an easy-to-understand guide on LLMs (Large Language Models) from basics to applications for AI enthusiasts.

Total of 38 articles available. | Currently on page 1 of 1.

제13장 — 규제 지형

EU AI 법의 단계적 적용, AI 시스템에도 여전히 구속력을 갖는 GDPR·CCPA·PIPL, 그리고 감사 가능성·모델 카드·위험 분류가 만드는 운영 형태.

2026-05-22

제9장 — 모델 무결성과 공급망 위험

모델을 서드파티가 배포한 바이너리로 다루기. BadNets에서 Sleeper Agents까지, 피클 대 safetensors, 그리고 SLSA·Sigstore·드리프트 모니터링.

2026-05-18

제7장 — 환각과 신뢰성

환각의 두 메커니즘 — 사실성과 충실성 실패, 신경망의 구조적 과신, 그리고 캘리브레이션·RAG 접지·human-in-the-loop로 이루어지는 신뢰성 엔지니어링.

2026-05-16

제1장 — 왜 AI 보안은 다른가

LLM 보안이 코드 보안이 아닌 이유. 확률적 시스템의 행동 포락선이 공격 표면이 되며, 프롬프트·검색·도구·학습·모델·출력의 여섯 표면이 새로운 신뢰 경계를 규정합니다.

2026-05-10

LLM Primer VII — 시리즈 소개 및 목차

LLM Primer VII: AI 보안의 챕터별 워크스루 소개. 위협 모델부터 규제 경계까지, 시리즈의 마지막 권에서 엔지니어링 아크가 적대자와 만나는 지점을 다룹니다.

2026-05-09

제16장 — 프로덕션의 비용 절감 전략

지난달 청구서의 3분의 1이나 절반으로 복리로 쌓이는 서로 독립적인 수의 카탈로그.

2026-05-08

제9장 — 투기적 디코딩

자기회귀의 순차 병목에 수학적 허점이 있다는 것, 그리고 언제 그 허점이 이득이 되는지의 산수를 보여 주는 장.

2026-05-01

제5장 — 양자화의 정체를 풀다

70B 모델은 4비트 양자화에서도 살아남는데 1B 모델은 그렇지 못한 이유, 그리고 레시피를 고르는 법.

2026-04-27

제3장 — 생성 AI를 위한 데이터센터 GPU

서빙용 GPU는 스펙 시트 앞면의 FLOP/s 숫자가 아니라 HBM 대역폭과 VRAM 용량으로 사야 한다는 주장을 하는 장입니다.

2026-04-25

제1장 — 토큰 생성의 기제

LLM 서빙의 거의 모든 어려운 질문은 한 사실에서 내려옵니다 — 각 토큰을 만드는 루프는 메모리 대역폭에 묶여 있고, 비싼 연산 유닛은 99.7퍼센트의 시간을 놀립니다.

2026-04-23

LLM Primer VI — 시리즈 서문 및 목차

LLM Primer VI — AI 시스템 확장하기의 16개 챕터를 하루 한 편씩 걷는 워크스루의 서문입니다. 메모리 대역폭, 스케줄링, 그리고 청구서가 만나는 지점에서 LLM 추론을 엔지니어링 학문으로 다룹니다.

2026-04-22

제1장 — AI 엔지니어링이라는 학문

데모는 잘 돌아가는데 프로덕션 시스템이 무너지는 이유는 모델 문제가 아니라 엔지니어링 문제입니다. 제1장은 확률적 코어 주위를 감싸는 결정적 래퍼를 세우고, 신뢰성·품질·성능·비용·진화라는 다섯 기둥으로 그 학문을 그립니다.

2026-04-14

LLM Primer V — 시리즈 소개 및 목차

LLM Primer V 워크스루 시리즈의 시작. AI 엔지니어링을 프롬프트 트릭이 아니라 하나의 학문 분야로 다루는 제5권을, 8개 장을 따라 하루에 한 편씩 살핍니다.

2026-04-13

제6장 — 기초 오케스트레이션 전략

LLM Primer IV 워크스루의 여섯 번째 글입니다. 두 기초 오케스트레이션 모양 — 순차 파이프라인과 동시 산-수집 — 과 모든 팀이 먼저 물어야 할 선행 질문을 살핍니다. 다중 에이전트 시스템이 정말 알맞은 답인가?

2026-04-04

제1장 — AI 통합 위기와 에이전트형 아키텍처의 부상

LLM Primer IV 워크스루의 첫 번째 글입니다. 시스템 프롬프트가 자라며 모놀리식 에이전트가 닳아 가는 과정, 그 밑에 숨은 N 곱하기 M 통합 문제, 그리고 MCP가 가능하게 하기 위해 만들어진 프롬프트 엔지니어링에서 컨텍스트 엔지니어링으로의 이행을 살핍니다.

2026-03-30

LLM Primer IV — 시리즈 소개 및 인덱스

LLM Primer 시리즈 제4권의 챕터별 워크스루를 여는 글입니다. 에이전트가 데모를 넘어 확장되려면 왜 프로토콜 층이 필요한지, 누구를 위해 이 책을 썼는지, 그리고 3월 30일부터 4월 12일까지 이어질 열네 편의 포스트 일정을 정리합니다.

2026-03-29

제8장 — RAG 파이프라인의 데이터 비식별화

LLM Primer III 워크스루의 여덟 번째 글입니다. 모델이 데이터를 보기 전에 비식별화할 것인가, 사용자가 출력을 보기 전에 할 것인가. 답은 파이프라인의 모든 것을 바꾸고, 규제 체계가 보통 그 답을 골라 줍니다.

2026-03-25

제5장 — 검색 파이프라인 설계

LLM Primer III 워크스루의 다섯 번째 글입니다. 단일 벡터 검색이 왜 파이프라인이 아닌지 — 하이브리드 검색, RRF, 크로스 인코더 리랭킹, 그리고 쿼리 측 재작성과 HyDE — 가 어떻게 성숙한 RAG 시스템이 수렴하는 프로덕션 아키텍처로 조립되는지를 함께 살펴봅니다.

2026-03-22

제1장 — RAG 아키텍처의 진화

LLM Primer III 워크스루의 첫 번째 글입니다. RAG의 네 가지 아키텍처 자세 — 나이브, 어드밴스드, 모듈러, 에이전틱 — 를 한 결정씩 LLM에게 권한을 더 넘겨주는 이야기로 읽고, 검색보다 파인튜닝이 더 나은 도구가 되는 자리를 솔직하게 짚습니다.

2026-03-18

LLM Primer III — 시리즈 소개 및 인덱스

LLM Primer 시리즈 제3권의 챕터별 워크스루를 여는 글입니다. 검색 증강 생성이 밖에서는 단순해 보이지만 안에서는 여러 분야가 겹친 스택임을 짚고, 누구를 위해 이 책을 썼는지, 그리고 3월 18일부터 28일까지 이어질 열한 편의 포스트 일정을 정리합니다.

2026-03-17

제11장 — 평가, 보정, 추론

LLM Primer II 시리즈 제11장입니다. 무엇이든 말할 수 있는 기계를 도대체 어떻게 잰단 말인가 — 그리고 "확신에 찬 모델은 거의 늘 보정이 나쁜 모델이라는 사실"을 마주하게 되는 자리. 퍼플렉시티, 보정, 벤치마크의 오차 막대, 환각의 수학을 함께 풀어 봅니다.

2026-03-13

제12장 — LLM 시스템을 짓는다는 것, 그리고 이 다음

LLM Primer I 시리즈 마지막 글 — 제12장입니다. 모델 한 대를 넘어, 도구와 RAG와 평가와 가드레일을 한 자리에 엮어 한 시스템으로 짓는 길을 풀어내고, 본책 다음 권으로 이어지는 다리를 함께 놓습니다.

2026-03-01

제11장 — 모델을 더 작게, 더 영리하게

LLM Primer I 시리즈 제11장입니다. 큰 모델을 어떻게 작고 빠르게 만들어 운영의 결에 맞추는가 — 디스틸레이션, 양자화, MoE — 그리고 2026 에디션의 새 절 §11.6 "추론 모델"의 큰 그림을 함께 풀어 봅니다.

2026-02-28

제10장 — 멀티모달: 텍스트를 넘어선 입력

LLM Primer I 시리즈 제10장입니다. 같은 트랜스포머가 어떻게 이미지와 오디오까지 받아들이게 되었는지 — 비전 트랜스포머와 오디오 토큰화의 메커니즘을 풀어내고, "한 모델이 모든 입력을 다 본다"는 그림의 한계와 강점을 정직하게 짚어 봅니다.

2026-02-27

제9장 — RAG: 모델에 최신의 결을 흘려보내는 길

LLM Primer I 시리즈 제9장입니다. 검색 보강 생성(RAG)이 정확히 무엇이고, 모델의 시간 인지의 결손과 사실 정확성의 결을 어떻게 뒷받침해 주는지 — 그리고 좋은 RAG와 나쁜 RAG의 갈림은 어디서 시작되는지를 풀어 봅니다.

2026-02-26

제8장 — 모델 한 대로는 부족할 때: 도구 사용과 에이전트

LLM Primer I 시리즈 제8장입니다. 모델을 모델 바깥의 결로 확장하는 자리 — 도구 사용, 함수 호출, 에이전트 — 그리고 2026 에디션의 새 절 §8.6 "에이전트 패턴"의 큰 가닥을 함께 풀어 봅니다.

2026-02-25

제7장 — 모델을 더 영리하게 쓰는 방식: 프롬프트 엔지니어링

LLM Primer I 시리즈 제7장입니다. 같은 모델을 두 배쯤 영리하게 만들어주는 프롬프트의 갈래들 — 시스템 프롬프트, 퓨샷 예시, 사고의 사슬, 역할 설정 — 그리고 그 갈래들이 왜 통하는지를, 다음 토큰 예측의 메커니즘과 이어 풀어 봅니다.

2026-02-24

제6장 — 안전, 정렬, 그리고 모델이 "도움이 된다"는 것의 의미

LLM Primer I 시리즈 제6장입니다. "유창함"과 "도움이 됨"이 어떻게 다른지를 짚고, 정렬(alignment)이 정확히 무엇을 다듬는 일인지를 풀어 봅니다. 그리고 2026 에디션에서 새로 더한 §6.6 — 헌법형 AI, 디버틀 모델, 새로운 정렬 연구의 가닥 — 의 맛보기까지 함께.

2026-02-23

제5장 — 그래도 작은 결함이 남아 있다

LLM Primer I 시리즈 제5장입니다. 잘 학습된 LLM도 여전히 갖고 있는 결함 — 환각, 시간 감각의 결손, 계산의 약점, 출력의 일관성 흔들림 — 의 정체를 들여다보고, 그것이 왜 "버그"가 아니라 같은 메커니즘에서 함께 나오는 "특성"인지를 풀어 봅니다.

2026-02-22

제4장 — 모델은 어떻게 학습되는가

LLM Primer I 시리즈 제4장입니다. 사전학습이 학습 결과를 형성하는 큰 무대인 이유, 파인튜닝이 모델 인격을 조각해 가는 정밀 작업인 이유, 그리고 RLHF가 단순한 "다음 토큰 예측기"를 매일 우리가 신뢰하는 그 어시스턴트로 만들어주는 방식을 풀어 봅니다.

2026-02-21

제3장 — 모델 안에서 텍스트는 어떻게 흐르는가

LLM Primer I 시리즈 제3장입니다. 토큰이 모델 내부에서 어떤 모습으로 변신해 가는지 — 임베딩, 어텐션, 트랜스포머 — 를, 수식의 함정에 빠지지 않으면서 정확함을 잃지 않을 정도로 풀어냅니다.

2026-02-20

제2장 — 확률, 토큰, 그리고 텍스트

LLM Primer I 시리즈 제2장입니다. 토큰이 단어와 어떻게 다른지, 모델이 매번 만들어내는 "다음 토큰 후보들의 확률 분포"가 정확히 무엇인지, 그리고 같은 모델이 따분한 글과 창의적인 글을 같이 쓸 수 있게 해주는 샘플링 노브 — temperature와 top-p — 의 정체를 풀어냅니다.

2026-02-19

제1장 — 대규모 언어 모델이란 무엇인가 (헤드라인 너머)

LLM Primer I 시리즈 제1장입니다. "대규모", "언어", "모델"이 정말로 가리키는 것이 무엇인지 풀어내고, 룰 기반 시스템에서 뉴럴 네트워크로 옮겨온 과정을 짚고, 현대 LLM의 작동에 대한 세 가지 큰 오해를 다룹니다. 앞으로 이어질 모든 내용의 토대가 될, 명료하고 읽기 쉬운 입구입니다.

2026-02-18

LLM Primer I 챕터별 워크스루 — 시리즈 서문과 인덱스

『LLM Primer I: 생성 AI는 어떻게 작동하는가』를 챕터별로 소개하는 12회 시리즈의 서문과 인덱스입니다. 2026년 2월 18일부터 3월 1일까지 매일 한 편씩. 차례로 따라 읽어도, 관심 가는 챕터만 골라 읽어도 됩니다. 열두 편의 글을 여기서 한꺼번에 찾을 수 있습니다.

2026-02-17

LLM 입문서 시리즈 — 생성형 AI를 한 권씩 풀어내는 일곱 권의 안내서

LLM Primer 시리즈 — Sho Shimoda의 생성형 AI 필드 가이드, 이제 완결. 기초부터 보안까지 7권 전권. 자매 볼륨 Physical AI도 포함. 7권 모두 Amazon에서 판매 중.

2026-02-15

LLM 정의와 개요: 파라미터, 학습 방식, 그리고 확장성 이해

LLM(대규모 언어 모델)은 수억~수조 개의 파라미터로 학습된 신경망 기반 모델입니다. 본 섹션에서는 LLM의 정의와 개요, 파라미터의 역할, 사전 학습과 파인튜닝, 자기 지도 학습, 그리고 확장성에 대해 설명합니다.

2024-09-03

LLM 가이드: 생성형 AI의 기초와 대규모 언어 모델 이해

LLM(대규모 언어 모델)은 GPT, BERT, T5와 같은 최신 AI 기술의 핵심입니다. 본 가이드는 LLM의 정의, NLP에서의 역할, 기존 기계학습과의 차이를 체계적으로 설명합니다.

2024-09-02

LLM 가이드 (대규모 언어 모델): 생성형 AI의 기초 이해

이 가이드는 GPT, BERT, T5와 같은 대규모 언어 모델(LLM)의 개념과 원리를 쉽게 이해할 수 있도록 정리했습니다. 생성형 AI를支える 핵심 기술인 트랜스포머 구조, 어텐션 메커니즘, 학습 과정, 그리고 실제 응용 사례까지 폭넓게 다룹니다. 머신러닝과 자연어 처리에 관심 있는 독자라면, 이 글을 통해 LLM의 기반을 체계적으로 이해할 수 있습니다.

2024-09-01