LLM入門書シリーズ
大規模言語モデルを、一巻ずつ、少しでも手の届くところへ。全7巻で、扱い方の別の側面をひとつずつ取り上げています。
このシリーズが目指していること
LLM入門書シリーズは、大規模言語モデルを「仕組みから理解する」ための読みものです。日々コードを書いている技術者の方、開発寄りの製品担当の方、専門家ではないけれど興味を持って読み進めたい方 — 技術にきちんと向き合おうとする読者を想定して書きました。各巻はそれぞれ別の側面を扱っていますが、技術的な厳密さを保ちつつ、現場で使える粒度にまで噛み砕くことを心がけています。
読み方は人それぞれです。第1巻だけで一通りの基礎を押さえる読み方もできますし、シリーズを順に追って — 基礎、数学、外部知識との連携、文脈の組み立て、運用、規模の拡大、安全性 — 大規模言語モデルをきちんと扱うための土台を、一通り組み立てていくこともできます。
全巻、株式会社レシートローラーでCTOを務める下田昌平が書いています。日々のAIシステムの設計・運用のなかで得た経験を、できるだけ専門外の方にも届く言葉に置き直しながら、書いてきたものです。
こんな方へ: 長く使える理解を手に入れたい技術者・設計担当の方。AIに関わる意思決定の場にいるプロダクト担当や経営層の方。ニュースの裏側で何が起きているかを掴みたい学生さんや、好奇心の強い実務者の方。数学的な前提知識がなくても読めるように整えていますが、すでに数学に経験のある方にも、読みものとして付き合っていただける構成にしてあります。
このページの読み方
下に各巻の目次を、部ごとに整理して掲載しています。シリーズ全体について、すべての章を一本ずつ読み解いていく解説記事を、少しずつ書いていく予定です。解説記事がすでに公開されている章にはリンクを、未公開の章はリンクのない地のままの文字で並べてあります。
付録もリストには載せていますが、これらは 書籍にだけ収録している内容 — 参考資料、早見表、解答付きの演習、その他「本の巻末」に置くべきもの — です。解説記事の対象にはしていません。付録まで手元に置きたい方は、書籍を覗いてみてください。
全7巻の構成
第1巻 — 生成AIの仕組み
大規模言語モデルの基礎を、できるだけやさしく、実用に近いところまで。
シリーズ全体の土台となる入口の1冊。ゼロから — トークン、学習、そして「次の単語を予測する」という一見素朴な行為から始めて — 大規模言語モデルとは何か、どのように訓練されるか、なぜそのように振る舞うのか、を予備知識なしで追えるかたちで描きます。専門用語は剥がし、誠実な見取り図を組み立てる。これ以降のすべての巻が、その上に積み上がっていきます。
Amazon: LLM Primer I — How Generative AI Works
|
|
シリーズ序文: LLM Primer I 章ごとの解説 — シリーズ序文と一覧
付録 (書籍のみ)
| 付録 A | LLM 用語集 |
| 付録 B | Attention の背後の数学 |
| 付録 C | プロンプティング・チートシート |
| 付録 D | ツール & ライブラリ |
| 付録 E | おすすめの読み物 |
第2巻 — 数学で読み解く言語モデル
数学的な洞察で AI の内部を覗く。
AI の内部 — Attention、最適化のダイナミクス、損失の地形、スケーリングの振る舞い — を、それらを「動かしている数学」のかたちで追いかける、数学的に厳密で、それでもなお読み物として読める一冊。重要な式はひとつひとつ完全に導出し、ひとつずつ物語と類例と具体的な数値計算で包み直しています。第1巻が脇のコラムに留めた数学を、本筋として読みたい方へ。
Amazon: LLM Primer II — Language Models Through Mathematics
|
|
シリーズ序文: LLM Primer II 章ごとの解説 — シリーズ序文と一覧
付録 (書籍のみ)
| LLM 数学チートシート |
| LLM の統計学的視点 |
| よくある質問 |
| 導出ワークブック |
| 演習問題と解答 |
| 記号インデックス |
| フォワードパスを数値で追う |
| アイデアのタイムライン |
第3巻 — RAG で強化するエンタープライズAI
エンタープライズ向けの Retrieval-Augmented Generation を作る、実務的な手引き。
現場で扱う RAG — ベクトルデータベース、チャンキング戦略、そして「自社のドキュメントにモデルを接地させる」アーキテクチャ。最新性と出典を伴うエンタープライズな回答を組み立てるために要るものを、一通り並べていく一冊。「最新性」と「出典」を満たさないと話が始まらない、そういう仕事に AI を載せる立場の方へ。
|
|
第I部 — RAG の基礎
第II部 — データ取り込み、解析、チャンキング
| 第2章 | 賢いドキュメント解析 |
| 第3章 | 高度なチャンキングのフレームワーク |
第III部 — ベクトルDBと検索最適化
| 第4章 | 適切なベクトルDBを選ぶ |
| 第5章 | 検索パイプラインの設計 |
第IV部 — セキュリティ、プライバシー、アクセス制御
| 第6章 | RAG の脅威モデルと脆弱性 |
| 第7章 | アクセス制御の実装 |
| 第8章 | RAG パイプラインでのデータ匿名化 |
第V部 — 評価、監視、運用
| 第9章 | RAG 評価の3本柱 |
| 第10章 | 主要な評価フレームワーク |
| 第11章 | 継続的な更新とパイプライン最適化 |
付録 (書籍のみ)
| 付録 A | RAG 最適化のための数式集 |
| 付録 B | データ匿名化と評価のためのサンプルシステムプロンプト |
| 付録 C | ベクトルDBとツールの意思決定マトリクス |
| 付録 D | RAG 評価のベンチマークデータセット |
第4巻 — MCP で設計する AI の認知
信頼できる AI エージェントのために、コンテキスト、ツール、メモリを工学する。
構造化されたコンテキストモデリングと、オーケストレーション。モデルの内部ではなく、モデルに「見せる文脈と状況」を作り込むことで推論を整える、という思想です。エージェント型システムを作る立場の方へ — ツールの目録、長時間走るループ、セッションを跨ぐメモリ、そして「モデルに何を見せるか」を設計する規律まで。
|
|
第I部 — AI 統合のパラダイムシフト
| 第1章 | AI 統合の危機とエージェント型アーキテクチャ |
| 第2章 | Model Context Protocol (MCP) の全体像 |
第II部 — MCP の中核機構
| 第3章 | サーバープリミティブ — コンテキストと能力の提示 |
| 第4章 | クライアントプリミティブ — エージェント挙動と制御 |
| 第5章 | トランスポートプロトコルとディスカバリ |
第III部 — マルチエージェントのオーケストレーションパターン
| 第6章 | オーケストレーションの基本戦略 |
| 第7章 | 高度な協調と動的なパターン |
| 第8章 | アーキテクチャ上の配置レイアウト |
第IV部 — AI 認知の設計 — コンテキストとメモリ
| 第9章 | Attention 予算の管理 |
| 第10章 | 長時間タスクのメモリ |
第V部 — エージェント型ワークフローのセキュリティ
| 第11章 | 攻撃面とプロトコルの脆弱性 |
| 第12章 | プロトコルの堅牢化と防御 |
第VI部 — 本番運用とスケール
| 第13章 | フレームワークとクラウド統合 |
| 第14章 | ベンチマーキング、テスト、パフォーマンス |
付録 (書籍のみ)
| 付録 A | MCP クイックリファレンスとチートシート |
| 付録 B | 実装ブループリントとコード例 |
| 付録 C | 本番運用とセキュリティのチェックリスト |
| 付録 D | 高度な仕様と SEPs |
| 付録 E | ベンチマークとパフォーマンスデータ |
| 付録 F | 公式リソースとエコシステムリンク |
第5巻 — 実世界の LLM アプリケーションを作る
本番運用の LLM システムを設計し、評価し、運用する。
プロトタイプから本番まで — API 設計、評価ループ、監視、統合 — を、システム指向の視点で順に辿る一冊。モデルを、ユーザーが日々使うサービスへと整えていく工程。アーキテクチャの理解を、実際の現場へと橋渡しする段階の方に。
|
|
第I部 — AI エンジニアリングの基礎
| 第1章 | AI エンジニアリングという規律 |
| 第2章 | ファウンデーションモデルとプロンプトエンジニアリング |
第II部 — エージェントと検索の能力を組み込む
| 第3章 | Retrieval-Augmented Generation (RAG) |
| 第4章 | AI エージェントとツール呼び出し |
第III部 — 品質保証と可観測性
| 第5章 | LLM アプリケーションの評価 |
| 第6章 | AI の可観測性とトレーシング |
第IV部 — セキュリティ、スケール、最適化
| 第7章 | LLM のセキュリティとガードレール |
| 第8章 | パフォーマンス、サービング、コストの最適化 |
付録 (書籍のみ)
| 付録 A | 本番運用とセキュリティのチェックリスト |
| 付録 B | ツールとフレームワーク選定マトリクス |
| 付録 C | プロトコル、ストリーミング、構造化出力 |
| 付録 D | レートリミットとコスト管理のアーキテクチャ |
| 付録 E | AI エンジニアリングのメトリクスと用語集 |
第6巻 — AI システムをスケールさせる
本番で動かす、低レイテンシな LLM 推論を組み立てる。
分散サービング、レイテンシ最適化、コストモデリング — 1日に何百万回も応答する規模のシステムのための、推論アーキテクチャ。AI システムが1台のサーバーを超えて、「インフラ」として扱う必要が出てきた段階の方へ。
|
|
第I部 — LLM 推論の基礎
| 第1章 | トークン生成のメカニクス |
| 第2章 | Key-Value (KV) キャッシュの課題 |
第II部 — ハードウェア基盤
| 第3章 | 生成 AI のためのデータセンター GPU |
| 第4章 | 専用 AI シリコンと ASIC |
第III部 — モデルレベルの最適化 (圧縮)
第IV部 — システムおよびエンジンレベルの最適化
| 第7章 | 先進的なバッチング戦略 |
| 第8章 | 次世代の KV キャッシュ管理 |
| 第9章 | 投機的デコーディング |
第V部 — サービングフレームワークとオーケストレーション
| 第10章 | LLM エンジン層 |
| 第11章 | プラットフォームとオーケストレーション層 |
| 第12章 | 分散サービングと Kubernetes |
| 第13章 | オートスケールとコールドスタートの緩和 |
第VI部 — アプリケーションレベルの経済学と TCO
| 第14章 | トークンエコノミクスと API 価格設定 |
| 第15章 | サーバーレス API 対 専用インフラ |
| 第16章 | 本番でのコスト削減戦略 |
付録 (書籍のみ)
| 付録 A | 数式とコストモデリングのリファレンス |
| 付録 B | ハードウェアとアクセラレータの仕様ガイド |
| 付録 C | デプロイメント構成とコードスニペット |
| 付録 D | ベンチマーク手法とメトリクス定義 |
第7巻 — AI セキュリティ
プロンプトインジェクション、ジェイルブレイク、敵対的脅威から LLM システムを守る。
安全で堅牢な AI を設計する。敵対的なリスク、プロンプトインジェクション、ガバナンスのフレームワーク、そして実世界に展開されたシステムのための防御的な設計。AI システムを「セキュリティに関わるインフラ」として扱う必要が出てきた方に。
|
|
第I部 — AI セキュリティの基礎
| 第1章 | AI セキュリティはなぜ違うのか |
| 第2章 | LLM システムの脅威モデリング |
| 第3章 | データセキュリティとプライバシー |
第II部 — プロンプトと対話のセキュリティ
| 第4章 | プロンプトインジェクションとジェイルブレイク |
| 第5章 | 入力検証と出力フィルタリング |
| 第6章 | RAG におけるリスク |
第III部 — モデルの頑健性と信頼性
| 第7章 | ハルシネーションと信頼性 |
| 第8章 | モデルへの敵対的攻撃 |
| 第9章 | モデルの完全性とサプライチェーンのリスク |
第IV部 — システムレベルのセキュリティアーキテクチャ
| 第10章 | 安全な LLM アーキテクチャの設計 |
| 第11章 | 可観測性、ロギング、インシデント対応 |
| 第12章 | アクセス制御とアイデンティティ |
第V部 — ガバナンス、倫理、コンプライアンス
| 第13章 | 規制のランドスケープ |
| 第14章 | バイアス、公平性、責任ある AI |
| 第15章 | 安全な AI 組織を作る |
第VI部 — 発展的トピック
| 第16章 | 安全なファインチューニングと適応 |
| 第17章 | 将来の脅威と新興の防御 |
付録 (書籍のみ)
| 付録 A | 本番システム向け AI セキュリティチェックリスト |
| 付録 B | サンプル脅威モデルテンプレート |
| 付録 C | 安全なプロンプト設計パターン |
| 付録 D | LLM アプリケーションのインシデント対応テンプレート |
| 付録 E | 推奨ツールとフレームワーク |
このページは少しずつ育てていきます
シリーズの各巻が公開されるたびに、また各章の解説記事が公開されるたびに、このページを少しずつ更新していきます。第3巻〜第7巻はそれぞれの目次を上に掲載していますが、章ごとの解説記事は、書き上がり次第、順に追加していく予定です。
追いかけてくださる方は、ブックマークを。あるいは、チャネルのフィードをご購読いただければ、新しい記事が出た日にお手元に届きます。