LLM Primer I 章ごとのウォークスルー

LLM Primer I: How Generative AI Works を章ごとに紹介する全12回シリーズ、その序文とインデックスです。

このシリーズを書いている理由

『LLM Primer I』を書いたとき、自分が読みたい本がどこにもなかった、というのが正直なところでした。大規模言語モデルが実際にどう動いているのかを、メカニズムから一段ずつ説明していて、かつ専門家ではない読者でも追える — けれどエンジニアが読んでも軽く流せない — そんな本が見当たらなかったのです。

LLM の入門書の多くは、ふたつのどちらかに寄っています。「AIの魔法」を漠然と語るだけで何の手がかりも残してくれないマーケティング寄りのもの。もしくは、最初の段落から行列代数が降ってくる研究論文寄りのもの。前者は読んでも視界がほとんど開けず、後者はただ威圧されるばかりで、肝心の「自分で考える力」は身につきにくいかと思います。

本書では、その間の道を歩こうとしました。技術的な精度は譲らず、それでいて読み通せる文章で、重要な概念をひとつずつ整理していく。2026年版ではさらに、本文の節々に「やさしい言葉で言うと」という短いコラムを差し込みました。数学の心得があってもなくても、最後まで読み切っていただけるように、という思いを込めています。

この12回シリーズは、その本を毎日少しずつ紹介していく試みです。各記事ではその章の中心となる考え方に触れ、なぜそういう構成にしたのかを書きました。シリーズ単体でも「現代のLLMをひと通り見渡すツアー」になるようにしたつもりですし、本書を手に取るかどうかの判断材料にもしていただけたら嬉しく思います。

読み方について: 各記事はそれぞれで完結しています。順に読んで全体を辿るのもよし、今気になっている章だけ拾うのもよし。どの記事からも、この目次へ戻れるようにしてあります。

こんな方へ

チャットボットに触れていて「裏で何が起きているんだろう」と思っている方。プロンプトのテクニック集ではなく、LLM そのものを腰を据えて理解したいエンジニアの方。自分が作ったわけではない AI ツールについて、判断を下す立場にいるマネージャーや経営層の方。本格的な技術分野への入口を探している学生さん。どのお立場の方でも、入っていけるように書きました。

必要のないもの: 数学の素養、プログラミング経験、機械学習の予備知識。本書は二層構造になっており、本文は技術的にきちんと書いていますが、その隣を走る「やさしい言葉で言うと」コラムが伴走してくれます。このシリーズはどちらかというと、そのやさしい側に寄せた紹介になっています。

12章の構成

第I部 — 概念と基礎

第1章 — 大規模言語モデルとは何か — 「大規模」「言語」「モデル」のそれぞれが本当に指しているもの。歴史を辿りつつ、判断を狂わせる代表的な誤解にも触れます。

第2章 — 確率、トークン、テキスト — テキストがトークンに変わる過程、言語モデリングを確率の問題として捉える視点、そして次トークン予測ひとつから「すべて」が立ち上がってくる理由。

第3章 — 言語のためのニューラルネットワーク — Feedforward が言語に向かなかった理由、RNN がぶつかった壁、そして Attention が決定的に変えたもの。

第II部 — LLM の動作原理

第4章 — Transformer アーキテクチャ — 現代AIのエンジンの中身。Self-Attention、位置エンコーディング、Encoder / Decoder、そしてスケーリング則。

第5章 — 大規模モデルの学習 — データの出どころ、損失関数の役割、分散学習の組み方、そしてフロンティアモデルの学習が数か月と数億ドルを必要とする理由。

第6章 — ファインチューニングと適応 — プロンプトの工夫から Instruction Tuning、LoRA。そして RLHF と、その現代的な後継である一連のアラインメント手法 — 生のモデルが「使えるアシスタント」になる工程。

第7章 — 次トークン予測の先へ — Embedding、セマンティック検索、RAG、そしてマルチモーダル入力への広がり。

第III部 — 実践

第8章 — アプリケーションで LLM を使う — チャットボット、要約、コード生成、知識抽出、評価。そして、モデル自身がツール利用ループを駆動する「エージェント型」の流れ。

第9章 — パフォーマンス、スケール、コスト — モデルサイズと能力、レイテンシとスループットのトレードオフ、量子化、エッジ展開、そして「フロンティアモデルが手の届く価格でも、しばしば誤った選択になる」理由。

第10章 — 安全性、倫理、信頼 — ハルシネーションが構造的に発生する理由、バイアスが宿る本当の場所、多層ガードレールが機能する仕組み、そして技術では置き換えられない「ガバナンス」というレイヤー。

第IV部 — 先端トピック

第11章 — 最先端の研究 — Mixture-of-Experts、検索とメモリの仕組み、ネイティブマルチモーダル、継続学習、そして今日の推論モデルを生んだ Inference-Time Scaling。2026年版でもっとも紙面を割いた追加です。

第12章 — 自分の LLM システムを構築する — 最終章。データセットとライセンス、学習パイプライン、評価フレームワーク、統合スタック、そしてうまくいく本番デプロイメントに共通するパターン。

2026年版での主な変更点: 全体を大幅に手を入れました。新しいセクションとして、アラインメントと選好最適化 (6.6 節)、エージェントとツール利用 (8.6 節)、Inference-Time Scaling と推論モデル (11.6 節) を追加。第11章の Mixture-of-Experts は「研究段階」から「本番技術」へと書き直しています。コンテキストウィンドウの例も、現行のフロンティアモデルに合わせて差し替えました。さらに本文の各所には「やさしい言葉で言うと」コラムを設け、専門外の読者の方でも内容を追っていただけるようにしてあります。

本書とシリーズについて

本書は LLM Primer I: How Generative AI Works — A Clear and Practical Guide to the Foundations of Large Language Models、株式会社レシートローラーでCTOを務める下田昌平が書いています。

LLM Primer シリーズの第1巻にあたります。続巻はそれぞれ別のテーマを掘り下げていきます — Retrieval-Augmented Generation、MCP によるコンテキスト設計、実世界の LLM アプリケーション、AI システムのスケール、AI セキュリティ。各巻は独立して読めますが、合わせて読めば、LLM を扱うエンジニアリングの全体像が少しずつ見えてくるかと思います。

もし『LLM Primer I』を読んで「あるテーマをもっと深く知りたい」と感じていただけたなら、続巻が次の一歩になるかもしれません。

準備が整いましたら、本書も覗いてみてください。 全12章、2026年に向けて全面改訂しました。図解、「やさしい言葉で言うと」コラム、コード例で、生成AIの中身を腰を据えて一緒に辿る構成にしています。『LLM Primer I』はAmazonで