LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 16 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第5章 — 入力検証と出力フィルタリング

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第5回。第4章の多層緩和フレームを運用規律へと落とし込む章 — サニタイズ段階、ガードレール、構造化出力、レッドチーミング、そして意味のある安全性メトリクスの話。

2026-05-14

第12章 — 分離型サービングとKubernetes

『LLM Primer VI』ウォークスルー第12回。プリフィルとデコードを別GPUプールに分割し、KVキャッシュをNVLink/InfiniBand上で運ぶ。ポッドを正しい側に留めるKubernetesのプリミティブ。

2026-05-04

第9章 — 投機的デコード

『LLM Primer VI』ウォークスルー第9回。自己回帰の逐次ボトルネックには数学的な抜け穴がある。安価な推測と少し広い検証パスで、ターゲットモデルが1トークン分の実時間で数トークンを生む。

2026-05-01

第8章 — 次世代のKVキャッシュ管理

『LLM Primer VI』ウォークスルー第8回。OSのページングをKVキャッシュに持ち込む章。PagedAttention、H2Oエビクション、InfiniGen、そしてプレフィックスキャッシュ経済圏。

2026-04-30

第7章 — 高度なバッチング戦略

『LLM Primer VI』ウォークスルー第7回。バッチングは最適化ではなく、帯域律速のデコードを成立させる唯一の動き。バッチは名詞ではなく動詞である。

2026-04-29

第2章 — KVキャッシュという課題

『LLM Primer VI』ウォークスルー第2回。重みより先にサービングクラスタのVRAMを食い尽くすデータ構造 — KVキャッシュ — の算式、アーキテクチャの変種、そしてナイーブな割当が同時実行数を壊す仕組み。

2026-04-24

第1章 — トークン生成のメカニズム

『LLM Primer VI』ウォークスルー第1回。LLMサービングの難問はほぼ全て一つの事実から派生する — トークンを生み出すループはメモリ帯域律速で、購入した高価な演算能力は99.7パーセント遊んでいる。

2026-04-23

第9章 — 注意の予算管理

LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。

2026-04-07

第9章 — RAG評価トライアド

LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。

2026-03-26

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第6章 — Transformer ブロック

LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。

2026-03-08

第5章 — 位置、順序、系列の構造

LLM Primer II シリーズの第5章をご紹介させていただきます。Attention が抱えていた「順序を見ない」という静かな不具合を、正弦波エンコーディング、相対位置、RoPE、そして Fourier の視点から控えめにたどってまいります。

2026-03-07

第4章 — Attention

LLM Primer II シリーズの第4章をご紹介させていただきます。Attention を直観から導出し、クエリ・キー・バリューの幾何、softmax の温度、マルチヘッド構造、そして Attention をカーネル法として読み直す視点まで、控えめに歩いてまいります。

2026-03-06

第2章 — LLM を文脈に置く

LLM Primer II シリーズの第2章です。前作『LLM Primer』の素朴な物語と、本書の数学とを橋渡しする章。LLM とはなにか、事前学習・パラメータ・スケール、データとしての言語、そしてトランスフォーマーが風景を塗り替えた理由。

2026-03-04

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM Primer シリーズ — Sho Shimoda による全7巻の生成AIフィールドガイド、ついに完結。基礎からセキュリティまで。姉妹編『Physical AI』も含む。全7巻がAmazonで販売中。

2026-02-15