LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 11 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第16章 — 安全なファインチューニングと適応

『LLM Primer VII』ウォークスルー第16回。ファインチューニング済みモデルを「セキュリティ性質を継承するのではなく獲得しなければならない成果物」として扱う章。アライメント侵食、ポイズニング、評価ゲート、ロールバック規律を追う。

2026-05-25

第15章 — 安全なAI組織の構築

『LLM Primer VII』ウォークスルー第15回。セキュリティ文化、レッドチーム、ベンダーリスク、継続評価、そして長期のモデル運用管理を、AIセキュリティの規律を年単位で支える組織インフラとして扱う章を紹介する。

2026-05-24

第13章 — 規制の状況

『LLM Primer VII: AIセキュリティ』第13章のウォークスルー。EU AI Act、GDPR、米国の連邦と州、シンガポール、日本、韓国 — 統一されていない規制の状況を歩き、監査可能性、モデルカード、リスク分類の枠組みを技術的統制に対応づける。

2026-05-22

第9章 — モデル整合性とサプライチェーンリスク

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第9回。モデル成果物を第三者配布のバイナリとして扱う章 — バイナリ配布が常に伴ってきたデシリアライゼーション、バックドア、出所の懸念を辿る。

2026-05-18

第13章 — 限界、リスク、未解決の課題

LLM Primer II 第13章の歩き読みです。数学を別の向きに使い、計算コストとエネルギーの天井、データから自然に染み込んでくるバイアス、そして数学だけでは答えの出ない倫理と社会の問いを、控えめに整理します。

2026-03-15

第11章 — 評価、キャリブレーション、推論

LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。

2026-03-13

第10章 — ポストトレーニングとアラインメントの数学

LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。

2026-03-12

第9章 — スケールでの学習

LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。

2026-03-11

第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ

LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。

2026-02-23

第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト

LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。

2026-02-22

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17