LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第10章 — ポストトレーニングとアラインメントの数学
LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。
2026-03-12第9章 — スケールでの学習
LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。
2026-03-11第1章 — 言語モデルのための数学的直観
LLM Primer II シリーズの第1章です。数式と読み手とのあいだに立っている「壁」を、そっと脇に避けるところから始めます。記号、言語生成のための確率、そして不確かさを測るためのエントロピー。
2026-03-03第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト
LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。
2026-02-225.2 勾配降下法とバックプロパゲーション - LLMのトレーニング手法の解説
勾配降下法とバックプロパゲーションは、LLM(大規模言語モデル)のトレーニングにおける重要な手法です。損失関数の勾配を効率的に計算し、モデルのパラメータを最適化するプロセスを詳しく解説します。
2024-10-155.1 損失関数の重要性 - LLMにおけるモデル最適化のカギ
損失関数は、モデルの最適化において重要な役割を果たし、LLMの精度向上に寄与します。クロスエントロピー損失関数や過学習、学習不足の検出に役立つ損失関数の仕組みを解説します。
2024-10-143.1 確率論と統計 - LLMにおける言語生成と予測の基礎
確率論と統計は、LLMの言語生成や次の単語の予測において重要な役割を果たします。n-gramモデル、マルコフ連鎖、最大尤度推定(MLE)など、LLMの予測精度を向上させる数理的手法について解説します。
2024-10-09