LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
合計 5 件の記事があります。 |
現在 1 ページ中の 1 ページ目です。
第8章 — モデルはどう学ぶか
LLM Primer II シリーズの第8章を紹介します。古典的な統計学習理論が「過学習するはず」と告げる規模で、なぜ大規模モデルは汎化してしまうのか。勾配降下法の暗黙的バイアス、スケーリング則、そして「まだ分かっていないこと」を、控えめに整理します。
2026-03-10第7章 — 効率と Transformer の派生
LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。
2026-03-09LLM入門書シリーズ — 生成AIを理解するために、分解してみる
LLM入門書シリーズは、大規模言語モデルとどう向き合うかを、全7巻にわたって扱う入門書です。第1巻の基礎から、第6巻の本番運用、第7巻の安全性まで、巻ごとに別の角度から取り上げています。このページでは、シリーズ全体の構成と、すでに読める第1巻・第2巻について、章ごとの解説をまとめて紹介します。
2026-02-153.3 LLMのデータロードと前処理パイプライン構築|効率的なデータ処理の自動化
LLMトレーニングに必要なデータロードと前処理パイプラインの構築方法を解説。Pythonコード例を使用し、Pandas、Dask、Scikit-learnでの効率的なデータ処理を紹介します。
2024-11-12