LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 17 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第15章 — 安全なAI組織の構築

『LLM Primer VII』ウォークスルー第15回。セキュリティ文化、レッドチーム、ベンダーリスク、継続評価、そして長期のモデル運用管理を、AIセキュリティの規律を年単位で支える組織インフラとして扱う章を紹介する。

2026-05-24

第11章 — 可観測性、ロギング、インシデントレスポンス

『LLM Primer VII: AIセキュリティ』第11章のウォークスルー。何をログすべきか、シグネチャ・統計・振る舞いを組み合わせた検知、NIST SP 800-61型のインシデントレスポンスをLLMシステムでどう回すか。OpenTelemetry GenAI規約が土台。

2026-05-20

第7章 — ハルシネーションと信頼性

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第7回。信頼性をセキュリティ的性質として扱う章 — 正しさが結果を左右する場面では、自信満々に間違った出力そのものがセキュリティ問題だからだ。

2026-05-16

第1章 — AIセキュリティがこれまでと違う理由

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルー、第1回。AIセキュリティは既存セキュリティにML形容詞を付けたものではない — 基盤が変わり、以後のすべての章がその変化から派生する、という章です。

2026-05-10

第9章 — 投機的デコード

『LLM Primer VI』ウォークスルー第9回。自己回帰の逐次ボトルネックには数学的な抜け穴がある。安価な推測と少し広い検証パスで、ターゲットモデルが1トークン分の実時間で数トークンを生む。

2026-05-01

第8章 — 次世代のKVキャッシュ管理

『LLM Primer VI』ウォークスルー第8回。OSのページングをKVキャッシュに持ち込む章。PagedAttention、H2Oエビクション、InfiniGen、そしてプレフィックスキャッシュ経済圏。

2026-04-30

第2章 — 基盤モデルとプロンプト設計

『LLM Primer V』ウォークスルー第2回。プロンプトエンジニアリングを芸ではなく工学として扱う回。モデル階層、サンプリングパラメータの2つのプロファイル、防御的プロンプトの5部構成、そして構造化出力・制約付きデコーディング。

2026-04-15

第1章 — AIエンジニアリングという規律

『LLM Primer V』ウォークスルー第1回。デモと本番の信頼性ギャップを名指しし、確率的な核を決定論的なラッパーで包む工学 — AIエンジニアリング — の枠組みと、信頼性・品質・パフォーマンス・コスト・進化の5つの柱を歩く。

2026-04-14

シリーズ序文と目次 — LLM Primer V

『LLM Primer V: 実運用のLLMアプリケーションを設計する』のウォークスルー序文。AIエンジニアリングを一つの規律として扱い、基盤モデル・プロンプト・検索・エージェント・評価・オブザーバビリティ・セキュリティ・サービングの8つの面を歩く8章構成の全体像を示す。

2026-04-13

第10章 — 主要な評価フレームワーク

LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。

2026-03-27

第9章 — RAG評価トライアド

LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。

2026-03-26

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第10章 — ポストトレーニングとアラインメントの数学

LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。

2026-03-12

第4章 — Attention

LLM Primer II シリーズの第4章をご紹介させていただきます。Attention を直観から導出し、クエリ・キー・バリューの幾何、softmax の温度、マルチヘッド構造、そして Attention をカーネル法として読み直す視点まで、控えめに歩いてまいります。

2026-03-06

第2章 — 確率、トークン、テキスト: 次の単語を当てるゲーム

LLM Primer I シリーズの第2章です。LLM がテキストをトークンに変換する仕組み、なぜ言語モデリングが本質的に確率の問題なのか、そして昔の n-gram アプローチが汎化できるニューラルモデルにどう道を譲ったかを解説します。パープレキシティのやさしい言葉での説明と、トークン境界がなぜ重要かも扱います。

2026-02-19

6.1 データセットの前処理 - トレーニングデータのクリーニングと最適化方法

LLM（大規模言語モデル）のトレーニングに使用されるデータセットの前処理手法を解説します。データのクリーニング、トークン化、バイアス軽減、サンプリングなど、効果的な学習のためのプロセスを紹介します。

2024-10-17

1.2 確率論の基本と対話生成｜LLMの次単語予測を学ぶ

LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語｜文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。

2024-10-04