LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第14章 — ベンチマーク、テスト、性能
LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。
2026-04-12第13章 — フレームワークとクラウド統合
LLM Primer IV ウォークスルー第13回。Strands と Bedrock、AWS のステート層パターン、Microsoft Agent Framework、LangChain、Semantic Kernel — そしてチームが独立にたどり着く3つの本番統合パターン。
2026-04-11第12章 — プロトコルの堅牢化と防御
LLM Primer IV ウォークスルー第12回。4つの防御クラスタ — 暗号アテステーション、境界付きセッション付きOAuthスコープ規律、ランタイム・サンドボックス、Human-in-the-loopゲート — を組み合わせることで、敵対的条件下でモデルが正しく振る舞うことに依存しない姿勢を作る。
2026-04-10第11章 — 攻撃面とプロトコル脆弱性
LLM Primer IV ウォークスルー第11回。MCPに適合された古典的攻撃 — Confused Deputy、Token Passthrough、Session Hijacking — 、Capability EscalationとUnauthenticated Samplingを巡るプロトコル・レベルの欠陥、そしてコンテキスト汚染を衛生問題ではなく構造的な問題にする暗黙の信頼伝播。
2026-04-09第10章 — 長期タスクの記憶
LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。
2026-04-08第9章 — 注意の予算管理
LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。
2026-04-07第8章 — アーキテクチャ的デプロイメント・レイアウト
LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。
2026-04-06第7章 — 高度な協働・動的パターン
LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。
2026-04-05第6章 — オーケストレーションの基本
LLM Primer IV ウォークスルー第6回。オーケストレーションの基本形 — 逐次パイプラインと並行スキャッタ・ギャザー — と、その前にチームが問うべき前提の問い: そもそもマルチ・エージェントが正解か。
2026-04-04第5章 — トランスポートプロトコルとディスカバリ
LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。
2026-04-03第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御
LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。
2026-04-02第3章 — サーバープリミティブ: コンテキストと能力の公開
LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。
2026-04-01第2章 — Model Context Protocol (MCP) の正体
LLM Primer IV ウォークスルー第2回。MCPが何を標準化しているのか、Host・Client・Serverの三役割の分割、動的ディスカバリと双方向メッセージがRESTと違って効いてくる場面、そして能力交渉で始まるセッション・ライフサイクル。
2026-03-31LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス
LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。
2026-03-29第11章 — 継続的なアップデートとパイプライン最適化
LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。
2026-03-28第10章 — 主要な評価フレームワーク
LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。
2026-03-27第9章 — RAG評価トライアド
LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。
2026-03-26第8章 — RAGパイプラインにおけるデータ匿名化
LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。
2026-03-25第7章 — アクセス制御の実装
LLM Primer III ウォークスルー第7回。基盤としての文書単位ACL、Microsoft Purview の機密ラベルと統合する RBAC、Zanzibar と SpiceDB による ReBAC、そしてそれらすべての下で動く「事前フィルタ vs 事後フィルタ」の規律。
2026-03-24第6章 — RAGの脅威モデルと脆弱性
LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。
2026-03-23第5章 — 検索パイプラインの設計
LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。
2026-03-22第4章 — 適切なベクトルデータベースの選定
LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。
2026-03-21第3章 — アドバンスト・チャンキングのフレームワーク
LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。
2026-03-20第2章 — インテリジェント文書パース
LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。
2026-03-19第1章 — RAGアーキテクチャの進化
LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。
2026-03-18LLM Primer III — シリーズ紹介とインデックス
LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。
2026-03-17第14章 — エンジニアのための実践的知識
LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。
2026-03-16第13章 — 限界、リスク、未解決の課題
LLM Primer II 第13章の歩き読みです。数学を別の向きに使い、計算コストとエネルギーの天井、データから自然に染み込んでくるバイアス、そして数学だけでは答えの出ない倫理と社会の問いを、控えめに整理します。
2026-03-15第12章 — LLM の実世界応用
LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。
2026-03-14第11章 — 評価、キャリブレーション、推論
LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。
2026-03-13第10章 — ポストトレーニングとアラインメントの数学
LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。
2026-03-12第9章 — スケールでの学習
LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。
2026-03-11第8章 — モデルはどう学ぶか
LLM Primer II シリーズの第8章を紹介します。古典的な統計学習理論が「過学習するはず」と告げる規模で、なぜ大規模モデルは汎化してしまうのか。勾配降下法の暗黙的バイアス、スケーリング則、そして「まだ分かっていないこと」を、控えめに整理します。
2026-03-10第6章 — Transformer ブロック
LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。
2026-03-08第12章 — 自分の LLM システムを構築する: データセットから本番まで
LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。
2026-03-01第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸
LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。
2026-02-28第10章 — 安全性、倫理、信頼: マーケティングの先へ
LLM Primer I シリーズの第10章です。LLM の安全性についての正直な像 — なぜハルシネーションが構造的に起きるのか、バイアスは本当はどこに宿るのか、多層ガードレールはどう機能するのか、そしてなぜ技術的コントロールでは置き換えられない制度的レイヤーがガバナンスなのかを解説します。安全に「出す」必要のある実務者向けです。
2026-02-27第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ
LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。
2026-02-26第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント
LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。
2026-02-25第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル
LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。
2026-02-24第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ
LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。
2026-02-23第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身
LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。
2026-02-21第1章 — 大規模言語モデルとは何か (見出しの先へ)
LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。
2026-02-18LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス
LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。
2026-02-17MCPの未来と標準化への道とは?|MCP入門 7.0|AI文脈設計の次なるステージとグローバル接続性
Model Context Protocol(MCP)はAIの文脈理解と再現性を支える設計思想です。最終章では、各社LLMとの親和性、Memory API連携、W3C標準化、人格と役割の制御まで、MCPの未来像を展望します。
2025-04-01システムメッセージ vs ユーザープロンプトとは?|MCP入門 6.2|LLMの人格と応答品質を分ける設計手法
プロンプトには“誰が話すか”という役割の違いがあります。本記事では、システムメッセージとユーザープロンプトの違いを明確化し、モデルの態度・目的意識・人格形成に与える影響、MCP設計への応用を詳しく解説します。
2025-03-29ツール活用 / マルチエージェントシステムでのMCP適用例とは?|MCP入門 5.4|複数エージェントとツールを統合する文脈設計
ツール活用やマルチエージェント設計では、AIが状態や目的を共有しながら協調する必要があります。MCPを活用することで、共通の文脈管理・状態同期・出力整理を実現し、複雑な連携を安定運用できる方法を解説します。
2025-03-26ドキュメントベース質問応答(RAG)でのContext設計とは?|MCP入門 5.3|情報の構造化で精度と説明力を高める方法
RAG(検索補助生成)で生成AIが正確に応答するためには、検索結果をどのように文脈化するかが鍵です。MCP設計により、取得情報のスロット化・優先度付け・役割づけを行い、安定した回答と説明責任のある出力を実現する方法を解説します。
2025-03-25タスク分離とセッション切り替えとは?|MCP入門 5.2|AI応答の誤りを防ぐ文脈設計
1人のユーザーが複数の目的でAIと対話する時、文脈の混在は誤応答や情報漏洩の原因になります。MCPによるセッションIDやタスクタグの活用により、タスク単位の文脈を安全かつ自然に切り替える方法を詳しく解説します。
2025-03-24