LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第14章 — ベンチマーク、テスト、性能
LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。
2026-04-12第11章 — 攻撃面とプロトコル脆弱性
LLM Primer IV ウォークスルー第11回。MCPに適合された古典的攻撃 — Confused Deputy、Token Passthrough、Session Hijacking — 、Capability EscalationとUnauthenticated Samplingを巡るプロトコル・レベルの欠陥、そしてコンテキスト汚染を衛生問題ではなく構造的な問題にする暗黙の信頼伝播。
2026-04-09第10章 — 長期タスクの記憶
LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。
2026-04-08第9章 — 注意の予算管理
LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。
2026-04-07第8章 — アーキテクチャ的デプロイメント・レイアウト
LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。
2026-04-06第7章 — 高度な協働・動的パターン
LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。
2026-04-05第6章 — オーケストレーションの基本
LLM Primer IV ウォークスルー第6回。オーケストレーションの基本形 — 逐次パイプラインと並行スキャッタ・ギャザー — と、その前にチームが問うべき前提の問い: そもそもマルチ・エージェントが正解か。
2026-04-04第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御
LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。
2026-04-02第1章 — AI統合の危機と、エージェント型アーキテクチャの台頭
LLM Primer IV ウォークスルー第1回。長いシステムプロンプトがモノリシック・エージェントを壊す理由、その下に隠れているN×Mの統合問題、そしてMCPが下支えするように作られた「プロンプト工学からコンテキスト工学へ」の移行を歩きます。
2026-03-30LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス
LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。
2026-03-29第11章 — 継続的なアップデートとパイプライン最適化
LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。
2026-03-28第10章 — 主要な評価フレームワーク
LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。
2026-03-27第9章 — RAG評価トライアド
LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。
2026-03-26第8章 — RAGパイプラインにおけるデータ匿名化
LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。
2026-03-25第5章 — 検索パイプラインの設計
LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。
2026-03-22第3章 — アドバンスト・チャンキングのフレームワーク
LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。
2026-03-20第2章 — インテリジェント文書パース
LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。
2026-03-19第1章 — RAGアーキテクチャの進化
LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。
2026-03-18LLM Primer III — シリーズ紹介とインデックス
LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。
2026-03-17第14章 — エンジニアのための実践的知識
LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。
2026-03-16第12章 — LLM の実世界応用
LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。
2026-03-14第11章 — 評価、キャリブレーション、推論
LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。
2026-03-13第10章 — ポストトレーニングとアラインメントの数学
LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。
2026-03-12第1章 — 言語モデルのための数学的直観
LLM Primer II シリーズの第1章です。数式と読み手とのあいだに立っている「壁」を、そっと脇に避けるところから始めます。記号、言語生成のための確率、そして不確かさを測るためのエントロピー。
2026-03-03第12章 — 自分の LLM システムを構築する: データセットから本番まで
LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。
2026-03-01第10章 — 安全性、倫理、信頼: マーケティングの先へ
LLM Primer I シリーズの第10章です。LLM の安全性についての正直な像 — なぜハルシネーションが構造的に起きるのか、バイアスは本当はどこに宿るのか、多層ガードレールはどう機能するのか、そしてなぜ技術的コントロールでは置き換えられない制度的レイヤーがガバナンスなのかを解説します。安全に「出す」必要のある実務者向けです。
2026-02-27第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ
LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。
2026-02-26第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント
LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。
2026-02-25第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル
LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。
2026-02-24第3章 — 言語のためのニューラルネットワーク: RNN から Self-Attention へ
LLM Primer I シリーズの第3章です。なぜ Feedforward では言語を扱えなかったか、RNN がどう壁にぶつかったか、そして Attention が何を変えたかを解説します。現代の NLP を定義した3つのニューラルネットワーク形態を、数学アレルギーなしで整理できる構成です。
2026-02-20第1章 — 大規模言語モデルとは何か (見出しの先へ)
LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。
2026-02-18LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス
LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。
2026-02-17W3CのAI Context仕様とは?|MCP入門 7.3|文脈の国際標準化とMCPの役割
AIの意思決定や会話文脈を明示的に設計するため、W3CではAI Context仕様の標準化が進んでいます。本記事ではその動向と、MCPとの親和性や将来のマッピング可能性について詳しく解説します。
2025-04-04OpenAI GPT、Claude、Geminiの文脈処理とは?|MCP入門 7.1|各社LLMの設計思想とMCPの位置づけ
各社LLMは文脈や状態の扱い方に独自のアプローチを持っています。本記事ではOpenAI GPTのSystem MessageとMemory API、Claudeの自己内省型設計、Geminiのマルチモーダル連携を比較し、MCPが果たす中立的な役割を明らかにします。
2025-04-02MCPの未来と標準化への道とは?|MCP入門 7.0|AI文脈設計の次なるステージとグローバル接続性
Model Context Protocol(MCP)はAIの文脈理解と再現性を支える設計思想です。最終章では、各社LLMとの親和性、Memory API連携、W3C標準化、人格と役割の制御まで、MCPの未来像を展望します。
2025-04-01JSONスキーマによる状態制御の工夫とは?|MCP入門 6.4|一貫性あるAI応答を実現する構造的設計
生成AIの応答を安定化させるには、“状態”の明示が不可欠です。本記事では、MCP設計におけるJSONスキーマの活用方法を詳しく解説し、意図や画面状況をモデルに正しく伝える設計戦略を紹介します。
2025-03-31“明示的な制約”と“暗黙の指示”の違いとは?|MCP入門 6.1|AIが期待に応えるためのプロンプト設計術
生成AIは指示されたことだけでなく、空気や文脈を読むことも求められます。本記事では、プロンプトにおける“明示的な制約”と“暗黙の指示”の違いを解説し、MCP設計を通じて誤解を防ぎ、意図通りの応答を得るための設計手法を紹介します。
2025-03-28ツール活用 / マルチエージェントシステムでのMCP適用例とは?|MCP入門 5.4|複数エージェントとツールを統合する文脈設計
ツール活用やマルチエージェント設計では、AIが状態や目的を共有しながら協調する必要があります。MCPを活用することで、共通の文脈管理・状態同期・出力整理を実現し、複雑な連携を安定運用できる方法を解説します。
2025-03-26ドキュメントベース質問応答(RAG)でのContext設計とは?|MCP入門 5.3|情報の構造化で精度と説明力を高める方法
RAG(検索補助生成)で生成AIが正確に応答するためには、検索結果をどのように文脈化するかが鍵です。MCP設計により、取得情報のスロット化・優先度付け・役割づけを行い、安定した回答と説明責任のある出力を実現する方法を解説します。
2025-03-25チャットボットの履歴管理とは?|MCP入門 5.1|スコープ制御で精度とコストを最適化する設計
生成AIチャットボットの応答品質は、会話履歴の設計に大きく左右されます。本記事では、MCPを活用して履歴の粒度・要約・トピック切り替えを制御し、自然かつ効率的なチャット体験を作る方法を解説します。
2025-03-23MCPの実践設計パターンとは?|第5章|チャット・RAG・ツール統合まで網羅的に解説
この章では、Model Context Protocol(MCP)を具体的にどう活用すべきか、チャットボット、タスク切替、RAG、マルチエージェントシステムといった現実的ユースケースごとに設計パターンを解説します。
2025-03-22外部ツールとのプロトコル統合とは?|MCP入門 4.4|カレンダー・チャット・CRMをAIと連携する設計法
SlackやGoogle Calendar、Salesforceなどの外部ツールと生成AIを連携し、チャットから予定作成や顧客データ操作を行う方法を解説。MCPを活用し、文脈の更新・アクション提案・認証設計まで詳しく紹介します。
2025-03-21マルチセッションとユーザー管理とは?|MCP入門 4.3|生成AIで複数会話と文脈を自在に制御する方法
一人のユーザーが複数の会話・プロジェクト・目的を同時に扱う時代において、セッション分離と状態復元は不可欠です。本章では、MCPを活用したマルチセッション設計、履歴管理、テンプレート切替、セキュリティまでを詳しく解説します。
2025-03-20複数モデル(LLM)の使い分け設計とは?|MCP入門 4.2|GPT-4・Claude・Geminiをタスクごとに最適活用
GPT-4、Claude、Geminiなど複数のLLMを目的に応じて使い分ける設計は、生成AIの品質・速度・コスト最適化に不可欠です。本節では、MCPによる役割分担、タスク別・属性別・フォールバック・ワークフロー設計を詳しく解説します。
2025-03-19RAGとの統合設計とは?|MCP入門 4.1|生成AIの文脈構築を強化する検索補助付き設計
RAG(検索補助付き生成)は、生成AIに最新情報や社内知識を与える鍵です。本章では、MCPとの接続方法、FAQ注入、要約統合、テンプレートとの連携など、RAGとコンテキスト設計を統合する具体的手法を紹介します。
2025-03-18MCPの拡張と統合とは?|MCP入門 第4章|RAG・マルチモデル・外部ツール連携の設計手法
MCP(Model Context Protocol)の応用編として、RAGの統合、複数LLMの使い分け、マルチセッション管理、外部ツールとの連携など、生成AIを高度に運用するための設計フレームワークを解説します。
2025-03-17テンプレートとスロットの設計とは?|MCP入門 3.3|生成AIの柔軟で安全な文脈構築法
生成AIの出力に一貫性と安全性を持たせるには、テンプレートとスロット設計が重要です。本章では、プロンプトテンプレート、文脈スロット化、入力サニタイズなど、再利用とセキュリティを両立する具体的なパターンを解説します。
2025-03-15コンテキストマネジメントとは?|MCP入門 3.2|履歴と外部情報を活かす生成AI設計
生成AIの出力品質は、どんな文脈や履歴情報を参照しているかで決まります。本章では、チャット履歴要約・外部ベクター検索・ユーザープロファイル統合といったMCP設計の基礎を丁寧に解説します。
2025-03-14MCP実装の基本設計パターンとは?|MCP入門 第3章|生成AIをプロダクトに組み込むための考え方
MCP(Model Context Protocol)をプロダクトや業務システムに実装するには、文脈・状態・履歴・ユーザー情報の扱い方を設計パターンとして整理する必要があります。本章ではMCPの構造化・再現性・スケーラビリティを支える4つの設計手法を紹介します。
2025-03-12MCPによる状態制御と再現性の向上とは?|MCP入門 2.3|生成AIの安定設計の鍵
生成AIをプロダクトとして安定運用するには、出力の一貫性と再現性が不可欠です。MCP(Model Context Protocol)は文脈と状態を構造化し、モデルの振る舞いを制御・再現可能にします。設計原則から具体例まで詳しく解説。
2025-03-10