LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第14章 — ベンチマーク、テスト、性能
LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。
2026-04-12第13章 — フレームワークとクラウド統合
LLM Primer IV ウォークスルー第13回。Strands と Bedrock、AWS のステート層パターン、Microsoft Agent Framework、LangChain、Semantic Kernel — そしてチームが独立にたどり着く3つの本番統合パターン。
2026-04-11第12章 — プロトコルの堅牢化と防御
LLM Primer IV ウォークスルー第12回。4つの防御クラスタ — 暗号アテステーション、境界付きセッション付きOAuthスコープ規律、ランタイム・サンドボックス、Human-in-the-loopゲート — を組み合わせることで、敵対的条件下でモデルが正しく振る舞うことに依存しない姿勢を作る。
2026-04-10第11章 — 攻撃面とプロトコル脆弱性
LLM Primer IV ウォークスルー第11回。MCPに適合された古典的攻撃 — Confused Deputy、Token Passthrough、Session Hijacking — 、Capability EscalationとUnauthenticated Samplingを巡るプロトコル・レベルの欠陥、そしてコンテキスト汚染を衛生問題ではなく構造的な問題にする暗黙の信頼伝播。
2026-04-09第8章 — アーキテクチャ的デプロイメント・レイアウト
LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。
2026-04-06第7章 — 高度な協働・動的パターン
LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。
2026-04-05第5章 — トランスポートプロトコルとディスカバリ
LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。
2026-04-03第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御
LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。
2026-04-02第3章 — サーバープリミティブ: コンテキストと能力の公開
LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。
2026-04-01第2章 — Model Context Protocol (MCP) の正体
LLM Primer IV ウォークスルー第2回。MCPが何を標準化しているのか、Host・Client・Serverの三役割の分割、動的ディスカバリと双方向メッセージがRESTと違って効いてくる場面、そして能力交渉で始まるセッション・ライフサイクル。
2026-03-31第1章 — AI統合の危機と、エージェント型アーキテクチャの台頭
LLM Primer IV ウォークスルー第1回。長いシステムプロンプトがモノリシック・エージェントを壊す理由、その下に隠れているN×Mの統合問題、そしてMCPが下支えするように作られた「プロンプト工学からコンテキスト工学へ」の移行を歩きます。
2026-03-30LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス
LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。
2026-03-29第6章 — RAGの脅威モデルと脆弱性
LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。
2026-03-23第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ
LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。
2026-02-26従来のプロンプト設計とMCPの違いとは?|MCP入門 2.2|生成AI設計の新常識
プロンプトエンジニアリングでは限界がある。MCP(Model Context Protocol)は、文脈と状態を分離・構造化することで、一貫性・拡張性・再現性を備えた生成AIの設計を可能にします。従来手法との違いを比較しながら丁寧に解説。
2025-03-09モデルはなぜ文脈を必要とするのか?|MCP入門 1.1|生成AIとコンテキスト理解
ChatGPTをはじめとする生成AIは、入力だけでなく“文脈”によって出力を変えています。なぜ文脈が必要なのか、モデルはどう背景を読み取るのか。MCP設計の基礎となる文脈理解について、具体例を交えて丁寧に解説します。
2025-03-035.2 コンテキストを保持したマルチターン会話の実装|LLM活用ガイド
LLMを用いたコンテキストを保持したマルチターン会話の実装方法を紹介。FlaskとRedisを使用したスケーラブルなチャットボットの設計とPythonのサンプルコードを掲載。
2024-11-185.1 LLMを活用したチャットボットの基本アーキテクチャ|Python実装ガイド
LLMを活用したチャットボットの基本アーキテクチャとPythonによる簡単なAPI実装例を紹介。FlaskやFastAPIを使用したスケーラブルな設計方法を解説。
2024-11-171.3 LLM推論APIにおけるキャッシュ戦略|高速化と負荷軽減のためのベストプラクティス
LLM推論APIのパフォーマンスを向上させるキャッシュ戦略について解説。Redisを使った具体的な実装例やキャッシュ最適化のベストプラクティスを紹介します。
2024-11-041.2 LLM推論APIのスケーリング|水平スケーリング、ロードバランシング、キャッシュ戦略の実装
LLM推論APIのパフォーマンス向上方法を紹介します。水平スケーリング、ロードバランシング、Redisキャッシュ戦略を使用した効率的なAPI設計の実装例を解説。
2024-11-045.3 LLMのリアルタイム使用における課題 | レイテンシとスケーラビリティの対策
LLM(大規模言語モデル)をリアルタイムで使用する際の課題と対策をエンジニア向けに解説。レイテンシの低減やスケーラビリティの確保、モデル最適化の手法について詳述します。
2024-09-235.2 LLMの計算リソースとコストの課題 | 最適化手法とクラウド活用
LLM(大規模言語モデル)の運用に伴う計算リソースとコストの課題をエンジニア向けに解説。モデル圧縮、量子化、分散トレーニングなどの最適化手法や、クラウドサービスを活用した効率的なリソース管理の方法について紹介。
2024-09-22