LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第14章 — ベンチマーク、テスト、性能
LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。
2026-04-12第13章 — フレームワークとクラウド統合
LLM Primer IV ウォークスルー第13回。Strands と Bedrock、AWS のステート層パターン、Microsoft Agent Framework、LangChain、Semantic Kernel — そしてチームが独立にたどり着く3つの本番統合パターン。
2026-04-11第5章 — トランスポートプロトコルとディスカバリ
LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。
2026-04-03第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御
LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。
2026-04-02第2章 — Model Context Protocol (MCP) の正体
LLM Primer IV ウォークスルー第2回。MCPが何を標準化しているのか、Host・Client・Serverの三役割の分割、動的ディスカバリと双方向メッセージがRESTと違って効いてくる場面、そして能力交渉で始まるセッション・ライフサイクル。
2026-03-31LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス
LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。
2026-03-29第5章 — 検索パイプラインの設計
LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。
2026-03-226.2 LLMモデルのバージョニングとモニタリング | MLflowとPrometheusを活用
LLMモデルの管理を効率化するためのバージョニングとモニタリング手法を解説。MLflowでモデルをバージョン管理し、PrometheusとGrafanaでリアルタイムにパフォーマンスを監視します。
2024-11-221.2 LLM推論APIのスケーリング|水平スケーリング、ロードバランシング、キャッシュ戦略の実装
LLM推論APIのパフォーマンス向上方法を紹介します。水平スケーリング、ロードバランシング、Redisキャッシュ戦略を使用した効率的なAPI設計の実装例を解説。
2024-11-04