LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第14章 — ベンチマーク、テスト、性能
LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。
2026-04-12第10章 — 長期タスクの記憶
LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。
2026-04-08第9章 — 注意の予算管理
LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。
2026-04-07第8章 — アーキテクチャ的デプロイメント・レイアウト
LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。
2026-04-06第7章 — 高度な協働・動的パターン
LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。
2026-04-05第6章 — オーケストレーションの基本
LLM Primer IV ウォークスルー第6回。オーケストレーションの基本形 — 逐次パイプラインと並行スキャッタ・ギャザー — と、その前にチームが問うべき前提の問い: そもそもマルチ・エージェントが正解か。
2026-04-04第5章 — トランスポートプロトコルとディスカバリ
LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。
2026-04-03第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御
LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。
2026-04-02第3章 — サーバープリミティブ: コンテキストと能力の公開
LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。
2026-04-01第2章 — Model Context Protocol (MCP) の正体
LLM Primer IV ウォークスルー第2回。MCPが何を標準化しているのか、Host・Client・Serverの三役割の分割、動的ディスカバリと双方向メッセージがRESTと違って効いてくる場面、そして能力交渉で始まるセッション・ライフサイクル。
2026-03-31LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス
LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。
2026-03-29第11章 — 継続的なアップデートとパイプライン最適化
LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。
2026-03-28第10章 — 主要な評価フレームワーク
LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。
2026-03-27第9章 — RAG評価トライアド
LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。
2026-03-26第8章 — RAGパイプラインにおけるデータ匿名化
LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。
2026-03-25第7章 — アクセス制御の実装
LLM Primer III ウォークスルー第7回。基盤としての文書単位ACL、Microsoft Purview の機密ラベルと統合する RBAC、Zanzibar と SpiceDB による ReBAC、そしてそれらすべての下で動く「事前フィルタ vs 事後フィルタ」の規律。
2026-03-24第6章 — RAGの脅威モデルと脆弱性
LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。
2026-03-23第5章 — 検索パイプラインの設計
LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。
2026-03-22第4章 — 適切なベクトルデータベースの選定
LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。
2026-03-21第3章 — アドバンスト・チャンキングのフレームワーク
LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。
2026-03-20第1章 — RAGアーキテクチャの進化
LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。
2026-03-18LLM Primer III — シリーズ紹介とインデックス
LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。
2026-03-17第14章 — エンジニアのための実践的知識
LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。
2026-03-16第11章 — 評価、キャリブレーション、推論
LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。
2026-03-13第7章 — 効率と Transformer の派生
LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。
2026-03-09第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸
LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。
2026-02-28第10章 — 安全性、倫理、信頼: マーケティングの先へ
LLM Primer I シリーズの第10章です。LLM の安全性についての正直な像 — なぜハルシネーションが構造的に起きるのか、バイアスは本当はどこに宿るのか、多層ガードレールはどう機能するのか、そしてなぜ技術的コントロールでは置き換えられない制度的レイヤーがガバナンスなのかを解説します。安全に「出す」必要のある実務者向けです。
2026-02-27第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ
LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。
2026-02-26第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント
LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。
2026-02-25第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル
LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。
2026-02-24W3CのAI Context仕様とは?|MCP入門 7.3|文脈の国際標準化とMCPの役割
AIの意思決定や会話文脈を明示的に設計するため、W3CではAI Context仕様の標準化が進んでいます。本記事ではその動向と、MCPとの親和性や将来のマッピング可能性について詳しく解説します。
2025-04-04MCPの拡張と統合とは?|MCP入門 第4章|RAG・マルチモデル・外部ツール連携の設計手法
MCP(Model Context Protocol)の応用編として、RAGの統合、複数LLMの使い分け、マルチセッション管理、外部ツールとの連携など、生成AIを高度に運用するための設計フレームワークを解説します。
2025-03-17MCPによる状態制御と再現性の向上とは?|MCP入門 2.3|生成AIの安定設計の鍵
生成AIをプロダクトとして安定運用するには、出力の一貫性と再現性が不可欠です。MCP(Model Context Protocol)は文脈と状態を構造化し、モデルの振る舞いを制御・再現可能にします。設計原則から具体例まで詳しく解説。
2025-03-10RAG時代の設計者とは?検索と生成をつなぎ、AIを業務に根づかせる方法|LLM入門 終章
RAGの本質は、情報の選別と構造化を通じて生成AIの文脈を設計すること。本章では、生成AI時代に求められる「検索と生成をつなぐ設計者」の役割と、今後の学びと実装の地図を示します。
2025-03-08RAGを強化するハイブリッド検索とMulti-Vector戦略とは?検索の多視点化と精度向上の設計|LLM入門 7.2
意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。
2025-03-05コンテキストウィンドウとは?生成AIにおける文脈の限界とMCP設計|MCP入門 1.3
生成AIが扱える“文脈”には上限があります。それがコンテキストウィンドウです。トークン数の制限とは何か、なぜ応答が急に崩れるのか、MCP(Model Context Protocol)における設計の工夫まで、丁寧に解説します。
2025-03-05RAGの限界と今後の展望とは?幻覚・検索精度・モデル進化にどう向き合うか|LLM入門 第7章
RAGには明確な強みがある一方で、限界や課題も存在します。本章では、幻覚対策やハイブリッド検索の可能性、大規模コンテキストモデルとの関係、そして今後の運用と設計戦略について実践的に整理します。
2025-03-03RAGとMCPの関係とは?RetrieverとLLMの役割分担を明確にする設計法|LLM入門 6.1
RAG構成を安定的に運用するには、RetrieverとLLMの責任範囲を明確にする必要があります。本記事では、MCP(Model Context Protocol)を活用して、指示・文脈・入力の3層に分けた設計の考え方を解説します。
2025-02-27RAGの設計力とは?プロンプトと文脈の最適化で生成精度を高める方法|LLM入門 第6章
高性能なLLMと正確な検索結果を活かす鍵は、プロンプトと文脈の設計にあります。本章では、RAGの実運用で成果を出すための構成・整形・トークン最適化の具体的な手法を、設計者の視点から詳しく解説します。
2025-02-26Azure Cognitive SearchやElasticでRAGを実現する方法|既存検索基盤を活かす構成とは|LLM入門 5.4
RAGはLangChainやLlamaIndex以外にも、Azure Cognitive SearchやElasticsearchといった既存インフラでも構築可能です。本記事では、それぞれの特徴や適用例、選定ポイントをわかりやすく整理します。
2025-02-25LlamaIndexとは何か?RAGにおける文書インデックス構築の強みとLangChainとの違い|LLM入門 5.3
LlamaIndexは、RAGの文書処理とインデックス管理に特化したライブラリです。本記事では、LlamaIndexの設計思想と主要機能、LangChainとの違いや併用パターン、実務での活用シーンを丁寧に解説します。
2025-02-24RAG構築に使える主要ツールとサービスの選び方|LLM入門 第5章
RAGを実装するには、適切なツールやサービスの選定が不可欠です。本章では、OpenAI Embeddings、LangChain、LlamaIndex、Azure Cognitive Searchなど、RAG構築に役立つ代表的な選択肢を比較・解説します。
2025-02-21RAGに適したベクトル検索エンジンとは?FAISS・Weaviate・Pinecone徹底比較|LLM入門 4.2
RAGの検索性能を支えるのがベクトル検索エンジンです。本記事では、FAISS・Weaviate・Pineconeといった代表的エンジンの特徴を比較し、導入時に重視すべき観点や選定ポイントをわかりやすく解説します。
2025-02-18RAG導入の実践ステップと落とし穴とは?PoCから本番運用までの道筋|LLM入門 3.4
RAGはPoC(概念実証)では効果を実感しやすい一方で、実運用への移行には注意点が多数あります。本記事では、導入フェーズにおけるステップと、技術・運用・責任設計の観点から見た“落とし穴”とその回避法を解説します。
2025-02-15RAGで専門文書を活用する方法|法務・医療・教育分野での事例と効果|LLM入門 3.3
法律文書、医療ガイドライン、教育要綱など、専門性の高い情報を誰もが使いやすくするにはどうすればよいか。本記事では、RAGを活用して専門文書を自然言語で引き出す仕組みと、実際の活用事例を丁寧に解説します。
2025-02-14RAGでFAQ対応を自動化する方法と効果とは?顧客サポートをAIで強化|LLM入門 3.2
RAGを活用したFAQ対応Botは、顧客の自然な質問に対して意味ベースで文書を検索し、正確でわかりやすい回答を生成します。本記事では、EC事業者の導入事例とともに、設計・運用のポイントや導入効果を具体的に解説します。
2025-02-13RAGで社内ナレッジBotを構築する方法と導入効果|LLM入門 3.1
就業規則や業務手順が整備されていても、社員が情報を引き出せない現実があります。本記事では、RAGを活用して社内文書に基づくナレッジBotを構築し、社内問い合わせ削減と業務効率向上を実現した事例を紹介します。
2025-02-12RAGの活用事例と導入効果とは?業務改善を実現する4つのユースケース|LLM入門 第3章
RAG(Retrieval-Augmented Generation)は、社内ナレッジBotやFAQ応答、自動応答の高度化に活用されています。本章では、実際のユースケースと導入プロセス、効果、注意点までを具体的に紹介し、実務に役立つ導入視点を提供します。
2025-02-11RAGの中核構造:RetrieverとGeneratorの役割と分離設計|LLM入門 2.2
RAGにおいて、Retriever(検索部)とGenerator(生成部)の明確な分離は高精度な応答生成の鍵となります。本記事では、それぞれの役割、構造、設計上のメリットについて詳しく解説し、柔軟で拡張性のあるAI構築のための基盤を紹介します。
2025-02-08