LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第11章 — 継続的なアップデートとパイプライン最適化
LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。
2026-03-28第10章 — 主要な評価フレームワーク
LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。
2026-03-27第9章 — RAG評価トライアド
LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。
2026-03-26第8章 — RAGパイプラインにおけるデータ匿名化
LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。
2026-03-25第7章 — アクセス制御の実装
LLM Primer III ウォークスルー第7回。基盤としての文書単位ACL、Microsoft Purview の機密ラベルと統合する RBAC、Zanzibar と SpiceDB による ReBAC、そしてそれらすべての下で動く「事前フィルタ vs 事後フィルタ」の規律。
2026-03-24第6章 — RAGの脅威モデルと脆弱性
LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。
2026-03-23第5章 — 検索パイプラインの設計
LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。
2026-03-22第4章 — 適切なベクトルデータベースの選定
LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。
2026-03-21第3章 — アドバンスト・チャンキングのフレームワーク
LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。
2026-03-20第2章 — インテリジェント文書パース
LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。
2026-03-19第1章 — RAGアーキテクチャの進化
LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。
2026-03-18LLM Primer III — シリーズ紹介とインデックス
LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。
2026-03-17第14章 — エンジニアのための実践的知識
LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。
2026-03-16第13章 — 限界、リスク、未解決の課題
LLM Primer II 第13章の歩き読みです。数学を別の向きに使い、計算コストとエネルギーの天井、データから自然に染み込んでくるバイアス、そして数学だけでは答えの出ない倫理と社会の問いを、控えめに整理します。
2026-03-15第11章 — 評価、キャリブレーション、推論
LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。
2026-03-13第10章 — ポストトレーニングとアラインメントの数学
LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。
2026-03-12第9章 — スケールでの学習
LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。
2026-03-11第12章 — 自分の LLM システムを構築する: データセットから本番まで
LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。
2026-03-01第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸
LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。
2026-02-28第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ
LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。
2026-02-26第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント
LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。
2026-02-25第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル
LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。
2026-02-24第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ
LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。
2026-02-23第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト
LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。
2026-02-22第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身
LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。
2026-02-21LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス
LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。
2026-02-17ドキュメントベース質問応答(RAG)でのContext設計とは?|MCP入門 5.3|情報の構造化で精度と説明力を高める方法
RAG(検索補助生成)で生成AIが正確に応答するためには、検索結果をどのように文脈化するかが鍵です。MCP設計により、取得情報のスロット化・優先度付け・役割づけを行い、安定した回答と説明責任のある出力を実現する方法を解説します。
2025-03-25タスク分離とセッション切り替えとは?|MCP入門 5.2|AI応答の誤りを防ぐ文脈設計
1人のユーザーが複数の目的でAIと対話する時、文脈の混在は誤応答や情報漏洩の原因になります。MCPによるセッションIDやタスクタグの活用により、タスク単位の文脈を安全かつ自然に切り替える方法を詳しく解説します。
2025-03-24MCPの実践設計パターンとは?|第5章|チャット・RAG・ツール統合まで網羅的に解説
この章では、Model Context Protocol(MCP)を具体的にどう活用すべきか、チャットボット、タスク切替、RAG、マルチエージェントシステムといった現実的ユースケースごとに設計パターンを解説します。
2025-03-22外部ツールとのプロトコル統合とは?|MCP入門 4.4|カレンダー・チャット・CRMをAIと連携する設計法
SlackやGoogle Calendar、Salesforceなどの外部ツールと生成AIを連携し、チャットから予定作成や顧客データ操作を行う方法を解説。MCPを活用し、文脈の更新・アクション提案・認証設計まで詳しく紹介します。
2025-03-21複数モデル(LLM)の使い分け設計とは?|MCP入門 4.2|GPT-4・Claude・Geminiをタスクごとに最適活用
GPT-4、Claude、Geminiなど複数のLLMを目的に応じて使い分ける設計は、生成AIの品質・速度・コスト最適化に不可欠です。本節では、MCPによる役割分担、タスク別・属性別・フォールバック・ワークフロー設計を詳しく解説します。
2025-03-19RAGとの統合設計とは?|MCP入門 4.1|生成AIの文脈構築を強化する検索補助付き設計
RAG(検索補助付き生成)は、生成AIに最新情報や社内知識を与える鍵です。本章では、MCPとの接続方法、FAQ注入、要約統合、テンプレートとの連携など、RAGとコンテキスト設計を統合する具体的手法を紹介します。
2025-03-18MCPの拡張と統合とは?|MCP入門 第4章|RAG・マルチモデル・外部ツール連携の設計手法
MCP(Model Context Protocol)の応用編として、RAGの統合、複数LLMの使い分け、マルチセッション管理、外部ツールとの連携など、生成AIを高度に運用するための設計フレームワークを解説します。
2025-03-17ユーザー状態とモデル状態の同期とは?|MCP入門 3.4|生成AIの一貫した応答設計
生成AIの出力の一貫性を保つには、ユーザーとモデルの状態を同期させることが重要です。MCPでは、セッションメモリ、タスク管理、ステートマシン、感情トラッキングなどを活用して文脈と目的を揃える設計が求められます。
2025-03-16コンテキストマネジメントとは?|MCP入門 3.2|履歴と外部情報を活かす生成AI設計
生成AIの出力品質は、どんな文脈や履歴情報を参照しているかで決まります。本章では、チャット履歴要約・外部ベクター検索・ユーザープロファイル統合といったMCP設計の基礎を丁寧に解説します。
2025-03-14OpenAI Function CallingとMCPの関係とは?|MCP入門 2.4|生成AIの構造化出力と実装設計
OpenAIのFunction Callingは、生成AIが構造化された出力を返す仕組みです。MCP(Model Context Protocol)の文脈・状態設計と深く関係し、再現性や拡張性の高いAI実装を支えます。本節ではその原理と設計のポイントを丁寧に解説します。
2025-03-11RAG時代の設計者とは?検索と生成をつなぎ、AIを業務に根づかせる方法|LLM入門 終章
RAGの本質は、情報の選別と構造化を通じて生成AIの文脈を設計すること。本章では、生成AI時代に求められる「検索と生成をつなぐ設計者」の役割と、今後の学びと実装の地図を示します。
2025-03-08RAGは今後も必要か?生成AI時代における検索設計の価値と使い続ける理由|LLM入門 7.4
長文処理に優れたLLMが登場する中で、RAGを使い続ける意味とは何か。本記事では、情報制御・更新性・出典明示・組織ナレッジ活用という観点から、RAGの価値と今後の活かし方を再評価します。
2025-03-07RAGは本当に不要になるのか?長文対応LLM時代の検索戦略を再考する|LLM入門 7.3
GPT-4 128kやClaude 2の登場により、「検索せず全文渡す」構成が可能になってきました。本記事ではRetrieval不要論の背景と現実的な限界、そしてRAGの再定義について丁寧に解説します。
2025-03-06モデルにとっての記憶とは何か?|MCP入門 1.4|生成AIと文脈再現の技術
生成AIは本当に記憶しているのか?実は、AIの“記憶”は文脈の再構築にすぎません。エフェメラルメモリ・永続メモリ・役割設計など、MCP(Model Context Protocol)での記憶制御の仕組みをわかりやすく解説します。
2025-03-06RAGを強化するハイブリッド検索とMulti-Vector戦略とは?検索の多視点化と精度向上の設計|LLM入門 7.2
意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。
2025-03-05コンテキストウィンドウとは?生成AIにおける文脈の限界とMCP設計|MCP入門 1.3
生成AIが扱える“文脈”には上限があります。それがコンテキストウィンドウです。トークン数の制限とは何か、なぜ応答が急に崩れるのか、MCP(Model Context Protocol)における設計の工夫まで、丁寧に解説します。
2025-03-05RAGにおける幻覚とは?情報の過不足を防ぎ生成精度を高める設計法|LLM入門 7.1
RAG構成でも、LLMによる幻覚(hallucination)は発生します。本記事では、Retriever精度、プロンプト設計、出典明示などにより幻覚を抑える具体的な方法と、検知・評価の技術までを丁寧に解説します。
2025-03-04RAGの限界と今後の展望とは?幻覚・検索精度・モデル進化にどう向き合うか|LLM入門 第7章
RAGには明確な強みがある一方で、限界や課題も存在します。本章では、幻覚対策やハイブリッド検索の可能性、大規模コンテキストモデルとの関係、そして今後の運用と設計戦略について実践的に整理します。
2025-03-03RAG設計におけるトークン制限への対処法とは?情報量と生成精度を両立する工夫|LLM入門 6.4
生成AIにはトークン数の上限という物理的な制約があります。本記事では、Retriever出力やプロンプトを設計する際に考慮すべきトークン制限と、その中で最も有効な情報を渡すための工夫と設計指針を解説します。
2025-03-02RAGにおけるプロンプト合成の設計パターンとは?文脈統合で生成精度を高める方法|LLM入門 6.3
Retrieverで得た情報をLLMにどう渡すかが、RAGの成否を分けます。本記事では、文書構造ごとのプロンプト合成パターンとその効果、生成品質を高めるための設計指針を具体的に解説します。
2025-03-01RAGの検索精度を高める設計術:質問の正規化とドキュメントマッチングとは|LLM入門 6.2
自然文のままでは曖昧なユーザー質問を、検索に適した形式へ整える「質問の正規化」と、意味的に関連する文書を適切に選び出す「マッチング戦略」について、RAG実装の視点からわかりやすく解説します。
2025-02-28RAGとMCPの関係とは?RetrieverとLLMの役割分担を明確にする設計法|LLM入門 6.1
RAG構成を安定的に運用するには、RetrieverとLLMの責任範囲を明確にする必要があります。本記事では、MCP(Model Context Protocol)を活用して、指示・文脈・入力の3層に分けた設計の考え方を解説します。
2025-02-27RAGの設計力とは?プロンプトと文脈の最適化で生成精度を高める方法|LLM入門 第6章
高性能なLLMと正確な検索結果を活かす鍵は、プロンプトと文脈の設計にあります。本章では、RAGの実運用で成果を出すための構成・整形・トークン最適化の具体的な手法を、設計者の視点から詳しく解説します。
2025-02-26Azure Cognitive SearchやElasticでRAGを実現する方法|既存検索基盤を活かす構成とは|LLM入門 5.4
RAGはLangChainやLlamaIndex以外にも、Azure Cognitive SearchやElasticsearchといった既存インフラでも構築可能です。本記事では、それぞれの特徴や適用例、選定ポイントをわかりやすく整理します。
2025-02-25