RAGとは？検索と生成を組み合わせた新しいAIの仕組み｜LLM入門 2.1 / LLM入門：RAGで強化する生成

2.1 Retrieval-Augmented Generationとは

RAG（Retrieval-Augmented Generation）は、生成AIの性能を高めるために開発された構造的な手法です。その名のとおり、「検索（Retrieval）」と「生成（Generation）」を組み合わせることで、単なる言語生成にとどまらず、外部知識に基づいた高精度な応答生成を実現します。

このセクションでは、RAGがどのような処理構造で成り立っているのか、全体の流れと構成要素をわかりやすく解説していきます。

なぜ「検索＋生成」なのか？

従来のLLMは、事前学習によって蓄えた知識をもとに応答を生成します。しかし、前章でも述べたとおり、以下のような制限があります。

モデルが知っている情報は学習時点で固定されている
特定の業務知識や社内ナレッジは学習されていない
回答の根拠や出典が明示されない

これらの制約を補うために、リアルタイムで情報を取り出し、それを文脈としてLLMに与える仕組みが必要となります。
その役割を果たすのが、RAGにおける「検索（Retrieval）」の部分です。

RAGの全体フロー

RAGの処理は、以下のようなステップで構成されます。

① 入力：ユーザーの質問を受け取る
自然言語による質問や指示が入力されます。たとえば「新しい社内の福利厚生制度について教えて」などです。

② 検索：関連情報を知識ベースから取得する
入力文を埋め込みベクトルに変換し、それと意味的に近い社内文書やFAQ、ナレッジベースの情報を検索します。
この処理はRetrieverと呼ばれる検索エンジンが担います。

③ 統合：検索結果をプロンプトに組み込む
取得した文書（複数ある場合が多い）を、LLMへの入力文に適切な形式で組み込みます。
この部分の設計次第で、生成精度は大きく左右されます。

④ 生成：LLMが文脈に基づいて回答を生成する
検索結果を踏まえて、LLMが自然な言葉で回答を作成します。ここでの処理はGeneratorが担当します。

このように、RAGは一方向の処理ではなく、検索と生成の協調的な構造として設計されています。
これは単なる「辞書を参照する」ような仕組みとは異なり、文脈に合わせて知識を引き出し、自然な言語として再構成する点に特徴があります。

RAGの構造的メリット

この構造により、RAGは以下のような利点を持ちます。

柔軟な知識更新：ナレッジベースを更新すれば即座に反映できる
正確性の向上：具体的な出典に基づいた回答が可能になる
透明性の確保：回答の根拠となった文書を同時に提示できる
セキュアな運用：モデルに機密情報を学習させる必要がない

このような特性から、RAGはとくに社内情報の活用や、業界固有知識を必要とする現場において、実用的な解決策として注目を集めています。

RAGは「統合設計」である

重要なのは、RAGは単なる“前処理”ではなく、LLMを業務で使うための一つの設計原則であるという点です。

どの情報を検索するか（Retrieverの設計）
どのように選び、並べて渡すか（情報統合の設計）
どのように回答させるか（プロンプトの設計）

これらを含めたシステム全体の構成が、RAGの真の価値を決めるのです。単にツールを使うだけではなく、自社の知識構造や業務文脈に合わせた設計が求められます。

RetrieverとGeneratorの分離

このセクションでは、RAGの基本的なフローと特徴を確認しました。次セクション「2.2 RetrieverとGeneratorの分離モデル」では、RAGの構成要素の中核である Retriever と Generator の機能と設計方針をさらに詳しく見ていきます。
この2つの役割を適切に分離・設計することが、実践的なRAGシステムを構築するうえでの第一歩となります。