RAGとは?検索と生成を組み合わせた新しいAIの仕組み|LLM入門 2.1

2.1 Retrieval-Augmented Generationとは
RAG(Retrieval-Augmented Generation)は、生成AIの性能を高めるために開発された構造的な手法です。その名のとおり、「検索(Retrieval)」と「生成(Generation)」を組み合わせることで、単なる言語生成にとどまらず、外部知識に基づいた高精度な応答生成を実現します。
このセクションでは、RAGがどのような処理構造で成り立っているのか、全体の流れと構成要素をわかりやすく解説していきます。
なぜ「検索+生成」なのか?
従来のLLMは、事前学習によって蓄えた知識をもとに応答を生成します。しかし、前章でも述べたとおり、以下のような制限があります。
-
モデルが知っている情報は学習時点で固定されている
-
特定の業務知識や社内ナレッジは学習されていない
-
回答の根拠や出典が明示されない
これらの制約を補うために、リアルタイムで情報を取り出し、それを文脈としてLLMに与える仕組みが必要となります。
その役割を果たすのが、RAGにおける「検索(Retrieval)」の部分です。
RAGの全体フロー
RAGの処理は、以下のようなステップで構成されます。
① 入力:ユーザーの質問を受け取る
自然言語による質問や指示が入力されます。たとえば「新しい社内の福利厚生制度について教えて」などです。
② 検索:関連情報を知識ベースから取得する
入力文を埋め込みベクトルに変換し、それと意味的に近い社内文書やFAQ、ナレッジベースの情報を検索します。
この処理はRetrieverと呼ばれる検索エンジンが担います。
③ 統合:検索結果をプロンプトに組み込む
取得した文書(複数ある場合が多い)を、LLMへの入力文に適切な形式で組み込みます。
この部分の設計次第で、生成精度は大きく左右されます。
④ 生成:LLMが文脈に基づいて回答を生成する
検索結果を踏まえて、LLMが自然な言葉で回答を作成します。ここでの処理はGeneratorが担当します。
このように、RAGは一方向の処理ではなく、検索と生成の協調的な構造として設計されています。
これは単なる「辞書を参照する」ような仕組みとは異なり、文脈に合わせて知識を引き出し、自然な言語として再構成する点に特徴があります。
RAGの構造的メリット
この構造により、RAGは以下のような利点を持ちます。
-
柔軟な知識更新:ナレッジベースを更新すれば即座に反映できる
-
正確性の向上:具体的な出典に基づいた回答が可能になる
-
透明性の確保:回答の根拠となった文書を同時に提示できる
-
セキュアな運用:モデルに機密情報を学習させる必要がない
このような特性から、RAGはとくに社内情報の活用や、業界固有知識を必要とする現場において、実用的な解決策として注目を集めています。
RAGは「統合設計」である
重要なのは、RAGは単なる“前処理”ではなく、LLMを業務で使うための一つの設計原則であるという点です。
-
どの情報を検索するか(Retrieverの設計)
-
どのように選び、並べて渡すか(情報統合の設計)
-
どのように回答させるか(プロンプトの設計)
これらを含めたシステム全体の構成が、RAGの真の価値を決めるのです。単にツールを使うだけではなく、自社の知識構造や業務文脈に合わせた設計が求められます。
RetrieverとGeneratorの分離
このセクションでは、RAGの基本的なフローと特徴を確認しました。次セクション「2.2 RetrieverとGeneratorの分離モデル」では、RAGの構成要素の中核である Retriever と Generator の機能と設計方針をさらに詳しく見ていきます。
この2つの役割を適切に分離・設計することが、実践的なRAGシステムを構築するうえでの第一歩となります。

下田 昌平
開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。カテゴリー
検索履歴
チーム

任 弘毅
株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田 昌平
開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。