RAGと従来の検索の違いとは?意味ベース検索と生成の融合を解説|LLM入門 2.3

2.3 従来の検索とRAGの違い

RAG(Retrieval-Augmented Generation)は「検索と生成の融合」とも呼ばれますが、ここでいう“検索”は、従来のキーワード検索やFAQシステムとは本質的に異なる性質を持っています。
このセクションでは、従来の検索システムとRAGの構造を比較しながら、何がどう違い、なぜRAGが新しい知識活用の方法として注目されているのかを明らかにしていきます。

 

従来の検索:キーワードに依存した情報取得

一般的な検索システム──たとえば、社内ポータルにあるFAQ検索やGoogleの検索ボックスに近いもの──は、入力されたキーワードと完全または部分一致する文書をスコア化し、類似度の高い順に並べて返す仕組みが主流です。

このような検索には以下のような特徴があります:

  • 単語ベースで動作する(例:「返品 ポリシー」など)

  • 構文の揺らぎに弱い(語順が変わる、別の表現を使うとヒットしない)

  • 質問応答ではない(ユーザーが自分で文書を読んで意味を解釈する必要がある)

  • 文脈を考慮しない(「この制度、去年とどう違う?」のような曖昧表現に対応しづらい)

このため、従来の検索は「情報を探すためのツール」としては有効でも、「知識を活用する会話体験」には向いていません。

 

RAGの検索:意味的・文脈的に関連する情報を抽出

一方、RAGにおける検索(Retriever)は、「ユーザーの意図や文脈を理解したうえで、意味的に関連する情報を取り出す」ことを目的としています。

このため、キーワードの完全一致ではなく、埋め込みベクトル(embedding)による意味類似度を用いて検索が行われます。

たとえば、以下のようなユーザー入力に対して:

「離職後の福利厚生はどうなりますか?」

従来の検索では「福利厚生」「離職」などのキーワードを含むページを探しますが、RAGのRetrieverは、たとえ質問文にその単語が含まれていなくても、「退職者向けの健康保険」「年金制度」「再雇用制度」など、意味的に関連する情報を検索結果として取り出すことができます。

これは、単語ではなく意味の距離(ベクトル空間上の距離)を指標にしているからです。

 

検索だけで終わらない:生成による自然な応答

さらに、RAGは検索した情報をそのまま提示するのではなく、生成モデルがそれらを統合し、ユーザーにとって理解しやすい形で回答を返すという大きな違いがあります。

従来の検索:

→ 検索結果を一覧で返す → ユーザーが自分で読んで解釈する

RAGの流れ:

→ 検索(Retriever)が情報を収集 → 生成(Generator)が文脈に合わせて自然な文章にまとめる → 回答として提示

つまり、RAGは「情報を探す仕組み」ではなく、「質問に答える仕組み」として設計されています。

 

FAQとの違い:事前定義 vs 文脈生成

従来のFAQシステムとの比較も明確にしておきましょう。

観点 従来のFAQ RAG型システム
回答の形式 事前に決められたテンプレート 動的に生成される自然言語
柔軟性 質問のバリエーションに弱い 表現が変わっても対応可能
更新のしやすさ 手動で管理・整備が必要 ナレッジベースの更新だけで即時反映
会話の流れ 断片的な検索結果表示 文脈を踏まえた一貫した応答

このように、RAGは「柔軟性」「スケーラビリティ」「自然さ」において、従来型の検索システムとは一線を画するアーキテクチャと言えます。

 

課題を補完する「生成AI × 検索」の進化

もちろん、RAGにも課題は存在します。たとえば、Retrieverが関係のない文書を返してしまえば、それに基づく回答もズレたものになります。プロンプトの長さにも限界があり、多くの文書を一度に統合することには制約があります。

しかし、こうした課題に対しても、検索アルゴリズムの改善や、マルチラウンドRAG、RAG-Fusionといった派生手法が開発されており、「生成AI × 検索」という流れは今後さらに進化していくと見られています。

 

RAGが得意なケース、不得意なケース

ここまでで、RAGが従来の検索手法とどのように異なるのか、またなぜそれが今求められているのかを整理しました。
次のセクション「2.4 RAGが得意なケース、不得意なケース」では、RAGが特に力を発揮するケースと、逆に現時点では苦手とするケースについて具体的に見ていきます。
導入の適否を判断するための視点としてご活用いただければと思います。

公開日: 2025-02-09
最終更新日: 2025-05-25
バージョン: 5

下田 昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。

チーム

任 弘毅

株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田 昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。