RAGとは何か？検索と生成をつなぐ新しいAIアーキテクチャの全体像｜LLM入門第2章

公開日: 2025-02-06 最終更新日: 2025-05-25 バージョン: 2

第2章　RAGの全体像

第1章では、ChatGPTの限界と、それを補うアプローチとしてRAG（Retrieval-Augmented Generation）がどのようにして登場したのかを、背景や設計思想の観点から見てきました。
本章では、RAGという仕組みの全体像を、より構造的・技術的な視点から解説していきます。

RAGは一見すると「検索と生成の組み合わせ」というシンプルな構造に見えますが、実際にはいくつかの重要な設計ポイントがあり、これを正しく理解することが、実務への応用において極めて重要になります。

本章では以下の4つのセクションを通じて、RAGの動作原理、構成要素、従来手法との違い、そして適用可能な業務領域について整理します。

2.1 Retrieval-Augmented Generationとは
　RAGの基本構造を概観し、ユーザー入力から応答生成までの全体フローを解説します。検索と生成の連携における中心的な仕組みを理解します。
2.2 RetrieverとGeneratorの分離モデル
　RAGを構成する2つの主要モジュール、Retriever（検索部）とGenerator（生成部）の役割の違いと連携の仕方を詳しく見ていきます。
2.3 従来の検索とRAGの違い
　FAQ検索やナレッジ検索との違いを明確化し、RAGがどのようにして“意味”に基づいた検索と柔軟な生成を両立させるのかを、対比を通じて理解します。
2.4 RAGが得意なケース、不得意なケース
　RAGが特に有効なシナリオ（ナレッジ検索、FAQ応答など）と、苦手とされる場面（即時性や計算を要するケース）について、適切な使いどころを整理します。

この4つの視点を通じて、RAGという技術の実際の構成と可能性を、概念だけでなく運用設計や実装につながる形で体系的に理解することができます。

次のセクション「2.1 Retrieval-Augmented Generationとは」では、まずRAGとは何かという基本定義から、その全体の流れを順を追って見ていきましょう。