LlamaIndexとは何か？RAGにおける文書インデックス構築の強みとLangChainとの違い｜LLM入門 5.3 / LLM入門：RAGで強化する生成

5.3 LlamaIndexの特徴と差別化ポイント

RAGを実装する際、LangChainと並んで注目されているもう一つの主要ツールが LlamaIndex（旧：GPT Index）です。LangChainが「LLMのための処理パイプライン」を設計するのに対し、LlamaIndexは「LLMが活用できるように文書を構造化する」ことに特化したライブラリです。

このセクションでは、LlamaIndexの設計思想と主要機能を解説しつつ、LangChainとの使い分け方や実務的な導入ポイントを紹介します。

LlamaIndexとは？

LlamaIndex は、RAG構成における文書処理とインデックス管理を抽象化し、以下のような機能を提供するオープンソースのPythonライブラリです：

多様な文書ソースからのデータ取り込み（PDF, Web, Notion など）
チャンク分割とメタデータ付与
複数形式のインデックス（Tree, List, Keyword Table, Vector）を生成
LLMへの問い合わせに最適な形で情報を整形・提供
ストレージ層（ファイル、DB、クラウド）との柔軟な連携

LlamaIndexはもともと「ドキュメント中心」のRAG構築を目的として開発されたため、**知識ベースを“構造的に育てていく”**という思想が色濃く反映されています。

LlamaIndexの構成概念

LlamaIndexの特徴的なアーキテクチャには、以下のようなレイヤーがあります：

Document Loader
　外部文書（Markdown, PDF, HTML など）を読み込み、LlamaIndexの Document オブジェクトへ変換
Node Parser（チャンク化）
　意味単位やトークン単位での柔軟な分割。メタデータや階層構造の付加も可能
Index（インデックス化）
　Vector Index（ベクトル検索）だけでなく、List Index（逐次処理）や Tree Index（階層構造）も選択可能
Retriever / Query Engine
　クエリに応じて、適切なチャンクを選択・整形してLLMに渡す

このように、LlamaIndexは「どの文書をどう保存し、どう取り出すか」を重視したツールであり、ドキュメント設計に強みがあると言えます。

LangChainとの違いと使い分け

LangChainとLlamaIndexは、併用することも可能ですが、次のような使い分けが一般的です。

比較項目	LangChain	LlamaIndex
主目的	パイプライン構成・ツール連携	文書インデックスの構築と検索
検索設計	Retriever中心	Index + Query Engine 中心
フレームワーク性	汎用性・拡張性が高い	文書構造の抽象化が強い
導入フェーズ	PoC開発・統合開発に向く	本番想定のナレッジ整備に向く
学習曲線	やや高め	比較的緩やか（例が豊富）

組み合わせる場合：
LlamaIndexで知識ベースを構築し、そのRetrieverをLangChainに組み込むことで、両者の利点を活かした設計が可能です。

特に効果的な用途例

LlamaIndexは以下のようなケースに強みを発揮します：

文書が多階層構造で管理されており、目次や章立てを維持した検索が必要な場合
文書の更新や追加が頻繁にあり、インデックスの再構築・差分更新が求められる場合
単なるベクトル検索だけでなく、「条件付きリスト」や「章単位の照会」など複数の参照手段が欲しい場合
検索結果に対して、元の文書構造やファイル名、タグなどのメタ情報を含めて回答させたい場合

補足：データのライフサイクルを意識した設計へ

LlamaIndexは、RAGの一部であるRetriever構成を“運用視点”から見直すことを促してくれるツールです。

文書をどこから取得し、どう構造化し、どう保持するか
どんなクエリに、どの粒度で、どんな順序で答えるか
変更があったとき、どう反映させるか

こうした設計を支援するという点で、LlamaIndexはRAGシステムをデータ運用の観点から整備するための実用的フレームワークであると言えるでしょう。

Azure・Elasticなど代替インフラの選択肢

本セクションでは、LlamaIndexが提供する柔軟なインデックス管理と、LangChainとの違いや併用方法について解説しました。
次のセクション「5.4 Azure Cognitive SearchやElasticなど代替案」では、クラウド基盤やエンタープライズ向けに広く採用されている Azure Cognitive Search や ElasticSearch などの選択肢を取り上げ、より広範なRAG設計の可能性を考察します。