LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 3 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第10章 — 主要な評価フレームワーク

LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。

2026-03-27

第9章 — RAG評価トライアド

LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。

2026-03-26

LLM Primer III — シリーズ紹介とインデックス

LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。

2026-03-17