LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 1 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第11章 — 評価、キャリブレーション、推論

LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。

2026-03-13