LLM入門

合計 4 件の記事があります。現在 1 ページ中の 1 ページ目です。

1.3 情報量とエントロピー ― モデルの“迷い”を数学で読む

大規模言語モデル（LLM）の「迷い」を数式で捉えるとは？本記事では、情報量・エントロピー・クロスエントロピーという情報理論の基礎概念を使い、LLMの予測の仕組みをわかりやすく解説します。損失関数の意味を本質から理解する1章。

2024-10-04

LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語｜文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。

2024-10-04

本記事では、LLM（大規模言語モデル）の仕組みを数学的視点から解説します。トランスフォーマーモデルや勾配降下法といった技術をわかりやすく説明し、エンジニア向けにLLMの理解を深めるための基礎知識を提供します。

2024-10-02

大規模言語モデル（LLM）の基礎から応用までを初心者向けにわかりやすく解説。LLMの仕組み、トレーニング、活用方法を体系的に学べる入門ガイド。

2024-10-01

任弘毅

株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。