LLM入門


合計 4 件の記事があります。 現在 1 ページ中の 1 ページ目です。

1.3 情報量とエントロピー ― モデルの“迷い”を数学で読む

大規模言語モデル(LLM)の「迷い」を数式で捉えるとは?本記事では、情報量・エントロピー・クロスエントロピーという情報理論の基礎概念を使い、LLMの予測の仕組みをわかりやすく解説します。損失関数の意味を本質から理解する1章。
2024-10-04

1.2 確率論の基本と対話生成|LLMの次単語予測を学ぶ

LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語|文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。
2024-10-04

1.0 LLM入門 - 大規模言語モデルの仕組みと数学的アプローチの解説

本記事では、LLM(大規模言語モデル)の仕組みを数学的視点から解説します。トランスフォーマーモデルや勾配降下法といった技術をわかりやすく説明し、エンジニア向けにLLMの理解を深めるための基礎知識を提供します。
2024-10-02

LLM入門 - 数学で理解する大規模言語モデルの仕組み

大規模言語モデル(LLM)の基礎から応用までを初心者向けにわかりやすく解説。LLMの仕組み、トレーニング、活用方法を体系的に学べる入門ガイド。
2024-10-01

チーム

任 弘毅

株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田 昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。