LLM入門
合計 4 件の記事があります。
現在 1 ページ中の 1 ページ目です。

1.3 情報量とエントロピー ― モデルの“迷い”を数学で読む
大規模言語モデル(LLM)の「迷い」を数式で捉えるとは?本記事では、情報量・エントロピー・クロスエントロピーという情報理論の基礎概念を使い、LLMの予測の仕組みをわかりやすく解説します。損失関数の意味を本質から理解する1章。
2024-10-04

1.2 確率論の基本と対話生成|LLMの次単語予測を学ぶ
LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語|文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。
2024-10-04

1.0 LLM入門 - 大規模言語モデルの仕組みと数学的アプローチの解説
本記事では、LLM(大規模言語モデル)の仕組みを数学的視点から解説します。トランスフォーマーモデルや勾配降下法といった技術をわかりやすく説明し、エンジニア向けにLLMの理解を深めるための基礎知識を提供します。
2024-10-02

LLM入門 - 数学で理解する大規模言語モデルの仕組み
大規模言語モデル(LLM)の基礎から応用までを初心者向けにわかりやすく解説。LLMの仕組み、トレーニング、活用方法を体系的に学べる入門ガイド。
2024-10-01
カテゴリー
検索履歴
会話履歴 688
エンジニア向け 382
マルコフ連鎖 364
注意メカニズム 356
自動要約 356
大規模言語モデル 354
生成型要約 353
NLP トランスフォーマー 349
パーソナライズドコンテンツ 345
教育AI 344
トークン化 342
言語モデル 339
ミニバッチ学習 335
数学的アプローチ 334
データ前処理 328
GPT テキスト生成 325
クロスエントロピー損失 318
LLM 要約 317
LLM テキスト生成 316
セルフアテンション 312
ロス計算 308
GPT-2 テキスト生成 305
トレーニング 305
バイアス 問題 304
線形代数 300
自動翻訳 299
自然言語処理 翻訳 295
コード生成 294
バッチサイズ 293
LLM リアルタイム処理 289
チーム

任 弘毅
株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田 昌平
開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。