LLM入門
合計 2 件の記事があります。
現在 1 ページ中の 1 ページ目です。

6.1 データセットの前処理 - トレーニングデータのクリーニングと最適化方法
LLM(大規模言語モデル)のトレーニングに使用されるデータセットの前処理手法を解説します。データのクリーニング、トークン化、バイアス軽減、サンプリングなど、効果的な学習のためのプロセスを紹介します。
2024-10-17

1.2 確率論の基本と対話生成|LLMの次単語予測を学ぶ
LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語|文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。
2024-10-04
カテゴリー
検索履歴
会話履歴 645
エンジニア向け 372
大規模言語モデル 344
自動要約 342
マルコフ連鎖 339
言語モデル 331
NLP トランスフォーマー 327
数学的アプローチ 323
注意メカニズム 322
生成型要約 322
データ前処理 320
パーソナライズドコンテンツ 316
トークン化 312
教育AI 312
LLM 要約 306
LLM テキスト生成 305
クロスエントロピー損失 301
ミニバッチ学習 299
ロス計算 299
トレーニング 293
GPT テキスト生成 292
GPT-2 テキスト生成 292
バイアス 問題 292
セルフアテンション 291
自動翻訳 290
バッチサイズ 285
自然言語処理 翻訳 285
線形代数 284
サンプリング 283
LLM リアルタイム処理 282
チーム

任 弘毅
株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田 昌平
開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。