LLM入門

合計 2 件の記事があります。現在 1 ページ中の 1 ページ目です。

6.1 データセットの前処理 - トレーニングデータのクリーニングと最適化方法

LLM（大規模言語モデル）のトレーニングに使用されるデータセットの前処理手法を解説します。データのクリーニング、トークン化、バイアス軽減、サンプリングなど、効果的な学習のためのプロセスを紹介します。

2024-10-17

1.2 確率論の基本と対話生成｜LLMの次単語予測を学ぶ

LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語｜文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。

2024-10-04

カテゴリー

LLM入門：RAGで強化する生成

MCP入門：AIに文脈を理解させる技術

LLM入門 X 数学

LLM入門（上）実践Python

LLM入門（上）

LLM入門しくみから学ぶ生成AIの基礎

タグ

LLM 36 RAG 35 LLM 26 MCP 23 LangChain 18 Python 17 プロンプト設計 17 生成AI 17 自然言語処理 13 モデルコンテキストプロトコル 9

検索履歴

会話履歴 645 エンジニア向け 372 大規模言語モデル 344 自動要約 342 マルコフ連鎖 339 言語モデル 331 NLP トランスフォーマー 327 数学的アプローチ 323 注意メカニズム 322 生成型要約 322 データ前処理 320 パーソナライズドコンテンツ 316 トークン化 312 教育AI 312 LLM 要約 306 LLM テキスト生成 305 クロスエントロピー損失 301 ミニバッチ学習 299 ロス計算 299 トレーニング 293 GPT テキスト生成 292 GPT-2 テキスト生成 292 バイアス問題 292 セルフアテンション 291 自動翻訳 290 バッチサイズ 285 自然言語処理翻訳 285 線形代数 284 サンプリング 283 LLM リアルタイム処理 282

チーム

任弘毅

株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。