LLM入門


合計 2 件の記事があります。 現在 1 ページ中の 1 ページ目です。

3.2 LLMのデータクレンジング自動化|Pythonでの効率的なノイズ除去と前処理

LLMのトレーニングにおけるデータクレンジングの重要性とその自動化手法を解説。Pythonコード例で、HTMLタグの除去、ストップワードの削除、正規化などの基本的なクレンジングプロセスを紹介します。
2024-11-11

3.1 LLMのデータセットと前処理 | データクリーニングとトークナイゼーションの重要性

LLM(大規模言語モデル)のトレーニングに必要なデータセットと前処理をエンジニア向けに解説。データのノイズ除去、トークナイゼーション、正規化、データバランスの取り方について詳しく説明します。
2024-09-12