LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 8 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第11章 — プラットフォームとオーケストレーション層

『LLM Primer VI』ウォークスルー第11回。プラットフォームの選択はフィーチャーではなく、どの運用モデルがチームの既存文化に合うかの問題である。

2026-05-03

『LLM Primer VI』ウォークスルー第10回。エンジンとプラットフォームの境界に名前をつけ、2026年のスタックを支配する5つのエンジンを歩く。ベンチマークではなく機構で選ぶ。

2026-05-02

『LLM Primer VI』ウォークスルー第9回。自己回帰の逐次ボトルネックには数学的な抜け穴がある。安価な推測と少し広い検証パスで、ターゲットモデルが1トークン分の実時間で数トークンを生む。

2026-05-01

『LLM Primer VI』ウォークスルー第3回。サービングGPUはFLOP/sではなくHBM帯域とVRAM容量で買うべきだと論じる章。H100、H200、B200、L40S、MI300Xを機構優先で読み解く。

2026-04-25

『LLM Primer VI: AIシステムのスケーリング』ウォークスルー全16回の序文と目次。LLM推論をメモリ帯域、スケジューリング、そしてドルが交錯するエンジニアリング領域として扱う一冊の全体像。

2026-04-22

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

LLMの推論速度を改善するための技術を解説。バッチ推論、ONNX Runtime、半精度推論（FP16）など、効率的な推論手法とその実装例を紹介します。

2024-11-14

LLMのモデル圧縮技術と推論速度の最適化手法を解説。量子化、知識蒸留、ONNXを使用したPython実装例で効率的なLLMのデプロイをサポート。

2024-11-12