LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 18 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第3章 — データセキュリティとプライバシー

『LLM Primer VII: AIセキュリティ』ウォークスルー第3回。データを固有のライフサイクルを持つ資産として扱う — モデルが部分的に記憶している訓練コーパスから、Samsung のエンジニアが名前が付く前にChatGPTに貼り付けたユーザー入力まで、という章です。

2026-05-12

第16章 — 本番環境でのコスト削減戦略

『LLM Primer VI』ウォークスルー最終回。前月の請求書の3分の1か半分に効いてくる直交する打ち手のカタログ。

2026-05-08

第15章 — サーバーレスAPI vs 専用インフラ

『LLM Primer VI』ウォークスルー第15回。損益分岐算術と、多くのチームにとって答えを傾けるプラットフォームエンジニアリングの行に名前をつける。

2026-05-07

第7章 — 高度なバッチング戦略

『LLM Primer VI』ウォークスルー第7回。バッチングは最適化ではなく、帯域律速のデコードを成立させる唯一の動き。バッチは名詞ではなく動詞である。

2026-04-29

第6章 — プルーニングと知識蒸留

『LLM Primer VI』ウォークスルー第6回。重み数を直接攻める章。無関係な重みをゼロにし、大きな教師の振る舞いを小さな生徒に転写する。Hopperの2:4スパース性、蒸留、そして3圧縮の順序。

2026-04-28

第2章 — KVキャッシュという課題

『LLM Primer VI』ウォークスルー第2回。重みより先にサービングクラスタのVRAMを食い尽くすデータ構造 — KVキャッシュ — の算式、アーキテクチャの変種、そしてナイーブな割当が同時実行数を壊す仕組み。

2026-04-24

LLM Primer VI — シリーズ序文と目次

『LLM Primer VI: AIシステムのスケーリング』ウォークスルー全16回の序文と目次。LLM推論をメモリ帯域、スケジューリング、そしてドルが交錯するエンジニアリング領域として扱う一冊の全体像。

2026-04-22

第9章 — 注意の予算管理

LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。

2026-04-07

第10章 — 主要な評価フレームワーク

LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。

2026-03-27

第3章 — アドバンスト・チャンキングのフレームワーク

LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。

2026-03-20

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM Primer シリーズ — Sho Shimoda による全7巻の生成AIフィールドガイド、ついに完結。基礎からセキュリティまで。姉妹編『Physical AI』も含む。全7巻がAmazonで販売中。

2026-02-15

5.2 コンテキストを保持したマルチターン会話の実装｜LLM活用ガイド

LLMを用いたコンテキストを保持したマルチターン会話の実装方法を紹介。FlaskとRedisを使用したスケーラブルなチャットボットの設計とPythonのサンプルコードを掲載。

2024-11-18

2.0 LLMモデルのファインチューニング｜Hugging Faceを使った効率的な微調整手法

Hugging FaceのTransformersライブラリを使用して、LLMのファインチューニングを行う方法を解説。トレーニングデータの準備から評価までの具体的な手順を紹介。

2024-11-05

1.3 LLM推論APIにおけるキャッシュ戦略｜高速化と負荷軽減のためのベストプラクティス

LLM推論APIのパフォーマンスを向上させるキャッシュ戦略について解説。Redisを使った具体的な実装例やキャッシュ最適化のベストプラクティスを紹介します。

2024-11-04

1.2 LLM推論APIのスケーリング｜水平スケーリング、ロードバランシング、キャッシュ戦略の実装

LLM推論APIのパフォーマンス向上方法を紹介します。水平スケーリング、ロードバランシング、Redisキャッシュ戦略を使用した効率的なAPI設計の実装例を解説。

2024-11-04

1.1 FlaskとFastAPIによるLLM APIの基本設計 | シンプルなPython API構築ガイド

FlaskとFastAPIを使用して、LLM（大規模言語モデル）APIの設計と実装を学びましょう。基本的なエンドポイントの作成、リクエスト処理、エラーハンドリングを含むシンプルなPythonガイドです。初心者から中級者まで、実践的なAPI構築に役立つ内容です。

2024-11-03

1.0 LLM API設計と実装ガイド | Flask & FastAPIチュートリアル

PythonフレームワークのFlaskやFastAPIを使ったLLM（大規模言語モデル）のAPI設計と実装方法を解説します。基本設計から、推論APIのスケーリング、キャッシュ戦略まで、効率的なLLM活用のための具体的な手法を紹介します。

2024-11-02

LLM入門：Pythonを用いたLLMアプリケーション構築ガイド | API設計、微調整、デプロイ

Pythonエンジニア向けに、LLM（大規模言語モデル）を活用したアプリケーションの構築方法を徹底解説。FlaskやFastAPIを使ったAPI設計、モデルの微調整（ファインチューニング）、データ前処理の自動化、推論速度の最適化、Docker/Kubernetesを使ったデプロイまで、実践的な内容をカバーします。

2024-11-01