LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 58 件の記事があります。 | 現在 2 ページ中の 1 ページ目です。

第11章 — 可観測性、ロギング、インシデントレスポンス

『LLM Primer VII: AIセキュリティ』第11章のウォークスルー。何をログすべきか、シグネチャ・統計・振る舞いを組み合わせた検知、NIST SP 800-61型のインシデントレスポンスをLLMシステムでどう回すか。OpenTelemetry GenAI規約が土台。

2026-05-20

第4章 — プロンプトインジェクションとジェイルブレイク

『LLM Primer VII: AIセキュリティ』ウォークスルー第4回。実践的LLMセキュリティ問題の中心に位置する章 — なぜプロンプトインジェクションにはパラメータ化クエリに相当する構造的な修正がなく、多層の部分的防御しかないのかを説明します。

2026-05-13

第1章 — AIセキュリティがこれまでと違う理由

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルー、第1回。AIセキュリティは既存セキュリティにML形容詞を付けたものではない — 基盤が変わり、以後のすべての章がその変化から派生する、という章です。

2026-05-10

LLM Primer VII — シリーズ序文 & インデックス

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルーのインデックス。シリーズ最終巻は、LLMシステムを敵対者・規制・確率的挙動から守る規律を、脅威モデルから規制の境界線まで一気に書き下ろします。

2026-05-09

第5章 — 量子化を解き明かす

『LLM Primer VI』ウォークスルー第5回。70Bモデルが4ビット量子化を生き延び1Bが生き延びない理由、そしてAWQ、GPTQ、SmoothQuant、GGUFの実体とレシピの選び方。

2026-04-27

第2章 — KVキャッシュという課題

『LLM Primer VI』ウォークスルー第2回。重みより先にサービングクラスタのVRAMを食い尽くすデータ構造 — KVキャッシュ — の算式、アーキテクチャの変種、そしてナイーブな割当が同時実行数を壊す仕組み。

2026-04-24

第2章 — 基盤モデルとプロンプト設計

『LLM Primer V』ウォークスルー第2回。プロンプトエンジニアリングを芸ではなく工学として扱う回。モデル階層、サンプリングパラメータの2つのプロファイル、防御的プロンプトの5部構成、そして構造化出力・制約付きデコーディング。

2026-04-15

第1章 — AIエンジニアリングという規律

『LLM Primer V』ウォークスルー第1回。デモと本番の信頼性ギャップを名指しし、確率的な核を決定論的なラッパーで包む工学 — AIエンジニアリング — の枠組みと、信頼性・品質・パフォーマンス・コスト・進化の5つの柱を歩く。

2026-04-14

第14章 — ベンチマーク、テスト、性能

LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。

2026-04-12

第3章 — サーバープリミティブ: コンテキストと能力の公開

LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。

2026-04-01

第5章 — 検索パイプラインの設計

LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。

2026-03-22

第9章 — スケールでの学習

LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。

2026-03-11

第8章 — モデルはどう学ぶか

LLM Primer II シリーズの第8章を紹介します。古典的な統計学習理論が「過学習するはず」と告げる規模で、なぜ大規模モデルは汎化してしまうのか。勾配降下法の暗黙的バイアス、スケーリング則、そして「まだ分かっていないこと」を、控えめに整理します。

2026-03-10

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第3章 — 数学的な道具立て

LLM Primer II シリーズの第3章です。本書が必要とする確率と線形代数を、必要な分量で、必要な順番で並べさせていただく短い章。最尤推定としての訓練、ベクトル空間と埋め込み、そして Attention への橋渡し。

2026-03-05

第2章 — LLM を文脈に置く

LLM Primer II シリーズの第2章です。前作『LLM Primer』の素朴な物語と、本書の数学とを橋渡しする章。LLM とはなにか、事前学習・パラメータ・スケール、データとしての言語、そしてトランスフォーマーが風景を塗り替えた理由。

2026-03-04

第1章 — 言語モデルのための数学的直観

LLM Primer II シリーズの第1章です。数式と読み手とのあいだに立っている「壁」を、そっと脇に避けるところから始めます。記号、言語生成のための確率、そして不確かさを測るためのエントロピー。

2026-03-03

第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸

LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。

2026-02-28

第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ

LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。

2026-02-26

第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ

LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。

2026-02-23

第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト

LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。

2026-02-22

第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身

LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。

2026-02-21

第2章 — 確率、トークン、テキスト: 次の単語を当てるゲーム

LLM Primer I シリーズの第2章です。LLM がテキストをトークンに変換する仕組み、なぜ言語モデリングが本質的に確率の問題なのか、そして昔の n-gram アプローチが汎化できるニューラルモデルにどう道を譲ったかを解説します。パープレキシティのやさしい言葉での説明と、トークン境界がなぜ重要かも扱います。

2026-02-19

第1章 — 大規模言語モデルとは何か (見出しの先へ)

LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。

2026-02-18

マルチセッションとユーザー管理とは？｜MCP入門 4.3｜生成AIで複数会話と文脈を自在に制御する方法

一人のユーザーが複数の会話・プロジェクト・目的を同時に扱う時代において、セッション分離と状態復元は不可欠です。本章では、MCPを活用したマルチセッション設計、履歴管理、テンプレート切替、セキュリティまでを詳しく解説します。

2025-03-20

OpenAI Function CallingとMCPの関係とは？｜MCP入門 2.4｜生成AIの構造化出力と実装設計

OpenAIのFunction Callingは、生成AIが構造化された出力を返す仕組みです。MCP（Model Context Protocol）の文脈・状態設計と深く関係し、再現性や拡張性の高いAI実装を支えます。本節ではその原理と設計のポイントを丁寧に解説します。

2025-03-11

RAGは本当に不要になるのか？長文対応LLM時代の検索戦略を再考する｜LLM入門 7.3

GPT-4 128kやClaude 2の登場により、「検索せず全文渡す」構成が可能になってきました。本記事ではRetrieval不要論の背景と現実的な限界、そしてRAGの再定義について丁寧に解説します。

2025-03-06

7.2 LLMの省リソーストレーニング技術 | 蒸留、量子化、スパース化、分散トレーニング

LLMのトレーニングにおける省リソース技術を解説。モデル蒸留、量子化、スパース化、分散トレーニングの手法でコストを削減しながら性能を維持する方法を紹介します。

2024-11-25

7.1 LLMの大規模モデル進化 | 性能向上と技術的課題

LLMの大規模モデル化による性能向上と、計算リソースやトレーニングコストの課題を解説。エンジニアが対応すべき技術と今後の展望を紹介します。

2024-11-25

6.2 LLMモデルのバージョニングとモニタリング | MLflowとPrometheusを活用

LLMモデルの管理を効率化するためのバージョニングとモニタリング手法を解説。MLflowでモデルをバージョン管理し、PrometheusとGrafanaでリアルタイムにパフォーマンスを監視します。

2024-11-22

4.3 LLMのモデル圧縮技術｜知識蒸留、量子化、プルーニングの解説

知識蒸留、量子化、プルーニングなどのモデル圧縮技術を使い、LLMの計算コストと推論速度を改善する方法を解説します。Pythonの実装例も紹介。

2024-11-15

4.1 LLMのモデル圧縮技術｜効率的な量子化と知識蒸留

LLMのモデル圧縮技術を解説。量子化、知識蒸留、プルーニングの実装例を紹介し、推論速度とリソース効率を向上させる方法を学びます。

2024-11-13

4.0 LLMのモデル圧縮と推論速度の最適化｜効率的なパフォーマンス改善

LLMのモデル圧縮技術と推論速度の最適化手法を解説。量子化、知識蒸留、ONNXを使用したPython実装例で効率的なLLMのデプロイをサポート。

2024-11-12

9.1 LLMを理解するための次のステップ - 実践的な学習方法とプロジェクト参加のすすめ

LLM（大規模言語モデル）の基礎を学んだエンジニアが、さらなる学びを進めるための次のステップを紹介します。研究論文の精読、実践的プロジェクトの参加、モデルのカスタマイズや最適化手法について詳しく解説します。

2024-10-26

8.1 モデルサイズと計算コスト - LLMの効率的な運用とコスト削減の技術

LLM（大規模言語モデル）のモデルサイズと計算コストに関する課題を解説し、量子化やプルーニングなどのモデル圧縮技術や、分散学習を通じたトレーニングコスト削減の方法を紹介します。

2024-10-23

8.0 LLMにおける課題と今後の展望 - バイアス、計算リソース、プライバシーの問題と解決策

LLM（大規模言語モデル）が直面する課題と、今後の技術的な進展について解説します。計算リソース、データバイアス、解釈可能性、プライバシーの課題を克服するための取り組みと今後の展望を紹介します。

2024-10-22

6.2 ミニバッチ学習と計算効率 - 大規模データセットの効率的なトレーニング手法

ミニバッチ学習は、大規模データセットを効率的にトレーニングするための手法です。計算効率の向上、学習率の調整、バッチサイズの最適化など、効率的なモデル構築を支える技術について解説します。

2024-10-18

6.0 大規模データセットとLLMトレーニングの実際 - データ収集、前処理、トレーニング方法

LLM（大規模言語モデル）のトレーニングには、膨大なデータセットと計算リソースが必要です。データ収集から前処理、トレーニング手法、評価方法までを詳しく解説します。

2024-10-16

5.2 勾配降下法とバックプロパゲーション - LLMのトレーニング手法の解説

勾配降下法とバックプロパゲーションは、LLM（大規模言語モデル）のトレーニングにおける重要な手法です。損失関数の勾配を効率的に計算し、モデルのパラメータを最適化するプロセスを詳しく解説します。

2024-10-15

5.1 損失関数の重要性 - LLMにおけるモデル最適化のカギ

損失関数は、モデルの最適化において重要な役割を果たし、LLMの精度向上に寄与します。クロスエントロピー損失関数や過学習、学習不足の検出に役立つ損失関数の仕組みを解説します。

2024-10-14

5.0 勾配降下法とモデル最適化 - LLMのトレーニング手法解説

勾配降下法は、LLM（大規模言語モデル）のトレーニングにおける重要な最適化手法です。クロスエントロピー損失やミニバッチ勾配降下法、勾配クリッピングを使ってモデルの精度を向上させる仕組みを解説します。

2024-10-13

3.1 確率論と統計 - LLMにおける言語生成と予測の基礎

確率論と統計は、LLMの言語生成や次の単語の予測において重要な役割を果たします。n-gramモデル、マルコフ連鎖、最大尤度推定（MLE）など、LLMの予測精度を向上させる数理的手法について解説します。

2024-10-09

LLMの構成要素とは？｜LLM入門 2.2｜トークン・ベクトル・パラメータで理解する内部構造

LLM（大規模言語モデル）の内部で何が起きているのか？本記事では、トークン化・埋め込み（Embedding）・パラメータ・アーキテクチャなど、モデルを構成する基本要素をわかりやすく解説します。自然言語を数値で処理するAIの仕組みを学びましょう。

2024-10-06

2.0 LLMの基本 ―「なぜLLMはここまで注目されているのか？」を整理

本記事では、LLMの基礎概念として、自然言語処理（NLP）の概要とトランスフォーマーモデルの仕組みについて詳しく説明します。LLMがどのようにして膨大なデータを処理し、高精度な結果を出すのかを理解します。

2024-10-06

7.2 省リソースでのLLMトレーニング | モデル蒸留、量子化、分散トレーニングの手法

LLM（大規模言語モデル）を省リソースでトレーニングするための技術を解説。モデル蒸留、量子化、分散トレーニング、データ効率の改善など、エンジニア向けにリソース削減のための手法を紹介します。

2024-09-29

7.1 LLMの大規模モデル進化 | モデルサイズの拡大とその課題、技術的アプローチ

LLM（大規模言語モデル）の進化について解説。モデルサイズの急速な拡大とそれに伴う課題、そして効率的なトレーニング手法や量子化技術など、技術的なアプローチを紹介します。

2024-09-28

7.0 LLMの未来の展望と課題 | モデル進化、省リソース、マルチモーダル統合

LLM（大規模言語モデル）の未来の発展と課題をエンジニア向けに解説。モデルの拡大、省リソーストレーニング、マルチモーダルモデルとの統合、データ倫理、法的規制など、技術的・倫理的な課題を詳述します。

2024-09-27

5.3 LLMのリアルタイム使用における課題 | レイテンシとスケーラビリティの対策

LLM（大規模言語モデル）をリアルタイムで使用する際の課題と対策をエンジニア向けに解説。レイテンシの低減やスケーラビリティの確保、モデル最適化の手法について詳述します。

2024-09-23

5.2 LLMの計算リソースとコストの課題 | 最適化手法とクラウド活用

LLM（大規模言語モデル）の運用に伴う計算リソースとコストの課題をエンジニア向けに解説。モデル圧縮、量子化、分散トレーニングなどの最適化手法や、クラウドサービスを活用した効率的なリソース管理の方法について紹介。

2024-09-22

5.0 LLMを使う際の注意点 | バイアス、リソース、リアルタイム処理の課題

LLM（大規模言語モデル）を使用する際の注意点についてエンジニア向けに解説。バイアスや倫理的問題、計算リソースとコスト、リアルタイムでの使用における技術的な課題について詳述。

2024-09-20

1 ページ目 / 2 ページ