LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 104 件の記事があります。 | 現在 3 ページ中の 1 ページ目です。

第17章 — 将来の脅威と新しい防御

『LLM Primer VII』ウォークスルー最終回、第17回。まだ形成途上の脅威群 — 自律エージェント、マルチモーダル攻撃面、合成アイデンティティ、2026年半ばのAI対AIのダイナミクス — を扱う章。そしてLLM Primerシリーズ全体を締めくくる回。

2026-05-26

第14章 — バイアス、公平性、責任あるAI

『LLM Primer VII』ウォークスルー第14回。責任あるAIを不確実性下の選択の集合として扱う章。バイアスの発生源、公平性メトリックの相互不整合、安全性と有用性のトレードオフ、そして組織のAIポリシーがその選択を担う層となる理由を追う。

2026-05-23

第12章 — アクセス制御とアイデンティティ

『LLM Primer VII: AIセキュリティ』第12章のウォークスルー。認証と認可、RBAC対ABAC、マルチテナント分離、レート制限、SSOやSCIMを含むエンタープライズガバナンスのオーバーレイ。モデル自身がプリンシパルとなる論点にも触れる。

2026-05-21

第11章 — 可観測性、ロギング、インシデントレスポンス

『LLM Primer VII: AIセキュリティ』第11章のウォークスルー。何をログすべきか、シグネチャ・統計・振る舞いを組み合わせた検知、NIST SP 800-61型のインシデントレスポンスをLLMシステムでどう回すか。OpenTelemetry GenAI規約が土台。

2026-05-20

第10章 — 安全なLLMアーキテクチャの設計

『LLM Primer VII: AIセキュリティ』第10章のウォークスルー。分離境界、階層化された検証、宣言的ポリシー、LLM呼び出しに適用されるゼロトラスト — モデルの自制ではなくアーキテクチャが被害範囲の上限を決める章。OPAとCedarにも触れる。

2026-05-19

第8章 — モデルへの敵対的攻撃

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第8回。Goodfellow 2014 の画像分類器研究から TextFooler や universal suffix、本番 API に対するモデル窃取まで、敵対的攻撃の系譜を辿る章。

2026-05-17

第7章 — ハルシネーションと信頼性

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第7回。信頼性をセキュリティ的性質として扱う章 — 正しさが結果を左右する場面では、自信満々に間違った出力そのものがセキュリティ問題だからだ。

2026-05-16

第5章 — 入力検証と出力フィルタリング

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第5回。第4章の多層緩和フレームを運用規律へと落とし込む章 — サニタイズ段階、ガードレール、構造化出力、レッドチーミング、そして意味のある安全性メトリクスの話。

2026-05-14

第4章 — プロンプトインジェクションとジェイルブレイク

『LLM Primer VII: AIセキュリティ』ウォークスルー第4回。実践的LLMセキュリティ問題の中心に位置する章 — なぜプロンプトインジェクションにはパラメータ化クエリに相当する構造的な修正がなく、多層の部分的防御しかないのかを説明します。

2026-05-13

第2章 — LLMシステムの脅威モデリング

『LLM Primer VII: AIセキュリティ』ウォークスルー第2回。Shostack の4つの問い、STRIDE、PASTA、MITRE ATLAS を、あらゆる入力を潜在的な指示として読む確率的関数を最も強力な構成要素として持つシステムに適用する、という章です。

2026-05-11

第1章 — AIセキュリティがこれまでと違う理由

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルー、第1回。AIセキュリティは既存セキュリティにML形容詞を付けたものではない — 基盤が変わり、以後のすべての章がその変化から派生する、という章です。

2026-05-10

第16章 — 本番環境でのコスト削減戦略

『LLM Primer VI』ウォークスルー最終回。前月の請求書の3分の1か半分に効いてくる直交する打ち手のカタログ。

2026-05-08

第15章 — サーバーレスAPI vs 専用インフラ

『LLM Primer VI』ウォークスルー第15回。損益分岐算術と、多くのチームにとって答えを傾けるプラットフォームエンジニアリングの行に名前をつける。

2026-05-07

第14章 — トークン経済とAPI価格

『LLM Primer VI』ウォークスルー第14回。第1章の物理を請求書の項目につなぐ章。初月の請求書がなぜチームがモデル化したものと似ていないかを説明する。

2026-05-06

第13章 — オートスケーリングとコールドスタート対策

『LLM Primer VI』ウォークスルー第13回。標準HPAがLLMで障害を出す理由と、KEDA、Knative、CRIUがどう修正を構成するかを説明する章。

2026-05-05

第12章 — 分離型サービングとKubernetes

『LLM Primer VI』ウォークスルー第12回。プリフィルとデコードを別GPUプールに分割し、KVキャッシュをNVLink/InfiniBand上で運ぶ。ポッドを正しい側に留めるKubernetesのプリミティブ。

2026-05-04

第11章 — プラットフォームとオーケストレーション層

『LLM Primer VI』ウォークスルー第11回。プラットフォームの選択はフィーチャーではなく、どの運用モデルがチームの既存文化に合うかの問題である。

2026-05-03

第10章 — LLMエンジン層

『LLM Primer VI』ウォークスルー第10回。エンジンとプラットフォームの境界に名前をつけ、2026年のスタックを支配する5つのエンジンを歩く。ベンチマークではなく機構で選ぶ。

2026-05-02

第9章 — 投機的デコード

『LLM Primer VI』ウォークスルー第9回。自己回帰の逐次ボトルネックには数学的な抜け穴がある。安価な推測と少し広い検証パスで、ターゲットモデルが1トークン分の実時間で数トークンを生む。

2026-05-01

第8章 — 次世代のKVキャッシュ管理

『LLM Primer VI』ウォークスルー第8回。OSのページングをKVキャッシュに持ち込む章。PagedAttention、H2Oエビクション、InfiniGen、そしてプレフィックスキャッシュ経済圏。

2026-04-30

第7章 — 高度なバッチング戦略

『LLM Primer VI』ウォークスルー第7回。バッチングは最適化ではなく、帯域律速のデコードを成立させる唯一の動き。バッチは名詞ではなく動詞である。

2026-04-29

第6章 — プルーニングと知識蒸留

『LLM Primer VI』ウォークスルー第6回。重み数を直接攻める章。無関係な重みをゼロにし、大きな教師の振る舞いを小さな生徒に転写する。Hopperの2:4スパース性、蒸留、そして3圧縮の順序。

2026-04-28

第5章 — 量子化を解き明かす

『LLM Primer VI』ウォークスルー第5回。70Bモデルが4ビット量子化を生き延び1Bが生き延びない理由、そしてAWQ、GPTQ、SmoothQuant、GGUFの実体とレシピの選び方。

2026-04-27

第4章 — 専用AIシリコンとASIC

『LLM Primer VI』ウォークスルー第4回。GPUかASICかの選択はワークロード形状の問題であり、Groq、Inferentia2、TPU、Gaudi 3のそれぞれが勝つ領域と失敗モードを歩く。

2026-04-26

第3章 — 生成AI向けのデータセンターGPU

『LLM Primer VI』ウォークスルー第3回。サービングGPUはFLOP/sではなくHBM帯域とVRAM容量で買うべきだと論じる章。H100、H200、B200、L40S、MI300Xを機構優先で読み解く。

2026-04-25

第2章 — KVキャッシュという課題

『LLM Primer VI』ウォークスルー第2回。重みより先にサービングクラスタのVRAMを食い尽くすデータ構造 — KVキャッシュ — の算式、アーキテクチャの変種、そしてナイーブな割当が同時実行数を壊す仕組み。

2026-04-24

第1章 — トークン生成のメカニズム

『LLM Primer VI』ウォークスルー第1回。LLMサービングの難問はほぼ全て一つの事実から派生する — トークンを生み出すループはメモリ帯域律速で、購入した高価な演算能力は99.7パーセント遊んでいる。

2026-04-23

LLM Primer VI — シリーズ序文と目次

『LLM Primer VI: AIシステムのスケーリング』ウォークスルー全16回の序文と目次。LLM推論をメモリ帯域、スケジューリング、そしてドルが交錯するエンジニアリング領域として扱う一冊の全体像。

2026-04-22

第8章 — パフォーマンス・サービング・コストの最適化

『LLM Primer V』ウォークスルー最終回。本番LLMの経済を、層をなす規律として扱う回。最も安い呼び出しは決してされないもの、次に安いのは十分なもののうち最も小さいモデルへの呼び出し、床は推論サーバ内のKVキャッシュ・連続バッチ・投機的デコーディング。

2026-04-21

第7章 — LLMセキュリティとガードレール

『LLM Primer V』ウォークスルー第7回。LLMアプリケーションが持ち込む新しいセキュリティ軸 — どこから、どれだけの権威を伴った指示がモデルに届くかを制御する軸 — を名指しし、その周りに4層の緩和マトリクスを組み立てる回。

2026-04-20

第6章 — AIオブザーバビリティとトレーシング

『LLM Primer V』ウォークスルー第6回。ユーザークエリを要求ログではなく因果木として扱い、その木を可読にするためにトレースすべきものを示す回。OpenTelemetryのGenAIコンベンション、TTFT/TPOT/コスト/品質という指標、そして評価への還流ループ。

2026-04-19

第3章 — 検索拡張生成 (RAG)

『LLM Primer V』ウォークスルー第3回。RAGパイプラインを端から端まで歩き、10件のお気に入り文書で動くデモを、実運用のコーパスに耐えるシステムから分ける技法 — ハイブリッド検索、構造的チャンキング、HyDE、step-back、text-to-SQL — をまとめる。

2026-04-16

第2章 — 基盤モデルとプロンプト設計

『LLM Primer V』ウォークスルー第2回。プロンプトエンジニアリングを芸ではなく工学として扱う回。モデル階層、サンプリングパラメータの2つのプロファイル、防御的プロンプトの5部構成、そして構造化出力・制約付きデコーディング。

2026-04-15

第12章 — プロトコルの堅牢化と防御

LLM Primer IV ウォークスルー第12回。4つの防御クラスタ — 暗号アテステーション、境界付きセッション付きOAuthスコープ規律、ランタイム・サンドボックス、Human-in-the-loopゲート — を組み合わせることで、敵対的条件下でモデルが正しく振る舞うことに依存しない姿勢を作る。

2026-04-10

第10章 — 長期タスクの記憶

LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。

2026-04-08

第9章 — 注意の予算管理

LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。

2026-04-07

第8章 — アーキテクチャ的デプロイメント・レイアウト

LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。

2026-04-06

第7章 — 高度な協働・動的パターン

LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。

2026-04-05

第6章 — オーケストレーションの基本

LLM Primer IV ウォークスルー第6回。オーケストレーションの基本形 — 逐次パイプラインと並行スキャッタ・ギャザー — と、その前にチームが問うべき前提の問い: そもそもマルチ・エージェントが正解か。

2026-04-04

第5章 — トランスポートプロトコルとディスカバリ

LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。

2026-04-03

第3章 — サーバープリミティブ: コンテキストと能力の公開

LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。

2026-04-01

第1章 — AI統合の危機と、エージェント型アーキテクチャの台頭

LLM Primer IV ウォークスルー第1回。長いシステムプロンプトがモノリシック・エージェントを壊す理由、その下に隠れているN×Mの統合問題、そしてMCPが下支えするように作られた「プロンプト工学からコンテキスト工学へ」の移行を歩きます。

2026-03-30

第9章 — RAG評価トライアド

LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。

2026-03-26

第8章 — RAGパイプラインにおけるデータ匿名化

LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。

2026-03-25

第6章 — RAGの脅威モデルと脆弱性

LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。

2026-03-23

第5章 — 検索パイプラインの設計

LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。

2026-03-22

第3章 — アドバンスト・チャンキングのフレームワーク

LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。

2026-03-20

第2章 — インテリジェント文書パース

LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。

2026-03-19

第1章 — RAGアーキテクチャの進化

LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。

2026-03-18

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

1 ページ目 / 3 ページ