LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 40 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第17章 — 将来の脅威と新しい防御

『LLM Primer VII』ウォークスルー最終回、第17回。まだ形成途上の脅威群 — 自律エージェント、マルチモーダル攻撃面、合成アイデンティティ、2026年半ばのAI対AIのダイナミクス — を扱う章。そしてLLM Primerシリーズ全体を締めくくる回。

2026-05-26

第11章 — 可観測性、ロギング、インシデントレスポンス

『LLM Primer VII: AIセキュリティ』第11章のウォークスルー。何をログすべきか、シグネチャ・統計・振る舞いを組み合わせた検知、NIST SP 800-61型のインシデントレスポンスをLLMシステムでどう回すか。OpenTelemetry GenAI規約が土台。

2026-05-20

第7章 — ハルシネーションと信頼性

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第7回。信頼性をセキュリティ的性質として扱う章 — 正しさが結果を左右する場面では、自信満々に間違った出力そのものがセキュリティ問題だからだ。

2026-05-16

第6章 — RAG のリスク

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第6回。検索コーパスを非信頼な入力チャネルとして扱う章 — 索引された文書はすべて、モデルから見ればユーザーの質問と同格の命令だからだ。

2026-05-15

第5章 — 入力検証と出力フィルタリング

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第5回。第4章の多層緩和フレームを運用規律へと落とし込む章 — サニタイズ段階、ガードレール、構造化出力、レッドチーミング、そして意味のある安全性メトリクスの話。

2026-05-14

第3章 — データセキュリティとプライバシー

『LLM Primer VII: AIセキュリティ』ウォークスルー第3回。データを固有のライフサイクルを持つ資産として扱う — モデルが部分的に記憶している訓練コーパスから、Samsung のエンジニアが名前が付く前にChatGPTに貼り付けたユーザー入力まで、という章です。

2026-05-12

第1章 — AIセキュリティがこれまでと違う理由

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルー、第1回。AIセキュリティは既存セキュリティにML形容詞を付けたものではない — 基盤が変わり、以後のすべての章がその変化から派生する、という章です。

2026-05-10

LLM Primer VII — シリーズ序文 & インデックス

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルーのインデックス。シリーズ最終巻は、LLMシステムを敵対者・規制・確率的挙動から守る規律を、脅威モデルから規制の境界線まで一気に書き下ろします。

2026-05-09

第8章 — 次世代のKVキャッシュ管理

『LLM Primer VI』ウォークスルー第8回。OSのページングをKVキャッシュに持ち込む章。PagedAttention、H2Oエビクション、InfiniGen、そしてプレフィックスキャッシュ経済圏。

2026-04-30

第4章 — 専用AIシリコンとASIC

『LLM Primer VI』ウォークスルー第4回。GPUかASICかの選択はワークロード形状の問題であり、Groq、Inferentia2、TPU、Gaudi 3のそれぞれが勝つ領域と失敗モードを歩く。

2026-04-26

第4章 — AIエージェントとツール呼び出し

『LLM Primer V』ウォークスルー第4回。エージェントを、スキーマ・メモリ層・マルチエージェント配線を工学的に組み立てられて初めて信頼できる「ツールに対してループするLLM」として扱う回。ReAct、契約としてのツールスキーマ、短期/長期/意味の3層メモリ。

2026-04-17

シリーズ序文と目次 — LLM Primer V

『LLM Primer V: 実運用のLLMアプリケーションを設計する』のウォークスルー序文。AIエンジニアリングを一つの規律として扱い、基盤モデル・プロンプト・検索・エージェント・評価・オブザーバビリティ・セキュリティ・サービングの8つの面を歩く8章構成の全体像を示す。

2026-04-13

第10章 — 長期タスクの記憶

LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。

2026-04-08

第9章 — 注意の予算管理

LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。

2026-04-07

第8章 — アーキテクチャ的デプロイメント・レイアウト

LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。

2026-04-06

LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス

LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。

2026-03-29

第11章 — 継続的なアップデートとパイプライン最適化

LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。

2026-03-28

第8章 — RAGパイプラインにおけるデータ匿名化

LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。

2026-03-25

第7章 — アクセス制御の実装

LLM Primer III ウォークスルー第7回。基盤としての文書単位ACL、Microsoft Purview の機密ラベルと統合する RBAC、Zanzibar と SpiceDB による ReBAC、そしてそれらすべての下で動く「事前フィルタ vs 事後フィルタ」の規律。

2026-03-24

第6章 — RAGの脅威モデルと脆弱性

LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。

2026-03-23

第5章 — 検索パイプラインの設計

LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。

2026-03-22

第4章 — 適切なベクトルデータベースの選定

LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。

2026-03-21

第1章 — RAGアーキテクチャの進化

LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。

2026-03-18

LLM Primer III — シリーズ紹介とインデックス

LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。

2026-03-17

第14章 — エンジニアのための実践的知識

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

第12章 — 自分の LLM システムを構築する: データセットから本番まで

LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。

2026-03-01

第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸

LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。

2026-02-28

第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント

LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。

2026-02-25

第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル

LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。

2026-02-24

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM Primer シリーズ — Sho Shimoda による全7巻の生成AIフィールドガイド、ついに完結。基礎からセキュリティまで。姉妹編『Physical AI』も含む。全7巻がAmazonで販売中。

2026-02-15

RAG時代の設計者とは？検索と生成をつなぎ、AIを業務に根づかせる方法｜LLM入門終章

RAGの本質は、情報の選別と構造化を通じて生成AIの文脈を設計すること。本章では、生成AI時代に求められる「検索と生成をつなぐ設計者」の役割と、今後の学びと実装の地図を示します。

2025-03-08

RAGは今後も必要か？生成AI時代における検索設計の価値と使い続ける理由｜LLM入門 7.4

長文処理に優れたLLMが登場する中で、RAGを使い続ける意味とは何か。本記事では、情報制御・更新性・出典明示・組織ナレッジ活用という観点から、RAGの価値と今後の活かし方を再評価します。

2025-03-07

RAGを強化するハイブリッド検索とMulti-Vector戦略とは？検索の多視点化と精度向上の設計｜LLM入門 7.2

意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。

2025-03-05

LlamaIndexとは何か？RAGにおける文書インデックス構築の強みとLangChainとの違い｜LLM入門 5.3

LlamaIndexは、RAGの文書処理とインデックス管理に特化したライブラリです。本記事では、LlamaIndexの設計思想と主要機能、LangChainとの違いや併用パターン、実務での活用シーンを丁寧に解説します。

2025-02-24

RAGは何に向いている？生成AIの得意・不得意を整理｜LLM入門 2.4

RAGは社内ナレッジ検索やFAQ応答に優れた効果を発揮しますが、数値計算やリアルタイム情報の処理には課題もあります。本記事では、RAGが得意なユースケースと不得意な場面を丁寧に解説し、導入判断の視点を提供します。

2025-02-10

RAGと従来の検索の違いとは？意味ベース検索と生成の融合を解説｜LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

RAGとは？検索と生成を組み合わせた新しいAIの仕組み｜LLM入門 2.1

RAG（Retrieval-Augmented Generation）は、外部知識を検索してLLMの応答に活かす次世代アーキテクチャです。本記事では、RAGの基本フローや構成要素、従来の生成AIとの違いを図解的にわかりやすく解説します。

2025-02-07

RAGとは何か？検索と生成をつなぐ新しいAIアーキテクチャの全体像｜LLM入門第2章

RAG（Retrieval-Augmented Generation）は、検索と生成を組み合わせた新しい生成AIの構造です。本章では、RAGの基本構造、RetrieverとGeneratorの役割、従来の検索との違い、得意・不得意なケースまで、全体像を体系的に解説します。

2025-02-06

なぜRAGが必要とされるのか？｜業務利用で見える生成AIの限界とは｜LLM入門 1.2

ChatGPTを業務に導入しようとすると、正確性・柔軟性・更新性に課題が見えてきます。本記事では、企業利用における生成AIの限界と、RAG（Retrieval-Augmented Generation）という新たなアプローチの登場背景を解説します。

2025-02-04