LLM入門
このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。
第12章 — プロトコルの堅牢化と防御
LLM Primer IV ウォークスルー第12回。4つの防御クラスタ — 暗号アテステーション、境界付きセッション付きOAuthスコープ規律、ランタイム・サンドボックス、Human-in-the-loopゲート — を組み合わせることで、敵対的条件下でモデルが正しく振る舞うことに依存しない姿勢を作る。
2026-04-10第10章 — 長期タスクの記憶
LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。
2026-04-08第11章 — 継続的なアップデートとパイプライン最適化
LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。
2026-03-28第10章 — 主要な評価フレームワーク
LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。
2026-03-27第9章 — RAG評価トライアド
LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。
2026-03-26第8章 — RAGパイプラインにおけるデータ匿名化
LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。
2026-03-25第7章 — アクセス制御の実装
LLM Primer III ウォークスルー第7回。基盤としての文書単位ACL、Microsoft Purview の機密ラベルと統合する RBAC、Zanzibar と SpiceDB による ReBAC、そしてそれらすべての下で動く「事前フィルタ vs 事後フィルタ」の規律。
2026-03-24第6章 — RAGの脅威モデルと脆弱性
LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。
2026-03-23第5章 — 検索パイプラインの設計
LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。
2026-03-22第4章 — 適切なベクトルデータベースの選定
LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。
2026-03-21第3章 — アドバンスト・チャンキングのフレームワーク
LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。
2026-03-20第2章 — インテリジェント文書パース
LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。
2026-03-19第1章 — RAGアーキテクチャの進化
LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。
2026-03-18LLM Primer III — シリーズ紹介とインデックス
LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。
2026-03-17第12章 — LLM の実世界応用
LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。
2026-03-14第11章 — 評価、キャリブレーション、推論
LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。
2026-03-13第7章 — 効率と Transformer の派生
LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。
2026-03-09第5章 — 位置、順序、系列の構造
LLM Primer II シリーズの第5章をご紹介させていただきます。Attention が抱えていた「順序を見ない」という静かな不具合を、正弦波エンコーディング、相対位置、RoPE、そして Fourier の視点から控えめにたどってまいります。
2026-03-07第4章 — Attention
LLM Primer II シリーズの第4章をご紹介させていただきます。Attention を直観から導出し、クエリ・キー・バリューの幾何、softmax の温度、マルチヘッド構造、そして Attention をカーネル法として読み直す視点まで、控えめに歩いてまいります。
2026-03-06第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル
LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。
2026-02-24RAGとの統合設計とは?|MCP入門 4.1|生成AIの文脈構築を強化する検索補助付き設計
RAG(検索補助付き生成)は、生成AIに最新情報や社内知識を与える鍵です。本章では、MCPとの接続方法、FAQ注入、要約統合、テンプレートとの連携など、RAGとコンテキスト設計を統合する具体的手法を紹介します。
2025-03-18RAGは今後も必要か?生成AI時代における検索設計の価値と使い続ける理由|LLM入門 7.4
長文処理に優れたLLMが登場する中で、RAGを使い続ける意味とは何か。本記事では、情報制御・更新性・出典明示・組織ナレッジ活用という観点から、RAGの価値と今後の活かし方を再評価します。
2025-03-07RAGを強化するハイブリッド検索とMulti-Vector戦略とは?検索の多視点化と精度向上の設計|LLM入門 7.2
意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。
2025-03-05RAGの検索精度を高める設計術:質問の正規化とドキュメントマッチングとは|LLM入門 6.2
自然文のままでは曖昧なユーザー質問を、検索に適した形式へ整える「質問の正規化」と、意味的に関連する文書を適切に選び出す「マッチング戦略」について、RAG実装の視点からわかりやすく解説します。
2025-02-28LlamaIndexとは何か?RAGにおける文書インデックス構築の強みとLangChainとの違い|LLM入門 5.3
LlamaIndexは、RAGの文書処理とインデックス管理に特化したライブラリです。本記事では、LlamaIndexの設計思想と主要機能、LangChainとの違いや併用パターン、実務での活用シーンを丁寧に解説します。
2025-02-24OpenAI Embeddingsとベクトル検索エンジンの連携方法|RAG構築の基本|LLM入門 5.1
RAGを構築する上で基本となるのが、OpenAIの埋め込みモデルとベクトルストアの組み合わせです。本記事では、text-embedding-ada-002の特徴と、FAISSやPineconeとの連携設計、実装時の注意点を詳しく解説します。
2025-02-221.3 LLM推論APIにおけるキャッシュ戦略|高速化と負荷軽減のためのベストプラクティス
LLM推論APIのパフォーマンスを向上させるキャッシュ戦略について解説。Redisを使った具体的な実装例やキャッシュ最適化のベストプラクティスを紹介します。
2024-11-047.2 質問応答システムと機械翻訳 - LLMによる自然言語処理の応用技術
LLM(大規模言語モデル)を活用した質問応答システムと機械翻訳の技術について詳しく解説します。カスタマーサポートの自動化、国際ビジネス、観光業界などでの具体的な応用例を紹介します。
2024-10-217.0 LLMの具体的な応用例 - 自然言語生成、機械翻訳、医療、法律、教育分野の利用事例
LLM(大規模言語モデル)は、自然言語生成、機械翻訳、医療、法律、教育など、様々な分野で幅広く応用されています。具体的な応用事例を通じて、LLMの現実世界での活用方法を紹介します。
2024-10-194.2 マルチヘッドアテンションの数理 - トランスフォーマーモデルにおける文脈理解の強化
トランスフォーマーモデルのマルチヘッドアテンションについて詳しく解説します。各ヘッドが異なる視点から文中の単語間の関連性を捉える仕組みと、その数理的な背景について説明します。
2024-10-124.1 セルフアテンションメカニズム - トランスフォーマーモデルの数理的基盤
トランスフォーマーモデルのセルフアテンションメカニズムについて詳しく解説します。クエリ、キー、バリューを用いた行列演算による単語間の関連度計算と、ソフトマックス関数を使った正規化を説明します。
2024-10-114.0 トランスフォーマーの数理 - セルフアテンションとマルチヘッドアテンションの仕組み
トランスフォーマーモデルにおける数理的な仕組みを解説します。セルフアテンションメカニズムの行列演算や、マルチヘッドアテンションによる文脈理解の向上について詳しく説明します。
2024-10-113.2 線形代数とベクトル空間 - LLMにおける単語埋め込みの数理的基盤
線形代数はLLM(大規模言語モデル)の数理的基盤です。単語の埋め込みやベクトル空間内での操作、コサイン類似度を用いた単語の関係性の解析について詳しく解説します。
2024-10-102.2 注意メカニズムの解説 | 自己注意とマルチヘッドアテンションによる文脈理解
LLM(大規模言語モデル)の基礎技術である注意メカニズムをエンジニア向けに解説。自己注意メカニズム、クエリ・キー・バリュー、スケールドドットプロダクトアテンション、マルチヘッドアテンションを用いた高度な文脈理解の仕組みを詳しく説明。
2024-09-09