LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 117 件の記事があります。 | 現在 3 ページ中の 1 ページ目です。

第14章 — ベンチマーク、テスト、性能

LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。

2026-04-12

第13章 — フレームワークとクラウド統合

LLM Primer IV ウォークスルー第13回。Strands と Bedrock、AWS のステート層パターン、Microsoft Agent Framework、LangChain、Semantic Kernel — そしてチームが独立にたどり着く3つの本番統合パターン。

2026-04-11

第12章 — プロトコルの堅牢化と防御

LLM Primer IV ウォークスルー第12回。4つの防御クラスタ — 暗号アテステーション、境界付きセッション付きOAuthスコープ規律、ランタイム・サンドボックス、Human-in-the-loopゲート — を組み合わせることで、敵対的条件下でモデルが正しく振る舞うことに依存しない姿勢を作る。

2026-04-10

第11章 — 攻撃面とプロトコル脆弱性

LLM Primer IV ウォークスルー第11回。MCPに適合された古典的攻撃 — Confused Deputy、Token Passthrough、Session Hijacking — 、Capability EscalationとUnauthenticated Samplingを巡るプロトコル・レベルの欠陥、そしてコンテキスト汚染を衛生問題ではなく構造的な問題にする暗黙の信頼伝播。

2026-04-09

第10章 — 長期タスクの記憶

LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。

2026-04-08

第9章 — 注意の予算管理

LLM Primer IV ウォークスルー第9回。コンテキスト・ロット、lost-in-the-middleの崖、ツール・ロードアウト・ロット、そして「モデルに欠けている知識はどこに置くべきか」への3つのアーキテクチャ上の答え — MCP、RAG、ファインチューニング。

2026-04-07

第8章 — アーキテクチャ的デプロイメント・レイアウト

LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。

2026-04-06

第7章 — 高度な協働・動的パターン

LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。

2026-04-05

第6章 — オーケストレーションの基本

LLM Primer IV ウォークスルー第6回。オーケストレーションの基本形 — 逐次パイプラインと並行スキャッタ・ギャザー — と、その前にチームが問うべき前提の問い: そもそもマルチ・エージェントが正解か。

2026-04-04

第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御

LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。

2026-04-02

第3章 — サーバープリミティブ: コンテキストと能力の公開

LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。

2026-04-01

第2章 — Model Context Protocol (MCP) の正体

LLM Primer IV ウォークスルー第2回。MCPが何を標準化しているのか、Host・Client・Serverの三役割の分割、動的ディスカバリと双方向メッセージがRESTと違って効いてくる場面、そして能力交渉で始まるセッション・ライフサイクル。

2026-03-31

LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス

LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。

2026-03-29

第11章 — 継続的なアップデートとパイプライン最適化

LLM Primer III ウォークスルー、最終回。CDC とインクリメンタルなインデックス更新でコーパスを新鮮に保ち、セマンティックキャッシュとモデル階層化でレイテンシを抑え、4段のフィードバックループで本番テレメトリと実際に行う変更の橋渡しをする — そして第4巻 MCP への橋。

2026-03-28

第10章 — 主要な評価フレームワーク

LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。

2026-03-27

第9章 — RAG評価トライアド

LLM Primer III ウォークスルー第9回。RAGは3つの異なる場所で失敗しうるのに、外から見ると同じ症状を出します — コンテキスト関連性、グラウンデッドネス、回答関連性という評価トライアドは、別のバグを直しながら別の症状を測ってしまうのを防ぐための、小さな粘り強い語彙です。

2026-03-26

第8章 — RAGパイプラインにおけるデータ匿名化

LLM Primer III ウォークスルー第8回。生成前 vs 生成後の匿名化、3つの技法ファミリー(マスキング、合成置換、差分プライバシー)、そしてシステムが有用なまま残れるかを左右する有用性 vs プライバシーのトレードオフ。

2026-03-25

第7章 — アクセス制御の実装

LLM Primer III ウォークスルー第7回。基盤としての文書単位ACL、Microsoft Purview の機密ラベルと統合する RBAC、Zanzibar と SpiceDB による ReBAC、そしてそれらすべての下で動く「事前フィルタ vs 事後フィルタ」の規律。

2026-03-24

第6章 — RAGの脅威モデルと脆弱性

LLM Primer III ウォークスルー第6回。検索で広がった攻撃面 — コーパス汚染、敵対的チャンク、間接プロンプトインジェクション、埋め込み反転、そしてエージェント型 RAG での「混乱した代理人」問題。具体的な攻撃、いずれも実証済みで、いずれも再現可能。

2026-03-23

第5章 — 検索パイプラインの設計

LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。

2026-03-22

第4章 — 適切なベクトルデータベースの選定

LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。

2026-03-21

第3章 — アドバンスト・チャンキングのフレームワーク

LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。

2026-03-20

第2章 — インテリジェント文書パース

LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。

2026-03-19

第1章 — RAGアーキテクチャの進化

LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。

2026-03-18

LLM Primer III — シリーズ紹介とインデックス

LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。

2026-03-17

第14章 — エンジニアのための実践的知識

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

第13章 — 限界、リスク、未解決の課題

LLM Primer II 第13章の歩き読みです。数学を別の向きに使い、計算コストとエネルギーの天井、データから自然に染み込んでくるバイアス、そして数学だけでは答えの出ない倫理と社会の問いを、控えめに整理します。

2026-03-15

第11章 — 評価、キャリブレーション、推論

LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。

2026-03-13

第10章 — ポストトレーニングとアラインメントの数学

LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。

2026-03-12

第6章 — Transformer ブロック

LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。

2026-03-08

第1章 — 言語モデルのための数学的直観

LLM Primer II シリーズの第1章です。数式と読み手とのあいだに立っている「壁」を、そっと脇に避けるところから始めます。記号、言語生成のための確率、そして不確かさを測るためのエントロピー。

2026-03-03

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

第12章 — 自分の LLM システムを構築する: データセットから本番まで

LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。

2026-03-01

第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸

LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。

2026-02-28

第10章 — 安全性、倫理、信頼: マーケティングの先へ

LLM Primer I シリーズの第10章です。LLM の安全性についての正直な像 — なぜハルシネーションが構造的に起きるのか、バイアスは本当はどこに宿るのか、多層ガードレールはどう機能するのか、そしてなぜ技術的コントロールでは置き換えられない制度的レイヤーがガバナンスなのかを解説します。安全に「出す」必要のある実務者向けです。

2026-02-27

第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ

LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。

2026-02-26

第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント

LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。

2026-02-25

第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル

LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。

2026-02-24

第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ

LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。

2026-02-23

第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト

LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。

2026-02-22

第1章 — 大規模言語モデルとは何か (見出しの先へ)

LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。

2026-02-18

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17

人格・役割・意図の設計とは?|MCP入門 7.4|AIの“存在”をプロトコルで定義する方法

AIが人格を持ち、役割を柔軟に切り替え、意図を理解して発話する時代が始まろうとしています。本記事では、MCPによってこうした構成要素をどのように設計・再現し、対話的存在としてのAIを実現できるのかを解説します。

2025-04-05

OpenAI GPT、Claude、Geminiの文脈処理とは?|MCP入門 7.1|各社LLMの設計思想とMCPの位置づけ

各社LLMは文脈や状態の扱い方に独自のアプローチを持っています。本記事ではOpenAI GPTのSystem MessageとMemory API、Claudeの自己内省型設計、Geminiのマルチモーダル連携を比較し、MCPが果たす中立的な役割を明らかにします。

2025-04-02

“明示的な制約”と“暗黙の指示”の違いとは?|MCP入門 6.1|AIが期待に応えるためのプロンプト設計術

生成AIは指示されたことだけでなく、空気や文脈を読むことも求められます。本記事では、プロンプトにおける“明示的な制約”と“暗黙の指示”の違いを解説し、MCP設計を通じて誤解を防ぎ、意図通りの応答を得るための設計手法を紹介します。

2025-03-28

ドキュメントベース質問応答(RAG)でのContext設計とは?|MCP入門 5.3|情報の構造化で精度と説明力を高める方法

RAG(検索補助生成)で生成AIが正確に応答するためには、検索結果をどのように文脈化するかが鍵です。MCP設計により、取得情報のスロット化・優先度付け・役割づけを行い、安定した回答と説明責任のある出力を実現する方法を解説します。

2025-03-25

タスク分離とセッション切り替えとは?|MCP入門 5.2|AI応答の誤りを防ぐ文脈設計

1人のユーザーが複数の目的でAIと対話する時、文脈の混在は誤応答や情報漏洩の原因になります。MCPによるセッションIDやタスクタグの活用により、タスク単位の文脈を安全かつ自然に切り替える方法を詳しく解説します。

2025-03-24

MCPの実践設計パターンとは?|第5章|チャット・RAG・ツール統合まで網羅的に解説

この章では、Model Context Protocol(MCP)を具体的にどう活用すべきか、チャットボット、タスク切替、RAG、マルチエージェントシステムといった現実的ユースケースごとに設計パターンを解説します。

2025-03-22

外部ツールとのプロトコル統合とは?|MCP入門 4.4|カレンダー・チャット・CRMをAIと連携する設計法

SlackやGoogle Calendar、Salesforceなどの外部ツールと生成AIを連携し、チャットから予定作成や顧客データ操作を行う方法を解説。MCPを活用し、文脈の更新・アクション提案・認証設計まで詳しく紹介します。

2025-03-21

複数モデル(LLM)の使い分け設計とは?|MCP入門 4.2|GPT-4・Claude・Geminiをタスクごとに最適活用

GPT-4、Claude、Geminiなど複数のLLMを目的に応じて使い分ける設計は、生成AIの品質・速度・コスト最適化に不可欠です。本節では、MCPによる役割分担、タスク別・属性別・フォールバック・ワークフロー設計を詳しく解説します。

2025-03-19