LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 50 件の記事があります。 | 現在 2 ページ中の 1 ページ目です。

第17章 — 将来の脅威と新しい防御

『LLM Primer VII』ウォークスルー最終回、第17回。まだ形成途上の脅威群 — 自律エージェント、マルチモーダル攻撃面、合成アイデンティティ、2026年半ばのAI対AIのダイナミクス — を扱う章。そしてLLM Primerシリーズ全体を締めくくる回。

2026-05-26

第8章 — モデルへの敵対的攻撃

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第8回。Goodfellow 2014 の画像分類器研究から TextFooler や universal suffix、本番 API に対するモデル窃取まで、敵対的攻撃の系譜を辿る章。

2026-05-17

第7章 — ハルシネーションと信頼性

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第7回。信頼性をセキュリティ的性質として扱う章 — 正しさが結果を左右する場面では、自信満々に間違った出力そのものがセキュリティ問題だからだ。

2026-05-16

第6章 — RAG のリスク

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第6回。検索コーパスを非信頼な入力チャネルとして扱う章 — 索引された文書はすべて、モデルから見ればユーザーの質問と同格の命令だからだ。

2026-05-15

第5章 — 入力検証と出力フィルタリング

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第5回。第4章の多層緩和フレームを運用規律へと落とし込む章 — サニタイズ段階、ガードレール、構造化出力、レッドチーミング、そして意味のある安全性メトリクスの話。

2026-05-14

第4章 — プロンプトインジェクションとジェイルブレイク

『LLM Primer VII: AIセキュリティ』ウォークスルー第4回。実践的LLMセキュリティ問題の中心に位置する章 — なぜプロンプトインジェクションにはパラメータ化クエリに相当する構造的な修正がなく、多層の部分的防御しかないのかを説明します。

2026-05-13

第3章 — データセキュリティとプライバシー

『LLM Primer VII: AIセキュリティ』ウォークスルー第3回。データを固有のライフサイクルを持つ資産として扱う — モデルが部分的に記憶している訓練コーパスから、Samsung のエンジニアが名前が付く前にChatGPTに貼り付けたユーザー入力まで、という章です。

2026-05-12

第2章 — LLMシステムの脅威モデリング

『LLM Primer VII: AIセキュリティ』ウォークスルー第2回。Shostack の4つの問い、STRIDE、PASTA、MITRE ATLAS を、あらゆる入力を潜在的な指示として読む確率的関数を最も強力な構成要素として持つシステムに適用する、という章です。

2026-05-11

LLM Primer VII — シリーズ序文 & インデックス

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルーのインデックス。シリーズ最終巻は、LLMシステムを敵対者・規制・確率的挙動から守る規律を、脅威モデルから規制の境界線まで一気に書き下ろします。

2026-05-09

第4章 — 専用AIシリコンとASIC

『LLM Primer VI』ウォークスルー第4回。GPUかASICかの選択はワークロード形状の問題であり、Groq、Inferentia2、TPU、Gaudi 3のそれぞれが勝つ領域と失敗モードを歩く。

2026-04-26

第3章 — 生成AI向けのデータセンターGPU

『LLM Primer VI』ウォークスルー第3回。サービングGPUはFLOP/sではなくHBM帯域とVRAM容量で買うべきだと論じる章。H100、H200、B200、L40S、MI300Xを機構優先で読み解く。

2026-04-25

第1章 — トークン生成のメカニズム

『LLM Primer VI』ウォークスルー第1回。LLMサービングの難問はほぼ全て一つの事実から派生する — トークンを生み出すループはメモリ帯域律速で、購入した高価な演算能力は99.7パーセント遊んでいる。

2026-04-23

LLM Primer VI — シリーズ序文と目次

『LLM Primer VI: AIシステムのスケーリング』ウォークスルー全16回の序文と目次。LLM推論をメモリ帯域、スケジューリング、そしてドルが交錯するエンジニアリング領域として扱う一冊の全体像。

2026-04-22

第4章 — AIエージェントとツール呼び出し

『LLM Primer V』ウォークスルー第4回。エージェントを、スキーマ・メモリ層・マルチエージェント配線を工学的に組み立てられて初めて信頼できる「ツールに対してループするLLM」として扱う回。ReAct、契約としてのツールスキーマ、短期/長期/意味の3層メモリ。

2026-04-17

第3章 — 検索拡張生成 (RAG)

『LLM Primer V』ウォークスルー第3回。RAGパイプラインを端から端まで歩き、10件のお気に入り文書で動くデモを、実運用のコーパスに耐えるシステムから分ける技法 — ハイブリッド検索、構造的チャンキング、HyDE、step-back、text-to-SQL — をまとめる。

2026-04-16

第1章 — AIエンジニアリングという規律

『LLM Primer V』ウォークスルー第1回。デモと本番の信頼性ギャップを名指しし、確率的な核を決定論的なラッパーで包む工学 — AIエンジニアリング — の枠組みと、信頼性・品質・パフォーマンス・コスト・進化の5つの柱を歩く。

2026-04-14

シリーズ序文と目次 — LLM Primer V

『LLM Primer V: 実運用のLLMアプリケーションを設計する』のウォークスルー序文。AIエンジニアリングを一つの規律として扱い、基盤モデル・プロンプト・検索・エージェント・評価・オブザーバビリティ・セキュリティ・サービングの8つの面を歩く8章構成の全体像を示す。

2026-04-13

第5章 — トランスポートプロトコルとディスカバリ

LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。

2026-04-03

第4章 — クライアントプリミティブ: エージェント的な振る舞いと制御

LLM Primer IV ウォークスルー第4回。Sampling、Roots、ElicitationはMCPがホストとサーバーの壁に穿つ、小さく制御された3つの穴 — それぞれユーザーが許可する能力、ホストが代理で受け入れるリスク。

2026-04-02

第3章 — サーバープリミティブ: コンテキストと能力の公開

LLM Primer IV ウォークスルー第3回。MCPサーバーが提供できる3つの名詞 — Resources(読む状態)、Prompts(再利用できる足場)、Tools(書き込み動作) — それぞれのスキーマ、ライフサイクル、エラーモデル、そして適切なプリミティブを選ぶ規律。

2026-04-01

LLM Primer IV — MCPで設計するAI認知: シリーズ紹介とインデックス

LLM Primerシリーズ第4作『MCPで設計するAI認知』の章ごとウォークスルーの第1回。エージェントがデモの段階から本番運用へ進むためにプロトコル層が必要な理由、本書の対象読者、そして3月30日から4月12日まで14回続く投稿の予定をまとめます。

2026-03-29

第5章 — 検索パイプラインの設計

LLM Primer III ウォークスルー第5回。単発のベクトル検索はパイプラインではない理由 — ハイブリッド検索、Reciprocal Rank Fusion、クロスエンコーダ再ランキング、そしてクエリ側の書き換えと HyDE が、成熟した本番 RAG の収斂先である構成にどう組み上がるか。

2026-03-22

第4章 — 適切なベクトルデータベースの選定

LLM Primer III ウォークスルー第4回。専用設計とPostgres型拡張のアーキテクチャ的分岐、マネージドの主役(Pinecone、Vertex)、オープンソース陣営(Qdrant、Milvus、Weaviate)、埋め込み型の選択肢、そして実際の選択を決める3つの運用軸 — レジデンシー、運用、コスト。

2026-03-21

第3章 — アドバンスト・チャンキングのフレームワーク

LLM Primer III ウォークスルー第3回。チャンキングのスペクトラム、オーバーラップの神話、検索品質を静かに殺す「コンテキストの崖」、そしてフロンティアの計算を書き換えたコンテクスチュアル・リトリーバルとレイトチャンキングを整理します。

2026-03-20

LLM Primer III — シリーズ紹介とインデックス

LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。

2026-03-17

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第8章 — モデルはどう学ぶか

LLM Primer II シリーズの第8章を紹介します。古典的な統計学習理論が「過学習するはず」と告げる規模で、なぜ大規模モデルは汎化してしまうのか。勾配降下法の暗黙的バイアス、スケーリング則、そして「まだ分かっていないこと」を、控えめに整理します。

2026-03-10

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第6章 — Transformer ブロック

LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。

2026-03-08

第5章 — 位置、順序、系列の構造

LLM Primer II シリーズの第5章をご紹介させていただきます。Attention が抱えていた「順序を見ない」という静かな不具合を、正弦波エンコーディング、相対位置、RoPE、そして Fourier の視点から控えめにたどってまいります。

2026-03-07

第4章 — Attention

LLM Primer II シリーズの第4章をご紹介させていただきます。Attention を直観から導出し、クエリ・キー・バリューの幾何、softmax の温度、マルチヘッド構造、そして Attention をカーネル法として読み直す視点まで、控えめに歩いてまいります。

2026-03-06

第3章 — 数学的な道具立て

LLM Primer II シリーズの第3章です。本書が必要とする確率と線形代数を、必要な分量で、必要な順番で並べさせていただく短い章。最尤推定としての訓練、ベクトル空間と埋め込み、そして Attention への橋渡し。

2026-03-05

第2章 — LLM を文脈に置く

LLM Primer II シリーズの第2章です。前作『LLM Primer』の素朴な物語と、本書の数学とを橋渡しする章。LLM とはなにか、事前学習・パラメータ・スケール、データとしての言語、そしてトランスフォーマーが風景を塗り替えた理由。

2026-03-04

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身

LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。

2026-02-21

第3章 — 言語のためのニューラルネットワーク: RNN から Self-Attention へ

LLM Primer I シリーズの第3章です。なぜ Feedforward では言語を扱えなかったか、RNN がどう壁にぶつかったか、そして Attention が何を変えたかを解説します。現代の NLP を定義した3つのニューラルネットワーク形態を、数学アレルギーなしで整理できる構成です。

2026-02-20

第1章 — 大規模言語モデルとは何か (見出しの先へ)

LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。

2026-02-18

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM Primer シリーズ — Sho Shimoda による全7巻の生成AIフィールドガイド、ついに完結。基礎からセキュリティまで。姉妹編『Physical AI』も含む。全7巻がAmazonで販売中。

2026-02-15

MCPの実践設計パターンとは？｜第5章｜チャット・RAG・ツール統合まで網羅的に解説

この章では、Model Context Protocol（MCP）を具体的にどう活用すべきか、チャットボット、タスク切替、RAG、マルチエージェントシステムといった現実的ユースケースごとに設計パターンを解説します。

2025-03-22

MCPの拡張と統合とは？｜MCP入門第4章｜RAG・マルチモデル・外部ツール連携の設計手法

MCP（Model Context Protocol）の応用編として、RAGの統合、複数LLMの使い分け、マルチセッション管理、外部ツールとの連携など、生成AIを高度に運用するための設計フレームワークを解説します。

2025-03-17

ユーザー状態とモデル状態の同期とは？｜MCP入門 3.4｜生成AIの一貫した応答設計

生成AIの出力の一貫性を保つには、ユーザーとモデルの状態を同期させることが重要です。MCPでは、セッションメモリ、タスク管理、ステートマシン、感情トラッキングなどを活用して文脈と目的を揃える設計が求められます。

2025-03-16

大規模言語モデルと対話型AIの「思考状態」を設計するプロトコルの基礎と応用

ChatGPTをはじめとする大規模言語モデル（LLM）の応答精度を高める鍵、それがModel Context Protocol（MCP）です。AIに“文脈”を理解させる新しい設計手法を、初心者にもわかりやすく解説します。

2025-03-01

RAGを構築するための技術要素とは？Embeddingから検索・統合まで解説｜LLM入門第4章

RAG（Retrieval-Augmented Generation）を構築・運用するには、埋め込みモデル、ベクトル検索エンジン、プロンプト整形などの技術が欠かせません。本章では、主要な技術コンポーネントとその選定ポイントを体系的に解説します。

2025-02-16

RAG導入の実践ステップと落とし穴とは？PoCから本番運用までの道筋｜LLM入門 3.4

RAGはPoC（概念実証）では効果を実感しやすい一方で、実運用への移行には注意点が多数あります。本記事では、導入フェーズにおけるステップと、技術・運用・責任設計の観点から見た“落とし穴”とその回避法を解説します。

2025-02-15

RAGで業務AIを強化する方法とは？｜LLM入門：検索と統合の仕組みを解説

RAG（Retrieval-Augmented Generation）は、大規模言語モデルに社内ナレッジやFAQを統合し、業務に使えるAIを構築する鍵です。本記事ではRAGの仕組み、活用例、導入のステップまで、わかりやすく解説します。

2025-02-01

4.1 セルフアテンションメカニズム - トランスフォーマーモデルの数理的基盤

トランスフォーマーモデルのセルフアテンションメカニズムについて詳しく解説します。クエリ、キー、バリューを用いた行列演算による単語間の関連度計算と、ソフトマックス関数を使った正規化を説明します。

2024-10-11

4.0 トランスフォーマーの数理 - セルフアテンションとマルチヘッドアテンションの仕組み

トランスフォーマーモデルにおける数理的な仕組みを解説します。セルフアテンションメカニズムの行列演算や、マルチヘッドアテンションによる文脈理解の向上について詳しく説明します。

2024-10-11

3.2 線形代数とベクトル空間 - LLMにおける単語埋め込みの数理的基盤

線形代数はLLM（大規模言語モデル）の数理的基盤です。単語の埋め込みやベクトル空間内での操作、コサイン類似度を用いた単語の関係性の解析について詳しく解説します。

2024-10-10

3.3 ファインチューニングとトランスファーラーニング | LLMの効率的なトレーニング方法

LLM（大規模言語モデル）のトレーニングにおけるファインチューニングとトランスファーラーニングをエンジニア向けに解説。既存のモデルを特定タスクに最適化し、効率的に新しいタスクに対応させる手法について詳述。

2024-09-14

1 ページ目 / 2 ページ