LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 85 件の記事があります。 | 現在 2 ページ中の 1 ページ目です。

第14章 — エンジニアのための実践的知識

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第11章 — 評価、キャリブレーション、推論

LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。

2026-03-13

第10章 — ポストトレーニングとアラインメントの数学

LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。

2026-03-12

第8章 — モデルはどう学ぶか

LLM Primer II シリーズの第8章を紹介します。古典的な統計学習理論が「過学習するはず」と告げる規模で、なぜ大規模モデルは汎化してしまうのか。勾配降下法の暗黙的バイアス、スケーリング則、そして「まだ分かっていないこと」を、控えめに整理します。

2026-03-10

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第5章 — 位置、順序、系列の構造

LLM Primer II シリーズの第5章をご紹介させていただきます。Attention が抱えていた「順序を見ない」という静かな不具合を、正弦波エンコーディング、相対位置、RoPE、そして Fourier の視点から控えめにたどってまいります。

2026-03-07

第3章 — 数学的な道具立て

LLM Primer II シリーズの第3章です。本書が必要とする確率と線形代数を、必要な分量で、必要な順番で並べさせていただく短い章。最尤推定としての訓練、ベクトル空間と埋め込み、そして Attention への橋渡し。

2026-03-05

第2章 — LLM を文脈に置く

LLM Primer II シリーズの第2章です。前作『LLM Primer』の素朴な物語と、本書の数学とを橋渡しする章。LLM とはなにか、事前学習・パラメータ・スケール、データとしての言語、そしてトランスフォーマーが風景を塗り替えた理由。

2026-03-04

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

第12章 — 自分の LLM システムを構築する: データセットから本番まで

LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。

2026-03-01

第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸

LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。

2026-02-28

第9章 — パフォーマンス、スケーリング、コスト: 本物のエンジニアリング・トレードオフ

LLM Primer I シリーズの第9章です。LLM をスケールで運用する現実 — モデルサイズと能力、レイテンシとスループットのトレードオフ、コストの経済学、量子化、エッジ展開を扱います。フロンティアモデルが、たとえ予算的に手が届いてもしばしば誤った選択肢になる理由も整理します。

2026-02-26

第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント

LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。

2026-02-25

第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト

LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。

2026-02-22

第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身

LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。

2026-02-21

第3章 — 言語のためのニューラルネットワーク: RNN から Self-Attention へ

LLM Primer I シリーズの第3章です。なぜ Feedforward では言語を扱えなかったか、RNN がどう壁にぶつかったか、そして Attention が何を変えたかを解説します。現代の NLP を定義した3つのニューラルネットワーク形態を、数学アレルギーなしで整理できる構成です。

2026-02-20

第1章 — 大規模言語モデルとは何か (見出しの先へ)

LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。

2026-02-18

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM入門書シリーズは、大規模言語モデルとどう向き合うかを、全7巻にわたって扱う入門書です。第1巻の基礎から、第6巻の本番運用、第7巻の安全性まで、巻ごとに別の角度から取り上げています。このページでは、シリーズ全体の構成と、すでに読める第1巻・第2巻について、章ごとの解説をまとめて紹介します。

2026-02-15

W3CのAI Context仕様とは?|MCP入門 7.3|文脈の国際標準化とMCPの役割

AIの意思決定や会話文脈を明示的に設計するため、W3CではAI Context仕様の標準化が進んでいます。本記事ではその動向と、MCPとの親和性や将来のマッピング可能性について詳しく解説します。

2025-04-04

OpenAI GPT、Claude、Geminiの文脈処理とは?|MCP入門 7.1|各社LLMの設計思想とMCPの位置づけ

各社LLMは文脈や状態の扱い方に独自のアプローチを持っています。本記事ではOpenAI GPTのSystem MessageとMemory API、Claudeの自己内省型設計、Geminiのマルチモーダル連携を比較し、MCPが果たす中立的な役割を明らかにします。

2025-04-02

MCPの未来と標準化への道とは?|MCP入門 7.0|AI文脈設計の次なるステージとグローバル接続性

Model Context Protocol(MCP)はAIの文脈理解と再現性を支える設計思想です。最終章では、各社LLMとの親和性、Memory API連携、W3C標準化、人格と役割の制御まで、MCPの未来像を展望します。

2025-04-01

JSONスキーマによる状態制御の工夫とは?|MCP入門 6.4|一貫性あるAI応答を実現する構造的設計

生成AIの応答を安定化させるには、“状態”の明示が不可欠です。本記事では、MCP設計におけるJSONスキーマの活用方法を詳しく解説し、意図や画面状況をモデルに正しく伝える設計戦略を紹介します。

2025-03-31

システムメッセージ vs ユーザープロンプトとは?|MCP入門 6.2|LLMの人格と応答品質を分ける設計手法

プロンプトには“誰が話すか”という役割の違いがあります。本記事では、システムメッセージとユーザープロンプトの違いを明確化し、モデルの態度・目的意識・人格形成に与える影響、MCP設計への応用を詳しく解説します。

2025-03-29

チャットボットの履歴管理とは?|MCP入門 5.1|スコープ制御で精度とコストを最適化する設計

生成AIチャットボットの応答品質は、会話履歴の設計に大きく左右されます。本記事では、MCPを活用して履歴の粒度・要約・トピック切り替えを制御し、自然かつ効率的なチャット体験を作る方法を解説します。

2025-03-23

RAGとの統合設計とは?|MCP入門 4.1|生成AIの文脈構築を強化する検索補助付き設計

RAG(検索補助付き生成)は、生成AIに最新情報や社内知識を与える鍵です。本章では、MCPとの接続方法、FAQ注入、要約統合、テンプレートとの連携など、RAGとコンテキスト設計を統合する具体的手法を紹介します。

2025-03-18

テンプレートとスロットの設計とは?|MCP入門 3.3|生成AIの柔軟で安全な文脈構築法

生成AIの出力に一貫性と安全性を持たせるには、テンプレートとスロット設計が重要です。本章では、プロンプトテンプレート、文脈スロット化、入力サニタイズなど、再利用とセキュリティを両立する具体的なパターンを解説します。

2025-03-15

システムインストラクションの設計パターンとは?|MCP入門 3.1|生成AIの人格と振る舞いの設計

生成AIの出力に一貫性と目的を持たせるには、システムインストラクションの設計が重要です。MCPにおける役割、トーン、ルール、タスク駆動型など、代表的な設計パターンをわかりやすく解説します。

2025-03-13

MCP実装の基本設計パターンとは?|MCP入門 第3章|生成AIをプロダクトに組み込むための考え方

MCP(Model Context Protocol)をプロダクトや業務システムに実装するには、文脈・状態・履歴・ユーザー情報の扱い方を設計パターンとして整理する必要があります。本章ではMCPの構造化・再現性・スケーラビリティを支える4つの設計手法を紹介します。

2025-03-12

OpenAI Function CallingとMCPの関係とは?|MCP入門 2.4|生成AIの構造化出力と実装設計

OpenAIのFunction Callingは、生成AIが構造化された出力を返す仕組みです。MCP(Model Context Protocol)の文脈・状態設計と深く関係し、再現性や拡張性の高いAI実装を支えます。本節ではその原理と設計のポイントを丁寧に解説します。

2025-03-11

MCPによる状態制御と再現性の向上とは?|MCP入門 2.3|生成AIの安定設計の鍵

生成AIをプロダクトとして安定運用するには、出力の一貫性と再現性が不可欠です。MCP(Model Context Protocol)は文脈と状態を構造化し、モデルの振る舞いを制御・再現可能にします。設計原則から具体例まで詳しく解説。

2025-03-10

従来のプロンプト設計とMCPの違いとは?|MCP入門 2.2|生成AI設計の新常識

プロンプトエンジニアリングでは限界がある。MCP(Model Context Protocol)は、文脈と状態を分離・構造化することで、一貫性・拡張性・再現性を備えた生成AIの設計を可能にします。従来手法との違いを比較しながら丁寧に解説。

2025-03-09

RAG時代の設計者とは?検索と生成をつなぎ、AIを業務に根づかせる方法|LLM入門 終章

RAGの本質は、情報の選別と構造化を通じて生成AIの文脈を設計すること。本章では、生成AI時代に求められる「検索と生成をつなぐ設計者」の役割と、今後の学びと実装の地図を示します。

2025-03-08

RAGは本当に不要になるのか?長文対応LLM時代の検索戦略を再考する|LLM入門 7.3

GPT-4 128kやClaude 2の登場により、「検索せず全文渡す」構成が可能になってきました。本記事ではRetrieval不要論の背景と現実的な限界、そしてRAGの再定義について丁寧に解説します。

2025-03-06

モデルにとっての記憶とは何か?|MCP入門 1.4|生成AIと文脈再現の技術

生成AIは本当に記憶しているのか?実は、AIの“記憶”は文脈の再構築にすぎません。エフェメラルメモリ・永続メモリ・役割設計など、MCP(Model Context Protocol)での記憶制御の仕組みをわかりやすく解説します。

2025-03-06

RAGを強化するハイブリッド検索とMulti-Vector戦略とは?検索の多視点化と精度向上の設計|LLM入門 7.2

意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。

2025-03-05

RAGにおける幻覚とは?情報の過不足を防ぎ生成精度を高める設計法|LLM入門 7.1

RAG構成でも、LLMによる幻覚(hallucination)は発生します。本記事では、Retriever精度、プロンプト設計、出典明示などにより幻覚を抑える具体的な方法と、検知・評価の技術までを丁寧に解説します。

2025-03-04

RAGの限界と今後の展望とは?幻覚・検索精度・モデル進化にどう向き合うか|LLM入門 第7章

RAGには明確な強みがある一方で、限界や課題も存在します。本章では、幻覚対策やハイブリッド検索の可能性、大規模コンテキストモデルとの関係、そして今後の運用と設計戦略について実践的に整理します。

2025-03-03

モデルはなぜ文脈を必要とするのか?|MCP入門 1.1|生成AIとコンテキスト理解

ChatGPTをはじめとする生成AIは、入力だけでなく“文脈”によって出力を変えています。なぜ文脈が必要なのか、モデルはどう背景を読み取るのか。MCP設計の基礎となる文脈理解について、具体例を交えて丁寧に解説します。

2025-03-03

RAGの検索精度を高める設計術:質問の正規化とドキュメントマッチングとは|LLM入門 6.2

自然文のままでは曖昧なユーザー質問を、検索に適した形式へ整える「質問の正規化」と、意味的に関連する文書を適切に選び出す「マッチング戦略」について、RAG実装の視点からわかりやすく解説します。

2025-02-28

LlamaIndexとは何か?RAGにおける文書インデックス構築の強みとLangChainとの違い|LLM入門 5.3

LlamaIndexは、RAGの文書処理とインデックス管理に特化したライブラリです。本記事では、LlamaIndexの設計思想と主要機能、LangChainとの違いや併用パターン、実務での活用シーンを丁寧に解説します。

2025-02-24

LangChainでRAGを構築する方法とは?RetrieverからLLM連携まで徹底解説|LLM入門 5.2

LangChainはRAG構築において、Retriever・LLM・プロンプトを一貫してつなぐフレームワークです。本記事では、各モジュールの役割と構成例、導入のメリット・注意点までを、実装の視点からわかりやすく解説します。

2025-02-23

RAGに適したベクトル検索エンジンとは?FAISS・Weaviate・Pinecone徹底比較|LLM入門 4.2

RAGの検索性能を支えるのがベクトル検索エンジンです。本記事では、FAISS・Weaviate・Pineconeといった代表的エンジンの特徴を比較し、導入時に重視すべき観点や選定ポイントをわかりやすく解説します。

2025-02-18

RAG導入の実践ステップと落とし穴とは?PoCから本番運用までの道筋|LLM入門 3.4

RAGはPoC(概念実証)では効果を実感しやすい一方で、実運用への移行には注意点が多数あります。本記事では、導入フェーズにおけるステップと、技術・運用・責任設計の観点から見た“落とし穴”とその回避法を解説します。

2025-02-15

RAGでFAQ対応を自動化する方法と効果とは?顧客サポートをAIで強化|LLM入門 3.2

RAGを活用したFAQ対応Botは、顧客の自然な質問に対して意味ベースで文書を検索し、正確でわかりやすい回答を生成します。本記事では、EC事業者の導入事例とともに、設計・運用のポイントや導入効果を具体的に解説します。

2025-02-13

RAGと従来の検索の違いとは?意味ベース検索と生成の融合を解説|LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

RAGの中核構造:RetrieverとGeneratorの役割と分離設計|LLM入門 2.2

RAGにおいて、Retriever(検索部)とGenerator(生成部)の明確な分離は高精度な応答生成の鍵となります。本記事では、それぞれの役割、構造、設計上のメリットについて詳しく解説し、柔軟で拡張性のあるAI構築のための基盤を紹介します。

2025-02-08

RAGとは?検索と生成を組み合わせた新しいAIの仕組み|LLM入門 2.1

RAG(Retrieval-Augmented Generation)は、外部知識を検索してLLMの応答に活かす次世代アーキテクチャです。本記事では、RAGの基本フローや構成要素、従来の生成AIとの違いを図解的にわかりやすく解説します。

2025-02-07

7.3 マルチモーダルモデルとLLMの統合 | テキスト、画像、音声、映像の融合技術

マルチモーダルモデルとLLMの統合により、テキスト、画像、音声、映像を同時に処理することで、より深い理解と高精度な応答が可能になります。具体的な技術と応用例を紹介します。

2024-11-26