LLM入門

このページでは、AI技術に関心のある方のために、LLM（大規模言語モデル）の基礎から応用までをわかりやすく解説します。

合計 49 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第14章 — バイアス、公平性、責任あるAI

『LLM Primer VII』ウォークスルー第14回。責任あるAIを不確実性下の選択の集合として扱う章。バイアスの発生源、公平性メトリックの相互不整合、安全性と有用性のトレードオフ、そして組織のAIポリシーがその選択を担う層となる理由を追う。

2026-05-23

第13章 — 規制の状況

『LLM Primer VII: AIセキュリティ』第13章のウォークスルー。EU AI Act、GDPR、米国の連邦と州、シンガポール、日本、韓国 — 統一されていない規制の状況を歩き、監査可能性、モデルカード、リスク分類の枠組みを技術的統制に対応づける。

2026-05-22

第9章 — モデル整合性とサプライチェーンリスク

『LLM Primer VII: AIセキュリティ』章別ウォークスルー第9回。モデル成果物を第三者配布のバイナリとして扱う章 — バイナリ配布が常に伴ってきたデシリアライゼーション、バックドア、出所の懸念を辿る。

2026-05-18

LLM Primer VII — シリーズ序文 & インデックス

『LLM Primer VII: AIセキュリティ』を章ごとに紹介するウォークスルーのインデックス。シリーズ最終巻は、LLMシステムを敵対者・規制・確率的挙動から守る規律を、脅威モデルから規制の境界線まで一気に書き下ろします。

2026-05-09

第7章 — 高度なバッチング戦略

『LLM Primer VI』ウォークスルー第7回。バッチングは最適化ではなく、帯域律速のデコードを成立させる唯一の動き。バッチは名詞ではなく動詞である。

2026-04-29

第10章 — 長期タスクの記憶

LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。

2026-04-08

第2章 — Model Context Protocol (MCP) の正体

LLM Primer IV ウォークスルー第2回。MCPが何を標準化しているのか、Host・Client・Serverの三役割の分割、動的ディスカバリと双方向メッセージがRESTと違って効いてくる場面、そして能力交渉で始まるセッション・ライフサイクル。

2026-03-31

第10章 — 主要な評価フレームワーク

LLM Primer III ウォークスルー第10回。評価トライアドを実際に運用できる形にする8つのフレームワークの現場ガイド — メトリックファースト側の RAGAS、TruLens、DeepEval と、可観測性プラットフォーム側の Braintrust、LangSmith、Phoenix、Galileo、Opik、そしてどれもまだ閉じていない評価ギャップ。

2026-03-27

第1章 — RAGアーキテクチャの進化

LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。

2026-03-18

第14章 — エンジニアのための実践的知識

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

第13章 — 限界、リスク、未解決の課題

LLM Primer II 第13章の歩き読みです。数学を別の向きに使い、計算コストとエネルギーの天井、データから自然に染み込んでくるバイアス、そして数学だけでは答えの出ない倫理と社会の問いを、控えめに整理します。

2026-03-15

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第11章 — 評価、キャリブレーション、推論

LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。

2026-03-13

第9章 — スケールでの学習

LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。

2026-03-11

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

第10章 — 安全性、倫理、信頼: マーケティングの先へ

LLM Primer I シリーズの第10章です。LLM の安全性についての正直な像 — なぜハルシネーションが構造的に起きるのか、バイアスは本当はどこに宿るのか、多層ガードレールはどう機能するのか、そしてなぜ技術的コントロールでは置き換えられない制度的レイヤーがガバナンスなのかを解説します。安全に「出す」必要のある実務者向けです。

2026-02-27

第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ

LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。

2026-02-23

第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身

LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。

2026-02-21

第3章 — 言語のためのニューラルネットワーク: RNN から Self-Attention へ

LLM Primer I シリーズの第3章です。なぜ Feedforward では言語を扱えなかったか、RNN がどう壁にぶつかったか、そして Attention が何を変えたかを解説します。現代の NLP を定義した3つのニューラルネットワーク形態を、数学アレルギーなしで整理できる構成です。

2026-02-20

第2章 — 確率、トークン、テキスト: 次の単語を当てるゲーム

LLM Primer I シリーズの第2章です。LLM がテキストをトークンに変換する仕組み、なぜ言語モデリングが本質的に確率の問題なのか、そして昔の n-gram アプローチが汎化できるニューラルモデルにどう道を譲ったかを解説します。パープレキシティのやさしい言葉での説明と、トークン境界がなぜ重要かも扱います。

2026-02-19

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM Primer シリーズ — Sho Shimoda による全7巻の生成AIフィールドガイド、ついに完結。基礎からセキュリティまで。姉妹編『Physical AI』も含む。全7巻がAmazonで販売中。

2026-02-15

ストラクチャード・コンテキスト vs ナチュラル・プロンプティングとは？｜MCP入門 6.3｜構造化と柔軟性を両立するプロンプト設計

生成AIに文脈を渡すには、JSON形式の構造化データか自然言語プロンプトか、どちらが適切か。本記事では、MCP設計において“ストラクチャード・コンテキスト”と“ナチュラル・プロンプティング”の違いと併用戦略を詳しく解説します。

2025-03-30

従来のプロンプト設計とMCPの違いとは？｜MCP入門 2.2｜生成AI設計の新常識

プロンプトエンジニアリングでは限界がある。MCP（Model Context Protocol）は、文脈と状態を分離・構造化することで、一貫性・拡張性・再現性を備えた生成AIの設計を可能にします。従来手法との違いを比較しながら丁寧に解説。

2025-03-09

RAG時代の設計者とは？検索と生成をつなぎ、AIを業務に根づかせる方法｜LLM入門終章

RAGの本質は、情報の選別と構造化を通じて生成AIの文脈を設計すること。本章では、生成AI時代に求められる「検索と生成をつなぐ設計者」の役割と、今後の学びと実装の地図を示します。

2025-03-08

MCPとは？生成AIの文脈と状態を設計する仕組み｜MCP入門 2.1

MCP（Model Context Protocol）は、生成AIが一貫した出力を生むための文脈と状態を設計・再現するためのプロトコルです。本節ではMCPの定義、プロンプトとの違い、設計思想としての役割を丁寧に解説します。

2025-03-08

RAGは本当に不要になるのか？長文対応LLM時代の検索戦略を再考する｜LLM入門 7.3

GPT-4 128kやClaude 2の登場により、「検索せず全文渡す」構成が可能になってきました。本記事ではRetrieval不要論の背景と現実的な限界、そしてRAGの再定義について丁寧に解説します。

2025-03-06

モデルにとっての記憶とは何か？｜MCP入門 1.4｜生成AIと文脈再現の技術

生成AIは本当に記憶しているのか？実は、AIの“記憶”は文脈の再構築にすぎません。エフェメラルメモリ・永続メモリ・役割設計など、MCP（Model Context Protocol）での記憶制御の仕組みをわかりやすく解説します。

2025-03-06

コンテキストウィンドウとは？生成AIにおける文脈の限界とMCP設計｜MCP入門 1.3

生成AIが扱える“文脈”には上限があります。それがコンテキストウィンドウです。トークン数の制限とは何か、なぜ応答が急に崩れるのか、MCP（Model Context Protocol）における設計の工夫まで、丁寧に解説します。

2025-03-05

プロンプトとコンテクストの違いとは？｜MCP入門 1.2｜生成AIにおける役割と設計の考え方

生成AIを効果的に活用するには、Prompt（命令）とContext（文脈）を分けて設計する必要があります。MCP（Model Context Protocol）の基礎として、この2つの違いと役割、実装への考え方を詳しく解説します。

2025-03-04

RAGの限界と今後の展望とは？幻覚・検索精度・モデル進化にどう向き合うか｜LLM入門第7章

RAGには明確な強みがある一方で、限界や課題も存在します。本章では、幻覚対策やハイブリッド検索の可能性、大規模コンテキストモデルとの関係、そして今後の運用と設計戦略について実践的に整理します。

2025-03-03

RAG設計におけるトークン制限への対処法とは？情報量と生成精度を両立する工夫｜LLM入門 6.4

生成AIにはトークン数の上限という物理的な制約があります。本記事では、Retriever出力やプロンプトを設計する際に考慮すべきトークン制限と、その中で最も有効な情報を渡すための工夫と設計指針を解説します。

2025-03-02

モデルコンテキストの基礎｜MCP入門第1章｜生成AIが文脈を理解する仕組み

生成AIやChatGPTの出力がなぜ“賢く”見えるのか？その鍵は文脈にあります。MCP（Model Context Protocol）の理解に必要な、AIと文脈の関係、プロンプトとの違い、コンテキストウィンドウの制約などをわかりやすく解説します。

2025-03-02

RAG構築に使える主要ツールとサービスの選び方｜LLM入門第5章

RAGを実装するには、適切なツールやサービスの選定が不可欠です。本章では、OpenAI Embeddings、LangChain、LlamaIndex、Azure Cognitive Searchなど、RAG構築に役立つ代表的な選択肢を比較・解説します。

2025-02-21

RAGでFAQ対応を自動化する方法と効果とは？顧客サポートをAIで強化｜LLM入門 3.2

RAGを活用したFAQ対応Botは、顧客の自然な質問に対して意味ベースで文書を検索し、正確でわかりやすい回答を生成します。本記事では、EC事業者の導入事例とともに、設計・運用のポイントや導入効果を具体的に解説します。

2025-02-13

RAGは何に向いている？生成AIの得意・不得意を整理｜LLM入門 2.4

RAGは社内ナレッジ検索やFAQ応答に優れた効果を発揮しますが、数値計算やリアルタイム情報の処理には課題もあります。本記事では、RAGが得意なユースケースと不得意な場面を丁寧に解説し、導入判断の視点を提供します。

2025-02-10

RAGと従来の検索の違いとは？意味ベース検索と生成の融合を解説｜LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

RAGの中核構造：RetrieverとGeneratorの役割と分離設計｜LLM入門 2.2

RAGにおいて、Retriever（検索部）とGenerator（生成部）の明確な分離は高精度な応答生成の鍵となります。本記事では、それぞれの役割、構造、設計上のメリットについて詳しく解説し、柔軟で拡張性のあるAI構築のための基盤を紹介します。

2025-02-08

RAGとは何か？検索と生成をつなぐ新しいAIアーキテクチャの全体像｜LLM入門第2章

RAG（Retrieval-Augmented Generation）は、検索と生成を組み合わせた新しい生成AIの構造です。本章では、RAGの基本構造、RetrieverとGeneratorの役割、従来の検索との違い、得意・不得意なケースまで、全体像を体系的に解説します。

2025-02-06

RAGとは何か？「知識の外部化」という新しいAI設計思想｜LLM入門 1.3

従来のAIは知識をモデルに内在化させる方式が主流でした。しかし、変化の激しい業務環境では「知識の外部化」が重要になります。本記事では、RAGによって実現される知識とモデルの分離という設計思想の本質を解説します。

2025-02-05

なぜRAGが必要とされるのか？｜業務利用で見える生成AIの限界とは｜LLM入門 1.2

ChatGPTを業務に導入しようとすると、正確性・柔軟性・更新性に課題が見えてきます。本記事では、企業利用における生成AIの限界と、RAG（Retrieval-Augmented Generation）という新たなアプローチの登場背景を解説します。

2025-02-04

ChatGPTだけでは業務に使えない理由とは？｜生成AIの限界とRAGの必要性｜LLM入門 1.1

ChatGPTは汎用的な質問に対しては強力なツールですが、業務利用では限界があります。本記事では、固有知識の欠如、幻覚（hallucination）、情報の鮮度といった構造的課題を解説し、RAGという新たなアプローチの必要性を明らかにします。

2025-02-03

なぜ今RAGが必要なのか？｜ChatGPTの限界と知識の外部化｜LLM入門第1章

ChatGPTだけでは業務に使えない──その理由は、固有情報の欠如や幻覚、情報の鮮度にあります。本章では、こうした生成AIの限界と、RAG（Retrieval-Augmented Generation）が求められる背景を丁寧に解説します。

2025-02-02

RAGで業務AIを強化する方法とは？｜LLM入門：検索と統合の仕組みを解説

RAG（Retrieval-Augmented Generation）は、大規模言語モデルに社内ナレッジやFAQを統合し、業務に使えるAIを構築する鍵です。本記事ではRAGの仕組み、活用例、導入のステップまで、わかりやすく解説します。

2025-02-01

4.3 LLMのモデル圧縮技術｜知識蒸留、量子化、プルーニングの解説

知識蒸留、量子化、プルーニングなどのモデル圧縮技術を使い、LLMの計算コストと推論速度を改善する方法を解説します。Pythonの実装例も紹介。

2024-11-15

3.1 確率論と統計 - LLMにおける言語生成と予測の基礎

確率論と統計は、LLMの言語生成や次の単語の予測において重要な役割を果たします。n-gramモデル、マルコフ連鎖、最大尤度推定（MLE）など、LLMの予測精度を向上させる数理的手法について解説します。

2024-10-09

2.1 LLM（大規模言語モデル）とは、人間の言葉を“理解しようとする”AIのしくみ

自然言語処理（NLP）の基本概念と、その数学的手法を解説します。確率論、統計、線形代数を利用したアプローチを通じて、NLPがどのようにテキストを理解・生成し、LLMに応用されているのかを紹介します。

2024-10-06

7.0 LLMの未来の展望と課題 | モデル進化、省リソース、マルチモーダル統合

LLM（大規模言語モデル）の未来の発展と課題をエンジニア向けに解説。モデルの拡大、省リソーストレーニング、マルチモーダルモデルとの統合、データ倫理、法的規制など、技術的・倫理的な課題を詳述します。

2024-09-27

2.1 トランスフォーマーモデルの説明 | 自己注意メカニズムとエンコーダー・デコーダー構造

LLM（大規模言語モデル）に使われるトランスフォーマーモデルの仕組みを解説。自己注意メカニズム、エンコーダー・デコーダーアーキテクチャ、並列処理によるスケーラビリティなど、エンジニア向けにトランスフォーマーの基本を詳述。

2024-09-07

2.0 LLMの基本的な仕組み | トランスフォーマーと注意機構の解説

LLM（大規模言語モデル）の基本的な仕組みをエンジニア向けに解説。トランスフォーマーモデル、注意機構（Attention Mechanism）、BERT、GPT、T5などの代表的なモデルの特徴を詳しく説明します。

2024-09-06