LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 57 件の記事があります。 | 現在 2 ページ中の 1 ページ目です。

第14章 — ベンチマーク、テスト、性能

LLM Primer IV ウォークスルー最終回。本物のサーバーに対する MCP-Universe ベンチマーク、明らかになった2つの体系的失敗モード、セッション・パー・リクエストと共有セッション・プールの10倍スループット差、そして第V巻への橋渡し。

2026-04-12

第12章 — プロトコルの堅牢化と防御

LLM Primer IV ウォークスルー第12回。4つの防御クラスタ — 暗号アテステーション、境界付きセッション付きOAuthスコープ規律、ランタイム・サンドボックス、Human-in-the-loopゲート — を組み合わせることで、敵対的条件下でモデルが正しく振る舞うことに依存しない姿勢を作る。

2026-04-10

第10章 — 長期タスクの記憶

LLM Primer IV ウォークスルー第10回。ウィンドウとReActスクラッチパッドによる短期記憶、エピソード・ベクトルと意味ストアによる長期記憶、そして数時間・数日にわたってエージェントを生産的に保つ圧縮技術。

2026-04-08

第8章 — アーキテクチャ的デプロイメント・レイアウト

LLM Primer IV ウォークスルー第8回。MCPエコシステムに現れた3つのデプロイメント・レイアウト — 再利用可能エージェント、厳格純粋、ハイブリッド — と、どれがどのプロジェクトに合うかを決める4つの拘束条件。

2026-04-06

第7章 — 高度な協働・動的パターン

LLM Primer IV ウォークスルー第7回。ラウンドテーブル合意、ハンドオフ・ルーティング、マジェンティック・オーケストレーション — トポロジがリクエストごとに作られねばならないときに現れるパターンと、単純なパターンが避ける失敗モード(終わらない、誤ルーティング、暴走する計画)。

2026-04-05

第6章 — オーケストレーションの基本

LLM Primer IV ウォークスルー第6回。オーケストレーションの基本形 — 逐次パイプラインと並行スキャッタ・ギャザー — と、その前にチームが問うべき前提の問い: そもそもマルチ・エージェントが正解か。

2026-04-04

第5章 — トランスポートプロトコルとディスカバリ

LLM Primer IV ウォークスルー第5回。MCPがサポートする3つのトランスポート、Server Cardを含む.well-knownディスカバリ層、そしてサーバーが協調的なネットワーク市民か負債かを決める地味な運用上の関心事 — CORS、Origin検証、キャッシュ。

2026-04-03

第2章 — インテリジェント文書パース

LLM Primer III ウォークスルー第2回。PDF はテキストファイルではなく、レイアウト指定書である。素朴な変換が何を捨て、レイアウト認識パーサーは何を取り戻すのか。LlamaParse、Docling、Unstructured、Marker-PDF、Firecrawl、DeepSeek-OCR の現在地と、ページ画像を直接検索するマルチモーダル系の道筋を整理します。

2026-03-19

第1章 — RAGアーキテクチャの進化

LLM Primer III ウォークスルー第1回。ベースモデルの2つの構造的制約 — 凍結された知識と、出典が示せないこと — に対するアーキテクチャ上の単一の答えが、3年で4つの顔を持つに至った話です。Naive、Advanced、Modular、Agentic という4つの姿勢と、検索よりもファインチューニングが効く場面を整理します。

2026-03-18

LLM Primer III — シリーズ紹介とインデックス

LLM Primer シリーズ第3巻『RAGで強化するエンタープライズAI』を、章ごとに紹介していくウォークスルーの初回です。なぜ検索拡張生成は、外から見ると単純で、中を開けると工程の積み重ねなのか。本書を誰に向けて書いたか、そして3月18日から28日までの11日間の進行を最初にお伝えします。

2026-03-17

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第6章 — Transformer ブロック

LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。

2026-03-08

第4章 — Attention

LLM Primer II シリーズの第4章をご紹介させていただきます。Attention を直観から導出し、クエリ・キー・バリューの幾何、softmax の温度、マルチヘッド構造、そして Attention をカーネル法として読み直す視点まで、控えめに歩いてまいります。

2026-03-06

第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸

LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。

2026-02-28

第10章 — 安全性、倫理、信頼: マーケティングの先へ

LLM Primer I シリーズの第10章です。LLM の安全性についての正直な像 — なぜハルシネーションが構造的に起きるのか、バイアスは本当はどこに宿るのか、多層ガードレールはどう機能するのか、そしてなぜ技術的コントロールでは置き換えられない制度的レイヤーがガバナンスなのかを解説します。安全に「出す」必要のある実務者向けです。

2026-02-27

第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント

LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。

2026-02-25

第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル

LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。

2026-02-24

第6章 — ファインチューニングと適応: 生のモデルから役に立つアシスタントへ

LLM Primer I シリーズの第6章です。プロンプトベースの安価な操作から、パラメータ効率の良いファインチューニング、そして RLHF やその現代的な後継 DPO による本格的なアライメントまで、適応の全スタックを扱います。なぜ今や API 型クローズドモデルの差別化要因が後学習にあるのかも整理します。

2026-02-23

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17

OpenAI GPT、Claude、Geminiの文脈処理とは?|MCP入門 7.1|各社LLMの設計思想とMCPの位置づけ

各社LLMは文脈や状態の扱い方に独自のアプローチを持っています。本記事ではOpenAI GPTのSystem MessageとMemory API、Claudeの自己内省型設計、Geminiのマルチモーダル連携を比較し、MCPが果たす中立的な役割を明らかにします。

2025-04-02

JSONスキーマによる状態制御の工夫とは?|MCP入門 6.4|一貫性あるAI応答を実現する構造的設計

生成AIの応答を安定化させるには、“状態”の明示が不可欠です。本記事では、MCP設計におけるJSONスキーマの活用方法を詳しく解説し、意図や画面状況をモデルに正しく伝える設計戦略を紹介します。

2025-03-31

ツール活用 / マルチエージェントシステムでのMCP適用例とは?|MCP入門 5.4|複数エージェントとツールを統合する文脈設計

ツール活用やマルチエージェント設計では、AIが状態や目的を共有しながら協調する必要があります。MCPを活用することで、共通の文脈管理・状態同期・出力整理を実現し、複雑な連携を安定運用できる方法を解説します。

2025-03-26

マルチセッションとユーザー管理とは?|MCP入門 4.3|生成AIで複数会話と文脈を自在に制御する方法

一人のユーザーが複数の会話・プロジェクト・目的を同時に扱う時代において、セッション分離と状態復元は不可欠です。本章では、MCPを活用したマルチセッション設計、履歴管理、テンプレート切替、セキュリティまでを詳しく解説します。

2025-03-20

複数モデル(LLM)の使い分け設計とは?|MCP入門 4.2|GPT-4・Claude・Geminiをタスクごとに最適活用

GPT-4、Claude、Geminiなど複数のLLMを目的に応じて使い分ける設計は、生成AIの品質・速度・コスト最適化に不可欠です。本節では、MCPによる役割分担、タスク別・属性別・フォールバック・ワークフロー設計を詳しく解説します。

2025-03-19

MCPの拡張と統合とは?|MCP入門 第4章|RAG・マルチモデル・外部ツール連携の設計手法

MCP(Model Context Protocol)の応用編として、RAGの統合、複数LLMの使い分け、マルチセッション管理、外部ツールとの連携など、生成AIを高度に運用するための設計フレームワークを解説します。

2025-03-17

ユーザー状態とモデル状態の同期とは?|MCP入門 3.4|生成AIの一貫した応答設計

生成AIの出力の一貫性を保つには、ユーザーとモデルの状態を同期させることが重要です。MCPでは、セッションメモリ、タスク管理、ステートマシン、感情トラッキングなどを活用して文脈と目的を揃える設計が求められます。

2025-03-16

OpenAI Function CallingとMCPの関係とは?|MCP入門 2.4|生成AIの構造化出力と実装設計

OpenAIのFunction Callingは、生成AIが構造化された出力を返す仕組みです。MCP(Model Context Protocol)の文脈・状態設計と深く関係し、再現性や拡張性の高いAI実装を支えます。本節ではその原理と設計のポイントを丁寧に解説します。

2025-03-11

Model Context Protocol(MCP)とは何か?|MCP入門 第2章|生成AIの文脈設計の新常識

MCP(Model Context Protocol)とは、生成AIにおける文脈と状態を体系的に制御・再現するための設計原則です。本章ではMCPの定義、従来のプロンプト設計との違い、状態設計による一貫性の向上、実装例などをわかりやすく解説します。

2025-03-07

RAGは本当に不要になるのか?長文対応LLM時代の検索戦略を再考する|LLM入門 7.3

GPT-4 128kやClaude 2の登場により、「検索せず全文渡す」構成が可能になってきました。本記事ではRetrieval不要論の背景と現実的な限界、そしてRAGの再定義について丁寧に解説します。

2025-03-06

RAG設計におけるトークン制限への対処法とは?情報量と生成精度を両立する工夫|LLM入門 6.4

生成AIにはトークン数の上限という物理的な制約があります。本記事では、Retriever出力やプロンプトを設計する際に考慮すべきトークン制限と、その中で最も有効な情報を渡すための工夫と設計指針を解説します。

2025-03-02

RAGに適したベクトル検索エンジンとは?FAISS・Weaviate・Pinecone徹底比較|LLM入門 4.2

RAGの検索性能を支えるのがベクトル検索エンジンです。本記事では、FAISS・Weaviate・Pineconeといった代表的エンジンの特徴を比較し、導入時に重視すべき観点や選定ポイントをわかりやすく解説します。

2025-02-18

RAGは何に向いている?生成AIの得意・不得意を整理|LLM入門 2.4

RAGは社内ナレッジ検索やFAQ応答に優れた効果を発揮しますが、数値計算やリアルタイム情報の処理には課題もあります。本記事では、RAGが得意なユースケースと不得意な場面を丁寧に解説し、導入判断の視点を提供します。

2025-02-10

RAGと従来の検索の違いとは?意味ベース検索と生成の融合を解説|LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

7.3 マルチモーダルモデルとLLMの統合 | テキスト、画像、音声、映像の融合技術

マルチモーダルモデルとLLMの統合により、テキスト、画像、音声、映像を同時に処理することで、より深い理解と高精度な応答が可能になります。具体的な技術と応用例を紹介します。

2024-11-26

7.2 LLMの省リソーストレーニング技術 | 蒸留、量子化、スパース化、分散トレーニング

LLMのトレーニングにおける省リソース技術を解説。モデル蒸留、量子化、スパース化、分散トレーニングの手法でコストを削減しながら性能を維持する方法を紹介します。

2024-11-25

7.1 LLMの大規模モデル進化 | 性能向上と技術的課題

LLMの大規模モデル化による性能向上と、計算リソースやトレーニングコストの課題を解説。エンジニアが対応すべき技術と今後の展望を紹介します。

2024-11-25

5.3 NLUとNLGの活用|高度なチャットボットの設計と実装

NLU(自然言語理解)とNLG(自然言語生成)の技術を使用して、よりインテリジェントなチャットボットを構築する方法をPythonの実装例とともに解説。

2024-11-19

5.2 コンテキストを保持したマルチターン会話の実装|LLM活用ガイド

LLMを用いたコンテキストを保持したマルチターン会話の実装方法を紹介。FlaskとRedisを使用したスケーラブルなチャットボットの設計とPythonのサンプルコードを掲載。

2024-11-18

5.1 LLMを活用したチャットボットの基本アーキテクチャ|Python実装ガイド

LLMを活用したチャットボットの基本アーキテクチャとPythonによる簡単なAPI実装例を紹介。FlaskやFastAPIを使用したスケーラブルな設計方法を解説。

2024-11-17

LLM入門:Pythonを用いたLLMアプリケーション構築ガイド | API設計、微調整、デプロイ

Pythonエンジニア向けに、LLM(大規模言語モデル)を活用したアプリケーションの構築方法を徹底解説。FlaskやFastAPIを使ったAPI設計、モデルの微調整(ファインチューニング)、データ前処理の自動化、推論速度の最適化、Docker/Kubernetesを使ったデプロイまで、実践的な内容をカバーします。

2024-11-01

5.0 勾配降下法とモデル最適化 - LLMのトレーニング手法解説

勾配降下法は、LLM(大規模言語モデル)のトレーニングにおける重要な最適化手法です。クロスエントロピー損失やミニバッチ勾配降下法、勾配クリッピングを使ってモデルの精度を向上させる仕組みを解説します。

2024-10-13

4.2 マルチヘッドアテンションの数理 - トランスフォーマーモデルにおける文脈理解の強化

トランスフォーマーモデルのマルチヘッドアテンションについて詳しく解説します。各ヘッドが異なる視点から文中の単語間の関連性を捉える仕組みと、その数理的な背景について説明します。

2024-10-12

4.0 トランスフォーマーの数理 - セルフアテンションとマルチヘッドアテンションの仕組み

トランスフォーマーモデルにおける数理的な仕組みを解説します。セルフアテンションメカニズムの行列演算や、マルチヘッドアテンションによる文脈理解の向上について詳しく説明します。

2024-10-11

3.2 線形代数とベクトル空間 - LLMにおける単語埋め込みの数理的基盤

線形代数はLLM(大規模言語モデル)の数理的基盤です。単語の埋め込みやベクトル空間内での操作、コサイン類似度を用いた単語の関係性の解析について詳しく解説します。

2024-10-10

2.1 LLM(大規模言語モデル)とは、人間の言葉を“理解しようとする”AIのしくみ

自然言語処理(NLP)の基本概念と、その数学的手法を解説します。確率論、統計、線形代数を利用したアプローチを通じて、NLPがどのようにテキストを理解・生成し、LLMに応用されているのかを紹介します。

2024-10-06

7.4 LLMにおけるデータ倫理とバイアス問題 | 公平性を高めるための対策

LLM(大規模言語モデル)のデータ倫理とバイアスの問題について解説。バイアスの発生要因とその影響、バイアス軽減のための対策、法的・社会的な影響についてエンジニア向けに詳述します。

2024-10-01

LLM入門 - 数学で理解する大規模言語モデルの仕組み

大規模言語モデル(LLM)の基礎から応用までを初心者向けにわかりやすく解説。LLMの仕組み、トレーニング、活用方法を体系的に学べる入門ガイド。

2024-10-01

7.3 LLMとマルチモーダルモデルの統合 | 画像、音声、映像との連携による未来のAI

LLM(大規模言語モデル)とマルチモーダルモデルの統合について解説。テキスト以外のデータ(画像、音声、映像など)との連携により、AIシステムの認識能力が飛躍的に向上する具体的な応用例や技術的課題、未来の展望を紹介。

2024-09-30

7.2 省リソースでのLLMトレーニング | モデル蒸留、量子化、分散トレーニングの手法

LLM(大規模言語モデル)を省リソースでトレーニングするための技術を解説。モデル蒸留、量子化、分散トレーニング、データ効率の改善など、エンジニア向けにリソース削減のための手法を紹介します。

2024-09-29