LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 57 件の記事があります。 | 現在 2 ページ中の 1 ページ目です。

第14章 — エンジニアのための実践的知識

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第9章 — スケールでの学習

LLM Primer II シリーズの第9章を紹介します。データ前処理が後段すべてを静かに左右する数学、ミニバッチと並列化の力学、そして数千の GPU にまたがる学習を数値的に安定に保つための、思いのほか繊細な工夫を、控えめに整理します。

2026-03-11

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第6章 — Transformer ブロック

LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。

2026-03-08

第5章 — 位置、順序、系列の構造

LLM Primer II シリーズの第5章をご紹介させていただきます。Attention が抱えていた「順序を見ない」という静かな不具合を、正弦波エンコーディング、相対位置、RoPE、そして Fourier の視点から控えめにたどってまいります。

2026-03-07

第4章 — Attention

LLM Primer II シリーズの第4章をご紹介させていただきます。Attention を直観から導出し、クエリ・キー・バリューの幾何、softmax の温度、マルチヘッド構造、そして Attention をカーネル法として読み直す視点まで、控えめに歩いてまいります。

2026-03-06

第2章 — LLM を文脈に置く

LLM Primer II シリーズの第2章です。前作『LLM Primer』の素朴な物語と、本書の数学とを橋渡しする章。LLM とはなにか、事前学習・パラメータ・スケール、データとしての言語、そしてトランスフォーマーが風景を塗り替えた理由。

2026-03-04

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

第12章 — 自分の LLM システムを構築する: データセットから本番まで

LLM Primer I シリーズの第12章です。最終章。LLM 駆動システムをエンドツーエンドで構築するために本当に必要なもの — データセットとライセンス、学習パイプライン、評価フレームワーク、統合アプリケーションスタック、そして成功するデプロイメントを失敗するパイロットから分けるケーススタディのパターンを扱います。

2026-03-01

第11章 — 最先端の研究: MoE、推論モデル、新しいスケーリング軸

LLM Primer I シリーズの第11章です。すでに本番の現実となった研究フロンティア — Mixture-of-Experts、検索で拡張するメモリ、ネイティブマルチモーダルのトークン化、継続学習、そして今日の推論モデルを生み出した Inference-Time Scaling のパラダイムを解説します。2026年版で最大のコンテンツ追加です。

2026-02-28

第8章 — アプリケーションで LLM を使う: チャットボット、コード、抽出、エージェント

LLM Primer I シリーズの第8章です。実際に本番で動くアプリケーションパターン — チャットボット、要約、コードアシスタント、構造化抽出、そしてモデル自身がツール利用ループを駆動するエージェント型システムの台頭を解説します。さらに、エンジニアが名前で押さえておくべきベンチマーク群も整理します。

2026-02-25

第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル

LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。

2026-02-24

第5章 — 大規模モデルの学習: フロンティアモデルを支える本当のコスト

LLM Primer I シリーズの第5章です。フロンティア LLM が実際にどう学習されるか — データパイプライン、損失関数、数か月にわたる GPU 時間、そして「学習」が今や研究よりも産業規模のエンジニアリング問題になっている理由を解説します。数億ドル規模の学習ランが何にお金を払っているかを解きほぐします。

2026-02-22

第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身

LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。

2026-02-21

第3章 — 言語のためのニューラルネットワーク: RNN から Self-Attention へ

LLM Primer I シリーズの第3章です。なぜ Feedforward では言語を扱えなかったか、RNN がどう壁にぶつかったか、そして Attention が何を変えたかを解説します。現代の NLP を定義した3つのニューラルネットワーク形態を、数学アレルギーなしで整理できる構成です。

2026-02-20

第1章 — 大規模言語モデルとは何か (見出しの先へ)

LLM Primer I シリーズの第1章です。「大規模」「言語」「モデル」が本当に何を意味するのかをひも解き、ルールベースシステムからニューラルネットへの移行を追い、現代のLLMの動作についての3つの大きな誤解を取り上げます。この先のすべての土台となる、明快で読みやすい入口です。

2026-02-18

LLM Primer I 章ごとのウォークスルー — シリーズ序文とインデックス

LLM Primer I:『生成AIの仕組み』の章ごとに紹介する全12回シリーズの序文とインデックスです。順番に読むことも、関心のある章だけを選んで読むこともできます。12本すべての記事をここから辿れます。

2026-02-17

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM入門書シリーズは、大規模言語モデルとどう向き合うかを、全7巻にわたって扱う入門書です。第1巻の基礎から、第6巻の本番運用、第7巻の安全性まで、巻ごとに別の角度から取り上げています。このページでは、シリーズ全体の構成と、すでに読める第1巻・第2巻について、章ごとの解説をまとめて紹介します。

2026-02-15

MCPの未来と標準化への道とは?|MCP入門 7.0|AI文脈設計の次なるステージとグローバル接続性

Model Context Protocol(MCP)はAIの文脈理解と再現性を支える設計思想です。最終章では、各社LLMとの親和性、Memory API連携、W3C標準化、人格と役割の制御まで、MCPの未来像を展望します。

2025-04-01

ツール活用 / マルチエージェントシステムでのMCP適用例とは?|MCP入門 5.4|複数エージェントとツールを統合する文脈設計

ツール活用やマルチエージェント設計では、AIが状態や目的を共有しながら協調する必要があります。MCPを活用することで、共通の文脈管理・状態同期・出力整理を実現し、複雑な連携を安定運用できる方法を解説します。

2025-03-26

MCP実装の基本設計パターンとは?|MCP入門 第3章|生成AIをプロダクトに組み込むための考え方

MCP(Model Context Protocol)をプロダクトや業務システムに実装するには、文脈・状態・履歴・ユーザー情報の扱い方を設計パターンとして整理する必要があります。本章ではMCPの構造化・再現性・スケーラビリティを支える4つの設計手法を紹介します。

2025-03-12

従来のプロンプト設計とMCPの違いとは?|MCP入門 2.2|生成AI設計の新常識

プロンプトエンジニアリングでは限界がある。MCP(Model Context Protocol)は、文脈と状態を分離・構造化することで、一貫性・拡張性・再現性を備えた生成AIの設計を可能にします。従来手法との違いを比較しながら丁寧に解説。

2025-03-09

RAG時代の設計者とは?検索と生成をつなぎ、AIを業務に根づかせる方法|LLM入門 終章

RAGの本質は、情報の選別と構造化を通じて生成AIの文脈を設計すること。本章では、生成AI時代に求められる「検索と生成をつなぐ設計者」の役割と、今後の学びと実装の地図を示します。

2025-03-08

RAGは今後も必要か?生成AI時代における検索設計の価値と使い続ける理由|LLM入門 7.4

長文処理に優れたLLMが登場する中で、RAGを使い続ける意味とは何か。本記事では、情報制御・更新性・出典明示・組織ナレッジ活用という観点から、RAGの価値と今後の活かし方を再評価します。

2025-03-07

RAGを強化するハイブリッド検索とMulti-Vector戦略とは?検索の多視点化と精度向上の設計|LLM入門 7.2

意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。

2025-03-05

大規模言語モデルと対話型AIの「思考状態」を設計するプロトコルの基礎と応用

ChatGPTをはじめとする大規模言語モデル(LLM)の応答精度を高める鍵、それがModel Context Protocol(MCP)です。AIに“文脈”を理解させる新しい設計手法を、初心者にもわかりやすく解説します。

2025-03-01

LlamaIndexとは何か?RAGにおける文書インデックス構築の強みとLangChainとの違い|LLM入門 5.3

LlamaIndexは、RAGの文書処理とインデックス管理に特化したライブラリです。本記事では、LlamaIndexの設計思想と主要機能、LangChainとの違いや併用パターン、実務での活用シーンを丁寧に解説します。

2025-02-24

RAGは何に向いている?生成AIの得意・不得意を整理|LLM入門 2.4

RAGは社内ナレッジ検索やFAQ応答に優れた効果を発揮しますが、数値計算やリアルタイム情報の処理には課題もあります。本記事では、RAGが得意なユースケースと不得意な場面を丁寧に解説し、導入判断の視点を提供します。

2025-02-10

RAGと従来の検索の違いとは?意味ベース検索と生成の融合を解説|LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

RAGとは?検索と生成を組み合わせた新しいAIの仕組み|LLM入門 2.1

RAG(Retrieval-Augmented Generation)は、外部知識を検索してLLMの応答に活かす次世代アーキテクチャです。本記事では、RAGの基本フローや構成要素、従来の生成AIとの違いを図解的にわかりやすく解説します。

2025-02-07

RAGとは何か?検索と生成をつなぐ新しいAIアーキテクチャの全体像|LLM入門 第2章

RAG(Retrieval-Augmented Generation)は、検索と生成を組み合わせた新しい生成AIの構造です。本章では、RAGの基本構造、RetrieverとGeneratorの役割、従来の検索との違い、得意・不得意なケースまで、全体像を体系的に解説します。

2025-02-06

なぜRAGが必要とされるのか?|業務利用で見える生成AIの限界とは|LLM入門 1.2

ChatGPTを業務に導入しようとすると、正確性・柔軟性・更新性に課題が見えてきます。本記事では、企業利用における生成AIの限界と、RAG(Retrieval-Augmented Generation)という新たなアプローチの登場背景を解説します。

2025-02-04

5.2 コンテキストを保持したマルチターン会話の実装|LLM活用ガイド

LLMを用いたコンテキストを保持したマルチターン会話の実装方法を紹介。FlaskとRedisを使用したスケーラブルなチャットボットの設計とPythonのサンプルコードを掲載。

2024-11-18

5.1 LLMを活用したチャットボットの基本アーキテクチャ|Python実装ガイド

LLMを活用したチャットボットの基本アーキテクチャとPythonによる簡単なAPI実装例を紹介。FlaskやFastAPIを使用したスケーラブルな設計方法を解説。

2024-11-17

5.0 LLMを活用したチャットボット構築ガイド|Pythonでの実装例付き

LLMを活用してチャットボットを構築する方法を解説。Pythonでの実装例と、スケーラブルなデプロイ手法も紹介。

2024-11-16

LLM入門:Pythonを用いたLLMアプリケーション構築ガイド | API設計、微調整、デプロイ

Pythonエンジニア向けに、LLM(大規模言語モデル)を活用したアプリケーションの構築方法を徹底解説。FlaskやFastAPIを使ったAPI設計、モデルの微調整(ファインチューニング)、データ前処理の自動化、推論速度の最適化、Docker/Kubernetesを使ったデプロイまで、実践的な内容をカバーします。

2024-11-01

5.0 勾配降下法とモデル最適化 - LLMのトレーニング手法解説

勾配降下法は、LLM(大規模言語モデル)のトレーニングにおける重要な最適化手法です。クロスエントロピー損失やミニバッチ勾配降下法、勾配クリッピングを使ってモデルの精度を向上させる仕組みを解説します。

2024-10-13

4.2 マルチヘッドアテンションの数理 - トランスフォーマーモデルにおける文脈理解の強化

トランスフォーマーモデルのマルチヘッドアテンションについて詳しく解説します。各ヘッドが異なる視点から文中の単語間の関連性を捉える仕組みと、その数理的な背景について説明します。

2024-10-12

4.1 セルフアテンションメカニズム - トランスフォーマーモデルの数理的基盤

トランスフォーマーモデルのセルフアテンションメカニズムについて詳しく解説します。クエリ、キー、バリューを用いた行列演算による単語間の関連度計算と、ソフトマックス関数を使った正規化を説明します。

2024-10-11

4.0 トランスフォーマーの数理 - セルフアテンションとマルチヘッドアテンションの仕組み

トランスフォーマーモデルにおける数理的な仕組みを解説します。セルフアテンションメカニズムの行列演算や、マルチヘッドアテンションによる文脈理解の向上について詳しく説明します。

2024-10-11

3.2 線形代数とベクトル空間 - LLMにおける単語埋め込みの数理的基盤

線形代数はLLM(大規模言語モデル)の数理的基盤です。単語の埋め込みやベクトル空間内での操作、コサイン類似度を用いた単語の関係性の解析について詳しく解説します。

2024-10-10

3.0 LLMの数理モデル - 確率論と線形代数の基礎解説

LLMの動作に深く関わる数理モデルについて解説します。確率論や統計がどのように言語生成に使われ、線形代数が単語埋め込みやベクトル空間での計算にどのように貢献しているのかを詳しく説明します。

2024-10-08

トランスフォーマーモデルとは?仕組みと特徴をやさしく解説|LLM入門 2.4

自然言語処理を飛躍させたトランスフォーマーとは何か?本記事では、大規模言語モデル(LLM)を支える中核技術「トランスフォーマー」の構造やセルフアテンションの考え方を直感的に解説。GPTやChatGPTの背景にある革新的仕組みに触れます。

2024-10-06

自然言語処理(NLP)とは?|LLM入門 2.3|大規模言語モデルがもたらした進化

NLP(自然言語処理)は、人間の言葉をコンピュータが理解・分析・生成するための技術です。本記事では、テキスト分類・翻訳・要約などのNLPの代表的なタスクと、LLM(大規模言語モデル)の登場によって何が変わったのかを簡潔に解説します。

2024-10-06

LLMの構成要素とは?|LLM入門 2.2|トークン・ベクトル・パラメータで理解する内部構造

LLM(大規模言語モデル)の内部で何が起きているのか?本記事では、トークン化・埋め込み(Embedding)・パラメータ・アーキテクチャなど、モデルを構成する基本要素をわかりやすく解説します。自然言語を数値で処理するAIの仕組みを学びましょう。

2024-10-06

2.0 LLMの基本 ―「なぜLLMはここまで注目されているのか?」を整理

本記事では、LLMの基礎概念として、自然言語処理(NLP)の概要とトランスフォーマーモデルの仕組みについて詳しく説明します。LLMがどのようにして膨大なデータを処理し、高精度な結果を出すのかを理解します。

2024-10-06

1.2 確率論の基本と対話生成|LLMの次単語予測を学ぶ

LMは対話を“一単語ずつの確率予測”で生成します。本記事では「P(次の単語|文脈)」の考え方、自己回帰的生成、Top-kサンプリングやTemperature制御まで、確率論の基礎を対話例とともにわかりやすく解説します。

2024-10-04

LLM入門 - 数学で理解する大規模言語モデルの仕組み

大規模言語モデル(LLM)の基礎から応用までを初心者向けにわかりやすく解説。LLMの仕組み、トレーニング、活用方法を体系的に学べる入門ガイド。

2024-10-01

7.1 LLMの大規模モデル進化 | モデルサイズの拡大とその課題、技術的アプローチ

LLM(大規模言語モデル)の進化について解説。モデルサイズの急速な拡大とそれに伴う課題、そして効率的なトレーニング手法や量子化技術など、技術的なアプローチを紹介します。

2024-09-28