LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 35 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第11章 — 評価、キャリブレーション、推論

LLM Primer II シリーズの第11章です。「何でも生成できる」機械を、いったいどうやって測るのか。パープレキシティで内在的な精度を見、キャリブレーションで自信と正答率のズレを測り、ベンチマーク値に誤差棒をつけ、ハルシネーションを RAG の幾何で抑える。第III部の締めくくりとして、誠実な評価の道具立てを整えます。

2026-03-13

第10章 — ポストトレーニングとアラインメントの数学

LLM Primer II シリーズの第10章です。事前学習で出来上がった「賢いが野生のままの次トークン予測器」を、いかにして役に立つアシスタントへと飼い慣らすか。教師ありファインチューニング、Bradley–Terry に基づく報酬モデル、KL の手綱付き RLHF、そして報酬モデルも RL ループも消し去る DPO の鮮やかな導出。アラインメントの数学を、3つの楽章として整理します。

2026-03-12

第8章 — モデルはどう学ぶか

LLM Primer II シリーズの第8章を紹介します。古典的な統計学習理論が「過学習するはず」と告げる規模で、なぜ大規模モデルは汎化してしまうのか。勾配降下法の暗黙的バイアス、スケーリング則、そして「まだ分かっていないこと」を、控えめに整理します。

2026-03-10

第7章 — 効率と Transformer の派生

LLM Primer II シリーズの第7章をご紹介させていただきます。Attention の O(n²)、GPU メモリとスループットの算数、FlashAttention の導出、そしてマルチクエリ・ゲート・低ランクといった派生たちを、控えめに見渡してまいります。

2026-03-09

第6章 — Transformer ブロック

LLM Primer II シリーズの第6章をご紹介させていただきます。フィードフォワード層、活性化関数、「Attention + FFN」がなぜ補完しあう組み合わせなのか、そして深さと幅が表現力に何をもたらすのかを、控えめに眺めてまいります。

2026-03-08

第2章 — 確率、トークン、テキスト: 次の単語を当てるゲーム

LLM Primer I シリーズの第2章です。LLM がテキストをトークンに変換する仕組み、なぜ言語モデリングが本質的に確率の問題なのか、そして昔の n-gram アプローチが汎化できるニューラルモデルにどう道を譲ったかを解説します。パープレキシティのやさしい言葉での説明と、トークン境界がなぜ重要かも扱います。

2026-02-19

ストラクチャード・コンテキスト vs ナチュラル・プロンプティングとは?|MCP入門 6.3|構造化と柔軟性を両立するプロンプト設計

生成AIに文脈を渡すには、JSON形式の構造化データか自然言語プロンプトか、どちらが適切か。本記事では、MCP設計において“ストラクチャード・コンテキスト”と“ナチュラル・プロンプティング”の違いと併用戦略を詳しく解説します。

2025-03-30

システムメッセージ vs ユーザープロンプトとは?|MCP入門 6.2|LLMの人格と応答品質を分ける設計手法

プロンプトには“誰が話すか”という役割の違いがあります。本記事では、システムメッセージとユーザープロンプトの違いを明確化し、モデルの態度・目的意識・人格形成に与える影響、MCP設計への応用を詳しく解説します。

2025-03-29

“明示的な制約”と“暗黙の指示”の違いとは?|MCP入門 6.1|AIが期待に応えるためのプロンプト設計術

生成AIは指示されたことだけでなく、空気や文脈を読むことも求められます。本記事では、プロンプトにおける“明示的な制約”と“暗黙の指示”の違いを解説し、MCP設計を通じて誤解を防ぎ、意図通りの応答を得るための設計手法を紹介します。

2025-03-28

モデルの“意図解釈”と状態伝達とは?|MCP入門 6.0|プロンプトに込められた意図を理解するLLM設計

LLMが正しく応答するためには、文脈だけでなく“何を求められているか”という意図を読み取る力が不可欠です。本章では、明示的な制約・システムメッセージ・構造化文脈などを通じて、モデルがどのように内部状態を形成するかを解説します。

2025-03-27

チャットボットの履歴管理とは?|MCP入門 5.1|スコープ制御で精度とコストを最適化する設計

生成AIチャットボットの応答品質は、会話履歴の設計に大きく左右されます。本記事では、MCPを活用して履歴の粒度・要約・トピック切り替えを制御し、自然かつ効率的なチャット体験を作る方法を解説します。

2025-03-23

マルチセッションとユーザー管理とは?|MCP入門 4.3|生成AIで複数会話と文脈を自在に制御する方法

一人のユーザーが複数の会話・プロジェクト・目的を同時に扱う時代において、セッション分離と状態復元は不可欠です。本章では、MCPを活用したマルチセッション設計、履歴管理、テンプレート切替、セキュリティまでを詳しく解説します。

2025-03-20

従来のプロンプト設計とMCPの違いとは?|MCP入門 2.2|生成AI設計の新常識

プロンプトエンジニアリングでは限界がある。MCP(Model Context Protocol)は、文脈と状態を分離・構造化することで、一貫性・拡張性・再現性を備えた生成AIの設計を可能にします。従来手法との違いを比較しながら丁寧に解説。

2025-03-09

MCPとは?生成AIの文脈と状態を設計する仕組み|MCP入門 2.1

MCP(Model Context Protocol)は、生成AIが一貫した出力を生むための文脈と状態を設計・再現するためのプロトコルです。本節ではMCPの定義、プロンプトとの違い、設計思想としての役割を丁寧に解説します。

2025-03-08

プロンプトとコンテクストの違いとは?|MCP入門 1.2|生成AIにおける役割と設計の考え方

生成AIを効果的に活用するには、Prompt(命令)とContext(文脈)を分けて設計する必要があります。MCP(Model Context Protocol)の基礎として、この2つの違いと役割、実装への考え方を詳しく解説します。

2025-03-04

モデルはなぜ文脈を必要とするのか?|MCP入門 1.1|生成AIとコンテキスト理解

ChatGPTをはじめとする生成AIは、入力だけでなく“文脈”によって出力を変えています。なぜ文脈が必要なのか、モデルはどう背景を読み取るのか。MCP設計の基礎となる文脈理解について、具体例を交えて丁寧に解説します。

2025-03-03

Azure Cognitive SearchやElasticでRAGを実現する方法|既存検索基盤を活かす構成とは|LLM入門 5.4

RAGはLangChainやLlamaIndex以外にも、Azure Cognitive SearchやElasticsearchといった既存インフラでも構築可能です。本記事では、それぞれの特徴や適用例、選定ポイントをわかりやすく整理します。

2025-02-25

OpenAI Embeddingsとベクトル検索エンジンの連携方法|RAG構築の基本|LLM入門 5.1

RAGを構築する上で基本となるのが、OpenAIの埋め込みモデルとベクトルストアの組み合わせです。本記事では、text-embedding-ada-002の特徴と、FAISSやPineconeとの連携設計、実装時の注意点を詳しく解説します。

2025-02-22

セマンティック検索とキーワード検索の違いとは?RAGの精度を左右する検索技術|LLM入門 4.4

RAGでは従来のキーワード検索ではなく、意味ベースのセマンティック検索が活用されます。本記事では、両者の違いと特性、ハイブリッド検索の活用法までを比較しながら、実務での使い分け方を丁寧に解説します。

2025-02-20

RAGの回答精度を左右するコンテキスト整形とは?LLMへの最適な情報の渡し方|LLM入門 4.3

RAGにおいてRetrieverが抽出した情報をどのように整形し、LLMに渡すかは、出力の質に直結します。本記事では、プロンプト設計・チャンク構造・トークン最適化など、回答品質を高めるための整形技術を詳しく解説します。

2025-02-19

RAGに適したベクトル検索エンジンとは?FAISS・Weaviate・Pinecone徹底比較|LLM入門 4.2

RAGの検索性能を支えるのがベクトル検索エンジンです。本記事では、FAISS・Weaviate・Pineconeといった代表的エンジンの特徴を比較し、導入時に重視すべき観点や選定ポイントをわかりやすく解説します。

2025-02-18

RAGと従来の検索の違いとは?意味ベース検索と生成の融合を解説|LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

RAGの中核構造:RetrieverとGeneratorの役割と分離設計|LLM入門 2.2

RAGにおいて、Retriever(検索部)とGenerator(生成部)の明確な分離は高精度な応答生成の鍵となります。本記事では、それぞれの役割、構造、設計上のメリットについて詳しく解説し、柔軟で拡張性のあるAI構築のための基盤を紹介します。

2025-02-08

RAGで業務AIを強化する方法とは?|LLM入門:検索と統合の仕組みを解説

RAG(Retrieval-Augmented Generation)は、大規模言語モデルに社内ナレッジやFAQを統合し、業務に使えるAIを構築する鍵です。本記事ではRAGの仕組み、活用例、導入のステップまで、わかりやすく解説します。

2025-02-01

5.0 LLMを活用したチャットボット構築ガイド|Pythonでの実装例付き

LLMを活用してチャットボットを構築する方法を解説。Pythonでの実装例と、スケーラブルなデプロイ手法も紹介。

2024-11-16

6.1 データセットの前処理 - トレーニングデータのクリーニングと最適化方法

LLM(大規模言語モデル)のトレーニングに使用されるデータセットの前処理手法を解説します。データのクリーニング、トークン化、バイアス軽減、サンプリングなど、効果的な学習のためのプロセスを紹介します。

2024-10-17

5.1 損失関数の重要性 - LLMにおけるモデル最適化のカギ

損失関数は、モデルの最適化において重要な役割を果たし、LLMの精度向上に寄与します。クロスエントロピー損失関数や過学習、学習不足の検出に役立つ損失関数の仕組みを解説します。

2024-10-14

4.1 セルフアテンションメカニズム - トランスフォーマーモデルの数理的基盤

トランスフォーマーモデルのセルフアテンションメカニズムについて詳しく解説します。クエリ、キー、バリューを用いた行列演算による単語間の関連度計算と、ソフトマックス関数を使った正規化を説明します。

2024-10-11

3.2 線形代数とベクトル空間 - LLMにおける単語埋め込みの数理的基盤

線形代数はLLM(大規模言語モデル)の数理的基盤です。単語の埋め込みやベクトル空間内での操作、コサイン類似度を用いた単語の関係性の解析について詳しく解説します。

2024-10-10

3.1 確率論と統計 - LLMにおける言語生成と予測の基礎

確率論と統計は、LLMの言語生成や次の単語の予測において重要な役割を果たします。n-gramモデル、マルコフ連鎖、最大尤度推定(MLE)など、LLMの予測精度を向上させる数理的手法について解説します。

2024-10-09

3.0 LLMの数理モデル - 確率論と線形代数の基礎解説

LLMの動作に深く関わる数理モデルについて解説します。確率論や統計がどのように言語生成に使われ、線形代数が単語埋め込みやベクトル空間での計算にどのように貢献しているのかを詳しく説明します。

2024-10-08

2.0 LLMの基本的な仕組み | トランスフォーマーと注意機構の解説

LLM(大規模言語モデル)の基本的な仕組みをエンジニア向けに解説。トランスフォーマーモデル、注意機構(Attention Mechanism)、BERT、GPT、T5などの代表的なモデルの特徴を詳しく説明します。

2024-09-06

1.3 LLMと機械学習の違い | トランスフォーマー、トランスファーラーニング、汎用性の比較

LLM(大規模言語モデル)と従来の機械学習(ML)モデルの違いを解説。トランスフォーマーアーキテクチャの利点、汎用性、データスケーラビリティ、トランスファーラーニングの活用をエンジニア向けに詳しく説明。

2024-09-05

1.2 LLMの自然言語処理における役割 | テキスト生成、質問応答、翻訳、コード生成の応用

LLM(大規模言語モデル)と従来の機械学習(ML)モデルの違いを解説。トランスフォーマーアーキテクチャの利点、汎用性、データスケーラビリティ、トランスファーラーニングの活用をエンジニア向けに詳しく説明。

2024-09-04

LLM入門: しくみから学ぶ 生成AIの基礎

自然言語処理で注目される大規模言語モデル(LLM)の仕組みやトレーニング方法、応用例をエンジニア向けに分かりやすく解説。GPTやBERTなどの最新モデルの解説も含む、実際にLLMを活用するための実践的なガイド。

2024-09-01