LLM入門

このページでは、AI技術に関心のある方のために、LLM(大規模言語モデル)の基礎から応用までをわかりやすく解説します。


合計 43 件の記事があります。 | 現在 1 ページ中の 1 ページ目です。

第14章 — エンジニアのための実践的知識

LLM Primer II 第14章、歩き読みシリーズの最終回です。本書を読み終えたあと、どのように理解を深め続けるか。PyTorch、JAX、Hugging Face、vLLM などの道具立てを数学に重ね、シリーズの次の巻へとご案内します。

2026-03-16

第12章 — LLM の実世界応用

LLM Primer II シリーズの第12章を紹介します。テキスト生成、要約、質問応答、翻訳、推論 — 一見ばらばらに見える応用が、ひとつの「次トークン分布」の上に静かに並んでいることを、これまでの数学のレンズで見直す章です。

2026-03-14

第5章 — 位置、順序、系列の構造

LLM Primer II シリーズの第5章をご紹介させていただきます。Attention が抱えていた「順序を見ない」という静かな不具合を、正弦波エンコーディング、相対位置、RoPE、そして Fourier の視点から控えめにたどってまいります。

2026-03-07

第3章 — 数学的な道具立て

LLM Primer II シリーズの第3章です。本書が必要とする確率と線形代数を、必要な分量で、必要な順番で並べさせていただく短い章。最尤推定としての訓練、ベクトル空間と埋め込み、そして Attention への橋渡し。

2026-03-05

第2章 — LLM を文脈に置く

LLM Primer II シリーズの第2章です。前作『LLM Primer』の素朴な物語と、本書の数学とを橋渡しする章。LLM とはなにか、事前学習・パラメータ・スケール、データとしての言語、そしてトランスフォーマーが風景を塗り替えた理由。

2026-03-04

第1章 — 言語モデルのための数学的直観

LLM Primer II シリーズの第1章です。数式と読み手とのあいだに立っている「壁」を、そっと脇に避けるところから始めます。記号、言語生成のための確率、そして不確かさを測るためのエントロピー。

2026-03-03

LLM Primer II — シリーズ序文と一覧

本書『LLM Primer II — 数学で読み解く言語モデル』を、章ごとに紹介するシリーズの序文と全14章の一覧です。

2026-03-02

第7章 — 次トークン予測の先へ: Embedding、検索、マルチモーダル

LLM Primer I シリーズの第7章です。次トークン予測器をはるかに豊かなものへと押し上げる能力 — Embedding、セマンティック検索、Retrieval-Augmented Generation、そしてマルチモーダル入力への移行を解説します。RAG が LLM を本物の文書に「接地」させ、捏造を抑える仕組みも整理します。

2026-02-24

第4章 — Transformer アーキテクチャ: 現代AIのエンジンの中身

LLM Primer I シリーズの第4章です。Transformer ブロックをツアーします。Self-Attention、位置エンコーディング、層のスタックがどう組み合わさって、現代の LLM の基盤となるアーキテクチャを構成しているか。Transformer のスケーリングがなぜ機能するか、そして何のコストがかかるかも明快に解説します。

2026-02-21

LLM入門書シリーズ — 生成AIを理解するために、分解してみる

LLM入門書シリーズは、大規模言語モデルとどう向き合うかを、全7巻にわたって扱う入門書です。第1巻の基礎から、第6巻の本番運用、第7巻の安全性まで、巻ごとに別の角度から取り上げています。このページでは、シリーズ全体の構成と、すでに読める第1巻・第2巻について、章ごとの解説をまとめて紹介します。

2026-02-15

RAGは本当に不要になるのか?長文対応LLM時代の検索戦略を再考する|LLM入門 7.3

GPT-4 128kやClaude 2の登場により、「検索せず全文渡す」構成が可能になってきました。本記事ではRetrieval不要論の背景と現実的な限界、そしてRAGの再定義について丁寧に解説します。

2025-03-06

RAGを強化するハイブリッド検索とMulti-Vector戦略とは?検索の多視点化と精度向上の設計|LLM入門 7.2

意味検索とキーワード検索を組み合わせるハイブリッド検索、複数の視点から検索するMulti-Vector RAG。どちらもRetrieverの精度と柔軟性を高める先進的な手法です。本記事では構成・効果・導入の注意点を解説します。

2025-03-05

RAGの検索精度を高める設計術:質問の正規化とドキュメントマッチングとは|LLM入門 6.2

自然文のままでは曖昧なユーザー質問を、検索に適した形式へ整える「質問の正規化」と、意味的に関連する文書を適切に選び出す「マッチング戦略」について、RAG実装の視点からわかりやすく解説します。

2025-02-28

Azure Cognitive SearchやElasticでRAGを実現する方法|既存検索基盤を活かす構成とは|LLM入門 5.4

RAGはLangChainやLlamaIndex以外にも、Azure Cognitive SearchやElasticsearchといった既存インフラでも構築可能です。本記事では、それぞれの特徴や適用例、選定ポイントをわかりやすく整理します。

2025-02-25

LlamaIndexとは何か?RAGにおける文書インデックス構築の強みとLangChainとの違い|LLM入門 5.3

LlamaIndexは、RAGの文書処理とインデックス管理に特化したライブラリです。本記事では、LlamaIndexの設計思想と主要機能、LangChainとの違いや併用パターン、実務での活用シーンを丁寧に解説します。

2025-02-24

LangChainでRAGを構築する方法とは?RetrieverからLLM連携まで徹底解説|LLM入門 5.2

LangChainはRAG構築において、Retriever・LLM・プロンプトを一貫してつなぐフレームワークです。本記事では、各モジュールの役割と構成例、導入のメリット・注意点までを、実装の視点からわかりやすく解説します。

2025-02-23

OpenAI Embeddingsとベクトル検索エンジンの連携方法|RAG構築の基本|LLM入門 5.1

RAGを構築する上で基本となるのが、OpenAIの埋め込みモデルとベクトルストアの組み合わせです。本記事では、text-embedding-ada-002の特徴と、FAISSやPineconeとの連携設計、実装時の注意点を詳しく解説します。

2025-02-22

RAG構築に使える主要ツールとサービスの選び方|LLM入門 第5章

RAGを実装するには、適切なツールやサービスの選定が不可欠です。本章では、OpenAI Embeddings、LangChain、LlamaIndex、Azure Cognitive Searchなど、RAG構築に役立つ代表的な選択肢を比較・解説します。

2025-02-21

セマンティック検索とキーワード検索の違いとは?RAGの精度を左右する検索技術|LLM入門 4.4

RAGでは従来のキーワード検索ではなく、意味ベースのセマンティック検索が活用されます。本記事では、両者の違いと特性、ハイブリッド検索の活用法までを比較しながら、実務での使い分け方を丁寧に解説します。

2025-02-20

RAGに適したベクトル検索エンジンとは?FAISS・Weaviate・Pinecone徹底比較|LLM入門 4.2

RAGの検索性能を支えるのがベクトル検索エンジンです。本記事では、FAISS・Weaviate・Pineconeといった代表的エンジンの特徴を比較し、導入時に重視すべき観点や選定ポイントをわかりやすく解説します。

2025-02-18

RAGに欠かせない埋め込みモデルとは?意味検索を支える技術解説|LLM入門 4.1

RAGにおける意味検索の基盤となるのが「埋め込みモデル(Embedding Model)」です。本記事では、OpenAIやSBERTなど代表的モデルの特徴、選定ポイント、チャンク設計との関係をわかりやすく解説します。

2025-02-17

RAGを構築するための技術要素とは?Embeddingから検索・統合まで解説|LLM入門 第4章

RAG(Retrieval-Augmented Generation)を構築・運用するには、埋め込みモデル、ベクトル検索エンジン、プロンプト整形などの技術が欠かせません。本章では、主要な技術コンポーネントとその選定ポイントを体系的に解説します。

2025-02-16

RAG導入の実践ステップと落とし穴とは?PoCから本番運用までの道筋|LLM入門 3.4

RAGはPoC(概念実証)では効果を実感しやすい一方で、実運用への移行には注意点が多数あります。本記事では、導入フェーズにおけるステップと、技術・運用・責任設計の観点から見た“落とし穴”とその回避法を解説します。

2025-02-15

RAGは何に向いている?生成AIの得意・不得意を整理|LLM入門 2.4

RAGは社内ナレッジ検索やFAQ応答に優れた効果を発揮しますが、数値計算やリアルタイム情報の処理には課題もあります。本記事では、RAGが得意なユースケースと不得意な場面を丁寧に解説し、導入判断の視点を提供します。

2025-02-10

RAGと従来の検索の違いとは?意味ベース検索と生成の融合を解説|LLM入門 2.3

RAGは従来のキーワード検索やFAQとは異なり、意味的に関連する情報を抽出し、生成AIによって自然な回答を構成します。本記事では、RAGの検索の仕組みと従来手法との違いを、事例と比較を交えてわかりやすく解説します。

2025-02-09

RAGの中核構造:RetrieverとGeneratorの役割と分離設計|LLM入門 2.2

RAGにおいて、Retriever(検索部)とGenerator(生成部)の明確な分離は高精度な応答生成の鍵となります。本記事では、それぞれの役割、構造、設計上のメリットについて詳しく解説し、柔軟で拡張性のあるAI構築のための基盤を紹介します。

2025-02-08

RAGとは?検索と生成を組み合わせた新しいAIの仕組み|LLM入門 2.1

RAG(Retrieval-Augmented Generation)は、外部知識を検索してLLMの応答に活かす次世代アーキテクチャです。本記事では、RAGの基本フローや構成要素、従来の生成AIとの違いを図解的にわかりやすく解説します。

2025-02-07

なぜRAGが必要とされるのか?|業務利用で見える生成AIの限界とは|LLM入門 1.2

ChatGPTを業務に導入しようとすると、正確性・柔軟性・更新性に課題が見えてきます。本記事では、企業利用における生成AIの限界と、RAG(Retrieval-Augmented Generation)という新たなアプローチの登場背景を解説します。

2025-02-04

RAGで業務AIを強化する方法とは?|LLM入門:検索と統合の仕組みを解説

RAG(Retrieval-Augmented Generation)は、大規模言語モデルに社内ナレッジやFAQを統合し、業務に使えるAIを構築する鍵です。本記事ではRAGの仕組み、活用例、導入のステップまで、わかりやすく解説します。

2025-02-01

3.3 LLMのデータロードと前処理パイプライン構築|効率的なデータ処理の自動化

LLMトレーニングに必要なデータロードと前処理パイプラインの構築方法を解説。Pythonコード例を使用し、Pandas、Dask、Scikit-learnでの効率的なデータ処理を紹介します。

2024-11-12

7.2 質問応答システムと機械翻訳 - LLMによる自然言語処理の応用技術

LLM(大規模言語モデル)を活用した質問応答システムと機械翻訳の技術について詳しく解説します。カスタマーサポートの自動化、国際ビジネス、観光業界などでの具体的な応用例を紹介します。

2024-10-21

4.1 セルフアテンションメカニズム - トランスフォーマーモデルの数理的基盤

トランスフォーマーモデルのセルフアテンションメカニズムについて詳しく解説します。クエリ、キー、バリューを用いた行列演算による単語間の関連度計算と、ソフトマックス関数を使った正規化を説明します。

2024-10-11

4.0 トランスフォーマーの数理 - セルフアテンションとマルチヘッドアテンションの仕組み

トランスフォーマーモデルにおける数理的な仕組みを解説します。セルフアテンションメカニズムの行列演算や、マルチヘッドアテンションによる文脈理解の向上について詳しく説明します。

2024-10-11

3.2 線形代数とベクトル空間 - LLMにおける単語埋め込みの数理的基盤

線形代数はLLM(大規模言語モデル)の数理的基盤です。単語の埋め込みやベクトル空間内での操作、コサイン類似度を用いた単語の関係性の解析について詳しく解説します。

2024-10-10

3.1 確率論と統計 - LLMにおける言語生成と予測の基礎

確率論と統計は、LLMの言語生成や次の単語の予測において重要な役割を果たします。n-gramモデル、マルコフ連鎖、最大尤度推定(MLE)など、LLMの予測精度を向上させる数理的手法について解説します。

2024-10-09

3.0 LLMの数理モデル - 確率論と線形代数の基礎解説

LLMの動作に深く関わる数理モデルについて解説します。確率論や統計がどのように言語生成に使われ、線形代数が単語埋め込みやベクトル空間での計算にどのように貢献しているのかを詳しく説明します。

2024-10-08

トランスフォーマーモデルとは?仕組みと特徴をやさしく解説|LLM入門 2.4

自然言語処理を飛躍させたトランスフォーマーとは何か?本記事では、大規模言語モデル(LLM)を支える中核技術「トランスフォーマー」の構造やセルフアテンションの考え方を直感的に解説。GPTやChatGPTの背景にある革新的仕組みに触れます。

2024-10-06

LLMの構成要素とは?|LLM入門 2.2|トークン・ベクトル・パラメータで理解する内部構造

LLM(大規模言語モデル)の内部で何が起きているのか?本記事では、トークン化・埋め込み(Embedding)・パラメータ・アーキテクチャなど、モデルを構成する基本要素をわかりやすく解説します。自然言語を数値で処理するAIの仕組みを学びましょう。

2024-10-06

2.0 LLMの基本 ―「なぜLLMはここまで注目されているのか?」を整理

本記事では、LLMの基礎概念として、自然言語処理(NLP)の概要とトランスフォーマーモデルの仕組みについて詳しく説明します。LLMがどのようにして膨大なデータを処理し、高精度な結果を出すのかを理解します。

2024-10-06

1.4 線形代数の感覚をつかむ:ベクトルと空間のイメージ

大規模言語モデル(LLM)は、単語の意味を「ベクトル」として数値で扱っています。本記事では、ベクトルとは何か、なぜ言葉を数で表現するのかをやさしく解説します。LLMの“頭の中”を覗いてみましょう。

2024-10-04

1.3 情報量とエントロピー ― モデルの“迷い”を数学で読む

大規模言語モデル(LLM)の「迷い」を数式で捉えるとは?本記事では、情報量・エントロピー・クロスエントロピーという情報理論の基礎概念を使い、LLMの予測の仕組みをわかりやすく解説します。損失関数の意味を本質から理解する1章。

2024-10-04

1.0 LLM入門 - 大規模言語モデルの仕組みと数学的アプローチの解説

本記事では、LLM(大規模言語モデル)の仕組みを数学的視点から解説します。トランスフォーマーモデルや勾配降下法といった技術をわかりやすく説明し、エンジニア向けにLLMの理解を深めるための基礎知識を提供します。

2024-10-02

LLM入門 - 数学で理解する大規模言語モデルの仕組み

大規模言語モデル(LLM)の基礎から応用までを初心者向けにわかりやすく解説。LLMの仕組み、トレーニング、活用方法を体系的に学べる入門ガイド。

2024-10-01