1.1 FlaskとFastAPIによるLLM APIの基本設計 | シンプルなPython API構築ガイド

1.1 FlaskまたはFastAPIを使ったAPIの基本設計

このセクションでは、Pythonフレームワークの Flask と FastAPI を使用して、LLM（大規模言語モデル）のAPIを設計・実装する方法を紹介します。基本的なAPIエンドポイントの作成から、リクエスト処理、エラーハンドリングまで、実践的な内容をカバーします。

Flask版


from flask import Flask, request, jsonify
from transformers import pipeline

app = Flask(__name__)
llm = pipeline("text-generation", model="gpt2")

@app.route("/predict", methods=["POST"])
def predict():
    data = request.json
    input_text = data.get("text", "")
    if not input_text:
        return jsonify({"error": "Input text is required"}), 400

    try:
        result = llm(input_text, max_length=50, num_return_sequences=1)
        return jsonify({"output": result[0]["generated_text"]})
    except Exception as e:
        return jsonify({"error": str(e)}), 500

if __name__ == "__main__":
    app.run(host="0.0.0.0", port=5000)

FastAPI版


from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
from transformers import pipeline

app = FastAPI()
llm = pipeline("text-generation", model="gpt2")

class InputText(BaseModel):
    text: str

@app.post("/predict")
async def predict(input_data: InputText):
    input_text = input_data.text
    if not input_text:
        raise HTTPException(status_code=400, detail="Input text is required")

    try:
        result = llm(input_text, max_length=50, num_return_sequences=1)
        return {"output": result[0]["generated_text"]}
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e)}

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

解説

Flask版は、シンプルで学習コストが低く、小規模なアプリケーションに適しています。
FastAPI版は、非同期処理に対応しており、高速なAPIを構築できます。また、Pydanticを使用することで、リクエストのバリデーションも行えます。

どちらを選ぶべきか？

小規模なプロジェクトや、非同期処理が不要な場合は Flask が便利です。
高速なAPIが求められる場合や、非同期処理が必要な場合は FastAPI が適しています。

次のセクション「1.2 LLM推論APIのスケーリング」では、推論APIを効率的にスケールさせるための方法について解説します。GunicornやUvicornを活用した負荷分散、キャッシュ戦略の実装を学びましょう。

公開日: 2024-11-03

最終更新日: 2025-03-10

バージョン: 1

テキスト生成

エラーハンドリング

非同期処理

下田昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。

カテゴリー

LLM入門：RAGで強化する生成

MCP入門：AIに文脈を理解させる技術

LLM入門 X 数学

LLM入門しくみから学ぶ生成AIの基礎

LLM入門（上）実践Python

タグ

LLM 36 RAG 35 LLM 26 MCP 23 LangChain 18 Python 17 プロンプト設計 17 生成AI 17 自然言語処理 13 モデルコンテキストプロトコル 9

検索履歴

会話履歴 1524 エンジニア向け 440 生成型要約 426 マルコフ連鎖 418 大規模言語モデル 418 自動要約 407 パーソナライズドコンテンツ 405 注意メカニズム 404 言語モデル 401 NLP トランスフォーマー 400 教育AI 400 データ前処理 391 トークン化 382 ミニバッチ学習 382 クロスエントロピー損失 381 LLM 要約 379 数学的アプローチ 379 GPT テキスト生成 378 バイアス問題 376 LLM テキスト生成 365 バッチサイズ 365 セルフアテンション 364 ロス計算 357 線形代数 350 トレーニング 347 FAQシステム 345 コード生成 345 GPT-2 テキスト生成 344 LLM リアルタイム処理 341 自動翻訳 339

チーム

任弘毅

株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。

下田昌平

開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。