AI APIの料金体系を徹底解説 — OpenAI・Claude・Geminiの選び方

AI APIの料金はなぜわかりにくいのか

AI APIを使い始めると必ず直面するのが「トークン課金」という概念です。月額固定ではなく、使った量に応じて課金されるため、コストの見積もりが難しいと感じる人が多いです。

トークンとは、AIモデルがテキストを処理する際の最小単位です。英語では約4文字が1トークンに相当しますが、日本語は文字ごとにトークン数が異なるため注意が必要です。ひらがな・カタカナは1文字あたり1〜2トークン、漢字は1〜3トークン程度になることが多いです。

APIの料金は「入力トークン（プロンプト）」と「出力トークン（レスポンス）」の2軸で計算されます。一般的に出力トークンのほうが割高に設定されています。

OpenAI（GPT-4o系）

最も広く使われているAPIです。GPT-4oは入力$2.50/100万トークン、出力$10.00/100万トークンが基本価格です（2026年4月時点）。精度が高く、ツール連携も豊富なため、業務用途で実績があります。

Anthropic Claude（Claude 3.5系）

Claude 3.5 Sonnetは入力$3.00/100万トークン、出力$15.00/100万トークンです。長文処理と指示への忠実さに定評があり、コーディング補助や文書生成に向いています。コンテキストウィンドウが大きく、長い文書の一括処理が得意です。

Google Gemini（Gemini 1.5系）

Gemini 1.5 Flashは入力$0.075/100万トークン、出力$0.30/100万トークンと非常に安価です。無料枠も充実しており、個人開発の初期段階や試作には最適です。Gemini 1.5 Proはより高精度ですが価格も上がります。

プロンプトを短く保つことが最も効果的です。システムプロンプトをキャッシュする機能（Anthropicのプロンプトキャッシング、OpenAIのPrompt Caching）を使うと、繰り返し同じ文脈を送る場合のコストを最大90%削減できます。

また、出力トークン数を制限する`max_tokens`パラメータを設定することで、予期しない大量課金を防げます。

当サイトではAI API料金を手軽にシミュレートできるツールを提供しています。