ChatGPT APIの料金(モデル別料金一覧)

ここでは、ChatGPT APIの各モデルの料金について、最新の情報をまとめています。

以下の表には、用途に応じた様々なAIモデルや機能の料金が含まれています。主な料金カテゴリは以下の通りです。

汎用チャットモデル
リアルタイム／オーディオプレビューモデル
Flex Processing (低遅延テキストモデル)
オーディオ（音声）トークン処理
画像トークン処理
Fine‑tuning（モデルのカスタマイズ）
Built‑in Tools（組み込みツール）
Web Search Tool Calls（Web検索ツール呼び出し）
Transcription & Speech Generation（文字起こし・音声合成）
Image Generation（画像生成）
Embeddings（埋め込み）

ChatGPT APIのモデル別料金一覧

ChatGPT APIの利用料金は、モデルの種類や処理内容によって異なります。以下に、各カテゴリ別の料金詳細をまとめました。料金は特に記載がない限り、100万トークンあたりの米ドル表記です。

1. 汎用チャットモデル (per 1M tokens)

テキストベースの対話生成や文章作成などに利用される主要なチャットモデルの料金です。

Model	Input	Cached input	Output
gpt-4.1	$2.00	$0.50	$8.00
gpt-4.1-mini	$0.40	$0.10	$1.60
gpt-4.1-nano	$0.10	$0.025	$0.40
gpt-4.5-preview	$75.00	$37.50	$150.00
o3	$2.00	$0.50	$8.00
o3-pro	$20.00	-	$80.00
o4-mini	$1.10	$0.275	$4.40
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
o1-pro	$150.00	–	$600.00
o1-mini	$1.10	$0.55	$4.40

2. リアルタイム／オーディオプレビュー (per 1M tokens)

リアルタイム応答や音声処理機能を持つプレビュー版モデルの料金です。

Model	Input	Cached input	Output
gpt-4o	$2.50	$1.25	$10.00
gpt-4o-audio-preview	$2.50	–	$10.00
gpt-4o-realtime-preview	$5.00	$2.50	$20.00
gpt-4o-mini	$0.15	$0.075	$0.60
gpt-4o-mini-audio-preview	$0.15	–	$0.60
gpt-4o-mini-realtime-preview	$0.60	$0.30	$2.40

3. Flex Processing (低遅延テキスト) (per 1M tokens)

より低い遅延でのテキスト処理に特化したモデルの料金です。

Model	Input	Cached input	Output
o3	$5.00	$1.25	$20.00
o4-mini	$0.55	$0.138	$2.20

4. オーディオ（音声）トークン (per 1M tokens)

音声データの処理に特化したモデルのトークンあたりの料金です。

Model	Input	Cached input	Output
gpt-4o-audio-preview	$40.00	–	$80.00
gpt-4o-mini-audio-preview	$10.00	–	$20.00
gpt-4o-realtime-preview	$40.00	$2.50	$80.00
gpt-4o-mini-realtime-preview	$10.00	$0.30	$20.00

5. 画像トークン (per 1M tokens)

画像入力の処理に関するトークンあたりの料金です。

Model	Input	Output
gpt-image-1	$10.00	$40.00

6. Fine‑tuning (per 1M tokens; training charged hourly)

特定のタスクに合わせてモデルをカスタマイズ（ファインチューニング）する際の料金です。トレーニングは時間単位で課金されます。

Model	Training	Input	Cached input	Output
o4-mini	$100.00 /hr	$4.00	$1.00	$16.00
o4-mini (data sharing)	$100.00 /hr	$2.00	$0.50	$8.00
gpt-4.1	$25.00	$3.00	$0.75	$12.00
gpt-4.1-mini	$5.00	$0.80	$0.20	$3.20
gpt-4.1-nano	$1.50	$0.20	$0.05	$0.80
gpt-4o	$25.00	$3.75	$1.875	$15.00
gpt-4o-mini	$3.00	$0.30	$0.15	$1.20
gpt-3.5-turbo	$8.00	$3.00	–	$6.00
davinci-002	$6.00	$12.00	–	$12.00
babbage-002	$0.40	$1.60	–	$1.60

7. Built‑in Tools

Code InterpreterやFile Searchなどの組み込みツールを利用する際の料金です。

Tool	Cost
Code Interpreter	$0.03 / second
File Search Storage	$0.10 / GB‑day (1 GB free)
File Search Tool Call	$2.50 / 1K calls
Web Search Tool Call (low)	$30 / 1K calls
Web Search Tool Call (med)	$35 / 1K calls
Web Search Tool Call (high)	$50 / 1K calls

8. Web Search Tool Calls (モデル別)

Web検索ツールを呼び出す際のモデルグループ別の料金です。コンテキストサイズによって料金が変動します。

Model group	Context size	Cost (per 1K calls)
gpt‑4.1, gpt‑4o, gpt‑4o‑search-preview	low	$30
	medium	$35
	high	$50
gpt‑4.1-mini, gpt‑4o-mini, gpt‑4o-mini-search-preview	low	$25
	medium	$27.50
	high	$30

9. Transcription & Speech Generation

音声の文字起こし（Transcription）およびテキストからの音声合成（Speech Generation）に関する料金です。テキストトークンとオーディオトークンで料金が異なります。

Text tokens (per 1M tokens)

文字起こしと音声合成におけるテキストデータの処理に関する料金です。

Model	Input	Output	Est. cost / min
gpt-4o-mini-tts	$0.60	–	$0.015
gpt-4o-transcribe	$2.50	$10.00	$0.006
gpt-4o-mini-transcribe	$1.25	$5.00	$0.003

Audio tokens (per 1M tokens)

文字起こしと音声合成における音声データの処理に関する料金です。

Model	Input	Output	Est. cost / min
gpt-4o-mini-tts	–	$12.00	$0.015
gpt-4o-transcribe	$6.00	–	$0.006
gpt-4o-mini-transcribe	$3.00	–	$0.003

10. Image Generation (price per image)

DALL·Eなどのモデルを使用して画像を生成する際の料金です。品質や解像度によって画像1枚あたりの価格が異なります。

Model	Quality	1024×1024	1024×1536	1536×1024
GPT Image 1	Low	$0.011	$0.016	$0.016
	Medium	$0.042	$0.063	$0.063
	High	$0.167	$0.25	$0.25
DALL·E 3	Standard	$0.04	$0.08	$0.08
	HD	$0.08	$0.12	$0.12
DALL·E 2	Standard	$0.016	$0.018	$0.02

11. Embeddings (per 1M tokens)

テキストをベクトル表現に変換する埋め込みモデルの利用料金です。

Model	Cost
text-embedding-3-small	$0.02
text-embedding-3-large	$0.13
text-embedding-ada-002	$0.10

参考：OpenAI Pricing

ChatGPT APIのトークンとは？1Kトークンの目安はどれぐらい？

トークンとは、テキストを小さな単位に分けたものです。
ChatGPTのAPI利用においては、ユーザーが入力するテキストと、ユーザーの質問に対しChatGPTが出力するテキストの両方がトークン数としてカウントされ、この数によって利用料金が計算されます。

トークンの概要について簡潔にまとめると、以下の通りです。

一般的には、トークンは単語、句読点、または記号等を含む
言語や文章の内容によってトークンの数は変わるため、明確な基準はない
同じ文章でも、英語の方がトークン数は少なくなる事が多い
日本語や中国語などの言語では、1つの文字が1トークンとしてカウントされることが多い。

トークン数を計算する方法

トークン数を計算する手段としては、主にOpenAI公式のツールを使う方法とPythonを用いる方法の二種類があります。
ここでは、OpenAIが公開しており誰でも簡単に試すことができる、Toknizerを利用して計算する手順を説明していきます。

Toknizerのサイトにアクセスします。
Toknizer(OpenAI)
画像の入力ボックスに、トークン数を計算したい文章を入力します。

Toknizerの使用画面
すると、このように入力した文章のトークン数を算出してくれます。

トークン数の算出

上の画像は、ChatGPTに文章の要約を頼むプロンプトのトークン数を算出した例です。
キャラクターが文章の文字数、トークンが消費されるトークンの数を指しています。
この結果から読み取ると、日本語の場合はおおよそ1文字辺り1トークンと換算といったイメージになります。
ただし、文章の内容や漢字の多さ、記号等で左右される可能性はあります。

トークンや請求額の確認方法

OpenAIのAPI管理ページ左側の、「Usage」ページで使用料や当月の請求金額を確認する事ができます。
過去の請求履歴を参照したり、請求データをエクスポートする事も可能です。
API管理ページはこちら:OpenAI開発者プラットフォーム

APIのトークン使用量
トークン使用量の確認

ChatGPT API利用料金の計算方法

利用料金の計算式は、以下のようになります。
(入力トークン数 / 1000) × 入力トークン料金 + (出力トークン数 / 1000) × 出力トークン料金 = 利用料金

例：GPT-4 1106 (Turbo)を（GPT4 Turbo)を使用し、入力が2000トークン、出力が3000トークンだった場合

入力料金: $0.01 / 1Kトークン
出力料金: $0.03 / 1Kトークン
計算式　: (2000 / 1000) × $0.01 + (3000 / 1000) × $0.03
合計   : $0.11

上記の式にあてはめる事で簡単に料金の目安を計算する事ができますので、是非参考にしてみてください。

試作中(PlaygroundやAssistantAPIなど)の入出力にもトークンを消費する

PlaygroundやAssistantAPI等の試作画面においても、入力・出力共に料金が発生します。
料金は上記で紹介したモデルに準拠しますが、AssistantAPIは料金体系が異なりますのでご注意ください。

どのモデルを使うべき？最もコスパがいいのは？

OpenAIのAPIでは、多様なAIモデルが提供されており、それぞれに特徴、得意分野、料金が異なります。プロジェクトの目的や予算に応じて最適なモデルを選択することが、コストパフォーマンスを高める上で非常に重要です。

ここでは、主要なモデルシリーズである「GPT-4oシリーズ」、「GPT-4.1シリーズ」、そして最新の推論モデルである「o1シリーズ」、「o3」、「o3-pro」、「o4-mini」を中心に、どのような場合にどのモデルが適しているかを解説します。

1. o3ファミリー (o3, o3-pro)：最先端の推論能力

「o3」は、OpenAIが「これまでにリリースした中で最もスマートなモデル」と位置づける、高性能な推論モデルです（2025年初頭リリース）。そして2025年6月には、その最上位版である「o3-pro」が登場しました。

「o3」

特徴:
複雑なクエリへの深い理解と詳細な回答生成。コーディング、数学、科学、特に視覚タスクで卓越した能力。ツールをエージェント的に連携可能。o3-pro登場に伴いAPI料金が大幅に値下げされ、コストパフォーマンスが向上。

【関連記事】
➡️OpenAI o3(ChatGPT o3)とは？使い方や料金、Proについて解説！

おすすめのケース:
高度な研究開発、専門的な問題解決。画像やグラフを含む複雑な情報を扱いたい場合。

「o3-pro」:

特徴:
**o3をベースに、より長く考え、最も信頼性の高い応答を提供するように設計された最上位モデル。**数学、科学、コーディングなどの分野でo3やo1-proを上回る性能。ツールアクセスも可能。
おすすめのケース:
**最高の信頼性と推論能力が求められる最先端の研究、ミッションクリティカルなタスク。**速度よりも応答の質を重視する場合。

➡️**OpenAI o3-proとは？使い方、o3・o1-proとの違い、料金、API、制限事項を解説！**

2. o1シリーズ (o1, o1-mini)：STEM分野や複雑な思考タスクに特化

「o1シリーズ」は、複雑な推論を実行するために強化学習で訓練されたモデル群です。特に科学、技術、工学、数学（STEM）分野での高い性能が特徴です。

「o1」:
- 特徴: 複雑な推論、「思考の連鎖」（Chain of Thought）を得意とします。応答前に内部で深く思考するプロセスを持ちます。「STEM」分野での能力が高いですが、一般的な言語タスクでは「GPT-4o」の方が優位な場合もあります。
- おすすめのケース: 数学的な問題解決、科学的な分析、コーディングタスクなど、論理的な思考と深い理解が求められる場合。
「o1-mini」:
- 特徴: 「o1」の基本的な能力を維持しつつ、処理速度と効率性を向上させた軽量・高速モデル。「STEM」分野、特にコーディングタスクで「o1」の初期プレビュー版を上回る性能を示すことがあります。
- おすすめのケース: 「o1シリーズ」の推論能力をより低コスト・高速に利用したい場合。特定のタスクに特化したLLM活用。

【関連記事】
➡️OpenAI o1(ChatGPT o1)とは？使い方や料金、Proについて解説！

o4-mini：高速・高コスト効率で実用的なタスクに最適

「o4-mini」は、高速性とコスト効率に特化した最新の小型AIモデルです（旧「o3-mini」後継）。

特徴:
- 軽量設計でありながら、数学、コーディング、ビジュアルタスク（画像理解）において高い性能を発揮。
- 応答速度が速く、大量処理にも対応できる高いスループット。
- 「o3-mini」と比較して性能が向上し、より幅広いタスクに対応可能。
おすすめのケース:
- リアルタイム性が求められるチャットボットやアプリケーション。
- コストを抑えつつAIを大規模に利用したい場合（大量のテキスト生成、データ処理など）。
- 日常的なAI活用や、予算を重視するプロジェクト。

【関連記事】
➡️【OpenAI】o4-miniとは？主な特徴や使い方、料金体系を解説

4. GPT-4oシリーズ (「gpt-4o」, 「gpt-4o-mini」)：マルチモーダルと速度のバランス

「gpt-4o」シリーズは、テキスト、音声、画像を統合的に扱えるマルチモーダル性と高速応答が特徴です。

「gpt-4o」:
- 特徴: 高度なマルチモーダル処理、リアルタイム性の高いインタラクション。最新のAI機能をバランス良く備えています。
- おすすめのケース: マルチモーダルAIアプリ開発、自然な会話体験が求められるサービス。
「gpt-4o-mini」:
- 特徴: 「gpt-4o」の機能をより低コストで利用可能。効率的な処理が求められる環境に適しています。
- おすすめのケース: 「gpt-4o」の機能を予算を抑えて使いたい場合、モバイルアプリや小規模ツールへの組み込み。

5. GPT-4.1シリーズ：高品質なテキスト生成に特化

「gpt-4.1」シリーズは、特にテキストベースのタスクで高い能力を発揮します。

「gpt-4.1」:
- 特徴: 高度なテキスト理解と生成、複雑な指示への対応、クリエイティブな文章作成。
- おすすめのケース: 専門的な文書作成、高品質なコンテンツ生成、ミッションクリティカルな業務。
「gpt-4.1-mini」:
- 特徴: 「gpt-4.1」に近いテキスト処理能力を低コストで。一般的なビジネス文書作成やFAQ応答に適しています。
- おすすめのケース: コストパフォーマンス重視の高度なテキストタスク。
「gpt-4.1-nano」:
- 特徴: コストを最優先。非常に基本的なテキスト処理、大量のシンプルなリクエスト処理。
- おすすめのケース: API利用料金を極力抑えたい場合、学習やごく小規模なテスト。

【結論】最もコスパがいいモデルは？

「最もコスパがいい」モデルは、タスクの要求と予算によって大きく変わります。

単純なタスクやコスト最優先: 「gpt-4.1-nano」や「gpt-4o-mini」が非常に低コストです。
速度とコスト効率のバランス、ある程度の汎用性: 「o4-mini」や、**API料金が大幅に値下げされた「o3」**は優れた選択肢です。
高度なテキスト生成でコストを抑えたい: 「gpt-4.1-mini」。
最新のマルチモーダル機能と速度: 「gpt-4o」。
「STEM」特化や複雑な推論（コスト許容）: 「o1」や「o1-mini」。
最高の推論能力と信頼性（コスト度外視または最重要課題向け）: 「o3-pro」。

各モデルのAPI料金と特徴を比較し、プロジェクトの要件に最も合致するものを選ぶことが重要です。無料利用枠や低コストモデルでプロトタイピングを行い、必要に応じて高性能モデルにスケールアップすることも有効な戦略です。

ご自身の用途や予算に合わせて、モデル選びの参考にしてみてください。

ChatGPT APIの商用利用はできる？

基本的には可能です。しかし、hatGPTのAPIを利用して作成したサービスの名称として、「○○GPT」の様な名称を付けることは禁止されています。

上記は一例ですが、OpenAIの利用規約やブランドガイドラインを参照することが重要です。
OpenAI 利用規約

【関連記事】
➡️ChatGPTの商用利用は可能！著作権リスクや規約上の注意点を解説

費用を抑えるための5つのポイント

ChatGPTのAPIは、ブラウザ版の様に使い放題というわけではなく、使った分だけ料金が発生する従量課金制です。

以下に挙げる5つのポイントを念頭に置くことで、コストを節約しながらもAPIの利用効率を高めることが可能です。

用途に応じたモデル選び

上記モデル別の比較で詳述した通り、タスクの複雑性や求められる品質に応じて最適なモデルを選択することが最も重要です。
例えば、最高性能の「o3」（出力 $40.00/1Mトークン）と、非常に低コストな「gpt-4.1-nano」（出力 $0.40/1Mトークン）では、1Mトークンあたりの出力料金に100倍の差があります。

シンプルな応答やテキスト処理: 「gpt-4.1-nano」、「gpt-4o-mini」、「o4-mini」などを検討。
複雑な分析や専門性の高いコンテンツ生成: 「gpt-4.1」、「gpt-4o」、「o1シリーズ」、「o3」を必要に応じて選択。

特に、「o4-mini」は高速かつコスト効率に優れ、多くの実用的なタスクでバランスの取れた選択肢となり得ます。
タスクの性質を正確に把握し、必要十分な性能を持つ最も安価なモデルを選ぶことがコスト削減の第一歩です。複数のモデルをタスクに応じて使い分けるアプローチも有効です。

プロンプトを最適化する

APIの利用時に限らず、言語モデルを利用する上で基本的な事ですが、プロンプトを最適化するという事が非常に重要です。
入力する文章はもちろんですが、「500文字以内で」や「箇条書きで」、「JSON形式で出力して」などと出力形式を具体的に指定することで、予期せぬ長文出力や意図しない形式によるトークンの消費を抑えることが可能です。

特に「o1シリーズ」のような推論モデルの場合、OpenAIは「人間が自然に質問するような形で使うのが最適で、複雑な指示や余計な情報は逆効果になる可能性がある」と示唆しています。
シンプルで明確な指示が、結果的にトークン数と処理時間の削減につながることがあります。

また、より洗練されたプロンプト（Few-shotプロンプティングなど、いくつかの例示を含める等）を入力することで出力精度の向上が期待でき、結果的に試行回数や修正のための追加のやり取り（トークン消費）を削減できます。

【関連記事】
➡️プロンプトエンジニアリング完全ガイド！ChatGPTで使える例文も紹介

日本語を英語に翻訳してから入力する

一般的に、同じ文章でも日本語の文章は英語の文章に比べてトークン数が2~3倍に増えるとされています。

一例として、これはトークン数を計算する方法にて入力した文章を英語に翻訳してからトークン数を計算した例です。

トークン英語版
同じ文章を英語に直した場合のトークン数

英語に翻訳する事で、Characters（文章全体の文字数)がほぼ2倍になっているにも関わらず、トークン数は約半分に抑えられています。

この例から分かる様に、大量のテキストデータ（特に長文のドキュメントなど）を入力としてAPIに渡す必要がある場合は、一度英語に翻訳してから処理し、必要であれば結果を再度日本語に翻訳することで、APIコストを大幅に削減できる可能性があります。
ただし、翻訳と逆翻訳のコストや手間、翻訳によるニュアンスの変化なども考慮に入れる必要があります。

過去の会話記録はなるべく含めない

ブラウザ版のChatGPTのように会話形式で応答できるAPIアプリケーションを構築する場合、過去のやり取りをコンテキストとして含めることで会話の流れを維持しますが、この過去のやり取りもトークンとしてカウントされ、料金が発生します。

全ての会話履歴を毎回含める必要はなく、直近の数ターン（例えば2～3回前）の会話履歴のみを参照させるように制限したり、会話の要約をコンテキストとして含めるなどの工夫をすることで、コストを抑えつつ、文脈に沿った応答を期待できます。

トークンの上限を指定する

予期せずAPI利用料が高額になってしまうことを防ぐために、**利用量の上限設定（Usage Limits）**は非常に重要です。
OpenAIのプラットフォームでは、月ごとのAPI利用金額の上限を設定できます。上限に達した場合でも後から変更できるので、予算管理のためにも必ず設定しておくことをお勧めします。

設定の仕方

OpenAI開発者プラットフォームページ左側の「Settings」から、「Billing」クリックします。
画像の様な画面に遷移するので、水色の矢印で囲んである「Usage Limits」を選択する事で、突き当たりの上限を設定する事が可能です。

OpenAI　開発者プラットフォーム
APIの利用上限設定

ChatGPT APIの無料枠を使う方法

2024年4月現在、 ChatGPTに新規登録したユーザーは、5ドル分の無料クレジットが付与されます。
APIを本格的に導入する前に、各モデルの出力やトークン消費量を実際に試してみたい！という方におすすめです。

無料トライアル
ChatGPT APIの無料枠の確認

ChatGPT APIの無料期間については、こちらの記事でくわしく解説しています。
➡️ChatGPT APIの無料期間とは？有効期限や確認方法について解説

まとめ

GPT-3.5 Turboは依然として強力なモデルであり、多くのテキストベースのタスクに対して十分な性能を提供しますが、より正確な出力や高度な文章理解を求める場合は、GPT-4-Turboの方が適していると言えるでしょう。しかしGPT-4 TurboとGPT-3.5 Turboにおいては出力・入力ともに10倍近くの価格差があります。

したがって、プロジェクトの要件が複雑なテキストの生成や長いコンテキストの理解を必要としない場合は、GPT-3.5 Turboはコスト効率の良い選択肢となります。
また前途の通り開発段階に応じて、段階的に使い分けるというアプローチも効果的です！

具体的なプロジェクトやサービスの開発においてどのモデルを選択すべきかは、プロジェクトのニーズ、予算、期待されるアウトプットの品質、処理速度など、多くの要素を総合的に考慮する必要があります。
また、モデルの性能や適用範囲については定期的にアップデートが行われるため、最新の情報に基づいた選択を行うことが大切です。この記事が最適なモデル選びの参考となれば幸いです！