この記事のポイント
Azure OpenAI Serviceの料金体系を、リージョンとモデルごとに詳細に解説
言語モデル、ベースモデル、微調整モデル、画像モデル、埋め込みモデル、音声モデルの各カテゴリにおける具体的な料金を提示
トークン単位やコンピューティング時間単位など、各モデルの課金方式の違いを説明
Azure Portalを通じたAzure OpenAI Serviceの購入手順を7つのステップで解説
Azureの料金計算ツールの使用方法と、正確な料金見積もりを出すためのパラメータ設定のポイントを紹介

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
Azure OpenAI Serviceは、クラウド経由で豊富なAI機能を提供し、インテリジェントなアプリケーション構築を可能にするサービスです。しかし、その利用料金の仕組みは複雑で、把握しづらいと感じる方も多いのではないでしょうか。
本記事では、Azure OpenAI Serviceを運用する上で欠かせない料金体系について、Standard(従量課金制)、Provisioned(PTU)、Batch APIといった料金プラン、Global/Data Zones/Regionalといったデプロイメントの違い、そして主要モデルや新しいAPI(Realtime API, CUA, Built-in toolsなど)ごとの課金方式を紹介します。
Azure OpenAI Serviceの料金についての疑問を解決し、効率的かつ予算に合ったサービス運用を実現するために、ぜひ参考にしてください。
Azureの基本知識や料金体系、利用方法についてはこちらの記事で詳しく解説しています。
➡️Microsoft Azureとは?できることや各種サービスを徹底解説
Azure OpenAI Serviceの料金体系の概要
Azure OpenAI Serviceの料金は、ユーザーが使用する料金プラン・デプロイメント・モデルによって異なります。
まず最初に、主な料金決定要素についてご紹介します。
料金プラン
Azure OpenAI Serviceは、主に以下の3つの料金プランがあります。
-
Standard (従量課金制 / オンデマンド)
使用した分だけ(主に入力トークンと出力トークンに応じて)料金が発生する「Pay-as-you-go」方式です。柔軟な利用が可能です。
-
Provisioned (PTU / プロビジョニング済みスループット)
特定のモデルに対して一定のスループット(処理能力)をPTU(Provisioned Throughput Unit)単位で事前に割り当て、確保するプランです。
予測可能なコストとパフォーマンスが必要な場合に適しており、月額または年額の予約により割引が適用されます。 -
バッチAPI
リアルタイム性が不要な大量の非同期リクエストを処理するためのオプションです。
通常、Global Standard価格の50%割引で提供され、24時間以内に結果が返されます。(言語モデルで利用可能)
デプロイメントの種類
StandardとProvisionedプランでは、以下のデプロイメントの種類を選択できます。
これにより、価格設定、パフォーマンス、データ処理の境界に対する柔軟性と制御が向上します。
- Global (グローバル デプロイ)
特定のリージョンに縛られず、Azureのグローバルネットワークを利用します。グローバルSKUとして提供されます。
- US/EU – Data Zones (データ ゾーン デプロイ)
特定のデータゾーン(現在はヨーロッパまたは米国)に限定して利用します。データ処理の境界が重要な場合に選択されます。
- Regional (リージョン デプロイ)
特定のAzureリージョン(例: 東日本、最大27リージョン)に限定してデプロイします。レイテンシの最適化や地域固有の要件に対応します。
モデル
利用するAIモデルの種類(例: o1-mini, GPT-4o)によって料金が大きく異なり、高性能なモデルほど高価になる傾向があります。
テキスト生成、推論特化、画像生成、音声処理、埋め込み、エージェント機能など、タスクに応じたモデルが存在します。
トークン
多くのモデルの料金は、処理されたトークン数に基づいて計算されます。トークンはテキストデータの基本単位で、単語や文字の一部に対応します。
料金表では「1,000トークンあたり」または「1M(100万)トークンあたり」の単価で示されることが一般的です。
入力トークンと出力トークンで単価が異なる場合が多いです。
standard(従量課金制)の具体的な料金について
ここではstandard(従量課金制)の具体的な料金について、モデルごとにその特徴と共にご紹介していきます。
本記事では主に東日本リージョンでAzure OpenAI Serviceを利用した場合の試算を示します。
価格表の見方:
- 価格は特に記載がない限り「100万トークンあたり」の日本円(¥)です。
- 「キャッシュされた入力」は、特定の条件下で適用される割引価格です。
- 「Batch API 価格」は、Batch API利用時の割引後価格(通常50%割引)です。
- 「該当なし」または「N/A」は、そのデプロイメント種類やオプションが利用できないか、料金が発生しないことを示します。
GPT-4.5
現時点でプレビュー提供されている最新鋭の汎用モデルです。非常に広範な知識を持ち、複雑な指示やユーザーの意図を深く理解する能力に長けています。
創造性が求められるタスクや、自律的に計画を立てて実行するようなエージェント機能の実装に適しています。
- 主な特徴:
28Kコンテキストウィンドウ、2023年10月ナレッジカットオフ。
モデル | デプロイメント | 価格 (100万トークン) | Batch API 価格 (100万トークン) |
---|---|---|---|
GPT-4.5-Preview-2025-02-27 | Global | 入力: ¥11,324.25 キャッシュ入力: ¥5,662.13 出力: ¥22,648.50 |
N/A |
o1
複雑な問題解決や論理的な思考(推論)に特化して設計された新しいモデルシリーズです。数学、科学、コーディングといった分野で特に高い性能を発揮します。
長文の読解や生成が必要なタスクにも対応できる、非常に大きなコンテキストウィンドウを持つのも特徴です。**
- コンテキストウィンドウ:200K
- ナレッジカットオフ:2023年10月
モデル | デプロイメント | 価格 (100万トークン) | Batch API 価格 (100万トークン) |
---|---|---|---|
o1 2024-12-17 | Global | 入力: ¥2,264.85 キャッシュ入力: ¥1,132.43 出力: ¥9,059.40 |
N/A |
US/EU – Data Zones | 該当なし | N/A | |
Regional | 該当なし | N/A | |
o1 preview 2024-09-12 | Global / Data Zones / Regional | 該当なし | N/A |
o3 Mini / o1-mini
o1シリーズのコンセプトを引き継ぎつつ、速度とコスト効率を重視した軽量版の推論モデルです。「o3-mini」は「o1-mini」の改良版で、より大きなコンテキストを扱えるようになっています。
比較的安価ながら、コーディングや数学などのタスクで高い効率を発揮します。**
- o3-mini
- コンテキストウィンドウ: 200K (入力) / 100K (出力)
- ナレッジカットオフ: 2023年10月
- o1-mini
- コンテキストウィンドウ: 128K (入力)
- ナレッジカットオフ: 2023年10月
モデル | デプロイメント | 価格 (100万トークン) | Batch API 価格 (100万トークン) |
---|---|---|---|
o3 mini 2025-01-31 | Global | 入力: ¥166.09 キャッシュ入力: ¥83.04 出力: ¥664.36 |
入力: ¥83.04 出力: ¥332.18 |
US/EU – Data Zones | 該当なし | 該当なし | |
Regional | 該当なし | N/A | |
o1-mini 2024-09-12 | Global | 入力: ¥166.09 キャッシュ入力: ¥83.04 出力: ¥664.36 |
N/A |
US/EU – Data Zones | 該当なし | N/A | |
Regional | 該当なし | N/A |
4o
最先端のマルチモーダルモデルです。テキストだけでなく画像入力にも対応し、以前のGPT-4 Turboモデルよりも高速かつ安価に利用できます。幅広いタスクに対応できる汎用性と高い性能を兼ね備えています。
- コンテキストウィンドウ: 128K
- ナレッジカットオフ: 2023年10月
モデル | デプロイメント | 価格 (100万トークン) | Batch API 価格 (100万トークン) |
---|---|---|---|
GPT-4o-2024-1120 | Global | 入力: ¥377.48 キャッシュ入力: ¥188.74 出力: ¥1,509.90 |
入力: ¥188.74 出力: ¥754.95 |
US/EU – Data Zones | 入力: ¥415.22 キャッシュ入力: ¥207.61 出力: ¥1,660.89 |
入力: ¥207.61 出力: ¥830.45 |
|
Regional (東日本など) | 入力: ¥456.74 キャッシュ入力: ¥228.45 出力: ¥1,826.98 |
N/A | |
GPT-4o-2024-08-06 | Global | 入力: ¥377.48 キャッシュ入力: ¥188.74 出力: ¥1,509.90 |
入力: ¥188.74 出力: ¥754.95 |
US/EU – Data Zones | 該当なし | 該当なし | |
Regional | 該当なし | N/A | |
GPT-4o-2024-0513 (旧ver) | Global | 入力: ¥754.95 出力: ¥2,264.85 |
該当なし |
US/EU – Data Zones | 該当なし | N/A | |
Regional | 該当なし | N/A |
GPT-4o mini
GPT-4oの能力を維持しつつ、大幅にコスト効率を高めた小型モデルです。テキストと画像の入力に対応しており、速度とコストが重要視される多くのアプリケーションに適しています。**
- コンテキストウィンドウ: 128K
- ナレッジカットオフ: 2023年10月
モデル | デプロイメント | 価格 (100万トークン) | Batch API 価格 (100万トークン) |
---|---|---|---|
GPT-4o-mini-0718 | Global | 入力: ¥22.65 キャッシュ入力: ¥11.32 出力: ¥90.59 |
入力: ¥11.32 出力: ¥45.30 |
US/EU – Data Zones | 該当なし | 該当なし | |
Regional | 該当なし | N/A |
Base Models (旧世代)
【どんなモデル?】以前の世代の基本的なテキスト生成モデルです。
特定の用途や互換性のために利用される場合がありますが、現在ではより高性能でコスト効率の良い新しいモデルが推奨されます。
モデル | 価格 (1,000トークンあたり) |
---|---|
Babbage-002 | ¥0.0604 |
Davinci-002 | ¥0.3020 |
モデルの埋め込み (Embedding)
テキストデータを数値ベクトルに変換し、意味的な類似性検索や分類、クラスタリングなどのタスクに利用するためのモデルです。
モデル | 価格 (1,000トークンあたり) |
---|---|
Ada (旧世代) | ¥0.0151 |
text-embedding-3-large | 該当なし (東日本では) |
text-embedding-3-small | ¥0.0030 |
画像モデル(DALL E)
テキストの説明から画像を生成するモデルです。クリエイティブな用途やコンテンツ作成に活用できます。
モデル | 品質 | 解像度 | 価格 (画像 100 件あたり) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | ¥603.960 |
Standard | 1024 * 1792, 1792 * 1024 | ¥1,207.920 | |
HD | 1024 * 1024 | ¥1,207.920 | |
HD | 1024 * 1792, 1792 * 1024 | ¥1,811.880 | |
Dall-E-2 | Standard | 1024 * 1024 | ¥301.980 |
音声モデル (Whisper, TTS)
Whisperは音声をテキストに変換(音声認識)、TTSはテキストを自然な音声に合成(音声合成)するモデルです。**
モデル | 課金単位 | 価格 (JPY) |
---|---|---|
Whisper | 時間あたり | ¥54.36 |
TTS (テキスト読み上げ) | 100万文字あたり | 該当なし |
TTS HD | 100万文字あたり | 該当なし |
Fine-tuning Models(微調整モデル)
ベースとなるモデルを、ユーザー固有のデータセットで追加学習させ、特定のタスクやドメインに合わせて性能をカスタマイズする機能です。
トレーニング(学習)、ホスティング(デプロイ維持)、推論(利用時)のそれぞれにコストが発生します。**
モデル | デプロイメント | 価格 |
---|---|---|
GPT-4o-2024-08-06 | Regional | 入力: ¥415.22/1Mトークン キャッシュ入力: ¥207.61/1Mトークン 出力: ¥1,660.89/1Mトークン トレーニング: ¥4,152.3/1Mトークン ホスティング: ¥256.7/時 |
Global | 入力: ¥377.48/1Mトークン キャッシュ入力: ¥188.74/1Mトークン 出力: ¥1,509.90/1Mトークン トレーニング: Regionalを使用 ホスティング: ¥256.7/時 |
|
GPT-4o-mini | Regional | 該当なし |
Global | 該当なし (トレーニングはRegionalを使用) | |
GPT-4-0613 (8K) | Regional | 該当なし |
GPT-3.5-Turbo (16K) | Regional | 入力: ¥75.5/1Mトークン 出力: ¥226.5/1Mトークン トレーニング: ¥1,207.92/1Mトークン ホスティング: ¥256.7/時 |
GPT-3.5-Turbo (4K) | Regional | 入力: ¥75.5/1Mトークン 出力: ¥226.5/1Mトークン トレーニング: ¥1,208.0/1Mトークン ホスティング: ¥256.7/時 |
Babbage-002 | (指定なし) | 入力: ¥60.40/1Mトークン 出力: ¥60.40/1Mトークン トレーニング: ¥60.4/1Mトークン ホスティング: ¥256.7/時 |
Davinci-002 | (指定なし) | 入力: ¥301.98/1Mトークン 出力: ¥301.98/1Mトークン トレーニング: ¥906.0/1Mトークン ホスティング: ¥256.7/時 |
新しいAPIファミリーと機能の料金
Azure OpenAI Serviceでは、特定のタスクに特化した新しいAPIや、AIエージェント構築を支援する組み込みツールも提供されており、それぞれに料金設定があります。
Realtime API
非常に低い遅延(レイテンシ)でリアルタイムな対話を実現するために最適化されたAPIです。
多言語の音声合成機能もサポートしており、応答性の高いチャットボットや会話型AIアプリケーションの構築に適しています。
モデル | デプロイメント | 価格 (100万トークン) - テキスト | 価格 (100万トークン) - オーディオ |
---|---|---|---|
GPT-4o-Realtime-Preview-2024-12-17 | Global | 入力: ¥754.95 キャッシュ: ¥377.48 出力: ¥3,019.80 |
入力: ¥6,039.60 キャッシュ: ¥377.48 出力: ¥12,079.20 |
US/EU, Regional | 該当なし | 該当なし | |
GPT-4o-Mini-Realtime-Preview-2024-12-17 | Global | 入力: ¥90.59 キャッシュ: ¥45.30 出力: ¥362.38 |
入力: ¥1,509.90 キャッシュ: ¥45.30 出力: ¥3,019.80 |
US/EU, Regional | 該当なし | 該当なし | |
GPT-4o-Realtime-Preview-2024-10-01 (旧バージョン例) | Global | 入力: ¥754.95 キャッシュ: ¥377.48 出力: ¥3,019.80 |
入力: ¥15,099.00 キャッシュ: ¥3,019.80 出力: ¥30,198.00 |
US/EU, Regional | 該当なし | 該当なし |
Chat Completions API (Audio)
音声コンテンツの処理(認識)と生成(合成)を行うためのAPIです。
リアルタイム性はRealtime APIほど高くありませんが、非同期での音声対話や、より複雑な音声処理、感情分析などのタスクに適しています。
モデル | デプロイメント | 価格 (100万トークン) - テキスト | 価格 (100万トークン) - オーディオ |
---|---|---|---|
GPT-4o-Audio-Preview-2024-12-17 | Global | 入力: ¥377.48 出力: ¥1,509.90 |
入力: ¥6,039.60 出力: ¥12,079.20 |
US/EU, Regional | 該当なし | 該当なし | |
GPT-4o-Mini-Audio-Preview-2024-12-17 | Global | 入力: ¥22.65 出力: ¥90.59 |
入力: ¥1,509.90 出力: ¥3,019.80 |
US/EU, Regional | 該当なし | 該当なし |
Computer-Using Agent (CUA)
AIがコンピューターのグラフィカルユーザーインターフェース(GUI)を操作できるようにする特殊なモデル/機能です。
自然言語の指示に基づいて、アプリケーションのナビゲーションや複数ステップのタスク自動化を可能にします。Responses APIのツールとして利用されます。
モデル | デプロイメント | 価格 (100万トークン) |
---|---|---|
computer-use-preview | Global | 入力: ¥452.97 出力: ¥1,811.88 |
Built-in tools (Assistants API / Responses API)
開発者がAIエージェント(自律的にタスクを実行するAI)を容易に構築できるようにするための、事前に用意されたツール群です。
ファイル検索、コード実行、外部機能呼び出しなどをAIに実行させることが可能になります。**
ツール | 課金単位 | 価格 (JPY) | 備考 |
---|---|---|---|
Computer Use (Responses API) | 100万トークン (入力/出力) | 入力: ¥452.97 出力: ¥1,811.88 |
CUAモデル利用時 |
File Search Tool Call (Responses API) | 1,000 ツールコールあたり | ¥377.475 | |
File Search Storage | 1GB / 日 あたりのベクトルストレージ | ¥15.099 | 最初の1GBは無料 |
Code Interpreter | セッションあたり | ¥4.5297 | 各セッションはデフォルト1時間アクティブ。同時セッション数で課金増加。 |
Azure OpenAI Servicesの利用
さて、ここからは実際の作成手順についてご紹介します。
※ 前提準備
以下を用意する必要があります。
- Azureアカウント、サブスクリプション、リソースグループ
- AIモデルをデプロイするためのアクセス許可
アカウント作成についてはこちらもご覧ください。
【関連記事】
➡️Azure Portalとは?操作方法やメリットをわかりやすく解説!
ステップ1: Azureポータルにサインイン
- Azureポータルにアクセスし、Azureアカウントでサインインします。
Azureポータル画面
ステップ2: Azure OpenAI Serviceの作成
- Azureポータル画面の「リソースの作成」で"Azure OpenAI"で検索し、「Azure OpenAI」をクリックします。
AzureOpenAI選択画面
- 「Azure OpenAIの作成」画面、「基本」タブで適切な設定をします。
※Azure Open AI Serviceの価格レベルによって料金が異なります。ここではstandardを選択します。
「次へ」をクリックします。
基本タブ画面
- 「ネットワーク」タブで適切な設定をします。
「次へ」をクリックします。
ネットワークタブ画面
- 「Tags」タブで適切な設定をします。
「次へ」をクリックします。
Tagsタブ画面
- 「レビューおよび送信」タブで設定に問題がないことを確認します。
「作成」をクリックします。
レビューおよび送信タブ画面
- デプロイ完了後、「リソースに移動」をクリックします。
デプロイ完了画面
ステップ3: モデルのデプロイ
AIモデルをデプロイして利用可能にするプロセスです。ここでは、Azure OpenAI サービスで提供されるさまざまな AI モデルを選択し、選択したモデルを独自の環境にデプロイすることで利用準備を整えることができます。
- 作成したAzure OpenAI Serviceから、「モデルデプロイ」をクリックします。
モデルデプロイ選択画面
- 「展開の管理」をクリックすると、Azure OpenAI Studioを利用することができます。
展開の管理選択画面
Azure OpenAI Studioは、Azure OpenAI Serviceを使ってモデルのテストや設定を行うためのブラウザベースのインターフェースです。開発者やビジネスユーザーが、Azure上で提供されているAIモデル(GPTなど)を使いやすくするために設計されています。
- Azure OpenAI Studioの画面より「モデルのデプロイ」をクリックします。
AzureOpenAIStudio画面
- いくつかの選択肢が表示されます。ここでは「基本モデルをデプロイする」を選択しました。クリックすると、Azureで利用できる幅広いモデルの中から、微調整されていない標準的なモデルを選んでデプロイすることが可能です。
基本モデルをデプロイする画面
- AIのモデルを選択することができます。選択したモデルによって料金も異なるため、コスト面も考慮しながら選択する必要があります。
基本モデル画面
- Azure OpenAI Studio には、利用可能なモデルが一覧表示されているモデルカタログがあります。カタログでは、用途や性能、料金に応じたさまざまなモデルの詳細情報を確認することができます。
「モデルカタログへ移動します」をクリックします。
モデルカタログ移動画面
モデルカタログ画面
Azureの料金計算ツール
Azure OpenAI Serviceを利用する際の料金を計算し見積もるためには、Microsoftが提供する料金計算ツールを使用することが有効です。具体的には、API呼び出しの頻度、使用するモデルの種類、データの量などのパラメータをユーザーが入力すると、それに基づいて料金が計算されるシステムです。
Azure OpenAI Serviceの料金計算ツール
【関連記事】
➡️ Azureの料金計算ツールの利用方法!基本機能や円表示の手順を解説
まとめ
本記事ではAzure OpenAI Serviceの料金体系の概要・言語モデル・料金プランについて説明しました。また料金を簡単に計算するための計算ツールについても説明しました。
Azure OpenAI Serviceは、Microsoft Azure上で提供されるAzure AIサービスの1つで、OpenAIの高度なAIモデル(GPT-4、GPT-3.5、DALL-Eなど)を利用できるサービスです。このサービスにより、テキスト生成、音声認識、画像生成など、さまざまな高度なAI機能をAzure上で簡単に活用できます。
ぜひAzure OpenAI Serviceを導入する際には、上記料金体系を参考にし、ニーズに合った料金体系を選ぶようにしてください。この記事をもとにAzure OpenAI Serviceを最もコスト効率の高い方法で使用し、新たな技術の実装において成功を収める助けとなることを期待しています。
Azure OpenAI Serviceの他の情報については、AI総合研究所の関連記事をご覧ください。