東京エレクトロンデバイス株式会社

Microsoft Azureコラム

2025/12/24

Writer: 手戸 蒼唯(てど あおい)

Azure OpenAI Service の料金体系・コスト最適化のポイントを解説

「Azure OpenAI Service を導入したいけど、料金体系が複雑で最適な選択がわからない...」そんな悩みを抱えていませんか?

本記事では、2 つの主要な料金モデルである従量課金制と PTU ベースの概要から、2024 年 8 月に更新された PTU アップデートの内容、さらにはコスト最適化の戦略まで包括的に解説します。

Azure OpenAI Service を最大限に活用しながら、効率的にコストを管理する方法を学びましょう。

Azure OpenAI Service 料金体系の概要

Azure OpenAI Service の料金体系は、主に従量課金制と PTU(プロビジョニング スループット ユニット)ベースの 2 つのモデルに基づいています。


従量課金制

従量課金制は、使用したリソースに応じて料金を支払う方式です。API とのやり取りで処理されたトークンの数に基づいて料金が計算されます。

トークンは、テキストを処理する際の最小単位で、おおよそ単語や句読点などに分割されます。日本語の場合、1 トークンは平均して約 1.2 文字に相当します。

従量課金制では、入力トークン(API に送信するテキスト)と出力トークン(API が生成するテキスト)の両方に対して課金が行われ、一般的に、出力トークンの方が料金が高く設定されています。

この方式のメリットは、使った分だけ支払うというシンプルな料金体系である点です。

小規模な利用から大規模なプロジェクトまで、様々な規模の利用シーンに柔軟に対応できます。


プロビジョニング スループット ユニット(PTU)

プロビジョニング済みスループットユニット (PTU)は、Azure OpenAI Service 特有の課金方式です。一定量の処理能力を事前に確保しておくことで、安定したパフォーマンスと応答速度を保証するものです。

PTU は、一定時間内に処理できるトークン数の単位と考えることができ、事前に確保した PTU に基づいて 1 時間ごとの料金が請求されます。

2024 年 8 月のアップデートでは、PTU の購入と使用に関する新しいオプションが導入され、より柔軟な利用が可能になりました。


【重要】2024 年 8 月の PTU に関するアップデート

Azure OpenAI Servie PTU の更新内容


2024 年 8 月の更新により、PTU はより柔軟かつ利用しやすくなりました。

主な変更点は以下の通りです。


  • 利用形態の変更

従来のコミットメント形式に加え、時間単位での利用が可能になりました。これにより、必要な時に必要なだけ PTU を使用できるため、コスト効率が向上します。

さらに、Azure Reservations を利用することで、長期利用割引を受けることも可能です。


  • モデル非依存の PTU クォータ

従来はモデルごとに別々の PTU クォータが設定されていましたが、更新後はモデルに依存しない単一の PTU クォータになりました。

これにより、異なるモデル間での PTU の共有が可能になり、リソースの効率的な活用につながります。


  • 利用可能リージョンの拡大

従来は特定のリージョンでのみ利用可能でしたが、更新後はより多くのリージョンで利用できるようになりました。


  • 超過使用の許可

従来はコミットメント以上は使用できませんでしたが、更新後は超過使用が可能になりました(時間単位で課金)。


  • セルフサービス管理の強化

従来は販売チームを通じてクォータ要求を行う必要がありましたが、更新後はセルフサービスのクォータ要求フォームが利用可能になりました。

また、Azure OpenAI Studio での直接管理も可能になり、より迅速かつ容易に PTU を管理できます。

※PTU を選択する際は思わぬ請求を避けるために、利用リソースの確認・アラートの設定などコスト管理にご留意ください。また、PTU モデルは高度な処理を必要とするケースでのご利用をお勧めいたします。

詳細はこちらからご確認ください。

Azure での PTU 選択や Azure Open AI service に関するご相談は、東京エレクトロンデバイスまでご気軽にご相談ください。


Azure OpenAI Service デプロイタイプ毎の料金体系

Azure OpenAI Service では、選択するデプロイタイプによって適用される料金モデルが異なります。

以下の表は、各デプロイタイプとそれに対応する料金モデルの関係を示しています。

デプロイタイプ

主な用途

特徴

料金モデル

Standard

中小規模の利用、変動的な使用パターン

リージョン固有のデプロイメント

従量課金制

Global Standard

高可用性要件、データ所在地制約が少ない場合

グローバルインフラストラクチャを利用

従量課金制

Global Batch

大規模な非同期処理、大量データ処理

大量のデータ処理やコンテンツ生成に適合

従量課金制(標準価格の 50%オフ)

Provisioned

大規模で一貫した利用、低遅延要件

事前に処理能力を確保

PTU ベース

デプロイタイプの選択は、プロジェクトの要件(規模、処理の緊急性、データの地理的制約など)と予算を考慮して行う必要があります。

適切なデプロイタイプを選ぶことで、必要な性能を確保しつつ、コストを最適化することが可能になります。

Azure OpenAI Service 主要モデルの料金体系

Azure OpenAI Serviceの料金は、利用するモデルやAPI、デプロイするリージョンによって異なります。

以下は、2025年8月時点の「米国東部2リージョン」における主要モデルの料金体系です。価格は100万トークンあたりの米ドル(USD)で表示されています。

モデル

入力 (100万トークンあたり)

キャッシュされた入力

出力 (100万トークンあたり)

GPT-5 Global

$1.25

$0.125

$10.00

GPT-5 mini Global

$0.25

$0.025

$2.00

GPT-5 nano Global

$0.05

$0.005

$0.40

GPT-5 chat Global

$1.25

$0.125

$10.00

o3 2025-04-16 Global

$2.00

$0.50

$8.00

o4-mini 2025-04-16 Global

$1.10

$0.28

$4.40

o3 mini 2025-01-31 Global

$1.10

$0.55

$4.40

o1 2024-12-17 Global

$15.00

$7.50

$60.00

GPT-4.1 Global

$2.00

$0.50

$8.00

GPT-4.1-mini Global

$0.40

$0.10

$1.60

GPT-4.1-nano Global

$0.10

$0.03

$0.40

GPT-4o 2024-1120 Global

$2.50

$1.25

$10.00

※実際の価格は、Microsoft との契約の種類、購入日、適用される為替レートによって異なる場合があります。最新の料金は以下の公式ページをご確認ください。


OpenAI API との料金構造比較

Azure OpenAI Service と OpenAI API はどちらもトークンベースの従量課金制ですが、料金構造や追加機能に違いがあります。

料金要素

Azure OpenAI Service

OpenAI API

基本課金単位

トークン数

トークン数

料金モデル

1. 従量課金制

2. PTU(プロビジョニング スループット ユニット)ベース

従量課金制のみ

長期利用割引

Azure Reservations を通じて利用可能

なし

リージョン別料金

リージョンによって料金が異なる場合あり

グローバル統一料金

追加インフラコスト

ストレージ、ネットワーク転送等で追加料金の可能性あり

基本的になし

超過料金

PTU モデルの場合、超過使用時に追加料金

なし(利用量に応じた課金のみ)

請求サイクル

月次(Azure の請求サイクルに統合)

使用量に基づく(通常は月次)

この比較から、大規模で長期的なプロジェクトでは Azure OpenAI Service がコスト最適化の可能性を提供し、小規模や変動的な利用では OpenAI API がシンプルで分かりやすい料金構造を提供していることがわかります。

選択に際しては、プロジェクトの規模、セキュリティ要件、予算、そして長期的な成長計画を考慮することが重要です。


Azure OpenAI Service のコスト最適化戦略

Azure OpenAI Service を効率的に利用するためには、適切なコスト管理が不可欠です。

このセクションでは、Azure 料金計算ツールの使用方法、PTU のサイズ設定と最適化、コスト最適化のベストプラクティス、そして予算設定と使用量の監視について説明します。


Azure 料金計算ツールの使用

Azure 料金計算ツールは、Azure OpenAI Service の利用コストを見積もるための便利なツールです。

モデル、リージョン、予想されるトークン数、PTU 数などを入力することで、おおよそのコストを算出できます。

Azure 料金計算ツールの利用イメージ


プロジェクトの予算策定や、異なるモデルやデプロイタイプのコスト比較に役立ちますので、ぜひ活用しましょう。

Azure 料金計算ツールの使い方は、以下の記事で詳しく解説しています。

Azure 料金計算ツールの使い方・見積もり作成のコツをわかりやすく解説


PTU のサイズ設定と最適化

PTU ベースのデプロイを選択した場合、適切な PTU 数を設定することがコスト最適化の鍵となります。ピーク時のトラフィック、平均使用パターン、必要なレイテンシなどを考慮し、過不足のない PTU 数を設定しましょう。

Azure OpenAI Studio 内の「Capacity Culclator を利用すると、必要な PTU 数を見積もることができます。

Capacity Culclator

Capacity Planner では、1 分あたりの最大呼び出し回数、プロンプト内のトークン数、モデルの応答トークン数などの情報を入力することで、推奨される PTU 数を算出できます。

また、異なるシナリオでのコスト比較も可能です。


予算設定と使用量の監視

Azure OpenAI Service の使用量とコストを効果的に管理するためは、以下の手順を踏むことをお勧めします。

  1. 月次予算の設定:予想される使用量に基づいて予算を設定します。
  2. アラートの設定:予算の 80%や 90%に達した時点でアラートを受け取るように設定します。
  3. 使用量の定期的な確認:Azure Portal や Azure Cost Management ツールで Azure OpenAI Service の使用量を定期的に確認します。
  4. 詳細な分析:使用パターンを分析し、異常な使用量や最適化の機会を特定します。
  5. 予算の調整:必要に応じて予算を調整し、ビジネスニーズの変化に対応します。
  6. PTU 使用量の監視:PTU の使用状況を監視し、必要に応じて調整します。


適切な予算設定と使用量の監視により、予期せぬコストの発生を防ぎ、Azure OpenAI Service を効率的に利用することができます。


Azure OpenAI Service 利用時の注意点

Azure OpenAI Service を利用する際には、いくつかの特殊なケースや注意点があります。

このセクションでは、Fine-tuning モデルの料金、PTU の予約と長期利用のオプション、HTTP エラー応答と課金の関係、そして Azure 前払いクレジットの利用について説明します。


Fine-tuning モデルの料金

Fine-tuning を行う場合は、トレーニングコスト、モデルの使用コスト、ストレージコストなどが発生します。

  1. トレーニングコスト:Fine-tuning プロセス自体に対して課金されます。これは使用されるトークン数と計算リソースに基づきます。
  2. 使用コスト:Fine-tuning されたモデルの使用料は、通常のモデルよりも高くなる傾向があります。
  3. ストレージコスト:Fine-tuning されたモデルの保存にはストレージ料金が発生します。


【注意点】

  • Fine-tuning の必要性を慎重に評価し、コストと期待される性能向上のバランスを検討してください。
  • 使用頻度の低い Fine-tuning モデルは定期的に見直し、不要なものは削除してストレージコストを最適化します。


PTU の予約と長期利用のオプション

Azure Reservations を通じて PTU を 1 か月または 1 年間予約購入でき、割引が適用されます。

安定した利用が見込まれる場合は、予約購入を検討しましょう。

  1. Azure Reservations:1 か月または 1 年間の期間で PTU を予約購入できます。
  2. 割引率:長期予約により、オンデマンド料金と比較して大幅な割引が適用されます。
  3. 柔軟性:予約はリージョンごとに購入でき、柔軟にスコープを設定できます。
  4. コスト最適化:長期的かつ安定した使用が見込まれる場合、予約オプションを活用することで大幅なコスト削減が可能です。


【注意点】

  • 使用量の予測を慎重に行い、過剰な予約を避けてください。
  • 予約の購入前に、実際の使用パターンを分析することをお勧めします。


HTTP エラー応答と課金の関係

API リクエスト時の HTTP エラー応答と課金には以下の関係があります。

  1. 成功したリクエスト(200 OK):通常通り課金されます。
  2. クライアントエラー(4xx):一般的に課金されません。
  3. サーバーエラー(5xx):通常課金されませんが、一部のケースで課金される可能性があります。


【注意点】

  • エラーが頻発する場合は、アプリケーションのロジックを見直し、不要な API コールを減らすことでコストを最適化できます。
  • レート制限に注意し、適切なリトライロジックを実装することが重要です。


Azure 前払いクレジットの利用

Azure 前払いクレジットは、Azure OpenAI Service の利用に適用できます。

  1. 適用範囲:前払いクレジットは、Azure OpenAI Service の使用料金に自動的に適用されます。
  2. 優先順位:前払いクレジットは、通常の従量課金よりも先に消費されます。
  3. 有効期限:クレジットには有効期限がある場合があるので、注意が必要です。


【注意点】

  • クレジットの残高と有効期限を定期的に確認してください。
  • クレジットを最大限に活用するために、使用計画を立てることをお勧めします。


これらの特殊なケースと注意点を考慮することで、Azure OpenAI Service をより効果的かつ効率的に利用することができます。

コスト管理と最適化を常に意識し、サービスの特性を十分に理解した上で利用することが重要です。


まとめ

本記事では、Azure OpenAI Service の料金体系について詳しく解説しました。

Azure OpenAI Service はトークンベースの公平な課金システムや、モデル別・リージョン別の料金設定、長期利用割引などの特徴を持つことが理解頂けたかと思います。

また、2024 年 8 月の更新により、従量課金制と PTU オプションの柔軟な選択が可能になり、ユーザーは使用パターンに応じて最適な料金モデルを選べるようになりました。

効率的な利用のためには、使用パターンの分析、適切なモデルとリージョンの選択、コストと使用量の定期的な監視が重要です。

今後は、AI モデルの進化に伴う新たな料金体系の登場や、産業別・用途別の特化型プランの提供が予想されます。Azure ユーザーの皆様は、これらの変化に柔軟に対応しながら、コストとパフォーマンスの最適なバランスを追求することが重要です。

CONTACT
お問い合わせ

Microsoft AzureおよびAI・IoTに関する
お問い合わせはこちらから

東京エレクトロンデバイス株式会社

Copyright © Tokyo Electron Device LTD. All Rights Reserved.
当ウェブサイトでは、サイトの利便性向上のためにクッキーを利用しています。サイトの閲覧を続行されるには、クッキーの使用にご同意いただきますようお願いします。詳細はこちら