🔖

【初心者用】Azure AI Foundry の Serverless API における Fine-tuning の料金について

に公開

執筆日

2025/12/15

はじめに

Azure AI Foundry で Fine-tuning を行う際、選択できる計算環境には大きく分けて次の2つがあります。

  • Serverless API
  • Managed Compute

今回はServerless APIのみになります。

Serverless APIにてFine-tuningを行った際の主な料金発生ポイント

トレーニングジョブの実行

実行時課金
モデルのFine-tuning処理に対して課金が行われます。
課金はトレーニング時間に応じて発生します。
そのため、モデルサイズ,学習データのサイズ,エポック数に影響を受けます。

課金の計算式イメージは下記です。
課金料金 ≒ GPUインスタンス単価 × トレーニング時間
※トレーニング時間はモデルサイズ・学習データサイズ・エポック数により変動します。

エポック数:繰り返し回数
インスタンス単価:VMごとの単価なのですがServerless APIの場合は、Azure側が自動で選択します。

ストレージ

固定費
アップロードしたトレーニングデータやFine-tuningしたモデルの保存にかかるストレージ料金です。

推論利用

実行時課金
APIリクエストを処理する際にトークン数に応じて課金
通常は「入力トークン」「出力トークン」の2種類

ホスティング費用

半固定費
Serverless環境が稼働している時間に応じて課金される。
アイドル状態が続くとスケールゼロとなり、課金が停止される。
※15日間完全にアクセスがない場合、デプロイ自体が削除される可能性があります。

参考資料

https://learn.microsoft.com/en-us/azure/ai-foundry/openai/how-to/fine-tuning-deploy?view=foundry-classic&tabs=portal
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic
https://techcommunity.microsoft.com/blog/azure-ai-foundry-blog/save-big-on-hosting-your-fine-tuned-models-on-azure-openai-service/4195386
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/how-to/fine-tuning-cost-management?view=foundry-classic
https://learn.microsoft.com/ja-jp/azure/ai-foundry/how-to/fine-tune-serverless?view=foundry-classic

ヘッドウォータース

Discussion