🔖
【初心者用】Azure AI Foundry の Serverless API における Fine-tuning の料金について
執筆日
2025/12/15
はじめに
Azure AI Foundry で Fine-tuning を行う際、選択できる計算環境には大きく分けて次の2つがあります。
Serverless APIManaged Compute
今回はServerless APIのみになります。
Serverless APIにてFine-tuningを行った際の主な料金発生ポイント
トレーニングジョブの実行
実行時課金
モデルのFine-tuning処理に対して課金が行われます。
課金はトレーニング時間に応じて発生します。
そのため、モデルサイズ,学習データのサイズ,エポック数に影響を受けます。
課金の計算式イメージは下記です。
課金料金 ≒ GPUインスタンス単価 × トレーニング時間
※トレーニング時間はモデルサイズ・学習データサイズ・エポック数により変動します。
エポック数:繰り返し回数
インスタンス単価:VMごとの単価なのですがServerless APIの場合は、Azure側が自動で選択します。
ストレージ
固定費
アップロードしたトレーニングデータやFine-tuningしたモデルの保存にかかるストレージ料金です。
推論利用
実行時課金
APIリクエストを処理する際にトークン数に応じて課金
通常は「入力トークン」「出力トークン」の2種類
ホスティング費用
半固定費
Serverless環境が稼働している時間に応じて課金される。
アイドル状態が続くとスケールゼロとなり、課金が停止される。
※15日間完全にアクセスがない場合、デプロイ自体が削除される可能性があります。
参考資料
Discussion