🤖

Vertex AI でGPU学習を始める前に知っておくべきクォータ申請の手順

2025/09/02に公開

 背景Vertex AI で CLIP モデルのファインチューニングを行おうとして、以下のエラーが発生しました。
ERROR: RESOURCE_EXHAUSTED: The following quota metrics exceed quota limits: 
custom_model_training_nvidia_t4_gpus
プロジェクトのOwner権限もあり、Vertex AI API も有効化済みでしたが、GPU 学習用のクォータが初期状態では 0 に設定されていることが原因でした。本記事では、この問題の解決方法と事前に必要な設定について説明します。

 前提知識：Vertex AI のクォータの種類Vertex AI には大きく分けて2つのGPUクォータがあります：

 1. Custom model serving (モデル配信用)Custom model serving Nvidia T4 GPUs per region
モデルをデプロイしてAPIとして公開する際に使用
一部のリージョンでは初期値が1に設定されている場合がある

 2. Custom model training (学習用)Custom model training Nvidia T4 GPUs per region  
モデルの学習・トレーニングで使用
初期値は全リージョンで 0 に設定
今回のエラーはこのクォータ不足が原因

 クォータ申請の手順
 Step 1: Google Cloud Console でクォータページにアクセス
Google Cloud Console にアクセス

IAM と管理 → 割り当てとシステム制限 をクリック

 Step 2: 学習用GPUクォータを探す検索ボックスで以下を検索：
Custom model training
または training でフィルタリング
注意: serving ではなく training のクォータを選択する必要があります。

 Step 3: 目的のGPUタイプとリージョンを選択例：Custom model training Nvidia T4 GPUs per region で us-central1
現在の値が 0 になっているはずです。

 Step 4: クォータ増加申請該当行の「編集」ボタンをクリック
新しい上限値を入力
申請理由を記載
送信

 よくある間違いとトラブルシューティング
 ❌ 間違い1: serving用クォータと勘違いCustom model serving Nvidia T4 GPUs  # これじゃない

 ✅ 正解: training用クォータCustom model training Nvidia T4 GPUs  # これが正解

 ❌ 間違い2: Compute Engine のGPUクォータと混同Compute Engine と Vertex AI は別々のクォータです。

 ❌ 間違い3: 無料トライアルアカウントでの申請無料トライアル期間中はGPUクォータの増加申請ができません。

 まとめVertex AI でGPU学習を始める際の重要ポイント：

GPU学習用クォータは初期値が0 - 事前申請が必須

serving用とtraining用を混同しない - training用を申請する

T4から始めるのが無難 - 承認されやすく、コストも抑えられる

余裕を持って申請 - 3-5営業日前に申請する
これらのポイントを事前に把握しておくことで、Vertex AI での機械学習プロジェクトをスムーズに開始できます。

 参考資料Vertex AI quotas and limits | Google Cloud
View and manage quotas | Cloud Quotas | Google Cloud
Configure compute resources for custom training | Vertex AI

背景

前提知識：Vertex AI のクォータの種類

1. Custom model serving (モデル配信用)

2. Custom model training (学習用)

クォータ申請の手順

Step 1: Google Cloud Console でクォータページにアクセス

Step 2: 学習用GPUクォータを探す

Step 3: 目的のGPUタイプとリージョンを選択

Step 4: クォータ増加申請

よくある間違いとトラブルシューティング

❌ 間違い1: serving用クォータと勘違い

✅ 正解: training用クォータ

❌ 間違い2: Compute Engine のGPUクォータと混同

❌ 間違い3: 無料トライアルアカウントでの申請

まとめ

参考資料

Discussion