Amazon Bedrock サービスクォータを引きあげれなかった話
個人でAWS Bedrock を使ってチャットボットサービスを構築しようとした際に、
サービスクォータの壁にぶつかりました。
特に個人利用のアカウントでは、Bedrock の推論 API には非常に低い初期上限値が設定されており、
分間 2〜3 リクエストほどしか呼び出せないケースがあります。
マネージメントコンソール上からクォータの引き上げリクエストを申請しましたが、却下されてしまった話です。
状況
チャットボットサービスをAWS上に構築したい思っていました。
最初の一歩として、サービスクォータを確認したところ、チャットボットを作るに厳しい以下の制限がかかっていました。
| 項目 | 値 |
|---|---|
| Cross-region model inference requests per minute for Anthropic Claude Haiku 4.5 | 2 |
| Global cross-region model inference requests per minute for Anthropic Claude Haiku 4.5 | 3 |
つまり 分間2~3回しかリクエストできない ということです。これはつらい。
サービスクォータ引き上げリクエスト
このままではまともなサービスにならないため、サービスクォータの引き上げリクエストを行いました。
丁度最近、マネージメントコンソール上からポチポチするだけで簡単にサービスクォータの引き上げリクエストを申請できるようになり、これを利用。
Qiita:「BedrockのClaudeクォータ緩和申請の手順が簡単になったよ!
」
試しにマネージメントコンソール上から申請しようとしたところ、以下のアラートが表示されました。

どうやらAWSのデフォルトのクォータ値以上の値しか申請できないようで、いったん以下の値で申請を出しました。
| 項目 | 値 |
|---|---|
| Cross-region model inference requests per minute for Anthropic Claude Haiku 4.5 | 125 |
リクエスト後の対応
リクエストの翌日、上限緩和の申請を承った旨の連絡が来ました。
最低限のリクエストだったので、てっきり緩和された連絡かと。
この度のご申請には、担当部署での確認が必要となりますため、現在担当部署に申請をさせていただいております。
申請結果が得られ次第早急にご連絡を差し上げますので、お急ぎのところ恐れ入りますが今しばらくお待ちいただけますようお願い申し上げます。
リクエストの4日後、未だリクエストは受理されず。
お問い合わせいただきました内容につきましては、大変お待たせいたしておりますが、引き続き、担当部署へ確認を取らせていただいております。
回答がご用意でき次第、ご連絡させていただきますので、
誠に恐れ入りますが、今しばらくお待ちいただきますようお願い申し上げます。
リクエストの8日後、緩和リクエストが却下となりました。
個人利用ではありますが、分間リクエストが2回だとかなりつらいです。Bedrockでの利用は諦めようと思います。
大変恐縮ながら、担当部署の判断により当該項目の緩和はできかねる結果となりましたことをご報告申し上げます。
まとめ
今回のケースでは、個人利用アカウントで Bedrock の推論クォータを引き上げようとしましたが、
結果として申請は却下されました。
「GUIで簡単に申請できるようになった」とはいえ、
実際には アカウントの利用実績・支払い状況・信頼スコア に応じてクォータが段階的に引き上がる仕組みが残っており、
初期状態では十分な上限に到達できない場合があることがわかりました。
もし個人で Bedrock を本格的に使いたい場合は:
- AWS アカウントを法人契約化する
- 利用量(請求実績)をある程度積む
- AWS サポートに直接チケットで交渉する
といったステップが必要になりそうです。
今回は諦める形となりましたが、Bedrock自体は良いサービスですし、より多くの人が気軽に触れるようになることを期待したいです。
Discussion