🐈

外部サービスの負荷増大時の影響を最小限にするための設計があるか？

2025/04/20に公開

 外部サービスの負荷増大時の影響を最小限にするための設計があるか？
 背景・概要外部サービスに依存した機能は、相手側のパフォーマンス劣化や障害時の影響を最小限にする設計が求められる
フォールバック、リトライ制御、非同期化、サーキットブレーカーなどが代表的な対策

 例外部OCR(テキスト認識) APIに対し、3回までの指数的リトライを許容し、それ以上はローカルキューに退避(Google Pub/Sub、Amazon SQS、Azure Storage Queue、Redis、Cloud Tasks、RDBMSなどに蓄積)して再処理する
SQS経由で非同期に送信し、送信結果は後続処理に影響しない設計に分離
サーキットブレーカー（例：Hystrix）を導入し、外部障害が全体を巻き込まないように防衛する(外部APIを呼び出さず即座に失敗を返すなど)

 よくある失敗例外部サービスが遅延してレスポンス待ちのAPIが枯渇
タイムアウトが無く永遠にリトライしてリソース枯渇
例外を握りつぶして意図しないサイレントフェイル

 FAQQ. 障害を前提とした設計って何？
A. 外部サービスは必ずいつか落ちる。設計時点で「落ちたらどうする？」を先回りで想定することで、信頼性を高める
Q. 非同期処理すれば全部解決？
A. 非同期だけでは整合性やタイムリーなレスポンス保証はできない。業務要件によってはフォールバックや通知も必要

 関連観点キャッシュ戦略が適切に考慮されているか？
非同期処理と同期処理の適用範囲が適切か？
API のレスポンス時間が適切か？
重要な処理において、フェイルオーバー設計が組み込まれているか？
📘 本記事は SaaS設計レビュー観点チェックリスト（2025年版） の一部です。
設計観点カテゴリ：📊 パフォーマンス・スケーラビリティ

レベル：DeepDive（実装・運用レベル）

推奨読者：設計リーダー / SRE / インフラ設計者 / レビュー担当者
🧭 他の観点もまとめて読みたい方はこちらからどうぞ。

外部サービスの負荷増大時の影響を最小限にするための設計があるか？

背景・概要

例

よくある失敗例

FAQ

関連観点

Discussion