パイロットライトとは
英語版のブログは以下をご覧ください。
AWS 公式
REL13-BP02 復旧目標を満たすため、定義された復旧戦略を使用する - AWS Well-Architected Framework
パイロットライト (数分間の RPO、数十分間の RTO): コアワークロードインフラストラクチャのコピーを復旧リージョンにプロビジョニングします。データを復旧リージョンにレプリケートして、そこでバックアップを作成します。データベースやオブジェクトストレージなど、データのレプリケーションとバックアップのサポートに必要なリソースは、常にオンです。アプリケーションサーバーやサーバーレスコンピューティングなど、その他の要素はデプロイされませんが、必要なときには、必須の設定とアプリケーションコードで作成できます。
ホットスタンバイみたいに常に別の場所でサブのシステムを動かすのではなく、最小限の核となる部分だけをスタンバイしておくってことみたいです。
AWS Black Belt Online Seminar AWSで実現するDisaster Recovery | PPT
AMI や CloudFormation を使ったり、EC2 インスタンス自体を停止させておいて、普段は余計なコストをかけず障害が起きた場合にいつでも立ちあげられるように準備しておくなどの方法があるようです。
その他
パイロットライト:停止した状態のサーバーを別のリージョンに用意しておき、障害発生時に立ち上げる。
AWS 上でのディザスタリカバリ (DR) 構成 4 パターン - michimani.net
DR 用にスペックの低い DB を起動しておいて、通常時はデータの同期のみを行います。障害発生時には、 DR 用のリージョンでアプリケーションを起動し、 DB のスペックを上げて対応します。そして元のリージョンの復旧作業を行います。
まとめ
今回は AWS における DR 対応で出てきたパイロットライトについて調べてみました。
以下がポイントでした。
- 障害の備えて最小限の核となる部分だけを別リージョンなどにスタンバイ
- AMI や CloudFormation を利用
- 普段はスタンバイの EC2 などは停止させ、障害時のみ起動させる
コスト最適化しつつ障害に備える方法といったところでしょうか。
シンプルな内容でしたが、どなたかの参考になれば幸いです。
追記 (2021.12.22)
公式ブログで詳しく説明されています。
AWS のディザスタリカバリ (DR) アーキテクチャ、パート III: パイロットライトとウォームスタンバイ | Amazon Web Services ブログ
参考資料
- REL13-BP02 復旧目標を満たすため、定義された復旧戦略を使用する - AWS Well-Architected Framework(https://www.slideshare.net/AmazonWebServicesJapan/aws-black-belt-online-seminar-awsdisaster-recovery)
- AWS 耐障害性と高可用性 - Qiita
- AWS 上でのディザスタリカバリ (DR) 構成 4 パターン - michimani.net
- AWS のディザスタリカバリ (DR) アーキテクチャ、パート III: パイロットライトとウォームスタンバイ | Amazon Web Services ブログ
Discussion