[SAP on AWS Specialty] 自分用勉強メモ ③
High Availability
SAPアーキテクチャーでは、ASCS とデータベースが SPOF であり、高可用性と耐障害性を実現する必要がある
実装方法として、ASCS とデータベースをそれぞれクラスタリングして実装
※クラスタリングを行う際、Overlay IP(OIP) を使用しデプロイされている VPC とは異なる IP アドレス帯を指定する必要がある
※この場合、NLB を使用し、OID へのアクセスを行っている
NLB (+Route53)を使うパターンか、Transit GW を使うパターンがある
SAP HANA の場合、HSR(HANA System Replication)を使用する
※ogreplay, delta_datashipping のオペレーションモードあり
→logreplay の方が即時反映
DR
Automatic Recovery
基になるハードウェア障害または修復にAWSの関与が必要な問題が原因でインスタンスが障害になった場合に、インスタンスを自動的に回復する
※終了したインスタンスは回復できない
復元されたインスタンスは、インスタンスID、プライベートIPアドレス、Elastic IPアドレス、およびすべてのインスタンスメタデータを含め、元のインスタンスと同じ
※障害のあるインスタンスにパブリックIPv4アドレスがある場合、インスタンスはリカバリ後もパブリックIPv4アドレスを保持
※障害のあるインスタンスが配置グループにある場合、回復されたインスタンスは配置グループで実行
Quick Starts
Cloudformation を使用し、SAP 環境をデプロイ
HANA Service Auto-Restart
SAP HANA が提供する障害復旧ソリューション
サービスのいずれかがソフトウェア障害または HANA Service AutoRestart watchdog 機能により、人為的なミスによりサービスが自動的に再起動する
サービスが再起動するとすべてのサービスがロードされ 必要なデータをメモリに戻し動作を再開する
Host Auto-Failover
SAP が提供する障害復旧ソリューション
障害が発生したら、別のスタンバイインスタンスで復旧
既存のストレージボリュームを含むインスタンス、ホスト名、IPアドレス、AWSインスタンスID などが同様となる
HANA System Replication (HSR)
SAPが提供する高可用性・ディザスターリカバリーソリューション
HSRは「N+N」方式を採用していて、プライマリシステムとセカンダリシステムの両方に同じ数のノードを構成
プライマリシステムの各サービスは、セカンダリシステムの対応するサービスと通信し、データを複製HSRでは、同期、インメモリ同期、非同期など、復旧時間目標(RTO)と復旧時点目標(RPO)に応じてさまざまなレプリケーションオプションを選択可能
HANA Backup/Restore
すべての変更をインメモリデータベースに永続化する
※停電からの復旧・再開でも永続的なストレージが失われない
※SAP HANA のデータおよびログファイルは、定期的にバックアップを取ることができる。
Storage Replication
AWS ではサポートされていない
Option 1 – Automatic Recovery & HANA Backup/Restore
AZ 障害が起こった際、Cloudformation を使用して別 AZ に新しい環境を展開し、S3 からバックアップ(スナップショット)をリストアする
Option 2 – Automatic Recovery & HSR without Data Preload (Warm Standby)
複数 AZ に HANA インスタンスを作成し、HSR を使用し、レプリケーションをしておく
AZ 障害が起こった際、セカンダリインスタンスに移行
preload オプションはオフ
Option 3 – Automatic Recovery & HSR without Data Preload (Warm Standby + Dev/QA)
Option 2 とほとんど一緒、Failover 時以外は Dev/QA 用に使用
Option 4 – Automatic Recovery & HSR with Data Preload (Hot Standby)
上記 2 オプションと構成は同じ
preload オプションがオン
このオプションが最高の RTO と RPO を得られるが最もコストがかかる
可能な限り低い RTO が必要な場合に適している
Option 5 – Automatic Recovery & Multi-Tier HSR (Hot Standby + Out-of-Region DR)
構成は Option 4 とほとんど同じ
リージョンレベルの障害のために別リージョンへ非同期 HSR preload オプションオフで同期
Option 6 – Automatic Recovery & HSR with Amazon S3 CrossRegion Replication (Hot Standby + Out-of-Region DR)
構成は Option 4 とほとんど同じ
別リージョンのレプリケーションは Cloudformation と S3 のクロスリージョンレプリケーションから構築、リストアする
Cost vs RPO/RTO
White Paper
Discussion