👩‍🔬

AWS FISハンズオン

2021/05/22に公開

はじめに

2021/5/15(土)に以下のハンズオンに参加した際の内容を紹介する。
AWSの基礎を学ぼう特別編　最新サービスをみんなで触ってみるはじめてのカオスエンジニアリング

この特別編では、2020年12月にアナウンスされた、制御された実験で弾力性とパフォーマンスを向上させるカオスエンジニアリングを実現させる、AWS Fault Injection Simulatorを皆で触って学びましょう

カオスエンジニアリングって何だろう、、
また、それを実現できるAWS Fault Injection Simulator(FIS)とは？
本題に入る前にサクッと解説する。

カオスエンジニアリングってなんだ

稼働中のシステムに対して意図的に障害を発生させて、
システムがどう対応するのかを確認し、実際の障害に備える手法。
NetflixがAWS上のシステムを対象に実施していることで知られている。

AWS FISってなんだ

AWSリソースに対して意図的に障害を起こすことができるマネージドサービス。
使用する際は「実験テンプレート」で障害を起こすシナリオを設計する。

ハンズオンの概要

FISでEC2インスタンスに障害を発生させる実験を行った。

FISでEC2を停止して復旧
FISでEC2を削除(terminate)
FISでEC2を停止してAuto Scalingで復旧

このブログでは一部を紹介。

事前準備

IAMロール作成

fisroleという名前でロールを作成する。
このロールに、FISがEC2を操作する際に必要な権限を付与していく。

【参考】IAM アクセス権限の設定

fisroleロールを使用するサービスの指定

FISが一覧に載っていないため仮でEC2を選択する。

ポリシー作成

ロールに割り当てるアクセス権限を定義する。
EC2インスタンスの参照や再起動・停止・削除の権限など。

作成したポリシーをロールに割り当て

ロール作成

FISを信頼するサービスとして設定する

このままではFISがEC2にアクセスすることはできない。
なぜなら、fisroleロールを使用する信頼されたサービスとしてFISが設定されていないから。
(ロール作成時にサービス一覧でEC2を選択しましたよね)

「信頼関係の編集」によりFISドメインを指定することで、
FISが、EC2アクセス時に必要となる一時的な認証情報を取得できるようになる。