Open2
システムの稼働率の計算について

- システムの開発の流れとしては、非機能要求グレードの作成→システムアーキテクチャの作成に基づく定量的な稼働率の算出 ということが多いと思う。
- この場合、いざ複合SLAを計算してみると、非機能要求グレードで定義した稼働率を下回ることもある。
- どのようにして、顧客側との合意形成を図っていくのが良いのだろうかと思い整理した。
- 正解は無いのだが、以下のような段取りが一番波風立たないのだろう。
- (AWSでもAzureでもだが)サービスのSLAを掛け合わせていくごとに、見かけ上の稼働率は下がっていくよということを、算出方法と共に伝える。
- 99.99%とかを実現しようとするには、マルチリージョンを視野に入れないといけない。要は、コストと稼働率のトレードオフを考えないといけないということを伝える。
- SLAとして高い稼働率を定義してしまうと、SLAなので契約として遵守できない場合のペナルティ)返金など)が発生してしまう。
- ペナルティの発生しないSLOを高めに設定し、SLAは現実的なラインで引いておくのがあり。
- 99%とかになってしまうことに抵抗がある、すなわち「そんなに実際に停止するの?」という顧客に対しては、「クラウドサービスのSLAは低めに設定されており、実際は数値以上の稼働率になっている(ただし実測値は非公表)。そのため、このクラウドサービスを使っても必ずしもSLAの数値通りに停止してしまうということはない。」