🗂

各種サービスのステータス

2022/11/03に公開約8,700字

システム開発では様々なインターネット上のサービスを利用していると思う。
例えば、Firebase、Github、Slack、etc。

特に AWS、GCP、Azure などのクラウドサービスが大規模に止まってしまうとなにが起こったのか把握するのに思わぬ時間がかかったりする。
とりあえず、これはなんかおかしいと思ったら Twitter で検索してみるのが手っ取り早かったりもする。

障害初期はうちだけの問題か、よそにもなにか起こっているのかの切り分けには Twitter が有効だったりする。
しかし正確に状況を知るためにはサービスで用意しているステータスページを見るのがいいだろう。

このエントリではシステム開発、運用によく使われるサービスのステータスページをまとめてみた。

多くのサービスでステータスページの内容を RSS フィードや Twitter でも情報提供している。
利用サービスのフィードを Slack にでも流すようにしておけばいち早く障害を察知するのに役立つと思う。

なお、サービスのチョイスは私が使っているものは含めているが、それ以外のものはよく使われていそうかなと思ったものを選んだ。
サービスの分類も私の独断と偏見[1]なので、悪しからず[2]
また Twitter については単なる公式 Twitter アカウントも含んでいる。それらにはステータス情報以外も投稿されている。

IaaS,PaaS系サービス

いわゆるパブリッククラウドサービスやシステム、サービスをまるっと載せてしまえるプラットフォームを提供しているサービスをこの分類にした。
ダウンされるとたちまちサービスの稼働に重大な影響が発生する可能性が高く、その稼働状況には特に気を配るべきサービスかと思う。

サービス名 ステータスページ フィード/Twitter
Amazon Web Service(AWS) AWS Service Health Dashboard RSS Feed(ECS)
RSS Feed(RDS)
RSS Feed(S3)
Google Cloud Platform(GCP) Google Cloud Status Dashboard RSS Feed
Microsoft Azure Azure の状態 RSS Feed
Heroku Heroku Status RSS Feed
Saleforce Trust Status

AWS は各リージョン x 各サービスごとの RSS 配信が用意されている[3]。表には代表的な 3 サービスのフィードを載せた。他のサービスはステータスページ参照のこと。
AWS Healthというサービスもあるので利用を検討してみてもいいかと思う。

Baas系サービス

システムの一部機能を担うバックエンド系のサービス。

サービスにクリティカルな影響があるものが多いのでその稼働状況に注意したいサービス群だと思う。

サービス名 ステータスページ フィード/Twitter 概要
Firebase Firebase Status Dashboard RSS Feed GoogleのBaas
Stripe Stripe System Status [Twitter]@stripestatus 決済サービス
Paypal PayPal Status Page RSS Feed 決済サービス
Auth0 Auth0 Status Page [Twitter]@auth0status 認証サービス
Okta Okta Status | System Status RSS Feed 認証サービス
OneSignal OneSignal Status RSS Feed
[Twitter]@OneSignalStatus
プッシュ通知配信サービス
Akamai Akamai Status RSS Feed CDN
Fastly Fastly Status RSS Feed CDN
Cloudflare Cloudflare Status RSS Feed CDN

Auth0 は RSS フィードも提供していますが、テナント ID を含める形で RSS フィードの URL が決まる。詳しくはステータスページを参照のこと。

開発支援 Saas

サービスの稼働には直接関わらないけれど、物によっては開発プロセスの重要な一部を担うサービス。

ライブラリ・パッケージエコシステム系サービス

各言語のパッケージマネージャがライブラリやパッケージを取得元とするサービス。
落ちているとライブラリ等が取得できずにビルドできなくなったりするので、本番サービスにすぐに影響することはないが、開発プロセスにとっては重要。
デプロイできなくなったりといった影響がある。

サービス名 ステータスページ フィード/Twitter
RubyGems RubyGems.org Status RSS Feed
[Twitter]@rubygems_status
npm npm, Inc. Status RSS Feed
[Twitter]@npmstatus
Docker Docker System Status RSS Feed

Docker は Dockerhub を含んでいる。

VCSサービス

ソースコードのバージョン管理システムのリモートリポジトリを提供するサービス。
落ちているとソースを取得できず、ビルドに失敗したりするのでやはり開発プロセスにおいて重要なサービスとなる。

サービス名 ステータスページ フィード/Twitter
Github GitHub Status RSS Feed
[Twitter]@githubstatus
GitLab GitLab System Status RSS Feed
[Twitter]@gitlabstatus
Atlassian Bitbucket Atlassian Bitbucket Status RSS Feed

CIサービス

落ちているとビルドやデプロイ処理が止まってしまうなどの影響がある重要サービス。
なお、Github Actions は GitHub Status に含まれている。

サービス名 ステータスページ フィード/Twitter
CircleCI CircleCI Status RSS Feed
[Twitter]@CircleCIstatus
Travis CI Travis CI Status RSS Feed
[Twitter]@traviscistatus

その他開発支援サービス

サービス名 ステータスページ フィード/Twitter 概要
Codecov Codecov Status RSS Feed
[Twitter]@codecov
コードカバレッジ計測
Cypress Cypress Status RSS Feed 自動テスト

監視・モニタリングサービス

サービスそのものや、開発プロセスを止めたりしないものの、システムの状態がわからなくなるので大いに困るサービス。

サービス名 ステータスページ フィード/Twitter
Mackerel Mackerel Status RSS Feed
[Twitter]@mackerelio
Datadog Datadog Status RSS Feed
[Twitter]@DatadogOps
New Relic New Relic Status RSS Feed
Sentry Sentry Status RSS Feed
[Twitter]@getsentry
Airbrake Airbrake Status RSS Feed
[Twitter]@airbrake
Google Analytics Google 広告 ステータス ダッシュボード RSS Feed

業務系Saas

開発業務をサポートするサービス。

開発プロセスそのものにとってクリティカルではないと思うが、使えないと作業効率を大きく落とす。

チャットサービスのダウンは高度に ChatOps を実現していると効率低下で済まないかも。

サービス名 ステータスページ フィード/Twitter 概要
G Suite Google Workspace ステータス ダッシュボード RSS Feed オフィススイート+α
Office365 Microsoft 365 Service health status [Twitter]@MSFT365Status オフィススイート+α
Slack Slack System Status RSS Feed [Twitter]@SlackStatus チャットサービス
Chatwork メンテナンス・障害・その他[4] チャットサービス
Discord Discord Status チャットサービス
Zoom Zoom Status RSS Feed ビデオチャットサービス
Figma Figma Status RSS Feed UIデザイン
Miro Miro Status RSS Feed
[Twitter]@MiroHQ
ビジュアルコラボレーション

ステータスページを作れるサービス

紹介したサービスのいくつかでも使われているが、Statuspage | Hosted Status Pages for Your Companyを使えばステータスページを作成できる。
自社のサービスで作りたくなったら利用を検討するといいと思う。

最後に

今の時代、すべてを自前で賄うとというのも難しいので多かれ少なかれこれらのサービスを使っているかと思う[5]
利用しているサービスはプロダクトやチームそれぞれだし、依存の度合いも違うだろう。止まることもあると思って完全な障害対策を用意しておけると理想かもしれない。しかし、障害が発生する頻度と発生時の損失、障害対策を維持するコストのバランスを考慮し最適な費用対効果を見いださないといけないのが現実。その結果、プラットフォームの障害には甘んじないとならない状況、箇所もあるとは思う。
だから、せめて迅速に状況を把握できるように障害情報を得る方法を確認しておきたいと思って調べた。

脚注
  1. 様々なサービスメニューを提供していて、分類しづらいサービスも多かった。 ↩︎

  2. 「あのサービスも入れてあげて!」とかコメントにあれば追加するかも。 ↩︎

  3. リージョンごとの全サービスフィードもあれば便利なのになぁと思った。 ↩︎

  4. いわゆるステータスページはない。要望は上がっていたが、その Chatwork に関するご意見・ご要望ページ自体がなくなっていた。 ↩︎

  5. 利用したほうが可用性が高かったりするし。 ↩︎

Discussion

ログインするとコメントできます