Rails の ActionCable は ALB の背後にある EC2 でどのように動作するのか
この記事は
AWS(CloudFront → ALB → EC2)でホストされた Rails + ActionCable アプリが、WebSocket 接続をどのように維持し、Blue/Green デプロイ時にどのような挙動を示すのかを調査した内容をまとめます。
背景
Rails アプリケーションにおけるブルーグリーンデプロイの実現方法を調査していた際に抱いた疑問をきっかけに調査しました。インフラの構成と、ブルーグリーンデプロイの方法のイメージを図解しました。
上記の図のように、Elastic Beanstalk で管理される ALB + AutoScaling + EC2 の構成で、Docker コンテナで EC2 上に Rails アプリケーション(ActionCable を利用した Websocket 通信を含む)をデプロイしていました。アプリのホスティング・ActionCable の使い方に関しては以下を前提としています。
- アプリは Docker で EC2 上にデプロイ
- WebSocket は 受信専用(送信は REST API 経由)
- ActionCable のサブスクリプションアダプターは PostgreSQL(LISTEN / NOTIFY)
この構成で、Elastic Beanstalk を使用したブルー/グリーンデプロイ のサービス紹介を参考に、Elastic Beanstalk の CNAME スワップが Rails アプリケーションの無停止デプロイに利用可能か評価していました。
この時、WebSocket 通信が都度 HTTP リクエストを行わず、確立したコネクションを維持し続けることを踏まえると、CNAME スワップの影響として以下の疑問が生じました。
- CNAME スワップを行うと、WebSocket のコネクションは維持されるのか
- WebSocket のコネクションが維持される場合、CNAME スワップ後の新しい EC2 インスタンスにはいつ接続されるのか
- WebSocket のコネクションが維持される場合、CNAME スワップ後の新しい EC2 インスタンスに接続されるまでの間、WebSocket のコネクションを通じてレスポンスを受け取れるのか
この疑問の是非によっては、ActionCable を利用した Rails アプリケーションのユーザーに不具合が発生する可能性があります。ブロードキャストされたメッセージが受信できない時間が発生する可能性がある。もしくは deprecated されるべき EC2 サーバの処理が続いてしまいユーザーに見える挙動に一貫性がなくなる可能性があります。
各リソースでの WebSocket の挙動
この疑問の解決のため、まずは使用している各リソースでの WebSocket の挙動について調査しました。
CloudFront
CloudFront ディストリビューションで WebSockets を使用する によると、CloudFront は WebSocket をネイティブサポートしています。WebSocket リクエストは、CloudFront がオリジンサーバーにリクエストを転送します。この際、Upgrade
ヘッダーを含む HTTP/1.1 リクエストがオリジンに送信されます。そのため、実質の WebSocket リクエストの処理はオリジンサーバである ALB 以降に委ねられます。
ALB (Application Load Balancer)
Application Load Balancer のリスナー によると、ALB もまた WebSocket をネイティブにサポートしています。
Application Load Balancer は WebSocket のネイティブ サポートを提供します。HTTP 接続のアップグレードを使用して、既存の HTTP/1.1 接続を WebSocket (ws または wss) 接続にアップグレードできます。アップグレードすると、リクエストに使用される TCP 接続 (ロードバランサーとターゲットへの) は、ロードバランサーを介したクライアントとターゲット間の永続的な WebSocket 接続になります。WebSocket は、HTTP リスナーと HTTPS リスナーの両方で使用できます。リスナーに対して選択したオプションは、HTTP トラフィックだけでなく、WebSocket 接続にも適用されます。詳細については、Amazon CloudFront デベロッパーガイドの How the WebSocket Protocol Works を参照してください。
ALB は HTTP/1.1 のアップグレードリクエストを受け入れると、ロードバランサーを介してクライアント-ターゲット間とで WebSocket の接続を確立します(クライアント ↔︎ ALB ↔︎ EC2 間に 1 本の持続的 TCP コネクションが張られる)。以降の WebSocket の通信は、この確立されたコネクションを通じて行われるため、ロードバランサを経由しつつも同じ EC2 に張り付きます。ALB にはスティッキーセッションの設定がありますが、WebSocket の接続はプロトコルレベルで接続の張り付きが保証されるため、スティッキーセッションを有効にする必要はありません。
EC2 (Rails アプリケーション)
Action Cable の概要 によると、以下の記述があります。
2.5 Pub/Sub
Pub/Sub(Publish-Subscribe)はメッセージキューのパラダイムの一種であり、情報の送信者(パブリッシャ)は個別の受信者を指定する代わりに、受信側の抽象クラスにデータを送信します。Action Cable では、この Pub/Sub アプローチを用いてサーバーと多数のクライアントの間の通信を行います。
サーバからのメッセージのブロードキャストは直接クライアントに送信されるわけではなく、受信側の抽象クラスである Pub/Sub を通じて行われます。
今回利用している Postgresql アダプタの実装を見ると、PostgreSQL の LISTEN/NOTIFY
の仕組みがメッセージバスとなり、どの EC2 インスタンス上でメッセージを発行してもすべてのサーバ・クライアントで同じメッセージをサブスクライブできるようになっています。
(参考)PostgreSQL の Pub/Sub 挙動の図解
PostgreSQL の
LISTEN/NOTIFY
の仕組みがメッセージバスとなり、どの EC2 インスタンス上でメッセージを発行してもすべてのサーバ・クライアントで同じメッセージをサブスクライブできるようになっています。
この部分の理解に関して、他の人の発表資料の引用となりますが、PostgreSQL を ActionCable アダプタとして利用した場合の挙動について、図解がわかりやすかったので引用します。(p.19,20,21 の複数 Rails サーバと Postgresql/Redis の Pub/Sub サーバの存在している図です)
このスライド中の図の様に、ActionCable のブロードキャストは一度 Rails サーバから Pub/Sub サーバに送信され、その後 Pub/Sub サーバに接続している Rails サーバにブロードキャストされ、その後 Rails サーバから WebSocket 接続しているクライアントの中で、ブロードキャスト対象のチャンネルをサブスクライブしているクライアントにメッセージが送信されます。
こうした挙動を Rails アプリケーション以降のリソースでしていることによって、たとえクライアントが接続している Rails サーバがロードバランサーの背後にある 1/N のインスタンスであっても、別の Rails サーバからブロードキャストされたメッセージを受信することが可能になっています。
動作確認結果
実際に CNAME スワップを行い、WebSocket のリクエストを実行するとどうなるのかを確認しました。結果として以下のようになりました。
検証項目 | 結果 |
---|---|
CNAME スワップ後、既存 WebSocket は維持されるか | ✅ 維持された |
新環境への乗り換えタイミング | 接続が切れた瞬間 or ブラウザリロード時 |
乗り換え前でもメッセージを受信できるか | ✅ 受信できた |
考察
ここまでの調査結果と動作確認の結果を踏まえ、ActionCable の Rails アプリケーションを Elastic Beanstalk の CNAME スワップを利用してブルーグリーンデプロイすることは可能であると考えられます。冒頭に掲載した図を再掲しておきます。
今回ケースでは CNAME スワップを行ったとしても、WebSocket のコネクションは維持され、依然 Blue 環境の EC2-a
などに接続しているクライアントが存在します。
この時、クライアントからの送信リクエストは Web API で行われている前提のため、リクエストは CNAME スワップ後の Green 環境の Rails サーバに一意に流れ込みます。
そのため、Pub/Sub サーバからはバージョンアップが反映されたメッセージが一意にブロードキャストされることになるため、Blue 環境/Green 環境のどちらに接続しているクライアントも同様にメッセージを受信することができます。
ただし、WebSocket 起因・Postgresql アダプタ起因により考えられる懸念として、以下は検討すべき課題として残ることもわかりました。
- Blue 環境を停止すると、その接続は切れるため再接続処理や受信に失敗した場合のリトライ手段が必要
- 負荷が増えペイロードが大きくなる場合は、PostgreSQL の
NOTIFY/LISTEN
には 8KB の制限があるため、Redis などの他の Pub/Sub アダプタの検討も必要
まとめ
- CloudFront → ALB → EC2 構成でも WebSocket は問題なく維持される
- ActionCable + PostgreSQL LISTEN/NOTIFY で、複数サーバ間のブロードキャストが保証される
- Elastic Beanstalk の CNAME スワップ を用いた Blue/Green デプロイは、ユーザーへの影響を最小化して実施可能
この調査を通じて、ActionCable のブロードキャストの仕組みや、PostgreSQL の Pub/Sub 機能を利用したメッセージの配信方法についても理解が深まりました。今後、ActionCable を利用したアプリケーションの設計やデプロイにおいて、これらの知識が役立てていきたいです。
Discussion