🛤️

TROCCOのSelf-Hosted RunnerをAmazon ECS（Fargate）で動かしてプライベートネット間の転送をしてみた

gtnao

2025/02/18に公開

 はじめに2025/02現在、クラウドETL「TROCCO」では、任意の環境でデータ転送処理を完結できる、「Self-Hosted Runner」機能の開発が進められています。

この度、β版としてトライアルの受付が始まったので、実際に試してみました。

 筆者について筆者は、サービスの黎明期よりTROCCOの開発に従事、Self-Hosted Runnerの設計や実装の一部も行っている、いわゆる中の人です。

今回は、現時点での公開可能情報から、できる限り本機能のイメージを明確にしていただければと、執筆しています。
!本記事でご紹介する内容は執筆時点のものであり、正式リリースに向けて仕様が変更される可能性があります。

 既存のTROCCOのアーキテクチャまず、既存のTROCCOのアーキテクチャについて軽く触れておきます。

TROCCOでは、データ転送ジョブが立ち上がると、弊社管理のAmazon EKS上でPodが立ち上がり、終了するとPodも破棄されます。

Pod内では、OSSのEmbulkで転送処理が行われつつ、その実行状況を管理するコードが動いています。

詳しくは「アーキテクチャConference2024」での拙スライドを参照ください。
https://speakerdeck.com/gtnao/paastosaasnojing-mu-dexin-lai-xing-tokai-fa-su-du-woliang-li-suru-trocco-r-nokoremadetokorekara?slide=42

 課題ここで問題となるのは、転送元/先のリソースがインターネットからアクセスできない場所にあるケースです。

SaaS系のコネクターは、トークンやID/Passwordによる認証があるとはいえ、インターネット上のどこからでもアクセス可能なことが多いです。

一方で、クラウドやオンプレミス上のデータベースやファイルストレージなどは、何かしらネットワーク面での制約があるはずです。

その場合、何らかの方法でTROCCOからアクセス可能となるように設定いただく必要があります。

例えば、踏み台サーバーを経由したり、AWSであればSSMやPrivateLinkを利用したり、といった具合です。

しかしながら、上記方法が使えない場合もありますし、踏み台経由にせよTROCCOのグローバルIPからのアクセスを明示的に許可いただく必要があります。

 Self-Hosted Runnerのアーキテクチャ前述の課題を解決するべく、Self-Hosted Runner機能ではコンテナイメージを配布して、データ転送処理部分をユーザーの任意の環境で行えるアーキテクチャを取っています。

一方で、設定の作成や管理は今まで通りTROCCOのサーバー上で行われる、ハイブリッドな形式です。

GitHub ActionsのSelf-Hosted Runnerを触ったことがある方は、それをイメージしていただけると分かりやすいはずです。
https://docs.github.com/ja/actions/hosting-your-own-runners/managing-self-hosted-runners/about-self-hosted-runners

 今回の題材今回は、Amazon ECS（Fargate）上でコンテナを動かしてみます。

より価値を実感してもらうため、以下のような環境下での転送を題材にしてみます。
2つの異なるVPCのプライベートサブネット上でAmazon RDS（MySQL）が動いている
両ネットワークはVPC Peeringで繋がっているが、RDSへは外部からのアクセスができない
片方のVPC上でECSを動かすことを想定し、そこからのRDSへのアクセスを許可しておく
赤色の矢印（リクエスト）が、全てSelf-Hosted Runnerを起点に走っています。

データ転送処理が実行されるのはSelf-Hosted Runner上なので、転送元/先のリソースへアクセス可能な環境下で起動することで、ネットワーク的制約を乗り越えることができます。
上記の構成は機能に直接関係はしない一例ですが、再現性のためTerraformのHCLファイルを置いておきます。

（ECSに関連する部分は、後述で画面から作成しているため含まれていません。）
https://gist.github.com/gtnao/73ae235b4f7f576327711f3543a7f0fb

 TROCCOとの通信ハイブリッドな機能なので、Self-Hosted RunnerとTROCCOは随時を通信する必要があります。

例えば、以下が挙げられます。
死活監視のために、Runner側からTROCCO側へ、定期的にHeartbeatリクエストを行う
ジョブが発火した際には、Heartbeatのレスポンスとしてその旨を受け取る

ジョブ実行前に、Runnerg側からTROCCO側へ、必要な接続情報を取得しに行く
ジョブ実行中に、Runnerg側からTROCCO側へ、実行ログを送信する
ジョブ完了時に、Runner側からTROCCO側へ、ステータスを通知する
簡略図

その全てが、Sels-Hosted Runner起点となっていることが重要です。
例えば、AWSのSecurity Groupではステートフルな（返りのパケットは自動的に許可される）仕組みなので、アウトバウンドな設定が通れば通信できます。

また、一般的にアウトバウンドな設定は、厳しく制限されるインバウンドな設定に比べて、比較的緩めに設定されることが多いです。

このようなアーキテクチャを取ることで、既存のTROCCOでは難しかった要件を満たせるようになります。

 Self-Hosted Runnerを動かすそれでは、実例に入っていきます。

 クラスターの作成Self-Hosted Runnerのオプションが有効な場合、TROCCOのサイドメニューに表示されます。

まずは、コンテナをまとめる論理的な概念である「クラスター」を作成します。

作成時にはトークンが発行されます。

セキュリティの都合上、一度しか表示されないため控えておいてください。

トークンは2つまで作成できるため、安全にローテーションが可能です。

例として表示されているDockerコマンド（docker pull, docker run）を実行することで簡単に立ち上げることができます。

docker runでは、環境変数として先ほどのトークンを指定してください。
Self-Hosted Runnerの1つの設計思想としてポータビリティがあります。

クラウドサービスや構成に寄らず、コンテナが実行できる環境であれば、1台から複数台まで互いに依存せずに立ち上げることができます。

極端な話、手元のPC上でも実行可能です。

とりあえず挙動を確認したい、といったアドホックな場合には有用でしょう。

 ECSの設定全体の構成はTerraformで作成しておきましたが、こちらは分かりやすさのため、マネージドコンソールから手動で準備していきます。

 トークンの安全な管理まず、トークンをセキュアにECSタスクへ設定すべく、System ManagerのParameter Storeに登録しておきます。

一手間かかりますが、こういうところはしっかりやっておきましょう。

 TaskExecutionRoleの用意ECSのTaskExecutionRoleに指定するためのIAM Roleを作成しておきます。

今回は、CloudWatch Logsへのロギング、Parameter Storeからの取得権限が必要です。

前者はマネージドポリシー（AmazonECSTaskExecutionRolePolicy）に含まれていますが、後者は自前で作成する必要があります。
{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "AllowSSMParameterAccess",
      "Effect": "Allow",
      "Action": ["ssm:GetParameter", "ssm:GetParameters"],
      "Resource": [
        "arn:aws:ssm:ap-northeast-1:<ACCOUNT_ID>:parameter/self_hosted_runner_token"
      ]
    },
    {
      "Sid": "AllowKMSDecrypt",
      "Effect": "Allow",
      "Action": "kms:Decrypt",
      "Resource": "arn:aws:kms:ap-northeast-1:<ACCOUNT_ID>:alias/aws/ssm"
    }
  ]
}
ECSタスクにAmazonECSTaskExecutionRolePolicyと作成したポリシーを許可するIAM Roleを作成します。

 ロググループの作成CloudWatch Logsのロググループも事前に作成しておきます。

AmazonECSTaskExecutionRolePolicyには、ロググループを作成する権限がないためです。

 セキュリティグループの作成SecutiryGroupを作成しておきます。

アーキテクチャ上インバウンドなアクセスは発生しないので、アウトバウンドなルールだけ許可しておきます。

 ECSクラスターそれでは、ECS自体の設定をしていきます。

今回は、Fargateを利用してECSクラスターを作成します。

 ECSタスク定義次に、ECSタスク定義を作成します。
Self-Hosted Runnerの最小推奨メモリは2GBです。

とりあえず、その値に設定しておきます。

タスク実行ロールでは先ほど作成したIAM Roleを指定します。

イメージのURIにはTROCCOの画面上に表示されていたものを指定してください。

インバウンドなリクエストを受け付けることはないため、ポートマッピングは指定不要です。

環境変数には、TROCCO_REGISTRATION_TOKENにValueFromでParametor StoreのARNを指定して埋め込みます。

ログ設定では、先ほど作成したCloudWatch Logsのロググループを指定します。

 ECSサービス最後に、ECSサービスを作成してデプロイします。

とりあえず、先ほど作成したタスク定義を1タスク起動する設定とします。

ネットワークは転送元側のパブリックサブネットで起動するようにしておき、先ほど作成したSecurity Groupを指定します。

タスクが起動し始めると、CloudWatch Logsでログが確認できます。

Joined cluster successfullyと出ていればひとまず成功です。
TROCCOの画面上からも確認できます。

まだジョブ待ち状態なのでIDLEステータスが表示されています。

 転送設定の作成TROCCO側の設定に戻ります。
!Self-Hosted Runnerでは、全てのコネクターをサポートしているわけではありません。

DB系、DWH系、ファイル系のコネクターを中心にサポートしていく予定です。

 接続情報まずは、それぞれのMySQLへの接続情報を作成します。

ホスト名が解決されるIPは、それぞれのプライベートサブネットのIPのため、従来のTROCCOであればもちろんアクセスできません。

 転送設定次に、転送設定を作成します。

Self-Hosted Runnerオプションが有効の場合、ジョブを動かすクラスターを選択可能です。

選択しないことも可能なので、ある設定は従来通りTROCCO上で動かし、ある設定は自前のコンテナ上で動かすこともできます。
その後は、設定を通常通り作成していきます。

Self-Hosted Runner機能の特徴として、設定を作成するフローは既存のTROCCOとシームレスという点があります。

 プレビューSTEP2へ進むと、従来通りプレビューが走ります。

ただしこちらは、Self-Hosted Runner上でEmbulkのpreviewコマンドが実行されています。
TROCCOの仕様上、スキーマ情報を決定するために必ずこのフローが必要になります。

しかしながら、セキュリティ都合上、実プレビューデータをTROCCOへ送ることを許可できないケースもあります。

この場合は、コンテナ起動時に環境変数TROCCO_NO_SEND_PREVIEW=trueを渡すことにより、必要不可欠なカラム情報のみが送られるようにできます。

 ジョブ実行それでは、データ転送ジョブを実行してみます。
CloudWatch Logsを見ると実行ログが流れ始めました。

TROCCOの画面上でも、RunnerのステータスがACTIVEになっています。

無事成功しました。

転送先のMySQLを覗いてみます。

実際にデータが入っていることも確認できました。

 CPUを増やしてみるECSタスク定義でvCPU数を増やしてデプロイしてみます。
TROCCOの裏側で利用しているEmbulkは、CPU数に比例して並列度が上がります。

コネクタの組み合わせや諸条件次第なので、一概に処理時間が比例的に短くなるわけではないですが、試してみましょう。

今回は、1vCPUから8vCPUに上げてみます。

新しいタスク定義でサービスを更新します。

新しいタスクが立ち上がりました。

同一の転送設定を実行してみると以下になりました。

以下の先ほどの結果と比較すると、20秒弱早くなったことが確認できました。

このように、ユーザー側で柔軟にリソースを調整できることも、Self-Hosted Runnerの価値の1つです。

 並列度を上げてみるECSサービスでタスク数を4に設定してデプロイしてみます。

その後、転送ジョブを同時に4件起動してみます。

それぞれのRunnerがACTIVEステータスになっており、並列でジョブが実行されていることが確認できます。

 おわりに今回は、TROCCO Self-Hosted Runnerが解決する課題、技術仕様、実際の構築例まで、広くご紹介させていただきました。

トライアルも受け付けておりますので、ご関心をお持ちの方はサービスページからお問合せください。