📚

Ruby on Docker環境で高速にrubocopする

2020/12/31に公開

数年前にgo/gofmtに触れて以降、CodeFormat on Saveされないとソワソワする体質になってしまい、仕事のRails開発においても"ruby.format": "rubocop"してFormat on Saveしています。
しかしながらrubocopは起動が遅く、Ctrl+SしてからFormat & Saveされるまでに1~2秒かかってしまい大変ストレスフル...

そこでrubocop実行を高速に、またDocker環境で満足に動くように試みました。

2022/9/10 追記

RuboCop 1.31 にて正式にServer Mode機能が実装されたため、そちらを使ったよりシンプルな方法を新しく記事にしています。

https://zenn.dev/cumet04/articles/rubocop-server-with-docker


TL;DR

既存プロジェクトのdocker-composeにrubocop-daemonを追加し、そこにローカルからコマンドを送信してrubocopとして動かせる環境を作った。

rubocop-daemon本体のforkおよび機能追加、composeの設定、環境特化のwrapperスクリプト(rubocopとして動くもの)を作り、vscodeからformatterとして実行できる環境を記した。

成果物と試行錯誤ログはこちら
https://github.com/cumet04/sbox_rubocop-daemon-on-docker/tree/rubocop-daemon-gem
https://zenn.dev/cumet04/scraps/fae984bf1de5e5

なお本記事は調査・試行錯誤ログの割合が多いため、手っ取り早く導入だけしたい方は上記リポジトリよりREADME.md, docker-compose.yml, backend/bin/rubocopだけ読めばokです。

rubocop-daemon

https://github.com/fohte/rubocop-daemon

rubocopをrequireしたdaemonを起動しておき、実際のCLIはdaemonへのコマンド送信と結果受信のみ行う(処理はdaemonが実行する)というツールです。都度の実行時に起動オーバーヘッドが発生せず早い、という仕組みです。

これや!求めていたのはこれや!こいつをdocker-composeで動かせばええんや!

...と思ったのですが、これはdocker環境というよりは1ホストに複数立てていい感じに使えるような想定の実装のため、docker環境で動かすには一工夫いりそうです。

とりあえず動かしてみる

とはいえ、まずは最低限動く状態にしてみます。

プロジェクトのディレクトリ構成は以下のような想定です。

/project-root/
  docker-compose.yml
  backend/
    Dockerfile
    Gemfile
    other-ruby-project-files...

またDockerfileも以下のようなシンプルなものの想定です。

FROM ruby:2.7.2

WORKDIR /app
COPY Gemfile Gemfile.lock ./
RUN bundle install
COPY . /app

この環境にrubocop-daemonを追加します。
Gemfileに以下を追加し、

Gemfile
gem 'rubocop-daemon', require: false

docker-compose.ymlに

docker-compose.yml
  rubocop_daemon:
    build:
      context: ./backend
    command: bundle exec rubocop-daemon start --no-daemon
    volumes:
      - /app/.bundle

という感じでrubocop-daemonのサービスを追加しdocker-compose upすると、アプリケーションとは別にrubocop-daemonのコンテナが起動します。

この状態でrubocop-daemonのコンテナ内でrubocop-daemon execすれば、つまりdocker-compose exec rubocop_daemon bundle exec rubocop-daemon execすればrubocopした場合の結果が出力されます。

簡単にですが、「ひとまず動く」状態を作ることができました。
ただしこれではdocker-compose execbundle exec rubocop-daemonそれぞれの起動オーバーヘッドが発生し、下手するとrubocopをそのまま動かすより遅くなってしまいます。

ここはやはりより速く、rubocop-daemonのリポジトリにあるrubocop-daemon-wrapperをローカル実行できるようにしたいところです。

wrapperを読み解く

そのためにはwrapperが何をしているのか確認します。
なお記事投稿時点での該当コードはこちらです。

上から要約すると

  • rubocop-daemonが使えない場合に標準rubocopにfallback (L5-14)
  • OS/ディストリによるncコマンドのオプション分岐 (L16-42)
  • daemonの各種ステータスのディレクトリ・ファイル名取得 (L44-66)
  • コマンド実行の排他制御 (L68-88) refs issue
  • 標準入力の読み取り(-s --stdin付きの場合) (L90-97)
  • daemonに送るコマンドの組み立て・送信 (L103-117)
  • 失敗時のクリーンアップ(コマンド送信自体に失敗した場合) (L119-132)

となっています。

ここから、docker-composeで動かすにあたってのポイントは

  • daemonとはncコマンドを使って、つまりTCPで通信しており、トークン・実行コマンド・標準入力の内容を送信している
  • daemonの状態を所定のディレクトリから読み取る必要がある
  • rubocop実行の終了コードはstatusファイルに書き込まれる

となります。

daemonをcomposeで動かす

これらを踏まえると、docker-composeの設定では「daemonのTCPポートをホストに露出する」「状態のディレクトリをホスト側から上書きマウントする」ことができればよさそうです。

rubocop-daemonの待ち受けポートを外部に露出する

と、ここでrubocop-daemonのコードを見ると、TCP待ち受けのアドレスが'127.0.0.1'で固定になっています。これではコンテナの外からの通信を受け付けることはできません...

ということで、forkしてbindingオプションを追加したものがこちら。
https://github.com/cumet04/rubocop-daemon/tree/binding_option

rubocop-daemon start--binding 0.0.0.0とオプションを追加するとコンテナの外からの通信を受けることができます。

現在はこれを使う必要があるため、Gemfileを以下のように変更します。

Gemfile
-gem 'rubocop-daemon', require: false
+gem 'rubocop-daemon', git: 'https://github.com/cumet04/rubocop-daemon', branch: 'binding_option', require: false

docker-compose.ymlを修正する

ホストとのTCP通信・状態ファイルの読み取りをできるように変更したdocker-compose.ymlが以下です。

docker-compose.yml
  rubocop_daemon:
    build:
      context: ./backend
-    command: bundle exec rubocop-daemon start --no-daemon
+    command: bundle exec rubocop-daemon start --no-daemon --binding 0.0.0.0 --port 3001
    volumes:
+      - "./backend/tmp/rubocop-daemon:/root/.cache/rubocop-daemon/app"
      - /app/.bundle
+    ports:
+      - "3001:3001"

※volumesの/root/.cache/rubocop-daemon/appの最後の/appはコンテナ内でdaemonが動くディレクトリに合わせます

これでdockerホスト側の3001ポート経由でrubocop-daemonとTCP通信ができ、状態ファイルも./backend/tmp/rubocop-daemonから参照できます。

wrapperスクリプトを書く

daemon側の準備ができたので、クライアント側の準備をします。

利用の前提やファイルパスなどの差異のためオリジナルのrubocop-daemon-wrapperは使えないため、この環境特化で作ります。また分岐とかやるのが面倒なのでvscodeのformatterとしてのみ使うことに最適化します。

backend/bin/rubocop
#!/bin/bash

set -eu
cd $(dirname $0)/..

NETCAT="nc" # 環境に応じて調整
DAEMON_DIR="tmp/rubocop-daemon"

COMMAND="$(cat $DAEMON_DIR/token) /app exec $@"

# 標準入力を読み取っておく; vscodeは'-s'オプション付きで実行するため
STDIN_CONTENT="$(cat)"

printf '%s\n%s\n' "$COMMAND" "$STDIN_CONTENT" | $NETCAT 127.0.0.1 $(cat $DAEMON_DIR/port)

exit $(cat $DAEMON_DIR/status)

決め打ちに決め打ちを重ね、更にエラー処理を略すことで非常にシンプルになっています。

ncコマンドはコードを直接書き換える式を採りました。Linuxな方はnc -Nにしてgit excludeしておきます。環境変数で上書きできるようにしたかったのですが、vscodeから実行した際にうまく読み込んでくれなかったため諦めました。

それ以降の処理はオリジナルを参考にシンプルにしたものです。
-sオプションは指定されていると決め打ちです。またエラー処理もset -eに任せています。プロジェクト内で使うものならこのくらいでもよいでしょう。

この時点で、以下のように上記ファイルを-sオプション専用のrubocopコマンドとして利用可能です。ncコマンドを使った簡易なスクリプトのため動作も速いです。

backend> cat config/application.rb | ./bin/rubocop -s config/application.rb
Inspecting 1 file
C

Offenses:

config/application.rb:1:1: C: [Correctable] Style/FrozenStringLiteralComment: Missing frozen string literal comment.
require_relative "boot"
^
config/application.rb:1:18: C: [Correctable] Style/StringLiterals: Prefer single-quoted strings when you don't need string interpolation or special symbols.
require_relative "boot"
                 ^^^^^^
config/application.rb:3:9: C: [Correctable] Style/StringLiterals: Prefer single-quoted strings when you don't need string interpolation or special symbols.
require "rails/all"
        ^^^^^^^^^^^
config/application.rb:10:3: C: Style/Documentation: Missing top-level class documentation comment.
  class Application < Rails::Application
  ^^^^^

1 file inspected, 4 offenses detected, 3 offenses auto-correctable

vscodeの設定&起動

ここまでくれば、このvscodeがスクリプトをrubocopとして使うようにできれば完成です。

vscodeのruby拡張でformatterやlinterを設定できますが、通常のruby拡張 (rebornix.ruby) ではformatterのパスを指定することはできず[1]、本記事で用意したrubocopコマンドを使うことができません。
そこでruby-rubocop (misogi.ruby-rubocop) という別の拡張を使うことで解決します。

上記拡張をインストールし、vscodeのsettings.jsonにて下記を設定します:

"ruby.format": false,
"ruby.lint": {},
"[ruby]": {
  "editor.defaultFormatter": "misogi.ruby-rubocop"
},
"ruby.rubocop.executePath": "./backend/bin/",

やっていることは、通常のruby拡張によるformat/lintの無効化・formatterに使う拡張の指定・rubocopパスの指定です。

rubocopのパスは実行ファイルのあるディレクトリを指定します。どうもこの拡張は {executePathの値}rubocopを実行するようで、rubocop自体のパスではなくディレクトリを指定し、末尾のスラッシュもつける必要があります。

これで独自に用意したrubocopコマンドにてformat/lintが実行されます[2]

記事初期公開時の内容(非推奨)

以下の内容はアプローチが非常にハックなため推奨しません。上記rubocop拡張機能の利用を推奨します。


しかしながらrubocop-daemonのREADMEにもあるように、vscodeは実行するrubocopのパスをカスタマイズすることはできません[3]

そのため何かしらのハックをするわけですが、筆者が試したのは以下2点です。
どちらの場合でも、format on saveや通常のlintなどで高速なlint/formatが確認できるはずです。

方法1 backend/binをPATHに追加してvscodeを起動する

起動例
$ env PATH="$PWD/backend/bin:$PATH" code .

PATHの先頭にbackend/binを追加してvscodeを起動します。対象プロジェクト専用のvscodeをshellから起動する必要がありますが、PCのグローバル環境を汚染しません。

なおbundlerを経由せずrubocopを起動させるため、vscodeの設定で"ruby.useBundler": falseとしておく必要があります。docker-composeで開発してる環境なら大丈夫でしょう。

※例のスクリプトがbackend/bin/rubocopにある前提

方法2 スクリプトをPATHの通ったところにシンボリックリンクしておく

設定例
$ ln -s $PWD/backend/bin/rubocop /usr/local/bin

※作成先パスは環境による。適切に優先度の高いところへ

グローバルのrubocopを完全にこのスクリプトに置き換えます。vscodeの起動の都度PATHなどを気にする必要がなくなる反面、対象プロジェクト以外でrubocopが使えなくなります[4]

仕事PCで単独プロジェクトしか触らないとか、他のプロジェクトはbundler経由だから問題無いなど、特定条件下では有用だと思います。

まとめ

一部ハックな感じではありますが、一旦入れてしまえば大変高速なlintやformatがお楽しみいただけると思います。

format on saveジャンキーな方は試してみてはいかがでしょうか。

脚注
  1. linterは指定可能なのですが... ↩︎

  2. linterは明示的に指定していませんがこれで動きます ↩︎

  3. 元のissueその次のissueも長らく動いておらず、実装の気配はなさそうです。こ、コントリビュートチャンスか...? ↩︎

  4. この点オリジナルのrubocop-daemon-wrapperはよく考えられていて、rubocop-daemonが無い場合は通常のrubocopとしても動作するようになっているようです ↩︎

GitHubで編集を提案

Discussion