速いターミナルfoot(について書こうとしたらtmuxが遅くて大差ないという記事)
alacrittyから乗り換えてfootというターミナルをしばらく使っています。zennに紹介記事がなさそうだったので、初めてですが記事を書いてみようと思い書いています。
この記事はREADME, wikiを読んで「はえ~なるほど」と思った部分、footを使ってみて気に入ったポイント、そして小学生並みの感想から成っています。ご了承ください。
foot とは
GPUを使わないにも関わらず高速なC言語製ターミナルエミュレーターです。
インタラクティブな動作での性能を重視して設計されています。
全体的に速いですが、alacrittyの倍以上速い部分、ケースもあれば、逆もあります。
footが速い理由
wikiによると速さの主な理由は2つです。
速い理由1:VT parserが高速
VT parserはエスケープシーケンスのパーサーです。
公式ドキュメントにfootとその他ターミナルエミュレータ(alacritty,urxvt,xterm)のvtebench結果を比較する表が掲載されています。footの各項目のスコアはalacrittyを大幅に上回るか同程度となっており、大きく劣る項目はありません。
footがいくつかの項目において非常に高速である主な理由がVT parserの速さなのだそうです。
vtebenchはPTYの読み取り速度を測るベンチマークだそうですので、パーサーが高速だというのは確かに効いてくる部分なのでしょう。
速い理由2:差分レンダリング
footのレンダリングエンジンは画面内で変化があった領域のみ再描画する差分レンダリングを行います。 1文字、1行だけの変更やスクロール(スクロールは画面全体が動くので素朴には全体の更新となってしまいますが、footは既存の表示を移動させて追加の行だけレンダリングすることができます)などにおいて効果は絶大で、alacrittyよりも速く描画してくれます。
画面全体に更新が発生した場合はalacrittyに劣りますが、全体の再描画はそこまで多くないので、実用上alacrittyより高速です。(alacrittyの画面描画は小さな変更でも画面全体を再描画します。)
そもそも、画面全体を書き換えるようなイベントはそのイベント自体がそこそこ時間がかかってターミナルの描画時間は誤差になるような気がします。
footの良いところ、気に入っているところ
サーバー/クライアントモードがある
バックグラウンドでサーバーを起動しておくことで省メモリーと爆速起動を実現するやつです。(urxvtのデーモン/クライアントモード相当)
複数のウィンドウ(クライアント)が1つのサーバープロセスを共有するため、リソースを一本化してメモリ消費を節約できます。
また、新しいウィンドウの起動はプログラムの本体的な部分やフォント等の読み込みの必要がなく、クライアントを1つ生やすだけで済むのですごく速いです。
私はswayユーザーで、最近neovimをfloating windowで起動させるキーボードショートカットを設定したのですが、footclientの起動は一瞬、neovimの起動もプラグインの遅延読み込みにより一瞬なので良い気分です。
適当計測結果によると80ミリ秒でvim成分が摂取可能らしいです。ホントか?
sixel対応
alacrittyが未だ(2022-09-08時点)sixel非対応である中、footはsixelによる画像表示に対応しています。私は結局tmuxを使ってしまうので有効活用できていませんが、alacritty並に速く、sixel対応のターミナルというのは私の知る限りはfootのみとなります。
性能検証
footとalacrittyの描画速度が手元の環境でどれくらい違うか確かめてみました。
環境
CPU: Core i5-8250U
OS: Arch linux
❯ foot --version
foot version: 1.13.1 +pgo +ime +graphemes -assertions
❯ alacritty --version
alacritty 0.10.1 ()
❯ sway --version
sway version 1.7
ディスプレイ解像度はフルHDで、画面領域をfootとalacrittyでだいたいはんぶんこです。swayのgapが8px入っています。別の仮想デスクトップにそれぞれフルスクリーンで表示した方が適切だったと気付いたのは本記事を書いてからしばらく後のこととなります。
ザーっと文字が流れていくときの全体的な性能
exa -lR /usr > result
でファイルを作って、
hyperfine -r 10 --show-output -N "cat result"
をそれぞれ実行しました。
ターミナルマルチプレクサなし
foot: 284.4 ms ± 16.2 ms
alacritty: 567.8 ms ± 33.5 ms
footが2倍ほど速いです。画面を流れていくような表示には滅法強いのが見て取れます。
tmux使用
foot: 1.608 s ± 0.015 s
alacritty: 1.583 s ± 0.046 s
両者大幅に速度が低下します。
footの方がalacrittyより僅差ですが遅くなりました。何度かやっても同じだったので偶然ではないようです。
foot自前のスクロールではなくtmux側がスクロールを行なっていることが差分レンダリングスクロールの性能を下げているようです。[1]render-timerを表示して実行してみたところ画面全体の再描画よりは高速に描画できてるっぽかったので無効になっているわけではなさそうです。
zellij使用
foot: 1.198 s ± 0.019 s
alacritty: 1.121 s ± 0.015 s
tmuxのときと同じ傾向ですが、tmuxほど性能が落ちていません。zellijの方が速いみたい?
でもzellijあんまり好きじゃない。
vtebench
vtebenchスコアを確認しました。
Benchmark | foot | alacritty | foot+tmux | alacritty+tmux |
---|---|---|---|---|
cursor_motion | 15.52ms | 31.58ms | 278.36ms | 257.67ms |
dense_cells | 46.32ms | 113.93ms | 717.64ms | 700.4ms |
light_cells | 8.04ms | 22.31ms | 22.32ms | 21.6ms |
scrolling | 167.66ms | 114.03ms | 416.33ms | 378.65ms |
scrolling_bottom_region | 128.22ms | 121.91ms | 427.5ms | 405.36ms |
scrolling_bottom_small_region | 130.88ms | 118.85ms | 325.97ms | 326.45ms |
scrolling_fullscreen | 9.68ms | 19.18ms | 37.66ms | 35.25ms |
scrolling_top_region | 136.57ms | 130.92ms | 321ms | 338.73ms |
scrolling_top_small_region | 136.15ms | 119.94ms | 332.97ms | 339.47ms |
unicode | 18.57ms | 26.79ms | 191.55ms | 259.82ms |
tmuxは使うなということだろうか
描画性能のチェック with vim
render-timerを使って描画にかかった時間を見ました。
ここで見られるのはあくまでレンダリング性能であってもう一つの心臓たるVT parserの効果は反映されません。
vimと言いつつneovimを使ったのですがまあ見るのはrender-timerの時間なのでどんなアプリケーションを使ったかでそう違ったりはしないでしょう。
1文字打つ
空のバッファーに"a"と1文字打ちました。
foot: 260.91 µs
alacritty: 1338.148 µs
footがalacrittyより5倍も速くなっています。
やはり差分レンダリングは変化量が小さいときの効果が絶大です。
1行スクロールする
先の実験で作った/usr以下の一覧を使いました。
foot: 734.15 µs
alacritty: 1329.285 µs
footがalacrittyの2倍弱速い結果となりました。footは差分レンダリングによって高速な動作を実現しているという性質上、変更される文字数が増えるほどリードは減っていき、やがて逆転される運命にあります。
2行以上スクロールする
footはスクロールする行数が増えるほど不利なのでスクロール行数を増やしていったときの変化を確認します。
スクロール行数 | render-timer時間(µs) |
---|---|
1 | 700くらい |
2 | 1200くらい |
3 | 1300くらい |
4 | 1400くらい |
5 | 1600くらい |
6 | 1800くらい |
10 | 2500くらい |
15 | 3700くらい |
20 | 5000くらい |
25 | 5500くらい |
26 | 5500くらい |
27 | 2500くらい |
30 | 2500くらい |
35 | 2500くらい |
26行のスクロールまでレンダリング時間が長くなって行き、27行スクロールから短くなり2500 µsくらいになります。後の検証の結論を持って来てしまいますが、2500 µsというのはどうやら全体再描画の際にかかる時間のようです。
この検証の結果が示すのは、footのレンダリングにおけるワーストケースは全体再描画ではなく、差分レンダリングを使うか諦めて全体を再描画するかどうかを決めるロジックが、本来であれば全体再描画が最適となる程の文字数が変更されたにも関わらず差分レンダリングを使うことを選択した場合に発生するということです。
画面全体の変化
G で一番下に行きました。
foot: 2505.03 µs
alacritty: 1168.534 µs
footは画面の大部分が変更された場合には諦めて画面全体の描画を行います。footは全体の描画もなんだかんだ高速で、alacrittyの半分程度のレンダリング性能は発揮します。footは差分レンダリングでalacrittyを超える性能になりますが、差分レンダリングできない時が遅いということはありません。むしろターミナルエミュレーター全体からすれば速い部類でしょう。
1行消してみる
dd で一行消しました。
foot: 1946.93 µs
alacritty: 1469.813 µs
なんか遅いです。実質、行を繰り上げてるだけだし差分スクロールが効いてくれそうな気がするのですが……
もしや number 列があるから?
set nonumberして1行消してみる
というわけで、set nonu して dd で1行消してみました。
foot: 985.47 µs
それっぽい速さになりました。どうやら左右に領域を分割するような要素があると差分スクロールは働かないらしいです。
試しに左にディレクトリツリーを出してスクロールした
foot: 2562.01 µs
予想通り、全体再描画な時のレンダリング時間になっていました。
微妙な気分ですがスクロール領域をうまく検出するのはそれはそれで時間がかかりそうなので仕方ないような気もします。
まとめのようなもの
footは差分レンダリングにより表示内容の変化が小さいときはalacritty以上に速いターミナルエミュレーターです。
個人的にはサーバー/クライアントモードを持った現代的なターミナルというのが手放せないポイントとなっており、差分スクロールがちょっと微妙でたまにalacrittyより遅かろうとalacrittyに戻ろうという気持ちにはなりません。
そもそも、ターミナルを速くしてもtmuxが結構遅いみたいなのでtmuxを使う場合はfoot+tmuxでもalacritty+tmuxでも大差ないんじゃないかと今は思っています。(本末転倒)
……大差ないのでサーバー/クライアントモードがあるfootの方が一枚上手なのではないでしょうか。[2]
Discussion