静的型付きスクリプト言語 Cotowali
この記事は未踏2021採択者アドカレ! の 23 日目の記事です。
Cotowali について
Cotowali は、2021年度未踏に「シェルスクリプトへのコンパイルを行う静的型付けスクリプト言語の開発」のテーマで採択され、現在開発中のスクリプト言語です[1]
Cotowali コンパイラは V言語で記述されています。Vコミュニティ公式ではないプロジェクトとしては規模が大きく、V言語コンパイラのバグ発見にも貢献しています[2]。
コンセプト
- POSIX 準拠シェルスクリプトへのトランスパイル
- シェルスクリプトの機能を取り入れながらも、一般的な言語に近く理解しやすい文法
- シンプルな静的型付け
ちなみに、Cotowali はあくまでシェルスクリプトをバックエンドに使う新規のスクリプト言語であり、シェルスクリプトに型をつけるものではありません。
静的型付けではありますが、型システムはごく簡易なものです。強い型付けによる強力なサポートではなく、ケアレスミスの防止のような補助的な用途を目的としています。
想定用途
これまでシェルスクリプトを使用していたような場面で使える、書きやすい言語としての用途を想定しています。また、シェルスクリプトの書きづらさを嫌ってポータビリティを犠牲に Ruby や Python が選択される場合がありますが、そのような場面でポータビリティを犠牲にしなくてもいい選択肢として選べる言語になることも目的としています。
具体的なケースとして、以下のような例を想定しています。
-
curl -sSL http://... | sh
でインストールするタイプのツールのインストールスクリプト - プロジェクトのセットアップスクリプト
- Docker の entrypoint スクリプト
- CI で利用するスクリプト
反対に、以下のようなケースは Cotowali のターゲット外です
- Web アプリ
- 複雑な CLI ツール
- ある程度パフォーマンスを気にする必要があるスクリプト
シンプルに言えば、小規模でポータビリティがあることが望ましいものが想定用途。大規模だったり、パフォーマンスを重視するものはターゲット外です。
言語仕様 / サンプル
Cotowali の言語としての特徴は、二つの部分から構成されます。
- 普通のプログラミング言語としての機能
- シェルスクリプトの用途のための機能
普通のプログラミング言語としての機能
シェルスクリプトのつらさの要因として、一般的なプログラミング言語には見られない特殊性が挙げられます。
古い言語という理由もありますが、シェルスクリプトは単純にプログラミング言語である以上に、シェルというインターフェースでもあるため、ある程度必要なことではあります(事実、PowerShell 等の新しいシェルにおいても、似た文法はある程度採用されています)。
しかし、Cotowali は純粋にプログラミング言語であるため、それらを排除し、できるだけ平凡な文法を採用しています。
サンプルコードをいくつか見てみましょう。このような、比較的普通に見える文法の言語がシェルスクリプトに変換されます。
fn fizzbuzz(i: int): string {
if i % 3 == 0 && i % 5 == 0 {
return 'fizzbuzz'
} else if i % 3 == 0 {
return 'fizz'
} else if i % 5 == 0 {
return 'buzz'
} else {
return "$i"
}
}
for i in range(0, 20) {
println(fizzbuzz(i))
}
// require は単にファイルを読み込みます。module を作ることはありません。
// また、コンパイル時に処理されるため、source コマンドとは別物です。出力時には単一ファイルになります。
require 'os' // std / COTOWALI_PATH
require './mymod' // relative
require 'github:cotowali/cotowali@main/tests/hello.li' // github
require 'https://.../hello.li' // http
module mod {
fn hello() { println("hello mod") }
}
module mod::submod {
fn hello() { println("hello mod::submod") }
}
mod::hello()
mod::submod::hello()
// type alias
type Vec2 = (float, float)
// methods
fn (v: Vec2) x(): float { return v[0] }
fn (v: Vec2) y(): float { return v[1] }
// operator overload
fn (lhs: Vec2) + (rhs: Vec2): Vec2 {
return (lhs.x() + rhs.x(), lhs.y() + rhs.y())
}
// Array は参照ではなく値です。
fn sum(vals: []int): int {
var n = 0
for v in vals {
n += v
}
return n
}
sum([0, 1, 2])
シェルスクリプトの用途のための機能
シェルスクリプトは単に分かりにくいだけの言語ではありません。コマンドを呼び出しパイプで繋ぐといった用途では、他の言語よりもシンプルに記述できる優れた側面もあります。
Cotowali ではそのようなシェルスクリプトの機能を取り入れています。
コマンド呼び出し
@command
で任意のコマンド呼び出しをサポートします。
require 'platform'
const url = 'https://example.com'
if platform::has_command('curl') {
@curl(url)
} else if platform::has_command('wget') {
@wget('-O', '-', url)
}
パイプライン
fn (n: int) |> twice() |> int {
return n * 2
}
fn ...int |> sum() |> int {
var (v, ret): (int, int)
while read(&n) {
ret += v
}
return ret
}
assert((range(1, 4) |> sum() |> twice()) == 12)
パイプライン演算子自体は他の言語にも存在する機能ですが、Cotowali のパイプライン演算子はそのままシェルスクリプトのパイプラインに変換されます。これは、既存のコマンド呼び出しと組み合わせて使用できることを意味します。
assert(((1, 2) |> @awk('{print $1 + $2}')) == '3')
シェルスクリプトでは行ごとの操作を行うことが多いです。これを反映したものが ...int
のような sequence 型であり、シェルスクリプトと同様にパイプでつなげて行ごとに処理する書き方ができます。
println(
cat(data.txt)
|> filter('foo')
|> replace('foo', 'bar')
|> head(3)
|> join('\n')
)
リダイレクト
リダイレクトによるファイルへの書き込みをサポートします。パイプラインの右端が文字列値の場合リダイレクトとして扱います。
現状では分かりやすさを優先して標準出力をファイルに書き込むリダイレクトのみをサポートしています。現時点では 2>&1
等に相当するものはサポートしていません。
10 |> 'data.txt' // echo 10 > data.txt
20 |>> 'data.txt' // echo 20 >> data.txt
fn filename(): string { return 'file.txt' }
cat('data.txt') |> first() |> filename()
do_something() |> null // redirect to '/dev/null'
インラインシェルスクリプト
インラインでシェルスクリプトを記述できます。また、ただ埋め込むだけではなく、%name
でCotowali で定義した変数を利用できます。
var n = 10
var text: string
sh { %text="n = $%n" }
assert(text == 'n = 10')
その他の構文
詳細はドキュメントを参照してください、と言いたいところなのですが、そちらの方には手が回っておらず十分ではありません。一応ある程度までは記述してあるため、参考程度にはなると思います。
より詳細について知りたい場合は、テストおよび標準ライブラリを参照してください。
利用方法
AdC に合わせて最初のバージョンをリリースしました。インストーラを使用してインストールでき、Linux と macOS をサポートします。
実用的な言語とは言い難いですが、遊んでいただければ幸いです。
インストール (Konryu)
インストールにはバージョンマネージャである Konryu を使用します。下記のコマンドを実行し、表示される指示に従うと、konryu コマンド、lic コマンド(コンパイラ)、lish コマンド(REPL) が利用できます。
curl -sSL https://konryu.cotowali.org | sh
# 以下を .bashrc 等に追加します
# export PATH="$HOME/.konryu/bin:$PATH"
# eval "$(konryu init)"
正常にインストールが完了し、PATH を正しく通していれば、以下のコマンドで Hello World が実行できます。
echo 'println("Hello World")' | lic run
konryu の使い方は help を参照してください[3]
Konryu - Cotowali installer and version manager
Usage: kornyu [options] [command] [version]
Options:
-h --help - Print help message
Commands:
help - Print help message
init - Print shell code to configure environment
install - Install cotowali release
uninstall - Uninstall specified version
use - Use specified version
releases - List available cotowali releases
versions - List installed cotowali versions
update - Update konryu
destroy - Destroy konryu and all installed files
Konryu は Cotowali 自体で書かれています。現在はリリースが一つしかないため、実質的にインストーラとしての役割しかありませんが、新しいバージョンがリリースされた場合、Konryu からインストールし、またバージョンを切り替えることができます。
Konryu はまさに Cotowali のターゲットとするユースケースであり、最初のリリースのためのマイルストーンでした。このようなスクリプトを記述できる程度には、Cotowali が動作することを示せているはずです。
Head を試す
現状では Konryu が対象とするのはリリースされたバージョンのみです。
Cotowali はまだまだ開発中であり、頻繁に変更されます。最新版である Head は、ソースコードからビルドするか、docker を通して使用します。
ソースコードからのビルドは README を参照してください。
docker イメージは cotowali/cotowali-dev
です。これは Github Action から自動的に push されるため、常に最新の環境です。
ただし、開発用の環境を含んだイメージであるため、サイズが大きいことに注意してください。
コンパイラの使用方法
lic file.li
でコンパイル結果を標準出力に出力します。実行は lic file.li | sh
あるいは lic run file.li
です。
Playground / オンラインコンパイラ
ちょっと試すために処理系をインストールするのは面倒、という方のために、Playground を用意しています。
また、オンラインコンパイル API も用意しているため、処理系がなくても以下のように手元で実行できます
# 現時点では https 非対応 です
curl http://lic.cotowali.org -d 'println("Hello World")' | sh
Heroku を利用しているため、初回のリクエストには1分程度かかることがあります。また、手動デプロイのため、最新版とは限らないことに注意してください
標準ライブラリ
Cotowali はポータビリティを重視します。
しかし、@command
による直接のコマンド呼び出しや、インラインシェルスクリプトの使用は容易にポータビリティを損ねます。
ポータビリティを重視して書かれた標準ライブラリが多くの範囲をカバーすることで、
直接のコマンド呼び出しやインラインシェルスクリプトをユーザーが利用することなく、
自然にポータビリティの高いスクリプトが書ける言語になることを目指しています。
標準ライブラリにはまだまだ手が回っていないのが現状ですが、現時点で存在する、いくつかの特徴的なライブラリを紹介します。
-
input_tty
入力を受け取る input() は存在しますが、シェルスクリプトに変換する特性上、標準入力からの入力ではユーザーの入力を適切に処理できないことがあります。たとえば、
curl url | sh
のような利用方法において、stdin は入力をとるために利用できません。これを解決するために、tty から入力を読み取る
input_tty
関数が実装されていますconst name = input_tty('Who are you ?') println("Hello $name")
-
tar.li
tar コマンドのオプションは覚えていますか? 熟練のプログラマにとっては常識かもしれませんが、
少なくとも初心者には正直わかりづらいです。私も毎回調べていました。また、できるだけ標準ライブラリだけでスクリプトを書けるようにするという目的から考えても、tar は使用頻度が高く、標準ライブラリに必須です。
Cotowali のでは、標準ライブラリ
tar
を require することで、
tar::create_to('file.tar', 'dist')
tar::extract_file('file.tar')
のように使用できます。現状では、tar コマンドの x(Extract), c(create), f(file), C(dir), z(gzip) に対応する関数がサポートされています。
-
platform.li
OS やシェル等の判定や、コマンドの存在確認ができます。 -
http.li
http::get(url)
が実装されています。curl や wget の複数のコマンドをラップすることでポータビリティのある http リクエストを行えます。
また、busybox の wget もサポートします。
非シェルスクリプトバックエンド
Cotowali はポータビリティを重視しています。それを標榜する以上は必然的に、シェルスクリプトを出力するだけでは足りません。
まだ部分的にしか動作しませんが、非シェルスクリプトのバックエンドの実験的な実装も存在します。
PowerShell バックエンド
まず当然挙がるのが PowerShell です。PowerShell バックエンドは、文法上は 8割程度まで動作します。現状でテストされているのは Linux 版の PowerShell ですが、当然目的は Windows の PowerShell のサポートです。
Universal バックエンド
少し不思議なバックエンドです。以下のコードはこのバックエンドの出力を簡略化したものです。
echo " \`" > /dev/null # " @"
hello() {
echo 'hello'
}
hello
: << '__END_HEREDOC__'
"@ > $null
function hello() {
'hello' | write-output
}
hello
function __END_HEREDOC__() {}
__END_HEREDOC__
このバックエンドは、以下のように使用できます。
echo 'println("hello")' | lic -b ush > hello.ush
sh hello.ush
# or
pwsh hello.ush
# or
cp hello.ush hello.ush.ps1
PowerShell.exe -ExecutionPolicy ByPass -f hello.ush.ps1
詳しい解説は省きますが、意外と仕組みはシンプルです。
最後に
未踏で開発中の言語 Cotwali についての簡単な紹介でした。
まだまだ実用的な言語には遠く、うまく動かないかもしれませんが、気が向いたら遊んでいただければ幸いです。
ところで、GitHub の Star が増えると継続のモチベーションにもなりますし、単純に喜びます。
-
静的型付「き」言語が正しいというご指摘をいただき、記事のタイトルは修正しました。ただ、採択テーマ名は静的型付「け」言語です。過去に戻って自分に教えてあげたい。 ↩︎
-
少なくとも今年度に入って以降の V言語へのコントリビューションはほぼ Cotowali の開発中に発見されたバグの修正であり、数えてみると 50 PR ほど送っていました ↩︎
-
コマンドを実行した際、単に http error と表示されることがあります。これは GitHub API のレートリミットの可能性が非常に高いです。Konryu では 1 コマンドで最大 1 回の API アクセスを行います。GitHub トークンの設定や結果のキャッシュは今のところ未実装です。 ↩︎
Discussion
Typoです. 「シンプルな性的型付け」
🙏🙏🙏
ush は sh と pwsh の polyglot ですか?
そうです。拡張子を ps1 にすれば PowerShell.exe でも実行できます。
シンタックスハイライトがないと読みづらいですが、基本的な仕掛けはすべて 1 行目に入っています。
なるほど
ありがとうございます
ここの拡張子は typo みたいですね