🗽
Juliaの自動微分ならDifferentiationInterface.jlがおすすめ

2025/08/09に公開
Juliaには多数の自動微分パッケージがあり, それぞれ使い方が異なります. ここでは, これらを共通のインターフェースから利用できるDifferentiationInterface.jlを紹介します.

 はじめに2025年7月に開催されたJuliaHEP 2025 Workshopに参加したところ, 自動微分に詳しい方に上記パッケージを紹介してもらえました. バックエンド一覧をによると, 対応している自動微分パッケージは下記の通りです.
ChainRules
Diffractor
Enzyme
FastDifferentiation
FiniteDiff
FiniteDifferences
ForwardDiff
GTPSA
Mooncake
PolyesterForwardDiff
ReverseDiff
Symbolics
Tracker
Zygote
これらのパッケージを同じインターフェースから利用できるようになり, 非常に便利なので共有します.

 インストールDifferentiationInterface.jlを利用するときは, バックエンドとして利用する自動微分パッケージも自分でインストールする必要があります. ここではForwardDiff.jlとZygote.jlをバックエンドとして使用するのでインストールしておきます. もちろん多変数の場合で最速の自動微分パッケージEnzyme.jlもバックエンドに利用できます. Google Colabの場合, Pkg.add("Enzyme")は998秒, import Enzymeは42秒かかったのでコーヒーでも淹れて待ちましょう.
import Pkg; Pkg.add("DifferentiationInterface")
import Pkg; Pkg.add("ForwardDiff")
import Pkg; Pkg.add("Zygote")
import Pkg; Pkg.add("Enzyme")
使うときは, 次のようにバックエンドも一緒に読み込みます.
using DifferentiationInterface
import ForwardDiff
import Zygote
import Enzyme

 1階微分試しにf(x) = x^4という関数を微分しましょう. f'(x) = 4 \cdot x^3なので, x=2を代入するとき,

f'(2) = 4 \cdot 2^3 = 32
が計算できれば正解です. 実際にderivativeという関数で微分できることを確かめてみましょう.
julia> f(x) = x^4
f (generic function with 1 method)

julia> derivative(f, AutoForwardDiff(), 2.0)
32.0

julia> derivative(f, AutoZygote(), 2.0)
32.0

julia> derivative(f, AutoEnzyme(), 2.0)
32.0
正しく計算できていますね. このように, 2つ目の引数で利用したいバックエンドを指定することによって, 簡単にバックエンドを切り替えることができます.

 2階微分上記と同じ関数の2回微分を計算します. f''(x) = 4 \cdot 3 \cdot x^2なので, x=2を代入するとき,

f''(2) = 4 \cdot 3 \cdot 2^2 = 48
が計算できれば正解です.
julia> f(x) = x^4
f (generic function with 1 method)

julia> second_derivative(f, AutoForwardDiff(), 2.0)
48.0

julia> second_derivative(f, AutoZygote(), 2.0)
48.0

julia> second_derivative(f, AutoEnzyme(), 2.0)
48.0
正しく計算できていますね. 2階微分の利用方法はドキュメントに書かれていないことが多いので, ここまで簡単に計算できることには感動しました.

 勾配勾配も次のように計算できます.
julia> f(x) = x[1] + x[2]^2
f (generic function with 1 method)

julia> gradient(f, AutoForwardDiff(), [1.0, 1.0])
2-element Vector{Float64}:
 1.0
 2.0

julia> gradient(f, AutoZygote(), [1.0, 1.0])
2-element Vector{Float64}:
 1.0
 2.0

julia> gradient(f, AutoEnzyme(), [1.0, 1.0])
2-element Vector{Float64}:
 1.0
 2.0
どのバックエンドでも同じ結果が得られていますね.

 ヘッシアンヘッシアンも次のように計算できます.
julia> f(x) = x[1] + x[2]^2
f (generic function with 1 method)

julia> hessian(f, AutoForwardDiff(), [1.0, 1.0])
2×2 Matrix{Float64}:
 0.0  0.0
 0.0  2.0

julia> hessian(f, AutoZygote(), [1.0, 1.0])
2×2 Matrix{Float64}:
 0.0  0.0
 0.0  2.0

julia> hessian(f, AutoEnzyme(), [1.0, 1.0])
2×2 Matrix{Float64}:
 0.0  0.0
 0.0  2.0
どのバックエンドでも同じ結果が得られていますね.

 高速化についてこちらのページで紹介されているように, 途中計算をキャッシュしておき, 利用時に引数として一緒に渡すことで高速化できる場合があります. また, !が付くインプレース版の関数には事前にメモリを確保して渡すので, メモリアロケーションの分だけコストが下がります. 勾配を例に通常版, キャッシュ版, キャッシュ＋インプレース版の使い方と速度を比較してみました.
通常版
import Pkg; Pkg.add("BenchmarkTools")
using BenchmarkTools

f(x) =  x[1] + x[2]^2
x = [1.0, 1.0]
backend = AutoEnzyme()

prep = prepare_gradient(f, backend, x)
value = [0.0, 0.0]

gradient(f, backend, x) |> println # 通常版
gradient(f, prep, backend, x) |> println # キャッシュ版
gradient!(f, value, backend, x) |> println # インプレース版
gradient!(f, value, prep, backend, x) |> println # キャッシュ＋インプレース版
# [1.0, 2.0]
# [1.0, 2.0]
# [1.0, 2.0]
# [1.0, 2.0]

@btime gradient($f, $backend, $x)
@btime gradient($f, $prep, $backend, $x)
@btime gradient!($f, $value, $backend, $x)
@btime gradient!($f, $value, $prep, $backend, $x)
#   48.437 ns (2 allocations: 80 bytes)
#   51.485 ns (2 allocations: 80 bytes)
#   27.112 ns (0 allocations: 0 bytes)
#   23.077 ns (0 allocations: 0 bytes)

prep = prepare_hessian(f, backend, x)
value = zeros(2,2)

hessian(f, backend, x) |> println # 通常版
hessian(f, prep, backend, x) |> println # キャッシュ版
hessian!(f, value, backend, x) |> println # インプレース版
hessian!(f, value, prep, backend, x) |> println # キャッシュ＋インプレース版
# [0.0 0.0; 0.0 2.0]
# [0.0 0.0; 0.0 2.0]
# [0.0 0.0; 0.0 2.0]
# [0.0 0.0; 0.0 2.0]

@btime hessian($f, $backend, $x)
@btime hessian($f, $prep, $backend, $x)
@btime hessian!($f, $value, $backend, $x)
@btime hessian!($f, $value, $prep, $backend, $x)
#   3.663 μs (37 allocations: 1.55 KiB)
#   174.773 ns (8 allocations: 352 bytes)
#   3.538 μs (29 allocations: 1.20 KiB)
#   93.782 ns (0 allocations: 0 bytes)
Enzymeではキャッシュとインプレースの効果が顕著です. 勾配とヘッシアンの両方において, キャッシュ＋インプレース版ではメモリアロケーションをゼロに抑えて大幅に高速化することができました. なお, 効率化の度合いはバックエンドによって大きく異なり, Zygoteでは逆効果になったりすることもありました.

 おわりにJuliaコミュニティでは全世界的に高速な自動微分パッケージEnzyme.jlへの移行が検討されており, 2024年12月の第146回計算科学コロキウム以降, 日本でもEnzyme採用の機運が高まっています. Enzymeは他のパッケージと比べると使い方がやや難しい気がしますが, このインターフェースなら簡単に利用できました. ぜひお試しください.

 参考文献https://juliadiff.org/DifferentiationInterface.jl/DifferentiationInterface/stable/

 ノートブック下記のリンクから, Google Colab上で実行できます.
https://colab.research.google.com/drive/17msfOUDbxCmwqPIg-Cmy4G05Fdm5uiCL?usp=sharing

 関連記事https://zenn.dev/ohno/articles/c1aa146fee7d48
https://zenn.dev/ohno/articles/7b4b6a1ec86189
https://zenn.dev/ohno/articles/0d8d24a50316b5
はじめに

インストール

1階微分

2階微分

勾配

ヘッシアン

高速化について

おわりに

参考文献

ノートブック

関連記事

Discussion