Zenn
Open11

CDCL (conflict-driven clause learning) アルゴリズムのSATソルバーを作る

termoshtttermoshtt

通常SATソルバと行った時は命題論理の充足可能性問題を解くアルゴリズムを指しますが、今回は論理学には深入りせずにブール論理の言葉で議論していきます。

ブール論理

ブール論理というのは集合 B={0,1}B = \{0, 1\} に対して、二項演算 \land (論理積)、\lor (論理和)、単項演算 ¬\lnot (否定) 及び以下の性質を満たす代数構造です。

  • 結合則: a(bc)=(ab)c,a(bc)=(ab)ca \lor (b \lor c) = (a \lor b) \lor c, a \land (b \land c) = (a \land b) \land c
  • 交換則: ab=ba,ab=baa \lor b = b \lor a, a \land b = b \land a
  • 吸収則: a(ab)=a,a(ab)=aa \lor (a \land b) = a, a \land (a \lor b) = a
  • 分配則: a(bc)=(ab)(ac),a(bc)=(ab)(ac)a \lor (b \land c) = (a \lor b) \land (a \lor c), a \land (b \lor c) = (a \land b) \lor (a \land c)
  • 可補束: a¬a=1,a¬a=0a \lor \lnot a = 1, a \land \lnot a = 0
  • 等冪性: aa=a,aa=aa \lor a = a, a \land a = a
  • 有界性: a0=a,a1=a,a1=1,a0=0a \lor 0 = a, a \land 1 = a, a \lor 1 = 1, a \land 0 = 0
  • 相補性: ¬0=1,¬1=0\lnot 0 = 1, \lnot 1 = 0
  • ド・モルガンの法則: ¬(ab)=¬a¬b,¬(ab)=¬a¬b\lnot (a \lor b) = \lnot a \land \lnot b, \lnot (a \land b) = \lnot a \lor \lnot b
  • 対合: ¬¬a=a\lnot \lnot a = a

この代数構造を含めてあらためて BB と書くことにします。これらの演算のうち結合則・交換則・吸収則・分配則・可補則を満たす任意の台集合を持つ代数構造をブール代数と呼びますが、ブール論理はそのうち特に台集合を B={0,1}B = \{0, 1\} としているものです。

論理式と標準形

可換環に対して多項式を考えたように、ブール論理についても変数を導入し、その変数に対して論理積、論理和、否定を適用することで式を構成できます。これを論理式と呼びます。例えば変数を x1,x2,x3Bx_1, x_2, x_3 \in B として、(x1x2)x3(x_1 \land x_2) \lor x_3 という論理式を考えることができます。このような式は演算の組み合わせによって何通りにも作ることができるので、特に有限回の操作で作ることが出来る論理式全体を多項式環のように B[x1,x2,x3]B[x_1, x_2, x_3] と書きましょう。この集合にもそのまま論理積・論理和・否定が定義されてブール代数となります。特に変数の無い場合 B[]B[]BB と同一視できます。

1つの多項式に対して例えば x21x^2 - 1(x+1)(x1)(x+1)(x-1) のように同じものを表す複数の表示がありますが、論理式にも同じことが言えます。多項式の場合に和を後に持ってきた x21x^2 - 1 の形式と積を後に持ってきた (x+1)(x1)(x+1)(x-1) の形式があるように、論理式では \land を後に持ってきたものと \lor を後に持ってきたものがあります。これをそれぞれ連言標準形 (CNF, Conjunctive Normal Form) と選言標準形 (DNF, Disjunctive Normal Form) と呼びます。いずれも ¬\lnot\land\lor より前に持ってきます。

SATソルバ

可換環RR上の多変数多項式 fR[x1,,xn]f \in R[x_1, \ldots, x_n] を使った方程式 f(x1,,xn)=0f(x_1, \ldots, x_n) = 0 を満たす (x1,,xn)Rn(x_1, \ldots, x_n) \in R^n の事を方程式の解と呼びますが、同じように多変数の論理式 fB[x1,,xn]f \in B[x_1, \ldots, x_n] を使った「方程式」f(x1,,xn)=1f(x_1, \ldots, x_n) = 1 を満たす (x1,,xn)Bn(x_1, \ldots, x_n) \in B^n の事を充足解と呼びます。この充足解を求める問題をSAT (Satisfiability) と呼びます。SATソルバはこの問題を解くアルゴリズムのことを指します。

termoshtttermoshtt

論理式 fB[x1,,xn]f \in B[x_1, \ldots, x_n] が一つ与えられたとする。例えば x1=1x_1 = 1 と仮定してこれを ff に代入したものを f(x1=1)B[x2,,xn]f(x_1 = 1) \in B[x_2, \ldots, x_n] のように書くことにしよう。

変数の代入に対して充足解がどうなるのかを考えてみよう。
もし f=1f=1の充足解が無いとすると、当然 f(x1=1)=1f(x_1 = 1) = 1の充足解も存在せず、逆にf(x1=1)=1f(x_1=1)=1の充足解が求まったならそこにx1=1x_1 = 1を加えるとそれはf=1f=1の充足解になる。x1x_10011 しか値を取らないので、f=1f=1の充足解を探す為に f(x1=0)=1f(x_1 = 0) = 1f(x1=1)=1f(x_1 = 1) = 1 の充足解を探す問題を解けばよいことが分かる。
これはB[x1,,xn]B[x_1, \ldots, x_n]上の充足解が変数の一つ少ないB[x2,,xn]B[x_2, \ldots, x_n]の充足解を求める問題に分解できること意味しており、一方一つしか変数の無い論理式に対しては充足解を求めることは自明なので、再帰的に問題を分割していけば充足問題は2n2^n個の自明な問題に分割でき、これは(計算量を考えなければ)常に解けることが分かる。

この原始的なアルゴリズムを単純な再帰として実装したものが brute_force である。決定変数の個数が精々30程度のごくごく小さい問題に対してはこれでも解けることが分かる。
https://github.com/termoshtt/cdcl/pull/5

なお各ステップにおいてどの変数を固定するのか?という問題がある。これはおそらく変数選択ヒューリスティックという分野が始まるはずだが、ここでは単に論理式に含まれる決定変数のうちIDが最も小さいものを選んでいる。

termoshtttermoshtt

次に単位伝搬を実装する。その前にもう少し用語を整理する。

リテラル

ある変数xxによって f=xf = x あるいは f=¬xf = \lnot x でかける論理式をリテラルと呼ぶ。

節 (clause)

SAT問題では通常CNFになった論理式を扱う。CNFは次のようなAND (OR (NOT X))) の形になっている

f=i=1nj=1mfij f = \land_{i=1}^n \lor_{j=1}^m f_{ij}

なおANDとORがそれぞれ無い場合はそれぞれ nnmm11 のケースと見なす(i=11fi=f1\land_{i=1}^1 f_i = f_1)。fijf_{ij}はリテラルである。

CNF系の論理式 ff11になるためにはANDで結合したすべてのサブ論理式 fi=j=1mfijf_i = \lor_{j=1}^m f_{ij}11 になっている必要がある。この fif_iff の節 (clause) と呼ぶ。

例えば f11=xf_{11} = x, f12=xf_{12} = x とすると f1=xxf_1 = x \lor x であるが、これは等冪則により簡略化してしまって f1=xf_1 = x として考える。このように簡略した後の式に含まれる決定変数の個数は一意に定まり、これを長さと呼ぶ。特に長さが 11 の節を単位節と呼ぶ。この時節はリテラルとして書ける。

単位伝搬

さてCNF形式の論理式 f=i=1nfif = \land_{i=1}^n f_i の充足解を求める問題に戻ろう。もし f1f_1 が単位節 f1=x1f_1 = x_1 であるとき、ffが充足可能であるならば常にf1f_1も充足可能なのですなわちx1=1x_1 = 1である。つまり x1=0x_1 = 0 の分岐を探査する必要はなく、f(x1=1)f(x_1 = 1) の充足可能性を調べれば十分となる。
これは探索する範囲が大幅に狭められることを意味する。

このように単位節によって割り当てられた変数を「含意(implication)」と呼び、一方探索の途中で仮定した変数の事を「決定(decision)」と呼んだりする(文献によって呼び方はわりとバラバラ)。

この含意のプロセスは伝搬する。例えば f1=¬x1,f2=x1x2f_1 = \lnot x_1, f_2 = x_1 \lor x_2 だったとすると、最初にこの節を見たときは f1f_1 は単位節だが f2f_2 は単位節ではない。なのでまず f1f_1により x1=0x_1 = 0と含意する。すると f2(x1=0)=x2f_2(x_1 = 0) = x_2なのでこれは単位節であり、よって x2=1x_2 = 1と含意出来る。これが単位節がなくなるまで繰り返すのが単位伝搬である。

このアルゴリズムは以下のPRで dpll として実装した
https://github.com/termoshtt/cdcl/pull/6

termoshtttermoshtt

ある二つの節f1,f2B[x1,,xn]f_1, f_2 \in B[x_1, \ldots, x_n]があって、特に

f1=x1g1, f2=¬x1g2, g1,g2B[x2,,xn] f_1 = x_1 \lor g_1, \space f_2 = \lnot x_1 \lor g_2, \space g_1, g_2 \in B[x_2, \ldots, x_n]

と書けるとする。この時に x1x_1 を「削除」した論理式 g1g2g_1 \lor g_2の事を「導出」と呼び f1f2f_1 \diamond f_2 と書く。これは任意の節 f1,f2f_1, f_2 に対して x1x_1 に相当する変数が指定できれば存在し、存在すれば一意である。例えば二つ以上の組があるケース

f1=x1x2x3,f2=¬x1¬x2x4 \begin{align*} f_1 &= x_1 \lor x_2 \lor x_3, \\ f_2 &= \lnot x_1 \lor \lnot x_2 \lor x_4 \end{align*}

を考えると、これは x1x_1 を削除するのか x2x_2 を削除するのかの二通りがあり一意に決まらないように見える。しかしこの場合x1x_1を削除すると x2¬x2=1x_2 \lor \lnot x_2 = 1 なので

(x2x3)(¬x2x4)=(x2¬x2)x3x4=1x3x4=1 \begin{align*} (x_2 \lor x_3) \lor (\lnot x_2 \lor x_4) &= (x_2 \lor \lnot x_2) \lor x_3 \lor x_4 \\ &= 1 \lor x_3 \lor x_4 = 1 \end{align*}

同様に x2x_2 を消去しても x1¬x1=1x_1 \lor \lnot x_1 = 1 より 11 になる。つまりどっちの変数を消去してももう片方に由来して 11 になるので f1f2=1f_1 \diamond f_2 = 1 として一意に定まる。よってこの \diamond 記号にどの変数を削除するのかを追記する必要はない。

命題論理では ABA \to B¬AB\lnot A \lor B と表現されるので、

(AB)(BC)=(¬AB)(¬BC)=¬AC=AC \begin{align*} (A \to B) \diamond (B \to C) &= (\lnot A \lor B) \diamond (\lnot B \lor C) \\ &= \lnot A \lor C = A \to C \end{align*}

となることからもこの操作を導出と呼ぶ理由がうかがえる。

termoshtttermoshtt

導出の重要な性質は次の命題である

(ffifj)(x)=1(f \land f_i \diamond f_j)(x) = 1なる xBnx \in B^n に対して f(x)=1f(x) = 1 なのは明らかなので逆を示す。

xBnx \in B^nf(x)=1f(x) = 1 となると仮定しよう。この時全ての l[1,m]l \in [1, m] について fl(x)=1f_l(x) = 1である。fifjf_i \diamond f_j が存在するのだから、必要であれば fif_ifjf_j を入れ替えることにより、あるk[1,n]k \in [1, n]があって節 gi,gjg_i, g_jによって

fi=xkgi, fj=¬xkgj f_i = x_k \lor g_i, \space f_j = \lnot x_k \lor g_j

と書けるとしてよい。今 xBnx \in B^n は固定してあるので xkx_k の値で場合分けする。

  • (xk=1x_k = 1 の場合) ¬xk=0\lnot x_k = 0 なので fj(x)=1f_j(x) = 1 であるためには gj(x)=1g_j(x) = 1 でなければならない。よって (fifj)(x)=(gigj)(x)=gi(x)gj(x)=1(f_i \diamond f_j)(x) = (g_i \lor g_j)(x) = g_i(x) \lor g_j(x) = 1
  • (xk=0x_k = 0の場合) 同様に fi(x)=1f_i(x) = 1 であるためには gi(x)=1g_i(x) = 1 でなければならず、(fifj)(x)=(gigj)(x)=gi(x)gj(x)=1(f_i \diamond f_j)(x) = (g_i \lor g_j)(x) = g_i(x) \lor g_j(x) = 1

以上より (fifj)(x)=1(f_i \diamond f_j)(x) = 1 \square

節の集合が与えられ時にそれから導出される節を追加しても充足性が変化しないので、もし単位節xkx_k (あるいは¬xk\lnot x_k) が導出出来たら元の論理式の充足解は常にxk=1x_k = 1 (あるいはxk=0x_k = 0)であるし、00が導出出来たら元の論理式がUNSATであることが結論できる。
CDCLではこのように変数の方を順番に固定していくのではなく節の方を操作していく。

termoshtttermoshtt

これは次の形の方が使いやすい

証明は上の xkx_k の場合分けそのまま。上の命題はこれから直ちに導ける。

termoshtttermoshtt

充足性を保ったまま節を削除することもできる。その前に少し記法を整理する。

ff はリテラル fif_i によって常に f=i=1lfif = \lor_{i=1}^l f_i と書ける。fif_iのうち同じものは等冪則によって一つに削減されるので、全ての fif_i は異なっているとしてよく、すると節はリテラルの集合として見做すことができる。特にこの時 fiff_i \in f と書く。

f(x)=1f(x) = 1 なる xBnx \in B^n について、g(x)=1g(x) = 1は上の命題より明らか。逆を示す。

g(x)=1g(x^\prime) = 1となるx=(x2,,xn)Bn1x^\prime = (x_2, \ldots, x_n) \in B^{n-1}を一つ固定する。問題はx1x_1をどうやって復元するかである。iI1I1ˉi \in I_1 \cup \bar{I_1}についてgig_iを次で定める:

fi=x1gifor iI1fi=¬x1gifor iI1ˉ \begin{align*} f_i &= x_1 \lor g_i &\text{for} \space i \in I_1 \\ f_i &= \lnot x_1 \lor g_i &\text{for} \space i \in \bar{I_1} \end{align*}

もし x1=1x_1 = 1 と決めるなら全てのiI1ˉi \in \bar{I_1} について gi(x)=1g_i(x^\prime) = 1で無ければfi(1,x)=1f_i(1, x^\prime) = 1と出来ず、x1=0x_1 = 0と決めるなら全てのiI1i \in I_1 についてgi(x)=1g_i(x^\prime) = 1となっていないと fi(0,x)=1f_i(0, x^\prime) = 1と出来ない。
つまりある組 (i,j)I1×I1ˉ(i, j) \in I_1 \times \bar{I_1} があって gi(x)=0g_i(x^\prime) = 0 かつ gj(x)=0g_j(x^\prime) = 0であるならば f(x1,x)=1f(x_1, x^\prime) = 1 となるように x1x_1 を定めることが出来ない。しかしg(x)=1g(x^\prime) = 1の仮定から全ての (i,j)I1×I1ˉ(i, j) \in I_1 \times \bar{I_1}の組について (fifj)(x)=(gigj)(x)=1(f_i \diamond f_j)(x^\prime) = (g_i \lor g_j)(x^\prime) = 1なので gi(x)=gj(x)=0g_i(x^\prime) = g_j(x^\prime) = 0となる組は存在しない。よって f(x1,x)=1f(x_1, x^\prime) = 1となるように x1x_1xx^\primeから定めることが出来る。 \square

この操作によって充足性を維持したまま変数を一つ取り除くことができる。しかし節の数は p=#I1,q=#I1ˉp = \#I_1, q = \#\bar{I_1}とすると mpq+pqm - p - q + pq個になっており、最悪のケース p=q=m/2p = q = m/2m2/4m^2/4のように節の個数が変数を取り除く回数に対して指数的に増えてしまう事が分かる。

termoshtttermoshtt

以上で素朴なCDCLアルゴリズムを理解する準備が概ね整ったはず。

  • Clause Learningというのは導出節を追加する操作の事
  • 変数を削除するように導出節を追加するのでは節の数が爆発してしまうので不味い。つまり有益な節だけを学習する必要がある。
  • なのでDPLLの時のように変数に仮の値を割り当てていく探索を行いながら矛盾する節を探し、その矛盾した節から導出節を作る事にする。これで必要な節だけが学習できるという目算。

CDCLでは導出により増えていく節と変数の割り当てと同時に連携しながら管理していく必要がある。

Trail

矛盾した節を見つけたときにそれから導出節を作る必要があるので、どの節によって変数を固定することになったかの理由が必要となる。Knuth 4Bではこのデータ構造をTrailと呼んでいる。ここではTrailに何を保存する必要があるのかを議論して最後にTrailのデータ構造を示す。

変数の割り当て

ある変数に値を割り当てる操作は、真であるリテラルのリストにその変数のリテラルを追加することと対応するので、Trailではリテラルのリストを管理する。つまりリテラル l=x1l = x_1 がTrailに入っていれば x1=1x_1 = 1 と割り当てていて、 l=¬x1l = \lnot x_1 がTrailに入っていればx1=0x_1 = 0と割り当てている事に相当する。順々に変数を割り当てる操作はリテラルを順々にTrailに追加していく事に相当する。

単位伝搬

Trailにリテラルを追加する操作は二通りある。一つはDPLLの時の単位伝搬に相当する操作で、既にTrailにリテラル a1,,aka_1, \ldots, a_kが存在していて、次の節 cc がある場合、リテラル ¬l\lnot lcc を理由としてTrailに追加する。

c=l¬a1¬ak c = l \lor \lnot a_1 \lor \cdots \lor \lnot a_k

この操作も同じように単位伝搬と呼ぶ。どの節から評価するか自由度があるが、そこは実装依存という事にしておく。

ここで重要となるのは、理由ccに含まれているリテラルは既にTrailに入っている点である。つまりTrailに入っているリテラルの順序には意味がある。Trail内のリテラル ll の理由にリテラル aa が含まれているとき、llaaに直接依存しているという。

決定

もう一つは決定である。現在のTrailの状態において全ての節を確認して単位伝搬が行えない場合、既にTrailに含まれているリテラルと変数が被らない新しいリテラルをTrailに追加する。この時理由となる節は存在しない。どのようなリテラルを選ぶかは実装依存である。

Trailのリテラルには順序があるので、あるTrail中のリテラルを指定するとそれ以前にいくつ決定により追加されたリテラルが存在するかが一意に定まり、それを決定レベルと呼ぶ。例えば次のようになる:

step リテラル 理由 決定レベル
0 ¬x6\lnot x_6 決定 1
1 ¬x9\lnot x_9 決定 2
2 x3x_3 x3x6x9x_3 \lor x_6 \lor x_9 2
3 ¬x4\lnot x_4 決定 3
4 x5x_5 x5x4x6x_5 \lor x_4 \lor x_6 3
termoshtttermoshtt

衝突

Trailにリテラルを追加したとき、ある節 cc がTrailに含まれるリテラル a0,a1,,aka_0, a_1, \ldots, a_k を使って

c=¬a0¬a1¬ak c = \lnot a_0 \lor \lnot a_1 \lor \cdots \lor \lnot a_k

と書ける場合がある。この時Trailによって指定される変数の割り当てに対して、他の変数をどう指定してもこの節が 00 になることが結論できてしまう。これを衝突と呼ぶ。

もし決定レベル 00 で衝突が起こったならばそれは問題がUNSATである事を意味し、レベル 11 以上で発生した場合は問題がUNSATであるかどれかの決定が間違っているかのいづれかを意味する。

DPLLでは衝突が発生したとき最後の決定が間違っていたとしてバックトラックを行うが、CDCLでは衝突の理由を分析して導出節を追加し、さらにTrailの適切な地点まで一気に巻き戻す。

衝突節

上の設定における衝突節 cc の分析に移ろう。現在のTrailの決定レベルを dd とする。

まずTrailに変数を追加した後に必ず全ての節について衝突していない事を判定しており、衝突していた場合は処理を継続していない事を前提とすると(あとでそのようにアルゴリズムを定義するが、ここでは仮定とする)、a0,,aka_0, \ldots, a_kのうちいずれかがTrailに最後に追加されたリテラルであることが分かる。適当に入れ変えることにより、このリテラルを a0a_0 であるとしてもよい。

続いて決定を行う前に全ての実行可能な単位伝搬を行っていると仮定すると、最後の決定の前の段階で節 cc が単位伝搬の対象になっていない事から、a0,,aka_0, \ldots, a_k のうち少なくとも二つのリテラルが現在の決定レベル dd に属していることが分かる。片方は a0a_0 なので、やはり適当に並べ替えて a1a_1 がそうであるとしてよい。

するとa0a_0は現在の決定レベルにおいてa1a_1より後に追加されていることからa0a_0の理由は決定ではない(a1a_1は決定かもしれない)ので理由の節が存在し、それをc0c_0と書く。これは次の形をしているはずである:

c0=a0¬b1¬bl c_0 = a_0 \lor \lnot b_1 \lor \cdots \lor \lnot b_l

ただし b1,,blb_1, \ldots, b_la0a_0 以前にTrailに追加されたリテラルである。

つまりa0a_0をTrailに追加する直前の段階で ccc0c_0 が存在していて、その時のTrailではa0a_0をどう決めてもこの両方を満たすことは出来ないという事である。どうしてこのような状況になっているのだろうか?a0a_0¬a0\lnot a_0 以外の ccc0c_0 に含まれる全てのリテラル a1,,ak,b1,,bla_1, \cdots, a_k, b_1, \ldots, b_l が全てTrailに含まれているから、すなわち cc0c \diamond c_000 だからである。よってこの導出節を新たに追加し、これが 00 になる前の状態まで戻ればよさそうである。

バックジャンプ

ではどこまで戻ればいいのだろうか?上での議論から既にcc0c \diamond c_0 には少なくとも一つ現在の決定レベルのリテラル a1a_1 が含まれていることが分かっているが、もしこれが一つだけならこの導出節は一つ前の決定レベルにおいて単位伝搬に使えたはずである。
上での仮定「決定を行う前に全ての実行可能な単位伝搬を行っている」を維持することを考えると、もしこの導出節を追加する場合、これが単位伝搬に使う事が可能だったところまで戻らないといけない。つまり a2,,ak,b1,,bla_2, \ldots, a_k, b_1, \ldots, b_l のうち決定レベルが最大のものが dd^\prime だとすると、Trailのこの決定レベルの最後に戻って(以降のTrailを削除し)、cc0c \diamond c_0 を追加し、これによって単位伝搬により a1a_1 をTrailに追加してアルゴリズムを再開する。この操作をバックジャンプと呼ぶ。

cc0c \diamond c_0 が現在の決定レベルに属する二つ以上のリテラルを含む場合は、次のプロセスによって一つだけ含むようになるまで変形する。
a1a_1 の他にも現在の決定レベルに属するリテラルが存在するケースを考える。この時上の議論と同じように少なくとも一方のリテラルは決定ではないので理由となる節 c1c_1 が存在し、(cc0)c1(c \diamond c_0) \diamond c_1 を考えることでそのリテラルを取り除くことができる。
現在の決定レベルには有限個しかリテラルが無いので、このプロセスは有限回で終了し、現在の決定レベルにおけるリテラルを一つだけ含む導出節 cc^\prime を得る。この cc^\prime を使って上のバックジャンプを実行する。

作成者以外のコメントは許可されていません