🚆

外挿を許容する合成コントロール法について

に公開

The Augmented Syntetic Control Method

本記事は以下の論文で提案されているRidge Augmented Syntetic Controlを解説します.
https://www.tandfonline.com/doi/full/10.1080/01621459.2021.1929245

データ分析で因果推論に取り組む際,合成コントロール法(以下 SCM)は非常に強力なツールです.
SCMは介入を受けなかったコントロール群のユニットを重み付けして,介入があったユニットの反実仮想を作り出します.
具体的には以下のようにWeightが決定されます.

\begin{aligned} & \min_{\gamma} && ||V_{x}^{1/2}(X_{1} - X_{0}^{\prime}\gamma)||_{2}^{2} \\ & \text{subject to} && \sum_{W_{i}=0} \gamma_{i} = 1, \\ & && \gamma_{i} \ge 0 \quad \forall i : W_{i}=0 \end{aligned}

この時、SCMのWeightの推定は

それぞれのweightが0以上であり、その合計が1になるように制約されます .

これは推定される合成コントロールが凸包の内側に必ず位置すること,

つまり,SCMは本質的に内挿しか行わず,外挿を許容しないことを示しています.

この制約こそが,SCMの大きな強みであると同時に,実用上の壁となる場合もあります.

例えば

  • SCMの理想 : 介入ユニットがコントロール群の凸包の内側にあれば、介入前の動きを完全に再現する完璧なフィットが可能

  • 現実の問題 : 実務で扱う観察データでは介入ユニットは凸包の外側に位置する場合があります.この場合,0以上の重みだけでは介入前のフィットを完全に達成することは不可能であり,推定量の信頼性に疑念が生じます.

Abadie et al. (2010)でも

https://www.tandfonline.com/doi/abs/10.1198/jasa.2009.ap08746

介入前のフィットが悪い場合にはSCMを使うべきではないと警告しています .

では,どうすればよいのでしょうか?

仮に代替案として,回帰を用いるとしましょう.

これは,負の重みを許容することでフィットを改善します。しかし、これは制御されない外挿であり,推定結果の信頼性を損なうリスクを伴います .

((もちろん回帰がダメだと言っているわけではまったくありません))

ここにSCMのジレンマがあります.

  • フィットの悪さを許容してSCMを使うか?

  • それとも,制御不能な外挿のリスクを負って回帰モデルを使うか?

ここが今回解決したい問題です.

その両者の中間的な解決策が

Ridge Augmented SCM (以下 Ridge ASCM)です.

Ridge ASCMによる制御された外挿

Ridge ASCMは、SCMのフィットの悪さによるバイアスを、Ridge回帰モデルを用いて補正(Augment)する手法です.

SCMとの明確な違いは
負の重みを許容することで外挿を可能にしつつ,その外挿の度合いを直接コントロールする点にあります.

Ridge ASCMは、SCMの解を起点とし、そこからの逸脱に対してペナルティを科します.
これにより,介入前のフィットを改善するために必要な分だけ,最小限の外挿を行うことを目指します.この外挿の程度は,Ridgeペナルティのハイパーパラメータ(λ)によって直接的に調整されます .

Weightはどのように決まるのか?

では,この制御された外挿を実現する weight は,どのように導かれるのでしょうか.
論文のAppendixを参考に,その導出過程を追ってみます.

  1. 目的関数

Ridge ASCMが解く最適化問題は、以下の目的関数を最小化することです.

\min_{\gamma \text{ s.t. } \sum_{i}\gamma_{i}=1} \frac{1}{2\lambda^{ridge}}||X_{1}-X_{0}^{\prime}\gamma||_{2}^{2}+\frac{1}{2}||\gamma-\hat{\gamma}^{scm}||_{2}^{2}

第1項: 介入ユニット (X_1) と合成コントロール (X_0'\gamma) の介入前フィットを表します.この項を小さくすることで,フィットを改善しようとします.

第2項: 求めたい新しいweight (\gamma) と,元のSCMのweight (\hat{\gamma}^{scm}) との距離を表します.この項は、\gammaが元のSCMから大きく逸脱することへのペナルティとして機能します.

\lambda^{ridge}: このハイパーパラメータが,フィットの改善とSCMからの逸脱,つまりは外挿の度合いとのトレードオフを制御します.

  1. ラグランジュの双対問題で解を求める

この目的関数を解くために,論文ではラグランジュの双対問題 (Lagrangian dual problem) を用います.詳細は割愛しますが,この手法によって最適化問題を数学的に簡単な問題に落とし込みます.

双対問題をラグランジュ乗数について解くと,最終的に以下の関係式が得られます.

\hat{\beta}=(X_{0}^{\prime}X_{0\cdot}+\lambda^{ridge} I)^{-1}(X_{1}-X_{0}^{\prime}\hat{\gamma}^{scm})
  1. 最終的なWeightの形式

この \hat{\beta} を使うと,Ridge ASCMの最終的なweight (\hat{\gamma}^{aug})は以下のように表現されます.

\hat{\gamma}_{i}^{aug}=\hat{\gamma}_{i}^{scm}+(X_{1}-X_{0}^{\prime}\hat{\gamma}^{scm})^{\prime}(X_{0}^{\prime}X_{0}.+\lambda^{ridge}I_{T_{0}})^{-1}X_{i}

シミュレーションで確認する

以下はRのSynthパッケージで分析した通常のSCMの結果です.

介入前のフィットが不十分なのが分かると思います.

以下はRのaugsynthパッケージで分析したRidge ASCMの結果です.

介入前のフィットが改善されているのが分かると思います.

まとめ

Abadie et al. (2010)で提案されている標準的な合成コントロール法は、その制約から外挿が不可能であり,介入前のフィットが悪いケースへの適用が困難でした.

Ridge ASCMは,この課題に対し,負の重みを許容しつつも,その逸脱の大きさをRidgeペナルティで制御するというアプローチで制御された外挿を実現しました .
これにより標準的なSCMのみに依存することなく,より頑健な因果効果の推定を行うことができます.

Discussion