Double/Debiased Machine Learning (DML) の概要
Double/Debiased Machine Learning (DML) のもとの論文
を(今更ながら)読んだのでざっくりメモしておく。
目的
世の中の多くの現象は非線形な関係性が想定される。回帰分析は線形モデルであるため、モデルの定式化の誤りに起因するバイアスが生じかねない。
実際に関心のあるパラメータは少なく、交絡のコントロールのために入れている局外母数(nuisance parameters)は高次元になりがち。
局外母数を非線形の関数
を作り、局外関数
もしこれが実現できれば、
- 機械学習による高い関数近似性能で非線形の関係性を捉えて交絡をコントロール
- パラメータは線形回帰モデルのように
の収束レートで少ないサンプルから効率的に推定\sqrt{n}
という、回帰分析と機械学習のいいとこ取りをしたモデルが作れる。
これを実現するのが DML のフレームワークである(
課題
その原因として、2 つのバイアスがある
-
正則化バイアス
- 機械学習アルゴリズムは正則化を行うため、推定にバイアスが入る
-
過学習によるバイアス
- ニューラルネットワークなど関数近似性能が高いアルゴリズムは、一方で過学習のリスクも高い
提案手法
2 つの課題への対策として、以下を行う
- 正則化バイアス → ネイマン直交性 を満たすモーメント条件による推定量で対応
- 過学習 → Cross-Fitting で対応
ネイマン直交性
Chernozhukov et al. (2018) は、統計的に望ましい性質を持つ推定量をもたらす条件として、ネイマン直交性(Neyman orthogonality)という条件を明らかにした。
このことの意味合いとしては、
「微小な
→ ネイマン直交性をもつスコア関数を用いる推定量は正則化バイアスに対し頑健になる
ネイマン直交性を満たすモーメント条件の例
先行研究のひとつである Robinson (1988) は部分線形モデルを提案し、(機械学習を使わない場合の)一致推定量も導出した。
部分線形モデル
の両辺を
これをモデルから差し引くと
という線形回帰の形になる(FWL 定理に出てくる残差回帰の形になる)
ただし、
この Robinson (1988) の推定量のモーメント条件
はネイマン直交性を満たす。実際、DML の実装の一つであるDoubleMLパッケージでも部分線形モデルの推定時のデフォルトのモーメント条件として使われている。
Cross-Fitting
K-fold Cross-Validation のように、ランダムにサンプルを
DML 推定量の具体例
ネイマン直交化された推定量として Robinson (1988) の推定量を使う場合、DML 推定量は「残差回帰を分割したサンプルで
Python での実装例としては
が参考になる。
参考
- 機械学習 × 計量経済学:Double/Debiased Machine Learning | Web 日本評論
- 金本拓. (2024). 因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ. 株式会社 オーム社.
- 22 - Debiased/Orthogonal Machine Learning — Causal Inference for the Brave and True
ノンパラ関連
モーメント法
Discussion