E-valueがどうしてあの形になったのか知らずに使うことに抵抗があったのと、導出の考え方が他にも応用できるかもしれないと思い、論文とAppendixの導出部分を読みました。論文たちは以下です。
- Ding, P., & VanderWeele, T. J. (2016). Sensitivity analysis without assumptions. Epidemiology, 27(3), 368-377. (URL)
- [1]の論文のeAppendix (URL)
- VanderWeele, T. J., & Ding, P. (2017). Sensitivity analysis in observational research: introducing the E-value. Annals of internal medicine, 167(4), 268-274. (URL)
この記事では自分用のメモとして、[1]の式変形と[2]のeAppendix 2の式変形の興味あるところを写経し、ところどころ補足します。
E-valueとbounding factorの使い方に興味がある人は使用例編を参照してください。
記法
論文では、Eが処置、Dがアウトカムなのですが、これがHernán MA, Robins JM (2020). Causal Inference: What Ifの記法で学んだ自分には驚くほど頭に入ってこないので変えます。すみません!
表記 |
意味 |
備考 |
A |
処置 |
とりあえず二値 |
Y |
アウトカム |
とりあえず二値 |
Y(0) |
A=0ときに観測される潜在アウトカム |
|
Y(1) |
A=1ときに観測される潜在アウトカム |
|
L |
測定済み交絡因子 |
なんでもOK |
U |
未測定交絡因子 |
とりあえずカテゴリカルな多値としておく |
DAGとしては次の図を想定しています(破線は、LからUに矢線があってもよいしUからLに矢線があってもよいの意味)。
つまり、次の条件付き交換可能性が成り立ちます。
\{Y(0), Y(1)\}\mathop{\perp\!\!\!\perp}A\mid U,L
以降ではL=\ellの層における相対リスク(relative risk, RR)を考えます。そのため各確率にL=\ellの条件付けが入るのですが、簡潔にするためにL=\ellの条件付けを省略します。
表記 |
定義 |
日本語 |
\text{RR}_{AU}(u) |
\frac{P\left(U=u\middle\vert A=1\right)}{P\left(U=u\middle\vert A=0\right)} |
AのカテゴリU=uに対する相対リスク =「A=1群ではA=0群と比べて、どれぐらい偏ってU=uが存在しているか」 |
\text{RR}_{AU} |
\text{max}_{u}\text{RR}_{AU}(u) |
\text{RR}_{AU}(u)の中で一番大きく変わるやつ |
r(u) |
P\left(Y(0)=1\mid U=u\right) \\= P\left(Y=1\mid A=0,U=u\right) |
U=uの層におけるA=0のときのリスク |
r^*(u) |
P\left(Y(1)=1\mid U=u\right) \\= P\left(Y=1\mid A=1,U=u\right) |
U=uの層におけるA=1のときのリスク |
\text{RR}_{UY\vert A=0} |
\frac{\text{max}_{u}{r(u)}}{\text{min}_{u}{r(u)}} |
A=0群におけるUのYに対する相対リスクの最大値 =「A=0群において、U=1群ではU=0群と比べてY=1の確率がどれぐらい高くなるか」の最大値 |
\text{RR}_{UY\vert A=1} |
\frac{\text{max}_{u}{r^*(u)}}{\text{min}_{u}{r^*(u)}} |
A=1群におけるUのYに対する相対リスクの最大値 |
\text{RR}_{UY} |
\text{max}\left(\text{RR}_{UY\vert A=0},\text{RR}_{UY\vert A=1}\right) |
上二つのほうの大きいほう |
\text{RR}_{AY}^{\text{obs}} |
\frac{P\left(Y=1\middle\vert A=1\right)}{P\left(Y=1\middle\vert A=0\right)}\\=\frac{\sum_{u} P\left(Y=1\middle\vert A=1,U=u\right)P(U=u\mid A=1)}{\sum_{u} P\left(Y=1\middle\vert A=0,U=u\right)P(U=u \mid A=0)}\\=\frac{\sum_{u} r^*(u)P(U=u\mid A=1)}{\sum_{u} r(u)P(U=u\mid A=0)} |
観測された、AのYに対する相対リスク |
\text{RR}_{AY+}^{\text{true}} |
\frac{P(Y(1)=1\mid A=1)}{P(Y(0)=1\mid A=1)} \\=\frac{\sum_{u} r^*(u)P(U=u\mid A=1)}{\sum_{u} r(u)P(U=u\mid A=1)} |
A=1群における、AのYに対する真の相対リスク =A=1群のUの経験分布を使った標準化 |
\text{RR}_{AY-}^{\text{true}} |
\frac{P(Y(1)=1\mid A=0)}{P(Y(0)=1\mid A=0)}\\=\frac{\sum_{u} r^*(u)P(U=u\mid A=0)}{\sum_{u} r(u)P(U=u\mid A=0)} |
A=0群における、AのYに対する真の相対リスク =A=0群のUの経験分布を使った標準化 |
\text{RR}_{AY}^{\text{true}} |
\frac{P(Y(1)=1)}{P(Y(0)=1)} = \frac{\sum_{u} r^*(u)P(U=u)}{\sum_{u} r(u)P(U=u)} |
whole populationにおける、AのYに対する真の相対リスク =Uの経験分布を使った標準化 |
\text{CRR}_{AY+} |
\frac{\text{RR}_{AY}^{\text{obs}}}{\text{RR}_{AY+}^{\text{true}}}=\frac{\sum_{u} r(u)P(U=u\mid A=1)}{\sum_{u} r(u)P(U=u\mid A=0)} |
A=1群における、AのYに対する交絡相対リスク(と呼ぶらしい) |
\text{CRR}_{AY-} |
\frac{\text{RR}_{AY}^{\text{obs}}}{\text{RR}_{AY-}^{\text{true}}}=\frac{\sum_{u} r^*(u)P(U=u\mid A=1)}{\sum_{u} r^*(u)P(U=u\mid A=0)} |
A=0群における、AのYに対する交絡相対リスク |
\text{CRR}_{AY} |
\frac{\text{RR}_{AY}^{\text{obs}}}{\text{RR}_{AY}^{\text{true}}} |
whole populationにおける、AのYに対する交絡相対リスク |
目的
真の相対リスク\text{RR}_{AY}^{\text{true}}、観測された相対リスク\text{RR}_{AY}^{\text{obs}}、未測定交絡の影響である\text{RR}_{AU}と\text{RR}_{UY}を結びつける式を導出します。
仮定として、処置A=1によってリスクが大きくなる方向の因果効果を考えます。具体的には、観測された相対リスクが1よりかなり大きく、未測定交絡の影響である\text{RR}_{AU}と\text{RR}_{UY}も1より大きいときを考えます。そして「未測定交絡の影響をこれぐらい大きく見積もらないと真の相対リスクは1まで下がらないだろう」といった知見を得ることを考えます。
もし、処置A=1によってリスクが小さくなる方向の因果効果を考えたい場合には、それぞれの相対リスクの逆数をとることで同様の議論が可能です。
命題 A.1.
\text{RR}_{AY}^{\text{true}}は\text{RR}_{AY+}^{\text{true}}と\text{RR}_{AY-}^{\text{true}}の重み付き平均である。また、\text{CRR}_{AY}は\text{CRR}_{AY+}と\text{CRR}_{AY-}の重み付き調和平均である。すなわち、
\text{RR}_{AY}^{\text{true}} = w\text{RR}_{AY+}^{\text{true}} + (1-w)\text{RR}_{AY-}^{\text{true}},
\frac{1}{\text{CRR}_{AY}}=\frac{w}{\text{CRR}_{AY+}}+\frac{1-w}{\text{CRR}_{AY-}}
ここで、f=P(A=1)でwは[0,1]の範囲の重みで
w = \frac{f\sum_{u} r(u)P(U\mid A=1)}{f\sum_{u} r(u)P(U\mid A=1) + (1-f)\sum_{u} r(u)P(U\mid A=0)}
証明
\begin{aligned}
&\text{RR}_{AY}^{\text{true}} \\
&= \frac{\sum_{u} r^*(u)P(U=u)}{\sum_{u} r(u)P(U=u)} \quad\because 定義より \\
&=\frac{f\sum_{u} r^*(u)P(U=u\mid A=1) + (1-f)\sum_{u} r^*(u)P(U=u\mid A=0)}{f\sum_{u} r(u)P(U=u\mid A=1) + (1-f)\sum_{u} r(u)P(U=u\mid A=0)} \quad\because 確率の積の公式 \\
&=\frac{f\sum_{u} r^*(u)P(U=u\mid A=1)}{f\sum_{u} r(u)P(U=u\mid A=1) + (1-f)\sum_{u} r(u)P(U=u\mid A=0)} \\&\quad + \frac{(1-f)\sum_{u} r^*(u)P(U=u\mid A=0)}{f\sum_{u} r(u)P(U=u\mid A=1) + (1-f)\sum_{u} r(u)P(U=u\mid A=0)} \quad\because 分子を分けた \\
&=\frac{f\sum_{u} r(u)P(U=u\mid A=1)}{f\sum_{u} r(u)P(U=u\mid A=1) + (1-f)\sum_{u} r(u)P(U=u\mid A=0)}\times \frac{\sum_{u} r^*(u)P(U=u\mid A=1)}{\sum_{u} r(u)P(U=u\mid A=1)} \\&\quad + \frac{(1-f)\sum_{u} r(u)P(U=u\mid A=0)}{f\sum_{u} r(u)P(U=u\mid A=1) + (1-f)\sum_{u} r(u)P(U=u\mid A=0)}\times \frac{\sum_{u} r^*(u)P(U=u\mid A=0)}{\sum_{u} r(u)P(U=u\mid A=0)} \quad\because 各項においてキャンセルできるものを差し込んだ \\
&= w\text{RR}_{AY+}^{\text{true}} + (1-w)\text{RR}_{AY-}^{\text{true}}
\end{aligned}
感想:「各群における真の相対リスクの何らかの重み付き平均」が全体の真の相対リスクになるのは、直感的にはそうだよなという感じ。重みまで含めてきちんと式で説明するとこうなるのかと勉強になりました。
命題 A.2.
次の\text{BF}_{U}をbounding factorと呼ぶ。
\text{BF}_{U} = \frac{\text{RR}_{AU}\times\text{RR}_{UY}}{\text{RR}_{AU} + \text{RR}_{UY} - 1}
交絡相対リスクはbounding factorで抑えられる。
\text{CRR}_{AY+}=\frac{\text{RR}_{AY}^{\text{obs}}}{\text{RR}_{AY+}^{\text{true}}}\leq\text{BF}_{U}
\text{CRR}_{AY-}=\frac{\text{RR}_{AY}^{\text{obs}}}{\text{RR}_{AY-}^{\text{true}}}\leq\text{BF}_{U}
\text{CRR}_{AY}=\frac{\text{RR}_{AY}^{\text{obs}}}{\text{RR}_{AY}^{\text{true}}}\leq\text{BF}_{U}
証明
はじめに\text{CRR}_{AY+}について証明する。ポイントは、\text{CRR}_{AY+}を\text{max}_{u}r(u)と\text{min}_{u}r(u)という2つの(uによらない)変数で記述すること。具体的には次が成り立つ。
\text{CRR}_{AY+}=\frac{w_1 \text{max}_{u}r(u) + (1 - w_1)\text{min}_{u}r(u)}{w_0 \text{max}_{u}r(u) + (1 - w_0)\text{min}_{u}r(u)}
ここで、
w_1 = \frac{\sum_u {(r(u) - \text{min}_{u}r(u))P(U=u\mid A=1)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)}
1 - w_1 = \frac{\sum_u {(\text{max}_{u}r(u) - r(u))P(U=u\mid A=1)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)}
w_0 = \frac{\sum_u {(r(u) - \text{min}_{u}r(u))P(U=u\mid A=0)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)}
1 - w_1 = \frac{\sum_u {(\text{max}_{u}r(u) - r(u))P(U=u\mid A=0)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)}
この部分の証明は論文にはないが備忘録として書いておく。\text{CRR}_{AY+}の新しい記述のうち、分子だけを変形すると、
\begin{aligned}
&w_1 \text{max}_{u}r(u) + (1 - w_1)\text{min}_{u}r(u) \\
&= \frac{\sum_u {(r(u) - \text{min}_{u}r(u))P(U=u\mid A=1)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)}\times \text{max}_{u}r(u) + \frac{\sum_u {(\text{max}_{u}r(u) - r(u))P(U=u\mid A=1)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)}\times\text{min}_{u}r(u) \quad\because w_1と(1 - w_1)を代入 \\
&= \frac{\sum_u {(r(u)\text{max}_{u}r(u) \cancel{-\text{min}_{u}r(u)\text{max}_{u}r(u)}\cancel{+\text{max}_{u}r(u)\text{min}_{u}r(u)} - r(u)\text{min}_{u}r(u))P(U=u\mid A=1)}}{\text{max}_{u}r(u) - \text{min}_{u}r(u)} \quad\because \sumの内側に入れた \\
&= \frac{\cancel{(\text{max}_{u}r(u) - \text{min}_{u}r(u))}\sum_u {r(u)P(U=u\mid A=1)}}{\cancel{\text{max}_{u}r(u) - \text{min}_{u}r(u)}} \quad\because \text{max}_{u}r(u) - \text{min}_{u}r(u) はuによらないので\sumの外側に出した \\
&= \sum_u {r(u)P(U=u\mid A=1)}
\end{aligned}
となって、\text{CRR}_{AY+}の定義の分子に一致する。分母も同様に式変形できる。
次に\Gamma=w_1/w_0と定義すると、
\begin{aligned}
\Gamma & =\frac{w_{1}}{w_{0}} \\
&=\frac{\sum_{u}\left\{r(u)-\min _{u} r(u)\right\} P\left(U=u\mid A=1\right)}{\sum_{u}\left\{r(u)-\min _{u} r(u)\right\} P\left(U=u \mid A=0\right)} \quad\because w_1, w_0の定義より\\
&=\frac{\sum_{u}\left\{r(u)-\min _{u} r(u)\right\} \text{RR}_{AU}(u) P\left(U=u \mid A=0\right)}{\sum_{u}\left\{r(u)-\min _{u} r(u)\right\} P\left(U=u\mid A=0\right)} \quad\because \text{RR}_{AU}(u)の定義より\\
& \leq \frac{\max _{u} \text{RR}_{A U}(u) \times \cancel{\sum_{u}\left\{r(u)-\min _{u} r(u)\right\} P\left(U=u\mid A=0\right)}}{\cancel{\sum_{u}\left\{r(u)-\min _{u} r(u)\right\} P\left(U=u\mid A=0\right)}} \quad\because \text{RR}_{AU}(u)をその最大値に固定すれば\sumの外に出せるので(上からおさえる) \\
&=\text{RR}_{A U} \quad\because \text{RR}_{A U}の定義より
\end{aligned}
またw_0 = w_1/\Gammaと書けるので、これを\text{CRR}_{AY+}の式に代入して\Gammaをまとめるように整理すると、
\operatorname{CRR}_{A Y+}=\frac{\left\{\max _{u} r(u)-\min _{u} r(u)\right\} \times w_{1}+\min _{u} r(u)}{\left\{\max _{u} r(u)-\min _{u} r(u)\right\} / \Gamma \times w_{1}+\min _{u} r(u)}
もし\Gamma > 1ならば、記事の末尾の補題A.1.より\operatorname{CRR}_{A Y+}はw_1について単調増加で、w_1=1のとき最大値をとる。
\begin{aligned}
&\text{CRR}_{A Y+} \\
&\leq \frac{\max _{u} r(u)}{\left\{\max _{u} r(u)-\min _{u} r(u)\right\} / \Gamma +\min _{u} r(u)} \quad\because w_1=1を代入した \\
&=\frac{\Gamma \times \max _{u} r(u)}{\Gamma \min _{u} r(u) + \max _{u} r(u) - \min _{u} r(u)} \quad\because 分子と分母に \Gammaを掛けた \\
&=\frac{\Gamma \times \text{RR}_{U Y \mid A=0}}{\Gamma + \text{RR}_{U Y \mid A=0} - 1} \quad\because 分子と分母を \min _{u} r(u)で割って、\text{RR}_{U Y \mid A=0}の定義より \\
&\leq \frac{\text{RR}_{AU} \times \text{RR}_{U Y \mid A=0}}{\text{RR}_{AU} + \text{RR}_{U Y \mid A=0} - 1} \quad\because \Gamma\leq\text{RR}_{AU}と補題A.2.より
\end{aligned}
もし\Gamma \leq 1ならば、補題A.1.より\operatorname{CRR}_{A Y+}はw_0について非増加で、w_1=0のとき最大値をとる。
\begin{aligned}
&\text{CRR}_{A Y+} \\
&\leq 1 \quad\because w_1=0を代入した \\
&\leq \frac{\text{RR}_{AU} \times \text{RR}_{U Y \mid A=0}}{\text{RR}_{AU} + \text{RR}_{U Y \mid A=0} - 1} \quad\because 補題A.2.より
\end{aligned}
同様に次も示せる。
\text{CRR}_{A Y-} \leq \frac{\text{RR}_{AU} \times \text{RR}_{U Y \mid A=1}}{\text{RR}_{AU} + \text{RR}_{U Y \mid A=1} - 1}
最後に、
\begin{aligned}
&\frac{1}{\text{CRR}_{A Y}}\\
&= \frac{w}{\text{CRR}_{A Y+}} + \frac{1-w}{\text{CRR}_{A Y-}} \\
&\geq \frac{w}{\left(\frac{\text{RR}_{AU} \times \text{RR}_{U Y \mid A=0}}{\text{RR}_{AU} + \text{RR}_{U Y \mid A=0} - 1} \right)} + \frac{1-w}{\left(\frac{\text{RR}_{AU} \times \text{RR}_{U Y \mid A=1}}{\text{RR}_{AU} + \text{RR}_{U Y \mid A=1} - 1}\right)} \quad\because すぐ上で示したことより \\
&\geq \frac{w}{\left(\frac{\text{RR}_{AU} \times \text{RR}_{U Y}}{\text{RR}_{AU} + \text{RR}_{U Y} - 1} \right)} + \frac{1-w}{\left(\frac{\text{RR}_{AU} \times \text{RR}_{U Y}}{\text{RR}_{AU} + \text{RR}_{U Y} - 1}\right)} \quad\because \text{RR}_{U Y}の定義と補題A.2より \\
&= \left(\frac{\text{RR}_{AU} \times \text{RR}_{U Y}}{\text{RR}_{AU} + \text{RR}_{U Y} - 1}\right)^{-1} = \frac{1}{\text{BF}_U}
\end{aligned}
感想:最後から2番目の不等号で補題A.2.を使うためには\text{RR}_{AU} > 1の条件が必要なのではと思ったのですが、相対リスクが1より大きい場面を想定している今の状況下ではそれを仮定していいのだと理解しました。
論文の主要な結果
以上より次の主要な結果が示せる。
\begin{equation}
\text{RR}_{AY}^{\text{true}} \geq \frac{\text{RR}_{AY}^{\text{obs}}}{\text{BF}_U} = \left.\text{RR}_{AY}^{\text{obs}} \right/ \frac{\text{RR}_{AU} \times \text{RR}_{U Y}}{\text{RR}_{AU} + \text{RR}_{U Y} - 1}
\end{equation}
仮に\text{RR}_{AU}と\text{RR}_{U Y}が同じ大きさでxとすると、(1)式から、
\text{RR}_{AY}^{\text{true}} x^2 - 2 \text{RR}_{AY}^{\text{obs}} x + \text{RR}_{AY}^{\text{obs}} \geq 0
となり、2次式の解の公式から、
x = \text{RR}_{AU} = \text{RR}_{U Y} \geq \left. \left\{ \text{RR}_{AY}^{\text{obs}} + \sqrt{ \text{RR}_{AY}^{\text{obs}} \left( \text{RR}_{AY}^{\text{obs}} - \text{RR}_{AY}^{\text{true}} \right) } \right\} \right/ \text{RR}_{AY}^{\text{true}}
もし、未測定交絡で観測された相対リスクの説明が完璧につくなら(すなわち\text{RR}_{AY}^{\text{true}}=1まで下がるならば)、
\begin{equation}
\text{RR}_{AU} = \text{RR}_{U Y} \geq \text{RR}_{AY}^{\text{obs}} + \sqrt{ \text{RR}_{AY}^{\text{obs}} \left( \text{RR}_{AY}^{\text{obs}} - 1 \right) }
\end{equation}
となる。(2)式の右辺をE-valueと呼ぶ。
共変量Lを再考する
これまで暗黙にL=\ellの条件付けと仮定してきたが、共変量Lを再考して結果を拡張する。\ellで条件づけたbounding factorを次のように書く。
\text{BF}_{U \mid \ell}=\frac{\text{RR}_{A U \mid \ell} \times \text{RR}_{U Y \mid \ell}} {\text{RR}_{A U \mid \ell}+\text{RR}_{U Y \mid \ell}-1}
すると、真の相対リスクは次のように変形できる。
\begin{aligned}
\text{RR}_{A Y}^{\text {true}} & =\frac{\sum_{\ell,u} P(Y=1 \mid A=1, L=\ell, U=u) P(L=\ell, U=u)}{\sum_{\ell,u} P(Y=1 \mid A=0, L=\ell, U=u) P(L=\ell, U=u)} \quad\because \text{RR}_{A Y}^{\text {true}}の定義より \\
&=\frac{\sum_{\ell,u} P(Y=1 \mid A=1, L=\ell, U=u) P(U = u \mid L=\ell) P(L=\ell)}{\sum_{\ell,u} P(Y=1 \mid A=0, L=\ell, U=u) P(U = u \mid L=\ell) P(L=\ell)} \quad\because 積の公式より\\
&=\frac{\sum_{\ell,u} P(Y(1)=1 \mid L=\ell, U=u) P(U = u \mid L=\ell) P(L=\ell)}{\sum_{\ell,u} P(Y(0)=1 \mid L=\ell, U=u) P(U = u \mid L=\ell) P(L=\ell)} \quad\because \text{consistency}より\\
&=\frac{\sum_{\ell} P(Y(1)=1 \mid L=\ell) P(L=\ell)}{\sum_{\ell} P(Y(0)=1 \mid L=\ell) P(L=\ell)} \quad\because Uの和をとった\\
&=\frac{\sum_{\ell} \text{RR}_{A Y \mid \ell}^{\text {true}} P(Y(0)=1 \mid L=\ell) P(L=\ell)}{\sum_{\ell} P(Y(0)=1 \mid L=\ell) P(L=\ell)} \quad\because \text{RR}_{A Y \mid \ell}^{\text {true}}の定義より \\
&\geq \frac{\sum_{\ell} \frac{\text{RR}_{A Y \mid \ell}^{\text{obs}}}{\text{BF}_{U \mid \ell}} P(Y(0)=1 \mid L=\ell) P(L=\ell)}{\sum_{\ell} P(Y(0)=1 \mid L=\ell) P(L=\ell)} \quad\because 主要な結果の(1)式より\\
&\geq \min_{\ell} \frac{\text{RR}_{A Y \mid \ell}^{\text{obs}}}{\text{BF}_{U \mid \ell}} \quad\because \frac{\text{RR}_{A Y \mid \ell}^{\text{obs}}}{\text{BF}_{U \mid \ell}}をその最小値に固定すれば\sumの外に出せるので(下からおさえる)
\end{aligned}
よって、L=\ellについて最小のbounding factorとE-valueを使えば、これまでと同様の議論が可能です。
補題
補題A.1.
h(x) = \frac{c_1 x + 1}{c_2 x + 1}
とする。c_1 > c_2のとき、h'(x) >0でh(x)は単調増加である。c_1 \leq c_2のとき、h'(x) \leq 0でh(x)は非増加である。
証明はxで微分するだけ。
補題A.2.
x, y > 1のとき、次の関数h(x)はx,yの両方について単調増加である。
h(x,y) = \frac{x y}{(x + y - 1)}
証明はxについて偏微分するだけ。xとyは対称なので成立する。ちなみに1 \leq x,y \leq 5の範囲でグラフにすると以下のような形をしていて、x = 1またはy = 1で最小値1をとります。
Discussion