🐒

All possible casesを対象としたバリデーション研究における感度とPPV

2023/12/03に公開

概要

二次利用データを用いた医療系の研究では、種々のコード(ICD10など)によって関心のある事象を定義する。その定義の妥当性を事前に評価しておく研究をバリデーション研究という。バリデーション研究の方法についてまとめた「日本における傷病名を中心とするレセプト情報から得られる指標のバリデーションに関するタス クフォース」報告書では、"all possible cases"を想定したサンプリング方法が紹介されている。本報告書によると、all possible casesを想定したサンプリング方法を用いたバリデーション研究では、感度はバイアスがかかるとされる一方、PPV推定量は不偏であると記載されている。なぜ感度がバイアスされ、PPVはバイアスされないのかについて考えた。

All possible casesを想定したサンプリングとは

海外では"all possible cases"というサンプリング手法として確立された名称というわけでもなさそうだが、報告書作成前の段階で例えば、Krysko et al.(2015)Widdifield et al.(2015)などでこのサンプリング方法を用いたバリデーション研究がなされている。その後、日本で行われているバリデーション研究でもall possible casesを想定した方法を用いているものはよくあると思う(例えば、Nishikawa et al.(2022))。

報告書ではall possible casesを想定した方法について下記のように説明されている。

研究対象集団(全体あるいはそのランダムサンプリング)の中で真のケースを多く含むことが期待されるサブグループを2種類以上(例:「レセプトに該当病名がある」サブグループと「関連する検査結果が正常値の○倍以上」のサブグループ)特定し、これらのサブグループの集合体を対象にカルテレビューで真のケースを見出し、これを「全ての真のケース」と仮定して、陽性的中度のみならず感度(および特異度・陰性的中度)も推定する方法である。

また、同報告書では感度の過大評価の可能性を指摘している。

なお、”all possible cases”の方法は、集団全体またはそのランダムサンプルの調査ではないので、「検討の対象となったサブグループの集合体に含まれない真のケース」の存在を否定することは通常できない。特に、設定可能なサブグループに含まれない真のケースが相当数存在することが確実であるような場合には、"all possible cases"の方法は、感度が過大評価され、アウトカム定義が「実際よりもよい」との誤った印象を与えることにつながるため推奨できない。設定されたサブグループから漏れる真のケースがそれほど多いとは考えられない場合にも、"all possible cases"の方法を用いた場合には、「検討の対象となったサブグループの集合体に含まれない真のケース」の程度が、推定された指標にどのような影響を与えるかについての感度解析をしておくことが望ましい

一方で、PPVにバイアスが生じる可能性については特に言及がないため、この方法を用いてもPPVは問題なく推定できるはずと考えられる。

なぜ感度にバイアスが生じるのかを考える

ある疾患をできるだけ高い精度で特定できる定義を考えたいとする。そのために、病名を用いて定義することにする(以下、病名定義と書く)。

まず、下記の通りいくつかの変数を設定する:

  • D_{def}:ある病名定義を満たすときに1を取る変数
  • D_{true}:関心のある真の疾患であるときに1を取る変数
  • Z_{APC}:all possible casesとして選択されたとき1を取る変数

この記法のもとで、通常の感度はSen = Pr(D_{def} = 1 | D_{true} = 1)と定義される。一方、all possible casesとして選択されたサンプルの中での感度はSen_{APC} = Pr(D_{def} = 1 | D_{true} = 1, Z_{APC} = 1)と書ける。

もし、「all possible casesとして選択されること」と「ある病名定義を満たすこと」が独立であれば、Sen_{APC} = Pr(D_{def} = 1 | D_{true} = 1, Z_{APC} = 1) = Pr(D_{def} = 1 | D_{true} = 1) = Senとなり、all possible casesを想定したサンプリングでも問題なく感度を推定できるはずである。

しかし、all possible casesは、真の疾患であれば満たしそうな条件を複数考えてその和集合とするので、その条件の中には関心のある疾患を特定するための病名定義が含まれると考える方が自然である。よって、D_{def}Z_{APC}が独立であるとは言えないだろう。

では、どのくらいのバイアスが生じるのだろうか?
まずSenを、Sen_{APC}Sen_{Non-APC}(all possible casesとして選ばれなかったサンプルにおける感度)、真の疾患のうちall possible casesに選択される確率Pr(Z_{APC} = 1|D_{true}=1) = pを用いて表現してみると、次のようになる:

\begin{align*} Sen &= Pr(D_{def} = 1| D_{true} = 1, Z_{APC} = 1) \cdot Pr(Z_{APC} = 1|D_{true}=1) \\ &+ Pr(D_{def} = 1| D_{true} = 1, Z_{APC} = 0) \cdot Pr(Z_{APC} = 0|D_{true}=1) \\ &= Sen_{APC} \cdot p + Sen_{Non-APC} \cdot (1-p) \end{align*}

と思う。
この表現を用いて正しい感度とAPCの感度の差を考えると:

\begin{align*} Sen_{APC} - Sen &= Sen_{APC} - (Sen_{APC} \cdot p - Sen_{Non-APC} \cdot (1-p)) \\ &= Sen_{APC} \cdot (1-p) - Sen_{Non-APC} \cdot (1-p) \\ & = (Sen_{APC} - Sen_{Non-APC}) \cdot (1-p) \end{align*}

となる。真の疾患をall possible casesとして全例必ず選択できるような条件になっているのであれば、二つの感度に差は生まれない。一方、その真の疾患が少しでも漏れる可能性があるならば、(all possible casesに選ばれる集団における感度と選ばれない集団における感度の差には何かしらの差があるはずなので)、Sen_{APC}にはバイアスが生じることになる。

実際、下記の記載があることから、all possible casesでないサンプルの中には何かしらの病名定義を満たすサンプルは存在しないはずなので、Sen_{Non-APC}=0となるはずである:

この方法では、複数のサブグループの一つに「アウトカム定義を満たす」グループを通常含めるが

このことを踏まえると、Sen_{APC} - Sen = Sen_{APC} \cdot (1-p)と書けることになる。また、この式を変形すると、Sen_{APC} = \frac{1}{p} \cdot Senとなり、all possible casesが真の疾患をどれだけ補足できているかを表すpの逆数倍、Sen_{APC}が大きく推定されてしまうことが分かる。

なぜPPVは不偏なのかを考える

次に、all possible casesを対象として計算するPPVになぜバイアスが生じないのかについて考える。

通常のPPVとall possible casesにおけるPPVはそれぞれ下記のように表せる:

\begin{align*} PPV &= Pr(D_{true} =1 | D_{def} = 1) \\ PPV_{APC} &= Pr(D_{true} =1 | D_{def} = 1, Z_{APC} = 1) \end{align*}

感度の時と同様の式変形をq = Pr(Z_{APC} = 1|D_{def} = 1)を用いて行うと二つのPPVの差は:

\begin{align*} PPV_{APC} - PPV &= (PPV_{APC} - PPV_{Non-APC}) \cdot (1-q) \end{align*}

となる。
すなわち、上述した通り、q=1になるようにall possible casesが選ばれていれば、PPVは正しく推定されることになる。

シミュレーション記事に続く。

Discussion