サンプルサイズの導出
はじめに
この記事では、サンプルサイズ設計、特に 2 標本の差の検定 で必要なサンプルサイズを計算する過程について記述します。勉強しながら筆者の理解したことを書いているので誤りもあるかもしれません。
計算の仮定
「新薬は既存薬より有効である」ことを、新薬治療群と既存薬治療群の 2 群における、ある検査値の平均値の差の検定で示したいとします。簡単のために、大きい方が治療が有効であるような検査値とします。
- 帰無仮説
:既存薬群の平均値H_0 新薬群の平均値\mu_0\ge \mu_1 - 対立仮説
:H_1 \mu_0\lt\mu_1
そもそもサンプルサイズを計算するモチベーションは、例数が多すぎても少なすぎてもよくないからです。
- 多すぎる場合は、時間・費用がかかる
- 少なすぎる場合は、実験が無駄になる可能性がある
そこで、そういった誤りを一定以下に抑えることができるであろう最小のサンプルサイズを計算します。以下のパラメータによって計算できます。
- 有意水準
:type I error の確率。小さい程嬉しい\alpha - 検出力
:真に有意であるときに正しく有意であると判断できる確率。1 から type II error の確率を引いた値。大きい程嬉しい1-\beta - エフェクトサイズ
:検出したい差。大きい程嬉しい\Delta - バラツキ
:想定される個人差。小さい程嬉しい\sigma
計算の過程
対立仮説
また、既存薬群と新薬群が等分散だと仮定し、被験者の割付を 1:1 とする場合、
\displaystyle f_0:\mathrm{N}\left(0, \frac{2\sigma^2}{n}\right) \displaystyle f_1:\mathrm{N}\left(\mu_1-\mu_0, \frac{2\sigma^2}{n}\right)
この
次に、このグラフで各群の平均値間の距離を考えると、下で示すような2通りで表すことができます。
これを等式で結ぶと、
としてサンプルサイズを求めることができます。
※このグラフでは、わかりやすさのために、橙の面積
また、両側検定 (
精度
上述の計算でサンプルサイズの概算はできますが、等分散性の過程、1:1 の割り付け、正規分布を用いてることなどから正確ではありません。
-
,f_0 の標準偏差:f_1 s=\displaystyle\sqrt{\frac{\sigma_0^2}{n_0}+\frac{\sigma_1^2}{n_1}} -
,f_0 が従う t 分布の自由度:f_1 \displaystyle\nu=\frac{\left(\sqrt{\frac{\sigma_0^2}{n_0}+\frac{\sigma_1^2}{n_1}}\right)^2}{\frac{\left(\frac{\sigma_0^2}{n_0}\right)^2}{n_0-1}+\frac{\left(\frac{\sigma_1^2}{n_1}\right)^2}{n_1-1}}
このとき、以下の式を解いて算出したサンプルサイズ
勉強中なこと
- エフェクトサイズ(効果量)の設定
- 調べてると、
なども出てきた\displaystyle\frac{\mu_1-\mu_0}{\sigma} - Cohen の論文・書籍に記述がありそう
- Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155–159. https://doi.org/10.1037/0033-2909.112.1.155
- https://amzn.to/3e5nQqK (University of Toronto に PDF [9MB] が置いてある)
- 調べてると、
- 1 標本や対応のある 2 標本の場合のサンプルサイズ設計
- Bayes 流の計算
- 分散未知で t 分布に従う場合の概算方法
-
検定や log-rank 検定などは一般化してこの式で求めれるそう\chi^2
練習問題
ノルウェーにおいて、40 週の妊娠期間を満了して生まれた新生児の出生時体重の分布は近似的に正規分布になり、その平均は
回答
この問題は「喫煙者から生まれた新生児の真の体重
すなわち、
の範囲に
次に、
の範囲に
より、喫煙していた女性から妊娠期間を満了して生まれた新生児
参考文献
-
A J Wilcox, and R SkjaervenEpidemiology Branch, National Institute of Environmental Health Sciences, Research Triangle Park, NC 27709. “Birth weight and perinatal mortality: the effect of gestational age.”, American Journal of Public Health 82, no. 3 (March 1, 1992): pp. 378-382. https://doi.org/10.2105/ajph.82.3.378 ↩︎
Discussion