📝
調査の誤差に関する考え方について
以下の記事で行った調査の誤差に関する考え方を紹介します。
ローモバの話はほとんど出てきません。
誤差について
私が行っている2つの調査は、無限にある母集団の中から標本を取り出していく、標本調査(点推定)に相当します。箱を開け試行、魔獣を攻撃する試行は母集団から無作為[1]に行われるため、完全な無作為抽出となります。
標本調査の誤差には標本誤差と非標本誤差があります。今回の調査の場合、非標本誤差は画像からのデータ抽出時の抽出ミス等から生まれます。今回は完璧に行われていると仮定し、非標本誤差は0としています。標本誤差については、標準誤差による信頼区間の評価によって行われます。
確率の標準誤差と信頼区間
確率(割合)
ここで
例えば
期待値の標準誤差と信頼区間
例えば3204個の箱を開け、100ジェムが13箱、50ジェムが38箱、その他はジェム無しだったとします。この時、平均値(期待値)
この平均値の標準誤差
ここで、
以上から、ジェムの期待値の95%信頼区間は0.71〜1.29[3:1]となります。
信頼区間を狭くする
上の計算式の通り、信頼区間の幅は標準誤差に比例し、標準誤差はサンプル数の平方根に反比例しています。このため、信頼区間を狭めるためにはサンプル数を増やすしかありません。
どれだけ試行を繰り返しても、信頼区間は0にはなりません。どこかで折り合いをつける必要があります。魔獣を攻撃したときのドロップアイテムの場合は公式の提示があり、これと合致することの確認が目的のため、信頼区間が狭い(確率の高い)カテゴリについて、公式の値が信頼区間内に収まることを1つの基準とできそうです。
Discussion