現代数理統計学の基礎
はじめに
今年の11月末に統計検定1級を受験するので、よく参考書として使用される本書を購入
章ごとに演習問題があるので、それを解きながら読み進めています~
とりあえずほぼ読んだってことで本書の紹介を書いていきまっす!
この記事の目的は、
くらいの感じ。
忙しい人用まとめ
- 数理統計を幅広くカバーしている
- 数理統計で使われる定理などがほとんど数式の証明付き
- 「とりあえずそういうもんなんだ」と思っていた統計の知識が「なるほどそういうことか」になる(伝われ)
- 数式に抵抗ある人は多分読めない
- 例題や演習問題があるので解きながら理解タイプと相性いい
- カイ二乗検定おもろい
どんな内容?
せっかくなので本書の内容を一部、webマーケティングの話っぽく変換して書いてみる
Aパターン・Bパターンを作って、試しにユーザーに使ってもらって、そのデータからどっちの方が効果的か分析してやろうみたいなやつです。知らない人はググってみてください。
このA/Bテストには「統計的検定」というのが使われていて、たくさんの検定方法があるみたいですが、その中でも汎用的に使われているらしい、
ってやつを、A/Bテストの具体例を挙げながら紹介します。
皆さんもA/Bテストしてる気分で見てみてください。
背景
あるECサイトが、購入ボタンのデザインを変更することで購入率を向上させることができるかを検証したいと考えています。既存のデザインを「バージョンA」とし、新しいデザインを「バージョンB」とします。
データの収集
1週間の間に、ランダムに一部のユーザーにバージョンA、もう一部にはバージョンBを表示し、それぞれのバージョンでの購入者数と非購入者数、それを基に計算した購入率を記録しました。
結果
以下のような観測値が得られたとします。
購入した | 購入しなかった | 合計 | 購入率 | |
---|---|---|---|---|
バージョンA | 50 | 450 | 500 | 10% |
バージョンB | 90 | 410 | 500 | 18% |
合計 | 140 | 860 | 1000 | 14% |
ここで、「購入率が8%もあがりました!」と上司に言えば、
「その8%ってどれくらい信頼できるの?偶然そうなった可能性もあるよね?」というカウンターがきて詰みます。
そこで出てくるのがカイ二乗検定ってわけです。
カイ二乗検定を使えば「どれくらい信頼できる」を評価できるので、例えば「95%以上の確率でバージョンBの方が効果的と言えます。」というカウンターパンチが打てます。
カイ二乗検定の実施(ここから本題)
カイ二乗検定では上の表を基に期待度数というものを計算します。
期待度数とは、バージョンAとバージョンBの差がないと仮定した場合の値です。
今回の場合、購入率の合計が14%であるので、バージョンA・バージョンBのそれぞれの購入率も14%であれば「差がない」と言えます。
したがって、期待度数は以下の表のようになります。
購入した | 購入しなかった | 合計 | 購入率 | |
---|---|---|---|---|
バージョンA | 70 | 430 | 500 | 14% |
バージョンB | 70 | 430 | 500 | 14% |
合計 | 140 | 860 | 1000 | 14% |
次に、実際の観測値(
)と期待度数( O )との差を元に、カイ二乗値( E )なるものを計算します。 χ^2
カイ二乗値とは「バージョンAとバージョンBの購入行動に関して統計的に有意な(意味のある)違いがどれくらいあるかの度合い」であり、値が大きいほど有意な違いがあると言えます。
計算式は以下です。
より、左上のマス(購入した×バージョンA)でカイ二乗値を計算すると、
同様にほかの3マスでも計算すると、
ここで、計算した
とカイ二乗分布のパーセント点( χ^2 )なるものを比較します。 χ^2_α
とは「バージョンAとバージョンBの差がない」ことを否定できる、つまりここでは「バージョンBの方が効果的である」確率が(1-α)*100%の時の値のことです。 χ^2_α
例えば、であるので、 χ^2_{0.05} = 3.84 が3.84以上であれば「95%以上の確率でバージョンBの方が効果的である」と言えます。今回は13.29で3.84以上なので言えますね。 χ^2
またなので、今回は「99%以上の確率でバージョンBの方が効果的である」とも言えます。 χ^2_{0.01} = 6.63
上の例は本書を読んだ自分が数理統計を知らない人でも伝わるように書いたので、本書の内容と若干ずれます。また、記事に始めに述べた通り統計的に誤った表現があるかもしれません。
なんとなくこんなことが書いてあるんだなと思ってくれればいいです。
ちなみに本書でカイ二乗検定に充てられてるページ数は約2ページ/300ページなので、もっとたくさんの検定方法や違う領域のテーマが幅広く解説されているのがわかると思います。
扱っているテーマ
数理統計に関して幅広くカバーしている
- 確率
- 確率分布と期待値
- 代表的な確率分布
- 多次元確率変数の分布
- 標本分布とその近似
- 統計的推定
- 統計的仮説検定(ここにカイ二乗検定がいる)
- 統計的区間推定
- 線形回帰モデル
- リスク最適性の理論
- 計算統計学の方法
- 確率過程
難易度や読みやすさ
数式を追える人であれば、時間かければ読める難易度
逆に数学無理!って人は多分無理
基本的に文字と数式しかないので、そういうのが無理な人は厳しい
一方で、例題や演習問題がたくさんある(章ごとに平均20問くらい)ので問題解きながら理解を深められるタイプは最強になれる
※自分的にはこれで救われた。文字と数式読んでも「何言ってんの?」だったけど、問題解いて「そういう風にこの定理は使えるのね。」となった
実用性
正社員として実務を行ったことがないので、なんとなく役に立ちそうくらいで書く
読んだ(解いた)感想
- 演習問題がむずすぎる(統計検定1級の問題よりはムズイ)
- が、時間かけて解ききって、統計検定1級の過去問見たらかわいく思えたのでやる価値は十分にある
- 試験まであと1か月切ってるので頑張ります~
Discussion