📑

点推定、区間推定

2024/11/18に公開

参考:https://bellcurve.jp/statistics/course/8003.html
本来知りたいと思っている集団:母集団
母集団の情報を推測するために選ばれた集団:標本
母集団から一部を選んで標本とすること:抽出
母集団の資質を推測すること:推測統計学

参考:https://bellcurve.jp/statistics/course/8608.html?srsltid=AfmBOopn9oVQnZ-5oqyR369PGxdKP2l8pdtbhGduoxkPi-NkDgEKu5j_
推測統計学の中には推定と検定がある
日本人全員(母集団)から百人を抽出した標本を考える

点推定

参考:https://bellcurve.jp/statistics/course/8610.html
点推定:標本から母集団を特徴づけるパラメータ(母数)を推測する

例)
•全国の映画館の数を数えたい
•でも全部数えるの無理
•なので、10個の都道府県をチョイス
•その10個から平均を出す
-それを47都道府県の平均値とする(母平均点の推定)
- 大数の法則に従う
- 標本が大きくなるにつれて標本平均は母平均に近づく

推定量

•標本から母集団を特徴づけるパラメータ(母数)パラメータを推定するための計算式を推定量という

□推定量の問題

一致性

参考:https://bellcurve.jp/statistics/course/8612.html
•標本から母集団を特徴づけるパラメータ(母数)を推定するとき、その推測が正確である必要がある。
•標本の数が増えれば増えるほど、推定量がだんだんと真の値に近づく性質を一致性という

不偏性

参考:https://bellcurve.jp/statistics/course/8612.html
•標本から母集団を特徴づけるパラメータ(母数)パラメータを推定するための計算式である推定量の期待値がパラメータに一致している必要がある(予想と真の値はある程度一致している必要ある)。この性質を不偏性という。

標本分散

参考:https://bellcurve.jp/statistics/course/8614.html
•得られたデータの平均をxの平均、ここのデータをxi、サンプルサイズをn、標本分散をS^2

•でも、標本分散はnが十分に大きくないと、標本分散の期待値はぼ分散に一致せず、母分散より小さくなる

不偏分散


•標本分散の期待値が母分散に一致するようにする

  • 標本分散の算出式にn/n-1をかけたものが不偏分散の算出式となる
    • n/n-1をかけたものが不偏分散の算出式となるか?:標本分散が母分散の推定値として偏りがあるので、それを補正する(不偏=偏りがない)ため
    • 標本平均を計算に使うことで、標本分散は母分散の下限推定値になりがち
      • 下限推定値:
      • 標本分散は母分散を推定するとき、いつも値が少し小さくなってしまう傾向がある。
      • なので、この偏りを補正するために不偏分散を使う

標準誤差

参照:https://bellcurve.jp/statistics/course/8616.html
•標準誤差:標本から母集団を特徴づけるパラメータ(母数)パラメータを推定するための計算式を推定量の標準偏差
•標本から得られる推定量そのもののバラつき(=精度)
•標本誤差は標本平均の標準偏差(バラつき具合)を表す
•平均μ、分散に従う母集団からサンプルサイズnの標本を抽出するとき、その平均値xの分布はnが大きくなるつれて
•標本を抽出するとき、その平均値xの分布はnの標本が大きくなるにつれて、正規分布に近づく(標本サイズが大きいと正規分布に近づく)

区間推定/点推定

参考:https://www.youtube.com/watch?v=a4w0pVnivjQ

  • 点推定:100人の日本人男性の身長を調べてみると、平均が174cmだったので、全国の日本人男性の平均身長も174cmとすること。
  • 区間推定:100人の日本人男性の身長を調べてみると、平均が174cmだったので、全国の日本人男性の平均身長は少し幅を持たせて172cmから176cmとすること。
    • 母集団からサンプルを抜き出してそれを標本とする際、100回中95回は母集団の平均内にある値が入るだろう!とするのが、区間推定でこの区間が「95%信頼区間」
    • 95%より、99%の方が幅が広い
      • 理由:99%は「母集団の平均値の99%が標本にもふくまれている」という意味だから、その分守備範囲も広くなる。

練習問題

参照:https://bellcurve.jp/statistics/course/11065.html

(1)

解説

-「X~」の計算式は「確率変数Xは平均がμで、分散が25である正規分布に従う」ことを意味している。

Discussion