🦫

ワシントン大学Steve Brunton先生の確率・統計講座ー第1回ー講座概観

2024/12/20に公開

こんにちは、あるいはこんばんは。
今回は、ワシントン大学のSteve Brunton先生による確率・統計講座の初回概要をご紹介します。

YouTubeリンクはこちら

講義のイメージ


確率と統計の重要性

本記事では、確率と統計の基礎的な概観を説明します。この分野の考え方は、以下の分野で欠かせない基盤となります:

  • 科学・工学分野
  • ビジネス分析
  • 機械学習
  • データサイエンス

確率と統計の目的と扱う問題を把握することで、今後より高度なトピックへのスムーズな理解と応用が可能になります。


確率(Probability)と統計(Statistics)の違い

確率 (Probability)

  • 仮定: 確率分布(モデル)は既知。
  • 目的: 「この分布からどのようなサンプル(観測値)が得られるか」を予測。
  • : サイコロの目は1~6が等確率、正規分布に従うデータが観測される。

統計 (Statistics)

  • 仮定: 観測データ(サンプル)はあるが、確率分布(モデル)は未知。
  • 目的: データから未知分布の特性を推定、または仮説を検定。
  • : 観測データから母集団平均や分散を推定、仮説検定。

確率論で扱う主なトピック

  1. 確率の基礎概念
    サンプル空間、事象、確率測度、頻度解釈、ベイズ的解釈など。

  2. 確率変数と分布
    ベルヌーイ分布、二項分布、正規分布、ポアソン分布など。

  3. 期待値・分散などの指標
    平均、分散、標準偏差、中央値などの統計量を理解。


統計学で扱う主なトピック

  1. データからの推定

    • 未知分布のパラメータを推定(例:平均、分散)。
    • 最大尤度推定(MLE)などの手法。
  2. 仮説検定と推測統計

    • 観測データを基に仮説(帰無仮説)の妥当性を検証。
    • サンプルサイズや分布を考慮した統計的検定。
  3. サンプリング

    • 母集団全体の観察が不可能な場合、標本を用いて母集団特性を推定。
    • サンプルサイズと抽出方法が精度やバイアスに影響。

中心極限定理 (Central Limit Theorem, CLT)

要点

  • 独立同分布 (i.i.d.) な確率変数からの大きなサンプルサイズの平均は、元の分布に依らず正規分布に近似される。

応用例

  • ガス分子の運動や温度特性
  • 乱流現象の統計モデル
  • 測定誤差 (ガウシアンノイズ)
  • カルマンフィルタによる状態推定
  • 天候予測やカオス系の確率モデル
  • 行動経済学や社会科学での人間行動モデル

まとめ

  • 確率と統計の違い
    確率は「既知のモデルで結果を予測」、統計は「観測データからモデルを推定」。

  • 今後の展開
    ベイズ統計や機械学習への応用を視野に、これらの基礎概念を押さえることが重要です。

次回以降、さらに具体的なトピックや手法を掘り下げていきます。実践的なデータ解析やモデル構築に役立つ基礎力を身につけていきましょう!

Discussion