ワシントン大学Steve Brunton先生の確率・統計講座ー第2回ー確率の導入
こんにちは、あるいはこんばんは。
今日は、Steve Brunton先生の確率・統計講座第2回のまとめです。
Youtube
確率は、「ある事象がどの程度起こりやすいか」を数値で表したものです。確率論を学び始める際に用いられる典型的な例が、コイン投げやサイコロ投げです。これらは単純なルールと有限の明確な結果集合を持つため、直感的に理解しやすい題材です。
基本概念:標本空間と事象
確率を扱う上で、まず「標本空間 (sample space)」と「事象 (event)」という2つの用語を押さえておきましょう。
• 標本空間 ():
起こりうる全ての結果を列挙した集合。
例えば、コインを2回投げる場合の標本空間は

(H:表、T:裏)
• 事象 (A):
標本空間の部分集合で、実際に起こる可能性がある特定の結果群を定義します。
例)「少なくとも1回は表が出る」事象は

確率の基本式:事象が起こる「方法の数」÷「起こりうる総数」
古典的な確率の定義はシンプルです。

先ほどのコインの例であれば、少なくとも1回表が出る事象Aは3通り(HH, HT, TH)、全結果は4通り(HH, HT, TH, TT)。よって、

これは、「2回コインを投げて少なくとも1回表が出る確率は75%」という意味です。
サイコロの例でより豊富なパターンを理解する
コインより結果の種類が多いのが6面体のサイコロです。1回の投げで結果は{1,2,3,4,5,6}の6通り。
2つのサイコロを同時に振れば、標本空間は36通り(6×6)あります。各目の組合せは(1,1), (1,2), …, (6,6)といった形で、理想的なサイコロでは全てが等確率です。
例題:「2つのサイコロを振って、少なくとも1つが5である確率は?」
1つめのサイコロが5になる組は(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)の6通り。
2つめが5の場合は(1,5), (2,5), (3,5), (4,5), (5,5), (6,5)の6通り。ただし(5,5)は重複するので、
合計は6+6-1=11通りとなります。
標本空間は36通りなので、
 (約30.6%)
ここで注目すべきは、計算方法や組み合わせの整理の仕方です。確率計算は単純な分数計算だけでなく、条件整理や重複分除去といった基本的な論理的ステップが重要になります。
一般化の道筋
サイコロやコインは均一かつ独立な事象を前提としており、各結果が等確率であることを仮定しています。現実世界では、条件が異なる場合や、確率が均等でない場合も多々あります。そのようなケースにも対応するためには以下の拡張が必要になります。
• 条件付き確率:ある条件下での起こりやすさを計算し、イベント同士の依存関係を解析。
• 確率分布:サイコロやコイン以外にも連続量を扱い、より複雑な現象をモデル化するために、確率密度関数や累積分布関数を使用。
まとめ
「事象が何種類あり、そのうち何通りが目的の事象か?」という単純な考え方は、確率論の基礎をつかむには最適な出発点です。コインやサイコロを用いることで、確率計算の直感を養うことができます。この基礎を踏まえた上で、より複雑な確率モデルへと進むことで、データサイエンスや機械学習、各種統計的手法による意思決定支援へと知識を拡張できるでしょう。
これらの基本的な概念と計算手順は、確率・統計を初めて学ぶ上で必須のステップとなります。サイコロの例は、単純なルールを使いながら、確率的思考の出発点となる優れたツールといえるでしょう。
Discussion