Deep Learning資格試験 応用数学 確率・統計(1)
はじめに
日本ディープラーニング協会の Deep Learning 資格試験(E 資格)の受験に向けて、調べた内容をまとめていきます。
集合
ものの集まりのこと。
例えば要素が a ~ e まである場合
集合
集合
集合
和集合
集合
イメージとしては OR
共通部分
集合
イメージとしては AND
絶対補
全体集合を
集合
相対補
集合
絶対補と違い、全体集合を考えない。
確率
頻度確率 (客観確率)
- 発生する確率
- 例:「サイコロをふって1が出る確率」
ベイズ確率 (主観確率)
- ある現象の頻度や傾向の代わりに、確率を知識の状態を表す合理的な期待値
- ある商店街の通りで、通行人が3人連続で男性だった。4人目は男性が通る確率の方が高い
- 過去の現象から、期待値を求める。たまたま男性が多く通る道なのかも。。。
条件付き確率
ある事象
独立な事象の同時確率
お互いの発生には因果関係のない事象
ベイズ則
コロナウイルスの陽性反応が出た人のうち、本当に感染している人の割合
※偽陽性があるため、陽性反応が出ても完成していない場合がある。
※偽陰性があるため、本当は感染していても陽性反応がでない場合がある
期待値
- その分布における確率変数の、平均値、もしくは「ありえそう」な値
事象 X | ||||
---|---|---|---|---|
確率変数 |
||||
確率 |
期待値
連続する値なら、期待値
分散・共分散
分散
- データの散らばり具合
- データの各々の値が、期待値からどれだけずれているのか平均したもの
共分散
- 二つのデータ系列の傾向の違い - 正の値をとれば似た傾向 - 負の値をとれば逆の傾向 - ゼロをとれば関係性に乏しい
標準偏差
分散は2乗しているため、元のデータと単位が違う
↓
平方根を求めれば、元の単位に戻る = 標準偏差という
確率変数と確率分布
参考:確率変数と確率分布
確率変数
- ある変数の値をとる確率が存在する変数のこと。
- 例えば、さいころを投げて出る目は{1, 2, 3, 4, 5, 6}のいずれかであり、それぞれの目が出る確率は
であることから、さいころを投げて出る目は確率変数であるといえる。\frac{1}{6} - 確率変数には、「離散型」と「連続型」の2種類がある。
確率分布
- 確率変数がとる値とその値をとる確率の対応の様子を「確率分布」という。
- 例えば、さいころを投げる例では、1 から 6 までの確率変数の値にそれぞれ
いう確率が対応しているので、確率分布といえる。\frac{1}{6}
離散型確率変数
- 離散型変数はとびとびの値をとる変数のことで、隣り合う数字の間には値が存在しないものをいう。
- 離散型変数には、さいころの出る目や人数などが含まれます。
確率質量関数
- 離散型確率変数
がある値X をとる確率を関数x とした場合、f(x) は「確率質量関数」という。f(x) -
(ある値X = x )となる確率は次のように表すことができる。x
連続型確率変数
参考:連続型確率分布
参考:確率密度と確率密度関数
- 連続型変数は、重さや温度などのように連続した値をとるものを指します。
- 例えば重さの場合、50kg と 51kg の間には 50.5kg や 50.1kg、50.000001kg など無数の値が存在します。
確率密度
- 確率密度は定義域内でのの値の「相対的な出やすさ」を表す。
確率密度関数
連続型確率変数
このとき、確率変数
期待値
分散
様々な分布
離散型分布 | 連続型分布 |
---|---|
一様分布 | 連続一様分布 |
二項分布 | 正規分布 |
マルチヌーイ分布 | 指数分布 |
多項分布 | t 分布 |
ポアソン分布 | F 分布 |
幾何分布 | カイ二乗分布 |
離散型分布
試行回数 | 2値分類 | 多クラス分類 |
---|---|---|
1回 | ベルヌーイ分布 | マルチヌーイ分布 |
n回 | 二項分布 | 多項分布 |
一様分布
- サイコロのイメージ
確率関数
期待値
分散
連続一様分布
確率関数
期待値
分散
ベルヌーイ分布
- コイントスのイメージ
- 裏と表で出る割合が等しくない場合でも扱える
-
の場合の二項分布に等しい。n = 1
事象
確率関数
期待値
分散
二項分布
- このベルヌーイ試行を回行って、成功する回数
が従う確率分布を「二項分布」という。X
1回の試行に対して事情
確率関数
期待値
分散
ポアソン分布
- 二項分布において、
が非常に大きく、n が極めてまれな現象であるときに従う確率分布である。p - 単位時間あたりにある事象が平均して
回起こる場合に、その事象が\lambda 回起こる確率を示す。x
確率関数
期待値
分散
マルチヌーイ(カテゴリカル)分布
- ベルヌーイ分布はバイナリの変数(裏表、0 か1)の確率分布を扱ったが、マルチヌーイ分布は変数が3つ以上のカテゴリに分かれる場合の確率分布。
- さいころを転がすイメージ
- 各面の出る割合が等しくない場合でも扱える
-
の場合の多項分布に等しい。n = 1
多項分布
- 多項分布はマルチヌーイ分布に従う試行を
回行なったもの。n - 二項分布を多項に拡張したものとも考えられる。
正規分布(ガウス分布)
- 釣鐘型の連続分布
確率関数
期待値
分散
対数尤度関数
ただし、
分散
Discussion