📊

統計検定1級チートシート

2025/02/23に公開

A. 統計検定®︎1級とは

日本統計学会が認定する最難関レベルの統計資格
大学専門課程修了レベルで、データ解析に用いる統計学の基礎能力をはかる
確率論・推定/検定理論・ベイズ統計・回帰分析・多変量解析などを網羅
統計数理(5問中3問選択)・統計応用(人文科学/社会科学/理工学/医薬生物学から1問選択)から成る
合格率は20%前後。一般に300H程度の勉強が必要(らしい)

B. 本稿の目的

統計検定1級合格までの過程で、当方が頭の中でシンプルにまとめた内容を備忘録として残す。
統計検定の問題を解くうえで必要であった公式を、本稿の執筆をもって改めて整理する。
- ※1 あくまで以下のチートシートは最低限必要な事項
- ※2 これらの数式を丸暗記ではなく、定義から導出できるようにし、試験で扱えるように理解する

C. チートシート

1. 基本式定義

離散/連続確率分布の定義

\begin{aligned}
  P(X=x) &= f_X(x) \qquad\quad\quad\ \ \  \text{[discrete]} \\[5pt]
  P(X\leq x) &= \int_{-\infty}^x f_X(t) dt \qquad \text{[continuous]}
\end{aligned}

期待値の定義

\mathbb{E}[g(X)] =
\begin{cases}
  \sum\limits_{x} g(x) f_X(x)  & : \text{[discrete]} \\
  \int g(x) f_X(x) \,dx & : \text{[continuous]}
\end{cases}

分散の定義

\sigma^2_X=\text{Var}[X]=\mathbb{E}[(X-\mathbb{E}[X])^2]

モーメント母関数

m_X(t)=\mathbb{E}[e^{tX}]

2. 多変数への拡張

和・積の法則


\text{I}:\,f_X(x) = \int f_{X,Y}(x,y) \, dy \qquad
\text{II}:\,f_{X,Y}(x,y) = f_{X|Y=y}(x) f_Y(y)

共分散・相関係数


\text{Cov}(X,Y) = \mathbb{E}_{X,Y} [(X - \mu_X)(Y - \mu_Y)] \qquad
\rho = \frac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y}

反転・全分散の公式


\mathbb{E}[X] = \mathbb{E}_{\textcolor{orange}{Y}} \left[ \mathbb{E}_X [X | \textcolor{orange}{Y}] \right] \qquad
\text{Var}[X] = \mathbb{E}_Y \left[ \text{Var}[X | Y] \right] + \text{Var} \left[ \mathbb{E}_X [X | Y] \right]

変数変換


f_{U,V}(u,v) = f_{X,Y} \big( x(u,v), y(u,v) \big) 
\left\|  
\begin{matrix} 
x_u & x_v \\ 
y_u & y_v 
\end{matrix} 
\right\|

3. 確率分布間の関係

4. 標本統計

標本統計量(平均・分散・普遍分散)


\text{I}: \quad \bar{X} \equiv \frac{1}{n} \sum_{i=1}^{n} X_i
\quad \quad
\text{II}: \quad S^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2
\quad \quad
\text{III}: \quad U^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2

検定統計量


\text{I}: \quad V_{n-1} = \frac{(n-1) U^2}{\sigma^2} \sim \chi^2(n-1)
\quad 
\text{II}: \quad \frac{\bar{X} - \mu}{U / \sqrt{n}} \sim \text{St}(n-1)
\quad 
\text{III}: \quad \frac{V_m / m}{V_n / n} \sim F(m,n)

チェビシェフの不等式


P(|X-\mu|\geq \varepsilon)\leq \frac{\text{Var}[X]}{\varepsilon^2}

中心極限定理


\textcolor{red}{\sqrt{n} (\bar{X} - \mu) \xrightarrow{d} \mathcal{N}(0, \sigma^2)}

5. 推定

十分統計量・フィッシャーの分解定理

f_n(x; \theta) = h(x) g(T(x); \theta)

対数尤度

\ell(\theta, x) = \log f_n(x; \theta) = \log \left[ \prod_{i=1}^{n} f(x_i; \theta) \right]

モーメント法

\mu_k = \mathbb{E} [X^k] = \frac{1}{n} \sum_{i=1}^{n} (X_i)^k

フィッシャー情報量

J_n(\theta) = \mathbb{E} \left[ \left\{ \frac{\partial}{\partial \theta} \log f_n(X; \theta) \right\}^2 \right]
= - \mathbb{E} \left[ \frac{\partial^2}{\partial \theta^2} \log f_n(X; \theta) \right]

クラメール・ラオの不等式

\text{Var}[\hat{\theta}] \geq J_n(\theta)^{-1}

A. 統計検定®︎1級とは

B. 本稿の目的

C. チートシート

Discussion