統計検定準1級に受かるための勉強法・参考サイト
変更履歴
2022/02/15 初稿
2022/02/15 細かな修正
2022/04/20 一部リンク先の動画について注釈を追加
この度、無事に統計検定準1級に合格したので勉強法、参考にしたサイトなどを共有しようと思います。
バックグラウンド
- 非理数∧非情報系大学生
→高校数学は数学Ⅲまでできる。いわゆる大学数学は教養で軽く学んだ程度(偏微分、固有値ベクトルを求めるくらいはできる)。 - 機械学習に関しての予備知識は少しある。
-
統計WEB-BellCurveで2級範囲の内容は履修済みで2級に受かりそうな知識はあった。(自称)
→過去問解いて合格できそうになったし今週末で2級申し込みするで~
→直前過ぎて無理ですと断られる
→大学の試験期間に入る
→気がつけば受けずじまい - 件のワークブックが出版され、これがあるなら準1級いけるやろと思い初版で購入するも挫折
といったところです。
2021年12月の中頃くらいから何故かやる気が再燃し勉強を再始動させました。
試験について
2021の6月を最後にPBT試験が終了し、以降は完全にCBTに移行となりました。(ダジャレではありません)
私はCBT形式で2022年2月に受験しました。
私が解いた問題セットでは問題構成は90分で21問、各問につき小問1問 or 一部の問で小問2問構成といった構成で、トータルでは25小問ほどといった感じでした。
PBTからCBTに変わってハードルが下がったと言う人が居ますが、そんなことはありません。個人的にはむしろPBTの択一問題or部分記述問題よりは難易度が上がっています。 部分点がないという意味ではある意味で論述問題よりもキツい問題もあります。
また出題もPBTの問題とは毛色がだいぶ違い、過去問・ワークブックの問題の解き方を暗記しているだけではまず太刀打ちできないといっていいと思います。個人的には1級に近づいた出題のような気がします。
また出題範囲についても「ワークブックのこの内容は出題されたことないし、出ないだろう」と思っているものでも出題されます。過去問で一回でも出た内容は必ず出ますし、一回も出ていなくてもワークブックに記述があれば出題される可能性があります。 なんなら記載がないのに出題されてるものもあるんだよなぁ...。
私自身、ワークブックや過去問の問題は例題を含め、すべて解けるようにして、その他に出そうだなと思った部分は学習した上で「9割取ったるで~」と意気込んで試験に臨んでも、試験本番では一周目で半分弱しか回答を埋められないほどの難易度の問題だらけだったので、ワークブックの内容は例題・演習問題となっている部分を血肉とするのはもちろん、演習問題となっている部分以外も読み込まないといけないなと感じました。
勉強方法
大前提として、2級の知識は完璧にしましょう
→統計検定2級の全知識 - とけたろうチャンネル
この動画で「あれ?わからん...。」となったところはすぐに復習しましょう。
ここまでできた方はやっと準1級の勉強に取りかかれます。
まず、統計学実践ワークブックは絶対買いましょう。
どんだけ内容がわかりにくいと言われていてもこれがバイブルです。地図です。方位磁石です。
なんだかんだ似ている問題も出題されます。
また、2021年末くらいに準1級 公式問題集も出版されているので、これも購入しましょう。
演習問題を手に入れるという意味でも過去問は大事です。ただ解説が親切ではないので、問題がすでに手に入っている方は買う必要はないです。
僕が購入した本は以上です。
ワークブックでわからないところは積極的にネットで検索しました。
CBTを経験した身からすると、理想を言えば書籍などはガンガン買って読み、しっかりと行間を補えるようにしたほうが理想かなとは思います。
とは言ったものの、そんなの生存者バイアスじゃないかと言われるのもアレなので、自分の勉強法を赤裸々に綴ります。
ワークブックはこのサイズの本にするために行間がだいぶ省略されている印象ですので、2級がやっと合格できるようになったくらいの人が読むのはとても骨が折れます。
ただ、じっくり数式や書いている文章を読み込んでいくと、意外と分かる人が読んだら分かるようになっているんだろうなと感じました。復習するときになるとむしろこれくらい削ぎ落とされている方が復習しやすいのではないかとすら感じます。
それでもわからない部分は気が狂ったようにネットで検索し、出てきたサイトをかたっぱしから読みました。参考にしたサイトは以下に列挙させていただきます。
数学関係の文献にだいたい言えることなのだと思いますが、文献によって、定義されている文字が違うので、ネットで検索したり、別の本で調べたりしてみても、ワークブックと定義されている文字が異なっていたりします。こういうところも理解しにくい原因の1つかなと感じます。
個人的にはワークブックがバイブルなので、ワークブックに対応させてひとつひとつ置き換えて噛み砕いていきました。
それらを何回読んでもワークブックの記述が理解できないときが往々にしてあります。
そんなときは、まず演習問題の解答を丸写ししてみて、具体的にどのように使われているかを頭に軽く入れてもう一度ワークブックの記述を読む と視界がひらける場合があります。
抽象的な記述も、具体化してみてみると案外そんな難しいことは言っていないということがあるので、わからなくなったらとりあえず問題に手を出すのも1つの手です。
また、1周目でわからない部分も2周目で理解できることが多々あります。何回読んでも解いてもわからないときは、諦めて一旦飛ばすのも手かなと思います。
上記をすべてやった上で「もうなーにをやってもあかんわ」となったものは潔くあきらめて、捨てるか丸暗記してしましょう。
自分はそうなったものや忘れやすそうな知識、解けなかった問題を全部まとめてankiにつっこんで覚えたり復習したりして記憶へ無理やり定着させました。
時系列で言うと
-
2ヶ月前~2週間前
公式ワークブック1-2周目&過去問1周目
ひたすら通読、(自分が理解できる)模範解答作り -
2週間前~本番
ひたすら演習、知識漏れの確認
最終的に勉強量としては
- 公式ワークブック 3-5周
- 過去問 3周(自分が理解できるように解答を補う→何も見ず解く→時間を計って解く)
くらいでしょうか。
1周目でめーちゃくちゃ時間がかかりましたが、しっかり向き合った分だけ2周目以降は高速化しますので、ご安心ください。
参考にしたサイト・動画
ここからはひたすら自分の参考にした動画やサイトを列挙します。
何もリンクが無いところは2級の知識だったり、ワークブックで理解できたところです。
わからないところがあればご自身で追加で調べてみましょう。
1 事象と確率
【大学数学】ベイズの定理【確率統計】 - 予備校のノリで学ぶ「大学の数学・物理」
4:00-, 13:00-の内容が特に重要です。
2 確率分布と母関数
生存関数 - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
生存時間解析〜生存関数とハザード関数とその関係〜 - AVILEN AI Trend
同時分布、周辺分布、条件付き分布の意味と例 - 具体例で学ぶ数学
3分でまとめる確率母関数【統計検定1級®①】【確率母関数②】 - はじめての統計学
6分でまとめる確率母関数と積率母関数の違い【統計検定1級】【モーメント母関数⓪】 - はじめての統計学
3 分布の特性値
条件付き期待値,分散の意味と有名公式 - 高校数学の美しい物語
2変量正規分布 - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
4 変数変換
「確率分布」の「変数変換」の仕組みの理解とその応用|問題演習で理解する統計学【15】 - あつまれ統計の森
データの変換は「何が嬉しいのか」と「変換の前後をヒストグラムで確認」が重要です。
数値データの取り扱い - Practical Data Science with R and Python
5 離散型分布
6 連続型分布と標本分布
積率母関数を用いた正規分布の平均・分散の導出 - AVILEN AI Trend
非心分布は諦めました。
7 極限定理,漸近理論
確率変数の収束についてまとめる - かりばぁ (id:kriver2135)
【確率統計】中心極限定理の気持ち【特別講義】 - 予備校のノリで学ぶ「大学の数学・物理」
テイラー展開と絡めて理解しましょう。
8 統計的推定の基礎
【ベイズ統計その②】この推定、もっとももっともらしいってよ…!【最尤推定のお話だよ! - AIcia Solid Project
モーメント法について解説【例題として正規分布を解説! - はじめての統計学
有効推定量とは?わかりやすく解説 - AVILEN AI Trend
Fisher情報量(Fisher情報行列) - マサムネの部屋
自然科学の統計学4章 最尤法 を読んだ その3 - かりばぁ (id:kriver2135)
自然科学の統計学4章 最尤法 を読んだ その4 - かりばぁ (id:kriver2135)
自然科学の統計学4章 最尤法 を読んだ その5 - かりばぁ (id:kriver2135)
自然科学の統計学4章 最尤法 を読んだ その6 - かりばぁ (id:kriver2135)
数式が苦手な方は気持ちの部分を理解するように読むとよいです。
フィッシャーネイマンの分解定理をポイントに分けて解説!【統計検定1級】 - はじめての統計学
漸近分散 漸近正規性 漸近有効性 - はじめての統計学
証明問題はCBTでは出題されにくいとは思いますが、理解のためにも知っておいて損はありません。
9 区間推定
10 検定の基礎と検定法の導出
こんなくだらない覚え方を発見したりしてました。
11 正規分布に関する検定
12 一般の分布に関する検定法
尤度比検定の自由度 - はじめての統計学
尤度比検定大事だと思うんですけどあんまり過去問ないですよね。
13 ノンパラメトリック法
14 マルコフ連鎖
大学受験時代の確率漸化式を思い出しました。
マルコフ連鎖・確率推移行列・定常分布 - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
マルコフ連鎖の基本とコルモゴロフ方程式 - 高校数学の美しい物語
15 確率過程の基礎
16 重回帰分析
まずは単回帰から理解することをおすすめします。
計算量の話は統計検定には関係ないので飛ばしてもらって大丈夫です。
【初学者向け】正則化とは【L1正則化 / L2正則化】 - NULL_blog
【初学者向け】L2正則化をわかりやすく解説【リッジ回帰】 - NULL_blog
【初学者向け】L1正則化をわかりやすく解説【なぜスパースか】 - NULL_blog
こんなくだらない覚え方を発見したりしてました。
正規化あたりの話はベイズ推論を学んでいくと伏線回収されて脳汁がドバドバ出るので興味あればぜひ。
17 回帰診断法
18 質的回帰
19 回帰分析その他
20 分散分析と実験計画法
直交表って何?【分散分析と組み合わせて素早く結果を得よう!】 - SiGmA EyE
直交表で交互作用を解明しよう!【割付方の注意点】 - SiGmA EyE
直交表L8(2^7)は空で書けるようにしました。
No[1], [2], [4]列を覚えればあとの列はノリで導けます。
21 標本調査法
22 主成分分析
主成分分析 ※簡単な考え方の流れ - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
【相関で情報を圧縮】主成分分析の気持ちを理解する【いろんな分析 vol. 2 】 - AIcia Solid Project
主成分分析とは何なのか、とにかく全力でわかりやすく解説する - CORE CONCEPT
23 判別分析
判別分析 - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
判別分析・数量化Ⅱ類 ~簡単な解法の流れ~ - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
24 クラスター分析
クラスター分析とは?その手法と応用例を図解! - GMO research
階層的クラスター分析(最近隣法・最遠隣法・デンドログラム) - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
クラスター分析の手法③(非階層クラスター分析) - ALBERT
25 因子分析・グラフィカル モデル
因子分析その1 - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
因子分析その2 - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
因子分析その2 ~計算編~ - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
因子分析その3(共通性・独自性・寄与率) - Yuya.K_ASN
↑現在はフルバージョンがudemyの講座に移動されたようです。
【相関から構造を推定】因子分析の気持ちを理解する【いろんな分析 vol. 1 】 - AIcia Solid Project
【もう二度と迷わない】因子分析と主成分分析は何が違うの?【いろんな分析 vol. 3 】 - AIcia Solid Project
【偽物の相関を見極めろ!】グラフィカルモデリングで変数の相関関係を把握する【いろんな分析 vol. 4 】 - AIcia Solid Project
【因果を利用した分析】ベイジアンネットワークで見る変数の因果関係【いろんな分析 vol. 5 】 - AIcia Solid Project
【潜在変数の関係を探る】構造方程式モデリング - 実応用の豊富な基礎分析なのです【いろんな分析 vol. 6 】 - AIcia Solid Project
【雰囲気をつかむ】階層ベイズモデリング - 構造を仮定して本質を推定する【いろんな分析 vol. 7 】 - AIcia Solid Project
6. マルコフグラフ - 電気通信大学大学院 情報理工学研究科 植野 真臣
26 その他の多変量解析手法
ラグランジュの未定乗数法】あの計算の意味、説明できますか?【幾何的イメージも解説】 - AIcia Solid Project
【数量化理論】数量化I類とその数式 - カテゴリ変数を反応に合わせて数値化する【いろんな分析 vol. 8 】 - AIcia Solid Project
【数量化理論】数量化II類とその数式 - 判別分析を利用してカテゴリ変数をベクトル化する技術【いろんな分析 vol. 9 】 - AIcia Solid Project
【数量化理論】数量化III類とその数式 - 反応データからカテゴリ変数をベクトル化する技術【いろんな分析 vol. 10 】 - AIcia Solid Project
【数量化理論】数量化IV類とその数式 - 類似度データからベクトルデータを復元する技術【いろんな分析 vol. 11 】 - AIcia Solid Project
27 時系列解析
【Part2】統計検定準1級 時系列解析のまとめ【自己相関係数・定常性】 - Syleir’s note
【Part3】統計検定準1級 時系列解析のまとめ【統計モデリング・ホワイトノイズ】 - Syleir’s note
【時系列分析入門コース】まずは基礎をガッチリ固めてスタートダッシュ - へちやぼらけ・データサイエンティスト
AR過程やMA過程は落ち着いてワークブックの導出を追っていきましょう。
AR(1)過程の(27.4)→(27.5)は高校数学の特性方程式を思い出すと幸せになれます。
スペクトラムの話はフーリエ解析を理解していない自分には辛かったので、グラフがΦの値でどう挙動が変わるかだけ覚えました。
【統計検定準1級】時系列解析(3)系列相関 - Goodな生活
28 分割表
29 不完全データの統計処理
【数分解説】混合ガウス分布: 複数のガウス分布の足し合わせで確率分布を表現したい【Gaussian Mixture Model : GMM】 - ThothChildren 理系技術学術解説動画
30 モデル選択
AICとBIC?情報量基準とは? - Miidas Research
交差検証(クロスバリデーション)とは?合わせてグリッドサーチに関しても学ぼう! - AI Academy Media
31 ベイズ法
ベータ分布の事後分布の平均と分散【ベイズ】 - AVILEN AI Trend
正規分布の事後分布の平均と分散【ベイズ】 - AVILEN AI Trend
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法 - Ken'ichi Matsui
ギブスサンプリング:やってることのイメージ - nykergoto’s blog
MCMC入門 Gibbs Sampling - Miidas Research
32 シミュレーション
逆関数法を用いた乱数生成の証明と例 - 高校数学の美しい物語
統計的データ解析 2014 - 林田清
(7,8スライド目)
最後に
まずはリンク先の方々に最大限の感謝を申し上げます。
この方々のおかげで合格できたと言っても過言ではないです。
たくさん列挙しましたが、おそらくこれ以上に調べて試行錯誤することで理解できた内容も多かったと思うので、ご自身でも書籍を読んだりネットで調べたりすると良いと思います。
準1級と2級は大きな難易度に大きな乖離がありますが、それだけに合格できたときの達成感は大きいです。
この記事が1人でも多くの方の合格に手助けできたのなら幸いです。
Discussion
統計検定勉強中の者です、事細かに記載いただきとても参考になりました。ありがとうございます。