統計検定1級受験体験記
1.はじめに
はじめまして、五合目です。この記事では、昨年11月の統計検定1級を受験するまでの勉強記録と、受験を終えて私が感じたことを書こうと思います。
簡単に統計検定1級の説明をすると、日本統計学会が認定している試験で、統計学の知識や考え方を正しく理解しているかを問う試験です。試験の形式は「統計数理」と「統計応用」の2つの試験に分かれており、いずれも記述式です。そして、その両方に合格して初めて「統計検定1級合格者」となります。
私の結果は、統計応用は合格だったものの統計数理は不合格だったため、1級としては不合格でした。ただ、不合格だった統計数理も、不合格者の中でも上位20%以内という惜しい結果でした(補足:統計検定1級では、不合格であっても、不合格者のうち上位何%の成績だったかを通知してくれます)。この結果に非常に悔しい思いをしたので、試験日からかなり時間が経過しましたが、この悔しさを忘れないように受験体験記を残すことにしました。
不合格者の体験記ですが、これから受験を考えている方や、同じく不合格とだったものの再挑戦を考えている方などの参考になれば幸いです。
1-1.自己紹介
筆者の略歴は以下の通りです。
略歴
・最終学歴:理学修士(理論物理)
・メーカーの技術職として約10年勤務
普段はメーカーで技術職として働いています。学生の頃は理論物理系の研究室に所属していたため、数学が得意というほどではないものの、数式アレルギーはありません。ただ、社会人になってからは数式を扱う機会がほとんどなかったため、勘は相当鈍っていました。
統計学の事前知識
・入社1~2年目にQC検定2級受験のために少し勉強
・以降、約10年間、特に統計学に触れることなく過ごす
・近年のデータサイエンスの高まりを受け、コロナ禍を機に統計学の勉強を再開
・2023年夏頃、2級受験 → 合格
・2024年春頃、準1級受験 → 合格(成績優秀賞)
1級受験前に、2級と準1級も受験しています。準1級は運よく成績優秀賞を取ることができ、そこまでの知識があった状態から1級受験を目指しました。
環境
妻と幼い子供の3人暮らしの家庭環境のため、仕事・家事・育児に奔走する生活を送っています。そのため、勉強時間は週に10時間程度しか確保できませんでした。私のようになかなか自分の時間を確保できない方の参考やモチベーションになればという思いでも、この記事を書いています。
受験理由
統計学を本格的に勉強しようとしたきっかけは、コロナ禍で在宅が強いられたときに、どこでも通用するようなスキルを持っていないことに気づいたためです。統計学でなくても良かったのですが、統計学であれば今の仕事でも活用できる場面がありそうだったことと、データサイエンスの製造業への応用の話も耳に入ってきていたので、これから先も必要になるスキルだと考え、統計学を勉強することにしました。
せっかくなので、試験も受けてみようと思い、2級から受験していきました。本当は準1級を取得できたところで統計学の勉強は一区切りにしようと思っていましたが、準1級の勉強を通じて統計学にすっかりハマってしまい、「どうせなら1級を目指そう!」と思い至りました。
2.試験対策
本格的に1級の勉強に取り組み始めたのは、2024年6月ごろからでした。ここでは、その試験対策について述べます。
なお、1級は数理と応用に分かれていますが、応用の方はさらに4つの分野に分かれており、受験申込時にその中から1つを選択する必要があります。私は理工学分野を選択しました。
2-1.取り組んだ書籍
まずは、公式の問題集です。
・統計検定1級公式問題集
こちらは「問題集」とありますが、過去問が収録されています。コロナで未開催だった2020年を省き、2019年から2022年の3年分の過去問が収録されています。私は、統計数理と統計応用の理工学分野、両方の過去問を3年分全て解きました。
統計数理対策の書籍としては、以下の2冊に取り組みました。
・数理統計学の基礎(久保川先生著・以下、久保川本)
・現代数理統計学(竹村先生著・以下、竹村本)
この2冊は1級対策の書籍としてはとても有名なものです。演習問題も豊富ですので、問題に慣れるためにどちらか1冊は購入しておくべきだと思います。内容的には、久保川本は定理とその証明が中心で、竹村本はそれに加えて各定理の重要性や実際の応用面についても触れられていることが多いと感じました。そのため、1級受験とは無関係に、統計学をより深く知りたい人には竹村本を強くお勧めします。
統計応用(理工学)の対策としては、例年出題される実験計画法の対策に以下2つの書籍で勉強をしました。
・品質管理のための実験計画法テキスト
・実験計画法 ー方法偏ー
実験計画法だけで良いのか?という疑問を持った方もいると思いますが、過去に合格された方のブログや過去問を見る限り、実験計画法以外の問題は統計数理の対策を十分行い、計算力を高めておけば合格点までは届くだろうと考えていました。そのため、理工学の対策は実験計画法だけに絞りました。あとは、実を言うと、統計数理と実験計画法以外の対策に時間を割けられなかったことや、実験計画法を極めたいという思いが1級受験の決め手となったことも理由です。
2-2.戦略
最初に、2022年の過去問を解いてみました。解いてみた感触として、どちらかと言えば、知識よりは計算力が必要な試験だと感じました。また、ネットで公開されている合格者のブログなどでは、数理の対策は久保川本の問題を何周も解いていた、という内容が多いのですが、私の実感としては、久保川本も竹村本も1級よりも難しすぎる問題が多かったです。そのため、演習問題は全てを解くのではなく、試験と同レベルの問題に絞ることにしました。
また、準1級の受験時には、公式の参考書「統計学実践ワークブック」の行間埋めをひたすら行っていましたが、この勉強方法はさすがに効率が悪いなと感じていました。時間が限られているため、1級受験では参考書を読み込むよりも問題を解くことに重点を置く方針としました。ただし、問題演習だけでは知識に漏れが生じるため、問題を解く中で知識不足を感じた場合は、適宜、本文の方の証明を追ったり、内容をノートにまとめるなどしました。
応用の対策は、過去問を1年分解いた感触と、実務で実験計画法を使っていた経験もあり、「数理よりは何とかなるだろう」と考え、実験計画法のテキストの問題を数問解くことと過去問を解くだけに留めました。その結果、応用では合格しましたが、試験当日は後悔することになりました…。
2-3.自主模試
「自主模試」と称し、試験の2週間前に2023年の数理と理工学の問題を試験と同じ形式で解いてみました。これまで過去問を解いていた感触としては、時間をかければ7~8割くらいはとれそう、でも時間内に解くのは厳しい、と感じていたので、90分で3問解けるかを試してみることにしました。また、合格するには5問の中から解けそうな問題3問を選択できるかも重要だと思っていたので、その練習も兼ねて本番と同じ形式で解きました。
結果は、数理、応用ともに時間が全く足らず、どちらも5割くらいの正答率でした…。ただし、この自主模試をやったことで、どれくらいのスピードで問題を解かなければならないかを掴むことができたことと、計算力が不足していることがわかったことは大きな収穫でした。
3.試験当日
3-1.午前:統計数理
最初に問題の選択です。ざっと5問を見渡し、問1はフィッシャー情報量の式の記憶が怪しかったので一旦、保留。問2は個人的に得意としていた変数変換の問題なので、これは解くことに決めました。問3も、前半は直ぐ解けそうで、後半もMSEをバイアス・バリアンス分解すれば良いと判断し、これも解くことにしました。残り、問4と問5どちらにするかですが、問4は経験分布が怪しかったことと、問5は順序統計量の問題でそこまで苦手意識は無かったのですが、ちょっと難しそうだと感じたので、一旦、保留にして問2、問3を解き進めることにしました。
問2は、最初に問題文の記号に落とし穴があり、「んっ?」と一瞬、手が止まってしまいました。過去問を解いた限り、1級ではこういう引っ掛け問題はほとんどなかったので、意図的では無かったと思いますが、他の記号ではいけなかったのかと疑問に感じました。とはいえ、大きな問題では無いので解き進めていきました。完答できそうかと思っていましたが、最後の〔5〕で求める分散がなぜか負になってしまい、計算ミスしているところを見直そうとしたところで30分経過していたので、一旦、問3を解くことにしました。
問3の前半は、ベルヌーイ分布に対する問題でした。ここまではすんなり解くことが出来ました。しかし、〔3〕で完全に手が止まってしまいました。最初の方針のバイアス・バリアンス分解をした後、そのあとどうするかが全く思いつきませんでした。後日、解きなおしてみると、計算量は多いものの丁寧に計算を進めて行けば解ける問題でした。しかし、当日は、「何かの公式や定理で簡単に解けるのでは?」という考えに陥ってしまい、計算を進めることが出来ませんでした。後で何度も解きなおそうとしましたが、結局、部分点すら取れない解答となり、この問3で大きく点を落としてしまいました。
問3の〔3〕で詰まってしまったところで、3問目を解くことにしました。改めて問題を見直し、経験分布が怪しかったものの、後半もそこまで難しそうではないと感じたため、問4を解くことに決めました。前半は経験分布のグラフを描く問題で、自身があったわけではありませんがグラフを描いて次の〔3〕へ進みました。〔3〕は久保川本で解いたことのある問題だったのですが、証明の仕方を完全に忘れてしまい解くことが出来ず…。後半は、計算の見通しがついたため、最後まで解き切ることは出来ました。が、計算ミスがあり、後日、公表された答えとは合っていませんでした…。問4は見たことある問題を解けなかったり、計算ミスもしていたので、ここでもう少し点数を稼げていれば、数理も合格だったかもしれません…。
試験後の感触としては、問3は半分しか解けなかったものの、問2はほぼ完答、問4は経験分布が合っていれば8割くらいという印象だったため、当落線上かなぁと思っていました。もう少し出来た部分もあったと思いますが、私自身としては、自分の実力を出し切れたと思っていたので、気持ちの切り替えは出来ていました。
参考のために、自己採点の結果を載せておきます。
問2 〔1〕〇 〔2〕〇 〔3〕〇 〔4〕〇 〔5〕△
問3 〔1〕〇 〔2〕〇 〔3〕× 〔4〕×
問4 〔1〕〇 〔2〕〇 〔3〕× 〔4〕△ 〔5〕×
先に述べた通り、結果は不合格の上位20%の成績でした。
3-2.昼休憩
昼休憩を1時間半挟んで、午後に応用の試験が開始になります。余談かもしれませんが、参考になる方もいるかもしれないので、少し情報を共有します。
私の受験会場であった統計数理研究では、昼食を持ち込んで食べられるエリアが確保されており、10数名くらいがそこでお昼を食べていました。私はてっきり会場とは別の場所で各自食べて戻ってくるのだと思い込んでおり、昼食を予め持ち込んではいませんでした。会場の周りには飲食店は見当たらなかったので、私は近くのコンビニ、と言っても徒歩で10分程度かかりましたが、そこで食べ物を買って食べていました。私は会場から一度出た方が気持ちがリフレッシュするので、会場で食べられたことを知っていたとしても同じことをしていたと思います。しかし、昼休憩はあまり動き回りたくないという人は会場に持ち込んでおくことをおすすめします。
3-3.午後:統計応用〔理工学〕
本題の試験の続きです。理工学の問1は実験計画法でした。実験計画法は必ず選択すると決めていたので、迷わず問1を選択しました。すんなり解き切りたかったのですが、途中、「あれ?これで良かったっけ?」と答案を書いては消しを繰り返したり、平方和の分解は全く手が進い、最後の分散分析は何を血迷ったのか、最初に書いた正答を消して間違った答えを書くなど、散々な結果でした…。得点源としたかった実験計画法でこの始末だったので、とても焦りました。
ただ、焦ってもしょうがないと自分に言い聞かせて、気持ちを落ち着かせるためにも他の問題を解くことにしました。ざっと見渡したところ、どれも難易度としては変わらない印象だったので、ある程度、知っている分野に絞り、問2と問5を解くことに決め、先に問2に取り掛かりました。
問2は最後の問題を省き、そこまで難しい問題ではありませんでした。ただ、尤度を求める問題で答えがかなり長い式になってしまい、自分が書いた解答に自信が持てない状態でした。さらに、最後はヘッセ行列(2階導関数の行列)の計算を求められたため、時間内に計算は無理だと即断し、あまり手ごたえを感じずに問5へ移りました。
問5は全分野共通の問題で、過去問を解いていた限りでは、個人的に解きやすいイメージがありました。最初も簡単な計算で答えられたので、問1、2を落としたとしても、ここで踏ん張りたいと思っていました。しかし、ひねりもなく計算を進めただけで答えが得られてしまい、逆に「何か見落としてないか?」、「計算ミスしていないか?」と不安に駆られてしまいました。結果としては、ほぼ正答出来たのですが、当日は全く手応え無く解いていました。
実験計画法で躓いてしまったことと、全ての問題にあまり自信を持てずに解答していたため、試験直後は合格は無理だと感じていました。さらに、1級では試験翌日に正答が公表されるのですが、問2のあの長い尤度の式が見当たらず、これはもう「100%落ちた」と思っていました。ただ、それでも合格だったのは、問2では、私は与えられたデータの数値を具体的に代入した式を書いていましたが、公表された解答例では記号に置き換えた書き方がされていました。そのため、数値を代入した場合でも正答とされたためだと思います。
こちらも、参考のために自己採点の結果を載せます。
問1 〔1〕〇 〔2〕〇 〔3〕△ 〔4〕× 〔5〕×
問2 〔1-1〕〇 〔1-2〕〇 〔1-3〕〇 〔2-1〕〇 〔2-2〕×
問5 〔1〕〇 〔2〕〇 〔3〕△ 〔4〕〇 〔5〕×
4.試験を終えて
4-1.反省点
もう少しで合格という結果だったわけですが、以下の点を改善すれば合格できたかもしれません。
勉強開始時期
普段、勉強時間を多く確保できない状況なのだから、もっと早く本格的な勉強を開始するべきでした。準1級受験は2024年の3月だったため、そこから1級のための勉強を継続しておかなければならなかったと思います。週10時間、ひと月4週間とすると、4月から開始したとしても11月の試験まで約300時間しか勉強時間がありません。正確な時間は解りませんが、6月から勉強を開始したため、恐らく200時間強の勉強時間しか無かったと思います。試験の難易度と自分の実力を考えると、もっと早く1級の対策に取り掛かる必要がありました。
計算力への傾倒
計算力を重視しすぎていた部分もあったと思います。私は、大学受験の頃から公式を丸暗記せず、その場で導出するタイプでした。ただ、公式などは暗記していた方が早く解答できるので、時間との戦いとなるこの試験では、暗記できるものは暗記しておくべきでした。計算量が多い試験であるため、時間が足りない原因が自分の計算力にあると思い込んでしまった部分があった気がします。
受験するタイミング
学生や20代の社会人の方は、興味があれば思い立ったその年に受験するべきです。理由は、かなり数学力が求められる試験であり、社会人を続けていると学生の頃より確実にこの能力は落ちます。私自身、もともと理論物理系の出身ではあったので、数式アレルギーは無いと自負していたのですが、いざ勉強を始めてみると高校レベルの数学ですら怪しくなっていました。社会人として仕事をしていると、学生の頃よりも数式に触れる頻度が激減する人がほとんどだと思います。加齢による衰えもありますが、これだけ数式に触れる機会が少なくなると、勘を取り戻すまでも時間がかかります。若い人は、少しでも興味があればすぐに受験することをおすすめします。難しいから受験は数年後に、と言っていると、後で後悔するかもしれません。
4-2.有効だった勉強方法
不合格だった私が言うのも説得力はありませんが、個人的に効果があったと思うことを紹介します。
各種確率分布に関する復習
試験1週間前から、各種確率分布の期待値・分散、母関数に尤度など、諸性質の導出や、確率分布間の関係性を一通り復習しました。私が受験した2024年の試験では、尤度を求める問題も多かったということもありますが、過去問でも、確率分布の諸性質は「出来て当たり前」という出題者の意図を感じる問題が多いです。基本的なことではありますが、だからこそ取りこぼししないように準備しておくことは必要だと思います。
自主模試の実施
問題を解くスピードが重要だという認識を持てたことと、事前に時間配分の戦略を考えられたことは良かったと思います。大問3つを90分で解く試験と聞くと、1問当たり30分で解こうと考えるのが普通です。ですが、合格ラインは6割くらいと聞いていたので、1問は完答できなくても良いと考えて、35分・35分・20分という時間配分にしても良いわけです。実際にこの戦略を採るかどうかに関わらず、このような考え方を持っておいたことで、当日は心理的に余裕を持てました。
5.受験を考えている方へ
2級、準1級も受験してきた身として思うのは、1級の内容は完全に「数学」です。実務で直接役立つような手法や知識は、準1級までの範囲で十分だと思います。ただ、それでも難易度の高い1級に挑戦することには多くの意義があります。具体的には、
- 統計学の理論の理解が深まる
- より正しく統計学を使えるようになる
- データサイエンスに関する技術書や論文を理解しやすくなる
といったメリットがあります。
統計学をはじめとしたデータサイエンスの知識や能力は、今後も重要性が増していくと思います。たとえ合格できなかったとしても、深い理解を求められる試験であるので、受験勉強の過程で非常に多くのことを学べるはずです。私自身も1級の勉強を通じて、これまでの統計学の使い方が間違っていたことに気づいたり、データの見方が変わってきていることを実感しています。その意味でも、受験したことに大きな意味があったと思います。
受験をためらっている方、ぜひ今年は受験してみましょう。私も再挑戦します。視野が広がり、新たな発見があると思います。
Discussion