📚

DS検定落ちた

2023/06/25に公開

クソほど凹む

はじめに

この試験はデータサイエンティスト協会がデータサイエンティストに必要なスキルを定義した試験である。データサイエンス、データエンジニアリング、ビジネスの3つの領域から計90問が出題され、おおよそ80%以上の正答率で合格となる。

今回の結果

  • 正答率75%
    • データサイエンス 70%
    • データエンジニアリング 80%
    • ビジネス 75%

筆者のスキルセット

  • 業務:デスクトップアプリケーション作成、産業用Windows設計、テクニカルサポート等
  • OS:Windows
  • 言語:C++, Python
  • DB:Firebird, SQLite
  • データサイエンス・ビジネス領域はずぶの素人

今回の学習スケジュール

  • 2カ月前から準備開始
  • 2か月前~半月前:問題集(黒本)を中心にして、回答ミスの知識を重点的に補強
  • 1カ月前~直前:公式リファレンスブックを読学

不合格への考察

学習時間の不足

当初は11月の受験を予定していたが、黒本の進みが良かったため予定を前倒した。
この時点でも試験の様子見と思っていたのだが、次第に本気になってしまった。
業務に追われて平日の学習時間が確保できていなかった。

学習先の偏り

黒本ベースの学習に偏ってしまった。黒本での学習をベースに知識を補強したが、考えていたよりも実際の試験問題と傾向が異なる。
黒本の問いは、正しい手段や技法の「名称当て」クイズだが、試験問題は手段・技法に関しての正しい「解説」を選ばせるモノが中心になる。
公式リファレンスは1周読んだだけで、内容を反芻していなかった。

試験問題の得点域に関する考察

正答率~70%迄

  • 黒本の正答率9割以上で試験ではこのあたりの点数になる。
  • 黒本は試験問題の代替ではなく知識0ベースの読者を効率よく70%程度まで引き上げる用途で効果を発揮するが、それだけで合格ラインにまで持ち上がるのは困難
  • 実際に試験問題は黒本よりも1段階深い学習深度を要求される

正答率70%以上

  • 合格ライン(正答率80%)まで持ち上がるには、公式リファレンスの内容をかなり細かい範囲まで理解・記憶する必要がある
  • 70%以上の得点域になると学習時間と点数の上昇率の相関が下がってくるため、それなりの勉強量が必要になる
  • 理解することがそもそもの資格試験としての在り方だが、丸覚えしてしまう方が費用対効果が高いかもしれない

合格への勘所

公式リファレンスの読み込みが必須

  • 正答率80%以上を目指す場合、公式リファレンスの熟読が必須
  • 知識が0ベースの場合は、黒本で問題解きながら知識幅を広げると効率的

Discussion