🐟

統計検定データサイエンス基礎の出題範囲と参考HP

2021/11/24に公開

引用元|統計検定 CBT「データサイエンス基礎」 出題範囲表

参考HPへのリンクは随時アップデート予定 (* は外部リンク)

データベース・データマネジメント

データベースマネジメント

ねらい) 分析目的に応じた構造化データの構築やデータ形式の変換、データ抽出等の簡単なデータの整理・整形ができる。

主な項目

  1. 構造化データ(レコード×フィールド, ケース×変数)*

  2. データの結合

  3. データ抽出(ランダムサンプリング, 無作為標本抽出)*

  4. 欠測値*

  5. データ形式(ロングフォーマット⇔ワイドフォーマット)*

  6. 乱数*

データマネジメント

ねらい) データの種類や尺度を理解し、層別、水準(レベル)化、変数変換等のデータ処理ができる。

主な項目

  1. 質的データ

  2. データの尺度

  3. 水準(レベル)化

  4. Z 変換(標準化)

  5. 量的データ

  6. 層別*

  7. 変数変換

  8. 偏差値*

主なExcel操作

  1. データのソート(並び替え)*

  2. RAND 関数*

  3. IF 関数*

  4. ピボットテーブル*

  5. データの分析四則演算*

データの可視化

データの可視化

ねらい) データを目的に応じて可視化するための統計グラフの作成と解釈ができる。

主な項目

  1. 円グラフ*

  2. 折れ線グラフ*

  3. ツリーマップ*

  4. ヒストグラム*

  5. 棒グラフ*

  6. 帯グラフ*

  7. パレート図*

  8. 箱ひげ図等*

主なExcel操作

  1. グラフの作成*

質的データの分析

1変量の質的データの分析

ねらい) 質的データを用いて、問題の可視化や現状分析のためのパレート分析(ABC 分析)ができる。

主な項目

  1. パレート表*

  2. 構成割合(確率)*

  3. パレート図*

  4. 累積度数(累積相対度数,累積確率)*

2変量以上 の質的データの分析

ねらい) 2つ以上の質的データを用いて、連関分析や要因探索のためのクロス集計表の分析ができる。

主な項目

  1. クロス集計表

  2. セル比率*

  3. 連関係数*

  4. 多重クロス表*

  5. 行(列)比率*

  6. 期待度数とカイ 2 乗統計量*

  7. 特化係数*

主なExcel操作

  1. SUM 関数*

  2. CHISQ.TEST 関数*

  3. ピボットテーブル*

量的データの分析

1変量の量的データの分析

ねらい) 量的データを用いて、問題の可視化や現状分析のためにデータの分布構造を分析できる。

主な項目

  1. 階級*

  2. 標準階級幅*

  3. ヒストグラム*

  4. 箱ひげ図*

  5. 管理図*

  6. 階級値*

  7. 度数分布表*

  8. 基本統計量(平均, 標準偏差, 分散, 四分位数, パーセント点)*

  9. 変動係数*

  10. 外れ値*

2変量以上の質的・量的データの分析

ねらい) 2つ以上の質的データや量的データを用いて、要因探索のための分布の比較や相関分析、単(重)回帰分析による予測モデル構築ができる。

主な項目

  1. 層別ヒストグラム*

  2. 相関*

  3. 散布図*

  4. 重回帰分析*

  5. 回帰係数*

  6. 残差*

  7. 並列箱ひげ図*

  8. 相関係数*

  9. 単回帰分析*

  10. 寄与率*

  11. 標準回帰係数*

主なExcel操作

  1. データの分析

  2. VAR 関数*

  3. CORREL 関数*

  4. AVERAGE 関数*

  5. STDEV 関数*

確率による意思決定

確率と確率分布

ねらい) 確率と確率分布による推測の考え方を理解し、シミュレーションを実行できる。

主な項目

  1. 場合の数*

  2. 条件付き確率*

  3. 尤度*

  4. 期待値*

  5. 正規分布*

  6. 確率*

  7. ベイズの定理*

  8. 事後確率*

  9. 2項分布*

  10. 確率的シミュレーション

推定

ねらい) 標本変動と誤差を理解し、母集団特性値の推定ができる。

主な項目

  1. 信頼区間*

  2. 標本誤差*

  3. 母平均*

  4. 信頼率(信頼度)

  5. 標準誤差*

  6. 母比率*

検定

ねらい) 仮説検定の考え方を理解し、文脈に応じた検定を行い、結果の適切な解釈ができる。

主な項目

  1. 帰無仮説*

  2. 有意水準(危険率)*

  3. 第一種の過誤

  4. 帰無仮説の棄却

  5. Z 検定*

  6. χ2 検定*

  7. 対立仮説*

  8. 有意確率(p 値)*

  9. 第二種の過誤*

  10. 2項検定

  11. t 検定*

  12. AB テスト*

主なExcel操作

  1. BINOM.DIST 関数*

  2. NORM.S.DIST 関数*

  3. Z.TEST 関数*

  4. CHI.DIST 関数*

  5. CONFIDENCE.NORM 関数*

  6. データの分析

  7. NORM.DIST 関数*

  8. NORM.INV 関数*

  9. T.TEST 関数*

  10. CHI.INV 関数*

  11. CONFIDENCE.T 関数*

  12. CHISQ.TEST 関数*

時系列データの分析

時系列データの分析

ねらい) 時系列データの構造を理解し、特徴を分析できる。

主な項目

  1. 指数*

  2. 伸び率*

  3. 平均成長率*

  4. 移動平均*

  5. 成長率*

  6. 季節調整*

主なExcel操作

  1. AVERAGE 関数*

テキストマイニング

テキストマイニング

ねらい) テキストマイニングの意味を知り、単語や品詞の出現頻度を分析できる。

  1. 参考*

その他参考HP

参考書籍

以上

Discussion