🦕

統計検定データサイエンスエキスパートの出題範囲と参考HP

2021/11/25に公開

引用元|統計検定 CBT「データサイエンスエキスパート」 出題範囲表

下記に加えて、統計検定2級3級4級データサイエンス基礎データサイエンス発展の範囲表の項目についても出題される。

統計基礎

確率と確率分布

確率分布、確率変数

  1. チェビシェフの不等式*

  2. 尖度*

  3. 積率母関数

  4. 積率

  5. 歪度*

主要な確率分布

  1. 対数正規分布

  2. ベータ分布

  3. 負の二項分布*

  4. ガンマ分布

  5. 超幾何分布*

確率変数の漸近的性質

  1. 大数の法則

  2. 確率収束

  3. 中心極限定理

  4. 分布収束

推測統計

標本分布

  1. カイ二乗分布*

  2. t 分布*

  3. 標本平均と標本分散の独立性

  4. F 分布

点推定、区間推定

  1. 一致性*

  2. 信頼区間と信頼係数*

  3. 有効性

汎用的な検定

  1. 尤度比検定

  2. ウィルコクソン検定

  3. ノンパラメトリック検定

  4. 並べ替え検定

種々の検定

  1. 一元配置分散分析*

  2. 交互作用

  3. 二元配置分散分析

  4. 適合度検定*

多重比較

  1. ボンフェロニ補正

ベイズ理論

事前分布・事後分布

  1. 事前分布

  2. 事後分布

  3. 共役事前分布

ベイズ的仮説検定

  1. ベイズファクター

  2. ベイズ判別(各カテゴリーの事後確率)

計算統計

ブートストラップ

  1. 復元抽出

  2. リサンプリング

  3. 経験分布

サンプリング

  1. 疑似乱数

  2. 棄却法

  3. 逆変換法

  4. マルコフ連鎖モンテカルロ法

モンテカルロ積分

  1. モンテカルロ積分

  2. 期待値や確率密度の正規化定数

数学基礎

線形代数

行列

  1. 三角行列

  2. 行列とその逆行列の積の可換性

  3. ランク

  4. トレース

  5. 直交行列

  6. 基本変形

  7. 簡約な行列

データ記述と線形代数

  1. all-ones ベクトル

  2. 2つの偏差ベクトルの内積

  3. 回帰分析における予測値ベクトルと残差ベクトル

  4. 偏差ベクトル

  5. 射影行列

固有値と固有ベクトル

  1. 対称行列の固有値

  2. 対称行列の対角化

  3. 二次形式と(半)正定値行列

  4. 固有ベクトル

  5. スペクトル分解

  6. 特異値分解

n 次元ユークリッド空間

  1. n 次元空間上の点の表現

  2. 行列のランクとその列空間の次元

  3. 係数行列

  4. 解の一意性

  5. シュミットの直交化

  6. 線形部分空間と基底・次元

  7. 同次方程式

  8. 解空間

  9. 正規直交基底

  10. 射影と直交成分

数値計算と線形代数

  1. LU 分解

  2. 反復法

  3. QR 分解

微積分

1 変数関数の微分法

  1. 極大・極小と導関数

  2. 方程式の数値的解法

  3. 二分法

  4. テイラー展開

  5. 反復法

  6. ニュートン法

1 変数関数の積分法

  1. 広義積分

  2. ベータ関数

  3. ガンマ関数

多変数関数の微分法

  1. 勾配

  2. ヘッセ行列

  3. ニュートン法

  4. 連鎖律(多変数関数の合成関数の微分)

  5. 極値と偏導関数の関係

  6. テイラー展開

  7. ヤコビ行列

多変数関数の積分法

  1. 重積分

  2. 累次積分

  3. 変数変換とヤコビアン

  4. ガウス積分

  5. 正規分布の極座標変換による求積

  6. 重積分(長方形領域)

  7. 一般の領域での重積分(縦線領域, 横線領域の重積分)

  8. 広義重積分

  9. 極座標変換

数値積分

  1. 台形則

  2. シンプソン法

最適化

連続最適化

  1. 最急降下法

  2. ラグランジュ乗数法

  3. 凸関数(定義, ヘッセ行列の(半)正定値性との関係)

  4. 線形計画法

  5. ニュートン法

  6. 条件付き極値問題

  7. 最適性条件

離散最適化

  1. 組み合わせ最適化

  2. ナップサック問題

  3. ネットワーク最適化

  4. 巡回セールスマン問題

計算基礎

データ収集

デジタルデータ収集

  1. エッジデバイス

  2. Web クローラー

  3. クライアント技術(SDK, API など)

  4. クラウドコンピューティングの利用

  5. センサーデータ

  6. スクレイピング

  7. 通信技術(HTTP, FTP, SSH など)

  8. 地理情報システム(GIS)

データ表現とデータ構造

データ表現

  1. 画像の符号化

  2. 色の 3 要素(RGB)

  3. 周波数

  4. 量子化

  5. 画素(ピクセル)

  6. 音声の符号化

  7. 標本化

データ構造

  1. グラフ

  2. 木構造

  3. ヒープ

  4. ネットワーク

  5. 二分木

データベース

データベース

  1. テーブル定義

  2. 主キーと外部キー

  3. データ定義言語(DDL)

  4. 正規化

  5. 結合

  6. ER 図

  7. データ操作言語(DML)

  8. データウェアハウス(DWH)

  9. 射影

  10. SQL

アルゴリズムとプログラミング

アルゴリズム

  1. バブルソート

  2. 深さ優先探索

  3. 貪欲法

  4. 分割統治法

  5. 再帰的アルゴリズム

  6. ビッグ O 記法

  7. 計算時間

  8. 最大次数

  9. 座標降下法

  10. 幅優先探索

  11. メタ戦略

  12. 局所探索

  13. 動的計画法

  14. フローネットワーク

  15. 入力データ量

  16. ステップ数

  17. 最急降下法

プログラミング

  1. 計算の構造化

  2. リファクタリング

  3. オブジェクト

  4. モジュール化

  5. オブジェクト指向

モデリング・AI と評価

モデリング・AIによる課題解決

AI の歴史と応用分野

  1. AI の歴史

  2. 探索

  3. エキスパートシステム

  4. フレーム問題

  5. 人間の知的活動と AI 技術(学習, 認識, 予測・判断, 知識・言語, 身体・運動)

  6. 推論

  7. トイプロブレム

  8. 汎用 AI/特化型 AI(強い AI/弱い AI)

  9. シンボルグラウンディング問題

  10. AI 技術の活用領域の広がり(流通, 製造, 金融, インフラ, 公共, ヘルスケアなど)

モデル作成とデータ分析の進め方

  1. 仮説検証サイクル

  2. 様々なデータ分析手法

  3. パターン発見

  4. リフト値

  5. モデルの解釈と有効性

  6. サンプルサイズの設計

  7. 実験計画法

  8. 分析目的の設定

  9. 様々なデータ可視化手法

  10. アソシエーション分析

  11. モデルの作成と検証

  12. 分析目的に応じた適切な調査(標本調査, 標本誤差)

  13. ランダム化比較試験

教師あり学習

線形回帰分析

  1. 正規方程式

  2. 自由度調整決定係数

  3. 回帰分析の諸仮定の妥当性

  4. 回帰係数の有意性検定(t 検定, F 検定)

  5. Stepwise 法

  6. 多重共線性等の推測の信頼性

質的回帰分析

  1. ロジスティック回帰

  2. 対数オッズ

  3. オッズ比

判別分析

  1. 線形判別分析

  2. SVM

  3. ソフトマージンと正則化

  4. 非線形な分離曲面

  5. 二次判別分析

  6. 最大マージン判別

  7. カーネル

正則化法とモデル選択

  1. バイアスとバリアンスのトレードオフの概念

  2. lasso

  3. ハイパーパラメータ

  4. リッジ回帰

  5. スパースモデリング

決定木

  1. 決定木(回帰, 判別)

  2. アンサンブル学習(バギング, ランダムフォレスト)

ベイズ統計・モデリング

  1. 単純ベイズ

  2. 階層ベイズ

  3. ベイズ判別(各カテゴリーの事後確率)

教師なし学習

クラスター分析

  1. k-平均法の手続き

  2. 階層クラスタリングの手続き

  3. 最長距離法

  4. 樹形図(デンドログラム)

  5. データの類似度

  6. 最短距離法

  7. Ward 法

主成分分析

  1. 可視化

  2. 寄与率*

  3. 特異値分解

  4. 次元削減

カーネル密度推定

  1. ヒストグラム*

  2. カーネル関数

時系列解析

時系列データの特徴

  1. 周期性

  2. 弱定常性

  3. 相互相関

  4. 強定常性

  5. 自己相関

  6. スペクトル

時系列モデル

  1. 自己回帰(AR)モデル

  2. ARIMA モデル

  3. 状態空間モデル

  4. 自己回帰移動平均(ARMA)モデル

  5. SARIMA モデル

  6. カルマンフィルタ

生存時間解析

生存時間データ

  1. 打ち切り

  2. ハザード関数

  3. 生存関数

生存関数の推定

  1. カプラン・マイヤー法

  2. ワイブル分布

  3. 指数分布*

質的データ解析

質的データの解析

  1. 多重分割表

  2. 対応分析

  3. 数量化理論

テキストデータ解析

テキストデータの数値化

  1. 形態素解析

  2. ストップワード

  3. ベクトル空間モデル

  4. ステミング

  5. 単語埋め込み

テキスト分析

  1. 共起ネットワーク

  2. トピックモデル

  3. カナ漢字変換

  4. 対応分析

  5. 言語モデル

  6. 機械翻訳

モデルの評価

モデル評価指標

  1. Mallows のCp 基準

  2. 情報量規準

  3. 交差検証法

  4. MSE

  5. 適合率(precision)

  6. 混同行列

  7. ROC 曲線とそのAUC

  8. AIC

  9. BIC

  10. 周辺尤度

  11. 正解率(accuracy)

  12. 再現率(recall)

  13. F 値

訓練データとテストデータ

  1. 訓練データとテストデータ

  2. 汎化誤差

  3. 適合不足

  4. ハイパーパラメータ

  5. バイアスとバリアンスの概念

  6. 過学習

  7. 交差検証法(leave-one-out, k-Fold)

因果推論

因果モデル

  1. 実験研究と観察研究

  2. 個体処置効果と平均処置効果

  3. 傾向スコア

  4. 層別*

  5. ノンコンプライアンス

  6. 潜在的結果変数

  7. 処置割当ての無視可能性

  8. マッチング

  9. 重み付け法

グラフィカルモデリング

  1. 偏相関行列

  2. 類似度行列

  3. 無向グラフ

  4. マルコフ確率場

  5. 構造方程式モデリング

  6. 距離行列

  7. 隣接行列

  8. 有向グラフ

  9. ベイジアンネットワーク

深層学習・ニューラルネットワーク

ニューラルネットワークの仕組み

  1. 入力層

  2. シナプス結合

  3. 誤差逆伝搬法

  4. 活性化関数(ReLU, シグモイド関数, 動径基底関数, ウェーブレット)

  5. (確率的)勾配降下法とそのアルゴリズム

  6. 計算グラフ

  7. 出力層

  8. 隠れ層

  9. 勾配消失

  10. ドロップアウト

  11. バッチ正規化

ニューラルネットワークモデル

  1. CNN

  2. プーリング

  3. LSTM

  4. 音声認識

  5. フィルタ

  6. RNN

  7. 画像解析

深層生成モデル

  1. 特徴抽出

  2. オートエンコーダー

  3. 識別モデル

  4. ノイズ除去

  5. 敵対的生成ネットワーク

  6. 生成モデル

AI とロボット

AI とロボット

  1. 家庭用ロボット

  2. サービスロボット

  3. センサー

  4. ジェスチャー認識

  5. 産業用ロボット

  6. 自動化機械

  7. アクチュエータ

  8. 行動推定

AI の構築・運用

AI の構築・運用

  1. AI の学習と推論・評価・再学習

  2. 複数の AI 技術を活用したシステム(スマートスピーカー, AI アシスタントなど)

  3. AI システムの品質・信頼性

  4. AI の計算デバイス(GPU, FPGA など)

  5. AI の社会実装・ビジネス/業務への組み込み

  6. AI システムの開発・テスト・運用

  7. AI の開発基盤(大規模並列GPU マシンなど)

参考書籍

以上

Discussion