🦮

統計検定データサイエンス発展の出題範囲と参考HP

2021/11/25に公開

引用元|統計検定 CBT「データサイエンス発展」 出題範囲表) 下記に加えて、統計検定3級4級およびデータサイエンス基礎の範囲表の項目についても出題される。 参考HPへのリンクは随時アップデート予定 (* は外部リンク)

社会におけるデータ・AI 利活用

社会で起きている変化

ねらい) 社会で起きている変化を知り、数理・データサイエンス・AI を学ぶことの 意義を理解する。

主な項目

  1. ビッグデータ、IoT、AI、ロボット*

  2. 第 4 次産業革命、Society 5.0、データ駆動型社会*

  3. 人間の知的活動とAI の関係性*

  4. データ量の増加、計算機の処理性能の向上、AI の非連続的進化*

  5. 複数技術を組み合わせた AI サービス*

  6. データを起点としたものの見方、人間の知的活動を起点としたものの見方*

社会で活用されているデータ

ねらい) 社会でどのようなデータが集められ、どう活用されているかを知る。

主な項目

  1. 調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータ*

  2. 構造化データ、非構造化データ(テキスト、画像/動画、音声/音楽)*

  3. 1 次データ、2 次データ、データのメタ化*

  4. データ作成(ビッグデータとアノテーション)*

データ・AI の活用領域

ねらい) さまざまな領域でデータ・AI が活用されていることを知る。

主な項目

  1. データ・AI 活用領域の広がり(生産、消費、文化活動)*

  2. 研究開発、調達、製造、物流、販売、マーケティング、サービス*

  3. 仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成*

データ・AI 利活用のための技術

ねらい) データ・AI を活用するために使われている技術の概要を知る。

主な項目

  1. データ解析:予測、グルーピング、パターン発見、最適化、シミュレーション, データ同化*

  2. 非構造化データ処理:言語処理、画像/動画処理、音声/音楽処理*

  3. 認識技術、ルールベース、自動化技術*

  4. データ可視化:複合グラフ、2 軸グラフ、多次元の可視化、関係性の可視化、地図上の可視化、挙動, 軌跡の可視化、リアルタイム可視化*

  5. 特化型 AI と汎用 AI、今のAI で出来ることと出来ないこと、AI とビッグデータ*

データ・AI 利活用の現場

ねらい) データ・AI を活用することによって、どのような価値が生まれているかを知る。

主な項目

  1. データサイエンスのサイクル(課題抽出と定式化、データの取得, 管理, 加工, 探索的データ解析、データ解析と推論、結果の共有, 伝達、課題解決に向けた提案)*

  2. 流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ, AI 利活用*

データ・AI 利活用の最新動向

ねらい) データ・AI 利活用における最新動向(ビジネスモデル、活用例)を知る。

主な項目

  1. AI 等を活用した新しいビジネスモデル(シェアリングエコノミー、商品のレコメンデーション)*

  2. AI 最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習)*

データ・AI 利活用における留意事項

データ・AI を扱う上での留意事項

ねらい) データ・AI を利活用する上で知っておくべきこと

主な項目

  1. ELSI(Ethical, Legal and Social Issues)*

  2. データ倫理:データのねつ造、改ざん、盗用、プライバシー保護*

  3. データバイアス、アルゴリズムバイアス、標本選択バイアス、帰納バイアス、公表バイアス*

  4. データ, AI 活用における負の事例*

  5. 個人情報保護、EU 一般データ保護規則(GDPR)、忘れられる権利、オプトアウト、知的財産、インフォームドコンセント*

  6. AI 社会原則(公平性、説明責任、透明性、人間中心の判断)*

  7. AI サービスの責任論*

データを守る上での留意事項

ねらい) データを守る上で知っておくべきこと

主な項目

  1. 情報セキュリティ:機密性、完全性、可用性*

  2. 情報漏洩等によるセキュリティ事故*

  3. 匿名加工情報、暗号化、パスワード、悪意ある情報搾取、不正アクセス行為の禁止、個人認証、個人識別符号、要配慮個人情報、再識別、秘密の曝露や差別の誘引*

データリテラシー

データを読む

ねらい) データを適切に読み解く力を養う。

主な項目

  1. データの種類、データの分布と代表値、データのばらつき、観測データに含まれる誤差の扱い*

  2. 相関と因果(交絡、偏相関係数)、回帰(重回帰分析、ロジスティック回帰分析、モデルの評価)*

  3. クロス集計表、分割表、相関係数行列、散布図行列*

  4. 統計情報の正しい理解(誇張表現に惑わされない)*

  5. 打ち切りや脱落を含むデータ、層別の必要なデータ、外れ値*

  6. 分類とグループ化(階層的クラスタリング、非階層的クラスタリング)*

  7. 母集団と標本抽出(層別抽出、多段抽出、クラスター抽出、母数と統計量の区別、標本分布)*

データを説明する

ねらい) データを適切に説明する力を養う。

主な項目

  1. データの表現(散布図、ヒートマップ、チャート化)*

  2. 不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)*

  3. データの比較(条件をそろえた比較、処理の前後での比較、A/B テスト、ランダム化比較試験)*

  4. 色の効果や特徴、点の色・大きさ・形状への配慮、線の太さと様々な破線*

データを扱う

ねらい) データを扱うための力を養う。

主な項目

  1. 集計、並べ替え、ランキング、データ解析ツール(スプレッドシート)*

数理基礎

線形代数

ねらい) データ分析に必要なベクトルや行列の扱いや n 次元ユークリッド空間の基本事項を理解する。

主な項目

  1. 平面ベクトル、空間ベクトル、n 次元ベクトル、ベクトルの和、内積、直交性、ノルム*

  2. 線形独立、部分空間*

  3. 正方行列、単位行列、転置行列、対称行列、行列の積、逆行列、行列式*

微分積分

ねらい) データ分析に必要な初等関数や微分積分の意味と操作を理解する。

主な項目

  1. 指数関数、対数関数、三角関数*

  2. 偏微分、接平面、重積分、累次積分*

  3. 積の微分、合成関数の微分、関数の最大最小、線形近似、原始関数、積分と微分の関係

数列

ねらい) 数列の基本的な事項を理解する。

主な項目

  1. 数列の和、Σ記号、極限

デジタル情報とコンピュータの仕組み

デジタル情報

ねらい) デジタル情報の表し方を理解する。

主な項目

  1. 数と表現(2 進数の表現、論理値)*

  2. 文字の表現(ASCII コード、シングルバイト文字、ダブルバイト文字)*

  3. 動画(ラスタデータ、ベクタデータ、コーデック)

  4. 情報量の単位(ビット、バイト、接頭語(k,M,G,T,m,μ,n,p など)を使った表現)*

  5. デジタル化(連続値、離散値)、画像*

コンピュータの仕組み

ねらい) 論理演算や計算上の誤差について理解する。

主な項目

  1. 集合、命題、真/偽、否定、論理和、論理積*

  2. 有効数字、浮動小数点、仮数部、指数部、丸め誤差

アルゴリズム基礎

アルゴリズムの表現

ねらい) アルゴリズムの表現方法を理解する。

主な項目

  1. フローチャート、アクティビティ図、端子、処理、判断、矢印*

アルゴリズムの構造

ねらい) 分岐、繰り返しなどのアルゴリズムの構造の基礎を理解する。

主な項目

  1. 代入、順次構造、選択構造、繰り返し構造*

基本的なアルゴリズムの例

ねらい) いくつかの基本的なアルゴリズムを理解する。

主な項目

  1. 並べ替え(ソート)、探索(サーチ)、合計、併合*

データ構造とプログラミング基礎(主に Python)

データ構造

ねらい) 配列などのデータ構造について理解する。

主な項目

  1. 配列とリスト(メモリ、ベクトル、行列、アドレス)

  2. 連想配列(キー、バリュー、連想、辞書、ハッシュ)

プログラミング基礎

ねらい) インタープリタ言語を用いて簡単なプログラミングができる。

主な項目

  1. インタープリタ言語(ソースコード、機械語、実行)

  2. 関数(引数、返り値)、制御文(for, while, if 文)、入出力(print 文)*

  3. 構文(変数、代入、計算、分岐、繰り返し)、演算(オブジェクト、四則演算)*

データハンドリング

代表的なデータ形式

ねらい) 代表的なデータ形式を理解する。

主な項目

  1. csv、XML、JSON

その他のデータ形式

ねらい) その他のデータ形式を理解する。

主な項目

  1. 離散グラフ、キー・バリュー形式である隣接リスト、NoSQL

データベース

ねらい) データベースの基礎概念を理解する。

主な項目

  1. データベース管理システム(DBMS)、リレーショナルデータベース、正規化、選択、射影、結合、SQL*

データクレンジング

ねらい) データクレンジング作業を理解する。

主な項目

  1. 表記の揺れの吸収(文字列、数字、日付、時刻)、名寄せ*

データ加工

ねらい) データの加工法を理解する。

主な項目

  1. 部分集合の抽出、行の並べ替え、新しい列の追加、プログラミング(Python、R)

データ取得とオープンデータ

日本や世界のオープンデータ

ねらい) オープンデータの普及に向けた国内及び国際的な動きを理解する。

主な項目

  1. 二次利用可能なルール、機械判読への適性、オープンデータ憲章

オープンデータの取得

ねらい) オープンデータの取得法を理解する。

主な項目

  1. e-Stat、DATA.GO.JP、データカタログサイト、Open Knowledge International、Web API*

統計法

ねらい) 統計法の意義について理解する。

主な項目

  1. 基幹統計調査、調査票情報の二次的利用

確率と確率分布

順列と組合せ

ねらい) 場合の数の数え方を理解する。

主な項目

  1. 階乗(n!)、順列(mPn)、組合せ(mCn)*

確率分布の概念

ねらい) 確率変数の分布の基本を理解する。

主な項目

  1. 確率変数、確率関数、確率密度関数、母平均、母分散、同時分布、周辺分布、共分散と相関、独立*

主要な確率分布

ねらい) 主な確率分布と確率計算を理解する。

主な項目

  1. ポアソン分布、指数分布、一様分布、正規分布、2 変量正規分布*

統計的推測

統計的モデル

ねらい) 統計的モデルの考え方を理解する。

主な項目

  1. 統計的モデル、母数、パラメータ

標本分布

ねらい) 標本分布の基本的な考え方理解する

主な項目

  1. 独立同一分布、標本平均、標本分散*

点推定

ねらい) 点推定について理解する。

主な項目

  1. モーメント法、最尤法、バイアス、不偏推定量、平均二乗誤差、バイアス分散分解*

仮説検定の考え方

ねらい) 仮説検定の考え方を理解する。

主な項目

  1. 帰無仮説、対立仮説、2 種の誤り、有意水準、検出力、p 値、検定統計量*

種々のデータ解析

時系列データ解析

ねらい) 時系列データの扱いを理解する。

主な項目

  1. 時系列データ(トレンド、周期、ノイズ)、季節調整、移動平均*

テキスト解析

ねらい) テキスト処理の基礎を理解する。

主な項目

  1. 形態素解析、単語分割、ユーザ定義辞書、n-gram、文章間類似度、かな漢字変換の概要*

画像解析

ねらい) 画像解析の基礎を理解する。

主な項目

  1. 画像データの処理、画像認識、画像分類、物体検出*

データ活用実践

教師あり学習

ねらい) 教師あり学習の実践例を理解する。

主な項目

  1. 教師あり学習による予測 (例:売上予測、罹患予測、成約予測、離反予測)*

  2. データ分析結果の共有、課題解決に向けた提案*

  3. データの収集、加工、分析*

教師なし学習

ねらい) 教師なし学習の実践例を理解する。

主な項目

  1. 教師なし学習によるグルーピング (例:顧客セグメンテーション、店舗クラスタリング)*

  2. データ分析結果の共有、課題解決に向けた提案*

  3. データの収集、加工、分析*

その他参考HP

参考書籍

以上

Discussion