🐕
変数の種類と尺度水準について
変数の尺度
統計やデータ分析において、変数はその性質に応じて質的変数と量的変数に分けられる。 さらに質的変数と量的変数はその性質に応じて以下4つの種類に分けることができる
質的変数
- 名義尺度: 他と区別し分類するための名称のようなもの(数字の大小には意味がない)
- 順序尺度: 順序や大小には意味があるが間隔には意味がないもの
量的変数
- 間隔尺度: 順番を表し間隔が一定なもの(「0」には意味がない)
- 比例尺度: 0が原点であり、間隔と比率に意味があるもの
名義尺度
他と区別し分類するための名称のようなもの(数字の大小には意味がない) (例:性別、血液型、郵便番号、電話番号、背番号、住所、学籍番号)
順序尺度
順序や大小には意味があるが間隔には意味がないもの (足し算引き算など四則演算には意味がない) (例:ランキング、順序など)
間隔尺度
順番を表し間隔が一定なもの(「0」には意味がない) 足し算・引き算はできるが、掛け算・割り算には意味がない (例えば、気温19℃ + 1℃=20℃ だが、 20℃/10℃=2倍にはならない) (例: 気温(摂氏)、西暦、テストの点数)
比例尺度
0が原点であり、間隔と比率に意味があるもの (足し算・引き算・掛け算・割り算すべて可能) (例: 身長、速度、絶対温度 [K])
データ分析上での取り扱い
通常、目的変数が間隔尺度比例尺度の場合には回帰分析、目的名義尺度や順序尺度の場合にはクラス分類を用いる。
名義尺度や順序尺度の変数を回帰分析の解析したい場合には、それぞれの目的変数をone-hotベクトルに変換することで回帰分析が可能となる。(参考|カテゴリ変数のエンコーディングについて) ただし、この場合には基本的には目的変数毎に回帰モデルを一つ構築する。
Discussion