Chapter 05

性別、乗船港、敬称(Name)をカテゴリカル変数に

(株)ディープブラック
(株)ディープブラック
2021.03.21に更新

カテゴリカル変数

カテゴリカル変数とは、性別や血液型などの、順位を付けられないものを指します。

Pythonでの扱い方

Pythonでカテゴリカル変数を扱うには、以下のように書きます。
今回は、Titanicの性別を用いて、例を出します。

import category_encoders as ce

ce_ohe = ce.OneHotEncoder(cols=["Sex"])
data = ce_ohe.fit_transform(data)

簡単ですね。

Titanicデータに当てはめる

######### データの前処理(category_encoders) #########
ce_ohe = ce.OneHotEncoder(cols=["Sex", "Embarked", "Honorific"])
data = ce_ohe.fit_transform(data)