🗂

scikit-learnのLabelEncoderとは?

2025/03/31に公開

LabelEncoder とは?

機械学習では、カテゴリ(文字列など)を数値に変換する必要がある場面がよくあります。
LabelEncoder は、カテゴリデータ(例: "apple", "banana", "orange")を 整数ラベル(0, 1, 2など)に変換してくれるツールです。

使い方の例

from sklearn.preprocessing import LabelEncoder

# データ(文字列のカテゴリ)
fruits = ["apple", "banana", "apple", "orange", "banana"]

# エンコーダの作成
le = LabelEncoder()

# 数値に変換
encoded = le.fit_transform(fruits)

print(encoded)

[0 1 0 2 1]

もちろん逆変換も出来ます。

le.inverse_transform([0, 1, 2])

array(['apple', 'banana', 'orange'], dtype='<U6')

Discussion