💭

「Kaggleで磨く機械学習の実践力」で学んだ際のメモ

2024/04/07に公開

はじめに

この記事は「Kaggleで磨く機械学習の実践力」で学んだ際のメモです。とくに書籍に書かれているソースコードを読んでいても「ここどんな処理?」、「なんでこの処理してるの?」なところを自分で調べてまとめています。

スクリプト7-6: カテゴリ変数をcategory型に変換

・↑の理由:カテゴリ変数(性別や血液型など)は通常文字列や整数で表現される
・でもカテゴリ型にはカテゴリ変数のメモリの効率的な仕様や処理速度向上の利点がある。なのでテゴリ型を使えば、整数や文字列で表現されていたときよりも、カテゴリ変数を効率的に扱うことができる

P226

【AUC(評価指標)計算の流れ】
・学習モデル(与えられたデータからパターンを学習し、未知のデータを予測するモデル)は以下のように推論(←学習モデルの推論ってどゆこと?)
y_pred = model.predict_proba(x:説明変数)

※学習モデルの推論:学習済みモデルを使用して、未知のデータを予測すること

・評価指標は以下のように計算(機械学習モデルがどれくらい優秀なのかを計算)
metric_auc = roc_auc_score(y:目的変数, y_pred)

Discussion