🚀

ScoreCardシーリズ(1)——スコアカードの由来

2023/09/07に公開

1.スコアカードの由来

2.証拠の重さと情報価値(WOE and IV)

3.グルーピングの方法(Grouping Method)

4.信頼できるAIの要素——PSI(population stability index)

5.スコアの計算

6.実例:モデルの構築

Github:https://github.com/datasciencekun/lapras

金融機関に使われる信用スコア

FICOスコア

アメリカで利用されている信用スコアの一つで、信用力を判断することです。
スコアは300〜850点の範囲で採点されていて、800点以上がexcellent、740点以上がvery good、670点以上がgoodに分類されていて、それ以下の点数のことをサブプライムと呼ばれています。

信用スコアというのはスコアが高ければ高いほど、信用が高いものです。

スコアカードの構成

下記は例としての計算方法で、現実ではないです。

上記のスコア項目は人間の経験ではなく、スコアカードというモデルで作られたものです。

二項分類の汎用方法論

教師あり学習の一つ

教師あり学習は二つのタイプがあります。

  • 回帰
  • 分類

分類の中で二項分類が一番使われているものです。

二項分類というのは結果が離散値になり、例えば0と1です。二項分類はデータサイエンス領域で信用状況、離職予測、購入傾向などの課題に幅広く使われています。

二項分類の結果をもっと深く考えれば、もともとモデルの結果が連続値になり、つまり確率です。ある閾値を使い、確率を二つ分を分けたことです。例えば、確率が0.5以上がポジティブになり、0.5以下がネガティブになります。

完全な説明可能性

人間として確率への理解は難しいです。そのため、ある数学公式を使い、確率をスコアに変換できます。

そのスコアは全てのアイテムの総和になり、理解されやすいです。

Discussion