🚀
ScoreCardシーリズ(1)——スコアカードの由来
4.信頼できるAIの要素——PSI(population stability index)
5.スコアの計算
Github:https://github.com/datasciencekun/lapras
金融機関に使われる信用スコア
FICOスコア
アメリカで利用されている信用スコアの一つで、信用力を判断することです。
スコアは300〜850点の範囲で採点されていて、800点以上がexcellent、740点以上がvery good、670点以上がgoodに分類されていて、それ以下の点数のことをサブプライムと呼ばれています。
信用スコアというのはスコアが高ければ高いほど、信用が高いものです。
スコアカードの構成
下記は例としての計算方法で、現実ではないです。
上記のスコア項目は人間の経験ではなく、スコアカードというモデルで作られたものです。
二項分類の汎用方法論
教師あり学習の一つ
教師あり学習は二つのタイプがあります。
- 回帰
- 分類
分類の中で二項分類が一番使われているものです。
二項分類というのは結果が離散値になり、例えば0と1です。二項分類はデータサイエンス領域で信用状況、離職予測、購入傾向などの課題に幅広く使われています。
二項分類の結果をもっと深く考えれば、もともとモデルの結果が連続値になり、つまり確率です。ある閾値を使い、確率を二つ分を分けたことです。例えば、確率が0.5以上がポジティブになり、0.5以下がネガティブになります。
完全な説明可能性
人間として確率への理解は難しいです。そのため、ある数学公式を使い、確率をスコアに変換できます。
そのスコアは全てのアイテムの総和になり、理解されやすいです。
Discussion