🤖

【機械学習】scikit-learn algorithm cheat-sheet

2020/10/06に公開

※随時更新していきます。
勉強中のメモなので、内容に誤りがある場合はご指摘いただけますと幸いです。

scikit-learn algorithm cheat-sheet(サイキットアルゴリズムチートシート)とは?

https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html

※チートシートとは…要はカンペ

下記4つに分類されている。

  • classification(クラス分類・教師あり学習)
  • clustering(グループ分け・教師なし学習)
  • regression(回帰・教師あり学習)
  • dimensionality reduction(次元削減/次元圧縮)

 
ちなみに最初の分岐が「学習データは50以上あるか?」という質問で、これがNOだともっとデータを集めてくるように促される。
 

classification(クラス分類・教師あり学習)

  • SGD(Stochastic Gradient Descent) Classifier
    • 大規模なデータを処理するのに向いている
  • kernel approximation
    • カーネル近似
  • Linear SVC(SVM Classification)
    • データ数がそれほど多くない場合に用いられる
  • Naive Bayes
    • 全ての推定の確率を計算し、最も確率の高いものを推定結果とする
  • KNeighbors Classifier
    • K近傍法
  • Ensemble Classifiers
    • 異なる機械学習アルゴリズムを持つ複数の分類器(Classifier)の予測結果を投票にかけ、多数決により予測値を決定するアルゴリズム

 

(おまけ)日本語にしてみた

 

こちらの記事で各アルゴリズムについて詳しく書かれていました。

Discussion