🤖
【機械学習】scikit-learn algorithm cheat-sheet
※随時更新していきます。
勉強中のメモなので、内容に誤りがある場合はご指摘いただけますと幸いです。
scikit-learn algorithm cheat-sheet(サイキットアルゴリズムチートシート)とは?
https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
※チートシートとは…要はカンペ
下記4つに分類されている。
- classification(クラス分類・教師あり学習)
- clustering(グループ分け・教師なし学習)
- regression(回帰・教師あり学習)
- dimensionality reduction(次元削減/次元圧縮)
ちなみに最初の分岐が「学習データは50以上あるか?」という質問で、これがNOだともっとデータを集めてくるように促される。
classification(クラス分類・教師あり学習)
- SGD(Stochastic Gradient Descent) Classifier
- 大規模なデータを処理するのに向いている
- kernel approximation
- カーネル近似
- Linear SVC(SVM Classification)
- データ数がそれほど多くない場合に用いられる
- Naive Bayes
- 全ての推定の確率を計算し、最も確率の高いものを推定結果とする
- KNeighbors Classifier
- K近傍法
- Ensemble Classifiers
- 異なる機械学習アルゴリズムを持つ複数の分類器(Classifier)の予測結果を投票にかけ、多数決により予測値を決定するアルゴリズム
(おまけ)日本語にしてみた
※こちらの記事で各アルゴリズムについて詳しく書かれていました。
Discussion