機械学習の推定の概要理解

1 min read読了の目安(約700字

scikit-learn は Pyhon の機械学習ライブラリで、多くの推定器 (Estimator) が実装されており、全容を理解するために以下のチートシートが用意されている。

チートシート

この前提となっている4つの大分類をざっくり理解するための概要のまとめ。

手法 概要 代表的なもの 活用例
回帰 (regression) 過去データからパターンを学習し、未知の結果を予測 線形回帰 過去の週次売上から来週の売上を予測, 過去のデータをもとに以上を検知
クラス分類 (classification) 過去のデータから分類方法を学習し、未知のデータを分類 ロジスティック回帰, 決定木, サポートベクターマシン 迷惑メールの分類, 文字認識, 画像認識
クラスタリング (clustering) 未知のデータを擬似性をもとにグループ化 k-means法 商品の購入状況から顧客の好みをグループ化
次元削減 (dimensionality reduction) データを表現するために必要な値を削減 主成分分析 複雑なデータの分布を可視化, データの軽量化による計算速度向上