👓
機械学習の推定の概要理解
scikit-learn は Pyhon の機械学習ライブラリで、多くの推定器 (Estimator) が実装されており、全容を理解するために以下のチートシートが用意されている。
この前提となっている4つの大分類をざっくり理解するための概要のまとめ。
手法 | 概要 | 代表的なもの | 活用例 |
---|---|---|---|
回帰 (regression) | 過去データからパターンを学習し、未知の結果を予測 | 線形回帰 | 過去の週次売上から来週の売上を予測, 過去のデータをもとに以上を検知 |
クラス分類 (classification) | 過去のデータから分類方法を学習し、未知のデータを分類 | ロジスティック回帰, 決定木, サポートベクターマシン | 迷惑メールの分類, 文字認識, 画像認識 |
クラスタリング (clustering) | 未知のデータを擬似性をもとにグループ化 | k-means法 | 商品の購入状況から顧客の好みをグループ化 |
次元削減 (dimensionality reduction) | データを表現するために必要な値を削減 | 主成分分析 | 複雑なデータの分布を可視化, データの軽量化による計算速度向上 |
Discussion