🤖
ざっくりと分かる機械学習概論
1. 機械学習とは何か
機械学習とは、コンピュータがデータから学習できるようにするためのコンピュータプログラミングについての科学(または技術)である
引用元:日本語版「scikit-learn, Keras, TensorFlowによる実践機械学習 第2版」オーレリアン・ジュロン著、オライリー・ジャパン、ISBN978-4-87311-928-1
- 要するに、以下の二つを行う領域の名称
-
データからパターンを見つける
-
アルゴリズムを用いて上記を自動化
-
データからパターンを見つける
2. 機械学習でできること、できないこと
-
できること
- 一定のパターンを持つデータからパターンを抽出する
- 果物のようなデータは学習しやすい。大きさ以外に個体差が無く、色・形ともに他の果物との違いが分かりやすい。
-
できないこと
- 人間のように物事を理解して判断する
- 人間の振る舞いはちょっとした機微で意味合いが変わるため、パターンを抽出するのが困難
- 人間の振る舞いはちょっとした機微で意味合いが変わるため、パターンを抽出するのが困難
- 人間のように物事を理解して判断する
3. 深層学習と機械学習の違い
深層学習なら機械学習でできないこともできるんじゃないの?
- 結論から言うと、そんな事はない。
- 下図のように、深層学習は機械学習の一手法であり、上記の問題は深層学習も抱えている
4. 教師あり学習・教師なし学習・半教師あり学習・強化学習
-
教師あり学習
- ラベル付きデータを用い、どの画像にはどのラベルが紐づいているのかを学習する。
- 学習したモデルは新しいデータに対しラベルを推論する
- 分類や回帰予測などに用いられる技術
- 分類や回帰予測などに用いられる技術
-
教師なし学習
- 教師あり学習のようにラベル付きデータを要さず、データを他の形に変え(次元削減やクラスタ分析など)、異なる観点からデータを見ることでパターンを抽出する
- 画像圧縮などに使われる技術(データ内の相関性から不必要な次元を削減し、データを軽量化する)
- 画像圧縮などに使われる技術(データ内の相関性から不必要な次元を削減し、データを軽量化する)
- 教師あり学習のようにラベル付きデータを要さず、データを他の形に変え(次元削減やクラスタ分析など)、異なる観点からデータを見ることでパターンを抽出する
-
半教師あり学習
- ラベル付きデータを学習し、ラベル無しデータにラベルを付けるアルゴリズム
- ラベル付きデータから、どのデータにどのラベルが付与されているかの分類をし、新しいデータに対しどのグループに属するか判定することで、ラベル付けを行う
- データのアノテーションに使われる技術
- データのアノテーションに使われる技術
-
強化学習
- あるデータの状態を特徴量として持ち、そのデータがどう変化(行動)したら、最良の結果(報酬)が得られるかという、方策を求めるアルゴリズム
- ゲームやシミュレーションなどで使われる技術(敵キャラクターを自動で戦わせる際など)
5. まとめ
- 機械学習はデータからパターンを見つける作業を自動化する技術を扱う領域
- 機械学習は一定のパターン抽出はできるが、人間の振る舞い判定のような複雑なパターン認識はできない
- 深層学習は機械学習の中の一技術の名称。万能なわけではない
- 教師あり学習は学習した結果が正しいかどうかを教える正解データが存在するアルゴリズムのこと
- 教師なし学習はラベル無しデータの形式を変えて、異なった形でパターンを抽出するアルゴリズムのこと
- 半教師あり学習はラベル付きデータを基にデータにラベリングするアルゴリズムのこと
- 強化学習はデータのある状態から変化させたときの報酬を最大化させるアルゴリズムのこと
6. その先へ
- 人工知能の概念を知る
- 機械学習の実装方法を知る
- 資格を通して機械学習の全体像を知る
Discussion