👻

【ディープラーニング基礎⑤】教師あり学習、教師なし学習、強化学習のそれぞれの特徴

2024/12/21に公開

ディープラーニング

人工知能

tech

 はじめにそもそも機械学習とは、データからパターンや知識を学習し、予測や意思決定を行う人工知能の一分野です。主な学習手法として、教師あり学習、教師なし学習、強化学習の3種類があります。以下にそれぞれの概要と特徴をまとめます。

 教師あり学習（Supervised Learning）教師あり学習は、入力データとそれに対応する正解ラベル（出力）をセットでモデルに学習させる手法です。モデルはこれらのデータから入力と出力の関係を学び、未知のデータに対して適切な出力を予測できるようになります。教師あり学習には学習フェーズと推論フェーズがあります。

 適用例
分類（Classification）: データを複数のクラスに分類するタスクです。例えば、メールを「迷惑メール」か「通常メール」に分類するスパムフィルタリングなどが該当します。

回帰（Regression）: 連続する数値を予測するタスクです。例えば、過去の販売データから次月の売上を予測するケースなどが該当します。
教師あり学習の利点は、正解ラベルが存在するため、モデルの性能を評価しやすく、高精度な予測が可能な点です。一方で、正確なラベル付きデータの収集にはコストと時間がかかるという課題があります。

 教師なし学習（Unsupervised Learning）教師なし学習は、正解ラベルのないデータのみを用いて、データの構造やパターンを学習する手法です。

 適用例クラスタリング（Clustering）: データを特徴に基づいてグループ分けする手法です。例えば、顧客データを購買傾向に応じてセグメント化するマーケティング分析などが該当します。犬と猫の画像を分類します。しかし、教師あり学習ではないので特徴で分類できてもそれが犬であるか猫であるかはわかっていません。
次元削減（Dimensionality Reduction）: 高次元のデータを低次元に圧縮し、データの本質的な特徴を抽出する手法です。主成分分析（PCA）などが代表的な手法として知られています。
主成分分析については以下の動画でわかりやすく説明されています。

https://www.youtube.com/watch?v=Etjrjx6iSsQ
教師なし学習は、データの潜在的な構造を発見するのに有効ですが、それだけで完結させることは難しいです。

 自己教師あり学習自己教師あり学習（Self-Supervised Learning、SSL）は、ラベル付けされたデータが不足している状況で、データ自体から擬似的なラベルを生成し、モデルの学習を行う手法です。これは、教師あり学習と教師なし学習の中間的な位置付けとされています。

 教師なし学習との違い
教師なし学習は、ラベルのないデータからデータ内のパターンや構造を発見する手法であり、クラスタリングや次元削減などが含まれます。一方、自己教師あり学習は、データから擬似ラベルを生成し、モデルの学習に利用する点で異なります。つまり、自己教師あり学習は、ラベルなしデータから擬似的な教師データを作成し、モデルを訓練する手法と言えます。

 自己教師あり学習の仕組み
自己教師あり学習では、以下の手順でモデルの学習が進められます：

擬似ラベルの生成: 未ラベルのデータから、データの一部を隠すなどして擬似的なラベルを生成します。例えば、画像の一部をマスクし、その部分を予測するタスクを設定します。

事前学習（Pretext Task）: 生成した擬似ラベルを用いてモデルを学習させます。この段階では、データの特徴を捉えることが主な目的です。

ファインチューニング: 事前学習で得られたモデルを、目的のタスク（例えば、画像分類や物体検出）に合わせて微調整します。このプロセスにより、モデルの性能を向上させます。

 適用例画像処理における適用例

画像の一部隠蔽と復元: 画像の一部をマスクし、元の画像を復元するタスクを通じて、モデルは画像の特徴を学習します。例えば、BEiT（Bidirectional Encoder representation from Image Transformers）は、BERTの構想を画像に適用した自己教師あり学習モデルであり、画像をパッチに分割し、一部をマスクして復元することで学習します。

画像の回転予測: 画像を任意の角度に回転させ、その回転角度をモデルに予測させることで、画像の幾何学的特徴を学習します。この手法は、モデルが画像の構造を理解するのに役立ちます。

パッチの並び替え予測: 画像を複数のパッチに分割し、ランダムに並び替えた後、元の正しい順序をモデルに予測させることで、画像の空間的な関係性を学習します。これにより、モデルは画像内のオブジェクトの配置や構造を理解できます。
自然言語処理における適用例

マスク付き言語モデル（Masked Language Model）: 文章中の単語をランダムにマスクし、周辺の文脈からマスクされた単語を予測するタスクです。BERT（Bidirectional Encoder Representations from Transformers）は、この手法を用いて事前学習を行い、高品質な言語表現を獲得します。

次文予測（Next Sentence Prediction）: ある文が次に続く文として適切かどうかをモデルに判断させるタスクです。これにより、モデルは文と文の関係性や文脈の流れを学習します。BERTの事前学習タスクの一部として利用されています。

文の一部隠蔽と予測: 文の一部を隠し、その内容を予測するタスクです。これにより、モデルは文脈理解や意味の推測能力を向上させます。自然言語処理における自己教師あり学習の一般的な手法として広く利用されています。
BERT、GPTについては以下のページでわかりやすく解説されています。

https://techblog.yahoo.co.jp/entry/2021122030233811/

 強化学習（Reinforcement Learning）強化学習は、エージェントが環境内で行動を選択し、その結果得られる報酬（報酬1+報酬2+ ... 報酬n)を最大化するように学習する手法です。エージェントは試行錯誤を通じて最適な行動方針（ポリシー）を獲得します。

 適用例ゲームAI: 囲碁や将棋などのボードゲームで人間を超えるプレイを実現するAIが開発されています。例えば、囲碁AIの「AlphaGo」は強化学習を活用してプロ棋士に勝利しました。
ロボット制御: ロボットが自律的に動作し、タスクを遂行するための制御アルゴリズムの学習に利用されています。
強化学習は、明確な教師信号がなくても学習可能で、複雑な意思決定問題に適用できますが、学習に時間がかかることや、報酬設計の難しさが課題となります。

はじめに

教師あり学習（Supervised Learning）

適用例

教師なし学習（Unsupervised Learning）

適用例

自己教師あり学習

教師なし学習との違い

自己教師あり学習の仕組み

適用例

強化学習（Reinforcement Learning）

適用例

Discussion