👋

GAN（敵対的生成ネットワーク）

2023/01/11に公開

AIに関する情報を閲覧するとき、「GAN」という単語をよく目にすると思いますが、
「難しそう」と思う方は多いのではないでしょうか?
ここでは、「GAN」について簡単に説明したいと思います。

GANとは

GAN（Generative Adversarial Network）とは、2つのニューラルネットワークが互いに競い合い、より正確な予測を行う機械学習（machine learning）モデルです。GANは通常、教師なしで実行され、協力的なゼロサム（zero-sum）ゲームの枠組みを使って学習します。

GANを構成する2つのニューラルネットワークは、Generator（ジェネレーター）とDiscriminator（ディスクリミネーター）と呼ばれます。Generatorは生成ネットワークで、Discriminatorは識別ネットワークです。Generatorの目的は、本物のデータと間違えられるような偽物のデータを作り出すことです。Discriminatorの目的は、その生成されたデータは本物かどうかを識別することです。

基本的に、GANは教師なしで学習データを生成します。GAN（敵対的生成ネットワーク）間のフィードバックループが続くと、Generatorのデータ生成力と、Discriminatorの識別力の精度を高めていきます。

GANの仕組み

GANを構築するに、まず、求める最終効果を確定し、そのパラメータに基づいて初期の訓練用データセットを収集します。それから、精度の高い出力を得るまでこのデータをランダムにGeneratorに入力することです。

その後、生成された画像は、オリジナルの実際データポイントと一緒にDiscriminatorに提供されます。Discriminatorはこれらの情報を識別、整理し、各画像の信憑性を表す0と1の間の確率を返します（1が本物、0が偽物）。最後はこれらの値の精度を手動で確認し、理想の結果が得られるまで繰り返されます。

GANの一般的な使用例

GANモデルは、画像コンテンツを理解し、高度な精度で画像データを再現できるため、画像の超解像処理にぴったりです。また、以下の応用ケースがあります。

画像の解像度を上げる

テキストから画像を生成する
白黒画像に色づける
動画内での人の動きパターンをモデル化する
画像を別の画像に仕上げる（ディープフェイク）

GANとは

GANの仕組み

GANの一般的な使用例

Discussion