🎃

GAN

2025/03/30に公開

GAN（敵対的生成ネットワーク）は、近年急速に発展している深層学習モデルの一つであり、様々な種類のGANが存在します。以下に代表的なGANモデルの発表順の説明文と応用分野を一覧にまとめています。

 GAN（敵対的生成ネットワーク)

発表順
GANモデル
説明文
応用分野


2014年
GAN (Generative Adversarial Networks)
生成器(Generator)と識別器(Discriminator)という2つのネットワークを競合させながら学習させることで、実データに近いデータを生成します。
画像生成、動画生成、音声生成、テキスト生成、データ拡張、異常検知

2014年
Conditional GAN (CGAN)
GANに条件情報を加えることで、特定の条件を満たすデータを生成できるようにしたモデルです。例えば、特定のクラスの画像や、特定のスタイルの画像を生成することができます。
条件付き画像生成、テキストから画像生成、画像編集

2015年
LAPGAN (Laplacian Pyramid GAN)
画像の多段階生成を行うGANモデルであり、低解像度の画像から始めて、徐々に高解像度の詳細を追加していくことで、高品質な画像を生成します。画像の階層的な構造を捉えることで、よりリアルな画像を生成できる点が特徴です。
高解像度画像生成、画像編集

2015年
DCGAN (Deep Convolutional GAN)
畳み込みニューラルネットワーク(CNN)をGANに応用することで、画像生成の精度を向上させました。GANの学習を安定化させるための工夫が施されており、比較的扱いやすいモデルとして知られています。
高解像度画像生成、画像編集、動画生成

2016年
infoGAN (Information Maximizing GAN)
生成器に入力する潜在変数と生成される画像との間の相互情報量を最大化することで、潜在変数と画像の特定の属性との間に意味のある関係性を学習するGANモデルです。例えば、潜在変数を操作することで、生成画像の特定の属性（髪の色、表情など）を制御することができます。
潜在変数による画像生成の制御、表現学習

2016年
StackGAN
テキストから高解像度の画像を生成するために、複数のGANを積み重ねたモデルです。段階的に画像を生成することで、より詳細な画像を生成することができます。
テキストから高解像度画像生成

2017年
WGAN (Wasserstein GAN)
GANの学習を安定化させるために、Wasserstein距離と呼ばれる新たな損失関数を導入したGANモデルです。従来のGANに比べて学習が安定しやすく、高品質な画像を生成できることが期待されています。
高品質画像生成、画像編集

2017年
Pix2Pix
画像から画像への変換を行うGANモデルであり、例えば、白黒画像をカラー画像に変換したり、航空写真を地図画像に変換したりすることができます。ペアとなる画像データを用いて学習を行う点が特徴です。
画像変換（白黒画像からカラー画像、航空写真から地図画像など）

2017年
CycleGAN
画像のスタイル変換を行うGANモデルであり、例えば、馬の画像をシマウマの画像に変換したり、風景画を印象派風に変換したりすることができます。教師データとしてペア画像を必要としない点が特徴であり、様々な応用が可能です。
画像スタイル変換（馬からシマウマ、風景画のスタイル変換など）

2018年
StyleGAN
高解像度で写実的な画像を生成することができるGANモデルであり、特に顔画像生成において高い性能を発揮します。生成画像のスタイルを細かく制御できる点が特徴であり、多様な画像を生成することができます。
高解像度顔画像生成、画像スタイル制御


 GAN（敵対的生成ネットワーク）応用分野
画像生成:
GANの最も代表的な応用分野であり、実在しない人物の顔画像、風景画像、イラストなどを生成できます。


画像変換:
画像のスタイル変換、解像度変換、セマンティックセグメンテーション（画像内の物体領域の認識）などに応用されています。


動画生成:
GANを用いて、短い動画や、動画のフレームを生成することができます。


テキストから画像生成:
テキストで説明されたシーンや物体に対応する画像を生成することができます。


データ拡張:
GANを用いて、学習データを人工的に増やし、モデルの汎化性能を向上させることができます。


異常検知:
GANを用いて、正常なデータ分布を学習し、そこから逸脱する異常なデータを検出することができます。


医療分野:
医療画像の生成や、病気の診断支援、創薬などに応用されています。


エンターテイメント分野:
ゲームや映画のCG生成、バーチャルリアリティ（VR）コンテンツの生成などに応用されています。


ファッション分野:
新しい服のデザイン生成や、バーチャル試着などに応用されています。

発表順	GANモデル	説明文	応用分野
2014年	GAN (Generative Adversarial Networks)	生成器(Generator)と識別器(Discriminator)という2つのネットワークを競合させながら学習させることで、実データに近いデータを生成します。	画像生成、動画生成、音声生成、テキスト生成、データ拡張、異常検知
2014年	Conditional GAN (CGAN)	GANに条件情報を加えることで、特定の条件を満たすデータを生成できるようにしたモデルです。例えば、特定のクラスの画像や、特定のスタイルの画像を生成することができます。	条件付き画像生成、テキストから画像生成、画像編集
2015年	LAPGAN (Laplacian Pyramid GAN)	画像の多段階生成を行うGANモデルであり、低解像度の画像から始めて、徐々に高解像度の詳細を追加していくことで、高品質な画像を生成します。画像の階層的な構造を捉えることで、よりリアルな画像を生成できる点が特徴です。	高解像度画像生成、画像編集
2015年	DCGAN (Deep Convolutional GAN)	畳み込みニューラルネットワーク(CNN)をGANに応用することで、画像生成の精度を向上させました。GANの学習を安定化させるための工夫が施されており、比較的扱いやすいモデルとして知られています。	高解像度画像生成、画像編集、動画生成
2016年	infoGAN (Information Maximizing GAN)	生成器に入力する潜在変数と生成される画像との間の相互情報量を最大化することで、潜在変数と画像の特定の属性との間に意味のある関係性を学習するGANモデルです。例えば、潜在変数を操作することで、生成画像の特定の属性（髪の色、表情など）を制御することができます。	潜在変数による画像生成の制御、表現学習
2016年	StackGAN	テキストから高解像度の画像を生成するために、複数のGANを積み重ねたモデルです。段階的に画像を生成することで、より詳細な画像を生成することができます。	テキストから高解像度画像生成
2017年	WGAN (Wasserstein GAN)	GANの学習を安定化させるために、Wasserstein距離と呼ばれる新たな損失関数を導入したGANモデルです。従来のGANに比べて学習が安定しやすく、高品質な画像を生成できることが期待されています。	高品質画像生成、画像編集
2017年	Pix2Pix	画像から画像への変換を行うGANモデルであり、例えば、白黒画像をカラー画像に変換したり、航空写真を地図画像に変換したりすることができます。ペアとなる画像データを用いて学習を行う点が特徴です。	画像変換（白黒画像からカラー画像、航空写真から地図画像など）
2017年	CycleGAN	画像のスタイル変換を行うGANモデルであり、例えば、馬の画像をシマウマの画像に変換したり、風景画を印象派風に変換したりすることができます。教師データとしてペア画像を必要としない点が特徴であり、様々な応用が可能です。	画像スタイル変換（馬からシマウマ、風景画のスタイル変換など）
2018年	StyleGAN	高解像度で写実的な画像を生成することができるGANモデルであり、特に顔画像生成において高い性能を発揮します。生成画像のスタイルを細かく制御できる点が特徴であり、多様な画像を生成することができます。	高解像度顔画像生成、画像スタイル制御

Discussion

ログインするとコメントできます