👻

【AIメモ】生成AIまとめ

2022/10/06に公開約2,100字

生成 AI がすごい

ここ半年での生成 AI の進化が凄まじいです。
ニュースや Twitter で話題になっていたので、知っている方も多いでしょう。

今回は、有名なモデルや最新のモデルについて紹介します。
大きく 3 つに分類しました。

  1. テキストから画像を生成
  2. テキストから動画を生成
  3. テキストから音声を生成


Created by NekoAllergy


01 画像を生成

📸 リアルな画像を生成「DALL-E2」

https://twitter.com/jaguring1/status/1554431706257850368

公式 ↓
https://openai.com/dall-e-2/

📸 リアルな画像を生成「Stable Diffusion」

https://twitter.com/jaguring1/status/1561845865710485504

公式 ↓
https://stability.ai/blog/stable-diffusion-public-release

📸 二次元イラスト生成「NovelAI Diffusion」

https://twitter.com/jaguring1/status/1577559912393375746

公式 ↓
https://novelai.net/

📸 二次元イラスト生成「ERNIE-ViLG」

https://twitter.com/jaguring1/status/1569685994512986114

公式 ↓
https://huggingface.co/spaces/PaddlePaddle/ERNIE-ViLG

その他

  • ruDALL-E
  • GLIDE
  • CogView2
  • Imagen
  • Parti
  • Midjourney

02 動画を生成

🎥 動画生成「Make-A-Video」

https://twitter.com/THayes427/status/1577341651734839296

https://twitter.com/MetaAI/status/1575495462894723072

🎥 動画生成「Imagen Video」

https://twitter.com/jaguring1/status/1577770376431796224

公式 ↓
https://imagen.research.google/video/

🎥 長時間の動画を生成「Phenaki」

https://twitter.com/jaguring1/status/1575656059472990208

公式 ↓
https://phenaki.video/#interactive

04 音声を生成

🎧 人レベルに近い会話「Whisper」

https://twitter.com/OpenAI/status/1572629923017400326

https://twitter.com/jaguring1/status/1572727974629371904

🎧 環境音を生成「AudioGen」

https://twitter.com/FelixKreuk/status/1575846953333579776

さいごに

生成 AI すごいです。

批判的な意見も多く見られますが、規制を進めたところで、AI 開発の勢いは止まりません。
現状を正しく理解しておくことが、多くの日本人にとって大切なことなのではないかと思います。

参考

小猫遊りょう(たかにゃし・りょう)さんのツイートを参考にさせていただきました。
いつも有益なツイートありがとうございます!
https://twitter.com/jaguring1

人工知能/AI/機械学習をもっと詳しく

ねこアレルギーのAI

ねこアレルギーの AI
YouTube で機械学習について発信しています。お時間ある方は覗いていただけると喜びます。



Created by NekoAllergy

Discussion

ログインするとコメントできます