🎥

Amazon Novaで動画生成してみた

2024/12/09に公開

この記事は株式会社ガラパゴス(有志) Advent Calendar 2024 の9日目です

今回は、先日のAWS reinvent:2024 で発表された 動画生成AIの「Amazon Nova Reel」について、試したみた結果を共有したいと思います。
今回は、Playgroundで触った内容を共有します。ちなみにAPIも利用可能です。

Amazon Novaを使うために

利用可能なリージョンは、以下3つが2024年12月時点で利用可能です。
ただし、Playgroundで触れるのは、バージニア北部だけです

  • バージニア北部/米国東部(us-east-1)
  • オハイオ/米国東部(us-east-2)
  • オレゴン/米国西部(us-west-2)

使い方(Playground)

※事前に、モデルアクセスの申請を通していてください

  1. リージョンをバージニア北部に設定します
  2. 「Bedrock」サービスを開きます
  3. 「Image / Video playground」を選択し、「モデル選択」ボタンをクリックします
  4. 「Amazon」の「Nova Reel」を選択し、「適用」ボタンをクリックします
  5. 以下の画面が表示されるので、いざレッツゴー

※出力される画像については、Playground用のS3 Bucketが設定されており、そこに出力されます
 出力されるまで、4~5分かかります

そのままプロンプトのみで動画生成することも可能です。
ベースとなる画像を参考にし、動画生成することもできます。
興味のある方をぜひ試しましょう。

勝手な僕の意見ですが、動画生成AIは、「高い」「処理時間が長い」というデメリットがあります。そのため、まずは「Flux」等の画像生成AIで、ベースImageを生成してから、動画を生成する方がメリットが高いと思います。
Fluxの話を書いた記事(Flux vs Dalle3)もあるので良かったらみてください。こちら

Amazon Novaを触ってみた感想

こちらの画像をベースに、動画を生成したいと思います。

生成した動画がこちらです

一旦の考察

実際に試した体感ですが、5回くらい試して、そのうち1動画が使える動画になる印象です
※今回のケースでいうと、犬の鼻がおかしくなったり、犬の目がおかしくなったりしました

英語と日本語で比較

日本語だとうまく意図を解釈してくれないケースもありました(なぜか動くときもあります)
そのため、英語でプロンプトを書くことをお勧めします
公式的には、英語のみを参照しているようです

Pricing

~ まだ公式で発表されていない状況 ~

まとめ

動画生成する際は、以下の流れで作るのが、現時点でのベストかと思います。

  1. 画像生成AI等を使って、ベース画像を生成する
  2. 「1.」で生成した画像をもとに、Image-to-Videoで実行
  3. 3~10の動画を生成する
  4. 「3.」で生成した動画からベストを選択する
    Pricingにもよると思いますが、動画を出すまでに時間がかかることを踏まえると、一度に複数の動画を生成した後に最適な動画を選択する方が、コストが減ると考えています。(人件費を踏まえると)
株式会社ガラパゴス(有志)

Discussion