🐢

『Kling AI』で1枚の画像を動画に!作成ポイントとAI動画活用例

2024/09/16に公開

私は、検索やちょっとした相談事から、ソースコードや画像、3Dモデルの作成など、さまざまなシーンで生成AIを活用しています。最近、動画を生成するAIを試してみて、「これほどのものがもう世の中に存在するんだ!」と本当に驚かされました。そこで、ぜひ紹介したいと思い、この記事を書きました。

以下をご覧ください。これは一枚の画像から動画を作成した様子です。まず、FLUX.1という画像生成AIを使って「カメおじさん」を作成します。


FLUX.1で作成した「カメおじさん」画像

この画像も既に踊りだしそうで、これはこれで凄いのですが、さらにこれを動画生成AIに与えると、次のような10秒の動画が生成されます。

https://www.youtube.com/watch?v=uH8IIoh3IF4

何と言いますか、本当に楽しそうに踊っているではありませんか!私がその場にいたなら、踊りの輪に加わりたいくらいです🐢

このような動画の作成を可能にしたのが「Kling AI」という動画生成AIツールです。商用サービスで、自身のPCにインストールする必要もなく、非常に簡単な操作で動画を作成することができます。

Kling AIで動画を生成した後、それらと各種素材をうまく組み合わせて動画編集ソフトで編集すると、次のような映像作品も作れるようになります。

https://www.youtube.com/watch?v=e9NK0dW7yf0

今回は、このAIツールを用いた動画生成の基本的な方法と、生成した5秒から10秒のAI動画をどのように活用するかについて例を紹介します。
なお、ブログの最後に「Tales of the Fortress 要塞物語」の続きの動画「The Secret of Turtle Red Eye(タートルレッドアイの謎)」と「Turtle Village -A Tourist's Guide-(タートルビレッジ観光ガイド)」を用意しております。ブログを一通り読んで、ちょっとリラックスしたいときに見ていただければ幸いです。


続きの動画のサムネイル(特典映像の章で公開しています)

ブログの構成

このブログは、次の6つの大きな章からなります。各章の概要については、次の図をご覧ください。


ブログの構成

インプット画像の作成

動画生成AIのインプットとなる画像について、次の内容を説明します。

  • 画像を用意する理由
  • 画像生成AIの紹介
  • 画像作成のポイント

画像を用意する理由

動画生成AIは、プロンプト(指示文)だけで動画を作成できますが、イメージ通りの動画を作るのは難しいことがあります。特に、Kling AIのような商用サービスでは、動画を作成するたびにクレジットやポイントを消費するため、何度も試行錯誤するのは避けたいところです。
そこで、あらかじめ画像生成AIでイメージに近い画像を作成し、それをインプットとして動画を作成します。こうすることで、イメージに合った高品質でリアルな動画を効率的に作成できます。

画像生成AIの紹介

目的の動画を作成するためには、適切な画像を用意することが重要です。画像生成AIを使うことで、イメージに合った画像を簡単に作成できます。以下に、主要な画像生成AIを一覧で紹介します。


画像生成AI一覧(クリックで拡大)

私はFLUX.1を使用して画像を生成していますが、これらの画像生成AIの中から目的に合ったものを利用してみてください。詳しい画像生成AIの使い方は、このブログでは触れませんが、「画像生成AI名 使い方」などで検索すると、分かりやすい使い方を解説しているブログや動画がたくさん見つかりますので、そちらを参考にしてみてください。

手軽に画像生成AIを試してみたいのであれば、GoogleのImageFXやMicrosoftの汎用AIであるCopilotから利用できるDALL-E3がオススメです。

画像作成のポイント

動画にした時に「期待する目的の登場人物」が「このように動いてほしい」というイメージを画像の時点で表現することが大切です。冒頭で紹介したカメおじさんに再び登場してもらいますが、この画像は楽しそうにダンスを踊っているように見えませんか?少なくとも愉快な様子は伝わってくると思います(残念ながら背後の観光客は誰も見ていないのですがw)。


再び登場する「カメおじさん」

カメおじさんは次のようなプロンプトで作成しました。

カメおじさんのプロンプト(日本語)
カメのマスコット人形の着ぐるみを着た老人男性がダンスを踊るシーンです。
自由の女神と観光客が背景に広がります。
登場人物は、カメのマスコット人形の着ぐるみを着た老人男性です。
カメの着ぐるみの老人男性は、頭の部分の人形を外して、リアルな人間の顔を晒しています。
カメの着ぐるみの老人男性は、観光客相手に楽しそうに笑顔でダンスを踊っています。
カメの着ぐるみは、フワフワ、モフモフして着心地が良いです。
カメの着ぐるみの老人男性の衣装は、可愛らしい亀の着ぐるみです。

また、スマホで撮影したような感じを出すために、縦画像にしたのもポイントです。このように、動画生成AIで動画を作成する際は、事前の画像作りが非常に重要です。この段階でしっかりとイメージを固めておきます。

AIで動画を生成

動画生成AIのそのものに関連して、次の内容を説明します。

  • 動画生成AIの紹介
  • Kling AIを選択した理由
  • Kling AIによる動画の作成方法
  • 動画生成のコツ

動画生成AIの紹介

私はKling AIを好んで利用していますが、サービスに対する要求や動画に対する感じ方は人それぞれです。色々なサービスを比較してみてください。以下に、主要な動画生成AIを一覧で紹介します。


動画生成AI一覧(クリックで拡大)

このブログではKling AIについてのみ詳しく解説します。その他の動画生成AIについては、画像生成AIの一覧を示した時と同様に、検索していただくことで、分かりやすく解説したブログや動画などの解説サイトを見つけることができると思います。

Kling AIを選択した理由

私は、Kling AIを利用する前にいくつかの動画生成AIを試しました。
Stable Video Diffusionは、初めて利用した動画生成AIです。動画が動いた瞬間はとても嬉しかったのを覚えています。ただ、25フレーム、6fpsあたりに最適化されているようで、基本的には短時間の低フレームレートの動画となります。
Luma Dream Machineは、初めて利用した商用サービスの動画生成AIです。簡単な操作で高品質の動画を生成でき、とても驚きました。また、無料アカウントでも素早く生成できたのも好印象でした。
そして、さらに探していた時に出会ったのがKling AIです。Kling AIを選択した理由は次の通りです。

  • 圧倒的に高品質な出力動画

    • 公式サイトのサンプル動画を見ていただければ分かると思いますが、本当に高品質な動画に驚かされました!
  • 初めてでも使いやすいインタフェース

    • 画像を用意して、短いプロンプトを入力し、僅かな設定をするだけで動画が作成できます。
  • 丁寧で分かりやすい解説サイトの提供

    • 画像や動画生成の全てのエッセンスを詰め込んだ解説とその出力結果が丁寧に示されたサイトが公式から提供されています。

以下に公式サイトのリンクを示しますので、まずはサンプルを見てみてください。

https://klingai.com/

Kling AIによる動画の作成方法

事前準備

まず事前準備として、アカウント作成とサブスクリプションへの加入(任意ですが加入をオススメします)が必要になりますので解説します。

●アカウントの作成

まず、利用にあたってはアカウントの作成が必要になります。

  1. https://klingai.com/(公式サイト)にアクセス
  2. ホーム画面右上のSign Inをクリック
  3. Welcome to KLING AIのポップアップ画面が表示されるので、Sign up for freeをクリック
  4. 表示される内容に従って、必要事項を入力し、アカウントを作成

●ベーシックユーザー(無料プラン)

無料で利用できるプランです。2024年11月のアップデートにより、生成速度が向上し、最新のモデルが利用可能になりました。まずは、この無料プランでどのような動画が作れるか試してみることをおすすめします。

  • 毎月366クレジットを付与(1ヶ月有効)
  • プロフェッショナルモードを5回まで使用可能
  • ビデオ拡張を2回、最大3分まで延長可能

以前は、無料プランの場合、動画作成が99%で止まり、2日ほど待たされることもありました。また、最新のモデルも試すことができませんでした。今回のアップデートは非常に嬉しい改善です。

●アドバンスユーザー(サブスクリプション)への加入

サブスクリプションプランの魅力は、Kling AIのすべての機能を利用でき、クレジットの範囲内で多数の動画を作成できることです。例えば、Standardプランの場合、毎月660クレジットが付与される他に、毎日ログインボーナスとして当日限定(翌日繰越し不可)の66クレジットが付与されます。つまり、月あたり最大で660クレジット + 66クレジット × 30日 = 2640クレジットが付与されることになります。動画の本数にすると次の通りです。

  • Kling 1.0

    • 標準モード(5秒)= 10クレジット → 264本
    • プロモード(5秒)= 35クレジット → 75本
  • Kling 1.5

    • 標準モード(5秒)= 20クレジット → 132本
    • プロモード(5秒)= 35クレジット → 75本

実際にこのブログで紹介している2~3分のストーリー性のある動画を作成しようと思った場合、思い通りの動画を作成するために試行錯誤しつつ、だいたい30本~40本の動画が必要(5秒・10秒・Lip Sync動画合わせて)になります。

サブスクリプションの加入方法は次の通りです。

  1. ホーム画面右上にあるSubscription programをクリック
  2. サブスクリプションのメニューが表示されるので、ポップアップ画面左上のMonthly Saverを選択
    ※本来はYearly Saverが安いのですが、キャンペーン中は初月のみ〇% Offのような割引をMonthly Saverで行っています。1か月間はこちらでサブスクして、気に入ったら年間契約に切り替えるのも良いでしょう。
  3. いくつかプランが表示されるので、まずはStandardを選択
  4. プラン説明の下にあるSubscribe Special OfferSubscribe Monthlyなどのボタンをクリック
  5. 必要なクレジットカード情報などを入力して完了

無料プランで動画作成に慣れてきて、もっと動画を作成してみたい、ストーリー性のあるものを作成してみたいと思ったら、サブスクリプションプランも検討してみると良いでしょう。

動画作成

いよいよ動画を作成していきます。本当に簡単ですので、ご安心ください👍

  1. ホーム画面でAI Videosをクリック

  2. KLING Createve Space画面が開いたら、動画のAIモデルを選択
    KLINGのAIモデルをKLING1.0KLING1.5を選択します。
    KLING1.0モデル:安価なコスト
    KLING1.5モデル:高画質、ダイナミックな動作、プロンプトへの高い追従性

  3. Image to Videoを選択

  4. Image and Promptの項目にベースとなる画像と、動画に与えるプロンプト(指示文)を入力

    • プロンプトは入力しなくても動画作成は可能ですが、目的の動画を作成するのが難しくなるため、入力した方が良いです。
    • プロンプトは英語で入力します。
  5. Settingの項目を設定

    各設定項目の意味は次の通りです。

    • Creativity/Relevanceスライダー
      • Creativity:
         AIが創造性豊かで自由な発想で動画を生成
      • Relevance:
         AIがプロンプトに忠実な動画を生成
    • Mode
      • Standard Mode:
         より速い生成速度を優先し、迅速に少ない費用で動画を生成
      • Professional Mode:
         より良いビジュアルで、豊かなディテールと優れた品質の動画を生成
    • Length
       5秒/10秒、選択した長さの動画を生成
    • Number of Generations
       一度に作成する動画の数を設定
  6. Generateボタンを押して動画を生成

    • 動画の生成は、数分程度で完了します。
    • Camera Movementは、Text to Videoの機能のため使用しません。
    • Negative Promptは、どうしても禁止したい要素があれば入力しても良いですが、基本は空欄で良いです。
  7. 作成が完了した動画を選択して、ダウンロード

    • サブスクリプションに加入すると、ウォーターマーク(透かし)無しでダウンロードできます。
  8. 無事に動画が完成(動画再掲)

https://www.youtube.com/watch?v=uH8IIoh3IF4

動画生成のコツ

動画生成のコツとして、動画用のプロンプトと私の動画Settingについて述べます。

動画用のプロンプト

まず、カメおじさんの動画を作るときのプロンプトは次のようにしました。

カメおじさんの動画用プロンプト(日本語)
マスコット人形の着ぐるみを着た老人男性が、楽しそうに全身を使ってダンスを踊るシーンです。
しかし、マスコット人形の着ぐるみを着た老人男性の背後の人々はその場から去っていきました。
マスコット人形の着ぐるみを着た老人男性は、一人になっても踊り続けた。

しかし、実際に生成された動画では、背後の人々は立ち去るどころか優しくおじさんを見守っていました。このことから、あまり長いプロンプトを指定しても、全てが動画に反映されるわけではないことが分かりました。

後から確認して分かったのですが、Kling AI公式のベストプラクティス集によると、本当に短いプロンプトで良いようです。ただし、次の内容を含んでおくと、よりイメージに近く、高品質な動画が生成されるようです。

  • 動画の主役、主人公
  • どのような動作をするのか
  • シーンの背景

詳細な解説については、次のリンク先に記載がありますので、機械翻訳するなどして読んでみてください。

KLING AI Guide(Image-to-Video) ※リンク先へジャンプ

また、画像生成やプロンプトからの動画生成について書かれたマニュアルも存在します。これらを読むだけで、画像や動画の作成に関する重要なポイントを把握できると思います。

KLING AI Best Practices ※リンク先へジャンプ

私の動画Setting

私は次のSettingを行って動画生成を行っています。もしよければ参考にしてください。

  • AIモデル
    KLING1.5モデルを使用します。
  • Creativity/Relevance
    基本は0.4~0.5に設定して動画生成AIが生成する予想外の展開も少し楽しんでいます。プロンプトにある程度忠実にしたい場合でも0.6~0.7に設定して、少し余白を残すようにしています。
  • Mode
    基本はProfessional Modeにしています。今まで生成した動画で満足度が高いものは、ほとんどがProfessional Modeで作成された動画です。
    ※ただし、KLING1.5モデルでStandard Modeが利用できるようになり、出力品質も高いため、今後はStandard Modeも織り交ぜて利用していく予定です。
  • Length
    基本は10秒です。そこから編集で5~8秒を切り出して利用することが多いです。
    ※出力された動画が丸々想定通りということは少なく、5秒だと切り出して利用する余地が少ないため、10秒にしています。
  • Number of Generations
    基本は1です。

以上で、AIによる動画生成の説明は終了です。お疲れさまでした🎉ここまでの内容を理解すれば、きっと目的の動画を作ることができるようになると思います。
引き続き、生成した動画の活用例について、よろしければお読みください。

生成した動画の活用例

生成した動画の活用例を紹介します。静止画が動画として動き出すだけでも十分に楽しいのですが、せっかくですので、その作成した動画を用いてさらに面白いことができないかと考えてみました。そこで思いついたのが、学習塾のCMのような動画を作ってみることでした。

  1. ベース画像の準備
    次のような学生がNo.1みたいなポーズをしている、いかにも学習塾っぽい画像を作成しました👆

    FLUX.1(anzu_flux)を利用して生成した画像
  2. 動画のプロンプトとSetting
    生成動画用のプロンプトは、この時点では、何かを熱く語りながらそのまま腕を上にあげて、No.1ポーズみたいなのを想定して、次の内容を与えました。
    また、動画の設定はCreativity/Relevance0.5、ModeProfessional Mode、Length5としました。
ポーズを決める女子高生(日本語)
Japanese:
女子高生は、賑やかな教室でよく喋ります。
女子高生は、片手を上に突き上げ、勝ち誇ったポーズをとります。
----
English:
This is a high school girl talking very much in a busy classroom. 
The high school girl thrusts one hand upwards and strikes a victorious pose.
  1. BGMの用意
    BGMはYouTubeオーディオライブラリを利用しました。こちらの音源であれば、YouTubeで使う分にはライセンスの心配が無いため安心です。

  2. 動画編集ソフトで編集
    動画はこのように編集ソフトを使い、一つ一つの動画をつなぎ合わせながら仕上げていきます。

    動画編集画面(filmora)

私は最近、有償のツールであるfilmora(フィモーラ)を購入しました。最新のバージョンにはAI機能が盛りだくさんで、これらの機能をうまく活用すると、編集作業をとても楽に行うことができます。

https://filmora.wondershare.co.jp/

また、有償のソフトはちょっと...という方も無料で使えるオープンソースの動画編集ソフトOpenShot Video Editorがあります。基本的な編集であればこちらでも十分です。

https://www.openshot.org/ja/

  1. CMの完成
    そして、完成したのがこちらの動画です。若干、AIが生成した動画に寄せている感はありますが、無事完成させることができました。ちなみに最後に出てくる企業ロゴ風のマークも生成AIで作成しています。

https://www.youtube.com/watch?v=bUBMZH-UmFY

「Suno」は、非常に高品質なAI楽曲作成サービスです。このサービスを利用してテーマソングを作成し、動画に合わせました。このように、他のAIツールやコンテンツを組み合わせることで、さらに魅力的な作品を作ることができます。

https://www.youtube.com/watch?v=7DbIfF9zrFg

ちなみにKling AIは、作成済みの動画の長さを後から拡張することができます。この動画素材も曲に合わせて5秒から10秒に拡張しました。生成した動画の左下にExtendボタンがあります。自動で長くする方法と、長くしたい部分のプロンプトを指定する方法の2パターンがあります。


動画の長さ拡張

機能詳細説明

この章では次の機能について、より詳細に説明します。Kling AIに対する知識を深めることで、思い通りの魅力的な動画を作成して、共有できるようになります。

  • KLING 1.5モデル
  • モーションブラシ機能
  • リップシンク機能
  • コミュニティ機能

それでは、それぞれの機能について見てみましょう。

KLING 1.5モデル

KLING 1.5モデルは、1080p HDビデオの生成が可能で、大画面向けに最適化された美しい映像を提供します。また、より自然な動きとテキストの応答性が向上しており、視覚的に魅力的なコンテンツを作成することができます。
動画作成の手順で示したモデル選択のリストでKLING 1.5を選択することで利用できます。
なお、これまでKLING1.5モデルはProfessional Modeのみでしたが、2024年11月のアップデートでStandard Modeも利用できるようになりました。違いは次のとおりです。

  • Standard Mode
    • 消費クレジット:20クレジット(5秒)/40クレジット(10秒)
    • 生成時間:3分~5分
    • 動画解像度:720p HD
    • モーションブラシ:利用不可
    • カメラコントロール:利用不可
  • Professional Mode
    • 消費クレジット:35クレジット(5秒)/70クレジット(10秒)
    • 生成時間:10分~15分
    • 動画解像度:1080p HD
    • モーションブラシ:利用可能(5秒のみ)
    • カメラコントロール:利用可能(5秒のみ)

Standard Modeの出力品質の高さには驚かされます。さらに、Professional Modeは人物の細かな動作や物の動きなどの表現が豊かです。また、Professional Modeはモーションブラシやカメラコントロールが利用できるため、より思い通りの動画を作成できます。重要なシーンではProfessional Modeを利用し、ちょっとした映像の差し込みにはStandard Modeを使い分けると良いでしょう。

次の内容は、Professional Modeでのプロンプトの追従性を確認しています。少し特徴的なプロンプトを設定してみました。

タートル学習塾のプロンプト(日本語)
女子高生は、僅かに微笑みながら親指を立て、喜びを表現します。
女子高生は、表情をキープします。
背後の学生たちは、立ち上がり両手を上げて最高潮に盛り上がります。
画面の両端からクラッカーと紙吹雪の効果的な演出があり、画面を明るい雰囲気にします。

そして結果はこちらです。

https://www.youtube.com/watch?v=bPqzKhWJwE0

指が親指か人差し指かという些細な違いはありますが、それ以外はプロンプトの指示通りです。一回の生成でこの品質と追従性はシンプルにすごいです!基本はKLING1.5モデルで良いと思います👍

モーションブラシ機能

モーションブラシ機能は、特定のオブジェクト(手、顔、背景の木々、ボールなど)の動きを指定できる機能です。今まではプロンプト任せで、結果がどうなるか予測しづらい部分もありましたが、この機能を用いることでコントロールすることができます。
なお、この機能は以前はKLING1.0モデルでしか利用できませんでしたが、2024年11月のアップデートでKLING1.5モデルでも利用できるようになりました。

まずImage to Videoを選択して、必要な画像とプロンプトを用意したら、設定項目のMotion BrushDraw Motionsをクリックします。


モーションブラシ設定

画面右側のAdd Movement PathAreaを選択して、動かしたい対象物を選択します。画面上部のAuto-SegmentationをONにすると、対象物の形を自動で認識して選択してくれるようになります。対象物は1つのAreaでまとめて指定しようとせず、小分けにAreaを設定したほうが期待する動作になりやすいとユーザーマニュアルに書いてありましたので、参考にしてみてください。


対象物のArea選択

Areaの設定が終わったら、画面右側のAdd Movement PathPathsを選択して、それぞれのAreaの動きを定義します。動きはPCの場合、左クリックしながらマウスを動かして描きます。今回は指と顔が画面向かって左側を向き、髪が反動でなびくようなシーンを想定して、Pathを設定しました。


対象物のPath指定

なお、ここでは割愛しますが、動かしたくないAreaを設定するためのStatic Areaというものがあります。例えば、背景で動かしたくないオブジェクトがあるときなどに指定します。

これらの指定が終わったら、Confirmボタンで設定を完了します。

元の画面に戻ったら、プロンプトを設定します。このプロンプトも大切で、動きとある程度一致するような形で記載する必要があります。そうしないと期待する動作をしないようです。

タートル学習塾のプロンプト(日本語)
女子高生は、人差し指を画面の左上に掲げます。
女子高生は、僅かな笑顔の表情で横を向き、人差し指を見つめます。
女子高生の髪は、首を振った反動で反対側にフワッとなびいています。

ここまでの一連のモーションブラシ機能の設定と、プロンプトの関連などについては、次の公式ドキュメントに記載があります。成功する方法や失敗する原因が詳しく書いてありますので、読むことをオススメします。

Motion Brush User Guide ※リンク先へジャンプ

そして、モーションブラシ機能を用いて作成した動画がこちらになります。

https://www.youtube.com/watch?v=n7NnztJQqYM

指と顔の動きは、ほぼ期待通りのものでした。一方で、髪の動きには効果が見られませんでした。これは、AreaやPathの指定が適切でなかったのか、プロンプトが不十分だったのかもしれません。それでも、モーションブラシ機能の効果を確認するには十分な結果となりました。

また、別の動画でモーションブラシを使用した事例も紹介します。

人物の手を上にあげさせています。1つの領域に1つのパスしか指定できないので、左右別々に領域を設定して、それぞれパスを指定します。

人物の手を操作するモーションブラシ

鶴と亀を別の方向に移動させています。対象物だけのパスを設定すると、背景がダイナミックに変化することがあるため、背景は全般的にStatic領域に設定しています。また、同じ2匹の亀でも別々に領域を指定して、パスを設定しています。このことはKlingのマニュアルにも推奨事項として記載されています。

複数のオブジェクトを移動しつつ、背景を固定するモーションブラシ

KLING 1.5モデルは確かに美しい動画が生成されますが、オブジェクトが指示通りに移動しないケースもよくあります。このようなときにKLING 1.0モデルとモーションブラシの組み合わせは非常に有効です。いくつか動画を作成して、その効果を実感しました。
なお、これらのモーションブラシの効果を確認したい場合は、ブログ末尾の「特典映像」の章の動画をご参照ください。

以上で、Kling AIアップデートの説明は終わりです。

リップシンク機能

リップシンク機能は、音声データ(ナレーションや音楽など)に合わせて、動画の口の動きを連動させるものです。以下に手順を示します。

  1. 動画をKling AIで作成し、用意します。

    • KLING 1.5、1.0モデルどちらで作った動画でも構いません。
  2. 音声や音楽データを用意します。

    • 動画と音声の長さは、できる限り合わせるようにします。
    • 私はVOICEPEAKという有償ソフトを使用して合成音声を作成しました。

      VOICEPEAK(合成音声ソフト例)
  3. 手順1で用意した動画を開き、動画左下のMatch Mouth Typeボタンをクリックします。

    Match Mouth Typeのボタンの位置

  4. 少し待つと次のような音声データを登録する画面が表示されるので、ここに音声データをドラッグ&ドロップします。

    音声データ登録前の画面

  5. 音声データのアップロードが完了すると次の画面が表示されるので、右下のLip Syncボタンを押します。

    音声データ登録後の画面

    • 消費するクレジットは以下の通りです。
      • 5秒動画 = 5クレジット
      • 10秒動画 = 10クレジット
  6. 作成が完了すると、音声に口の動きが連動した動画が生成されます。

https://www.youtube.com/watch?v=jH7DJMd9tVY

また、今まで作ってきた映像にもリップシンク機能を試してみました。こちらもご覧ください。

https://www.youtube.com/watch?v=fYUqur4M_V4

コミュニティ機能

コミュニティ機能は、自身が作成した生成物をKlingのコミュニティに共有する機能です。

  1. TOP画面から「Community」を選択します。

    Communityの位置

  2. 「Publish」ボタンを押下します。

    Publishボタンの位置

  3. 必要事項を入力して、「Publish」します。

    • 動画をアップロードしないと「Publish」ボタンはグレーアウトのままで押せません。

      投稿記載例
  4. 投稿後しばらく待ち、動画の内容に問題が無ければ、次のような通知が届きます。

    投稿結果成功
    英語の日本語訳
    システム通知 投稿成功
    素晴らしい仕事です!あなたの作品は無事に投稿されました。クレジットがあなたのアカウントに追加されました。特別オファー:今すぐ、短編映画ごとに666クレジット、ビデオ素材ごとに36クレジット、画像素材ごとに6クレジットを獲得できます。(注:獲得したクレジットは1か月間有効です。)今すぐ作成を開始して、さらに多くのクレジットを獲得しましょう!
    なお、次のような注意点があります。

    • 投稿した内容は内部でチェックされているようで、結果が出るまで少し時間がかかります。
    • あまりにも短い投稿はチェックではじかれるようです。5秒の動画にBGMと音声をつけたものはNGでした。一方で20秒くらいの動画はOKでした。

動画サンプル集

Kling AIで生成した動画に、編集ソフトで効果音やBGMを追加してみました。元の素材が良いので、少し手を加えるだけで映像作品として仕上がるのがすごいと思います。ご覧ください。

なお、BGMや効果音などは、YouTube Studioのオーディオライブラリから入手することができ、著作権使用料無料で利用できます。ごく一部のBGMについては帰属表示(公開時にアーティスト名などの情報を記載する)が必要な場合がありますので、ライセンスをよくご確認ください。

YouTube Studio ※リンク先へジャンプ
※リンク先に飛ぶとGoogleアカウントを入力する画面が表示されることがあります。気になる方は、自身で検索いただき、公式サイトよりアクセスください。

YouTube Studioの画面が開いたら、画面左のメニューからオーディオライブラリを選択してください。


YouTube Studio オーディオライブラリ

それでは、以降のサンプル動画集をお楽しみください。

モーションブラシ機能でオブジェクトをイメージに近い形で動かしました。また、2種類の効果音を追加するだけでそれらしくなります。なお、少々強引な発艦で、地上の人々は大変そうではありますが、諸々ありえない現象を再現できるのもAIの良いところ(?)です。
https://www.youtube.com/watch?v=ja0Bc3ttezM


モーションブラシの設定

KLING1.5モデルで生成した動画にBGMを追加しました。これから宇宙を舞台にした物語が始まりそうです。船体を緑にしたのは銀河英雄伝説の影響です。
https://www.youtube.com/watch?v=zW5vSZP8gT8

こちらも、KLING1.5モデルで生成した動画にBGMを追加しました。まるでサスペンスのワンシーンのようです。動画の後半で目線を下にやるしぐさが自然です。
https://www.youtube.com/watch?v=NNgHEnLHBkU

こちらは、KLING1.5モデルで生成した動画に字幕を追加しました。文字を追加するだけで、日本語吹き替えの洋画のような雰囲気になりました。絵師が動き出そうとする絵画を制しつつ「絵は動かないですよ」と誤魔化し、絵がしぶしぶ動くのをやめる様子がよく表現されています。また、魔法のような現象を少し自慢気に語る女性も、自然な感じが出ています。
https://www.youtube.com/watch?v=AmLY3eCWgrs

少しでも何かの参考になれば幸いです。

特典映像

最後までブログを読んでいただき、本当にありがとうございます!
ブログ冒頭でご紹介しました「要塞物語」で登場した"タートルレッドアイ"の謎に迫る続きの動画です。もしお時間がございましたら、ご覧ください。

https://www.youtube.com/watch?v=BQ0AT1E7vCM

使用したツールは次の通りです。

  • 動画生成AI:Kling AI
  • 画像生成AI:Flux
  • 合成音声AI:VOICEPEAK 商用可能 6ナレーターセット
  • 編集ソフト:Filmora
  • BGM(音楽AI): Filmora Generative Music
  • 字幕英訳:Copilot(GPT4)/ChatGPT/Gemini

さらに、タートルビレッジという小さな村の観光ガイドビデオを作成しました。一見すると村の紹介動画ですが、予想外の展開を楽しんでいただけると思います。前作(The Secret of Turtle Red Eye)との関連も・・。

https://www.youtube.com/watch?v=l3qHAIK-fy4

使用したツールは次の通りです。

  • 動画生成AI:Kling AI
  • 画像生成AI:SDXL
  • 合成音声AI:VOICEPEAK 商用可能 6ナレーターセット
  • 編集ソフト:Filmora
  • BGM(音楽AI): Filmora Generative Music
  • 字幕英訳: GPT4o、Claude3.5 Sonnet、Gemini
    ※英語字幕は、GPT4oとClaudeに日本語を英訳してもらい、それをGeminiに評価してもらうという方法を取っています。最終的にどれを使うかは、私のなけなしの英語能力による判断なのですが、ニュアンスの近そうなものを選択しています。

ここまでブログを読んでくださった方は、きっとこのような動画作成できるようになると思いますので、チャレンジしてみてください。

まとめ

動画生成AI「Kling AI」を用いた一連の動画の作り方から、サンプルCMを作成する活用例を示すことができました。また、発展的な機能の詳細やストーリー性のある動画についてもご紹介しました。
私自身、普段はエンジニアとしてロボットやシステム開発を行っており、映像制作は全くの専門外です。AIという文脈で趣味として触っているだけですが、それでもAIを利用することでここまでのことができるようになりました。AIは人間の能力を拡張する素晴らしいパートナーだと思います。

この記事を読んだ方も、ぜひ新しい世界にチャレンジしてみてください。もし、分からないことや疑問がありましたら、遠慮なくコメント欄に書き込んでください。🐢

最後まで読んでくださり、ありがとうございました!

リンク

私が書いたAI関連の記事のリンクを紹介します。興味があればぜひご覧ください。

Tripo 2.0というAIで3Dモデルを生成する技術に関する記事です。下の記事のTripoSR後継モデルで、精度が劇的に向上しています。モノづくり、動画、VRなど幅広い分野に応用できる可能性があります。現在は未実装ですが、3Dワールドの生成やヒューマノイドモデルを自在に動かして動画を作成する機能もリリース予定とのことで、今後の展開が非常に楽しみです。

https://zenn.dev/safubuki/articles/turtle-20240929-tripo2-evo

上記のTripo 2.0の元となったAIで3Dモデルを生成する技術に関する記事です。ローカル環境ではいくらでも生成できるため、全くメリットが無くなったわけではありません。技術の変遷を確認する意味でも、読んでみると良いかもしれません。3Dモデル作成における画像生成のコツや成功・失敗事例なども記載しており、楽しんでいただけると思います。

https://zenn.dev/safubuki/articles/turtle-20240721-tripo-3dp

TripoSRの後継モデル「Stable Fast 3D」に関する記事です。Stable Fast 3Dは、Tripo AI社と提携しているStability AI社がリリースし、3Dモデルの出力品質が向上しました。使い方やStable Fast 3DとTripoSRの出力結果の比較など、興味深い内容が多数含まれています。TripoSR、Stable Fast 3D、そしてTripo 2.0の順でリリースされました。

https://zenn.dev/safubuki/articles/turtle-20240803-stable-fast

GitHub CopilotというAIを利用したコーディングツールの記事です。プログラミングに興味がある方は、こちらの記事も読んでみてください。AIをうまく活用すると、モノづくりの速度が改善します。

https://zenn.dev/safubuki/articles/turtle-20240223-gitcopilot

更新履歴

更新履歴は折りたたみ表示にしています。
確認したい場合は、以下のバーをクリック(タップ)してください。

更新履歴(最終更新日:2024/11/24)

更新履歴

  • 2024/11/24

    • 新規機能の追加でブログの構成が分かりづらくなっていたので、全体的に見直して整理しました。ブログの構成の章に全体像の図を追加更新しました。
    • 追加機能解説①、③を、機能詳細説明という章に集約しました。
    • 導入文にTurtle Village -A Tourist's Guide-の説明を追加しました。
    • ベーシックユーザー(無料プラン)のアップデートに伴い、文章を見直しました。
    • アドバンスユーザー(サブスクリプション)の記述を無料プランのアップデートに合わせて見直しました。
    • 動画作成手順にKling AIモデルを選択する手順を追加しました。
    • 私の動画Settingを最新の状況に合わせて修正しました。
    • KLING 1.5モデルにStandard Modeが追加されたため、説明を追加しました。
    • KLING 1.5モデルのProfessional Modeでモーションブラシとカメラコントロールが利用できるようになったため、記述を更新しました。
    • モーションブラシ機能がKLING 1.5モデルでも利用できるようになったため、KLING 1.0モデルでしか使えないという記述を削除しました。
    • リップシンクの説明で不要な動画を削除しました。
    • 特典映像にTurtle Village -A Tourist's Guide-動画を追加しました。
  • 2024/10/21
    特典映像(タートルレッドアイの謎)を差し替えました。

    • 字幕を日本語にしました。
    • セリフの日本語イントネーションが不正確な個所を修正しました。

    モーションブラシの解説を新たに2つ追加しました。

  • 2024/10/20
    特典映像(タートルレッドアイの謎)を追加しました。
    ブログ冒頭の文章を修正しました。
    有償の動画編集ツールをFilmoraをメインで使っているため差し替えました。
    文章全般に「ぜひ」が多かったので削減しました。
    更新履歴の表示方法を見直しました。

  • 2024/10/06
    ブログの導入部分に、動画生成AIによる映像作品例を追加しました。

  • 2024/10/04
    コミュニティ機能で投稿した動画の結果通知内容を追加しました。

  • 2024/10/03
    リップシンク機能の章に新たな動画を追加しました。

  • 2024/10/02
    アップデートされた、リップシンク機能とコミュニティ機能について解説を追加しました。

  • 2024/09/30
    Tripo 2.0リンク及び、説明文を追加しました。
    TripoSRの記事紹介文の内容を見直しました。
    Stable Fast 3Dの記事紹介文の内容を見直しました。

  • 2024/09/28
    動画サンプル集に動画を追加しました。

  • 2024/09/24
    YouTube Studio オーディオライブラリの説明を、動画サンプル集の説明文に追加しました。

  • 2024/09/23
    動画サンプル集を追加しました。

  • 2024/09/19 ②
    アップデートされた、KLING 1.5モデルの追加と、モーションブラシ機能について解説を追加しました。

  • 2024/09/19 ①
    タートル学習塾のCM風動画の尺を長くし、さらにテーマソングを入れたバージョンを作成して、追加しました。

GitHubで編集を提案

Discussion