ポン出しで良い感じのPVが作れるか(Suno x Runway)
こんにちは!
京都芸術大学のグループ会社クロステックマネジメントのR&Dでやっていることが、なかなか面白いので、伝えたい。
でも、普通に書くと伝わりにくいので、PVにしてみようと思う(突然)
超ざっくり調査
GPTに雑に調査してもらった感じだと、歌を作って動画を合わせるのが定石という印象。
歌から動画をそのまま作るくらいズボラしたかったけど、あんまり良いソリューションがパッと見なさそうだった(良いサービスあれば教えてください!)
ちなみに、「Kaiber AI」というサービスがめちゃ良さそうだったんだが(リンキン・パークのMVでも使われいる)、改修されて?今は以前の「Kaiber AI」ではなく、「KaiberのSuperstudio」を使う形になっている模様。
(Kaiber AIについては下記の記事がわかりやすかった)
以前の「レガシーのKaiber AI」だと、歌から動画を生成、というのがあったようだが、「Superstudio」では音楽と動画をフロー形式で組み合わせる、という考え方のUIだった。
ということで、割と普通に「Suno」で音楽生成、「Runway」で動画生成でやることにした
Suno
「Suno」を使って音楽生成をする。
R&Dでやっていることの概要をここから取ってきて歌詞を生成させようとしてみる。
が、GUIからだと、インプットの最大文字数が200文字 👻
(API経由だと、V3.5/V4 では最大 3,000文字、V4.5/V4.5PLUS では最大 5,000文字 が使用可能な模様)
一部を入れて歌を作ってみたが、内容があまり伝わらなそう。。
(この辺りで、生成された歌詞や曲調のクオリティから若干の恥ずかしさが早くも発生してきたが、気にせず進んでいく)ちなみに、京都芸術大学の校歌的なものがあるか調べてみた。
あった。
作詞:秋元康
すごいw
そして、AKB48が歌ってた
この学園歌の歌詞を使って、ロックな感じにしたりとかして遊んでみたが、著作権的に公開するのはダメそうなので自重しておく。
著作権切れの歌詞が良いのでは、ということで、著作権切れの「ふるさと」を使うことにしてみる。
とりあえず、ロックな感じにしてみた。
ちなみに、Sunoのモデルは2025.08時点のハイエンドモデルv4.5を利用。他のモデルよりやはりクオリティが高いように感じる(音楽的素養がないので気のせいかもしれない)
Runway
次は、「Runway」を使って動画生成する。
ChatGPTで、ふるさとの歌詞を入れて、いくつかのシーンを作るプロンプトを作ってもらう。
普通に作ると面白くないので、ロックなウサギを登場させるように依頼してみる。
出てきた動画生成用のプロンプトの一部↓
(イントロシーン)
At sunset in the Japanese countryside, mountains and rivers in the distance, golden rice fields stretching wide. Suddenly, a punk rocker rabbit with a mohawk and leather jacket appears, shredding on an electric guitar. Lightning flashes across the sky, and the quiet village transforms into a rock concert stage. Cinematic style, powerful atmosphere, hard rock vibe.
「兎追ひしかの山」のシーン
On the grassy slope of a Japanese countryside mountain, a punk rocker rabbit with a mohawk and leather jacket stands on a stage, gripping a microphone and singing passionately. Behind him, the open fields and a dramatic sunset sky stretch wide, with flashes of lightning and bursts of fire lighting up the scene. Small animals gather like a cheering crowd, bouncing to the rhythm. Cinematic style, energetic and dramatic, overwhelming hard rock atmosphere.
「小鮒釣りしかの川」のシーン
By a clear rural river in Japan, a punk rocker rabbit with a mohawk and leather jacket stands at the riverside, gripping a microphone and singing passionately. The camera focuses on the rabbit in close-up, capturing its fierce expressions and powerful performance. Behind him, sunlight sparkles on the water and lush green trees frame the scene, enhanced with flashes of lightning and bursts of sparks. Cinematic style, energetic and dramatic, emphasizing the commanding presence of the singing rabbit.
「夢は今もめぐりて」のシーン
A dreamlike stage performance. A punk rocker rabbit with a mohawk and leather jacket sings passionately into a microphone under a spotlight. The camera focuses on the rabbit’s expressions, emphasizing the raw emotion in its voice. Behind him, memories appear as floating projections—running through fields, gazing at the sky—layered with glowing dreamy effects. Cinematic and dramatic, blending a surreal atmosphere with the intensity of hard rock.
「忘れがたきふるさと」のシーン
At sunset in a countryside village, a punk rocker rabbit with a mohawk and leather jacket stands at the center, gripping a microphone and singing with soul. The camera tightly focuses on the rabbit, its silhouette glowing against the setting sun. Behind him, golden rice fields and old houses with smoke rising set the scene, enhanced by flashes of lightning and bursts of fire for epic scale. Cinematic and emotional, highlighting the powerful presence of the singing rabbit.
で、途中で一つ教訓。
普通に何も考えずに動画生成をポチると、下記の選択肢が「All」が選択状態になっていて、プロンプトに応じて最適なモデルを作ってくれるということなのだが、最適なモデルとして、Veo3が使われてcreditが一気に600溶ける、という事案発生(他のモデル利用の場合は数十くらいなのに、veo3は桁が一つ多い)
モデルごとの消費credit
これがわかった後も、デフォルトが「All」になってるので600creditを度々溶かしつつ、「Runway only」を選択してGen4を駆使してなんとか完成 😇
繋げる
最後の行程は繋げる。こだわる人はここもしっかりやるんだろうと思うけど、”ポン出し”がテーマでもあるので、macのiMovieでスッと雰囲気で繋げてしまう。
(CapCutやDescriptとかを使うとオシャレにできそう)
そして、できたものがこちら。
(あれ、一体何を作りたかったんだっけ、、、、)
良いものを作るには、日々精進が必要ですね
こんな遊びみたいなことを仕事としてできる良い場所があります
↓
どんなことをやっているかは、上記を確認しつつ、ご興味持たれたら話を聞いてみてください!仲間募集中です!
おまけ
話題の「nano banana(Gemini 2.5 Flash Image)」を駆使すると、より意図した動画とかを作りやすくなりそうですね。
これとこれをインプットに、
プロンプトを
A hard-rock rabbit chasing other rabbits, with countryside mountains in the background.
にして
生成物。なるほど

京都芸術大学のテックブログです。採用情報:hrmos.co/pages/xtm/jobs 芸大など5校を擁する瓜生山学園は、通信教育で国内最大手、国内で唯一notionと戦略パートナー契約を結ぶなどDX領域でも躍進、EdTech領域でAIプロダクトを開発する子会社もあり、実は多くのエンジニアがいます。
Discussion