AIにレコードジャケットは描けるのか?
ついに我が家のPCにもインストールしました。stable-diffusion。
ARMベースのMacbook Proっていう、激遅環境ではあるが、手許でいろいろ試したりソースいじったりできるのがいいね。
で、『呪文』の唱え方も、完全に理解した() ところで、ふと。
文字列→画像生成、といったら、レコードジャケットのデザインに使えるのではないか?
いやもはや、MP3だサブスクだという時代に、ジャケットなど不要なのかもしれない。
だが、そんなことはない。モノとしてのレコード (録音媒体) に付加価値を持たせるのは、アーティストの意図発現のためにも商業的にも正しいはず。『ジャケ買い』 つまりジャケットのデザインをみて購入の是非を決める、というのが現にある。
それに、本来『意図・意味を持たない』はずの芸術である音楽において、意味をもつ情報である歌詞、曲のタイトルの次に重要視されるのは、レコードのモノとしてのグラフィックデザインである。
かのEarth Wind & Fireのジャケットデザインをしていた長岡秀星氏は、Earth Wind & Fireのもうひとりのメンバーと呼ばれたくらいである。いやメンバーより重要なポジションにあったともいえる。
このグループでは、曲順はリーダーのMaurice Whiteが占いによって決める。曲順は、セールスに支障がない発売直前まで、メンバーにもレコード会社にも知らされない。ただジャケットは曲順がないとデザインできないことから、占い師とMauriceが決めた曲順は、ただひとり長岡秀星氏のみに知らされたという (ちょっと都市伝説っぽい)。
というわけで、70〜80年代のロック・ポップスの名曲の歌詞からジャケットを生成してみました。
気になるのが著作権。
まあ歌詞の部分は、第三者視点とかに変更するためそもそも再作文してあるのが多いし、本記事は『歌詞と映像の論評』ってことで出典を明確にして引用している、著作権法の引用規定の範囲内なのだが……将来的には、画像見てJ○SRACが「著作権払え」って言ってこないとも限らんわけで……(笑)。
※ 下記Youtubeへの直リンクは、ログインしていないと『表示できません』になるので、その場合はURLをブラウザにコピペしてください (URLとサムネイルを二重に掲載してますうざくてすみません)。
Deep Purple "Smoke on the Water" "Highway Star"
このテーマで画像を作成するに当たって、まず思い浮かんだのがこの曲。
ロックにしては写実的、っていうか実際の出来事ベースに書かれた歌詞で、ロックフェスのときどっかのバカが発煙筒で火事起こしちまった、という、ほんとに現代なら映像が残っててもおかしくないような情景を曲にしています。
stable-diffusionには
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a photo of smoke on the water of lake Geneve, outdoor live performed by Frank Zappa and the Mothers were at the best place around but some stupid with a flare gun burned the place to the ground, Nikon D1, Sigma OSM lens 28mm, ISO 100, shutter speed 1/250 sec, F2.8"
を食わせました。
カメラのスペックを唱えると実写表現になるってのはこちらの知恵から。
Franc Zappa & Mothersはどこいったんでしょうかねえ。なんか、火事に慌ててフレーミングしそこねてシャッター切った写真みたい。
さてDeep Purpleというと、名曲『Highway Star』。
https://youtu.be/CfgGXWA4c-Q
なんか高速走ってて「なんぴとたりとも俺の前には行かせねえ!!」というつもりなのか、わしの軽自動車よりとろとろ走って右車線塞いでたりするバンの後ろに『Highway Star』とか書いてあると、おおおnobody gonnta take my carなkilling machineだぜwww とか思っちゃうのだが、呪文は以下。
python scripts/txt2img.py --H 384 --W 256 --plms --n_samples 2 --prompt "a photo of the highway star, that nobody gonna beat, killing machine, Nikon D1, Sigma OSM lens 250mm, ISO 400, shutter speed 1/1000 sec, F5.6"
んでできたのが、高速道路の横から撮ってガードレールに阻まれなおかつシャッター切り遅れたみたいな写真。
YES "Roundabout"
プログレに偏向するのはわしの趣味なんでご勘弁。
さて抽象的な歌詞だとどうなるか? まあ予想通りではあるんですけどね……。
名曲『Roundabout』。
https://youtu.be/QOrrNM4md8c
呪文は
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of the roundabout that the words will make you out and out, spending the day your way"
画像はつまらん。
でもこういうジャケット、イタリアンプログレとかでありそう。
ってかオリジナルのアルバム (『こわれもの』) ジャケットが↑だし。
King Crimson "21st Century Schizoid Man"
やるでしょ当然w
元ジャケットの画像がこれですもの。
カラオケで入れると歌う部分30秒に対して延々7分『(伴奏)……』という表示が続くこれ。
抽象的歌詞の極み。
ただこれ、思ったより悪くないっていうか……そもそも歌詞が、ぶつ切りの単語を並べたもので、それが狂気を表現する短文になっているから、どれも悪くない。生成した画像のうち、7割位はジャケットに使えそう?
ここでは複数呪文と、複数画像を掲載します。
1番:
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of 21st century schizoid man, cat's foot, iron claw, neurosurgeons scream for more, paranoia's poison door"
2番:
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of 21st century schizoid man, blood rack, barbed wire, politicians funeral pyre, innocents raped with napalm fire"
3番 (※ ぜんぶじゃねーかw):
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of 21st century schizoid man, death seed, blind man's greed, poets starving, children bleed, nothing he's got, he really needs"
Steely Dan "Deacon Blues"
さて、ちょっとロックからは離れますけど、プログレの意味不明あるいは過激な歌詞で意味深な画像が生成されるのと対象的に、写実的な……アメリカン演歌みたいなのはどーも、うまくいかないようですな。
まずは、人生でそれほど成功したわけでもなく、サックスでも習って気ままに吹き、夜な夜なスコッチでもあおって車輪の下で死んじゃうんだろうね、というような、どこか物悲しい男の背中。
まあ、Steely Danの意味不明なものが多い歌詞にしては、ストレートにド演歌です。
https://youtu.be/6O4cvfaAsUM
呪文は
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of a man leaning to work the saxophine, plays just what he feels, drink scotch whiskey all night long and die behind the wheel"
で出来上がったのがこれ。
スコッチとか車輪の下はどこ行った? (呪文が悪い?)
ま、悪くないんだが……ちなみに本物のこのアルバム (『Aja』) のジャケットは (上にYoutubeのが表示されてると思うけど)、ものすごいローキーの写真でわかりにくいが、モデルの山口小夜子さんなんですよねー (タイトル曲の『Aja』が東洋人との国際結婚の難しさを歌ったもの、といわれている)。
Billy Joel "Piano Man"
も少しはっぴ〜なの行こか。
ということで、Billy Joelの、やはり酒場でのピアノ弾きの情景を描写した『Piano Man』から。
https://youtu.be/QwVjTlTdIDQ
呪文は1番の
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of piano man who can play an old man a melody, he is not really sure how it goes but it's sad and it's sweet and he knows it complete when he wore a younger man's clothes, singing them a song, he is the piano man"
出来上がったのがこれ。
Piano Man、なんか偉そう。
つか、弾き語りをリクエストする老人の悲哀とかどこ行った!?
Earth Wind & Fire "Jupiter" "In the Stone"
さてwww
冒頭で伏線を張っときましたが、Earth Wind & Fire。
凄いところは、そのコンセプト。
愛と希望と、宇宙。みたいな。
ジャケットはその中のひとつであって、曲のタイトル (ちなみに1980年代までは、日本側のプロテューサもそのコンセプトに乗って、『暗黒への挑戦』『カリンバの歓喜誘惑』『宇宙を見よ!!』など、ヘビメタか? なんかの宗教か!? という邦題も多かった)、そしてステージでイリュージョンを展開する……ベーシストが宙吊りになって演奏したり、メンバーがステージ上のピラミッドに消えていき、煙とともに消滅し、最後に後方から出てくるとか、もーそれはそれはイロモノ他と一線を画すバンドでした。
ライブ映像はここから。
https://www.youtube.com/watch?v=alROoSD0BX4
名曲『Jupiter』は0'38"〜、イリュージョンは38’36”〜 観ることができます(笑)。
さてはて。
そんな『Jupiter』、大の大人が恥ずかしげもなく「君を救うために宇宙の果てから愛という名の宇宙船に乗ってきたんだよ〜」という歌詞をAIに喰わせたら、どうなるか?
python scripts/txt2img.py --H 256 --W 384 --plms --n_samples 2 --prompt "a picture of a man named Jupiter from the galaxy, to make everybody on earth free, deliver a flower from a distant planet from he came"
いや……。逆にどうにもなりませんでした……。
(上記の映像と比べて下さい)。
さて冒頭で長々と述べた長岡秀星氏のジャケットの凄さですけど、わしはリアルタイムで観ているものとして、『All'n'All』 (太陽神) と、『I am』 (黙示録) の凄さが印象に残ってる。
その中からというと、『I am』1曲めの『In the Stone』ですかねえ。
やっぱり日本でヒットした『September』『Boogie Wonderland』あたりは、ちょっと「踊ろうよ〜」ってパーティ感で宇宙とかけ離れちゃうのでね。
https://youtu.be/6Z2xClustQo
で呪文としては、愛は古来から石に刻まれている〜 (長岡秀星氏のジャケット観ながら唱えて下さい)
python scripts/txt2img.py --H 384 --W 384 --plms --n_samples 2 --prompt "a picture of a stone in which love is written in, that will learn to sing one's song, unlocks the heart and souls of one and the lover"
こんなのを唱えると、こうなる。
バレンタインデーかよ!!
結言
長岡秀星氏デザインのジャケットの凄さは、でっかい写真で観てみることをおすすめします。
詳しくはこんなページ
もあって、良い写真とかもあるんですけど、これが30cm角のアナログLPレコードのジャケットサイズなんだぜ!! そりゃ痺れるよな〜。やっぱり音楽に対する思い入れが、コードやメロディー→演奏→歌詞の内容→を超えて、一段階深く自分の体験になるわけです。
ジャケ絵として、リスナーにそういう印象を抱かせる絵を描けるAIは、果たしてやってくるんでしょうかねえ? そういうことできるようになるのが、創造するAIのシンギュラリティな気がする。
Discussion