🎥

動画生成AI sora でYOKAI出してみたら、AIの中に棲む私を見た

に公開

はじめに

先日、動画生成AI「Sora」で妖怪を作るという体験するワークショップに参加したので、それについて考察という名のエッセイにしてみました。本記事はノウハウやTips少なめですみません。

前段として

AIの新たなモデルと向き合うとき、私はいつも少し緊張する。
それは「新しいツールを試す」というよりも、知らない誰かと出会うような感覚に近い。
画面の向こうにいるのは、単なるアルゴリズムではなく、こちらの思考や感情を静かに反射する鏡のような存在だからだ。

AIはもはや「便利なツール」という言葉では片づけられない。自動化や効率化の領域を超えて、人間の「自己」に触れ始めている。私たちはいま、AIを通して「もう一人の自分」──分人──と向き合う時代に立っているのかもしれない。

先日、動画生成AI「Sora」を体験するワークショップに参加した。
テーマは「妖怪生成」。現代アーティストの たかくらかずきさんが講師を務め、会場はホテルアンテルーム京都。

このイベントは、AIに触ることがある種「別の自分」を呼び出す体験になりうることを、強く実感させてくれた。たかくらさんはOpenAIがセレクションしたクリエイターの一人であり、このワークショップはOpenAIの協力によって実現したものだった。

https://aiyokai.peatix.com/

妖怪とAIは似ている? ― 解釈から生まれる生成表現

「妖怪とAIって、似ていると思いませんか?」
ワークショップの冒頭、たかくらかずきさんのこの一言が印象的だった。そもそも妖怪とは、人間の想像力と環境との関係のなかで立ち現れる、「目には見えない存在」である。生成AIもまた、偶然や想像力、あるいは集合知によって、これまで可視化できなかったものを立ち上げらせる。

そもそも妖怪とは、人間の想像力と環境とのあいだで立ち現れる「関係の存在」である。
柳田國男や折口信夫が指摘したように、妖怪は特定の土地や季節、暮らしの変化など、人間と自然とのあいだの「ずれ」や「境界」から生まれてきたとされる。そこには、人が完全に制御できない外界への畏れと、名づけることで不可視のものと自己を「関係づける」ということと言える。

一方の生成AIもまた、同様に「人間と環境の関係」から現れる。
ただ、その環境は自然界ではなく情報環境の中でである。AIは膨大なデータ群から新しい像を生成する。
その過程で現れるイメージは、私たちが明確に意図したものではなく、むしろデータと想像力の間に生まれる存在であり、それはまさに現代の妖怪と言えるのではないだろうか。

ワークショップでは、参加者がまずChatGPTを使い、自分の思い描く妖怪の性質や由来を言葉にすることから始まった。「川辺に潜む影のような生き物」「夜の森で光る目を持つ存在」など、断片的なイメージを文章化し、動画生成AI「Sora」に入力していく。
AIはそのテキストをもとに映像を生成するが、一度で理想の形にたどり着くことはほとんどない。
想像 → イメージ化 → テキスト化 → AI入力 → 出力 → 修正というプロセスを、およそ二十回近く繰り返しながら、思いがけず現れた像を「むしろこの偶然こそ妖怪らしい」と受け入れていく。

今回のワークショップにおいての自分の妖怪コンセプトは、テキストでのやり取りの中で生まれる誤解やすれ違い、思いがけないトラブルはすべて妖怪の仕業だ!と見立てて、自分の制作コンセプトの核に据えてみた。

妖怪は、人間の不満や不安、恐怖、自然現象への驚きといった感情を媒介にして生まれる存在だと言われる。AIによる生成過程もまた、人間の内面(想像・感情)と外部環境(データ・モデル)との交錯から生まれる。ここで生成される映像は、単なるフェイクでも視覚的シミュレーションでもなく、人間の認知とアルゴリズムのあいだに生じた媒介的な現象であり、情報環境が人間の想像を再帰的に描き返す場として機能していたと言える。

妖怪を生成する ― 制作プロセスの体験

制作は、次のような手順で進んだ。

1. プロンプト設計

ChatGPTを用いて、妖怪の性格・動き・環境を整理し、英語プロンプトを生成する。

例:
“A yokai born from the reflection of the moon on the river, with glowing eyes and slow, eerie movement in the mist.”

この段階で、AIが「monster」と誤解しがちな妖怪のニュアンスを、「spirit」「ghost」「mythical presence」などの単語で調整すると精度が上がる。そもそも、西洋圏のデータセットには「YOKAI」という概念がほとんど存在しないのではないかと感じた。そのためAIは妖怪を“monster(怪物)”として解釈してしまい誤読を起こす。

2. 動画生成と編集

Soraでは、以下の機能を組み合わせて映像を調整する。生成AI「Sora」では、以下の4つの機能を中心に活用した。

機能 内容 活用例
Storyboard 構成の骨組みを設計。シーンを分けて物語を可視化。 妖怪が現れる前→出現→消えるまでの3構成に。
Re-Cut 映像全体の再構成。テンポや尺を調整 動きが遅すぎる/場面が長い時に使用。
Blend 複数動画の要素を融合。 “光る目”と“霧の森”の映像を合成
Loop 動画の最後と最初を自然に繋げる 妖怪が永遠に現れ続けるような表現に。

そして、上記を繰り返してシーンを作成して、最後にそれっぽいBGMをAIで作って繋げたものがこちら!

https://youtu.be/Ot2mVepdi8M

分人というレンズ ― 「自分・相手・環境」をめぐるAI時代の自己像

この体験を通じて思い出したのが、小説家・平野啓一郎の「分人」という概念だった。人は一枚岩の存在ではなく、「自分」「相手」「環境」という三つの要素の交差によって、いくつもの自己=分人を生きている。家族といるときの自分、友人といるときの自分、SNS上の自分など、それぞれモードが違うが、どれも嘘ではないし、すべて「本当の自分」だ。

そこにAIが加わると、構図は変化する。AIは応答者として「相手」となり、同時に自分が生成する映像や世界そのものが「環境」となる。また、、AIが生み出す映像や空間は、現実を模倣したコピーではなく、情報のレイヤー上で構成されるもうひとつの環境=データ的環境と言える。制作者は、その中で思考し創造し、そしてAIとの新しい関係を結びはじめる。

かつて写真機が登場したとき、画家たちは「絵画の死」を嘆いた。しかし、写真は絵画を終わらせるどころか、「何を描くか」という新しい問いを生み出した。
写真家ヴィレム・フルッサーは、写真家を「装置にプログラムされた可能性空間を遊ぶ存在」と呼んだ。
写真家は、その限られた条件の中で、装置が許す範囲を試し、逸脱し、揺らがせながら「まだ見ぬ像」を引き出すプレイヤーなのだ。生成AIを扱うアーティストもまた、同じようにAIの情報環境の内部で遊ぶ存在だ。同じように、コンピュータやデジタルツールが広まったとき、人間の創造性は危機に瀕するどころか、デジタル上で新しい表現形式を見出してきた。AIもまた、その連続線上にあると言える。

また、メディア理論家マーシャル・マクルーハンは「メディアは人間の拡張である」と述べた。文字は記憶の拡張、車輪は足の拡張、カメラは眼の拡張、そしてAIは思考の拡張として現れた。その拡張の本質は、単に人間の能力を高めることではない。AIというメディアは、人間の知覚と認識の枠組みそのものを組み替え、思考のあり方そのものを変容させていく。

さいごに

クロステックマネジメント(京都芸術大学)では、プロ志向のエンジニアをはじめ幅広く人材を募集しています。AI×教育に興味のある方のエントリーをお待ちします!

https://www.wantedly.com/companies/company_7297732

続く

クロステックマネジメント(京都芸術大学)

Discussion