AI (作品) に「著作権料よこせ」って言えるのか? 〜または、ぐーちょきぱーとトルコとそよ風〜
ひとの創造物をAIに喰わせる (学習データとする) ことについて、侃々諤々の議論である。禁止していたら『生成系AI』の研究・開発に支障をきたし、あっという間に後進国になってしまうのは確定である。かといって無制限に放置していたら、絵師や作家が次々失業して、文化が失われてしまう。
おそらく落とし所としては、学習データとするのは禁止しない・AI生成物から著作権料を取る、というあたりなんだろうが、それについて『クリエイターとAIの未来を考える会』から出た声明を読んで、あれっと思ってしまった。
ひとが創造するとき、他人の創造物を真似するところからはじめるのは当たり前であるが、意図せず同じになってしまうことがある。ひとですらそうなのに、AIの出力が学習元データと区別することはできるのか? 『そよ風の誘惑』と『トルコ行進曲』と『フレールジャック』を聴くと、読者もあれっ? と思うだろう(謎)。という疑問を投げかけて終わらないはなし。
背景
クリエイター界隈が大騒ぎである。ひとの独擅行為だと思われていた文章・画像・音楽などの『創造』 (らしきもの) を、『生成系AI』がいとも簡単にこなしてしまうことがわかったからである。まあ、AIがひとの仕事を奪うまでもなく、独創性のかけらもないパクリだとかルーチンワークで『創造的行為』してる『ひと』のクリエイターもどきは死ね、という議論もあるんで、それはそれでアレだと思うが (どれだ)、問題なのは『作風が真似されてオリジナル作者が「もう要らね」みたいになったら食えなくなる』『AIの学習に用いたデータ (ひとの創造物) がそのまま出てきちゃったりするケースがある』、みたいなはなしである。
かといって、ひとの創造物をAIに喰わせるのを一切禁止したら、AIは動作できない。いまさら一部の国 (属性) のひとに禁止とか開発の一時停止を要請とかしたって、それ以外のひとたちが研究・開発を前に進めるだけで。もうパンドラの箱は開けられちゃったんだから後戻りできないよね。
日本では幸い、2019年の改正著作権法第30条の4で
その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
……情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう……)の用に供する場合
と定められた。現行法のもとでは、著作者がどんなに「ダメ」と禁止ルールを設定しても法律のほうが上位法なので、AI開発者は無断で・許可なく、学習データとして利用することができちゃうのである。ただしAI生成物が俺の作品の剽窃だ、というのが裁判で認められれば、賠償は求めることができる。のだろう。
でも、いちいちチェックして黒っぽければ訴えた上に判決を待ってたんじゃ、クリエイターは干上がっちゃうよね。ということで、『クリエイターとAIの未来を考える会』の提言『画像生成AIの適正使用及びそれに伴う著作権制度の整備等に関する提言(第2版)』では、以下のような提案をしている。
- Stable Diffusionに代表される画像生成AIの機械学習における著作物の使用は、著作権法30条の4に規定する著作物の権利制限の対象外とすること。
- 画像生成AIの学習における著作物の使用は著作権の原則に従いオプトイン方式とし、著作者から著作物の使用許可を事前に得ること。
- 画像生成AIの使用において、AIの機械学習に使用した著作物の著作者に対し、学習への使用及びそのAIが消費者に使用された回数等に応じた使用料を支払うこと。
1項目は、改正著作権法第30条の4を追認しているかたちである。つまり、禁止する (オプトアウト方式) のではなく、容認した上で (2項目) 相応な著作権料を取る (オプトイン方式) べきである、という意見である。
しごく建設的である。
だが、この声明を読んでふとわしの頭をよぎったのは、『そよ風の誘惑』と『トルコ行進曲』と『フレールジャック』である。
著作権よこせリクエスト大会
その前に、人間が同様のことをしたらどーなっているか、というはなし。
その昔の80年代、NHK FMで『渋谷陽一のサウンドストリート』というのがあって、人気企画に『著作権料よこせリクエスト大会』というのがあった。
リスナーからの投稿で、有名ヒット曲どうしがどんだけ似ているか、というのを楽しむコーナーである。どんなのが「著作権よこせ」と言われた (渋谷陽一に認定された)……のかは、下記の記録をみて聴いてみてほしい。
-
サウンドストリート DJ渋谷陽一 1985年6月28日放送『著作権料よこせリクエスト』:
- Philip Bailey "Easy Lover" →田原俊彦『落ちないでマドンナ』
- Madonna "Material Girl" →レベッカ『ラブ・イズ・キャッシュ』
- Madonna "Angel" →小田和正・財津和夫・松任谷由実『今だから』
- Nick Lowe "Too Many Teardrops" →Police "Every Breath You Take" →大沢誉志幸『そして僕は途方に暮れる』/Corey Hart "It Ain't Enough"
- Dave Edmonds "Get Out of Denver" →Police "Canary in a Coal Mine"
- Prince "Purple Rain" →とんねるず『母子家庭のバラード』
- Prince & The Revolution "When Doves Cry" →Third World "Sense of Purpose"
- Alphaville "Big In Japan" →本田美奈子『殺意のバカンス』
- Rick Springfield "Just One Kiss" →近藤真彦『ラストチャンスは俺にくれ』
- 近藤真彦『ケジメなさい』 →爆風スランプ『よい』
- 細川たかし『津軽じょんがら節』 →Frankie Goes to Hollywood "Relax"
- 金井克子『他人の関係』 →Led Zeppelin "Whole Lotta Love"
- Fixx "Are we Ourselves" →細川たかし『北酒場』
- Stile Council "Shout to the Top" →CCB『スクールガール』
- Hall and Oates "All American Girl" →大沢誉志幸『彼女はfuture-rhythm』
- Billy Joel "Tell Her About It" →いいとも青年隊『失恋コンテスト』
- Rufus Thomas "Boom Boom" →RCサクセション『眠れないTonight』
- Pink Floyd "Echos" →山口百恵『マホガニーモーニング』
- Free "All Right Now" →Steve Miller Band "Rock'n Me"/Anne Bertucci "Number One Contender"
- Nick Lowe "My Heart Hurts" →Marshall Crenshaw "Mary Anne"
- Scritti Politti "Absolute" →中川勝彦『僕たちのマンネリズム』
- King Crimson "Prince Rupert Awakes" →井上大輔『ビギニング』
- Taste of Honey "Boogie Oogie Oogie" →Sundy & the Sunsets "Sticky Music"
- Wham! "Wake Me Up Before You Go-Go" →リフラフ『東京涙倶楽部』
- (https://twitter.com/msdatabase/status/1512764666769928193):
- Tears For Fears "Change" →シブがき隊『喝!』
- 渋谷陽一のサウンドストリート 「著作権料よこせリクエスト大会」'82
※ 中には「無茶苦茶なw」と思えるような、ほとんどネタみたいな似方をしているのがあるが、これが後述する『偶発的に似て』著作権よこせ、の恐ろしさでもある。
補足しておくと、80年代当時たとえば「アメリカでヒットしたポップスをパクって日本の歌謡曲を作ってやろう」という流れがあった (洋楽のチャートどうしでもそれはあった)。「あれが売れたんだから類似のこれも売れるだろう」という、まるで■-11の『ジェネリックお菓子』みたいなあざとさである。もちろん、そのものズバリをクローンするのであれば、著作権を尊重したカバー曲というやり方も当時からあった (たとえばVillage Peopleの "YMCA" と西城秀樹の『ヤングマン』とか)。
ジェネリックをつくる側に悪意はなくても、そればかり聴いて耳に残ってると影響を受けちゃう (つまり過学習であるな)、ということはあり得る。いや、「○○ちゃ〜ん、△△みたいな路線で、ひとつ頼むよ」とか言われて悩んでいるうちに締切が迫ると、悪意の有無に関わらず『過学習』は起きちゃうだろうな。
いまでもこういう事例はあるとは思うが、訴訟だ何だでうるさくなっているので、あまりあからさまにやられてはいないのだろう。
加えて、人間がパクって作曲して編曲して作品を世に出すには、時間が掛かる。そこんとこ、AIはGPUパワーに物言わせて、一時間に何百曲、何千曲ものパクリ作品を生み出すことができる。だから問題は何万倍・何億倍になる。
『そよ風の誘惑』と『トルコ行進曲』と『フレールジャック』
さて、似ている曲が出来たら元曲に金を払う、ということになると、たとえばコードやアレンジ・音色などを度外視してメロディラインだけに問題を単純化しても (現に、現行の音楽著作権使用料はメロディラインの音列に対して払われる)、『有限個の音階を有限個並べた音列で、偶発的に同じ・似た曲はできちゃわないのか?』という疑問が生じる。
オクターブ違いの音を同一視して半音階も入れた12音でたった8個からなる音列をつくる (音符の長さは無視する) だけでも、キーが異なるものは同一視 (移動ド) しても
の音列ができる。これだけでも多いが、メロディーライン中の音数は (AメロとかCメロに限っても) もっと多い。ほぼ無限の組み合わせがあるような気がしてくる。
なおこの問題は昔、ベースの水野正敏さんが作曲理論の本を書く際に相談されたので、ささっと計算してみせたら「メロディがなくなる心配はないんやなぁ〜」と安心されていた。
けど、どう考えてもこの3583万通りのうち3582万通りくらいのフレーズは、音階がランダム的 (耳には) にジャンプしまくったり、いわゆるアベイラブルノートを外しまくったクソメロディーだろう (しらんけど)。音楽的には耳に心地よい・面白いものだけ歴史的に残って、残りのクソメロディーは歴史に埋もれたり、また誰かが再発明したりしてるだろう。
では名曲は? ここで思い出すのが、『そよ風の誘惑』と『トルコ行進曲』と『フレールジャック』である。
Soundhoundみたいな『音楽を検索してくれるソフト』の出現を待つまでもなく、Google検索などというものができてきた2000年代以降、「あれなんていう曲だっけ」の検索は楽になった。キーはCとして (つまり移動ド) 頭の中でそらで唄い、文字列で検索するのである。そうすると、やっぱり移動ドで唄って文字列で掲載している掲示板だとか、移動ドで「この曲なんでしたっけ?」って文字列で質問したひとに知恵袋とかで答えている、というwebページがみつかるのだ。
それで起きた実話なんだけど、あるときわしが
- オリビア・ニュートンジョンの『そよ風の誘惑』 "Have You Never Been Merrow" (John Farrer曲)
これ、小学校くらいのときポール・モーリアグランドオーケストラの演奏で、よく聴いてたんだよね。ともかく、タイトルを失念したので、Google検索で
みふぁそそらそふぁみ
でぐぐってみたのである。そしたら……目的の『そよ風の誘惑』のほかに
- Frère Jacques (作者不詳): 英題 "Are You Sleeping?"、日本では「ぐーちょきぱーで何作ろう」で知られる曲である
- トルコ行進曲 (Turkish March) (Wolfgang Amadeus Mozart曲)
が引っかかってきてしまった。
どういうことか。下の譜面と、それを演奏したものをみてみてほしい (すべてキーはCに統一……するまでもなく、モーツァルトもオリビアもCであったw)。
Frère Jacques
譜面はmakingmusicfun.netのフリー楽譜より
トルコ行進曲
譜面はWikipediaより
そよ風の誘惑
採譜・譜面筆者
オリジナリティを感じる理由と生成アルゴリズム
もちろん、これらの3曲が全然別物に聴こえるのは、音を聴いてもらえば明らかだろう。
まず音価 (アーティキュレーション) が違う。自然言語でいえば「多機能トイレ」と「滝のおトイレ」くらい違う。よくわからないたとえですまん。
この音列が出てくるタイミング (構造上の小節番号や小節上の入り拍) も違う。自然言語なら「ここでは着物を脱いで下さい」と「ここで履物を脱いで下さい」くらい違う。いやその例えもちょっと違うか。『そよ風の誘惑』ではAメロの2拍の休符後に、『トルコ行進曲』ではAメロの終わりからBメロ(?)頭に1拍食ってアウフタクトで入っている。「ぐーちょきぱー」に至っては、Aメロの最終小節からBメロにかけての全然関係ないフレーズの繋がりである。
さらにコード進行もぜんぜん異なっている。自然言語でいえば「アヒルと鴨のどちらが可愛い?」→「わたしは鴨が好きです」と「お昼はたぬきそばと鴨南蛮、どっちがいい?」→「わたしは鴨が好きです」くらい、コンテキストが異なっている。いやますます訳わからんか。僕はうなぎだ。
もちろん、わざとアーティキュレーションを変更して新しい曲にきかせてやれ、と、「ぐーちょきぱー」を聴いたモーツァルトが悪意を持って剽窃したとか、『トルコ行進曲』を聴いたジョン・ファーラーが思ったとか、そういうふうには思えない。だが、おそらく『不自然にランダムっぽくジャンプする音列』は音楽とみなされなくて、「みふぁそそらそふぁみ」の音列はひとの耳に快適に聴こえる、という経験則から、このような音列が無関係・偶発的に選ばれてしまう、ということはあり得る。
そしてAIの生成方法も、そうなっている。AIが例えばこれらの曲を学習し、内部に『自然で快適に聴こえる音列を選ぶネットワーク』が出来たとする。すると
- 「みふぁ」の次には「そ」が来る
- 「みふぁそ」の次には「そ」が来る
- 「みふぁそそ」の次は「ら」だ
- ……
のように作曲するだろう。そして、画像生成や文章生成の多くの自動生成アルゴリズムは、そのようにできている。作風も意図も全然異なった出力に対して、我々はジョン・ファーラーやモーツァルト (あ、死後しばらく経ってるかw) に著作権料を払わないといけないのだろうか?
払わなければ、ジョン・ファーラーの名作に対して申し訳ないような気もするし、別にモーツァルトに言われなくてもこの音列は自然に素敵な音列だと思うような気もする。
まとめ (まとまらない)
以上、『AIに喰わせる人間の著作物』に対する、至極まっとうな権利保全方式と思える『オプトイン方式』について考察してみた。
人間が創造性を身につけるときでさえ、他の人間の作品のコピーから入る。それによって得た技法・(自己) 評価能力などに基づいて生成された作品は、たとえ物理的な音列 (文字列・ビットマップ) の一部が同じであっても、『独創的』と評価されることがある。というのは、『トルコ行進曲』『そよ風の誘惑』をみれば明らかだ。
逆に同じような印象・構造・機能の作品が出力されたら、人間の創造者からであっても、ひとはそれを「パクリ」とよぶ。「似せてやれ」と意図をもってパクらなくても、期せずして似てしまう、という事例も、枚挙に暇がない。
ましてAIである。『学習に用いたものと同じ (ないし類似)の音列 (文字列・ビットマップ)』が出力されたら、一律に『学習データに著作権料を払え』というのは現実的なのだろうか。ひとつには、一律・包括的に著作権保証料を課してしまう、というのも手であろうが、映像用ディスクでこのやり方があまり上手く行かなかったのはよく知られている。
もちろん、現在の人間が人間の創作物を単純利用する著作権料配分の組織ですら、利権問題や非効率などが問題となっているので、そちらの解決ができない限り、それより数万倍速い『AIが出力したものの著作権配分組織』が上手くいくとは思えない。
ではどうしたらよいか、という建設的意見を出すことなく、ただ垂れ流しの文章を書いてみただけなんだけど。事態はなかなか単純じゃない、ってことで、読んだひとの考察の一助になれば。
Discussion