👏

AIのトレーニングデータをめぐる争いが音楽ジェネレーターに拡大

2024/07/03に公開

本記事は、Fastcompanyにより翻訳されたものです。
https://www.fastcompany.com/91146872/ai-hallucinations-grounding

ジェネレーティブAIツールは単なるアグリゲーターの一種?フェイスブックは、ユーザーにニュースを入手するための単一の場所を提供することで、デジタル広告戦争に勝利しました(出版社のサイトを訪問する必要性を排除)。パブリッシャーは苦しみ、今も苦しんでいます。今、コンテンツ所有者とパブリッシャーは、新しいタイプのアグリゲーターがもたらす潜在的な害に気づき始めています:ジャーナリスト、作家、写真家、ビデオグラファー、ミュージシャンによって作成されたコンテンツを吸い上げ、訓練するジェネレーティブAIツール。AIツールがコンテンツの全部または一部を複製すると、ユーザーは元のソースを訪問する必要性を感じなくなるかもしれません。これは、昔ながらのディスインターミディエーションの話です。

フォーブスが最近、AI検索ツールのPerplexityがカスタムブログ記事(新機能のPagesを使用)を作成(その後宣伝)するために、このニュースサイトのオリジナル報道を使用した後、非難を浴びたのはまさにそのためです。その数日後、ワイアードの調査により、Perplexityが使用しているウェブクローラーが、「クロール禁止」シグナルを発信しているウェブサイトからコンテンツをスクレイピングしていることが判明しました。

このようなアグリゲーターの被害者であるコンテンツ制作者は、ますます弁護士を立てるようになっています。私たちはすでに、AI画像生成企業に対する訴訟を目にしています。その企業は、モデルを学習させるために収集した著作権で保護された画像に酷似した画像を生成していました。ニューヨーク・タイムズ社は、OpenAIとその支援者であるマイクロソフト社を、ニュース記事以外では基本的に同じことをしているとして訴えました。訴えによると、OpenAIとマイクロソフトは、新聞記事を言語モデルのメモリにエンコードし、ChatGPTとBing Chat(現在はCopilotと呼ばれている)がその情報にアクセスし、適切な引用なしに、場合によってはそのままの情報を再生できるようにしたという。

このテーマの次のバリエーションは、(必然的に)AI音楽生成ツールに関わるものです。ソニー、ワーナー、ユニバーサルの大手レコード会社グループは、業界団体である全米レコード協会とともに、AI音楽生成アプリの大手2社、UdioとSunoに対し、著作権で保護された楽曲をスクレイピングして学習させ、音源に酷似したAI楽曲を生成しているとして訴訟を起こしました。ウェブからスクレイピングされた膨大な量のテキストや画像で学習するLLMや画像生成アプリと同様、AI音楽生成アプリも、アプリメーカーが無料で収集した膨大な量の音楽に依存しています。

これらのケースにおけるAI企業の主な抗弁は、クリエイティブなコンテンツの利用は著作権法の「公正利用」条項の下でカバーされるというものです。この条項は、コンテンツを使用して「変形的」または実質的に新しいものを創作する人々に対するセーフハーバーを定めています。「私たちのシステムは、新しい音楽的アイデアを反映した音楽を創作するように明確に設計されています」と、ウディオはファスト・カンパニーに送った声明の中で述べています。「私たちは、トレーニングセットのコンテンツを再現することには全く興味がありません」

現実には、生成AIモデルは通常、スクレイピングされたコンテンツ、合成トレーニングデータ、コンテンツ所有者からライセンスされたコンテンツを慎重に組み合わせてトレーニングされます。法的報復を恐れて、多くのAI企業はライセンスされた学習データにより多くの費用を費やしており、これには音楽も含まれます。Financial Times紙は26日に、YouTubeが現在、ソニー、ワーナー、ユニバーサルと、彼らが所有する楽曲をAIモデルのトレーニング用にライセンスするための交渉を行っていると報じました。

以上、「AIのトレーニングデータをめぐる争いが音楽ジェネレーターに拡大」というAIニュースを紹介しました。ほかの最新AIツールを体験してみたい方に、写真をアップロードするだけで、AIが自動的に写真をイラストに変換してくれるサイトーーToongineerを代表するツールとして知られ、超解像技術を搭載することでユーザーに最高なオンライン画像加工サイトサービスを提供するVanceAIを試すのをおすすめします。

Discussion