無断転載画像を学習していないAIモデル・オープンなデータセット

2024/07/28に公開

概要

学習禁止しているデータを学習していないモデルや
学習OKのオープンなデータセットを調べる
(随時追加)

Adobe Firefly

https://www.adobe.com/jp/products/firefly.html
学習元データがオープンなものに限られていて、学習に使用されたデータの制作者にマージンが入る仕組みがあるらしい

Fireflyは、学習にAdobe Stock画像、オープンライセンスのコンテンツ、一般コンテンツを使用し、安全に商用利用できるよう設計されています。また、クリエイターが生成AIの恩恵を受けられるよう、自身のコンテンツがFireflyモデルのトレーニングに使用されたAdobe Stockコントリビューター向けに、報酬モデルを構築しています。

Emi (Ethereal master of illustration)

二次絵っぽい画像を生成できるモデル
https://huggingface.co/aipicasso/emi

最先端の開発機材H100と画像生成Stable Diffusion XL 1.0を用いて AI Picasso社が開発したAIアートに特化した画像生成AI
無断転載画像を学習していない

Manga Diffusion

漫画っぽい画像を生成するモデル
https://huggingface.co/aipicasso/manga-diffusion-poc

著作権者から許可された画像やパブリックドメインの画像、CC-0の画像だけで学習

絵藍ミツアプロジェクト

AI Vtuberプロジェクトとしてモデルも公開されている
https://elanmitsua.com/
https://huggingface.co/Mitsua/mitsua-diffusion-one

当社が権利的に又は心理的にクリーンと考えるデータ1でゼロから学習2することや、学習画像提供者に返礼をすることで、アーティストに対する倫理的問題の改善も目指します

オープンなデータセット

下記で研究機関などが用意している権利的に安全なデータセット一覧が見れる
https://appen.co.jp/blog/open-data-set-list/

Discussion