🙋♂️
Snowflake上で共有されるデータの権利はどう管理される?
Snowflake歴1日ですが、せっかくSnowdayというイベントに参加してきたので、「SnowPro Corner」というところで質問させてもらった話を共有したいと思います。
疑問
Snowflakeで公開されたデータを加工/分析して再度Marketplaceにアップしたら、権利はどうなるの?
極端な話、公開されているデータを少しだけ粗くしたものを再配布したら、元のデータ配布者は嫌ですよね。でもどの程度加工したらOKなのか、そもそも加工したものの再配布などは禁止されていたりするのか、Snowflake上に法的な規定やライセンス設定(GithubでMITとかGPLとか設定するみたいなイメージ)はあるのか、などの疑問が浮かびました。
回答
ひと言で言うと、
「Snowflakeは、データ利用についての詳細は管理していないです。」
とのことです。
(ただ、Marketplace上の表示でそれっぽい表示はあったので、実は何かしらはあるのかも...?という話はしていました...)
いただいた情報としては、
- 今のところ、二次利用・配布などで訴訟が起きたりする例は聞いたことがない
- データ共有する配布者が利用規約を提示してMarketplaceに載せる形になっているので、特別な制限があればそこに書いてあるはず
- 無料で共有されているデータは元々オープンなデータを綺麗にしてMarketplaceにアップしているものが多いので、利用に関して問題になるようなデータセットは基本的に存在しない(だろう)
- 有料データセットはリクエストを送った上で購入する(実際に使ったことはないですが、承認ボタン押すだけではなく、実際に提供者とやりとりするらしいです)ので、そのあたりで現実的には調整していく(のだろう)
という感じでした。
世の中的には、機械学習データの権利などは絶賛揉めている最中だと思うので、今後どうなっていくか分かりませんが、積極的にデータ共有の文化に入っていく場合には頭をよぎる問題かなと思いました。現時点での状況として、知り得たことを共有しました。(自分で何一つ調べないで聞いた話をまとめているだけですが...)
- 間違いがあれば適宜修正していこうと思います。誤りがあればご指摘ください。
- 状況が変わった場合は、誤解を生まないように、本記事を削除したり更新したりしようと思います。
Discussion