Zenn
😨

あなたが生成AIに入力したデータ、学習に使用されているかも

2025/03/31に公開

なんとなく使っているとやばいかも

ChatGPT や Gemini, Claude, Deepseek, Grok... など、なんとなく使っている人は多いと思います。

あなたが使っている生成AIの、データ学習ポリシーはご存知でしょうか?

おそらくこの記事を読んでいる人は業務のタスクを生成AIにやってもらうのに使っているのではないでしょうか。
なんとなく使っていると、あなたの入力したデータは生成AIの学習に使用されます。
機密情報を使用してしまうと、漏洩させたと認定される危険があるので注意が必要です。

代表的な生成AIの利用規約を確認し、学習に使用されない方法を確認してみたので参考になると幸いです。

Claude

デフォルトでは原則として入力したデータは学習に使用されない設定になっているようです。
優しいですね。

Claude利用規約

規約の一部引用

4. Inputs, Outputs, and Materials.

...省略...

    1. If you provide Feedback to us (through the Services or otherwise) regarding any Materials, we may use that Feedback in accordance with Section 5 (Feedback).
    1. If your Materials are flagged for trust and safety review, we may use or analyze those Materials to improve our ability to detect and enforce Acceptable Use Policy violations, including training models for use by our trust and safety team, consistent with Anthropic’s safety mission.

ChatGPT

デフォルトでは入力したデータが学習に使用される設定になっているようです。

学習されないようにする設定

右上のプロフィールアイコン > 設定 > データ コントロール > すべての人のためにモデルを改善する をオフにすると、学習に利用されないようです。

OpenAI利用規約

ChatGPT(API利用)

API利用では学習されないようです。

OpenAI におけるエンタープライズプライバシー

規約の一部引用

当社のコミットメント

OpenAI は ChatGPT Team、ChatGPT Enterprise、ChatGPT Edu、そして API プラットフォームを利用する際、ビジネスデータ(入出力データ)に対してお客様に所有権と管理権を提供し、さらに、コンプライアンス要件を満たすための支援もしています。

所有権

ユーザーに自身のデータの所有と管理の権利が付与されます

  • デフォルトでは、ユーザーのビジネスデータを使用してモデルに学習させることはありません
  • 入力と出力はユーザーに帰属します(法律で認められている場合)
  • データの保持期間はユーザーが管理します(ChatGPT Enterprise)

Gemini(Gemini アプリ)

geminiは規約が複数あってちょっとわかりにくいです。
多分以下がgeminiアプリ(https://gemini.google.com/)の規約です。
規約:Gemini アプリのプライバシー ハブ

学習されないようにする設定

以下のURLからアクティビティの保存をオフにできるようです。
しかし、72時間以降は履歴も残らなくなってしまう可能性がありそうなUIです・・・
https://myactivity.google.com/product/gemini?utm_source=help&pli=1

なぜかオンオフ切り替えできないアカウントも・・・
なぜかオンオフ切り替えできないアカウントも・・・

72時間は残るということは、72時間は学習に利用されてしまう・・?分からない書き方ですね・・・

規約の一部引用

収集されるデータの種類と使用方法

  • Google ではこのデータをプライバシー ポリシーに従って、Google のプロダクト、サービス、機械学習技術(Google Cloud など、Google の企業向けプロダクトも含む)の提供、改良、開発に使用します。
  • 18 歳以上のユーザーの場合、[Gemini アプリ アクティビティ] はデフォルトでオンになっています
  • 18 歳未満のユーザーは、[Gemini アプリ アクティビティ] をオンにするかどうかを選択できます。
  • [Gemini アプリ アクティビティ] の設定がオンの場合、ユーザーの Gemini アプリ アクティビティは Google アカウントに最大 18 か月間保存されます。これは、[Gemini アプリ アクティビティ] の設定で 3 か月または 36 か月に変更できます。

人間のレビュアーが Google の AI を改善する仕組み

  • 品質の向上とプロダクトの改良(Gemini アプリで使用される生成的機械技術など)を目的として、人間のレビュアー(サードパーティのレビュアーも含む)が Gemini アプリとの会話を確認し、注釈を付け、処理を行います。このプロセスでは、プライバシーを保護するための措置が講じられています。
  • これには、レビュアーが Gemini アプリとの会話を確認したり注釈を付けたりする前に、その会話と Google アカウントとの関連付けを解除する措置も含まれます。会話には機密情報を入力しないでください。
  • また、レビュアーに見られたくないデータや、Google のプロダクト、サービス、機械学習技術の改良に使用されたくないデータも入力しないでください。

Gemini(aistudio, API利用)

無料枠を使用すると学習に利用されるようです。
有料枠を使用すると学習に利用されなくなるようです。

学習されないようにする設定

学習されたくない場合は有料枠を使用しましょう。

Google API 利用規約
Gemini API 追加利用規約

Grok(XのAI)

未ログイン状態で使用すると学習に利用されるようです。
ログイン状態で使用すると、学習に利用されるか選択可能なようです。

Terms of Service - Consumer

学習されないようにする設定

設定 > データコントロール > モデルを改善する でOFFにすると学習に利用されないようです。

deepseek

deepseek.com にて使用する場合、全てのデータが学習に利用される可能性があるようです。
DeepSeek Terms of Use

学習に利用されないようにする設定に関する記載は見つけられませんでした。
全て学習される前提で使用すると良いでしょう。

他社がホスティングしているdeepseekなら学習に利用されないケースもある

deepseekはオープンソースのため、他社が自前のサーバーでホスティングして動かすことができます。
そのため、そのホスティング事業者が学習しないと明言していれば学習されないで使用することもできます。

まとめ

以上、各生成AIにて入力データを学習に利用されないようにするための設定でした。
基本的にオフにして使用すると良いです。


XでもAI情報を発信しています。
長くならないことは大体Xで発信します。

よかったらフォローお願いいたします⭐️
Xはこちら

Discussion

ログインするとコメントできます