Azure OpenAI Serviceのコンテンツフィルタをオフにしてみる(前編)
はじめに
Azure OpenAI(AOAI)サービスではデフォルトで「コンテンツフィルタ」という機能が有効になっており、これをオフにすることはできません。この機能をオフにするためには、Microsoft社に申請が必要になります。
今回、企業で使うと想定した時に「オフにしたらどういう振る舞いになるのか?」「オフになって運用されている危険なLLMリソースが存在しないかチェックしたいな?」といった発想から、コンテンツフィルタ機能をオフにして諸々検証してみることにしました。
コンテンツフィルタとは
AOAIサービスの入出力に対して、
・憎悪、性的、暴力、自傷行為のカテゴリに当てはまる場合はブロック
・著作権や肖像権に違反するようなものの場合はブロック
・ジェイルブレイクの類(LLMに対して命じられているシステムプロンプトの類を無視するような指示)をブロック
といった、「責任あるAI」を実現するための機能です。
これらはデフォルトで有効な状態で提供されておりますが、前述の通り「オフにする」ことが出来ません。利用者目線で出来ることは、フィルタの強弱(緩い表現でもブロックされる~過激な表現じゃないとブロックされない)といった変更のみ…です。
申請
さて、それではコンテンツフィルタを無効にする申請を行っていきます。
なお、これは2024/12/18時点の情報です。今後、内容が変更されたり、そもそも申請が出来なくなる可能性もあるかと思いますのでご留意下さい。
申請手順
申請用のLink先が消えているドキュメントも多くありそうなのですが、執筆(2024/12/18)時点で生きていそうなのが下記ドキュメントにありました。
Azure OpenAI モデルの場合、変更されたコンテンツ フィルタリングを承認されたお客様のみコンテンツのフィルター処理を完全に制御でき、コンテンツ フィルターをオフにできます。 次のフォームから修正コンテンツ フィルターを申請してください: Azure OpenAI 制限付きアクセス レビュー: 修正コンテンツ フィルター
申請内容
リンクを踏むと、この手のMicrosoft向け申請で良く出てくるFormsの画面に飛ばされます。
回答する必要があるのは以下のような項目です。
- First Name
- Last Name
- 対象Subscription ID(最大3つ)
- 会社のメールアドレス
- 会社名
- 従業員数
- 規模
- 業種
- 何のためにコンテンツフィルターを外したいのか
- Latency
- Content Filtering Quality
- Senario-specific Business need
- To facilitate red teaming and/or testing and evaluation
- その他
- 自社のための申請ですか?(顧客の代理申請ではないですか?)
- 責任あるAIの文脈で、コンテンツフィルタを止めることのリスクを把握してますか?
- 規約に従って使ってね
基本的には「なんに使うの?」「リスクを認識している?」「気を付けてね?」ということなのですが、所属企業名を出して申し込むことになりますので、そこも含めて一定の審査を受けるものと思われます。
ちなみに私は「To facilitate red teaming and/or testing and evaluation」にチェックを入れて申請しました。
受付
申し込みが終わると、受けつけました!のメールが届きます。改めて10 business daysと言われます。あとは結果を待ちましょう。
おわりに
AOAIサービスでコンテンツフィルタをオフにするための申請をしてみました。以前見たときと比べて、申請における質問数も減ったような…?「責任あるAI」に関して、利用者である我々の信用度が上がってきたということでしょうか。
後編ではコンテンツフィルタの解除結果とともに、実際にどのように動くかをまとめる予定です。
(無事に解除されればですが。)
それではお楽しみに!
Discussion