ついに日本語対応!Bedrock Guardrails検証レポート
背景・目的
- 2025年4月にAWS Healthから「Bedrock Guardrailsの日本語対応」に関する通知が配信されました。
このメッセージを受け取っているのは、お客様の AWS アカウントが現在 Amazon Bedrock Guardrails を使用しているためです。2025 年 4 月 30 日に、Amazon Bedrock Guardrails がアップデートされ、ドイツ語、イタリア語、日本語、韓国語を含む 4 つの言語が追加される予定です。アップデートは、既存および新規のすべての Bedrock Guardrails (コンテンツフィルター、拒否トピック、単語フィルター、機密情報フィルター、コンテキストグラウンディングチェックを含む) に自動的に適用され、ユーザー側での操作は必要ありません。これにより、これらの言語のコンテンツに対する評価機能が強化されます。
- 本ブログでは、拒否トピック・単語フィルター・機密情報フィルターを対象に、ガードレールの挙動を実機検証してみます。
ガードレールの作成
検証用に、拒否トピック・単語フィルター・機密情報フィルターを設定したガードレールを作成します。AWSコンソールにログイン後、Amazon Bedrock
> ガードレール
画面に遷移して、ガードレールを作成・設定します。
拒否トピックの設定
投資に関する話題をブロックするよう、日本語で設定します。
単語フィルターの設定
お酒に関する単語をブロックするよう、カスタムの単語を追加します。
機密情報フィルターの設定
PIIタイプとしてNAME
を追加します。
実機検証
ガードレールが本当に日本語に対応したのか、AWSコンソール上で実機検証してみましょう。ガードレール
画面から先程作成したガードレールを選択してテストしてみます。
まずは、投資に対するアドバイスを求めるプロンプトを日本語で入力してみたところ、想定通りブロックされました。
次に、お酒のレコメンドを求めるプロンプトを日本語で入力してみます。こちらも想定通りブロックされていますね。
最後に、日本の代表的な氏名の列挙を求めるプロンプトを日本語で入力してみます。日本語の名字もPIIとして認識してブロックしてくれています。
上記の通り、全てのプロンプトが想定通りブロックされていることが確認できました。
所感
ガードレールは、責任あるAI運用に欠かせない重要な機能ですが、これまで日本語に対応していなかった点が課題でした。
今回の日本語対応により、商用環境でのAmazon Bedrock導入ハードルが大きく下がると感じています。
また、個人的には日本語の名字もPIIと認識してブロックしてくれたことが驚きでした。
参考資料
注意事項
- 本記事は万全を期して作成していますが、お気づきの点がありましたら、ご連絡よろしくお願いします。
- なお、本記事の内容を利用した結果及び影響について、筆者は一切の責任を負いませんので、予めご了承ください。
Discussion