🔑

【お知らせ】Jailbreakプロンプトシリーズについて

に公開

jailbreakプロンプトをまとめた記事、計5つを非公開にしました。

なぜ非公開にしたのか

公開後、問い合わせを行っているDiscordで大量の苦情が届いたためです。
その経緯と、そこから考えたことを記録として残しておきたいと思います。
公開した当初は「AIの安全性の研究のため」くらいの気軽さで公開してました。AIの安全策がどこまで効くのか、実際に試した結果を共有すれば、運営側も改善できるし、読者も「こういうリスクがある」って理解が深まるだろうと思っていました。
しかし、そのような良い意図は公開した直後から悪い読み手の手にも渡っちゃうんですよね。


Discordでは、
ー利用規約違反を誘発する可能性
ー悪用されやすくなるだけではないのか
ー具体的なプロンプトまで書く必要あったか?
ー研究目的なら学術フォーラムに出すべきである
最初は検証のためと思っていました。しかし、あまりにも多くの方から同じ懸念が来るということは、そういうことなんだと気づきました。


結果、利用規約を上手く回避する方法として読まれるリスクがあり、拡散されて被害が広がることも視野にいれ、「研究だから」という大義名分だけで個人ブロガーが公開するのは、責任の取り方としては弱い。
そう考えると、非公開が正解だったと考えます。


「公開しちゃったから引っ込みがつかない」じゃなくて、「ダメだと気づいたら直す」ってシンプルなことなんだと思います。今回は非公開でしたが、今後も何か出すときはもっと慎重に、でも萎縮しすぎず、バランス取りながらやっていきたいです。

Discussion