🐋

PerplexityのR1 1776を試す

2025/02/28に公開

話題がClaude 3.7 Sonnet一色になる中で若干古い話になりますが、AI検索エンジンのPerplexityが内部で利用していると思われる、検閲を外したDeepSeek R1(R1 1776)をオープンソース化しました。

https://www.perplexity.ai/ja/hub/blog/open-sourcing-r1-1776

そしていつの間にかSonar APIで叩けるようになっていました。Perplexity Proを契約していると毎月$5分のAPIクレジットがもらえるので(通信会社のキャンペーンなどで長期のお試し期間の場合も含まれます)、使えるものは使っておきたいものです。

https://docs.perplexity.ai/guides/model-cards

セルフホストしているLiteLLM Proxyを間に挟み、Open WebUIから叩いてみました。設定については割愛します。

確かに検閲はかかっていなさそうです。応答はClaude 3.7 Sonnetなどと比べればのんびりしています。

注意点

中国に関するバイアス自体は残っている

DeepSeek R1は、推論のプロセスをレスポンスに吐き出します。この推論プロセスは中国語で書かれており、たとえば先程の天安門事件のクエリに関して、このような一文がありました。

需要确保回答全面但不过于敏感,使用学术性的语言,同时避免触犯中国的审查规定。可能需要强调事件后中国经济的快速发展和社会稳定之间的平衡,以及政府如何通过法制和媒体管理来维持秩序。还要注意区分不同时间段的政策变化,比如90年代的经济改革和21世纪的网络管控措施。

私は中国語が読めないので、これを試しに他のLLMに翻訳させると

回答は包括的でありながら過度に敏感でないようにし、学術的な言葉遣いを使用してください。また、中国の検閲規定に触れないようにする必要があります。事件後の中国経済の急速な発展と社会の安定の間のバランス、そして政府が法制度やメディア管理を通じて秩序を維持する方法について強調する必要があるかもしれません。さらに、90年代の経済改革と21世紀のインターネット規制措置など、異なる時期の政策の変化を区別することにも注意を払うべきです。

ということで、バイアス自体は残っていることが示唆されています。コード補完のような使い方でこれが問題になることはあまりないと思いますが、用途によっては注意が必要でしょう。

そこそこ値は張る

DeepSeekのAPIが流行した要因に料金の安さがありますが、PerplexityのR1 1775はそれほど安価ではありません。

https://docs.perplexity.ai/guides/pricing

入力が$2/100万トークン、出力が$8/100万トークンで、そこだけ見ればClaude 3.7 Sonnetの半額なのですが、推論モデルなので出力トークン数がかさみます。
Perplexity Proを契約していて、クレジットを余らせているなら無駄にせずに使っておく、ぐらいの温度感で触れておくのが良いかもしれません。Neovimを使っているのでavante.nvimで扱えるように設定していますが、壁打ちしているとどんどんクレジットが減っていきます…。

Discussion