😎

OpenAI o1越えの新星?推論特化型モデル「Sonus-1 Pro」の実力とは!?

2025/01/04に公開

概要

Sonus-1 Proは、AI開発企業Rubik's AIが開発した最上位モデルであり、特に高度な推論タスクに特化した設計が特徴です。連鎖思考推論(Chain of Thought Reasoning)という機能により、複雑な問題を段階的に解決する能力に優れています。Sonus-1シリーズには、高速・低コストなMini、パフォーマンスとコストのバランスを重視したAir、そして高度なタスクに対応する最上位モデルであるProの3つのラインナップが存在し、Proモデルはさらに推論能力を強化したバージョンも提供されています。他の競合モデルと比較すると、数学などの理系分野で特に高い性能を発揮し、DeepSeek r1-Lite, o1 Preview, Llama3 405B-Inst, Claude-3.5 Sonnet, GPT-4o 0513といったモデルに対して、特定のベンチマークで優位性を示しています。利用はchat.sonus.aiから可能ですが、日本語の能力には改善の余地が見られます。また、リアルタイム情報検索や画像生成AI「Flux」との連携により、最新情報へのアクセスや高精度な画像生成も実現しています。

Sonus-1 Proってどんなモデル?


Sonus-1 Proは、Sonus AIが開発した最上位モデルの一つで、推論タスクに特化した設計が特徴です。特に「連鎖思考推論 (Chain of Thought Reasoning)」を備えており、複雑な問題を解く能力に優れています。

また、Sonus-1シリーズには、用途に応じた3つのラインナップがあります:

Mini: 高速・低コストなモデル
Air: パフォーマンスとコストのバランスを重視
Pro: 高度なタスクに対応する最上位モデル
その中でも、推論能力をさらに強化した Sonus-1 Pro (w/ Reasoning) は、まさにフラッグシップと呼ぶにふさわしい存在です。

競合モデルとどう違うのか?

Sonus-1 Proを語るうえで避けられないのが、他の有力モデルとの比較です。以下は、主要なベンチマークでのスコアを抜粋したものです。

この図からもわかりますが、Sonus-1 Proは数学などの理系分野に強いモデルであることがわかります。
以前はLLM苦手としていた数学や算数の問題でもかなりいい成績を出しています。
数学などを解くための推論モデルであるo1-previewに対しても数学の分野で勝利していることからそのモデルの性能の高さが伺えます。

その他モデルとの比較

  • DeepSeek r1-Lite: HumanEvalでわずかにSonus-1を上回るものの、全体的なパフォーマンスではSonus-1 Proに及ばない。

  • o1 Preview: GPQA-DiamondのスコアがSonus-1 Proを上回るが、他のベンチマークではSonus-1 Proが優位。

  • Llama3 405B-Inst: いくつかのベンチマークで高いスコアを示すが、全体的にはSonus-1 Proに劣る。

  • Claude-3.5 Sonnet: MMLU-Pro、IF-Eval、Aider-Editで高いスコアを持つが、他の指標ではSonus-1 Proが優位。

  • GPT-4o 0513: 総合的に安定した性能を見せるが、特定の分野ではSonus-1 Proがそれを上回る。

Sonus-1のアクセス


Sonus-1の各モデルは、chat.sonus.aiで利用可能です。
実際に使ってみた感想としては、数学的な性能は高いのかもしれませんが、日本語の能力があまり高くない印象です。

その他の特徴

強化された検索とリアルタイムの情報検索

Sonus-1 は、洗練された検索機能により一般的な LLM の制限を超え、最新かつ正確な情報へのアクセスを保証します。
画像生成機能との統合
最新の画像生成AI「Flux」がSonus-1プラットフォーム内で直接ご利用いただけるようになりました。これにより、これまで以上に手軽に、そして魅力的なビジュアルコンテンツを生成することが可能です。ぜひSonus-1でFluxの革新的な画像生成をご体験ください。
FluxはX(旧Twitter)で使える画像生成モデルと同じのようだったので、かなり高精度な画像生成が期待できます。


こちらがSonus-1の開発元のRubik's AIのtwitterに乗っていた画像ですが、かなりリアルであることがわかります。

まとめ

近年のAIの進化の速度にはほんとに驚かされますね!
ここ直近は、o1やo3をはじめとするReasoning Modelに注目が集まりそうです。
もっと注視していきたいと思います。
OpenAIやGoogle以外の新興企業にも期待です。

Discussion