🥗

o3-mini/o3-mini-high登場 推論モデルを普段使いしましょう!


2025年1月31日(現地時間)に、OpenAIからo3-miniが発表されました。加えてo3-mini-highというo3-miniに比べて応答時間が掛かる一方でより精度が高い回答ができるモデルも発表しました。
https://x.com/OpenAI/status/1885406588057313550
使った印象として、特徴としては下記かなと考えています。

  • STEM(科学・技術・工学・数学のことで、プログラミングも含めるのが一般的)に特化している
  • 一方で、汎用的なアイディア出しや、言語処理はo1やo1 Proの方がしっくりくる
  • Web検索を具備しており、Web検索+推論ができる
  • 無料ユーザは、「Reason」ボタンを押しておくことによって無料でo3-miniが使える

ただ、OpenAIの推論モデルだけでも「o3-mini」「o3-mini-high」「o1」「o1 Pro」と種類が増えて、これまでの「GPT-4o」も存在します。選択肢が増えるのは良いですが、どれを使ったら良いか悩ましいですよね。
「o3-mini-high」にそれぞれの特徴をWebリサーチしてもらって、「o1 Pro」に表で整理してもらいました。
概ね合っているかなと考えていますが、間違った情報がありましたらごめんなさい。ご指摘ありましたら直せたらと考えています!

モデル 構成・特徴 強み 弱み 利用シーン例 プラン
o3‑mini - STEM(数学・科学・プログラミング)特化
- 高速応答(約7.7秒)
- 無料利用可
- 基本的な技術タスク
- 日常レベルのSTEM問題
- 複雑すぎる課題には推論が浅くなる場合がある
- 汎用的な文章作成はやや弱い
- 軽めのプログラミング
- 学習支援
- 小規模な実験
無料で利用可能
o3‑mini‑high - o3‑miniより高い推論力
- STEM分野でより複雑な課題に対応
- 難易度の高い数理やプログラミング
- 研究レベルの技術課題
- 処理が重く応答時間が長め
- 有料ユーザー限定
- 本格的な数理解析
- 大規模な開発や研究
有料ユーザー限定
o1 - 汎用的なタスクに広く対応
- ビジネス文書作成や創作的文章生成が得意
- ビジネス文書
- 一般的な文章生成
- 多目的タスク
- STEM特化ではない
- 最新技術最適化ではo3‑miniに及ばない可能性
- 多様な文章作成
- STEM以外の業務対応
有料ユーザー限定
o1 Pro - 最大約200,000トークンの長い文章に対応
- 大規模で高度な推論が可能
- 長文の会話
- 大規模データ解析
- 研究開発レベルの課題
- 処理が重く応答が遅い
- 利用コストが高い
- 詳細な議論
- 長文の調査
- 大規模プロジェクトや高度研究
有料ユーザー限定(Proプランのみ)

大きな変化として、o3-miniが無料ユーザでも使えるようになったです。これまでChatGPTで推論モデルを使う場合有料ユーザしか使えませんでした。今後は無料ユーザでも使えます。推論モデルはこれまでのGPT-4oと比べて、質問者のことを親身に考えて適切な言葉選びでピンと来る回答をしてくれる優秀なパタートナーAIです。無料で使えるので、ぜひ使ってみてください!質問がより自分ごとなほど、その違いがわかると思います!

また、プログラミングはo3-miniやo3-mini-highが強そうです。VBAのマクロやExcelの数式程度しか試せていないのですが、これまでプログラミングはClaude 3.5 Sonnetだよなぁと思っていたのですが、匹敵するアウトプットをしてくれる印象です。ぜひ、ITエンジニアの方でプログラミングされる方はo3-miniやo3-mini-highを使ってみてください!

一方で、汎用的なアイディア出しや言語処理は、o1の方がしっくりくる印象でした。
ので、もし有料ユーザの方はSTEMタスクかそうでないかで、o1とo3を使い分けると良いかもしれません。

いろいろ書きましたが、この記事を読んでいる皆さんにこういった推論モデルを日常使いしてほしいと考えています!
というのも、昨年(2024年)12月から推論モデルの波がやってきています。
これまでのGPT4-oやClaude 3.5 Sonnetを使ってみて、良いけどまだまだだなと思っていた方、今の生成AIは当時よりかなり進化していますよ!ただ、その進化をピンと来るように説明するのが難しいです。自分ごとの課題を問いかけるとその回答精度に驚くと思います。
ぜひこの機会にo3-miniやo3-highを使ってみてほしいし、慣れてきたら使い分けてビジネスや日常に活用して頂きたいなと考えています!

Accenture Japan (有志)

Discussion