GPT-4.5の公式情報を確認して冷静になった
執筆日
2025/02/28
概要
本日2025/2/28、待望のOpenAIのGPT最新モデルが利用可能になりました。
そして、HWSとしてはAzure OpenAIで使えるのかが一番の気になりポイントですが、申請は必要なものの早速モデル追加されていました。新規モデルが即日追加されるのはかなり珍しい気がします。(自分の知る中では初めて)
というわけで申請が通るのを待っている間に新モデルについての公式情報をまとめてメモっておこうというのが本記事の趣旨になります。
おそらく利用者が最初に気になるであろうポイントを重点的にまとめたつもりなので、ただ要約しただけよりは有用になっていると信じたいです。(この情報も必要だろ、というのがあれば追記するのでコメントください!)
参考
利用者
- ChatGPT Proユーザー
- ウェブ、モバイル、デスクトップアプリでGPT-4.5を選択できる
- 有料APIユーザー
- 今回はTier(総利用料によるランク分け)による足切りはないようです
- (申請が通った)Azure OpenAIユーザー
- 今までの実績的に数日で申請は通る気がします
- (発表1週間後の)ChatGPT Plusユーザー
- Sam AltmanのTwitter(現:X)によると急いでGPU用意してるからちょっと待って的な理由のようです
機能について
利用できる機能は今までのモデルより少し絞られているようで目立った新機能はありません。(使えないやつはあんまり性能よくなかったからなのでは……という気がします)
またトレーニングデータはGPT-4o 11月モデルと同じく2023年10月までの情報を利用しているようです。
- ChatGPT
- 検索で最新の最新情報にアクセス
- ファイルや画像のアップロードをサポート
- キャンバスを使用してライティングやコード作業
- ボイスモード、ビデオ、スクリーンシェアリングなどのマルチモーダル機能をサポートしていません
- API
- コンテキスト長 は 入力128,000 出力16,384 で従来モデルと同じ
- Structured outputs
- Prompt caching
- Tools
- Streaming
- Text(input/output)
- Image(input)
API利用料
Azure OpenAIはまだ出ていませんでした。
BatchAPIはトークン当たり半額利用でき、画像のトークン使用量計算方法はGPT-4oと同じです。
モデル | Input Tokens / 1M | Cached Input Tokens / 1M | Output Tokens / 1M |
---|---|---|---|
GPT-4.5 | $75.00 | $37.50 | $150.00 |
GPT-4o | $2.50 | $1.25 | $10.00 |
OpenAI o1 | $15.00 | $7.50 | $60.00 |
…………………高い!!!!!!!GPT-4oと比較して入力30倍・出力15倍です。o1は推論の内部トークンも入るので一概に比較できませんがそれでもかなり高く感じますね。
何に強い?
以下モデル説明の翻訳
より高い感情的知能と創造性から恩恵を受けるアプリケーション(例えば、ライティング・ヘルプ、コミュニケーション、学習、コーチング、ブレーンストーミングなど)に特に有用であると感じるかもしれない。 また、マルチステップコーディングワークフローや複雑なタスクの自動化など、エージェント的なプランニングと実行においても強力な能力を発揮します。
特に新しい機能タスクができるようになったという感じはしませんね。順当に今まで以上にタスク実行能力が上がっていますよ、ということだと思います。
従来モデルとの関係
以下、モデル説明の翻訳
GPT-4.5は非常に大規模で計算負荷の高いモデルであるため、GPT-4oよりも高価であり、GPT-4oを置き換えるものではありません。 このため、現在の機能のサポートと将来のモデルの構築のバランスを取りながら、APIでの提供を長期的に続けるかどうかを評価しています。 私たちは、GPT-4.5の長所、能力、実世界での潜在的な用途について、より多くのことを学ぶことを楽しみにしています。 GPT-4.5があなたのユースケースにユニークな価値を提供する場合、あなたのフィードバック(新しいウィンドウで開きます)は、私たちの決定を導く上で重要な役割を果たすでしょう。
今後出していく大規模モデル(数か月後に発表される予定のGPT-5)の提供に向けてのテスト的な側面が大きく、ビジネス的に使っていくユースケースは期待されていないように感じます。正に4.5という名前の通りの位置づけなのだと思われます。
ベンチマーク比較
確かにワンショットでここまで回答できるのは凄いんだけど、正直ここまで来るとベンチマーク結果だけを見て、うおぉという感じにもなりませんね(o3のような軽量思考モデルがすごい)
GPT-4.5 | GPT-4o | OpenAI o3-mini (high) | |
---|---|---|---|
GQPA (science) | 71.4% | 53.6% | 79.7% |
AIME '24 (math) | 36.7% | 9.3% | 87.3% |
MMLU (multilingual) | 85.1% | 81.5% | 81.1% |
MMMU (multimodal) | 74.4% | 69.1% | - |
SWE-Lancer Diamond (coding)* | 32.6% | 23.3% | 10.8% |
SWE-Bench Verified (coding)* | $186,125 | $138,750 | $89,625 |
SWE-Bench Verified (coding)* | 38.0% | 30.7% | 61.0% |
- Numbers shown represent best internal performance.
まとめ
- API利用料金は高すぎるので案件で使っていこうぜ!という感じではない(現状プレビュー版なのもあるし、API公開を継続していくかはOpenAIも検討中)
- ChatGPTユーザーはコーディング性能の向上に感動して嬉しくなれそう(Github Enterpriseユーザーは既にCopilotで利用可能なようです)
- OpenAIはGPUの管理がめちゃくちゃ大変そう
- お手頃価格のGPT-4.5oか、最強のGPT-5に思いを馳せよう
Discussion