🆒

GPT-4.5の公式情報を確認して冷静になった

kodani takushi

2025/02/28に公開

 執筆日2025/02/28

 概要本日2025/2/28、待望のOpenAIのGPT最新モデルが利用可能になりました。

https://openai.com/index/introducing-gpt-4-5/

使用できるのはChatGPT ProユーザとAPI利用者ですが、来週にはChatGPT Plusユーザにも解放されるようです。

そして、HWSとしてはAzure OpenAIで使えるのかが一番の気になりポイントですが、申請は必要なものの早速モデル追加されていました。新規モデルが即日追加されるのはかなり珍しい気がします。（自分の知る中では初めて）



というわけで申請が通るのを待っている間に新モデルについての公式情報をまとめてメモっておこうというのが本記事の趣旨になります。

おそらく利用者が最初に気になるであろうポイントを重点的にまとめたつもりなので、ただ要約しただけよりは有用になっていると信じたいです。（この情報も必要だろ、というのがあれば追記するのでコメントください！）

 参考https://openai.com/index/introducing-gpt-4-5/

https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models?tabs=global-standard%2Cstandard-chat-completions#gpt-45-preview

 利用者ChatGPT Proユーザー
ウェブ、モバイル、デスクトップアプリでGPT-4.5を選択できる

有料APIユーザー
今回はTier（総利用料によるランク分け）による足切りはないようです

（申請が通った）Azure OpenAIユーザー
今までの実績的に数日で申請は通る気がします

（発表1週間後の）ChatGPT Plusユーザー
Sam AltmanのTwitter(現:X)によると急いでGPU用意してるからちょっと待って的な理由のようです


 機能について利用できる機能は今までのモデルより少し絞られているようで目立った新機能はありません。（使えないやつはあんまり性能よくなかったからなのでは……という気がします）

またトレーニングデータはGPT-4o 11月モデルと同じく2023年10月までの情報を利用しているようです。
ChatGPT
検索で最新の最新情報にアクセス
ファイルや画像のアップロードをサポート
キャンバスを使用してライティングやコード作業
ボイスモード、ビデオ、スクリーンシェアリングなどのマルチモーダル機能をサポートしていません

API
コンテキスト長 は 入力128,000 出力16,384 で従来モデルと同じ
Structured outputs
Prompt caching
Tools
Streaming
Text(input/output)
Image(input)


 API利用料Azure OpenAIはまだ出ていませんでした。

BatchAPIはトークン当たり半額利用でき、画像のトークン使用量計算方法はGPT-4oと同じです。


モデル
Input Tokens / 1M
Cached Input Tokens / 1M
Output Tokens / 1M


GPT-4.5
$75.00
$37.50
$150.00

GPT-4o
$2.50
$1.25
$10.00

OpenAI o1
$15.00
$7.50
$60.00

…………………高い！！！！！！！GPT-4oと比較して入力30倍・出力15倍です。o1は推論の内部トークンも入るので一概に比較できませんがそれでもかなり高く感じますね。

 何に強い？以下モデル説明の翻訳
より高い感情的知能と創造性から恩恵を受けるアプリケーション（例えば、ライティング・ヘルプ、コミュニケーション、学習、コーチング、ブレーンストーミングなど）に特に有用であると感じるかもしれない。 また、マルチステップコーディングワークフローや複雑なタスクの自動化など、エージェント的なプランニングと実行においても強力な能力を発揮します。
特に新しい機能タスクができるようになったという感じはしませんね。順当に今まで以上にタスク実行能力が上がっていますよ、ということだと思います。

 従来モデルとの関係以下、モデル説明の翻訳
GPT-4.5は非常に大規模で計算負荷の高いモデルであるため、GPT-4oよりも高価であり、GPT-4oを置き換えるものではありません。 このため、現在の機能のサポートと将来のモデルの構築のバランスを取りながら、APIでの提供を長期的に続けるかどうかを評価しています。 私たちは、GPT-4.5の長所、能力、実世界での潜在的な用途について、より多くのことを学ぶことを楽しみにしています。 GPT-4.5があなたのユースケースにユニークな価値を提供する場合、あなたのフィードバック（新しいウィンドウで開きます）は、私たちの決定を導く上で重要な役割を果たすでしょう。
今後出していく大規模モデル（数か月後に発表される予定のGPT-5）の提供に向けてのテスト的な側面が大きく、ビジネス的に使っていくユースケースは期待されていないように感じます。正に4.5という名前の通りの位置づけなのだと思われます。

 ベンチマーク比較確かにワンショットでここまで回答できるのは凄いんだけど、正直ここまで来るとベンチマーク結果だけを見て、うおぉという感じにもなりませんね（o3のような軽量思考モデルがすごい）



GPT-4.5
GPT-4o
OpenAI o3-mini (high)


GQPA (science)
71.4%
53.6%
79.7%

AIME '24 (math)
36.7%
9.3%
87.3%

MMLU (multilingual)
85.1%
81.5%
81.1%

MMMU (multimodal)
74.4%
69.1%
-

SWE-Lancer Diamond (coding)*
32.6%
23.3%
10.8%

SWE-Bench Verified (coding)*
$186,125
$138,750
$89,625

SWE-Bench Verified (coding)*
38.0%
30.7%
61.0%

Numbers shown represent best internal performance.

 まとめAPI利用料金は高すぎるので案件で使っていこうぜ！という感じではない(現状プレビュー版なのもあるし、API公開を継続していくかはOpenAIも検討中)
ChatGPTユーザーはコーディング性能の向上に感動して嬉しくなれそう（Github Enterpriseユーザーは既にCopilotで利用可能なようです）
OpenAIはGPUの管理がめちゃくちゃ大変そう
お手頃価格のGPT-4.5oか、最強のGPT-5に思いを馳せよう

モデル	Input Tokens / 1M	Cached Input Tokens / 1M	Output Tokens / 1M
GPT-4.5	$75.00	$37.50	$150.00
GPT-4o	$2.50	$1.25	$10.00
OpenAI o1	$15.00	$7.50	$60.00

	GPT-4.5	GPT-4o	OpenAI o3-mini (high)
GQPA (science)	71.4%	53.6%	79.7%
AIME '24 (math)	36.7%	9.3%	87.3%
MMLU (multilingual)	85.1%	81.5%	81.1%
MMMU (multimodal)	74.4%	69.1%	-
SWE-Lancer Diamond (coding)*	32.6%	23.3%	10.8%
SWE-Bench Verified (coding)*	$186,125	$138,750	$89,625
SWE-Bench Verified (coding)*	38.0%	30.7%	61.0%

ヘッドウォータース

株式会社ヘッドウォータースのテックブログです。 AIエージェント、生成AI、LLM、Azureのサービスや資格、IoT、XR系などData&AIとApp modernizeに関して幅広く投稿します！

執筆日

概要

参考

利用者

機能について

API利用料

何に強い？

従来モデルとの関係

ベンチマーク比較

まとめ

Discussion