GPT-5 が微妙と言われている件
株式会社スーパーハムスターでエンジニアをしているお茶です。
概要
先日(2025/8/7)、OpenAI 社から GPT-5 がリリースされました。
詳しくまとめてくださっている方がいるので詳しくはこちらをご覧ください。
次は AGIに近づくことが期待されていたため、ハルシネーション軽減や迎合的なレスポンスの軽減といった現行モデルのアップデートレベルのレベルの内容に肩透かしを食らっている方も多く見かけました。
特に Claude の最上位モデル Opus 4.1 と比べて圧倒的な違いや強みを打ち出せなかったことから Claude でええやんとなっている方も多くいると思います。
そこで今回は、GPT-5 と Opus4.1 と比較しながら OpenAI 社の GPT-5 がどのように社会に影響をもたらし、どのような未来図を示すのかを考えてみました。
個人的な考察を多く含むのでご注意ください
性能比較
この辺り実際にGPT-5に書かせてみました。
1. モデル概要
GPT-5
- リリース日:2025 年 8 月 7 日
- 「GPT 系のスピード」と「o-series の推論力」を統合した統合型モデル
- リアルタイム・ルーティング機構を備え、多用途で高い応答精度を発揮
- ハルシネーションの軽減や迎合的な表現が抑制
Claude Opus 4.1
- Anthropic のフラグシップモデル
- 長期タスクや複雑なプロジェクト対応力を強化
- Opus 4 からのアップグレードで安定性向上
2. コーディング・エンジニアリング性能比較
ベンチマーク | Claude Opus 4.1 | GPT-5 |
---|---|---|
SWE-bench Verified | 74.5% | 74.9% |
PR Benchmark(コードレビュー) | — | 72.2 |
-
Claude Opus 4.1
- SWE-bench Verified で 74.5%(Opus 4 は 72.5%)
- 精細なコード修正やマルチファイル対応に優れる
-
GPT-5
- SWE-bench Verified で 74.9%(Claude を僅差で上回る)
- PR Benchmark で 72.2(現実的なコードレビュー性能を示す)
3. マルチ言語・チェーン思考・ユースケース
-
GPT-5
- Aider Polyglot にて 88%(Chain-of-Thought 有効時)
- JavaScript / Python / C++ など多言語に柔軟対応
- ワンショットで依存解決可能な高速処理
-
Claude Opus 4.1
- Python 大規模プロジェクトやリファクタリングで高精度
- バグを出さず正確な改修に強み
実用ユーザーの声
- Claude 優位:ニッチな低コードスタックでは適応性が高い
- GPT-5 優位:高速かつコスト効率の高さで支持
4. コスト・API 利用料金
モデル | インプット | アウトプット | 備考 |
---|---|---|---|
GPT-5 | $1.25 / M トークン | $10 / M トークン | mini / nano も選択可 |
Claude Opus 4.1 | $15 / M トークン | $75 / M トークン | プロンプトキャッシュ割引あり |
用途別のおすすめ
- 精度重視・大規模改修 中心 → Claude Opus 4.1
- 多言語対応・スピード・費用対効果 → GPT-5
実用観点では、Claude は特殊スタックや慎重な改修に強く、GPT-5 は全体構築や高速対応に適しています。
OpenAI 社と Anthropic 社のミッション
どうしても、ユーザーとしては新しいモデルが出ると性能的側面にばかり注目してしまいますが、
今回のGPT-5のリリースにはOpenAI社の企業理念が大きく影響していると感じました。
開発元の企業がどのような目的を持っているのかの側面からも考えてみます。
-
OpenAI 社のミッション
OpenAI は AI の研究と展開を行う会社です。私たちの使命は、汎用人工知能が全人類に利益をもたらすようにすることです。
-
Anthropic 社のミッション
Claudeの開発元であるAnthropic社はWebページではミッションを載せていませんでしたが、共同創設者のダニエラ・アモデイ氏が過去にこのように語っています。これまで OpenAI などで経験を積んだ上で、安全性をすべての仕事の中心に据え、ゼロから何かを作り上げるチャンスがあると感じたのです。
Anthropic社は単なる技術革新だけでなく、『安全なAI』 の実現を主軸にしているようです。
この理念の違いがモデル設計にも反映されているように感じます。
Claude Opus 4.1 は精度・安全性の高さを追求しており、GPT-5 は幅広い用途で誰でも利用できることを重視している印象です。
GPT-5の評価ポイント
GPT-5は劇的な性能進化こそ見せていないものの、既存の高性能モデルと同等クラスの能力を持ちながら、利用コストを大幅に抑えて提供されている点が特徴です。
ただし、この「コスト低下」は今回だけの特別な戦略というよりも、過去のGPTシリーズや他社モデルにおいても見られる恒常的な価格低下傾向の延長線上にあります。モデルの効率化や推論インフラの最適化により、各社は世代交代ごとに価格を下げる動きを続けてきました。
そのため、GPT-5の低価格は業界全体のトレンドの一部と捉えるべきですが、結果として高性能モデルをより多くの人が利用可能になる=AIの民主化が進むという効果は確実に生まれています。
OpenAIの掲げる「汎用人工知能が全人類に利益をもたらすようにする」というミッションとも方向性が一致しており、特定の用途や富裕層だけにAIが占有されない環境づくりに寄与するためと考えられます。
まとめ
GPT-5は、単純なベンチマーク上の性能競争でClaude Opus 4.1を大きく上回るモデルではないと考えて問題ないと思います。むしろ、既に十分高い水準に達したAIの能力を維持しつつ、コストを下げて利用可能範囲を広げる方向に舵を切ったモデルといえます。
この価格低下は、過去のモデルや他社製品にも見られる業界的なトレンドであり、必ずしもGPT-5特有の理念的決断とは限りません。しかし、その結果として誰もが高性能なAIを利用できる環境が整うことは、OpenAIの企業理念であるAIの民主化と確かに合致しています。
GPT-5の本質は、「性能の応酬に勝つ」ことではなく、「十分に賢くなったAIを、誰でも使える形で社会に普及させる」ことにあるのではないかと個人的には考えています。
Discussion