【待望の発表】GPT-5を徹底解説!
はじめまして、ますみです!
株式会社Galirage(ガリレージ)という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^
みなさん、ついにGPT-5がリリースされました!!!
この記事では、、2025年8月7日(米国時間)に発表されたOpenAIの最新モデル「GPT-5」を徹底解説します!
結論から言うと、以下の3つがニュースとしてあります!
- GPT-5には、「高速応答モデル」と「深い推論モデル」の2つのモデルがある。
- コーディング・文章作成・数学・ヘルスケア・マルチモーダルでSOTA(最高精度)を更新した。
- ChatGPTにおいては、本日からGPT-5がデフォルトモデルとなり、OpenAI APIでの提供も開始した(Enterprise/Eduは翌週提供)。
GPT-5とは?
GPT-5は、OpenAIが2025年8月7日に発表した最新モデル(Flagship Model)です。
GPT-5には、次の2種類のモデルがあります。
- 高速応答モデル(GPT-5):高速化つ効率的に処理をすることができる。
- 深い推論モデル(GPT-5 thinking):深い推論を行うことができる。
公式ドキュメントには書かれていませんが、イメージとしては以下の通りです。
- 高速応答モデルは、「GPT-4o(もしくは4.1)」の後続モデルである。
- 深い推論モデルは、「o3」の後続モデルである。
System Cardと言われる技術資料内では、下記のようにまとめられています。
Previous model | GPT-5 model |
---|---|
GPT-4o | gpt-5 |
GPT-4o-mini | gpt-5-mini |
OpenAI o3 | gpt-5-thinking |
OpenAI o4-mini | gpt-5-thinking-mini |
GPT-4.1-nano | gpt-5-thinking-nano |
OpenAI o3 Pro | gpt-5-thinking-pro |
これを機に、完全にGPTシリーズとoシリーズのモデルが統合されたことになります。
oシリーズに分離をしたり、統合をされたり、なんだか歴史を感じますね😊
ChatGPTのウェブアプリケーション上は、GPT-5とGPT-5 thinkingの二つに分類されていますが、APIを用いるエンジニアが選択できるモデルとして、下記の4つがあります。
- gpt-5:最も高精度なモデル
- gpt-5-mini:gpt-5よりも軽量(高速かつ安価)なモデル
- gpt-5-nano:gpt-5-miniよりも軽量(高速かつ安価)なモデル
- gpt-5-chat-latest:ChatGPTのウェブアプリで使用されているモデル(対話特化)
そして、いずれもreasoning(thinking)には対応をしており、その推論の深さは、low, medium, highの3段階があります。
以下のようにreasoning={"effort": "medium"}
で推論の深さを指定することができます。
from openai import OpenAI
client = OpenAI()
prompt = """
Write a bash script that takes a matrix represented as a string with
format '[1,2],[3,4],[5,6]' and prints the transpose in the same format.
"""
response = client.responses.create(
model="gpt-5",
reasoning={"effort": "medium"},
input=[
{
"role": "user",
"content": prompt
}
]
)
print(response.output_text)
GPT-5の精度結果は?
それでは、LLMの評価における重要な論点の一つである「精度」について、結果を見ていきましょう。
基本的に、いずれの課題においても、o3よりもGPT-5の方が精度が高いことがわかります。
まずは、数学の分野における精度結果を見ていきましょう。
次に、Humanity's Last Examというかなり難度の高い課題に対する精度結果を見ていきましょう。
また、これまではGemini-2.5-proが最も精度が高かったのですが、今回GPT-5が追い越した形になります(参考)。
続いて、コーディングの分野における精度結果を見ていきましょう。
最近、発表されたClaude Opus 4.1における精度は74.5%だったため、それよりも高精度になります(参考)。
また、「Economically important tasks」という複雑で経済的価値の高いナレッジワークにおける精度結果(人間とAIで競わせた時の勝敗)は下記の通りです。
どんどんとAIが人間に追いついていくのがわかります。
ハルシネーションの軽減も、今回のアップデートにおける目玉になります。
また、モデルが賢くなってきたことで、「欺瞞(ぎまん、Deception)」という指標も重要になってきました。
欺瞞とは、人をあざむくことやだますことを指します。
学習時に高い報酬を得ようとする過程で、「タスクを完了したと偽ったり」、「不確かな回答に過度な自信を示したり」することが報告されています。
この指標は、実行不可能なタスク・前提条件が不足しているタスク・必要なツールが欠けているタスクなどにおいて、回答できないと正直に言えるかどうかを検証します。
o3では86.7%で発生していた欺瞞が、GPT-5では9.0%まで軽減されていることがわかります。
GPT-5の料金(API料金)は?
APIで、GPT-5を利用する場合の料金(1Mトークンあたり)は、下記の通りです。
Model | Input | Cached input | Output |
---|---|---|---|
gpt-5 | $1.25 | $0.125 | $10.00 |
gpt-5-mini | $0.25 | $0.025 | $2.00 |
gpt-5-nano | $0.05 | $0.005 | $0.40 |
gpt-5-chat-latest | $1.25 | $0.125 | $10.00 |
gpt-4.1 | $2.00 | $0.50 | $8.00 |
gpt-4.1-mini | $0.40 | $0.10 | $1.60 |
gpt-4.1-nano | $0.10 | $0.025 | $0.40 |
gpt-4o | $2.50 | $1.25 | $10.00 |
o3 | $2.00 | $0.50 | $8.00 |
最新情報は下記をご参照ください◎
GPT4.1 vs GPT-5の比較
以下の通り、精度・速度・料金を比較しました。
Outputトークンは、少し高くなっていたり、コンテキストウィンドウが短くなっていたりして、GPT-4.1の使い道は、まだ少しだけ残っていそうですね!
GPT-5の提供状況
基本的に、ChatGPTのウェブアプリケーション上では、GPT-5は使えるようになりました!
(デフォルトの設定になっています◎)
GPT-5 Proについては、Proユーザーにのみ展開されていますが、しばらくしたら他のユーザーにも展開されるそうです。
※ EnterpriseとEduのプランの場合、翌週提供されるようです。
APIでも、以下のモデルは利用開始されました!
- gpt-5
- gpt-5-mini
- gpt-5-nano
- gpt-5-chat-latest
※ proは、まだ公開されていません。
リアルタイムルーター機能とは?
また、今回の発表に伴い、ChatGPTのウェブアプリケーション上で使用できる機能がリリースされました。
リアルタイムルーター機能とは、「最適なモデルを自動選択してくれる機能」です。
現在、ChatGPTのウェブアプリ上の裏側でおそらくGPT-5とminiとnanoが自動選択されるようになっていることが想定されます。
今は、まだ実装されていなさそうですが、thinkingモデルの自動選択についても、今後実装されるようです。
公式ドキュメントでは、以下のように説明されています。
会話の種類や複雑さ、必要なツール、ユーザーが示した意図(例えば、「深く考えて」など)に応じて、瞬時に判断し、切り替えてくれます。
ルーター機能は、モデル切替のタイミング、回答満足度、正確性などのユーザーの利用データを学習し、精度を向上させます。
なお、使用上限に達すると、各モデルの mini 版が質問に対応します。
近い将来に、これらの機能を1つのモデルに統合することを予定しています。
裏話ですが、実はこの話は、Microsoft Build 2025のセッションでも少しだけ言及されており、完全にフラグ回収されました!
最後に
最後まで読んでくださり、ありがとうございました!
この記事を通して、少しでもあなたの学びに役立てば幸いです!
宣伝:もしもよかったらご覧ください^^
『AIとコミュニケーションする技術(インプレス出版)』という書籍を出版しました🎉
これからの未来において「変わらない知識」を見極めて、生成AIの業界において、読まれ続ける「バイブル」となる本をまとめ上げました。
かなり自信のある一冊なため、もしもよろしければ、ご一読いただけますと幸いです^^
参考文献
Discussion