Closed22日前にクローズ1

ChatGPT-5記録：挙動検証ログ（2025-08-15）

productivity

日記

ChatGPT

ゆういち

日付：2025-08-15
タグ：
モデルタグ：GPT-5
内容タグ：モデル比較 / 失敗事例 / 雑談挙動
テーマ：

GPT-5の会話・対話品質を実体験として検証し、4oやClaudeとの比較を試みた
試したこと：
GPT-5で雑談・相談ベースの対話を実施
会話の中で指示や文脈の保持を確認
不満点（繰り返し・食い違い・ずれた提案）を指摘してフィードバック
「他ユーザーの評価」や「使い分けの実態」の調査依頼
GPT-5の挙動とRedditなどの反応を突き合わせて評価
結果・気づき：
会話の中で過去の発言が取り込まれず、ループが発生
問題の本質に即した提案がなされず、話がかみ合わない
同様の不満はRedditでも多数報告されており、4o・Claudeへの回帰が増えている
GPT-5はベンチマーク上は優秀でも、体感品質（対話性・修正力）では明確に劣後する場面がある
メモ：
GPT-5はマルチモーダル用途（画像・動画生成）や長文要約に用途を絞るべき
実務では、会話＝4o、コーディング＝Claude、GPT-5＝限定用途という役割分担が現実的

このスクラップは22日前にクローズされました