Closed1
ChatGPT-5記録:挙動検証ログ(2025-08-15)

日付:2025-08-15
タグ:
- モデルタグ:
GPT-5
- 内容タグ:
モデル比較
/失敗事例
/雑談挙動
テーマ:
GPT-5の会話・対話品質を実体験として検証し、4oやClaudeとの比較を試みた
試したこと:
- GPT-5で雑談・相談ベースの対話を実施
- 会話の中で指示や文脈の保持を確認
- 不満点(繰り返し・食い違い・ずれた提案)を指摘してフィードバック
- 「他ユーザーの評価」や「使い分けの実態」の調査依頼
- GPT-5の挙動とRedditなどの反応を突き合わせて評価
結果・気づき:
- 会話の中で過去の発言が取り込まれず、ループが発生
- 問題の本質に即した提案がなされず、話がかみ合わない
- 同様の不満はRedditでも多数報告されており、4o・Claudeへの回帰が増えている
- GPT-5はベンチマーク上は優秀でも、体感品質(対話性・修正力)では明確に劣後する場面がある
メモ:
- GPT-5はマルチモーダル用途(画像・動画生成)や長文要約に用途を絞るべき
- 実務では、会話=4o、コーディング=Claude、GPT-5=限定用途という役割分担が現実的
このスクラップは22日前にクローズされました