Closed1

ChatGPT-5記録:挙動検証ログ(2025-08-15)

ゆういちゆういち

日付:2025-08-15

タグ

  • モデルタグ:GPT-5
  • 内容タグ:モデル比較 / 失敗事例 / 雑談挙動

テーマ
GPT-5の会話・対話品質を実体験として検証し、4oやClaudeとの比較を試みた

試したこと

  • GPT-5で雑談・相談ベースの対話を実施
  • 会話の中で指示や文脈の保持を確認
  • 不満点(繰り返し・食い違い・ずれた提案)を指摘してフィードバック
  • 「他ユーザーの評価」や「使い分けの実態」の調査依頼
  • GPT-5の挙動とRedditなどの反応を突き合わせて評価

結果・気づき

  • 会話の中で過去の発言が取り込まれず、ループが発生
  • 問題の本質に即した提案がなされず、話がかみ合わない
  • 同様の不満はRedditでも多数報告されており、4o・Claudeへの回帰が増えている
  • GPT-5はベンチマーク上は優秀でも、体感品質(対話性・修正力)では明確に劣後する場面がある

メモ

  • GPT-5はマルチモーダル用途(画像・動画生成)や長文要約に用途を絞るべき
  • 実務では、会話=4o、コーディング=Claude、GPT-5=限定用途という役割分担が現実的
このスクラップは22日前にクローズされました