📈

Claude CodeとCodexの併用で学んだこと(容量制限編)

に公開

現在、ChatGPTのPlusプランとClaudeのProプランを併用して、Webアプリの開発を行っています。

Claude Code(Ops4.6)とCodex(GPT-5.5)を併用する中で、使い方によって消費効率が大きく変わったため、その内容を備忘録として記載します。

起きていた問題

Claude Code(特にOps)を使っていると、2〜3回のやり取りで上限に達することがありました。
代替としてCodexを利用していましたが、そちらも使い続けるうちに3〜4回程度で上限に達するケースがありました。

原因としては、以下が考えられます。

  • 1つのメッセージで設計と実装をまとめて依頼していた
  • 指示が曖昧で、AI側の試行回数が増えていた
  • コンテキストが肥大化していた

加えて、内部的には次の影響も大きかったと感じています。

  • 「設計 → 実装 → 修正」を1スレッドで回すと、毎回フルコンテキストが再評価される
  • 曖昧な依頼は分岐パターン(試行)を増やす
  • ファイル数や差分が多いほど、1回あたりの処理コストが増える

結果として、1回あたりの消費が非常に重くなっていました。

試した改善

役割を分離しました。

  • Codex:設計・分割・方針決定(思考コストが高い部分)
  • Claude Code:実装(手を動かす部分)

具体的な流れは以下の通りです。

  1. Codexに対して「設計・分割・方針」を依頼する
  2. 出力された設計をそのままClaude Codeに渡す
  3. Claude Codeでは実装に集中させる

ここで重要だったのは、「設計を完成させてから実装に渡す」ことです。
途中で設計フェーズに戻らないようにすることで、コンテキストの往復を抑えることができます。
コンテキストを抑えることにより、入力トークン(Prompt Caching)の節約につながります。

変化

この分離によって、やり取り回数が明確に増えました。

  • Before:2〜3往復で上限に到達
  • After:10回近くやり取りが可能

体感としては「1回あたりの消費が軽くなった」というより、
「無駄な試行が減った」ことによる改善が大きいと感じています。

なぜ効いたか

  • 設計と実装は、必要とされる思考の種類が異なる
  • 同時に行うと、両方のコストが毎回発生する
  • 分離することで、それぞれが最適化された状態で処理される

特にOpsは「広く考える」用途に強い反面、その分コストが重くなりやすいです。
常時使用するのではなく、設計フェーズに限定することで安定しやすくなります。

実運用で意識していること

  • 1メッセージ1目的(設計または実装)
  • 曖昧な指示を減らす(入力の解像度=消費効率)
  • 差分ベースで依頼する(全文を貼らない)
  • スレッドを分ける(フェーズごとにリセットする)

悪い例(重い)

API作って、DB設計して、フロントも繋いで、ついでにリファクタも

良い例(軽い)

API設計だけ作成してください(エンドポイント・I/O定義)

→ 次スレッド

この設計をもとにNodeで実装してください

まとめ

  • Opsは強力だが、使い方によってはすぐに上限に達する
  • 設計と実装を分離することで効率が大きく改善する
  • 「Codexで設計 → Claude Codeで実装」という流れは実用的

上限に詰まり始めたタイミングでこの分け方に切り替えると、体感が大きく変わります。

また、GitHubのIssueでタスクを整理したり、
Claude Code向けの CLAUDE.md や、Codex向けの AGENTS.md を整備するなど、
AIエージェントに渡す前提情報や指示を明確にすることも重要だと感じています。

関連記事

GitHubで編集を提案

Discussion