🦢

Claude Opus 4.5 vs Kimi K2.5 〜コーディング性能とコスト効率比較〜

に公開1

はじめに

この記事で述べること

  • Kimi K2.5について
  • Claude Opus 4.5に匹敵するコーディング性能というのは本当?
  • ClaudeとKimi Code Planのサブスクはどちらを選ぶべき?
    • コーディング性能、レートリミット、費用の観点で
  • 結局あなたはどうするの?

Kimi K2.5について

Kimi K2.5は、2026年1月27日にMoonshot AIによってリリースされた。

コーディング性能においてはClaude Opus 4.5に匹敵する性能と謳われ、それでいてオープンウェイトであるという非常に興味深いモデルである。

https://www.kimi.com/ai-models/kimi-k2-5

https://huggingface.co/moonshotai/Kimi-K2.5

コーディング性能がClaude Opus 4.5に匹敵するというのは本当?

コーディングエージェントとLLMを組み合わせたtypescriptのコーディングベンチマークの一つとして、laisoさんが開発されたts-benchがある。

https://github.com/laiso/ts-bench

私はこのベンチマークはコーディング性能を測るツールとして非常に強力だと認識しており、今回もこのベンチマークで評価を行った。

まずはkimi-cli + Kimi-K2.5の組み合わせでベンチマークを実施した結果がこちら

https://x.com/gosrum/status/2016445835656196537

今まで評価した組み合わせでは一度も満点を取れなかったのだが、初めて満点を実現した!
ただし、これだけではGLM-4.7よりも性能が良いということはわかっても、Claude Opus 4.5に匹敵するかはわからない。

そこで良い機会だと思って、Claude Code + Claude Opus 4.5/ Sonnet 4.5の組み合わせとも比較することにした。

エージェントはどれを選ぶべきか?

そうこうしているうちに、opencodeでKimi-K2.5が無料で使えるというアナウンスがされた。

https://x.com/gosrum/status/2017008056413147565

というわけで、opencode - opencode/kimi-k2.5-freeとついでにClaude Code + Kimi-K2.5の組み合わせでもts-benchを評価した。

ts-benchの結果はこちら。

今回わかったことをまとめると以下の通り。

  • Kimi-K2.5はどのエージェントと組み合わせても安定して満点を取っている。Claude Code + Claude Opus 4.5も満点であり、Kimi-K2.5がClaude Opus 4.5に匹敵するという看板に偽りはなさそう

  • Claude Codeは正解にたどり着くための時間が最も短い

  • GLM-4.7はClaude Sonnet 4.5に匹敵している。ただし、正解にたどり着くまでの時間がClaude Sonnet 4.5よりも遅い。

というわけで、結論としては現時点で情報も多いClaude Codeを採用することにする。

ClaudeとKimi Code Planのどちらを選ぶべきか?

ts-benchの結果から、Kimi-K2.5がClaude Opus 4.5の代替になりうるポテンシャルを秘めていることがわかった。

こうなってくると、次に気になるのはレートリミットを含めた費用対効果だろう。それではレートリミットの比較はどう評価すべきか?

その方法として、「ts-benchを一通り回したときにレートリミットの何%を消費するか?」を指標として評価することにした。私が契約しているプランでの比較結果は以下の通り。

プラン Usage 費用
Claude Pro 60% $20 / 月(年間なら $17 / 月)
Kimi Code Plan (Moderato) 11%(実際は 33%) $19 / 月(年間なら $15 / 月)

つまり、同じタスクをこなすのにClaude ProプランはKimi Code Plan(Moderato)プランに比べて倍近いのクォータを消費することになる。これは、Claude Proプランが半分の使用量でレートリミットになることを意味する。

Kimi Code PlanのAllegrettoやVivaceプランがそれぞれModeratoプランの3.5x quota、17.5x quota、Claude Maxプランのクォータ倍率とコストを考慮し、コスト効率(クォータ量/コストの大きさ)を可視化したグラフと表を以下に示す。

通常の月額プラン

結果としては面白いことにKimi CodeのAllegrettoプランが最もコスト効率が高いことがわかった。


参考までに、以下に年間プランのコスト効率についても記載しておく。

年間プラン

こちらもKimi Allegrettoが最もコスト効率が良いプランとなっていることがわかる。また、年間プランの場合はKimi Code Plansの方がコスト効率が良い結果になった。

それであなたはどうするの?

それで私はどうするのか?結論は以下の通り。

  • Claude Proプランが満期になる2/28まではClaude Opus 4.5をメインに据える。

  • レートリミットが来たら、opencode + Kimi-K2.5(無料版)を使い、それも使えなくなったらGLM Coding PlanでGLM-4.7を使う。

  • Claude Proプランが満期になった時点でopencode + Kimi-K2.5(無料版)が使えなくなっていたら、Kimi Code PlanのModeratoプランを1ヶ月単位で契約し、メインClaude Code + Kimi-K2.5、サブClaude Code + GLM-4.7で運用する予定。

選定理由はClaude Proでは頻繁にレートリミットにかかってしまっていることから使用できるクォータを低コストで引き上げたいこと。年間プランはやはり怖いので、多少効率が悪くても月額プランとした。

まとめ

本記事では、下記を備忘録的にまとめた。

  • Kimi K2.5のコーディング性能を評価するベンチマークを実施し、Claude Opus 4.5に匹敵するモデルであることを確認した
  • Kimi Code PlanとClaudeのサブスクのコスト効率を計算し、可視化した。
  • Claude Proプランのレートリミットが厳しいと感じていることと、Kimi Code Planのコスト効率の良さからModeratoプランを通常の月額料金で契約する方針に決めたこと。

この記事が、みなさんのサブスクポートフォリオを見直す判断材料になれば幸いである。

Discussion

owayoowayo

気になってたので情報助かります。
opencode経由なら期間限定で無料なんですね。
私も試してみます。