Claude Opus 4.5 vs Kimi K2.5 〜コーディング性能とコスト効率比較〜
はじめに
この記事で述べること
- Kimi K2.5について
- Claude Opus 4.5に匹敵するコーディング性能というのは本当?
- ClaudeとKimi Code Planのサブスクはどちらを選ぶべき?
- コーディング性能、レートリミット、費用の観点で
- 結局あなたはどうするの?
Kimi K2.5について
Kimi K2.5は、2026年1月27日にMoonshot AIによってリリースされた。
コーディング性能においてはClaude Opus 4.5に匹敵する性能と謳われ、それでいてオープンウェイトであるという非常に興味深いモデルである。
コーディング性能がClaude Opus 4.5に匹敵するというのは本当?
コーディングエージェントとLLMを組み合わせたtypescriptのコーディングベンチマークの一つとして、laisoさんが開発されたts-benchがある。
私はこのベンチマークはコーディング性能を測るツールとして非常に強力だと認識しており、今回もこのベンチマークで評価を行った。
まずはkimi-cli + Kimi-K2.5の組み合わせでベンチマークを実施した結果がこちら
今まで評価した組み合わせでは一度も満点を取れなかったのだが、初めて満点を実現した!
ただし、これだけではGLM-4.7よりも性能が良いということはわかっても、Claude Opus 4.5に匹敵するかはわからない。
そこで良い機会だと思って、Claude Code + Claude Opus 4.5/ Sonnet 4.5の組み合わせとも比較することにした。
エージェントはどれを選ぶべきか?
そうこうしているうちに、opencodeでKimi-K2.5が無料で使えるというアナウンスがされた。
というわけで、opencode - opencode/kimi-k2.5-freeとついでにClaude Code + Kimi-K2.5の組み合わせでもts-benchを評価した。
ts-benchの結果はこちら。

今回わかったことをまとめると以下の通り。
-
Kimi-K2.5はどのエージェントと組み合わせても安定して満点を取っている。Claude Code + Claude Opus 4.5も満点であり、Kimi-K2.5がClaude Opus 4.5に匹敵するという看板に偽りはなさそう。
-
Claude Codeは正解にたどり着くための時間が最も短い
-
GLM-4.7はClaude Sonnet 4.5に匹敵している。ただし、正解にたどり着くまでの時間がClaude Sonnet 4.5よりも遅い。
というわけで、結論としては現時点で情報も多いClaude Codeを採用することにする。
ClaudeとKimi Code Planのどちらを選ぶべきか?
ts-benchの結果から、Kimi-K2.5がClaude Opus 4.5の代替になりうるポテンシャルを秘めていることがわかった。
こうなってくると、次に気になるのはレートリミットを含めた費用対効果だろう。それではレートリミットの比較はどう評価すべきか?
その方法として、「ts-benchを一通り回したときにレートリミットの何%を消費するか?」を指標として評価することにした。私が契約しているプランでの比較結果は以下の通り。
| プラン | Usage | 費用 |
|---|---|---|
| Claude Pro | 60% | $20 / 月(年間なら $17 / 月) |
| Kimi Code Plan (Moderato) | 11%(実際は 33%) | $19 / 月(年間なら $15 / 月) |
つまり、同じタスクをこなすのにClaude ProプランはKimi Code Plan(Moderato)プランに比べて倍近いのクォータを消費することになる。これは、Claude Proプランが半分の使用量でレートリミットになることを意味する。
Kimi Code PlanのAllegrettoやVivaceプランがそれぞれModeratoプランの3.5x quota、17.5x quota、Claude Maxプランのクォータ倍率とコストを考慮し、コスト効率(クォータ量/コストの大きさ)を可視化したグラフと表を以下に示す。
通常の月額プラン


結果としては面白いことにKimi CodeのAllegrettoプランが最もコスト効率が高いことがわかった。
参考までに、以下に年間プランのコスト効率についても記載しておく。
年間プラン


こちらもKimi Allegrettoが最もコスト効率が良いプランとなっていることがわかる。また、年間プランの場合はKimi Code Plansの方がコスト効率が良い結果になった。
それであなたはどうするの?
それで私はどうするのか?結論は以下の通り。
-
Claude Proプランが満期になる2/28まではClaude Opus 4.5をメインに据える。
-
レートリミットが来たら、opencode + Kimi-K2.5(無料版)を使い、それも使えなくなったらGLM Coding PlanでGLM-4.7を使う。
-
Claude Proプランが満期になった時点でopencode + Kimi-K2.5(無料版)が使えなくなっていたら、Kimi Code PlanのModeratoプランを1ヶ月単位で契約し、メインClaude Code + Kimi-K2.5、サブClaude Code + GLM-4.7で運用する予定。
選定理由はClaude Proでは頻繁にレートリミットにかかってしまっていることから使用できるクォータを低コストで引き上げたいこと。年間プランはやはり怖いので、多少効率が悪くても月額プランとした。
まとめ
本記事では、下記を備忘録的にまとめた。
- Kimi K2.5のコーディング性能を評価するベンチマークを実施し、Claude Opus 4.5に匹敵するモデルであることを確認した
- Kimi Code PlanとClaudeのサブスクのコスト効率を計算し、可視化した。
- Claude Proプランのレートリミットが厳しいと感じていることと、Kimi Code Planのコスト効率の良さからModeratoプランを通常の月額料金で契約する方針に決めたこと。
この記事が、みなさんのサブスクポートフォリオを見直す判断材料になれば幸いである。
Discussion
気になってたので情報助かります。
opencode経由なら期間限定で無料なんですね。
私も試してみます。