OpenHands(OpenDevin)を使った感想「本家Devinは安い」
業務でDevinを利用してすごく気に入ったので、個人用途でも使いたくなりました。
ただ個人支出で$500/月は正直無理なので、OSSのOpenHands(旧OpenDevin)に目をつけました。
しかしながらSonnet 3.7(3.5)で使った結果、逆に「実は本家Devinって安いんじゃないか?」となったのでやったことと所感を書いておきます。
OpenHandsについて
OpenHandsは、エンジニアリングタスクを支援するオープンソースのAIエージェントです。Devinのオープンソース実装として知られており(以前はOpenDevinという名称でした)、様々な開発作業をサポートしてくれます。
特に新規プロジェクトの立ち上げや、既存コードベースへの機能追加、リファクタリングなどできるとしており、例えば、新しいReactコンポーネントの作成や、GitHubアクションの追加、バグ修正など、幅広いタスクをこなすことができるようです。
ただし、すでに様々なエンジニアが指摘していることですが、現状のAIエージェント技術(OpenHandsに限らず)では複雑な開発タスクを完全に自動化することはできません。依然として人間の適切なガイドは必要であり、「タスクを小さな単位に分割する」「具体的な指示を心がける」といったことは意識しないといけません。
Devinは高い・・・のでOpenHands!
Devinは$500(¥75000)/月からという値付けなので、個人用途としてはお財布的に厳しいです。
そこでOpenHandsを使うことでお安くAIエージェントを利用できるかを試してみることにしました。
OpenHandsは基本的にはローカル端末上での起動を前提としているようです。しかし、自分としては「外出中もスマホからAIコーディングしたい」というニーズがあったので、以下のような構成でGoogle Cloud上にデプロイすることにしました。
Google Cloud構成図
結果、狙い通りPCからもスマホからもインターネット経由で使えるようになりました。
クラウドにデプロイしたOpenHandsを使える
外出中でもスマホからAIコーディングできるようになった
約1時間で$30(¥4500)溶ける 😂
まずはAnthropicのAPIキーで始めましたが、頻繁にレート制限に引っかかる問題が発生しました。そこで$40を課金してTier2にアップグレードしました(Tierとレート制限についてはAnthropicのドキュメント参照)。
それでも引き続きレート制限に引っかかってしまうのでOpenRouterのAPIキーに移行しました。
ただ、Claude Sonnet3.7(3.5)がなかなかお高いです😇 Clineなどの文脈で、Claude APIをぶん回すとかなりのコストがかかることは知られていると思います。
OpenHandsの場合も、個人開発用途で対話しながらコーディング作業させてみたところ、1時間ほどで約$30が溶けました。https://openrouter.ai/activity のキャプチャが以下です。
すぐに$30消費されました
1リクエストあたり$0.4(¥60)😇
そしてLLMの利用料に加えてGoogle CloudのCompute EngineやCloud Load Balancingの固定費ものしかかることになります。
Devinは1時間あたり$8(¥1200)
一方、Devinのコストについて。どうしても月額$500というところに目がいってしまいますが、1時間あたりで考えてみます。
こちらによると1ACUあたり約15分の作業に相当とのことなので、これをそのまま受け取るなら1時間あたり4ACUということになります。そして1ACUは$2なので、1時間あたり$8(¥1200)ということになります。もしかしてDevinは安い・・・?
月$10〜$20で実質AI使い放題なGitHub CopilotやCursorと比べるとだいぶ高く感じますが、コーディングエディタのお供ではない、自律的なAIエージェントとしては実はかなりがんばっている価格設定なのではないかと思います。
ACUには実行環境のインスタンス費用も含まれていますし、そのほか機能面の優位性として
- 並列実行可能
- また、指示ごとに開発環境(インスタンス)が完全に独立
- Slack連携
- GitHub IssueやPR上でのコメント
- 作業精度が高い
- 主観になってしまいますが、Devinの方がより指示の意図通りにコーディングしてくれると感じました
- Devinは複数のAIモデルを組み合わせて、それぞれの得意な役割をやらせてそう(OpenHandsは単一モデルを指定) https://x.com/ScottWu46/status/1895209597084017073
- 主観になってしまいますが、Devinの方がより指示の意図通りにコーディングしてくれると感じました
- AIエージェント作業中に割り込み指示ができる
- OpenHandsは現状未対応(明示的に作業を中止させないと発言できない)
といったところもあると考えると、実は相当安いといえるのかなと。
OpenHandsの強み
もちろんOpenHandsの強みはあります。
まず、DeepSeekやGemini 2.0 Flashなどの低コストなモデルを選択できるため、その場合はDevinよりも安価に利用できる可能性が高いです(ただ、やっぱりSonnetにコーディングさせたいですが・・・)。
また、OSSなので、(技術とやる気があれば)必要に応じてソースコードをカスタマイズし、自分の開発環境や要件に合わせた調整はできるでしょう。まだまだ発展途上と思われるので、コミュニティによるさらなる改善も期待できると思います。
まとめ
Devinは一見高額に思えますが、実際の利用時間あたりのコストや提供される機能を考慮すると実際はコストパフォーマンスは全然悪くないと思いました。一方でOpenHandsは、料金が高めのモデルを避けて利用することでコストを抑える場合や、カスタマイズ性やセルフホストを重視する場合の選択肢になり得るかなと。
とはいえ個人用途で月額$500〜は相当厳しいという事実は変わらないので、OpenHandsの取り組みは応援したいです。チャンスがあったらコードリーディング、コントリビュートなどしてみたいなと思っています。
以上、Devinは実は安いと思う話でした。
Discussion