🚀

Computer-Use Agent (c/ua) と軽量VMツール Lume の紹介&試用レビュー

に公開

こんにちは、酒井です!
株式会社 EGGHEAD(エッグヘッド)という「製造業で生成 AI を活用したシステム開発」をしている会社の代表をしております。

https://egghead.co.jp?utm_source=zenn&utm_medium=social&utm_campaign=normal

この記事では、c/ua (Computer-Use Agent)と関連する軽量VMツール Lume について紹介します。実際に環境構築を行い、Jupyter Notebook で試用してみた体験をレポートします。

はじめに

c/ua (Computer-Use Agent) とは?

c/ua(Computer-Use Agent)は、単一の統合フレームワークで2つの主要な機能を提供します。

  1. 高性能仮想化 - Apple Silicon上でAppleのVirtualization.Frameworkを使用したLume CLIにより、macOS/Linux仮想マシンをネイティブに近いパフォーマンス(ネイティブ速度の最大97%)で作成・実行できます。

  2. コンピュータ操作インターフェースとエージェント - AIシステムがこれらの仮想環境を観察・制御できるフレームワークです。アプリケーションの操作、ウェブブラウジング、コード作成、複雑なワークフローの実行など、様々な操作が可能になります。

なぜCUAを試してみたのか?

これから先、AIエージェントがPCを操作するようになっていくと予想されます。しかし、自分のPCで直接操作させると、意図せず大事なファイルを消したり、大切な情報を漏洩してしまうリスクがあります。そのため、AIにコンピューター操作をさせるには、安全な仮想環境が重要になってくることが予想されます。

このような次世代の可能性を秘めたCUAというOSSを実際に触ってみることで、現状の課題や将来性を探りたいと思いこちらのOSSを動かしてみました。

Lume とは? - Apple Silicon 向け軽量VMツール

c/uaを試す前に、関連技術である「Lume」について紹介します。

概要

Lumeは Apple Silicon (M1‑M4) 上で macOSとLinux仮想マシンを1コマンドで作成・管理できる軽量CLI/ローカルAPIサーバー です。

Apple公式 Virtualization.framework を直接利用し、ベンチマークでネイティブ比最大97%の性能を実現します。GUIはなく、単一バイナリで完結する点が特徴です。

主な特徴

機能 内容
ワンコマンド起動 lume run macos-sequoia-vanilla:latest などで即起動
事前ビルドイメージ macOS Sequoia/Ubuntu ARMほかを ghcr.io/trycua から配布
API/Python SDK lume serve でHTTP API、pip install pylume でプログラム制御が可能
共有フォルダ & 可変ディスク ホスト↔ゲスト間でファイル同期、容量は自動拡張
オープンソース MITライセンスで公開。Homebrewでも配布

インストールと基本操作

sudo /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"

# 使い方例
lume pull macos-sequoia-vanilla:latest   # イメージ取得
lume run  macos-sequoia-vanilla:latest   # VM起動
lume list                                # 稼働中VM確認
lume stop <vm-id> && lume delete <vm-id> # 停止・削除

Lumeは「CLI特化・高速・オープンソース」にフォーカスし、CIや自動化に組み込みやすいのが強みです。

CUA 環境構築

Dockerイメージのダウンロード

  1. lumeのインストール
$ sudo /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"
  1. macOS CUAイメージのプル
$ lume pull macos-sequoia-cua:latest

これはかなり時間がかかります。私の場合、インターネット回線の速度が遅かったのもあり、ダウンロードに一晩かかりました。

  1. イメージの起動
$ lume run macos-sequoia-vanilla:latest
[2025-04-18T13:00:31Z] INFO: Running VM mount=none shared_directories= name=macos-sequoia-vanilla_latest no_display=false recovery_mode=false vnc_port=0
[2025-04-18T13:00:31Z] INFO: Running VM with configuration cpuCount=4 memorySize=4294967296 sharedDirectories= vncPort=0 recoveryMode=false diskSize=42949672960
[2025-04-18T13:00:31Z] INFO: Pre-VZMacHardwareModel: hardwareModel=132 bytes
[2025-04-18T13:00:31Z] INFO: VNC server started external=vnc://:safe-spring-spring-ocean@172.22.1.49:51395 local=vnc://:safe-spring-spring-ocean@127.0.0.1:51395
[2025-04-18T13:00:31Z] INFO: Starting VNC session
[2025-04-18T13:00:31Z] INFO: VNC info vncInfo=vnc://:safe-spring-spring-ocean@127.0.0.1:51395

起動すると、以下のような画面が表示されます。

CUA Jupyter Notebook での試用体験

試用したノートブック

GitHub - trycua/cua リポジトリにある build-your-own-operator-on-macos-1.ipynb を使用しました。以下のブログの内容になります。

https://www.trycua.com/blog/build-your-own-operator-on-macos-1

実行手順

CUAリポジトリのREADMEのOption2 を実行します。具体的な手順は以下の通りです。

  1. Lume CLIのインストール
$ sudo /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/lume/scripts/install.sh)"
  1. 最新のmacOS CUAイメージをプル
$ lume pull macos-sequoia-cua:latest
  1. Lumeデーモンサービスを起動
$ lume serve
  1. リポジトリをクローンしてVSCode(Cursor)を起動
$ git clone git@github.com:trycua/cua.git
cd cua
cursor .
  1. 実行
    ここまできたらnotebooks/blog/build-your-own-operator-on-macos-1.ipynbファイルを開いてセルを順番に実行していきます。

試用してみた感想

実際に試用してみた感想は以下の通りです。

  • 動作速度: 全体的に動作が遅く、レスポンスを待つ時間が長いです。
  • AIの賢さ: 現状では「賢くない」印象を受けました。複雑なタスクや柔軟な対応は難しかったです。
  • 実行環境: M4 32GのメモリのMacでは環境自体はサクサク動作します。ハードウェア性能は十分ですが、AIの処理に時間がかかりました。

以下は実際に試用している様子を8倍速で録画した動画です。

https://youtu.be/z3-cpJYIZcs

まとめ

今回、c/ua (Computer-Use Agent) と関連する軽量VMツール Lume について紹介し、実際に試用してみました。

要点まとめ

  • Lume: Apple Silicon向けの高速VM管理ツールで、CIや自動化に適しています。
  • CUA環境構築: Dockerイメージのダウンロードに時間がかかる場合があります。
  • CUA試用感: 現状では動作が遅く、AIのモデルの賢さが足りていない印象です。ただ、o3レベルのモデルがcomputer-useでも使えるようになると実用レベルになるのではと思いました。

所感と今後の展望

現状のCUAは「もう何回かブレイクスルーがないと実用化は難しい」という印象です。コンセプトとしては非常に魅力的ですが、実用レベルに達するにはまだ時間がかかりそうです。

しかし、先日のo3のリリースなどAIの急速な進化を考えると、近い将来、CUAのような技術が開発現場を大きく変えるポテンシャルを秘めています。特にLumeのような高速VM技術と組み合わせることで、安全かつ効率的なAIエージェントの実行環境が整備されていくので引き続き追っていきたいと思います。

GitHubで編集を提案
EGGHEAD テックブログ

Discussion