Open9
Browser Use 使ってみる
オープンソースのブラウザー操作エージェントっぽい
→Claude computer useのブラウザ版かな?
ローカルで触ってみる
これもあったけど、スターが多い上の方を使ってみる
ERROR: Package 'browser-use' requires a different Python: 3.10.14 not in '>=3.11'
python3.11以降が必要。 pythonの環境構築いつも詰まる。今回はDockerも使えないっぽい。
python3 -m venv myenv
source myenv/bin/activate
仮想環境を作って何とか解決
./myenv/bin/python examples/try.py "Your query here" --provider openai
"Your query here" の所にプロンプトを書いて実行する。
メルカリのURLを指定して、商品を購入できないか試してみる
./myenv/bin/python examples/try.py "https://jp.mercari.com/item/m75091555543 商品のURLを開いて商品を購入して" --provider openai
試してみる
結果
- URLは正常に開ける
- 購入ボタンも正常に押せる
- ログインしようとする
- ログイン情報を与えていないから、ログインできずに詰まる
- 何度もIDとパスワードを入力し続けて失敗し続ける
改善策
プロンプトにIDとパスワードを入れてみる
open-aiAPIのlimitに引っかかってSTEPが多くなると実行できなくなる。
gpt-4o-mini
をモデルで使えれば制限かからなそう。
return ChatOpenAI(model='gpt-4o', temperature=0.3)
↓
return ChatOpenAI(model='gpt-4o-mini', temperature=0.3)
に変更。
メアドとパスワードは突破できたけど、
SMS認証で詰まる
この技術使えば突破できるんかな?
感想
- AIエージェントの技術面白い
- 勉強してみたいし、自分でも作ってみたい
- これは業務に結構活かせそう
- 今までセレニウムで書いてた所をこのツールでAIでよしなにやってくれるようになったら楽になる
- UIが多少変わっても、AIがよしなに対応してくれるようになる
ブラウザ自動化ツール他にも沢山あるんかな?