Open9

Browser Use 使ってみる

しょーへーしょーへー
ERROR: Package 'browser-use' requires a different Python: 3.10.14 not in '>=3.11'

python3.11以降が必要。 pythonの環境構築いつも詰まる。今回はDockerも使えないっぽい。

しょーへーしょーへー
./myenv/bin/python examples/try.py "Your query here" --provider openai

"Your query here" の所にプロンプトを書いて実行する。
メルカリのURLを指定して、商品を購入できないか試してみる

しょーへーしょーへー
./myenv/bin/python examples/try.py "https://jp.mercari.com/item/m75091555543 商品のURLを開いて商品を購入して" --provider openai

試してみる
https://youtu.be/SOQy_gHxAIc

結果

  • URLは正常に開ける
  • 購入ボタンも正常に押せる
  • ログインしようとする
  • ログイン情報を与えていないから、ログインできずに詰まる
  • 何度もIDとパスワードを入力し続けて失敗し続ける

改善策
プロンプトにIDとパスワードを入れてみる

しょーへーしょーへー

open-aiAPIのlimitに引っかかってSTEPが多くなると実行できなくなる。
https://platform.openai.com/docs/guides/rate-limits?context=tier-one#usage-tiers
Usage tier 1で、TPM (Tokens Per Minute): 1分あたりに処理できるトークン数の上限が0,000 と設定されている。
gpt-4o-mini をモデルで使えれば制限かからなそう。
https://github.com/gregpr07/browser-use/blob/95d61b3325e19faef028a82437930ac9d59de976/examples/try.py#L31C3-L31C53
return ChatOpenAI(model='gpt-4o', temperature=0.3)

return ChatOpenAI(model='gpt-4o-mini', temperature=0.3)
に変更。

しょーへーしょーへー

感想

  • AIエージェントの技術面白い
  • 勉強してみたいし、自分でも作ってみたい
  • これは業務に結構活かせそう
  • 今までセレニウムで書いてた所をこのツールでAIでよしなにやってくれるようになったら楽になる
  • UIが多少変わっても、AIがよしなに対応してくれるようになる