🥕

PlaywrightのMCP対応で広がるビジネス自動化

1. はじめに

日本時間2025年3月25日、Microsoftが自社開発のブラウザ自動化ツールPlaywrightがModel Context Protocol (MCP)に対応したと発表しました。この発表は一見すると技術的なアップデートの一つに過ぎないように思えますが、実は生成AIとブラウザ自動化の融合という観点から見ると、ビジネス現場に大きな変革をもたらす可能性を秘めています。
https://x.com/playwrightweb/status/1904265499422409047
これまで生成AIは主に情報提供や内容生成が中心でしたが、MCPに対応することで、AIがブラウザやデスクトップアプリケーションを直接操作できるようになります。つまり、AIが「考える」だけでなく「行動する」能力を手に入れたといえるでしょう。本記事では、PlaywrightのMCP対応の概要と技術的背景、そしてこれによって可能になる新たなビジネスユースケースについて解説します。
また、後半で試しにClaude for desktopで使ってみています。私は、Windows 11を使っており、特にWindowsの方、参考になると思います。(とはいってもPlaywright MCPはあまりOS間の違いがなさそうですが)

2. MicrosoftがPlaywrightがMCPに対応した概要

PlaywrightがModel Context Protocol (MCP)に対応したとのことですが、具体的にはどういうことでしょうか。これは、Playwright MCPと呼ばれるMCPサーバーの実装を公開し、LLM(大規模言語モデル)がPlaywrightのブラウザ自動化機能を使ってウェブページと相互作用できるようになったことを意味します。
https://github.com/microsoft/playwright-mcp

Playwrightとは

Playwrightは、Microsoftが開発したオープンソースのブラウザ自動化フレームワークです。Webアプリケーションのテスト自動化やスクレイピング、RPAなどの用途で使用されています。

Playwrightの主な特徴

  • クロスブラウザサポート:Chromium(Chrome/Edge)、Firefox、WebKit(Safari)の主要ブラウザエンジンを単一のAPIでサポート
  • 複数言語対応:JavaScript/TypeScript、Python、.NET、Javaなど複数のプログラミング言語に対応
  • 高い信頼性:自動待機メカニズムによる安定したテスト実行
  • 堅牢な要素選択:CSS、XPath、テキスト内容、ラベルなど多様な方法で要素を特定可能
  • リアルなユーザー操作:実際のブラウザの入力パイプラインを使用し、人間の操作と区別できないイベントを生成

従来、Playwrightは主に開発者やテスターによって直接利用されてきましたが、MCP対応により、AIモデルが自動化プロセスを駆動できるようになりました。これは「プログラムされた自動化」から「インテリジェントな自動化」への転換点といえます。

MCPとは

Model Context Protocol (MCP)は、Anthropic社によって開発され、2024年初頭にオープンソース化されたプロトコルです。このプロトコルは、AIモデルと外部システム(データソースやツール)を統一的に繋ぐための標準インターフェースとして機能します。Anthropic社は「MCPはAIアプリケーションのUSB-Cポートのようなもの」と表現しており、様々な機能をモジュール的にLLMに"挿して使える"汎用コネクタとして設計されています。
MCPの目的は、AIと外部システムの統合コストを削減し、AIが必要なコンテキスト(データや機能)に簡潔かつ安全にアクセスできるようにすることです。従来はAIごと・システムごとにカスタム統合が必要でしたが、MCPによって「追加・交換が効く共通インターフェース」が提供されるため、開発負担や複雑さが大幅に軽減されます。

MCPについては、ぜひ下記記事もご参考になってください。
https://zenn.dev/acntechjp/articles/78b0dbc48d39d0

Playwright MCPの技術的特徴

Microsoft実装のPlaywright MCPは、アクセシビリティツリーを使用して効率的で決定論的な自動化を実現しています。従来のスクリーンショットベースのアプローチとは異なり、ブラウザの構造化されたアクセシビリティデータを活用することで、以下のような利点があります:

  1. 高速・軽量:Playwrightのアクセシビリティツリーを使用し、ピクセルベースの入力ではなく構造化データを扱うため、処理が迅速
  2. LLMに優しい設計:視覚モデルを必要とせず、構造化データだけで動作可能
  3. 決定論的ツール適用:スクリーンショットベースのアプローチが持つ曖昧さを回避し、信頼性の高い操作を実現

3. PlaywrightがMCPに対応することでなにができるようになるか

PlaywrightとMCPの統合により、生成AIがブラウザを直接操作できるようになりました。具体的には、以下のような新機能が可能になります:

AIによるブラウザ操作の自動化

生成AIがMCP経由でPlaywrightの機能にアクセスすることで、以下のような操作が可能になります:

  • ウェブナビゲーション:URLへの移動、リンクのクリック、フォーム操作
  • データ抽出:ウェブページからの情報収集と構造化
  • フォーム入力:名前、住所、日付などの情報を適切なフィールドに入力
  • ボタン操作:送信、保存、削除などのアクションの実行
  • 認証プロセス:ログイン手順の自動化

これらの操作は全て、AIがアクセシビリティツリーを介してページの構造を理解し、適切なアクションを選択することで実現されます。
一方で、認証周りに課題があったり、使えるブラウザもChromeのみだったりします。

アクセシビリティツリーの優位性

Playwright MCPの重要な技術的優位性は、従来の画像認識ベースのアプローチではなく、ブラウザのアクセシビリティツリーを活用していることです。

  • 構造的理解:AIはページの視覚的な外観ではなく、論理構造を把握
  • 高い安定性:UIの見た目が変わっても、機能的な構造が維持されていれば安定して動作
  • 軽量処理:画像解析のための重い計算リソースが不要
  • セマンティックな理解:各要素の役割(ボタン、入力フィールド、リンクなど)を正確に識別

LLMとブラウザ自動化の融合

生成AIの言語理解能力とPlaywrightの自動化機能が融合することで、以下のようなシナリオが実現可能になります:

  • 自然言語による操作指示:「このフォームに名前と住所を入力して送信して」といった人間のような指示でタスクを実行
  • コンテキスト認識操作:現在の状況を考慮した適応的な操作判断
  • 複雑なワークフローの自動化:複数のステップや条件分岐を含む業務プロセスの自動実行
  • 例外処理:予期せぬ状況(エラーメッセージ、確認ダイアログなど)への対応

このように、AIがブラウザを「目」と「手」として使用できるようになったことで、デジタル業務の自動化領域は大きく拡張されました。

4. ビジネスインパクトと想定されるユースケース

PlaywrightのMCP対応によって生まれる新たな可能性は、様々なビジネス領域に影響を与えます。ここでは、経理・人事・ITエンジニアリングの3つの分野における具体的なユースケースを探ります。

経理業務での活用

経理部門では、データ入力や処理に関する多くの定型業務が存在します。MCP対応PlaywrightとAIの組み合わせにより、以下のような業務を自動化できます:

  • 請求書処理:AIが請求書データを読み取り、会計システムに自動入力。異常値を検出した場合は人間に確認を求める
  • データ抽出と監視:市場調査や競合分析のためのウェブデータ自動収集
  • 財務レポート作成:異なるシステムからデータを集約し、構造化されたレポートを生成
  • 取引先マスタ管理:新規取引先情報の登録や既存データの更新を自動化
  • 支払い処理:支払期日の監視、支払い処理の実行、記録の維持

会計ソフト大手のXero社は既に独自のMCPサーバーを公開し、AIが請求書作成や取引処理を自動化できることを実証そうです。経理領域では、AIエージェントが入力業務のRPA機能と経営分析の補助の両面で活躍できる可能性があります。

人事・採用プロセスでの活用

人事部門でも多くの反復的な業務があり、AI+Playwright MCPによる自動化の恩恵が期待できます:

  • 採用プロセス自動化:求人サイトへの掲載、応募者スクリーニング、面接スケジューリング
  • 従業員オンボーディング:新入社員データの登録、各種システムへのアカウント作成、必要書類の配布
  • 勤怠管理:勤怠データの収集、異常パターンの検出、レポート生成
  • 社内コミュニケーション:定型的な通知の自動送信、フィードバック収集、FAQ対応
  • 人事データ分析:人材データの収集と分析、トレンド把握、予測モデル構築

これらの自動化により、人事担当者は戦略的な人材獲得や従業員エンゲージメント向上などの高付加価値業務に集中できる可能性があります。

ITエンジニアリングでの活用

開発・運用部門では、テストや監視など多くの業務がPlaywright MCP対応のAIによって効率化できます:

  • 自動テスト:AIがユーザーシナリオを理解し、ウェブアプリのE2Eテストを自動生成・実行
  • 品質保証:UIの変更によるバグや予期せぬ動作を検出
  • システム監視:定期的なヘルスチェック、パフォーマンスモニタリング、異常検知
  • 設定管理:クラウドコンソールやダッシュボードでの設定変更の自動化
  • アクセシビリティテスト:ウェブアプリのアクセシビリティをチェックし、規制遵守を確保

特に注目すべきは、アクセシビリティツリーの使用により、UI変更に強いテストやデータ抽出が可能になる点です。これにより、ウェブサイトのデザイン変更が頻繁に行われる環境でも、安定した自動化を維持できます。

5. 使ってみる

それでは、実際にClaude for desktopを使ってPlaywright MCPを使ってみましょう。

設定

Claude for desktopの「ファイル>設定」をクリックします。

「開発者」の「構成を編集」をクリックします。

「claude_desktop_config.json」をテキストエディタで開きます。

MCP Serverの設定を追加します。

claude_desktop_config.json
{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": [
        "@playwright/mcp@latest"
      ]
    }
  }
}

Claude for desktopを再起動します。この時アプリを閉じるだけではなく、プロセス自体を閉じる必要があります。下記画像を参考に「終了」をクリックして閉じましょう。

使う

使用時点のUSDJPYの為替レートを調べてもらいました!無事に動きました。

プロンプト
USDJPYの現在の値をPlaywrightでWeb検索して、教えてほしい。

(補足)ここまでの道のりでトラブルが

実際に使ってみたところエラーが起きました。
一部マスキングしていますが、具体的には下記エラーが発生しました。

エラーメッセージ
{
  `url`: `https://www.google.com/search?q=Azure+Microsoft+cloud+services`
}
Error: browserType.launch: Chromium distribution 'chrome' is not found at C:\Users\<user name>\AppData\Local\Google\Chrome\Application\chrome.exe
Run "npx playwright install chrome"

どうやら、Playwright MCPが想定しているChromeのインストール先と私のWindows 11端末でのインストール先が異なったようです。
これについて、Githubで開発者へ障害報告をしました。
https://github.com/microsoft/playwright-mcp/issues/13
すると、僅か約1日で改修してくださり、無事に使えるようになりました!
このスピード感、Playwright MCPへの力の入れようが感じられました!

6. おわりに

PlaywrightのMCP対応は、生成AIとブラウザ自動化の融合という新たな時代の幕開けを告げるものです。これまでの生成AIが主に「考える」能力を提供していたのに対し、MCPとPlaywrightの組み合わせにより、AIが「行動する」能力を獲得しました。

この変化がもたらす最大のビジネスインパクトは、プログラミングスキルを持たない一般のビジネスユーザーでも、自然言語での指示だけでブラウザベースの複雑な業務を自動化できるようになることです。これは従来のRPAツールを超える柔軟性と適応力を持ち、多様なビジネスシーンで活用できます。

また、MCPという標準プロトコルの採用は、AIエコシステムの相互運用性を高め、様々なツールやサービスとの統合を容易にします。Microsoft、Anthropic、OpenAIといった主要AIプレイヤーがMCPをサポートする動きを見せており、今後ますます多くの企業がこの標準を採用すると予想されます。

今後はセキュリティとガバナンスの強化が重要な課題となるでしょう。AIが自律的に操作を行う際には、誤操作や不正利用を防ぐ仕組みが不可欠です。MCPの仕様アップデートでは、権限管理や監査機能の強化が図られており、企業での安全な活用に向けた基盤整備が進んでいます。

PlaywrightのMCP対応は、単なる技術的進化を超え、ビジネスプロセス改革の新たな可能性を開くものです。企業はこの技術を活用することで、業務効率化とコスト削減を実現するとともに、人間の創造性や専門性を活かした高付加価値業務への集中が可能になります。AIとの協業によって、より効率的で革新的なビジネス環境の構築を目指していくことが、これからの競争力の源泉となるでしょう。

Accenture Japan (有志)

Discussion