chrome.devtools.network を使って、拡張機能からネットワークリクエストを取得する
完成図イメージ
Twitterでハッシュタグをつけるとアイコンが表示されるときがあります。企業がキャンペーンをしてるときや #MeToo など社会運動があるときに使われます。なんというタグを使うとアイコン付きのハッシュタグが表示されるかは一般に公開されていませんが、chrome.devtools.network
APIを使って一覧を表示する拡張機能を作っていきましょう。
拡張機能を使えばWebページに表示されている多くの情報にアクセスできるのはこれまでの拡張機能の開発で実感していただけたかと思います。しかし拡張機能で全ての情報が簡単に取得できるわけではありません。例えばネットワークリクエストにアクセスするにはある制限がかかっています。ネットワークリクエストはDevToolsからネットワークタブを開いて閲覧することができる情報の一覧です。
ネットワークリクエストにアクセスできると、Cookieやhiddenで埋め込まれている情報など、画面上に表示されている以上の情報にアクセスすることができます。それゆえセキュリティーを重視するChromeでは、拡張機能開発者がネットワークリクエストに気軽にアクセスできないような仕組みになっています。それを裏付けるものとして、ネットワークリクエストにアクセスするためのchrome.devtools.network
APIはユーザー自身がDevtoolsを開かないと利用することができません。さらにDevToolsを自動で開くようなAPIは提供されていません。開発者でもない限り、DevToolsを開いたことがないユーザーがほとんどでしょう。それゆえchrome.devtools.network
APIは開発者にとって魅力的なAPIとはいえ、利用してくれるユーザーは限られてくると思います。
ファイルの作成
まずは必要なファイルを作っていきましょう。
{
"manifest_version": 3,
"name": "Hashtag Viewer",
"version": "1.0.0",
"description": "Twitterのハッシュタグの一覧を表示します",
"devtools_page": "devtools.html" // 👈①
}
<!DOCTYPE html>
<html>
<head>
</head>
<body>
<script src="devtools.js"></script> // 👈②
</body>
</html>
chrome.devtools.panels.create( // 👈③
"HashTags", // パネルの名前
"images/logo-retweet.png", // アイコン画像を指定できる
"./panel.html", // パネルで表示されるhtml
() => {} // callback
);
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Hashtag Viewer</title>
</head>
<body>
<h1>ハッシュタグ一覧</h1>
<script src="/panel.js"></script>
</body>
</html>
chrome.devtools.network.onRequestFinished.addListener((req) => { //👈④
console.log(req); //👈⑤
});
①DevTools のパネルを作るのに特別な permission はいらない
DevTools
でカスタムパネルを追加するには、manifest.json
で devtools_page
項目にhtmlファイルを追加するだけです。このあたりはポップアップやオプションページと扱いが似ています。いずれも独立したWebページだからでしょうか。
devtools.html
の役割
② devtools.html
は非常に簡潔なものになります。このファイルはdevtools.js
を呼び出すためにあるようなものです。ユーザーがDevToolsを開くとmanifest.json
で指定したdevtools.html
がロードされ、devtools.html
内の<script>
で読み込まれているdevtools.js
がロードされます。このhtml
にh1
やspan
など見た目に関する記述を書いても画面上のどこにも反映されません。また、Chrome拡張機能はコンテンツセキュリティポリシーに従う必要があるため、JavaScriptのコードはインラインで記述してはならず、scrpt
タグで読み込む必要があります。
chrome.devtools.panels.create()
③ パネル内ではchrome.devtools
APIとchrome.extension
APIしか使うことができません。しかし、メッセージを送ることでバックグラウンドで処理した結果を受け取ることができるのでそれほどの不便はありません。
chrome.devtools.panels.create()
の構文
chrome.devtools.panels.create(title, iconPath, htmlPath, callback)
引数 | 型 | 説明 |
---|---|---|
title | string | パネルに表示される名前 |
iconPath | string | パネルに表示されるアイコンのパス |
pagePath | string | パネルのhtmlのパス |
callbacks? | string | コールバック |
このpagePath
にはhtmlファイルを指定しなければなりません。パネルはこの関数を使って作ります。
devtools.js
も補助的な役割のファイルで、実際にパネルに表示されるファイルはpanel.html
で、パネルに関する処理を書くファイルはpanel.js
です。
chrome.devtools.network
④ 冒頭でも説明したように、chrome.devtools.network
APIを使うことでネットワークリクエストの情報を取得できるようになります。ネットワークリクエストの一覧の情報はHARファイルという情報にまとめられます。HTTP Archive ファイルの略で HARファイルと呼ばれています。HARファイルはJSON形式のファイルで、HTTP通信の内容に加えてページのロード時間なども含まれます。HARファイルはchrome.devtools.network.getHAR()
メソッドを使うことで取得できます。
しかし今回は通信内容のファイルが保存したいわけではなく、やり取りされるネットワークリクエストにアクセスし、必要な情報だけを入手するだけなのでchrome.devtools.network.onRequestFinished
イベントに、イベントハンドラーを追加して、必要な情報だけを取得するだけの処理になります。
onRequestFinished
の構文
chrome.devtools.network.onRequestFinished.addListener((req) => {
...
})
callback
の引数
パラメーター | 型 | Head |
---|---|---|
req | request | HARファイルと同じもの。script、jSON、画像などが含まれる。 |
⑤ ネットワークリクエストを出力してみる
④で追加したイベントハンドラーの引数にはreq
を指定しました。この変数にはネットワークリクエストの全ての情報が入っています。どのような情報が入っているかコンソールパネルを開いて確認してみましょう。
しかし今回のようにDevToolsのパネルの拡張機能の開発をしているとき、コンソールパネルを開くのに一手間かかります。以下の手順を踏んでください。
- twitterを開いているページでDevToolsを開く(右クリック->検証)
- パネルの左端の >> と書かれてある箇所をクリック
- HashTags をクリック
- HashTags パネル上でさらにDevToolsを開く(右クリック->検証)
- コンソールパネルをクリック
上の手順を踏むと、コンソールには大量の Object が出力されていることが確認できます。これらのオブジェクトは全て、ネットワークパネルで受けとったネットワークリクエストと等しいものです。この中から作りたい拡張機能に合わせてリクエストを選別を行います。しかしconsole.log
でリクエストの一覧を出力したものはとても見づらいので、必要なネットワークリクエストを選別するときは普通、ネットワークパネルから確認します。
パネルを先頭に移動する
HashTagsパネルは常にパネル一覧の最後に配置されるので開発中は先頭に移動させておくといいです。HashTagsパネルをドラッグ&ドロップして要素の左側においておくと便利です。しかし先頭に配置しても、DevToolsを開いたときにデフォルトで開かれるパネルは要素パネルであることに注意してください。
パネルの順番は変えられる
ネットワークタブで確認する
必要なネットワークリクエストを選別するために、ネットワークパネルを利用するのがいいことを説明しました。Twitterから、DevToolsを開いてネットワークパネルを開き、Twitterを再度読み込みしてみます。するとこのように多くのデータが送られてくることがわかります。ネットワークリクエストの多くは用途不明なJSファイルだったり、ユーザーのアイコンだったりするので面白いものはほとんどありません。
ここで面白そうなファイルを見つけるコツを紹介します。それは表示ファイルをFetch/XHR
をクリックしてフィルタリングすることです。このフィルタリングを設定して表示されるファイルは、ユーザーの投稿などデータベースから取得してきた情報が格納されていることが多いです。
Fetch/XHR をクリックしてフィルタリング
こうして表示されたファイルからhashflag.json
というファイルをクリックしてください。すると右にサイドバーが出てくるので「プレビュー」をクリックします。
このプレビューで表示されるものはhashflag.json
の内容そのものです。もっといえば、ハッシュタグに関数情報が格納されているjsonファイルです。ブラウザで見やすくするため整形されていますが、これらのデータは1つのjsonファイルに格納されています。
この中の[0..99]
と書かれている箇所をクリックします。するとデータが展開されてhashtag
とかかれた項目が見えます。
この中に100WIN
と書かれたものがあるので、twitterを開き、#100WIN
と入力してみましょう。すると絵文字つきハッシュタグが表示されます。
他に表示されているハッシュタグを追加しても同じように絵文字付きハッシュタグが表示されます。
JSONの中身を見ると次のようなオブジェクトの構造になっていることがわかります。
{
"hashtag": "100WIN",
"starting_timestamp_ms": 1674720000000,
"ending_timestamp_ms": 1704111600000,
"asset_url": "https://abs.twimg.com/hashflags/LCSFranchise_LeagueEmoji_100Thieves2023/LCSFranchise_LeagueEmoji_100Thieves2023.png",
"is_hashfetti_enabled": false
}
asset_url
に格納されているURLをに移動してみると、hashtag
キーの文字を入力したときに出てきたのと同じ画像が出てきました。
抽出する情報はこれで決まりました。ネットワークリクエストからhashflag.json
という名前のファイルのみを取得し、そのJSONからhashtag
キーとasset_url
キーの一覧を表示してみましょう。
リクエストを抽出する
再びHashTagsパネルに戻ってネットワークリクエストがどのような形式のオブジェクトなのかを確認してみましょう。数ある中からhashflags.json
ファイルを選び取るには何かしらの条件分岐が必要です。そのためにネットワークリクエストの構造を知る必要があります。ネットワークリクエストは以下のような構造です。主要な情報はrequest
キーかresponse
キーの中にあることがわかります。
urlでフィルタリングする
コードに戻ります。ネットワークリクエストからURLを出力させてみましょう。先ほどの画像をみるとURLはrequest
キーの中のurl
キーに格納されていることがわかります。そこで、コードを次のように書き換えます。
chrome.devtools.network.onRequestFinished.addListener((req) => {
- console.log(req);
+ console.log(req.request.url)
});
HashTagsパネルのDevToolsを開き、Twitterを再度読み込みをしてみます。するとconsole.log(req)
のときと違って、ネットワークリクエストのURLのみが出力されました。
WindowsならControl + F
、Macなら⌘ + F
を押してhashflags
と検索してみましょう。するとhttps://twitter.com/i/api/1.1/hashflags.json
というURLがヒットしました。
次にこのURLに着目してネットワークリクエストがどのようなものなのか調べてみます。
chrome.devtools.network.onRequestFinished.addListener((req) => {
- console.log(req.request.url)
+ const url = req.request.url
+ if (url === 'https://twitter.com/i/api/1.1/hashflags.json') {
+ console.log(req);
+ }
});
出力されたオブジェクトを見ても先ほどは見れたハッシュタグのURLは見当たりません。コールバックで取り出したreq
からネットワークリクエストのデータの本体(body)を取り出すには次のようなコードにします。
chrome.devtools.network.onRequestFinished.addListener((req) => {
const url = req.request.url
if (url === 'https://twitter.com/i/api/1.1/hashflags.json') {
- console.log(req);
+ req.getContent((content, encoding) => {
+ const json = JSON.parse(content);
+ console.log(json);
+ });
}
});
データの本体を取り出すにはgetContent()
メソッドを使います。getContent()
メソッドの返り値にデータの本体が格納されています。今回はJSONデータを扱うことがわかっているので、JSON.parse()
を使ってJavaScriptで扱いやすくしています。
getContent()
の構文
reqest.getContent((content, encoding) => {
}
パラメーター | 型 | 説明 |
---|---|---|
content |
string |
ネットワーク本体の情報 |
encoding |
string |
エンコーディング名。何もされてなければ空白。 |
最後にこれらの情報をHashTagsパネルに表示してみましょう。
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Hashtag Viewer</title>
</head>
<body>
<h1>ハッシュタグ一覧</h1>
+ <table id="dataTable">
+ <tr>
+ <th>ハッシュタグ</th>
+ <th>画像</th>
+ <th>URL</th>
+ </tr>
+ </table>
<script src="/panel.js"></script>
</body>
</html>
chrome.devtools.network.onRequestFinished.addListener((req) => {
const url = req.request.url
if (url === 'https://twitter.com/i/api/1.1/hashflags.json') {
req.getContent((content, _) => {
const json = JSON.parse(content);
+ const table = document.getElementById("dataTable");
+
+ json.forEach((item) => {
+ const row = table.insertRow();
+ const cell1 = row.insertCell();
+ const cell2 = row.insertCell();
+ const cell3 = row.insertCell();
+
+ cell1.innerHTML = item.hashtag;
+ cell2.innerHTML = `<img src="${item.asset_url}" alt="画像" style="width:50px;height:auto;">`;
+ cell3.innerHTML = item.asset_url;
+ });
});
}
});
次のように一覧が表示されると完成です。
パネルのデバッグをする
パネルを開く前に受信したネットワークリクエストはパネルに受信されない。そのため再度読み込みが必要
? アイコンの設定の仕方がわからない。サイズの問題?パスの問題?
document.location.href
では閲覧中のURLを取得できない
拡張機能のややこしいところはWebサイト、バックグラウンド、ポップアップが3つの世界でそれぞれ独立して動いているということです。今回使っているDevToolsのパネルも例外ではなくこの3つから独立して動いています。独立していることの何が厄介かというと思った通りの挙動をしないということです。たとえば現在開いているサイトのURLを取得しようとしてdocument.location.href
を使っても、得られるものはサイトのURLではなくパネルのURLです。
DevTools 周りのAPI
Discussion