👌
Puppeteerを用いたスクレイピング操作 Tips
クエリセレクタ
XPathを使う
$x('/html/body/div[2]/table/tbody/tr[2]/td[2]')
返り値はElementHandleの配列のため(たとえ一つでも配列となる)、0番目を指定してやる必要がある
タグから辿る
- 5番目のtd、その下のaタグを得る場合
<ElementHandle>.$('td:nth-child(5)>a')
<ElementHandle>.$('td:nth-child(3) > div:nth-child(2)'))
クラス名から探す
<ElementHandle>.$('.some-class'))
情報を得る
内部のテキスト情報
<ElementHandle>.getProperty('textContent')
クラス名
<ElementHandle>.getProperty('className')
Discussion