👌

Puppeteerを用いたスクレイピング操作 Tips

2022/09/23に公開

クエリセレクタ

XPathを使う

$x('/html/body/div[2]/table/tbody/tr[2]/td[2]')

返り値はElementHandleの配列のため(たとえ一つでも配列となる)、0番目を指定してやる必要がある

タグから辿る

  • 5番目のtd、その下のaタグを得る場合
<ElementHandle>.$('td:nth-child(5)>a')
<ElementHandle>.$('td:nth-child(3) > div:nth-child(2)'))

クラス名から探す

<ElementHandle>.$('.some-class'))

情報を得る

内部のテキスト情報

<ElementHandle>.getProperty('textContent')

クラス名

<ElementHandle>.getProperty('className')

Discussion