Open1

WebスクレイピングとAPIの違い

ひでひで
  1. Webスクレイピング
  • Webページから直接データを抽出する方法
  • HTMLを解析してデータを取得
  • サイトの構造変更に弱い

例:

from bs4 import BeautifulSoup
import requests

# Webページの内容を取得
url = "https://example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# データを抽出
title = soup.find('h1').text
  1. API
  • データを取得するための正式な仕組み
  • 決められた形式でデータをやり取り
  • より安定的でスムーズ

例:

import requests

# APIからデータを取得
api_url = "https://api.example.com/data"
response = requests.get(api_url)
data = response.json()

違いを例えで説明すると:

  • スクレイピング:お店の商品棚から直接情報を探す
  • API:お店の受付カウンターで正式に情報を受け取る