Chapter 03無料公開

第2回|Jupyter labを使って自動的にgoogleのサイトを開こう【Mac編】

ちょいタメ
ちょいタメ
2021.09.04に更新

第1回で、Pythonのソースコードやプログラム文章を書く「jupyter lab」までのインストールが完了していると思います。

ここからは実際に、お使いのMacからソースコードを書いて、GoogleChromeを自動的にブラウザを開くまでを
お教えいたします。

このやり方が分かれば、応用としてインスタグラムのサイトに自動に入ることができます。

jupyter labをターミナルで開こう(おさらい)

第1回でご説明をしたターミナルの開き方のおさらいをしましょう。

ターミナルの開き方は、ショートカットキーで【Command + スペース】を押すと、画面に下記のような「Spotlight検索」と言うものが表示されます。

そこの検索画面に【ターミナル】と入力してみてください。

すると、下記のような画面が表示されたのがコードを入力する為に用いる「ターミナル」と言います。
ターミナルというのは、「コマンドと呼ばれる命令文を用いてMacの操作や設定をおこなうためのツール」になります。
使用しているパソコンによっては、表示されている文言が違う可能性があります。
水色の格好で隠しているところには、自分のパソコン名が表示されており、末尾に「$」マークがあれば正常に動作しております。

末尾に「$」マークの後に、下記のソースコードを入力して

jupyter lab

これで「jupyter lab」を開くことができました。

続いて、ソースコードを書くためのNoteを開きます。
Noteの開き方は下記の画像の通りです。
※画面は見やすいように、背景をブラックモードにしております。

Seleniumをインストールしてブラウザ操作を行う

続いて、ブラウザを操作を自動化するためのフレームワーク「Selenium(セレニウム)」をインストールします。
Seleniumのインストール方法は、下記のソースコードをNoteに入力してください。
jupyter labでフレームワークやモジュールをインストールをするときは、
最初に「!(エクスクラメーション)」を入力するのが主流なので覚えておいてくださいね。

!pip install selenium

https://youtu.be/567eB95CNis

上記のソースコードを入力して後に、Shift +Enterキーを押してください。
「!pip」というのは、簡単にいうと「インストールしたいです!」と宣言するものです。

brewを介して、Googleのクロームドラーバーをインストール

第1回でインストールをした「Homebrew」で、Googleのクロームドライバーをインストールします。
これは、jupyter labから GoogleChromeに自動でWeb操作ができるものになります。
※Macに関しては、Homebrew経由でインストールを行うようにしてください。

それではNote内に下記のソースコードを入力し、Shift +Enterキーを押してください。

!brew install chomedriver

https://youtu.be/HlVk6xsyfXo

インストールが完了しましたら、続いて下記のソースコードを入力して、Shift +Enterキーを押して、
インポートをしてください。
こちらは、先ほどインストールしたseleniumの中にあるブラウザを自動操作する「webdriver」を
jupyter lab内にインポートします。

from selenium import webdriver

その後に、次のソースコードを入力してください。

from time import sleep

<入力イメージ>

こちらのtime・sleepは、一時停止を意図的にプログラムするものになります。
なぜこのプログラムを必要なのかというと、今回行うスクレイピング自体、ネット環境を司るサーバー自体に
かなりの負荷をかけるため、プログラムで待機時間を設けます。

実際にGooglechomeをプログラミングで開いてみよう

続いて、WebブラウザのGooglechomeをプログラミングで自動的に開いてみましょう。

下記のソースコードを!pipでインストールしてください。
このソースコードは、自分の使用しているGooglechomeバージョンに合わせたドライバを
自動的にインストールしてくれる賢いものになります。

!pip install webdriver_manager

<入力イメージ>

その後に、下記のソースコードをインポートしてください。(コードを入力して、Shift +Enterキーを押す)
これは、Googlechomeを開くための準備みたいなコードです。

from webdriver_manager.chrome import ChromeDriverManager

その後に、この下記のコードを入力してください。
こちらは、実際にGooglechomeを自動的に開くソースコードになります。

driver = webdriver.Chrome (ChromeDriverManager().install())

<入力イメージ>

ソースコードを入力した途端、下記の画像のようにGooglechomeが自動で開きます。

テストとして、Googleのサイトを自動で開いてみましょう!
先ほど開いたGooglechomeのサイトは残したままで、jupyterのNote内に
下記のソースコードを入力してください。

driver.get('https://www.google.com/')

https://youtu.be/rVW27z8A9x4

すると、Googleの検索サイトに移動します。
ソースコード内の「get」を使うことで、()内に指定したサイトのURLの情報を取ってくることができます。

かなり簡単ですよね!
Pythonのプログラミングは他のHTMLやCSSなどよりかは、言語や文章があっさりしているので
初心者でもスッと入るので、自分でも本当にやりやすかったです。

第3回では、有料になりますがインスタグラムの自動イイねのソースコード記載いたします。