google colabolatoryでは、先頭に!をつけることでシェルコマンドと言われるパソコンの操作も実行できます。
!python -V
pythonのバージョン確認を行うことができます。
google colabolatoryには、教材作成時点でpython 3.7がインストールされています。
!pip freeze
pip freeze
を行うと、どのようなライブラリーがインストールされているかを確認することができます。
!pip freeze
実行するとインストールされているライブラリーの一覧が表示される
google colaboratoryでは、機械学習に必要な色々なライブラリーもインストールされている。
!pip install
pip install
を行うと、ライブラリーをインストールすることができる。
以下に示すコードでケモインフォマティクスで、良く使われるrdkitをインストールしてみます。
!pip install rdkit==2022.3.5
インストールされているかを確認するために、簡単なコードを実行します。
from rdkit import Chem
from rdkit.Chem import Draw
mol = Chem.MolFromSmiles('Cc1ccccc1')
Draw.MolToImage(mol, size=(100,100))
以下の用にトルエンが画面上に表示されれば成功です。
!wget
wget
はRLを指定してファイルをダウンロードすることができます。
githubの所定の場所からファイルを直接、ダウンロード
試しにgithubから2つのファイルをダウンロードしてみます。
!wget https://raw.githubusercontent.com/chemoinformatics-lecture/lecture-beginner/main/lesson07_automl/data/example.csv
!wget https://raw.githubusercontent.com/chemoinformatics-lecture/lecture-beginner/main/lesson05_MOPAC/data/phenol.dat
実行するとexample.csvとphenol.datというファイルが、フォルダーに増えていると思います。
このcsvファイルは、pandasで読み込んで表示することができます。
import pandas as pd
df = pd.read_csv("example.csv")
df
表示させたものが以下になります。
!cat
指定されたファイルの内容が画面に表示することができます。
さきほど、wgetでダウンロードしたphenol.datを開いてみます。
!cat phenol.dat
画面上にphenol.datの中身が表示されます。
ファイルの確認などに使用するコマンドになります。