Google ColaboratoryにminiforgeをインストールしてRDkitを走らせた
はじめに
Google Colab上にminicondaでconda環境を構築して、rdkitを使う記事は、こちらの化学の新しいカタチさんのGoogle ColabでRDKit:ケモインフォマティクス用のpython環境を手軽に構築さんや、@kimisyoさんのGoogle Colaboratoryにcondaをインストールしケモインフォマティクスしてみるに詳しく記載されています。
今回、miniforgeで環境を構築したいと思って探したのですが、情報を見つけることができませんでした。また、通常のLinux x86_64 (amd64)に対するminiforgeインストール手順を試したところ、インストールは進むものの、!which condaで探しても見つからず、condaのコマンドを使うことができませんでした。
概要
Google Colab上にconda環境を構築するライブラリcondacolabを使わせてもらうこととしました。condacolabのpipによるインストールは、ほぼチュートリアルの手順どおりでしたが、デフォルトのMambaforgeではなく、miniforgeを指定しました。conda環境構築後、rdkitをインストールして走らせらました。先に引用した先行の記事から、下記二点の変化がありました。
- condacolabのpythonは3.6ではなく、3.7になっていました。
- miniforgeはlatestのものがインストールされますが、python3.9ではなく、python3.7がインストールされるようになっていました(チュートリアルに記載あり)。おそらく、Google Colabのバージョンに合わせるためではないかと思うのですが、現時点、rdkitはpython3.8まででしか使えないようなので、好都合でした。
内容
1. 導入手順
- condacolabのチュートリアルに従って、以下を走らせ、miniforgeをインストールした。
!pip install -q condacolab
import condacolab
condacolab.install_miniforge()
ここで「セッションがクラッシュしました」という警告が出るが、無視して良いとチュートリアルにある。
2. 以下でpythonのバージョンやcondaの場所を確認した。
!which python
!python --version
[出力]: /usr/local/bin/python
[出力]: Python 3.7.10
!which conda
[出力]: /usr/local/bin/conda
- rdkitをインストールした。
!conda install rdkit
今回はあえてチャンネルもバージョンも指定しませんでしたが、python3.7でもあり、バージョンは指定した方が良いかもしれません。念のため、!conda listで確認したところ、rdkit 2022.03.2でした。
2. 検証
さて、本業。とりあえず、メチルエチルケトンをSMILESから作ってみます(酢エチにしようとして、酸素1コ入れ忘れた)。
from rdkit import Chem
from rdkit.Chem import Draw
m = Chem.MolFromSmiles('CCC(=O)C')
Draw.MolToImage(m)
描けた。ただし、ローカルのJupyter Notebookと異なり、明示的にDrawモジュールを指定する必要があるようです。
まとめ
condacolabを使うことにより、Google Colab上に、miniforgeによるconda環境を構築し、rdkitを使うことができるようになりました。自身の目的では、環境構築よりは、データ解析に手間や時間をかけたいですから、こういったライブラリを提供いただけるのは、とても有難いことだと思いました。
Discussion