🙄

Google ColaboratoryにminiforgeをインストールしてRDkitを走らせた

2022/05/25に公開

はじめに

Google Colab上にminicondaでconda環境を構築して、rdkitを使う記事は、こちらの化学の新しいカタチさんのGoogle ColabでRDKit:ケモインフォマティクス用のpython環境を手軽に構築さんや、@kimisyoさんのGoogle Colaboratoryにcondaをインストールしケモインフォマティクスしてみるに詳しく記載されています。
今回、miniforgeで環境を構築したいと思って探したのですが、情報を見つけることができませんでした。また、通常のLinux x86_64 (amd64)に対するminiforgeインストール手順を試したところ、インストールは進むものの、!which condaで探しても見つからず、condaのコマンドを使うことができませんでした。

概要

Google Colab上にconda環境を構築するライブラリcondacolabを使わせてもらうこととしました。condacolabのpipによるインストールは、ほぼチュートリアルの手順どおりでしたが、デフォルトのMambaforgeではなく、miniforgeを指定しました。conda環境構築後、rdkitをインストールして走らせらました。先に引用した先行の記事から、下記二点の変化がありました。

  • condacolabのpythonは3.6ではなく、3.7になっていました。
  • miniforgeはlatestのものがインストールされますが、python3.9ではなく、python3.7がインストールされるようになっていました(チュートリアルに記載あり)。おそらく、Google Colabのバージョンに合わせるためではないかと思うのですが、現時点、rdkitはpython3.8まででしか使えないようなので、好都合でした。

内容

1. 導入手順

  1. condacolabのチュートリアルに従って、以下を走らせ、miniforgeをインストールした。
!pip install -q condacolab
import condacolab
condacolab.install_miniforge()

ここで「セッションがクラッシュしました」という警告が出るが、無視して良いとチュートリアルにある。
2. 以下でpythonのバージョンやcondaの場所を確認した。

!which python
!python --version

[出力]: /usr/local/bin/python
[出力]: Python 3.7.10

!which conda

[出力]: /usr/local/bin/conda

  1. rdkitをインストールした。
!conda install rdkit

今回はあえてチャンネルもバージョンも指定しませんでしたが、python3.7でもあり、バージョンは指定した方が良いかもしれません。念のため、!conda listで確認したところ、rdkit 2022.03.2でした。

2. 検証

さて、本業。とりあえず、メチルエチルケトンをSMILESから作ってみます(酢エチにしようとして、酸素1コ入れ忘れた)。

from rdkit import Chem
from rdkit.Chem import Draw
m = Chem.MolFromSmiles('CCC(=O)C')
Draw.MolToImage(m)

描けた。ただし、ローカルのJupyter Notebookと異なり、明示的にDrawモジュールを指定する必要があるようです。

まとめ

condacolabを使うことにより、Google Colab上に、miniforgeによるconda環境を構築し、rdkitを使うことができるようになりました。自身の目的では、環境構築よりは、データ解析に手間や時間をかけたいですから、こういったライブラリを提供いただけるのは、とても有難いことだと思いました。

Discussion