🗼

open Babelを用いて化合物の情報を変換する方法

2023/04/11に公開

はじめに

ここでは、WEB版のopenBabelの簡単な使い方を紹介します。

http://www.cheminfo.org/Chemistry/Cheminformatics/FormatConverter/index.html

openBabelとは

OpenBabelは、ほぼすべての化学フォーマットを変換することができ、あるプログラムから別のプログラムへ素早く移動するのに非常に実用的です。

いろいろなフォーマットを変換可能

mol, SMILES, InChI, gaussian input, gaussian output, MOPAC inputなどの色々な形式に変換できる。

色々なフォーマットの簡単な説明

mol file

MOLファイルはMolecular Design Limited社の運営するデータベース群の入出力フォーマットでしたが,現在ではケモインフォマティクスにおけるデータ交換フォーマットとしてデファクトスタンダードの1つになっています.またその歴史的由来から「MDL MOLファイル」とも呼ばれている。

SMILES

1986年、David Weiningerは化学データ処理のためのSMILES(SimplifiedMolecular Input Line Entry System)表記法を開発した。​この言語は柔軟で習得しやすく、化学構造情報をグラフに基づく高度に圧縮・簡略化された線表記で記述されたものである。化学情報学では一般的な表現方法となる。

InChI:International Chemical Identifier

IUPAC International Chemical Identifier (InChI) は、化合物に対する非独占的なバイ・ユニーク識別子である。2000年から開発されているオープンソースのInChIアルゴリズムは、現在多くの分子エディタに実装されており、化合物をユニークな英数字の文字列に変換​でき、自由に使え、非営利で使用できる。SMILESでは問題があった一意性を解決している。​

gaussian input file

gaussianで計算するための入力ファイル。Gaussianは、ジョン・ポープルが1970年に設計した計算化学用のソフトウェアである。Gaussianは量子化学計算のデファクト・スタンダードといわれる

gaussian output file

gaussianで計算した出力ファイル。Gaussianは、ジョン・ポープルが1970年に設計した計算化学用のソフトウェアである。Gaussianは量子化学計算のデファクト・スタンダードといわれる。

mop : MOPAC Cartesian format

mopacで計算するための入力ファイルの形式。MOPAC (Molecular Orbital PACkage) は、MINDO、MNDO、AM1、PM3、PM5、Sparkle/PM3などの半経験的量子力学計算を行うための計算化学ソフトウェアである。Michael Dewarらにより開発された。

基本的な使い方

左上のINPUTのところにSMILESの文字列を入力した状態でOptionsのInput formatにsmi -- SMILES formatを選び変換したいformatを選んだあと(画像ではmol -- MDL formatが選ばれている)、Convertボタンを押すとOUTPUTのところに変換されたformatが表示される。

Convertボタンを押したあとに表示されるOUTPUTので右上のダウンロードボタンをクリックすると、ファイルとしてダウンロードすることも出来る。

option

Convertボタンを押すまえにoptionを設定することも出来る。

  • Generate coordinatesで2次元 or 3次元の構造を自動で出力してくれる。
  • Add/Delete hydrogensで水素の付加や除去も選択できる。

構造を書いて変換することも出来る。

構造を書いたときには、INPUTのところにはmolファイルが表示されるので、Input formatには mol -- MDL MOL formatを選択します。

右上のボタンをクリックすると描いた構造をそのままmol fileとしてダウンロード、画像ファイルとしてダウンロード、molファイルとしてクリップボードにコピーなどを行う事もできる。

WEB版ではなく、Open Babelをプログラムで動かす

1つの化合物を変換する場合などは手軽なWEB版のopenBabelを使うこともあるかと思いますが、多くの化合物を処理するためにはプログラムを利用する方が便利です。

google colabolatoryなどでopenbabelを動かすやり方は、こちらをご覧ください。

https://zenn.dev/poclabweb/books/chemoinfomatics_beginner/viewer/lesson05_01_mopac

Discussion