👨‍💻

外部データベースのまとめ(ケモインフォマティクス )

2020/11/30に公開

主にケモインフォマティクスで活用できそうな外部データベースのまとめ。

API利用などで一括取得が可能なDB

  • Pubchem 化合物のデータベース。(APIを使った自動取得が可能) (参考:pubchem から化合物情報を一気に取得する)
  • ChemSpider 化合物のデータベース。(APIを使った自動取得が可能)
  • GDB-17,13,11 GDB-11:C,H,N,O,F から構成される原子数(水素は除く)が11個の化合物のデータベース GDB-13:C,H,N.O,D,Cl から構成される原子数(水素は除く)が13個の化合物のデータベース
  • MoleculeNet 機械学習による分子特性予測をテストするために設計されたベンチマーク用データセット。化学構造と量子化学計算出力値をまとめたデータセット(QM7, QM8, QM9)や 水溶解度(logP)のデータなどが収容。

(おそらく)一括取得不可

  • Polyinfo 高分子の物性に関するデータベース。利用するには登録が必要。スクレイピングなどのデータの一括取得は基本的には禁止されている。
  • Bordwell pKa Table pKa のデータベース。構造化データではないため解析に使用するにはデータの整形が必要。

一括取得の可否不明

  • CAS アメリカ化学会が運営しているデータベース
  • PubChemQC 量子化学計算のデータベース
  • ZINC15 バーチャルスクリーニング用途に市販化合物を集めたデータベース
  • ChEMBL 化学構造と生物活性データを集めた、医薬品・医薬品候補化合物データベース
  • PDB タンパク質の立体構造データベース
  • CCDC 低分子や結晶構造のデータベース
  • SDBS 有機化合物のスペクトルデータベース

参考

以下のHPの情報を使わせてもらいました。

関連書籍

Discussion