💊

Sanitize It Yourself で最高にブロックバスターな分子を作ろう!

2021/12/20に公開

これは創薬 (dry) Advent Calendar 2021の12日目の記事です。

ここ数年のAIブームにより、分子設計アルゴリズムが数多く提案されています。しかし、コンピュータによって生成された分子を自動的に評価するのは難しい課題で、化学者たちからは生成された分子の妥当性について厳しい注文がつけられているのが現状です。

Science誌に掲載されたブログ記事のGenerating Crazy Structuresではアルゴリズムによって生成された分子をcrazyという強い言葉で非難しています(ちなみにこの記事で"worst example"として紹介されている分子は逆合成ちゃんの中の人が開発したアルゴリズムで生成されたものです)

遺伝的アルゴリズムで最高にブロックバスターな分子を作ろう!で遊んでいただいた方はお分かりかと思いますが、分子生成アルゴリズムの多くは人間が見ればひと目でおかしいと感じる分子であっても原子価さえあっていれば妥当な分子として生成してしまいます。AiZynthFinderなどの自動逆合成プログラムを使って分子の合成可能性を数値的に評価する試みも提案されているのですが、逆合成アルゴリズムの性能が十分ではないため信用性があまり高くないのが現状です。コンピュータによって生成された分子の候補から有用な分子を見つけ出すためにはまだ人の力を借りる必要があると感じています。

分子のチェックを容易にするために開発したWebサービスがSanitize It Yourselfです。論文はChemRxivで公開しています

https://doi.org/10.33774/chemrxiv-2021-9nhm1-v2

使い方

まずはDemoページの使い方を紹介します。

  • DemoページではZINCデータベースから取得した1000個の分子が表示されています
  • 各分子の下に表示されている 👎 と 👍 を押すことで分子を評価することができます
  • 画面上部にあるFilterのチェックボックスを利用して、各種フィルタにあてはまる分子のみを表示することができます。現在Rule of Five・PAINS・MCFの3種類のフィルタが実装されています。自分が 👎 または 👍 を押した分子の表示も可能です。
  • SMARTSを用いた部分構造検索も行えます。Filterの一番右側にあるSubstructure searchをクリックすると分子エディタが起動してGUI上でSMARTSを書くことができます。エディタを使わずに手打ちすることも可能です。
  • Exportボタンを押すとSMILESリストをダウンロードできます。Filterに 👍 を指定した状態でExportすると自分が 👍 を押した分子だけをエクスポートできます。
  • 各分子の右上に表示されている三角形をクリックするとメニューが表示されます
    • Detailsを選ぶと各分子の詳細情報を確認することができます。詳細情報ページから分子へのリンクを共有したり、逆合成ちゃんにリプライを飛ばしたりすることも可能です。
    • Substructure Searchを選ぶとその分子を初期状態にした分子エディタが起動します。分子を編集して部分構造検索を行うことができます。
    • Nearest Neighbor Searchを選ぶとその分子に近い分子が表示されます。分子の近さはMACCS keyのAngular distanceによって評価されます。

自分で分子リストを作るためにはログインする必要があります。トップページからTwitterまたはORCIDを使ってログインしてください。

ログインするとダッシュボード画面に移動します。

この画面から新しいプロジェクトを作ったり、自分のプロジェクトを管理したりすることができます。プロジェクトのURLを共有することで他の人にも分子を見てもらうことが可能になります。あなったが作った分子をみんなで評価してブロックバスターを作ろう!

Sanitize It YourselfのソースコードはGitHubに公開しています。サーバーに送信したくない分子情報がある場合はこのソースコードを使って自分のサーバー上でサービスを運営することも可能です。バグ報告や機能追加の提案お待ちしています。
https://github.com/n-yoshikawa/molecule-sanitizer

Discussion