💊

in silico創薬の物性評価を論文に沿ってやってみた。

2025/01/14に公開

本記事は物性予測ツールであるSwissADME、Deep-PKについて書かれた記事です。
こちらの内容が理解できると、望みの化合物の物性を簡単にわかることができるようになります。ぜひ皆さんもトライしてみて下さい!

動作検証済み環境

Windows 11 Home, 13th Gen Intel(R) Core(TM) i7-13700, 64 ビット オペレーティング システム、x64 ベース プロセッサ, メモリ:32GB

本記事は以下の論文のフォローになります。

https://www.nature.com/articles/s41598-022-10364-z

本論文は標的の選定方法からスクリーニング、スクリーニングした薬物候補化合物の毒性、物性予測、MDシミュレーションまでしており、ほぼ無料のツールですることができます。in silico創薬の基本が詰まっているので、一緒に勉強していきましょう。

宣伝

本記事を見てくださり、ありがとうございます。

本記事を含めた技術書が販売されました!
https://zenn.dev/labcode/books/1e05d05bf8f393

また上記は中級者向けですので、
初学者の方で、インシリコ創薬についてより学びたい方は

拙著
https://zenn.dev/labcode/books/xvsw0lszpqir77
で学び、さらに色々な方法で新薬探索を楽しんでいただければと思います!

また化合物の評価を行いたい場合は
https://zenn.dev/labcode/books/ar7sn7jlhhafgm
を見ていただければと大変嬉しいです。

In silico創薬とその流れ

In silico 創薬、in silicoスクリーニングとは

インシリコ創薬(in silico drug discovery)は、コンピュータを駆使し、シミュレーションやデータ解析を用いて新薬を設計・発見する手法です。

これにより、従来の実験的な方法に比べてコストと時間を大幅に削減できるとされています。

その中でもin silicoスクリーニングは、膨大なデータベースから有望な候補物質を迅速に特定し、その効果や副作用を予測することで、創薬の初期段階での効率化が図られます。

一見難しそうなin silico創薬ですが、現在では様々なアプリケーションやwebサイトがあり、それらを駆使すれば、誰でも簡単に創薬をすることもできます。本記事では、それらのアプリケーションを駆使し、in silico創薬を行った論文をもとに、手法をわかりやすく説明していきます。

In silico創薬の流れ

  1. ターゲット選定、準備:疾患の原因となる分子(ターゲット)を特定し、その3D構造を準備します。
  2. 化合物ライブラリの構築:in silicoスクリーニングに使用する化合物集団(=ライブラリ)を作成します。
  3. in silicoスクリーニング:コンピュータ上で数百万の化合物を対象に、ターゲット分子との結合親和性を評価します。
  4. 分子動力学シミュレーション(MD simulation):候補化合物とターゲットの相互作用を動的に解析し、安定性や効果を予測します。
    4.1.環境構築:Windowsでの環境構築を示しています。
    4.2.MD simulation:MD simulationを行います。結果の可視化を行います。
    4.3.RMSD, RMSF, RoG, hydrogen bond, RDF 解析:構造変化や分子間相互作用を評価するための解析手法を行います。
    4.4.MM-GBSA解析とMM-PBSA解析、decomposition解析、アラニンスキャン:分子間相互作用や結合エネルギーへの各残基の寄与を解析します。
    4.5.Water swapping解析:リガンド-タンパク質間の結合自由エネルギー計算を行います。
  5. 物性、毒性評価(本記事):過去のデータを用いて、新たな候補物質の特性や副作用を予測するモデルを構築します。
  6. (実験的検証):in silico解析で得られた候補物質を実験室で合成し、実際の効果や安全性を検証します。

すでに公開したものについては、リンクを貼っています。

pkCSMについてはアップデートされ、Deep-PKとなっていますので、こちらで行います。

またSwissADMEについては以前の記事からUIが少し変更になっていますが、やり方はほぼ同じです。

最初にSwissADMEについて説明し、次にDeep-PKについて説明します。

物性評価とは

薬物化合物の物性評価とADME(吸収、分布、代謝、排泄)は、医薬品開発において重要な要素です。物性評価では、化合物の溶解性、安定性、リポフィリシティ(脂溶性)、分子サイズなどの基本的な化学的特性を調査します。これらの物理化学的特性は、薬物の生体内での挙動、すなわちADMEプロセスに直接影響を及ぼします。吸収は薬物が体内に入る方法を指し、分布は薬物が体内でどのように移動し組織に分配されるかを示します。代謝は薬物が体内でどのように変化し、活性を変えるかを、排泄は薬物が体外にどのように排出されるかを表します。これらの過程は、薬物の有効性、安全性、および投与量を決定する上で不可欠です。

SwissADME

SwissADMEは、これらのADMEプロファイルを予測するためのウェブベースのツールです。SMILES(Simplified Molecular Input Line Entry System)形式で入力された化合物の構造に基づき、物理化学的特性、リポフィリシティ、薬物類似性、水溶性などのパラメーターを迅速に計算します。このツールは、化合物の生物利用性レーダーを使用して、薬物としての適合性を視覚的に評価します。このレーダーは、薬物が「薬物らしい」範囲内にあるかどうかを示し、薬物開発の初期段階でのスクリーニングに役立ちます。SwissADMEによるこれらの予測は、化合物の設計と最適化をガイドし、効率的な薬物開発プロセスに貢献します。

Swiss ADMEによる物性

それでは早速、SwissADMEを使ってみていきましょう。

こちらにアクセスしてください。以前の記事と比べてUIが少し違っています。

以下のような画面にアクセスできると思います。

左のMarvin JSと書かれている箇所にこの構造をかき、真ん中の矢印でSMILESという化合物を文字で表したものを生成します。

右下のRunを押せば、今回のモデル化合物CMNPD28986の物性が表示されます。

各物性説明

以下のようにモデル化合物Top-2の物性が予測されました。

各物性について説明します。

Physicochemical Properties (物理化学的特性)

  • SMILES: 化学構造を記述する文字列形式。ここでは、CC(=O)C1CcC2c(CO1)c(O)ccc2 が示されています。
  • Formula (分子式): 化合物の分子式。C12H14O3 です。
  • Molecular weight (分子量): 化合物の質量で、206.24 g/mol となっています。
  • Num. heavy atoms (重原子数): 重い原子(炭素以外の非水素原子)の数。15個。
  • Num. arom. heavy atoms (芳香族重原子数): 芳香族環に含まれる重原子の数。6個です。
  • Fraction Csp3: 分子中のsp3混成軌道を持つ炭素の割合。0.42 です。
  • Num. rotatable bonds (回転可能結合数): 回転できる単結合の数。1個です。
  • Num. H-bond acceptors (水素結合受容体の数): 水素結合を受け入れられる原子の数。3個です。
  • Num. H-bond donors (水素結合供与体の数): 水素結合を提供できる水素原子の数。1個です。
  • Molar Refractivity (モル屈折率): 分子の極性やサイズを反映した屈折率。56.80です。
  • TPSA (Topological Polar Surface Area; トポロジカル極性表面積): 極性原子の表面積を示し、薬物の膜透過性や吸収を予測するための指標。46.53 Ų です。

Lipophilicity (脂溶性)

  • 脂溶性は、化合物が水よりも脂肪(油)によく溶ける性質を示します。これは、化合物が細胞膜を透過できるかどうかに影響を与えます。脂溶性の指標であるLog Pは、分子の親油性(脂溶性)を予測する複数のモデルを使用して算出されます。
    • Log P (iLOGP): 分子のグラフ構造に基づいて脂溶性を予測するモデルです。iLOGPはグラフベースのアプローチを採用しており、1.98という値です。
    • Log P (XLOGP3): 経験的な方法で、分子中の親油性基や親水性基の分布を元に予測します。ここでは1.40と予測されています。
    • Log P (WLOGP): 水中での溶解性に基づいたモデルで、1.66 という値が得られています。
    • Log P (MLOGP): Muegge法に基づく脂溶性の予測で、1.04 です。このモデルはリード化合物の評価に使われることが多いです。
    • Log P (SILICOS-IT): SILICOS-ITモデルを使用した予測で、分子の構造的特徴を基に2.39と算出されています。
    • Consensus Log P: 上記すべてのモデルの平均値で、1.69 となっています。これにより、全体的な親油性を安定して評価できます。

Water Solubility (水溶性)

  • Log S (ESOL): 実験的に得られた溶解度を基に、化合物の溶解性を予測するパラメータ。ここでは -2.23 であり、1.21 mg/ml (5.88e-03 mol/l) の溶解度を示しています。クラスは「Soluble」として記載され、水溶性があることが示されています。
  • Log S (Ali): 溶解度の別の予測モデルで、-1.98 となっており、2.15e+00 mg/ml (1.04e-02 mol/l) の溶解度を持つとされています。「Very Soluble」のクラスに分類されています。
  • Log S (SILICOS-IT): さらに別の予測モデル。-2.78 であり、3.40e-01 mg/ml (1.65e-03 mol/l) の溶解度を持つことが示されています。「Soluble」のクラスに分類されています。

Pharmacokinetics (薬物動態)

  • GI absorption (消化管吸収): 消化管での吸収率が「High(高い)」と予測されています。経口投与での吸収性が高いことを示唆しています。
  • BBB permeant (血液脳関門通過性): 血液脳関門を通過できるとされています(Yes)。脳に到達する可能性が高いです。
  • P-gp substrate: P-glycoprotein(P-gp)の基質ではないと予測されています(No)。P-gpは薬物の排出に関与する輸送タンパク質であり、基質でないことは細胞外への排出が少ないことを示します。
  • CYP1A2 inhibitor: CYP1A2酵素の阻害剤ではない(No)。
  • CYP2C19 inhibitor: CYP2C19酵素の阻害剤ではない(No)。
  • CYP2C9 inhibitor: CYP2C9酵素の阻害剤ではない(No)。
  • CYP2D6 inhibitor: CYP2D6酵素の阻害剤ではない(No)。
  • CYP3A4 inhibitor: CYP3A4酵素の阻害剤ではない(No)。これらの酵素は薬物代謝に関わる主要な酵素です。
  • Log Kp (skin permeation; 皮膚透過性): 皮膚透過性の指標で、-6.56 cm/s。これは、化合物が皮膚を通過するのが困難であることを示します。

Druglikeness (ドラッグライクネス)
Druglikeness(ドラッグライクネス)とは、化合物が薬物として適切な特性を持つかどうかを示す指標です。これにより、化合物が経口薬や他の薬物としての開発に適しているかどうかを評価します。ドラッグライクネスの評価は、以下の5つの基準を使って行われます。これらの基準は、薬物の物理化学的性質や体内での挙動を予測し、開発に適した化合物を選定するために役立ちます。

Lipinski(リピンスキーの5つの法則)
リピンスキーの「5つの法則」は、経口薬としての適性を予測するための一般的な基準です。この法則に違反していない化合物は、体内で効果的に吸収される可能性が高いとされています。以下の基準に基づいています:

  1. 分子量が500未満
  2. **LogP(脂溶性)**が5未満
  3. 水素結合供与体(H-bond donor)が5以下
  4. 水素結合受容体(H-bond acceptor)が10以下
  5. 回転可能結合の数が10以下

この化合物はこれらの基準に全て適合しており、経口薬としての可能性が高いとされています。

Ghose フィルター
Ghoseフィルターは、化合物が「ドラッグライク」かどうかを評価する別の基準です。具体的には、以下のような化合物特性を確認します:

  1. 分子量が160~480の範囲内
  2. LogPが-0.4~5.6の範囲内
  3. モル屈折率が40~130の範囲内
  4. 原子数が20~70の範囲内

このフィルターに適合している化合物は、薬物として使用される可能性が高く、ここでもYesとされているため、この化合物はGhose基準を満たしています。

Veber 基準
Veber基準は、化合物の膜透過性や経口バイオアベイラビリティを評価するために使用される基準です。以下の条件を満たす化合物が、良好な吸収性を持つとされます:

  1. 回転可能結合の数が10以下
  2. *TPSA(トポロジカル極性表面積)**が140 Ų以下

この化合物は、これらの基準も満たしており、膜を通過しやすく、体内での吸収が良好であることが期待されます。

Egan フィルター
Eganフィルターは、化合物が細胞膜を通過できるかどうか、および血液脳関門(BBB)を通過する可能性を評価するために使用されます。このフィルターは、化合物の膜透過性や血液脳関門を通過する性質を評価するもので、LogPTPSAの値を基準にします。

この化合物もEgan基準を満たしており、膜透過性が高く、脳に到達する可能性もあります。

Muegge 基準
Muegge基準は、リード化合物の選定において使われるドラッグライクネスの評価基準です。以下のような条件を持つ化合物が、リード化合物として適していると判断されます:

  1. 分子量が200~600の範囲内
  2. LogPが-2~5の範囲内
  3. TPSAが150 Ų以下
  4. 水素結合供与体、受容体、回転可能結合の数がそれぞれ一定基準内であること

この化合物も、Muegge基準に適合しており、リード化合物としての適性が高いとされています。

Bioavailability Score(経口バイオアベイラビリティスコア)
Bioavailability Scoreは、化合物が経口投与された際にどれだけ効率的に吸収されるかを示す予測スコアです。このスコアは0.55であり、これは中程度の経口バイオアベイラビリティを持つことを示しています。スコアが高いほど、経口薬として効果的に体内に吸収される可能性が高いことを意味します。

Medicinal Chemistry (医薬化学)
PAINS アラート
アッセイ干渉の可能性がある化合物を検出するフィルターです。PAINSに該当すると、実際の効果ではなく偽陽性の結果を引き起こすことがあります。PAINSアラートは0で、この化合物はアッセイ干渉を起こしにくく、信頼できる薬物候補です。

Brenk アラート
毒性や不安定な構造を持つ化合物を検出する基準です。Brenkアラートも0で、毒性や不安定性が少ない安全な構造です。

Leadlikeness(リードライクネス)
リード化合物としての適性を評価します。分子量や脂溶性などに基づいて評価されます。分子量が基準を少し超えているため1つの基準に違反していますが、全体的にはリード化合物としての適性は高いです。

Synthetic Accessibility(合成容易性)
化合物がどれだけ容易に合成できるかを示すスコアです。値が低いほど合成が簡単です。合成容易性のスコアは2.90で、合成が比較的簡単な化合物です。

これらのデータは、化合物の薬理学的および化学的特性を理解し、開発に適した候補として評価するための重要な指標です。

Deep-PKとは

Deep-PKは、薬物動態(PK)および毒性を予測・解析・最適化するためのプラットフォームです。薬物の吸収、分布、代謝、排泄、および毒性(ADMET)に焦点を当て、グラフニューラルネットワーク(GNN)とグラフベースの特徴を利用して、64のADMETおよび9の一般的な特性を含む73のエンドポイントに対して高い予測精度を実現します。これにより、分子の最適化と理解をサポートし、ユーザーが入力された分子のPKおよび毒性を効率的に最適化できるよう支援します。

Deep-PKによる物性評価

ではDeep-PKを早速使ってみましょう!

こちらにアクセスしてください!

SMILEとemail addressをを書いて、ADMETを押してください。

右にスライドしていくと、Toxicityなどもみれます。

またMetabolismを押すと、代謝系のプロパティも出てきます。

SwissADMEと被っている項目が多いので、被っていない項目を示します。

Caco-2 浸透性 (logPaap):

化合物がCaco-2細胞を通過する能力を評価します。腸上皮細胞を通過する予測値が-4.81で、吸収性が低いことを示しています。

Human Oral Bioavailability 20%:

化合物の経口バイオアベイラビリティ(吸収されて血中に入る割合)を評価。80.8%と高いバイオアベイラビリティが予測され、経口投与に向いています。

Human Intestinal Absorption:

腸からの吸収率を評価し、99.5%と非常に高い吸収性が予測されています。

MDCK 浸透性:

腸吸収と腎臓での浸透性を評価する指標で、-4.35の値は浸透性が低いことを示します。

Log Vapor Pressure (蒸気圧):

化合物が気体として存在する能力を示す指標で、蒸気圧が低い(-4.96)ため、揮発性が低いことを示しています。

Melting Point (融点):

104.29 °Cで、この化合物は室温では固体であることを示しています。溶解性や安定性に影響します。

pKa (酸性):

化合物が酸としてどれだけプロトンを放出するかを示す値で、9.6です。これは弱い酸性を示しています。

pKa (塩基性):

化合物が塩基としてどれだけプロトンを受け取るかを示す値で、5.84です。これも弱い塩基性を示しています。

最後に

いかがでしたでしょうか。化合物の物性はもうかなり予測できるようになっている印象です。インシリコ技術を活用して、創薬をもっと効率的に行っていきましょう!

参考文献

https://www.youtube.com/watch?v=RG9DmOw1D2g
https://www.youtube.com/watch?v=6doVRePMHEg
https://www.nature.com/articles/srep42717
https://biosig.lab.uq.edu.au/deeppk/

Discussion