【まとめ記事】In silico創薬を論文に沿ってフォローする
本記事はIn silico創薬論文を作成する前段階として、In silico創薬論文の一つを例にして、そのやり方を示した記事のまとめ記事です。この記事とリンクの記事を参照にしていただき、自分にもIn silico創薬論文が書けそう!と思っていただけると幸いです。
宣伝
本記事を見てくださり、ありがとうございます。
本記事で紹介している手法は初学者にとって少し難しい可能性があります。
もっと基礎的なところを学びたいという方は以下の技術書をお勧めいたします。
拙著
では色々な方法で新薬探索を行なっています。また化合物の評価を行いたい場合は
を見ていただければと思います。今回フォローしたIn silico創薬論文
今回参考にしているIn silico創薬論文はscientific reportsの以下の論文です。
概要は
多剤耐性菌であるAcinetobacter baumannii(A. baumannii)の標的分子5-enolpyruvylshikimate-3-phosphate (EPSP) synthaseに対して、効きそうな低分子化合物をIn silico創薬で発見した
という論文です。一部有料ツールで行なっていますが、無料で行えるツールで代用できます。
IFは3.8(2024年)で、同様な流れを取っている論文ではIFは3-5あたりを推移している印象があります。ですが、後々示す基本的な流れを押さえつつ、部分的にアレンジを加えるともう少しIFは上がりそうです。
In silico創薬論文の流れと概要
基本は以下の流れで、すでにやり方を記事にしているものについてはリンクを書いています。
-
ターゲット選定、準備:疾患の原因となる分子(ターゲット)を特定し、その3D構造を準備します。
-
化合物ライブラリの構築:in silicoスクリーニングに使用する化合物集団(=ライブラリ)を作成します。
-
in silicoスクリーニング:コンピュータ上で数百万の化合物を対象に、ターゲット分子との結合親和性を評価します。
-
分子動力学シミュレーション(MD simulation):候補化合物とターゲットの相互作用を動的に解析し、安定性や効果を予測します。
4.1.環境構築:Windowsでの環境構築を示しています。
4.2.MD simulation:MD simulationを行います。結果の可視化を行います。
4.3.RMSD, RMSF, RoG, hydrogen bond, RDF 解析:構造変化や分子間相互作用を評価するための解析手法を行います。
4.4.MM-GBSA解析とMM-PBSA解析、decomposition解析、アラニンスキャン:分子間相互作用や結合エネルギーへの各残基の寄与を解析します。
4.5.Waterswapping解析(後日公開):リガンドと水分子を入れ替えることで、タンパク質-リガンド結合エネルギーを精密かつ水媒介相互作用を考慮して計算します。
-
物性、毒性評価(後日公開):過去のデータを用いて、新たな候補物質の特性や副作用を予測するモデルを構築します。
-
(実験的検証):in silico解析で得られた候補物質を実験室で合成し、実際の効果や安全性を検証します。
ここからは各項目をもう少し詳しく解説していきます。
ターゲット選定、準備
この記事では、多剤耐性菌Acinetobacter baumanniiに特有のタンパク質「EPSP synthase」を標的とし、in silicoスクリーニングの準備方法を解説しています。このタンパク質はヒトに存在しない代謝経路に関与しており、有望な薬剤ターゲットとして選定されています。
手順としては、まず水分子や不要なリガンドを除去し、水素化や電荷付加を行いタンパク質を整備します。その後、エネルギー最小化で分子構造を安定化させ、Ramachandranプロットで構造品質を評価します。これらの準備を通じて、精度の高い分子ドッキング解析が可能になります。
化合物ライブラリの構築
この記事では、大規模化合物ライブラリの構築方法を解説しています。海洋天然物データベースCMNPDを利用し、化合物情報を取得した後、FAFDrug4 serverを使って薬物化合物として有望な候補をフィルタリングします。具体的な手順として、CMNPDからSDFファイルをダウンロードし、毒性のある構造やPAINS化合物を除外することで、化合物を7480種類まで絞り込みました。
In silicoスクリーニング
この記事では、構築した化合物ライブラリを用いた分子ドッキングスクリーニングの方法を解説しています。ツールとしてPyRxを使用し、化合物のエネルギー最小化と標的タンパク質への結合親和性評価を実施しました。
まず、PyRxで化合物ライブラリをエネルギー最小化し、pdbqt形式に変換します。その後、ドッキングを行い、結合部位をGrid Boxで指定して親和性を計算します。最後に、得られた結合エネルギーの解析を行い、結合エネルギーが-7.7 kcal/molと最も低いCMNPD14239が特定されました。
MD simulation
- 環境構築
この記事では、Windows上でGROMACSを使用するための環境構築方法を解説しています。Windows Subsystem for Linux(WSL)を活用し、Linux環境を構築することで、GROMACSのインストールと動作が可能になります。手順は、WSLのセットアップ、Ubuntuでの必要なパッケージ準備、GROMACSのインストール、GPU対応設定(任意)、および動作確認を含みます。
- MD simulationの実行
この記事では、リガンド-タンパク質の分子動力学シミュレーション(MDシミュレーション)をGROMACSを用いて実施する方法を詳しく解説しています。シミュレーションは、リガンドとタンパク質の準備、位置拘束設定、水の追加と中和、NVT/NPT平衡化、そして100nsの生産MDまでの流れを網羅しています。また、エラー回避や可視化方法にも触れています。
- RMSD, RMSF, RoG, hydrogen bond, RDF 解析
この記事では、リガンド-タンパク質間の分子動力学(MD)シミュレーションをGROMACSを使って再現し、以下の解析(RMSD, RMSF, RoG, 水素結合、RDF)を実施する手順を解説しています。これらの解析を通じて、構造の安定性や分子間相互作用を評価し、新薬探索に役立つ情報を得る方法を具体的に紹介しています。
- MM-GBSA解析とMM-PBSA解析、decomposition解析、アラニンスキャン
この記事は、リガンド-タンパク質間の結合解析を行うためのMDシミュレーションと、MM-GBSA/MM-PBSA解析、エネルギー分解解析、アラニンスキャン解析の実施方法を詳述しています。GROMACSとgmx_MMPBSAを使用した解析の環境構築、計算プロセス、結果の解釈を通じて、結合自由エネルギーやホットスポット残基を特定する手順を解説しています。これらの手法により、創薬研究で重要な結合部位の理解を深めることができます。
- Waterswapping解析(後日公開)
この記事では、WaterSwap解析を用いたリガンド-タンパク質間の結合自由エネルギー計算について解説しています。WaterSwap法は水分子の橋渡し効果を直接評価でき、安定した収束性と高い信頼性を持つ手法です。OpenBioSimとAmberToolsを使った環境構築と解析手順を紹介し、BAR法、FEP法、TI法を用いて結合エネルギーを評価しました。特にBAR法が最も精度の高い結果を示し、リガンドがタンパク質に高い結合親和性を持つことが確認されました。
物性、毒性評価(後日公開)
この記事では、SwissADMEとDeep-PKを用いた化合物の物性評価について解説しています。SwissADMEでは、物理化学的特性や脂溶性、水溶性などのADMEプロファイルを可視化し、Deep-PKでは毒性や薬物動態を詳細に予測可能です。SMILES形式の入力を通じて、効率的に薬物候補化合物を評価できます。これにより、in silico創薬の初期段階で重要な物性予測を簡単に行うことができます。
同様の流れで作成されている論文たち
以下にターゲットはそれぞれユニークですが、同様の手順で、publishされている論文を紹介します。ここ5年の論文が多いので、まだまだこのやり方で論文は書けそうな感じはしています。一部有料ツールを使っています。
状況に応じて、各論文のMaterial and Methodsを参考にすると良いです。
- Structural Dynamics of P-Rex1 Complexed with Natural Leads Establishes the Protein as an Attractive Target for Therapeutics to Suppress Cancer Metastasis
出版年:2023年
標的:P-Rex1 (PDB: 5D27)
標的選定理由:ガンでの様々な機能
ライブラリ:CMNPD, MPD3, selleckchem bioactive library I, selleckchem bioactive library II, Asinex target oncology library
スクリーニング:FAF-Drugs4
分子ドッキング:PyRx, GOLD
MD simulation: AMBER20
評価:RMSD, RMSF, RoG, βFactor, MM/GBSA, MM/PBSA, RDF plots,
ADMET analysis:Swiss ADME, pkCSM, PreADMET
- Determination of Novel Anti-Cancer Agents by Targeting OGG1 Enzyme Using Integrated Bioinformatics Methods
標的:OGG1 enzyme (PDB: 6RLW)
標的選定理由:OGG1の機能低下が様々な病態を阻害
ライブラリ:CMNPD, MDP3, selleckchem bioactive library I, II, Asinex target oncology library
スクリーニング1:Discovery Studio 3.5 toxicity prediction module
スクリーニング2:PyRx, GOLD
MD: AMBER20
評価:RMSD, RMSF, RoG, βFactor, MM/GBSA, MM/PBSA, Hydrogen bonds analysis, WaterSwap, Alanine scan
ADMET analysis: Swiss ADME, pkCSM
- In silico screening of potential β-secretase (BACE1) inhibitors from VIETHERB database
出版年: 2022年
IF: 2.2
標的: β-secretase (BACE1) (PDB: 2P4J)
標的選定理由: β-amyloid形成に関係、阻害剤はアルツハイマーに効く
スクリーニング: AutoDock4
MD: GROMACS 5.1.3
評価法: Binding free energy, Steered Molecular Dynamics (SMD) simulations, RMSD,
ADMET: PreADMET
- In Silico Identification of Angiotensin-Converting Enzyme Inhibitory Peptides from MRJP1
出版年: 2020年
IF: 3.24
標的: Angiotensin-Converting Enzyme (ACE) (PDB: 1O8A)
標的選定理由: ACEは血圧の調節に重要な役割を果たし、その阻害は高血圧を予防するための主要なターゲットとされています。
ライブラリ: AHTpin serverを使ったMRJP1由来のペプチドライブラリ
スクリーニング: PatchDock
分子ドッキング: FireDock
MD: AMBER v14
評価法: RMSD, RMSF, B-factor, QSARモデル, SVMスコア
- Molecular Insights into Binding Mode and Interactions of Structure-Based Virtually Screened Inhibitors for Pseudomonas aeruginosa Multiple Virulence Factor Regulator (MvfR)
Publication Year: 2021
IF: 4.2
標的: Multiple Virulence Factor Regulator (MvfR) (PDB: 6B8A)
標的選定理由: MvfR を阻害することで、緑膿菌を抗生剤に効きやすくする。
ライブラリ: Asinex Antibacterial Library , CMNPD
スクリーニング: AutoDock Vina, GOLD 5.2
MD: AMBER20
評価法: RMSD, RMSF, RoG, Hydrogen bond analysis, RDF, MM/PBSA and MM/GBSA binding free energies
ADMET Tools: SwissADME, pkCSM
- (単著!!!)Identification of promising methionine aminopeptidase enzyme inhibitors: A combined study of comprehensive virtual screening and dynamics simulation study
出版年: 2023年
IF: 3.0
標的: Methionine Aminopeptidase (MetAP) enzyme from Rickettsia prowazekii (PDB: 3MR1)
標的選定理由: 細菌の生存に不可欠、これが抗菌標的として非常に魅力的です。
ライブラリ: Asinex Antibacterial Library, CMNPD
スクリーニング: PyRx
MD: AMBER 22
評価法: RMSD, RMSF, Radius of Gyration (Rg), Hydrogen Bond Analysis, MM/GBSA, MM/PBSA, WaterSwap Method
ADMET: ADMETlab 2.0
- In silico high-throughput virtual screening and molecular dynamics simulation study to identify inhibitor for AdeABC efflux pump of Acinetobacter baumannii
出版年: 2017年
標的: AdeB protein of AdeABC efflux pump (PDB: Homology model, no PDB ID provided)
標的選定理由: AdeABC effluxポンプは、薬剤排出機構によりAcinetobacter baumanniiの薬剤耐性を引き起こすため、薬剤のターゲットとして有効である。
タンパク質の構造評価 (全無料):PROCHECK(https://www.ebi.ac.uk/thornton-srv/software/PROCHECK/)、VERIFY3D(https://www.doe-mbi.ucla.edu/verify3d/)、Ramachandran plots、ProSA-Web(https://prosa.services.came.sbg.ac.at/prosa.php)、PDBSUm(https://www.ebi.ac.uk/thornton-srv/databases/pdbsum/)
活性ポケット発見:SiteMap
ライブラリ(無料): ZINC database (BioBlocks library, 159,868 compounds)
スクリーニング: Maestro v10.3, QikProp (ADMET analysis), Glide (HTVS, SP, XP docking)
分子ドッキング: Glide (Schrödinger suite)
MD: GROMACS v5.1.4
ADMET: QikProp
- In silico screening of Andrographis paniculata secondary metabolites as anti-diabetes mellitus through PDE9 inhibition
出版年: 2023年
IF: 2.6
標的: PDE9 (PDB: 4Y87)
標的選定理由: PDE9はcGMPの分解に関与し、インスリン抵抗性の改善に寄与する可能性があるため。
ライブラリ: Maebashi Institute of TechnologyおよびNara Institute of Science and TechnologyによるAndrographis paniculata二次代謝産物ライブラリ (http://www.knapsackfamily.com/KNApSAcK_Family/)
スクリーニング: AutoDockTools, AutoDock
MD: Gromacs 2021.3, AMBER99SB-ILDN force field
評価法: RMSD, MM/GBSA, MM/PBSA, Hydrogen bonds analysis
- MOLECULAR DOCKING AND MOLECULAR DYNAMIC STUDIES: SCREENING PHYTOCHEMICALS OF Acalypha indica AGAINST BRAF KINASE RECEPTORS FOR POTENTIAL USE IN MELANOCYTIC TUMOURS
IF: 0.81
標的: BRAF kinase receptor (PDB: 6XFP)
標的選定理由: BRAFキナーゼは細胞アポトーシスに関与しており、悪性黒色腫における主要な標的となるため。
ライブラリ: Acalypha indicaの植物化学成分(the NCBI PubChem Compound databaseから抽出)
スクリーニング: AutoDock 4.2
MD: GROMACS 2019.6
評価法: RMSD, MM/PBSA法による結合エネルギー、残基の結合エネルギーへの寄与評価
- Bulbine frutescens phytochemicals as novel ABC-transporter inhibitor: a molecular docking and molecular dynamics simulation study
出版年: 2021年
IF: 1.9
標的: P-glycoprotein (PDB: 3G60)
標的選定理由: ABCトランスポーターは、薬剤排出を介して薬剤耐性に関与し、癌治療の効果を低減することが知られているため、ABCトランスポーターの阻害が多剤耐性克服の戦略となり得る。
ライブラリ: Bulbine frutescensの既知のフィトケミカルライブラリ 25 個
スクリーニング: AutoDock Tools 1.5.6
MD: GROMACS (version 2018)
評価法: RMSD, RMSF, Radius of Gyration (RoG), 水素結合解析、MM-GBSAによるタンパク質・リガンド結合自由エネルギー計算
- Identification of lead inhibitors for 3CLpro of SARS-CoV-2 target using machine learning based virtual screening, ADMET analysis, molecular docking and molecular dynamics simulations
出版年: 2024年
IF: 4.03
標的: 3CLpro (PDB: 5R82)
標的選定理由: 3CLproはSARS-CoV-2ウイルスの複製に関与し、ウイルス感染を抑制するための主要なターゲット酵素です。
ライブラリ: eMolecules databases https://search.emolecules.com/
スクリーニング: CHEMBLからさせたモデルによるバーチャルスクリーニング
分子ドッキング: AutoDock 4
MDシミュレーション: GROMACS (CHARMM36フォースフィールド)
評価法: RMSD, RMSF, Protein Solvent Accessible Surface Area (SASA), RoG, MM-PBSA (結合自由エネルギー)など
ADMET: SwissADME, ProTox-II, pkCSM
- Discovery of human coronaviruses pan-papain-like protease inhibitors using computational approaches
標的: Papain-like protease (PLpro) (PDB: 6W9C, 3MJ5, 4R3D)
標的選定理由: PLproはコロナウイルスの複製と免疫回避に重要な役割を果たすため、抗ウイルス薬のターゲットとして有望
ライブラリ: Asinex protease inhibitor library (~7,000化合物)
スクリーニング: PyRx 0.8(6W9Cを使う)
分子ドッキング:Autodock-Vina 1.1.2
MD: GROMACS 2018
パラメーター: SwissParamを使って、トポロジーファイル生成、OPLS-AA/L force-field、TIP3P
評価法: RMSD, RMSF, ポテンシャルエネルギー, RoG, 水素結合解析, SASA, PCA, MM-PBSA, MM-GBSA
ADMET: SwissADME, PreADMET, pkCSM
- Virtual screening of knottin and defensin peptides perceives hits against the SARS CoV-2 RBD domain and hACE2 interaction
出版年: 2023年
IF: なし ChemRxiv
標的: SARS-CoV-2 RBD (PDB: 記載なし)
標的選定理由: SARS-CoV-2 RBDドメインとヒトACE2の相互作用を阻害し、ウイルスの宿主細胞への侵入を防ぐことを目的とした。
ライブラリ: CyBase(https://cybase.org.au/)、KNOTTIN(https://www.dsimb.inserm.fr/KNOTTIN/)
スクリーニングツール:
HADDOCK 2.4
Kd, ΔG予測:PRODIGY webserver(https://rascar.science.uu.nl/prodigy/)
MD: GROMACS 2020.4を使用した200nsのMDシミュレーション
評価法:
- RMSD, RMSF, RoG, SASA
- 水素結合解析
- アラニンスキャン
- MM/PBSA, per-residue energy decomposition, PCA, FEL analysis
- Identification of novel PAD4 inhibitors using pharmacophore-based virtual screening, molecular docking, and molecular dynamics simulations
出版年: 2024
IF: なし ChemRxiv
標的: PAD4 (PDB: 8GOD)
標的選定理由: PAD4の過剰発現は関節リウマチなどの自己免疫疾患に関連しており、PAD4を抑制することにより、炎症を抑える治療法として有望であるため。
ライブラリ: PubChem、ZINC、MolPort
スクリーニング: SwissADME→PharmIT https://pharmit.csb.pitt.edu/
分子ドッキング: MOE 2024 (有償)
MD: Desmond Schrödinger
パラメータ:TIP3P, OPLA -AA, 300K, 1 atm
評価法: RMSD, RMSF, Rg, contact analysis, MM-GBSA
最後に
いかがでしたでしょうか?これを機にインシリコ創薬研究を始めていただくきっかけになれれば、幸いです。
■著者情報
しずく
略歴:理科大薬→東大理 博士(理学)。大学院時代の専門はペプチド創薬。ペプチドのスクリーニング、合成、in vitroアッセイに従事。現在は外資系企業にてバイオインフォマティシャン。研究で使えるプログラミングを紹介するブログ「LabCode」でin silico創薬の記事を担当。生涯を通じて、新薬を一つでも多く開発していきたい。
■宣伝
LabCodeというブログを運営しています。
現役の博士課程学生や博士卒エンジニアが記事を執筆していますので、実際に研究で使えるプログラミングのノウハウが手に入ります。他にも技術書を販売しています。
本記事の著者も技術書を販売しています。
同じコミュニティで別著者ではありますが、RNA-seq、scRNA-seq、量子化学計算の技術書を販売しています。
Discussion