📑

EvoBind2 : タンパク質配列情報のみからの直鎖・環状ペプチド binderの設計に関する論文の日本語解説

2025/02/09に公開

Design of linear and cyclic peptide binders of different lengths from protein sequence information

本記事は、以下の論文の内容をレビュー・解説するものです。
本記事は、筆者の個人的な研究・技術への関心に基づく解説であり、 所属組織や事業活動とは無関係です。
本記事は、一研究者として学術論文の内容を理解し共有したいという 個人的な動機に基づくものです。

Citation

Design of linear and cyclic peptide binders of different lengths from protein sequence information

Qiuzhen Li, Efstathios Nikolaos Vlachos, Patrick Bryant

bioRxiv 2024.06.20.599739; doi: https://doi.org/10.1101/2024.06.20.599739

Summary

タンパク質構造予測技術は近年大きな進歩を遂げていますが、新規機能の設計という課題は依然として残されています。特に、タンパク質間相互作用の設計は重要な課題です。従来の手法では標的タンパク質の構造情報や結合部位の知識が必要でしたが、本研究で開発されたEvoBind2は、タンパク質の配列情報のみを用いて高親和性のペプチドbinderを設計することを可能にしました。

この手法の特徴は、AlphaFold2とAlphaFold-Multimerを組み合わせた二段階評価システムを用いることで、adversarialな設計を効果的に除外できる点です。また、環状ペプチドの設計も可能で、これは医薬品開発において特に重要な意味を持ちます。

技術的詳細

EvoBind2の革新的な点は、AlphaFold2[1]とAlphaFold-Multimer[2]を組み合わせた二段階の評価システムです。最初にAlphaFold2を使用してペプチド配列を最適化し、次にAlphaFold-Multimerを用いてadversarialな設計を除外します。具体的には、2つの損失関数を組み合わせた最適化プロセスです。第1の損失関数は、ペプチドの予測信頼度であるpredicted local distance difference test(pLDDT)と標的タンパク質との界面距離に基づいており、第2の損失関数は、異なる構造予測モデル間の一致度を評価します。この組み合わせにより、従来のシステムと比較して約3倍の成功率を達成しています。また、cyclic offsetという手法[3]を導入し、環状ペプチドの設計を可能にした点です。

Figure 1
Figure 1より引用. CC BY 4.0

結果

研究の主要な成果として、直鎖ペプチドでは46%(13個中6個)、環状ペプチドでは75%(4個中3個)という高い成功率を達成しました。特に、最も強力な環状ペプチドは0.26 nMという非常に強い結合親和性を示し、これは既知の天然ペプチドの137倍という驚異的な値です。

Figure 3
Figure 3より引用. CC BY 4.0

予測構造と実験結果の詳細な解析により、多様な結合モードが確認され、これはシステムが効果的に設計空間を探索できていることを示しています。また、pLDDT、predicted aligned error (PAE)などと実際の結合親和性との間に明確な相関が見られないこともわかりました。

Figure 4
Figure 4より引用. CC BY 4.0

クリティカルな分析

本研究の最大の強みは、配列情報のみから高親和性のペプチドbinderを設計できる点です。これは、新規標的に対する迅速な薬剤開発を可能にするアプローチと考えられます。

一方で、予測された構造と実際の結合親和性との間に明確な相関関係が見られない点は、手法の限界を示しています。また、一部のペプチドは合成が困難であるという実用面での課題も存在します。

これらの知見は、今後の研究における重要な方向性を示唆しています。特に、結合自由エネルギーの予測や、動的な相互作用の考慮など、新たな要素を取り入れることで、さらなる改善が期待できます。また、合成容易性を考慮した設計制約の導入なども、実用化に向けた重要な課題となると考えられます。

手法の詳細な解説

EvoBind2の最適化プロセスは、以下の数式で表される損失関数を最小化することを目指します。

Loss_1 = (peptide\ plDDT)^{-1} \cdot \frac{1}{n}\sum_{j=1}^n d_j

ここでpeptide plDDTはペプチドの予測信頼度スコア、d(j)はペプチドと標的タンパク質間の最短距離を表します。この最適化は1000回の反復で行われ、各反復では1つのアミノ酸をランダムに変異させます。

初期配列の生成には、Gumbel分布に基づく重み付けを使用し、20種類のアミノ酸それぞれに0-1の範囲で重みを割り当てます。標的タンパク質に関しては、Uniclust30データベースに対してHHblitsを用いて多重配列アラインメント(MSA)を生成します(E-value閾値0.001、2回の反復検索)。

Figure 5
Figure 5より引用. CC BY 4.0

第2の損失関数は以下のように定義されます:

Loss_2 = (peptide \ plDDT)^{-1} \cdot (\frac{1}{m}\sum_{i=1}^m d_i + \frac{1}{n}\sum_{j=1}^n d_j) \cdot \frac{1}{2} \cdot \Delta COM

この関数では、AlphaFold-Multimerを用いた予測構造と、EvoBind2による予測構造の一致度を評価します。特に重要なのは、\Delta COMという項で、これは二つの予測構造間のC<sub>α</sub>の重心距離を表します。

Figure 6
Figure 6より引用. CC BY 4.0

EvoBind2の実験プロトコルについて、より詳細に解説していきます。まず、標的タンパク質配列はUniclust30データベースに対してHHblitsを用いて検索され、多重配列アラインメント(MSA)が生成されます。この際、E-value閾値は0.001に設定され、2回の反復検索が行われます。

初期ペプチド配列は、Gumbel分布に基づくランダムな重みづけにより生成されます。各アミノ酸位置で20種類のアミノ酸に対する重みが0-1の範囲で割り当てられ、最大値を持つアミノ酸が選択されます。

構造予測においては、AlphaFold2のmodel_1を使用し、8回のリサイクル(recycles)と1つのアンサンブルで予測を行います。各最適化ラウンドでは1000回の反復が実施され、これを異なる初期配列から5回繰り返すことで、十分な探索が確保されています。

構造予測の詳細な評価

予測構造の評価において、pLDDTスコアとPAEの両方が使用されました。興味深いことに、これらの予測信頼度指標と実際の結合親和性との間に強い相関は見られませんでした。例えば、高いpLDDTスコア(>90)を示すペプチドでも、実際の結合が確認できないケースが存在しました。

具体的な例として、あるadversarialな設計では、EvoBind2のロススコアが0.04という良好な値を示したにもかかわらず、実験での結合が確認できませんでした。一方、AFMロスが高い(>1)にもかかわらず、実際には強い結合を示すケースも観察されています。

これらの詳細な結果は、構造予測に基づくペプチド設計の複雑さを示すとともに、現在の手法の限界と改善の余地を明確に示しています。特に、予測信頼度指標と実際の結合能との関係性の理解は、今後の研究における重要な課題となっています。

実験結果の詳細

直鎖ペプチドの結合親和性は7.93 μMから19 nMの範囲に分布し、環状ペプチドでは5.72 μMから0.26 nMの範囲でした。特に興味深いのは、予測された構造の多様性です。成功したペプチドは異なる結合モードを示し、これは設計空間の効果的な探索を示唆しています。また、in silicoメトリクス(plDDT、PAEなど)と実際の結合親和性との間に明確な相関が見られなかったことは、構造予測の限界と今後の改善の必要性を示しています。

Figure 2
Figure 2より引用. CC BY 4.0

直鎖ペプチドの結果詳細

直鎖ペプチドの設計では、各長さ(8-20残基)について以下のような詳細な結果が得られました。

  • 最強の結合親和性:16残基のペプチド(配列:RDIREISSRGAENING)が19 nMを示しました
  • 物理化学的特性:成功したペプチドは平均して37.5%の荷電残基と18.8%の疎水性残基を含んでいました
  • 長さの影響:中程度の長さ(12-16残基)のペプチドが最も高い成功率を示す傾向が見られました

Figure 7
Figure 7より引用. CC BY 4.0

環状ペプチドの結果詳細

環状ペプチドでは、特に14残基の配列(TWMDADGSDSEGNN)が0.26 nMという驚異的な親和性を示しました。この配列は以下の特徴を持っています:

  • 荷電残基:29%
  • 疎水性残基:14%
  • 予測構造の信頼度(pLDDT):96.51

溶解性と安定性の評価

すべての設計されたペプチドに対して、以下の基準で溶解性フィルターが適用されました。

  • 荷電残基(D, K, R, H, E):25%以上
  • 疎水性残基(W, L, I, F, M, V, Y):25%未満

これらの基準を満たすペプチドは、実際のSPR測定バッファー中でも良好な溶解性を示しました。

このような詳細な実験データと解析結果は、EvoBind2が実用的なペプチドbinder設計ツールとして機能することを示すとともに、さらなる改善の余地があると考えられます。特に、予測信頼度と実際の結合能の関係性の理解は、今後の研究における重要な課題です。

個人的な洞察

この研究が示す最も重要な意義は、タンパク質の配列情報のみから高親和性ペプチドを設計できる可能性を実証したことです。これは創薬プロセスに大きな変革をもたらす可能性があります。

特に注目すべきは、環状ペプチドの設計における成功です。環状ペプチドは、以下の理由から創薬において極めて重要です。

  • 直鎖ペプチドと比較して生体内での安定性が高い
  • 細胞膜透過性が向上する可能性がある
  • プロテアーゼによる分解に対する抵抗性が高い

EvoBind2は、二つの異なる構造予測モデル(AlphaFold2とAlphaFold-Multimer)を組み合わせることで、より信頼性の高い予測を実現している点です。この「クロスバリデーション」的なアプローチは、他のAI創薬研究にも応用できる重要な概念です。個人的には環状ペプチドの立体構造予測も可能なRoseTTAFold2[4]などの全く別のタンパク質立体構造予測モデルによるバリデーションも入るとより良いのではないかと考えました。

研究結果は非常に有望ですが、実用化に向けては以下のような課題と可能性があると考えられます。

  1. 現在の手法は単一のタンパク質に対するbinder設計に成功していますが、これを大規模なスクリーニングに拡張できる可能性があります。複数の標的に対する並行設計や、特定の特性(溶解度や膜透過性など)を最適化するための拡張が考えられます。
  2. 予測精度の向上 構造予測の信頼度指標と実際の結合親和性との間に明確な相関が見られない点は、今後改善の余地があります。これは、結合自由エネルギーの予測や、動的な相互作用の考慮など、新たな要素を取り入れることで改善できる可能性があります。
  3. sampleあたりの計算コストが比較的高いため。計算コストの最適化や、合成容易性を考慮した設計など、実践的な改良が必要と考えられます。

参考文献

脚注
  1. Jumper, J. et al. Highly Accurate Protein Structure Prediction with AlphaFold. Nature 596, 583–89 (2021). https://doi.org/10.1038/s41586-021-03819-2. ↩︎

  2. Evans, R. et al. Protein complex prediction with AlphaFold-Multimer. bioRxiv (2021) https://doi.org/10.1101/2021.10.04.463034. ↩︎

  3. Rettie, S. A. et al. Cyclic peptide structure prediction and design using AlphaFold. bioRxiv (2023) https://doi.org/10.1101/2023.02.25.529956. ↩︎

  4. Baek, M. et al. Efficient and accurate prediction of protein structure using RoseTTAFold2. bioRxiv (2023) https://doi.org/10.1101/2023.05.24.542179. ↩︎

Discussion