📖

re:Invent 2024: MerckとAWSが生物学的Foundation Modelで創薬革新

2024/01/01に公開

はじめに

海外の様々な講演を日本語記事に書き起こすことで、隠れた良質な情報をもっと身近なものに。そんなコンセプトで進める本企画で今回取り上げるプレゼンテーションはこちら!

📖 AWS re:Invent 2024 - How Merck improves drug design with biological foundation models (HLS215)

この動画では、AWSのHealth AI部門とMerckが、最先端の生物学的Foundation Modelを活用した創薬プロセスの改善について解説しています。AWS HealthOmicsを活用することで、AlphaFold2やRFDiffusionなどのProtein Language Modelを効率的にオーケストレーションし、タンパク質設計や抗体探索を大規模に実行できるようになった実例を紹介。特に、Merckが開発した世界初の抗体言語モデルや、AUTOBANと呼ばれるタンパク質設計プラットフォームなど、具体的な成果が示されています。AWS HealthOmicsによって、これまで1-2人しか実行できなかった抗体のヒト化作業を民主化し、数千もの設計を大規模に生成できるようになった点が印象的です。
https://www.youtube.com/watch?v=f5Bmf_axRNw
※ 動画から自動生成した記事になります。誤字脱字や誤った内容が記載される可能性がありますので、正確な情報は動画本編をご覧ください。
※ 画像をクリックすると、動画中の該当シーンに遷移します。

re:Invent 2024関連の書き起こし記事については、こちらのSpreadsheet に情報をまとめています。合わせてご確認ください!

本編

AWS HealthOmicsによる創薬革新:概要と背景

Thumbnail 0

皆様、お集まりいただきありがとうございます。本日はHLS 215にて、Merckが最先端の生物学的Foundation Modelを活用して創薬をどのように改善しているかについてお話しさせていただきます。私はAWSのHealth AI部門のPrincipal Product ManagerのAaron Friedmanです。後ほどお話しいただくMatt StudneyとDanny Bittonも同席しています。この話題は私にとって非常に思い入れのあるものです。私は博士課程で計算化学を専攻していましたが、2年前に私たちはAWS HealthOmicsをローンチしました。これは当初、オミクスとバイオインフォマティクスの作業に焦点を当てたサービスでしたが、その当時特に興味深かったのは、バイオFoundation Modelの急速な普及でした。これについては後ほど詳しくお話しします。

ここ数年で分かってきたのは、私たちがバイオインフォマティクスのコミュニティのために構築していたものが、そのコミュニティで反響を呼んだだけでなく、この分野で広く応用できるということでした。アーキテクチャについての話をよく耳にしますが、今朝Mattがコンピュート、ストレージ、データベース、そして推論といったアーキテクチャの構成要素について素晴らしい概要を説明してくれたと思います。これらは今後もなくなることはありません。しかし、結局のところ、アーキテクチャや私たちが構築しているものは、この分野でのビジネス上の課題や目標を解決するための手段なのです。

Thumbnail 100

重要なのは、私たちのお客様が解決しようとしている科学的な課題です。特定の疾患を標的とする新しい抗体の設計を支援したり、これらの変異から新しい作用機序を見出したり、予測されたタンパク質構造に対して大規模な化合物ライブラリをスクリーニングし、その情報を活用してリード最適化やヒット・トゥ・リードをより良く進めることなどです。創薬パイプライン全体を通じて、最終目標は新しい治療薬の発見と人類の健康の向上です。私にとって特に興奮するのは、このように使命感を持って、私たちや愛する人々の生活に具体的な影響を与える多くの企業や組織と協力できることです。これらの組織が行う仕事は、私たち全員に影響を与えるものなのです。

Thumbnail 190

創薬全般について言えば、製薬企業は長い歴史を持っています。ペニシリンやアスピリンなど、多くの薬剤が長年存在してきました。しかし、特に興奮させられるのは、ここ数十年で発見を補完する手段として計算科学が台頭してきたことです。これは過去10年ほどで2つのノーベル賞をもたらしました。1つ目は2013年のMartin Karplusらのチームによる物理ベースのシミュレーションに関するもの、そして最近では今年、AlphaFold2とWashington大学のDavid Bakerのグループによる全ての研究成果を含むタンパク質予測とタンパク質生成に関するものです。

これにより、何十年も行われてきたことを本当に補完できるようになりました。より多くのデータポイントをより速く取得し、研究室で生成したそれらのデータポイントを使って、その後の研究をより良く進めることができます。これによってボトルネックを打破し、研究室でより直列的なアプローチを取っていた場合には試すことができなかったかもしれない仮説をサンプリングしてテストすることが可能になります。この分野における計算科学の力は、今後も発展し続けると考えています。

AIとFoundation Modelが変える創薬プロセス

Thumbnail 260

Thumbnail 290

現在、私たちは生活のあらゆる面においてGenerative AIについて多く語っていますが、ライフサイエンス研究の分野でも素晴らしい影響を与えています。先ほどのスライドで触れた科学的な課題に立ち返ると、Drug Design、Biomarker Discovery、Target Assessmentなどの分野で、これらの課題への取り組み方を改善できるAIベースのアプリケーションが存在します。 そして、これらのグループの中には、RNAやDNAベースのアルゴリズムからProtein Modelまで、さらには免疫特性の評価や新しい抗体の設計を支援する方法など、様々なタイプのアルゴリズムやモデルが登場しています。

Thumbnail 330

臨床におけるDigital Twinsのような概念を超えて、Drug Discoveryを加速するために、スペクトル全体にわたって多くの異なるタイプのモデルと素晴らしい取り組みが行われています。そして詳しく見てみると、このスライドは既に古くなっています。なぜなら毎週のように新しいモデルがリリースされているからです。この1ヶ月だけでもBolts OneやHi-One Rが登場し、さらに多くの新しいモデルが次々と現れています。

Protein DesignとDiscoveryの分野を見ると、すでに包括的なモデルセットが存在します。組織としては、これらのモデルをテストし、スケールで実行し、その系統を追跡できるようにしたいと考えています。多くのモデルとバージョンがある中で、以前行ったことと、それらがどのように関連しているかを把握しながら、モデルを入れ替えられるようにしたいと考えています。これにより、どの科学的なレシピが最も価値を生み出しているかを評価できます。この業界が進歩を続ける中で、オーケストレーションは非常に興味深い課題となっています。

Thumbnail 390

本日、Mattが4番目のビルディングブロックとしての Inferenceについて話しました。これは非常に重要です。現在、私たちは多くのモデルトレーニングを行っており、これらのモデルは進化し続けています。また、Design-Build-Test-Learnサイクルの一部として、Fine-tuningも多く行っています。しかし、実際にスケールで必要なのは、多くの予測を行い、その情報を使って研究室で次に取るべきステップ、つまり最適なアクションを判断することです。

Inferenceには2つのタイプがあります。1つはInteractive Inferenceで、SageMakerノートブックやエンドポイントを使用して、異なるパラメータでモデルをテストし、最適化を試みるような場合です。素早いフィードバックを得ながら反復的に作業を進めることができます。そして準備ができたら、Batch Approachに移ります。これは、DifDockで100万の化合物をスクリーニングしたり、ターゲット抗原に結合する50万の新しい抗体やNanobody構造を生成したりする場合に使用します。これがBatch Inferenceの出番で、複数のモデルと複数のステップをスケールで実行します。

Thumbnail 500

ここで本当に重要なのは効率性です。エンドポイントを常時稼働させることもできますが、それではリソースの使用率が非常に低くなってしまい、実際のコストパフォーマンスが大幅に低下してしまいます。従来のハイパフォーマンスコンピューティングのアプローチに近いバッチモードで実行すると、リソースの使用率を大幅に向上させ、素早くスケールアップでき、さらに重要なことに、スケールダウンも容易に行えます。

お客様との対話で分かることは、これらのツールを使って新しいデータポイントを提供したいが、どのように始めて、どうスケールさせるかを知る必要があるということです。私たちはこれを4つの主要な領域にまとめました:素早く始める方法、自社グループや独自ツールで実証された科学的レシピ、そして活発なオープンソースコミュニティの活用です。例えば、RFDiffusionで異なる抗体スキャフォールドを使用したり、AlphaFold2の多量体予測に物性予測や物理ベースの計算を追加したりすることもできます。

これらすべてを理解した後、スケールアップしてデータサイロを横断し、コラボレーターと状態を共有したいと考えています。今日の一般的なやり方を考えると、多くのアーキテクチャが必要になります。以前Solutions Architectだった経験から言うと、エンドポイントを構築し、すべての権限を管理し、独自のコードとオーケストレーターを書き、これらすべての異なる作業を行う必要がありました。AWSで非常に堅牢なソリューションを構築できますが、それには組織の多くの時間が必要でした。AWSでは、組織は実際のサイエンス、つまり本来のビジネスの差別化につながらないことに多くの時間を費やしていました。

Thumbnail 620

これが、私たちが約3年前にAWS HealthOmicsを構築した理由です。 これは実際、このトーク全体で唯一のアーキテクチャスライドです。これは意図的なものです。なぜなら、私たちはお客様やエンドユーザーがこれらの多くの事柄について心配する必要がないようにしたいからです。私たちが目指しているのは、1回のAPI呼び出しで効果的に推論を行うことです。

歴史的に必要だった作業を考えてみると、モデルをコンテナ化してクラウドにアップロードし、その後オーケストレーションスクリプトを書く必要がありました。バイオインフォマティクスや一般的なライフサイエンスコミュニティが注目しているNextflowのようなドメイン固有言語を使用するか、ML Flowのようなものを使用するか、あるいはStep Functionsを使用するかもしれません。ツールやコンテナがあり、それらを実行する必要があります。共有ファイルシステム、オーケストレーション、障害、リトライなど、これらすべてを管理する必要がありました。結局のところ、あなたがしたいのは、「これが私のツールで、これが私のデータで、これが実行したいレシピです。どうか実行してください」と言うことだけなのです。

Thumbnail 690

私たちが目指しているのは、これをますますシンプルな単一のAPI呼び出しにまとめることです。 この点について、私たちは顧客と2つのアプローチで取り組んでいます。1つ目は、顧客の大多数が採用していて、これからMarkが説明する方法ですが、独自の科学的レシピを構築・定義できるプライベートワークフローです。一方で、すぐに始めたい方向けのアプローチもあります。AlphaFoldをデフォルト設定で使用する場合は、配列を入力するだけで、しばらくして結果が出力されます。他に何もする必要はありません。ただし、カスタマイズしたい場合は、多くの顧客がプライベートワークフローの領域に進むことになります。

AWS HealthOmicsの実践:ワークフローとコラボレーション

Thumbnail 730

Thumbnail 760

先ほどの話に戻りますが、AWS HealthOmicsは、高性能コンピューティングと大規模推論を組み合わせて、さまざまなタイプのProtein Language Model、より広範なFoundation Model、そして一般的なAIモデルをオーケストレーションする特定の領域で、顧客から非常に高い評価を得ていることがわかりました。まずはこれら4つの要素を見ていきましょう。最初は実証済みのレシピについてです。すぐに実行できるワークフローについて先ほど触れました。 私たちのチームは、オープンソースのツールとリポジトリに多大な投資を行ってきました。AWS Samplesにある Drug Discovery Workflowsリポジトリには、AlphaFoldやAmplify、RFDiffusion、Protein MPNNなどが含まれています。非常に簡単に始められ、実際にレシピがどのように構成されているかを確認し、何をするのかを正確に把握できます。これには、AWSアカウントにすぐにデプロイできるワンクリックデプロイスクリプトが用意されています。

Thumbnail 800

レシピを使い始めて、それを自分のニーズに合わせて調整したい場合は、コードに入っていきます。これはより低レベルな側面ですが、ここでインフラを変更する必要はありません。これは文字通り、この場合Nextflowでビジネスロジックを定義するだけです。左側にステップのセット、右側にデフォルトの設定ファイルがあるとします。ランダムシードを変更したい場合や、AlphaFoldの予測にRelaxationを追加したい場合もあるでしょう。これらはすべて非常に簡単に行えます。コードを変更して再度プッシュすれば、それがHealthOmicsのワークフローとして登録され、すぐに実行できます。

Thumbnail 850

次にやりたいことは、このデータを共同研究者と共有することかもしれません。これは時間とともに、特に組織間の連携において、また組織内でも重要性が増していることに気づきました。製薬会社で何かを開発した場合、他の人が同じものを開発するのは単なる資源の無駄です。カタログを作成して、それを他の人と共有できるようにしたいものです。私たちにはワークフローの共有や協力を可能にする機能があります。組織間で共同研究を行っていて、例えばテクノロジー系のスタートアップが開発した科学的レシピを自社のデータで実行したいが、そのデータは共有したくない場合、それが可能です。なぜなら、彼らは直接ワークフローを共有でき、あなたは自分のアカウントでデータを実行できるため、共同研究パートナーがそれを見る必要は全くないからです。パートナーが誰であれ、データを見る必要はありません。

Thumbnail 930

このような安全な共同研究、つまり信頼できる仲介者として機能することは、協力関係を促進し、必要な方法で科学研究を行うことを可能にする上で非常に強力な手段となり得ます。これは非常に簡単で、 このグループやこのAWSアカウントと共有したいと指定するだけです。相手が承認すれば、アクセスが許可されます。これらを取り消すこともでき、完全にコントロールできますが、コラボレーションは非常に重要です。

Thumbnail 950

これらすべてを完了したら、スケールアップする必要があります。バッチ推論に話を戻して、実際にどのように大規模な分析を実行するかについて説明すると、私が「Serverless Science」と呼んでいるコンセプトがあります。ゼロまでスケールダウンし、必要に応じてスケールアップできるServerlessは重要な特徴の一つとして多く語られています。ここでも同じことができます。数千の計算予測を同時に実行でき、使用していない時は料金が発生しません。これは、RFDiffusionからProtein MPNN、そしてAlphaFold2へと続くタンパク質工学と設計のような、より複雑な科学的レシピのオーケストレーションを考え始めると、非常に強力な機能となります。

私が特に興味深いと感じているのは、これらすべてを自分で構築する必要がないということです。マネージドサービスとして利用でき、完全にAPI駆動型なのです。ここで、Merckにバトンタッチしたいと思います。彼らはアーキテクチャではなく、ビジネスの成果と科学的成果について話してくれます。これこそが、この全ての取り組みの中で本当にエキサイティングな部分だと思います。それでは、Merck R&D ITのVPであるMatt Studneyに引き継ぎたいと思います。

Merckの事例:タンパク質設計とAI活用の最前線

ありがとう、Aaron。皆さん、こんにちは。Matt Studneyです。私はMerck Research Laboratoriesの情報技術部門を率いています。創薬、開発科学、臨床研究、ファーマコビジランス、規制、ビジネス開発、メディカルアフェアーズにおける科学者たちのためのすべての機能を提供する責任を担っています。私たちのチームは、3つのバリューチーム、20のプロダクトライン、70のプロダクト、そして1000以上のアプリケーションに分かれた、プロダクトおよびケイパビリティモデルとして構成されています。

私たちはAmazon Web Servicesと10年以上にわたってパートナーシップを結んできました。パートナーシップを開始した当初、私たちはインフラストラクチャを管理するのではなく、医薬品を開発・発見する製薬会社でありたいという現実を追求していました。それは素晴らしいパートナーシップによる重要なインフラ戦略でした。時間とともに、より意味のある機能とパートナーシップへとシフトしていきました。研究部門だけでも1000のアプリケーションのうち400以上をリファクタリングし、リフト&シフトを行ってきました。オンプレミスサーバーからAWSへ、高性能コンピューティング機能の50%以上を移行したところです。

これは、私たちのデータも一緒に移行されているということを意味します。当社は100年以上の歴史を持つ企業なので、今やすべてのデータがAWS上にあります。ほぼ無制限のコンピュート能力と高性能コンピューティング機能を持ち、そしてAWS HealthOmicsプラットフォームのような機能も利用できるようになりました。これまでにない洞察を引き出すために、彼らと協力して取り組んでいます。私たちは、ターゲットの選定方法、物質の構成の構築方法、そして何十億ものデータセットを使用してできる限り安全性を確保する方法を改善するための機能に大きく投資しています。私のチームのDanny Bittonは、Aaronとそのチームと密接に協力して、これらのワークフローを実現してきました。データ生成から科学者のユーザー体験まで、シームレスに科学的成果を導き出せるようにしたいと考えています。

この3年間で世界が変化する中、AWSはインフラストラクチャパートナーから、これまでにない発想やコンセプト、成果、洞察を引き出すケイパビリティ構築パートナーへと進化してきました。これから登壇するDannyが、非常に効果的で成功を収めているワークフローの一部をご紹介します。ありがとうございます、Matt。皆様、こんにちは。このセッションでは、科学的成果と、AWS HealthOmicsサービスが実際にどのようにタンパク質医薬品の開発を加速させたかについてお話しさせていただきます。

Thumbnail 1210

Thumbnail 1230

まず、タンパク質設計の概要と、設計・最適化におけるAIと機械学習の活用方法、そして私たちがAWS HealthOmicsチームとパートナーシップを組んでこれらのワークフローを推進した方法についてお話しします。 大まかに言えば、HealthOmicsチームは、すぐに実行できるワークフローやカスタマイズされたワークフローの合理化と民主化を可能にするだけでなく、計算能力のスケーリングと計算時間の短縮、そして推論の規模拡大を実現し、これまでできなかった計算を可能にしてくれます。

Thumbnail 1270

Thumbnail 1290

ご存知の通り、私たちの体は主に水とタンパク質でできています。体内には約35兆個の細胞があり、それぞれの細胞がタンパク質工場として機能しています。 タンパク質は至る所に存在し、重要な細胞機能を担い、細胞内のすべての重要なプロセスを仲介しています。タンパク質は組織を構築する構造成分であり、ホルモンや輸送・シグナル分子として、また細菌やウイルスから私たちを守る免疫システムの分子としても機能します。さらに、体内のすべての反応を触媒する酵素でもあります。したがって、タンパク質の配列、構造、または機能に問題が生じると、それが病気につながる可能性が高いのです。

Thumbnail 1370

製薬会社である私たちを含め、すべての製薬会社が行っているのは、これらのタンパク質をターゲットとする薬剤の設計です。外来タンパク質に関しては、それらをワクチンとして使用して私たちの免疫システムを準備し、将来の感染から保護することができます。これらのタンパク質に結合する低分子を設計することもできますし、タンパク質をターゲットとするタンパク質を設計することもできます。つまり、タンパク質は主要な薬剤やワクチンのターゲットであり、また薬剤としても使用できるということです。 ここでいくつか例を挙げましょう:抗体であるPembrolizumabは、免疫細胞上に存在する受容体に結合するタンパク質です。これにより、免疫システムとがん細胞との結合を阻害し、基本的にがん細胞を免疫システムによる排除にさらすことで治療効果を得ています。同様に、コレステロール代謝に関与するPCSK9酵素があり、これに対して環状ペプチド阻害剤(これもタンパク質です)を設計して、コレステロール受容体との結合を阻害し、血中コレステロール値を低下させることができます。HPVのようなウイルスの場合、そのコートタンパク質をワクチンとして使用することができ、ご覧のように、ワクチン接種後にはウイルス全体が抗体で覆われることになります。

Thumbnail 1450

Thumbnail 1470

Thumbnail 1490

先ほど、酵素は体内のすべての反応を触媒すると申し上げました。 実際、酵素は化学工場なのです。私たちはこれを利用して、酵素を再設計し、異なる温度や異なるpHなどの産業条件下で機能させ、医薬品の製造に活用することができます。 このようなタンパク質の多様な機能を考えると、なぜ設計と最適化が必要なのかという疑問が生じます。 その答えは非常に単純です。基本的に、天然のタンパク質の特性は、安定性、溶解性、製造のしやすさといった観点で、私たちが医薬品に求める特性とは大きく異なるのです。

自然界には多くのタンパク質が存在しますが、私たちは新しい望ましい機能や特性を持つ新規タンパク質を作り出したいと考えています。ラボでこれを行うとすれば、手間がかかり高コストになってしまいます。そこで私たちが目指しているのは、コンピュータ上で数千もの設計を生成できる計算パイプラインを作り、実際にラボで検証する必要のある設計数を大幅に減らすことです。

Thumbnail 1540

Thumbnail 1550

近年、AIと機械学習の手法が劇的に進歩し、この分野を完全に革新しました。 特に注目すべきは、Google DeepMindのAlphaFoldや、David Baker研究室のRosettaFold、MetaグループのESM foldといったDeep Learning手法です。ただし、これらはすべて1つのことしかできません - それは、タンパク質の配列から直接3次元構造を予測することです。Baker研究室はさらに、3次元構造から配列を生成できるタンパク質言語モデルも開発しました。また、OpenAIのDALL-Eがテキストプロンプトから直接AIイメージを生成できるのと同様に、自然界に存在しない全く新しい設計を生成できるDiffusionモデルも開発しました。

Thumbnail 1630

Thumbnail 1640

Thumbnail 1660

私たちはAaron氏のチームと協力して、これらの手法をすべて組み合わせ、 ボタン1つで数千もの設計を大規模に生成できるGenerative AIパイプラインを開発しました。 研究者は関心のある構造や予測を入力し、保持したいタンパク質の内容や領域を指定することができます。そしてその周りに新しい設計を作り出すことができます。これは新しいワクチン、酵素、ペプチド、さらには治療や診断目的のタンパク質バインダーの作成にも活用できます。

Thumbnail 1690

Thumbnail 1720

タンパク質言語モデルは、大規模言語モデルと非常によく似ています。実際の違いは入力だけです。言語モデルでは、大量のテキストコーパスを入力として、文脈から単語を予測しようとします。一方、タンパク質言語モデルでは、大量の配列コーパスを入力として、文脈から関連するアミノ酸を予測しようとします。 Generative AIに関して言えば、チャットを使用して新しいテキストコンテンツを生成できるように、タンパク質の分野では、SalesforceのProt2などのGPTライクなタンパク質言語モデルを使用できます。これを微調整して新しい設計を生成することができます。その仕組みとしては、まず関心のある配列をトークン化するデータ準備を行い、次のトークンを予測するようにモデルを微調整します。ユーザーはそのトークンをプロンプトとして使用して、新しい設計を生成できます。

Thumbnail 1780

タンパク質言語モデルは抗体探索にも活用できます。従来の抗体探索アプローチでは、標的タンパク質をマウスやウサギに注入し、多くの結合アッセイや実験室での実験を行って、最終的に標的に結合するマウス抗体を得ます。しかし、これはまだ医薬品ではありません - ヒト化する必要があります。

Thumbnail 1870

現在の抗体のヒト化の方法は、抗体の必要な部分を取り出し、基本的にヒトの骨格に切り貼りするというものです。この方法には2つの問題があります。1つは、当社でこの作業ができるのはわずか1、2人しかいないということです。もう1つは、1つの薬剤候補を得るまでに多くの実験が必要だということです。この課題に対応するため、私たちは世界初となる抗体言語モデルを用いて、抗体エンジニアリングの判断をガイドするプラットフォームを開発し、抗体のヒト化を大規模に行えるようにしました。このモデルは、他の回帰モデルと共に公開しており、実験室での作業前に多くのデザインを大規模に行うことができます。

Thumbnail 1890

この方法では、4,000万のヒト配列を含むパブリックデータベースを使用しています。ユーザーは単純に1つまたは複数の抗体配列(マウスやウサギなどの非ヒト由来)を入力するだけで、ヒト化されたリード候補を生成できます。以前は社内の1、2人しか実行できなかったこの作業を、非常に直感的なユーザーインターフェースを通じて誰でも行えるようになり、アプローチを民主化することができました。

Thumbnail 1910

Thumbnail 1950

ターゲットデザインや酵素の多様化に関しては、AUTOBANと呼ばれる新しいプラットフォームを作成しました。これはタンパク質の共同アノテーションとデザインを可能にするもので、タンパク質用のCADツールのようなものです。このプラットフォームは、タンパク質言語モデルやAlphaFoldなど、社内外の複数のソースを統合しています。ユースケースの1つは、そのままでは発現できないターゲットをデザインする必要がある場合です。後でタンパク質を精製できるように、様々なタグを追加してそれらを結合します。精製後、中央のリンク(オレンジ色で表示)を切断する必要がありますが、このプロセスが効率的でないと、タンパク質の収率が低くなり、アッセイに必要なタンパク質が十分に得られなくなる可能性があります。

Thumbnail 2010

一つのアプローチとして、多くの配列をデザインし、AlphaFoldの予測を手動で確認して、最も安定したリンクを見つけることができます。ここで私たちはAWS HealthOmicsチームと協力して分子動力学シミュレーションを行いました。分子動力学は、時間の経過とともに分子中の原子がどのように相互作用するかをシミュレートする仮想実験です。マイクロ秒単位で多くのシミュレーションを実行し、タンパク質と薬剤の相互作用のモデル化、先ほど示したリンクの最適化、あるいは新しいCryptic Pocketの発見などに活用できます。これは非常に計算コストの高い作業で、AWS HealthOmicsなしでは実現できませんでした。

Thumbnail 2080

Thumbnail 2090

この方法では、異なるリンカーの安定性を評価し、実験から最高の収率のタンパク質を得るために最適なものを選択することができます。冒頭で触れたBiocatalysisについて、私たちは酵素を再設計して産業条件下でより安定的に機能するようにすることができ、Biocatalysisはグリーンケミストリーを実現する優れた方法となっています。

このアプローチは環境にやさしく、医薬品製造の工程数を減らすことで製造コストも削減できます。Biocatalysisの基本原理はとてもシンプルです。酵素配列から始めて、複数の変異を導入します。バクテリアで発現させる酵素のライブラリを作成し、その酵素を作って活性をテストします。変異の選択を改善するためにMachine Learningモデルを導入できますが、基質と酵素の相互作用をモデル化するためにMolecular Dynamicsも使用できます。

Thumbnail 2170

Thumbnail 2190

Protein Language ModelやMultiple Sequence Alignmentからの豊富な情報、そして酵素活性を向上させる可能性の高い変異を特定できるRegression Modelを活用して、自動化された方法でこれを行うことができます。 最後のユースケース例として、Cryptic Pocketsの特定を目指しています。すべてのタンパク質が薬剤の標的になるわけではありません - これらのポケットがないため、薬剤設計ができないタンパク質があるのです。Molecular Dynamicsを行うと、溶液中でのタンパク質の動きをモデル化でき、これらの一時的なポケットを見つけて、それらに対する薬剤を設計することができます。計算コストが非常に高いため、現在できることは、Molecular Dynamicsのトラジェクトリを使用してこれらのポケットを予測するMachine Learningモデルを訓練することです。

まとめと今後の展望:re:Inventセッションの案内

Thumbnail 2260

以上で、パネルディスカッションに移りたいと思います。ありがとうございました。ありがとう、Danny。Matt、Bio MSのような手法や、より従来型の MDなどがこの分野で応用されているのを見るのは本当に素晴らしいですね。15年前に初期のMD研究に携わっていたことを思い出します。シミュレーションを実行し、そのデータを効果的な合成データや事前計算データとして使用して新しいモデルを生成し、新しい予測を行い、それらをスケールアップできるようになっている - すべてが組み合わさってきているのを見るのは本当に素晴らしいことです。

re:Inventは2日目に入ったばかりで、まだまだたくさんのセッションが控えています。そのいくつかをスライドに掲載しました。本日、HealthOmicsについてより詳しく知りたい方は、私の同僚のMargaret McDowellがNateraと共に、Nateraが診断検査をHealthOmicsでどのようにスケーリングしているかについて素晴らしい講演を行います。木曜日のDan ShearinによるInnovationトークもぜひご覧いただきたいのですが、Foundation Modelsに興味がある方も、より一般的なヘルスケアおよびライフサイエンス向けAWSに興味がある方も、多様な講演やワークショップがあります。本日開催されるものがたくさんありますので、このQRコードをスキャンしてください。参加者ガイドにすぐにリンクできるよう、ここに表示しておきます。

以上で終わりとさせていただきます。明らかに、これから3日間でたくさんの内容がありますが、皆様のご参加を心より感謝いたします。そして、皆様にとって有意義なものとなることを願っています。私の発表終了後、質問がある方は横に移動してください。また、ランチタイムですので、昼食を取られたり、次のセッションに向かわれたりしても構いません。ランチタイムの時間帯であることは承知しています。繰り返しになりますが、ご参加いただき、ありがとうございました。私自身も、これから開催される素晴らしい講演や、素晴らしい顧客事例を聞くのを楽しみにしています。皆様にとって素晴らしいre:Inventとなりますように。


※ こちらの記事は Amazon Bedrock を利用することで全て自動で作成しています。
※ 生成AI記事によるインターネット汚染の懸念を踏まえ、本記事ではセッション動画を情報量をほぼ変化させずに文字と画像に変換することで、できるだけオリジナルコンテンツそのものの価値を維持しつつ、多言語でのAccessibilityやGooglabilityを高められればと考えています。

Discussion