Zenn
💊

このブログについて

2024/08/29に公開

はじめに

このブログ 「t_rakkoの創薬DX研修」 は、新規に創薬DXに関わることになった人に向けて、何か役に立つことを発信したいと考えて立ち上げたものです。

誰しも一番初めは、 創薬という目的のために、ITを手段として用いたいと考えているが、その具体的な道筋が見えない 状態だと思います。自分も情報系出身ですが、創薬の知識も、またITの知識すらも足りない状態から始まりました。

複数分野をまたがる領域では、得られる情報がとても少なくなります。「創薬」の参考書、「IT」の参考書は巷に多くありますが、 本ブログでは、「創薬」「IT」の両方が必要な人に向けて、その両分野を統合した新しい情報源を提供したい と考えています。少しでもお役に立てば幸いです。

執筆者:t_rakko

  • 機械・情報系出身です。大学では生物と機械のハイブリッドを研究する研究室に所属していて、卒業後はシステムエンジニアとして勤務していましたが、ご縁があり製薬企業のラボオートメーション部門に採用されました。
  • t_rakkoは、私が技術コンペなどでよく使うIDです。

以下、本ブログで取り上げるテーマについて、概説と代表的な記事を列挙します。

創薬DXに直接的にかかわる内容

インシリコ創薬

タンパク質と化合物の相互作用をコンピュータ上で予測し、新薬になる可能性のある化合物を高速に提案する技術です。従来は人間の経験と勘で探索していた化合物を、より高速に調査するのが目的です。2024年にノーベル化学賞を受賞したAlphaFoldのような深層学習系の手法が有名ですが、実験でのフィードバックと組み合わせやすいベイズ最適化による手法もあります。

ラボオートメーション

主にロボットを活用し、研究者が行う実験を自動化する取り組みです。人の手による実験の揺らぎを減らして実験の再現性を高めること、研究者を培地交換などの単純作業から解放することなど、様々な観点から期待されています。ただし、「ラボオートメーション」という言葉の範囲が広すぎるため、しばしばインシリコ創薬まで含まれていたり、あるいはただのRPAがこう呼ばれていることもあります。

バイオリポジトリ

生命科学実験に必要な試料やデータを一元的に収集・管理・配布するための施設やシステム全体を指す言葉です。生命科学論文はしばしば再現性に問題があると言われていますが、その原因の多くは前処理の工程で起こるそうです(*参考)。そのため、信頼性のある試料とデータを提供することが、そのまま創薬研究の進展にもつながる重要な技術です。

  • 【書籍紹介】ヒト生体試料・データ取扱い実践ハンドブックを読む (執筆中)

薬学・ITの基礎知識

創薬DXに関連した知識を学ぶ際に参考になった書籍やサイトなどを列挙していきます。かなり雑多ですが、どれもとても役に立ったのでお勧めです。

薬学 (創薬)

創薬DXに関わるのはエンジニア出身の方が多いと思いますが、事前に、創薬プロセスやモダリティについて知識を仕入れておくと、研究者との議論についていきやすくなるでしょう。以下の本は、自分が読んだ本の中で、特に奥が深いと感じたものです。

薬学 (解剖・病理)

薬を作ることに携わっているのであれば、「自分が何を作っているのか」は知っておくべきでしょう。薬が病気を治すのであれば、何が正常で、何が異常なのかを言える必要があります。その際に役に立つのは、解剖学・病理学の知見です。

  • 【書籍紹介】「からだが見える」を読む (執筆中)

薬学 (統計学)

人間には必ず個体差があります。この薬が100%効くというのはあり得ず、統計的に効くかどうか、という議論が必要です。患者としては「100%治ります」と言ってほしいと思いますが、それはできません。せめて、「統計」が何を表しているのか、科学研究において何を担っているのかを理解して臨みましょう。

  • 【書籍紹介】「基礎から学ぶ統計学」を読む (執筆中)

IT (深層学習)

ここからは、創薬DXを実現するために必要なIT技術の話になります。
まずは、AlphaFoldを含めてホットである深層学習についてです。理論の詳細はより専門的な書籍や大学の授業を参照してください。ここでは、あくまで「創薬DX」の観点から、医療分野に、深層学習を応用する、というテーマの教材を紹介します。

IT (古典的人工知能)

深層学習を実世界に適用するに当たって常に問題になるのが、「説明可能性」の問題です。深層学習では、発見された特徴量が現実の何に対応するのかが明確にできないことがしばしば発生します。

ドメイン知識が十分にあり、モデル構築に必要なパラメータが分かっている場合であれば、古典的な機械学習アルゴリズムを適用するのも一考の余地があるでしょう。

IT (ロボット)

ラボオートメーションの本領は、やはりロボットを使って実験を自動化する過程でしょう。2024年現在では、数としてはあまり多くありませんが、実例もいくつか出てきています。(「ラボオートメーション」の項も参照ください)

ロボットについて学ぶのであれば、実際に作ってみるのが一番と思われます。手軽さも考えて、シミュレータ上でロボットを動かしてみる例を紹介します。

  • DjangoとWebotsを繋いで多軸ロボットアームを動かしてみる (執筆予定)

IT (Web開発)

ラボオートメーションシステムを現場展開するに当たっては、PCや環境に依存せず統一的に動かせるインターフェースがあると喜ばれます。UI開発のために、DjangoのようなフレームワークとJavaScriptのような低レイヤ部分を両方含めて、Web開発の知識を仕入れておくと、何かあった時に便利かもしれません。

IT (データベース)

バイオリポジトリの項目でも触れましたが、生体試料やデータを適切に管理・保存・配布できるシステムの構築は、現代の生命科学実験において必要不可欠です。ITで言えば、データベース構築に相当します。内製しないとしても、設計を知っておくことで話がしやすくなることは多いでしょう。

  • CTFでサーバーを攻撃して学ぶデータベースのアンチパターン (執筆予定)

全体図

学術系の知見であれば、医科歯科大学清水秀幸先生のロードマップ を参照するのがおすすめです。ライフサイエンスと数理科学の融合領域において、どのように勉強を進めていくのが良いかの一例を示してくださっています。

最後に

とても幅広く膨大な勉強が必要になる「創薬DX」という分野ですが、そのぶん、やるべきことはまだまだ多く残されています。患者さんにより多くの治療法を届けるために、ITの分野から価値を提供していきましょう。

もし同業者の方で、おすすめの書籍や論文などあればぜひお知らせください。

Discussion

ログインするとコメントできます