NAM研究コミニティ~2025~電子カルテと臨床応用の進展
こんにちは!今回は、医療分野における最先端のAI研究に関する3つの論文を紹介します。電子カルテ(EHR)データを活用した機械学習モデルの最適化から、実世界のエビデンスを用いた治療効果の検証、そして臨床医向けの神経発達スクリーニングダッシュボードの開発まで、医療AIの多様な応用について解説します。
CORE-BEHRT:最適化された電子カルテ向けBERTモデル
著者: Mikkel Fruelund Odgaard, Kiril Vadimovic Klein, Martin Sillesen, Sanne Møller Thysen, Espen Jimenez-Solem, Mads Nielsen
電子カルテ(EHR)システムの普及により、利用可能な医療データは飛躍的に増加しました。これにより、自然言語処理(NLP)やコンピュータビジョンからインスピレーションを得たモデルが医療データ分析にも応用されるようになりました。特に、BEHRTやMed-BERTの登場以降、BERT系のモデルが医療分野でも人気を集めています。
この研究では、著者たちは「CORE-BEHRT」と名付けた電子カルテデータ向けのBERTモデルを段階的に最適化し、データ表現、技術的コンポーネント、トレーニング手順などの設計選択がどのように性能向上に寄与するかを詳細に分析しています。
主な成果:
- データ表現の改善(特に薬剤情報とタイムスタンプを含めること)により、平均ダウンストリーム性能がAUROC 0.785から0.797へ向上(p < 10^-7)
- アーキテクチャとトレーニングプロトコルの改善により、さらにAUROC 0.801へ性能が向上(p < 10^-7)
- 25種類の多様な臨床予測タスクにわたる厳密な評価を通じ、17タスクで統計的に有意な性能向上、24タスクで改善が認められ、結果の一般化可能性を実証
この研究は、今後のBERTベースの電子カルテモデル開発に強固な基盤を提供し、これらのモデルの信頼性向上を目指しています。
臨床試験を超えて:実世界エビデンスによる異質で時間変化する治療効果の調査
著者: Isabel Chien, Cliff Wong, Zelalem Gero, Jaspreet Bagga, Risa Ueno, Richard E. Turner, Roshanthi K Weerasinghe, Brian Piening, Tristan Naumann, carlo bifulco, Hoifung Poon, Javier Gonzalez
ランダム化比較試験(RCT)は新しい治療法の有効性を評価するために不可欠ですが、コストと時間がかかります。また、厳格な適格基準により、多様な患者集団を十分に代表していない可能性があり、公平性の問題や一般化可能性の制限につながることがあります。さらに、従来の試験分析方法は、厳格な仮定とバイアスによって制限されています。
実世界エビデンス(RWE)は、臨床試験の設定を超えて治療効果を探索する有望な方法を提供し、代表性のギャップに対処し、時間の経過に伴う患者の転帰に関する追加の洞察を提供します。
この研究では、著者たちは「TRIALSCOPE-X」と「TRIALSCOPE-XL」という機械学習パイプラインを導入しています。これらは、観察データから生じるバイアスを軽減し、従来の方法の限界に対処することで、RWEを使用して治療成果を分析するように設計されています。
主な特徴:
- 異種患者集団と様々な時間枠にわたる因果的かつ時間変化する治療効果を推定
- 広く使用されているがん免疫療法薬「キイトルーダ」の治療効果を調査する予備結果は、新しい設定での治療成果の評価と潜在的な格差の発見におけるこの方法の有用性を示している
- RWEベースの分析は、証拠に基づく医療に情報を提供し、より包括的な臨床研究を形作る、データ駆動の洞察を提供する可能性がある
臨床医のための電子カルテベースの神経発達サーベイランスダッシュボードの開発
著者: De Rong Loh, Elliot D. Hill, Ann Marie Navar, Geraldine Dawson, Matthew M. Engelhard
背景と動機:
著者たちは早期の自閉症および注意欠陥・多動性障害(ADHD)を予測するモデルを開発しました。これらのモデルを実践で使用するために、電子カルテ(EHR)内での静的展開が重要なステップとなります。しかし、関心が高まっているにもかかわらず、このようなモデルが臨床実践に効果的に統合された例は少ないのが現状です。
デューク大学では、機械学習モデルを臨床使用に変換することが機関の優先事項となっています。開発と後ろ向き評価に続いて、目標はこれらのモデルをユーザーフレンドリーなウェブアプリケーションを通じて展開し、臨床医の意思決定プロセスを強化するための予測洞察を提供することです。
設計上の考慮事項:
- ユーザー中心のアプローチを採用し、診断の可能性が高い子どもをスクリーニングする臨床医のニーズに合わせたデザイン
- StreamLitを使用した、ミニマリスティック、直感的でインタラクティブなインターフェース
- 神経多様性を肯定するコミュニケーション実践を採用(例:「リスク」ではなく「可能性」という用語を使用)
- 保護された分析コンピューティング環境(PACE)内でのホスティングにより、保護された健康情報を扱うための堅牢なセキュリティを確保
ダッシュボードインターフェース:
- ランディングページには「ダッシュボード概要」が表示され、デューク健康イノベーション研究所によって開発された「モデルファクト」ラベルが含まれる
- 「全患者」ページでは、デューク大学ヘルスシステム(DUHS)EHR内のすべての対象患者のデフォルト表示を提供
- 「患者検索」ページでは、包括的な個別ビューを提供し、患者のスナップショット、様々な時点での診断の予測確率、時間経過に伴う患者固有の可能性と人口および下位グループ分布を比較できる
今後の展望:
- 臨床医がモデル出力をより理解するための説明可能性ツールの実装
- フォーカスグループの実施によるダッシュボードの反復的な改良
- モデルの前向き展開と実生活の臨床環境での検証への移行
まとめ
これらの3つの研究は、医療分野におけるAIと機械学習の進展を示しています。電子カルテデータを活用したモデルの最適化、実世界のデータを用いた治療効果の評価、そして臨床意思決定を支援するためのツール開発など、医療AIは多様な方向に発展しています。
これらの研究は、将来の医療において、よりパーソナライズされた、エビデンスに基づく、効率的なケアを提供するための重要な一歩となるでしょう。医療AIの発展に伴い、患者のアウトカム向上と医療システムの効率化が期待されます。
Discussion