📚

最新の時系列ファウンデーションモデルは,生き物の自律神経の良し悪しや無呼吸症の兆候を表す生体リズムを認識・予測できるか?

に公開

時系列ファウンデーションモデルを用いた心拍変動(HRV)解析:自律神経評価と睡眠時無呼吸症候群(SAS)への応用可能性

〜最新の時系列ファウンデーションモデルは、生体の自律神経機能や睡眠時無呼吸症候群の兆候を反映する心拍変動パターンを認識・予測できるか?〜

1. はじめに

1.1. AIにおけるパラダイムシフトと時系列分析への波及

近年,自然言語処理(NLP)やコンピュータビジョン(CV)の分野において,ファウンデーションモデル(Foundation Models: FMs)と呼ばれる大規模事前学習モデルが顕著な成功を収め,AI研究開発にパラダイムシフトをもたらしています.これらのモデルは,膨大な量の多様なデータを用いて事前に訓練され,特定のタスクに特化することなく,広範な下流タスクに対して高い汎化性能を示すことが特徴です.この成功は時系列分析の領域にも波及し,新たな研究フロンティアとして注目されています.特にヘルスケア分野では,生理学的時系列データ解析への応用が期待されています.

1.2. 生理学的信号分析におけるファウンデーションモデルの可能性

心拍変動(Heart Rate Variability: HRV)のような生理学的時系列データは,生体内の複雑な調節メカニズムを反映しており,健康状態や疾患リスクを評価するための重要な情報源となります.HRVは,心臓の拍動間隔(R-R間隔,以下RRI)の微細な変動を捉えたものであり,特に自律神経系(Autonomic Nervous System: ANS)の活動バランス(交感神経と副交感神経の相互作用)を非侵襲的に評価する指標として広く用いられています.FMsは,その強力な表現学習能力により,複雑でノイズを含むことが多いHRVデータの解析に新たな可能性を開くと期待されます.

1.3. 本稿における核心的問いと課題認識

本稿は,Lag-LLaMAやChronosといった特定の時系列ファウンデーションモデル(Time Series Foundation Models: TSFMs)が,ANSの健康状態や睡眠時無呼吸症候群(Sleep Apnea Syndrome: SAS)の兆候を反映するHRVパターンを認識・予測する能力を持つか,という核心的な問いに取り組みます.これらのモデルが,事前学習で獲得した汎用的な知識を,特殊な生理学的データであるHRVの解析にどの程度有効に活用できるかが課題となります.

1.4. 本報告書の目的と構成

本報告書の目的は以下の通りです.

  • Lag-LLaMAとChronosのアーキテクチャと動作原理を比較検討し,HRV分析への適合性を評価する.
  • TSFMsを用いてHRVを分析し,自律神経機能やSASの影響を評価するアプローチの可能性と課題を探る.
  • 予備的な計算機実験を通じて,TSFMsによる翌日HRV予測とSAS影響評価の実現可能性を検証する.

本報告書は以下の構成をとります.第2章では,生理学的時系列分析のためのTSFMsの基本原理と,Lag-LLaMAおよびChronosモデルの詳細を解説し,比較分析を行います.第3章では,TSFMsをHRVに適用し,ANS機能とSASを評価する具体的なアプローチについて論じます.第4章では,関連する公開データリソースを概観し,データの前処理における重要な考慮事項を述べます.第5章では,ファウンデーションモデルを用いた翌日HRV予測の実験設計と手法について説明します.第6章では,実験結果,特に予測におけるSAS影響の定量的評価を示します.最後に第7章で,TSFMsの生理信号解析への応用可能性と今後の展望について考察と結論を述べます.

2. 生理学的時系列分析のためのファウンデーションモデル

2.1. 時系列ファウンデーションモデル(TSFMs)の基本原理

TSFMsの基本的な考え方は,多様な時系列データ(センサーデータ,金融市場データ,生理学的測定値など)の大規模なコレクションを用いてモデルを事前に学習させることです.この事前学習フェーズでは,モデルは時系列データに共通する普遍的なパターン,例えばトレンド,周期性,時間的依存関係などを,主に自己教師あり学習(予測,再構成,対照学習など)を通じて獲得します.自己教師あり学習は,特にラベル付けが困難なヘルスケアデータにおいて有効なアプローチとされています.

事前学習によって得られた汎用的な知識を活用し,HRV予測やSAS検出といった特定の下流タスクに対して,少量のタスク固有データを用いたファインチューニングを行うか,あるいは追加学習なしのゼロショット/フューショット推論によってモデルを適応させます.このアプローチにより,データが限られている状況でも高い性能を発揮し,優れた汎化能力を持つことが期待されます.従来の統計モデル(ARIMAなど)や古典的な機械学習手法と比較して,TSFMsは手動での特徴量エンジニアリングを必要とせず,データから直接的に複雑な非線形関係や長期依存性を捉える能力に優れている点が大きな利点です.

2.2. Lag-LLaMA:ラグ(時間遅れ)ベースの確率的予測アプローチ

Lag-LLaMAは,時系列予測のためのオープンソースのファウンデーションモデルであり,特に確率的予測とゼロショット性能に焦点を当てて設計されています.

  • アーキテクチャ:
    大規模言語モデル(LLM)であるLLaMAを基盤としたデコーダオンリーのTransformerアーキテクチャを採用しています.入力として,過去の特定の時間遅れ(ラグ)を持つ時系列値を使用します.
  • 確率的出力:
    Lag-LLaMAの重要な特徴は,単一の点予測値ではなく,将来のデータ点の確率分布 P(x\_t | x\_{t-lag\_1}, x\_{t-lag\_2},...) を学習・予測する点です.これにより,予測の不確実性を定量化でき,予測区間などの豊富な情報を提供可能です.生理学的信号のように本質的に変動性を持つデータに対して,この分布的アプローチは特に有用です.
    例えば,予測される心拍数範囲やその安定性の変化は,点予測よりも多くの情報を含み得ます.予測分布の分散が広い場合は自律神経の不安定性やストレス増加を,狭い場合は硬直した(潜在的に不健康な)状態を示唆する可能性があります.
  • ゼロショット予測:
    事前学習済みモデルが,未知のデータセットに対してもタスク固有の追加学習なしで予測を行うゼロショット能力を目指しています.
  • HRVへの適用可能性:
    明示的にラグに注目するアーキテクチャは,血圧反射(Baroreflex)のような特定の生理学的フィードバックループの遅延時間を捉えるのに適している可能性があります.また,分布出力はHRVの自然な変動性や,ストレス下での不安定性をモデル化する上で有利と考えられます.ただし,後述するように,不等間隔なRRI系列への直接適用には課題があります.

2.3. Chronos:量子化ベースの言語モデル的アプローチ

ChronosもオープンソースのTSFMであり,Lag-LLaMAとは異なるアプローチを採用しています.

  • アーキテクチャ:
    T5ファミリーに基づくエンコーダ・デコーダ型のTransformerアーキテクチャを利用しています.
  • 量子化:
    Chronosの核心的なアイデアは,連続的な時系列値をスケーリングと量子化によって離散的なトークン(固定語彙内のビン)に変換することです.これにより,時系列予測問題を,言語モデルが得意とするトークンシーケンス生成タスクとして扱います.
  • 学習データ:
    公開されている多様な時系列データセットと,汎化性能向上のためにガウス過程を用いて生成された合成データを用いて事前学習されています.
  • HRVへの適用可能性:
    量子化ステップは,一種の次元削減とノイズフィルタリングとして機能し,ノイズの多い生理学的信号に対して頑健性をもたらす可能性があります.連続的なRRI値を有限の離散トークンにマッピングするプロセスは,信号を平滑化し,小さな変動やノイズの影響を低減させ,大規模なトレンドの把握やノイズの多いセンサーデータへの対処に役立つ可能性があります.
    しかし一方で,量子化によってRRI変動の正確なタイミングや振幅に関する情報が失われるリスクがあります.これは,RMSSDのような標準的なHRV指標や,1/fスケーリングのような複雑なダイナミクスを捉える上で重要となる可能性があります.
    量子化戦略(ビンの数や境界)の選択はパフォーマンスに大きく影響し得るため,HRV分析においては慎重な検討が必要です.Chronosの原著論文では,ゼロショット予測性能が様々なデータセットで示されています.

2.4. 比較分析:生体信号モデリングにおけるLag-LLaMAとChronos

Lag-LLaMAとChronosは,HRVのような複雑な生理学的信号のモデル化において,それぞれ異なる設計思想に基づいています.ラグに注目し確率分布を出力するLag-LLaMAと,値を量子化しトークンシーケンスとして扱うChronosの間には明確な違いがあり,HRV分析における潜在的な強みと弱みに繋がります.

  • Lag-LLaMA:
    • 強み:特定の生理学的遅延の捉えやすさ,予測不確実性の直接的な定量化,連続値保持による微細構造(例:RMSSD計算に必要な精度)の維持.
    • 弱み:ラグ選択への感度,ノイズ感受性が相対的に高い可能性,不等間隔データへの直接適用の困難さ.
  • Chronos:
    • 強み:量子化によるノイズ平滑化効果と頑健性,多様なデータでの事前学習による柔軟性,言語モデル技術の直接的活用.
    • 弱み:量子化による情報損失(特に振幅や微細タイミング情報),ビン設定への依存性.

どちらのモデルが特定のHRV分析タスク(例:正確なタイミングが重要な不整脈関連パターン検出 vs ノイズが多い状況での全体的なHRVレベル予測)に適しているかは,タスクの性質,データの質,そして利用可能な計算資源によって判断されるべきです.表1に,HRV分析の観点から見た両モデルの主な特徴をまとめます.

表1: HRV分析のためのLag-LLaMAとChronosの比較

特徴 Lag-LLaMA Chronos
コアアーキテクチャ LLaMAベース (Decoder-Only) T5ベース (Encoder-Decoder)
入力処理 生のラグ値 量子化された値/トークン
出力タイプ 確率分布 量子化値のシーケンス / 点予測
時間的依存性の扱い 明示的なラグ Transformerの注意メカニズム
事前学習データ (論文参照) 公開データ + 合成データ (ガウス過程)
HRVに対する潜在的強み 特定遅延の捕捉, 不確実性の定量化 ノイズへの頑健性, パターンの柔軟性
HRVに対する潜在的弱み ラグ選択への感度, 不等間隔データ問題 量子化による情報損失
ゼロショット能力 目標あり 実証あり

この比較から,Lag-LLaMAの分布出力とChronosの量子化は,時系列の不確実性をモデル化する上で根本的に異なるアプローチであることがわかります.量子化は構造を強制しますが情報損失のリスクがあり,分布モデリングは連続性を保持しますが訓練が難しくなったり外れ値に敏感になったりする可能性があります.

HRVの場合,RMSSDのようなビート間の微細な変動や1/fノイズのような長期相関は,粗い量子化によって不明瞭になる可能性がありますが,量子化はノイズの多いPPG信号を平滑化し,基本的なトレンドを明確にするのに役立つかもしれません.分布出力はリスク評価に有用な不確実性を直接定量化します.したがって,タスクが頑健性やトレンドを優先するのか,それとも忠実度や変動性を優先するのかによって,最適なアプローチは異なります.

3. TSFMsを用いたHRVによるANSおよびSAS評価への応用

3.1. 自律神経機能と健康状態を映す窓としてのHRV

HRVは,連続する心拍間隔(RRI)の変動性を定量化したものであり,心臓のペースメーカーである洞房結節に対する交感神経系と副交感神経系(迷走神経)からの入力の複雑な相互作用を反映しています.HRV分析は,主に時間領域(SDNN:全RRIの標準偏差,RMSSD:隣接RRI差の二乗平均平方根など),周波数領域(LF:低周波成分 0.04-0.15Hz,HF:高周波成分 0.15-0.4Hz,LF/HF比など),および非線形領域(DFA:Detrended Fluctuation Analysis,サンプルエントロピーなど)の指標を用いて行われます.

これらの指標は異なる生理学的メカニズムを反映すると考えられています.例えば,HF成分は主に呼吸性洞性不整脈を介した副交感神経活動(迷走神経活動)を,LF成分は血圧反射(Baroreflex)活動や交感神経活動の影響を含むとされています.SDNNは全体的な変動性を,RMSSDは短期的な変動(主に副交感神経)を反映します.

HRVのパターン,特にその低下や変化は,心血管疾患リスクの増加,糖尿病性自律神経障害,過度の心理社会的ストレス,うつ病などの精神疾患,そして睡眠時無呼吸症候群(SAS)のような睡眠障害といった,様々な健康状態や疾患リスクと関連付けられています.したがって,HRVは自律神経機能の客観的評価指標として,また多様な疾患リスクのスクリーニングやモニタリングツールとして,臨床的に重要視されています.Transformerなどの深層学習モデルを用いたHRVからのSAS検出研究も行われています.

3.2. TSFMsによる複雑なHRVダイナミクスのモデル化

HRVデータは,非定常性,複数の時間スケールにわたる相互作用(呼吸,血圧反射,概日リズムなど),そしてノイズの影響を受けやすく,従来の線形モデルや単純な統計的手法でその複雑なダイナミクスを完全に捉えることは困難です.

ファウンデーションモデルは,その大規模な構造とデータ駆動型の表現学習能力により,このような複雑なHRVダイナミクスをモデル化する上で大きな可能性を秘めています.特に,Transformerベースのモデルが持つ長期的な依存関係や非線形なパターンを捉える能力は,HRV分析において有利です.

注目すべき点として,健康な状態のHRVはしばしば「1/fゆらぎ」(あるいはより一般的に1/f^\beta型のべき乗則スケーリング)と呼ばれる特徴的な長期相関構造を示すことが知られています.これは,完全に規則的な周期的変動と完全にランダムな変動(ホワイトノイズ)の中間に位置する複雑な変動パターンであり,システムの適応性や効率的な恒常性維持メカニズムを反映していると考えられています.

疾患状態では,この複雑な調節が崩壊し,よりランダム(ホワイトノイズ様,\beta \approx 0.5)になったり,逆により硬直した周期的パターン(\beta > 1)に近づいたりすることがあります.DFA(Detrended Fluctuation Analysis)によって算出されるスケーリング指数\alpha\alpha = \frac{(\beta+1)}{2}の関係)は,この特性を定量化する指標として用いられ,特に短期相関を示す DFA \alpha 1 は重要な指標とされています.

TSFMs,特にTransformerベースのモデルは,その長期依存性を捉える能力により,この1/f特性(DFA \alpha 1 \approx 1)を「健康な」パターンの一部として暗黙的に学習し,その特性からの逸脱を検出することで,生理学的調節不全や病理学的状態の早期兆候を捉えることができる可能性があります.これは,単に平均的なHRV指標を計算するだけでは見逃される可能性のある,より深いレベルでの健康状態評価につながるかもしれません.

3.3. 健康モニタリングのための将来HRV軌跡予測

TSFMsを用いたHRV分析の一つの応用シナリオは,過去のHRVデータ(RRI系列)を入力として,将来のHRVトレンド(将来のRRI系列やそこから計算されるHRV指標)を予測することです.この予測により,健康状態の潜在的な変化を早期に検知することが期待されます.

予測されたHRV指標の低下(例えばSDNNやRMSSDの低下)は,自律神経系の機能低下,ストレスレベルの増加,あるいは心臓の適応能力の低下を示唆する可能性があります.さらに,HRVの絶対値だけでなく,その「複雑性」や「フラクタル性」(例:DFA \alpha 1)の変化を予測することも重要です.複雑性やフラクタルスケーリング(1/fのような)は,個体差や状況による変動が大きい絶対的なHRV値よりも,システムの健康状態を示すより頑健な指標であると主張されています.

TSFMsは,将来のRRI値だけでなく,将来のRRIウィンドウから導出される特徴,特に DFA \alpha 1 のような複雑性を捉える指標を予測するように訓練することができます.モデルが将来の DFA \alpha 1 の減少(1/fからランダム性への移行,DFA \alpha 1 \rightarrow 0.5)または大幅な増加(より滑らかで複雑性の低い信号への移行,DFA \alpha 1 \gg 1)を予測する場合,それは生理機能低下の早期警告を提供する可能性があります.予測されたスケーリング指数が健康な範囲(DFA \alpha 1 \approx 1)から逸脱すると予測される場合,それは健康な適応能力喪失の早期警告サインとなり得ます.

3.4. 睡眠時無呼吸症候群(SAS)の調査:翌日への影響予測

SASは,睡眠中の上気道閉塞による間欠的な低酸素血症と睡眠断片化を引き起こす疾患です.これは,特に睡眠中のHRVに特徴的な変化,例えば心拍数の周期的変動(CVHR:無呼吸中の徐脈と覚醒反応に伴う頻脈の繰り返し)や,全体的な交感神経活動の亢進と副交感神経活動の低下をもたらします.

より有望かつ生理学的に妥当なアプローチは,夜間のSASイベントが翌日の日中の自律神経機能に及ぼす持続的な影響をモデル化することです.夜間の繰り返される低酸素や睡眠断片化は,慢性的な自律神経系の調節不全を引き起こし,日中においても交感神経活動の亢進,HRVの低下,ストレス反応性の鈍化などを引き起こす可能性が複数の研究で示唆されています.

この「自律神経系の二日酔い」とも言える現象は,夜間のSASイベント情報(例えば,夜間のRRIパターンや,可能であれば無呼吸低呼吸指数(Apnea-Hypopnea Index: AHI)のような重症度指標)を入力とし,翌日の日中のHRVパターン(例:平均心拍数の上昇,RMSSDの低下,LF/HF比の変化,DFA \alpha 1 の低下)を出力とするマッピング関係をTSFMsに学習させることでモデル化できます.

このアプローチの妥当性は,夜間の急性ストレス(低酸素,覚醒,交感神経サージ)が翌日の日中のANS機能に測定可能な変化をもたらすという生理学的根拠に基づいています.(夜間データ/SAS重症度,翌日の日中RRI) のペアで訓練されたTSFMは,この関係性をモデル化することを学習できます.

モデルによる日中のHRV変化の予測は,SAS重症度の機能的影響を示す非侵襲的な指標として役立つ可能性があり,単に無呼吸イベントを数えるよりも感度が高い可能性があります.このようにして,TSFMはSASによる日中の生理機能への負荷を定量化し,単なるイベント数を超えた臨床的意義のある情報を提供する可能性があります.

4. TSFMベースの生理学的分析のためのデータリソースと前処理

4.1. HRV,睡眠,関連疾患に関する主要データセット

ファウンデーションモデルの学習や評価には,大規模で質の高いデータが不可欠です.生理学的信号研究において,PhysioNet (https://physionet.org/) は最も重要な公開データリソースの一つであり,多様なデータセット(PhysioBank)と解析ツール(PhysioToolkit)を提供しています.本研究の目的に関連性の高い主要な公開データセットをいくつか紹介します.

  • St. Vincent's University Hospital / University College Dublin Sleep Apnea Database (UCDDB, PhysioNet):
    • 信号:睡眠時無呼吸症候群(OSA)が疑われる成人25名の夜間ポリソムノグラフィ(PSG)記録.ECG,呼吸(気流,胸腹部努力),SpO2,睡眠段階などを含む.
    • アノテーション:専門家による呼吸イベント(無呼吸,低呼吸)および睡眠段階のアノテーションが付与されている.AHIも提供.
    • アクセス:PhysioNet経由で自由に利用可能 (https://physionet.org/content/ucddb/1.0.0/).
    • 利点:SAS研究のための質の高い同期データ(ECG,呼吸,睡眠等),AHIラベル付き.
    • 欠点:被験者数が比較的少ない(25名).夜間データのみ.
  • Apnea-ECG Database (PhysioNet):
    • 信号:ECG記録(約8時間).
    • アノテーション:1分ごとの無呼吸イベントのアノテーション.
    • アクセス:PhysioNet経由で自由に利用可能 (https://physionet.org/content/apnea-ecg/1.0.0/).
    • 利点:比較的多くの被験者(70名),ECGと無呼吸イベントの関連研究に有用.
    • 欠点:呼吸信号や睡眠段階の情報は限定的.アノテーションの粒度が粗い.
  • Sleep Heart Health Study (SHHS, PhysioNet):
    • 信号:大規模コホート研究の一部として収集された自宅でのPSG記録(ECG, EEG, EOG, EMG, 呼吸, SpO2等).
    • アノテーション:睡眠段階,呼吸イベント,心血管疾患リスク因子など豊富な情報.
    • アクセス:PhysioNet経由で利用可能だが,データ使用申請が必要 (https://sleepdata.org/datasets/shhs).
    • 利点:大規模(数千人規模),長期的な健康追跡情報との連携可能性.
    • 欠点:データアクセスに申請が必要,データのばらつきが大きい可能性.
  • MIMIC-III/IV (PhysioNet):
    • 信号:ICU(集中治療室)における高解像度の波形データ(ECG, PPG, 血圧など)および豊富な臨床情報.
    • アノテーション:多様な疾患,治療,検査結果,生命兆候など.
    • アクセス:PhysioNet経由で利用可能だが,トレーニングとデータ使用契約が必要 (https://physionet.org/content/mimiciv/ または https://physionet.org/content/mimiciii/).
    • 利点:非常に大規模,マルチモーダル,臨床的関連性が高い.
    • 欠点:ICUという特殊な環境,アクセスにトレーニングと申請が必要.
  • DAPPER (Daily Ambulatory Psychological and Physiological recording for Emotion Research) (Synapse):
    • 信号:手首装着型ウェアラブルによるPPG,皮膚電気活動(GSR),3軸加速度.前処理済み1Hzデータ(HR含む)も提供.
    • アノテーション:自己申告による感情状態(快・不快,覚醒度),性格特性,抑うつスコア(BDI-II)など.
    • アクセス:Synapse プラットフォーム経由.DUC(データ使用証明書)の提出が必要 (https://www.synapse.org/#!Synapse:syn20815189/wiki/600986).
    • ライセンス:CC BY 4.0.
    • 利点:日常生活下のウェアラブルデータ,マルチモーダル(生理+心理),RAWデータ利用可能.
    • 欠点:睡眠段階や特定疾患のアノテーションはない,DUCが必要.

これらのデータセットを表2にまとめます.
表2: HRV・睡眠・関連疾患研究のための主要公開生理学的データセット概要(一部)

データセット名 主な信号 主なアノテーション/特徴 アクセス元/条件例
UCDDB (PhysioNet) PSG (ECG, Resp, SpO2等) 呼吸イベント, 睡眠段階, AHI (OSA疑い) PhysioNet / 自由
Apnea-ECG (PhysioNet) ECG 分単位の無呼吸イベント PhysioNet / 自由
SHHS (PhysioNet) PSG (多種) 睡眠段階, 呼吸イベント, CVDリスク因子 PhysioNet / 要申請
MIMIC-III/IV (PhysioNet) ICU波形/臨床データ 多様な疾患, 治療, 生命兆候 PhysioNet / 要申請
DAPPER (Synapse) PPG, Accel, GSR (手首型) 感情, 性格, 日常生活 Synapse / 要DUC
... (その他多数) ... ... ...

この表は,研究目的に合ったデータセットを選択する際の出発点となります.特にTSFMを用いた研究では,データの規模,信号の種類と質,アノテーションの有無と粒度,そしてアクセス容易性が重要な選択基準となります.現状では,TSFMの事前学習に理想的な「巨大で多様,マルチモーダル,長期的,高精度アノテーション付き,容易にアクセス可能」な単一の公開生理学データセットは存在しないため,複数のデータセットを組み合わせるか,特定の目的に合致するデータセットを選択し,ファインチューニングやドメイン適応技術を駆使する必要があります.

本研究では,予備実験として St. Vincent's University Hospital / University College Dublin Sleep Apnea Database (UCDDB, PhysioNet)を使用しました.このデータベースは入手が容易であり,閉塞性睡眠時無呼吸 (OSA) の疑いがある被験者群と,OSAリスクの低い健常者群 (AHI < 5と定義されることが多い) の両方のデータを含んでいるためです.

4.2. 重要なデータ前処理ステップ(RRI抽出,ノイズ除去等)

TSFMsに入力する前に,生理学的信号には慎重な前処理が必要です.

  • RRI抽出(心拍間隔の計算):
    HRV分析の基本は,心拍ごとの間隔(ECGからはRR間隔,PPGからはIBI: Inter-Beat Interval)を正確に抽出することです.
    • ECG Rピーク検出:
      Pan-Tompkins法,ウェーブレット変換,適応閾値法,深層学習ベースの手法などが用いられます.一般にクリーンなECGでは高精度ですが,ノイズや不整脈に対する頑健性が求められます.
    • PPG ピーク検出:
      PPG信号はECGに比べて信号対雑音比(SNR)が低く,モーションアーティファクトの影響を受けやすいため,ピーク検出はより困難です.様々なアルゴリズムが提案されていますが,アルゴリズムの選択と検証が重要です.
    • PPG vs. ECG 精度比較:
      RRI/IBIの精度において,ECGはゴールドスタンダードと見なされます.PPG由来のIBIは,心臓の電気的活動から血流変化までの時間差(Pulse Transit Time: PTT)を含み,このPTT自体が血圧や血管硬度などによって変動するため,ECG由来のRRIとは本質的に異なります.
      また,PPGはモーションアーティファクトの影響を受けやすく,ウェアラブルデバイスで一般的な低いサンプリングレートもタイミング誤差を増大させます.結果として,特に運動時や特定の患者群においては,PPG由来のHRV指標(特にRMSSDのような短期変動指標)の精度はECG由来のものより劣る傾向があります.
      この精度ギャップは,ECGデータで学習したTSFMをPPGデータに適用する際に考慮すべき重要な点です.
  • ノイズフィルタリングとアーチファクト除去:
    生理学的信号には様々なノイズ(基線変動,電源ノイズ,筋電図ノイズ,モーションアーティファクトなど)が含まれるため,適切なフィルタリング(例:バンドパスフィルタ)が必要です.
    また,生理学的にありえないRR間隔(極端に短い/長い)や急激な変化を示す間隔は,アーチファクトとして除去または補正する必要があります(例:Kubios HRVソフトウェアで用いられるような閾値法).
    信号品質指標(Signal Quality Index: SQI)を用いて低品質なセグメントを除外することも有効です.
  • セグメンテーションとフォーマット:
    分析目的に応じてデータをセグメント化します(例:5分間隔,日中/夜間,睡眠段階別).その後,TSFMsへの入力に適した形式(例:固定長のテンソル)に変換し,必要に応じてパディングやアテンションマスクを作成します.不等間隔のRRI系列を等間隔データにリサンプリングする場合もありますが,情報損失に注意が必要です.

これらの前処理ステップの質が,後続のTSFM分析の精度と信頼性を大きく左右します.特に,ECGとPPGの間の本質的な違いと精度ギャップを理解し,目的に応じて適切な信号源と前処理手法を選択することが重要です.

本研究では,ECG信号からRRIを算出するにあたり,まず信号に対して最低限のクリーニング処理を行いました.その上で,Rピークの検出には標準的なPan-Tompkins法を実装したライブラリを用いました.アーチファクト除去には,隣接RRI間の差分に基づく閾値法を適用しました.

4.3. TSFMsを用いた異常検知と早期健康警告の可能性

TSFMsは,正常な生理学的パターンの複雑なモデルを学習し,そこからの逸脱を「異常」として検出することで,健康状態の悪化や特定のイベント(SASイベント,ストレス反応,発作など)の早期警告システムとして機能する可能性があります.

  • 異常検知におけるTSFMの役割:
    • 表現学習:
      正常データの高次元表現(埋め込み)を学習し,異常データがこの表現空間から外れることを検出.
    • 再構成/予測ベース:
      正常データを学習したモデル(例: オートエンコーダや予測モデル)を用い,異常データに対する再構成誤差や予測誤差が大きい場合に異常と判定.TSFMの予測分布の不確実性を利用することも考えられます.
    • 解釈可能性:
      検出された異常の原因を説明(例:どの信号のどのパターンが異常と判断されたか).
  • 課題とアプローチ:
    生理学的信号における「正常」の定義は,個人差や状況依存性が大きく困難です.また,異常イベントは稀であるためデータが不均衡になりがちで,ノイズやアーチファクトとの区別も難しいです.現在の汎用TSFMsは予測タスクに最適化されており,異常検知性能は限定的との指摘もあります.
    異常検知に関する深層学習のサーベイは存在しますが,生理信号に特化したTSFMベースの異常検知はまだ発展途上です.異常データがファインチューニングデータに含まれることによる性能低下(汚染)の問題もあり,これに対処する手法も提案されています.
  • 早期警告信号(EWS):
    特定の疾患増悪や状態遷移の前には,システムの回復力低下を示す微細な統計的変化(EWS)が現れることがあります(例:分散の増加,自己相関の増加).TSFMsは,これらの微妙なEWSパターンを学習し,差し迫った状態変化を予測できる可能性があります.

理論的には有望ですが,TSFMを用いた生理学的異常検知は,特に「正常」の定義の難しさ,データの不均衡性,解釈可能性の欠如といった課題から,現状では予測タスクほど確立されていません.正常範囲の境界を学習したり,不確実性を活用したりするなど,異常検知に特化したアーキテクチャや学習戦略が必要となる可能性があります.

5. ファウンデーションモデルによる翌日HRV予測性能の検証

5.1. 実験目的と仮説

本研究では,3.4章で提示した仮説,すなわち「夜間の生理学的状態(特にSASの存在)が翌日の自律神経活動に持続的な影響を与え,時系列ファウンデーションモデル(TSFMs)はその影響を夜間のECGデータから予測できる」を検証するための予備的な計算機実験を設計しました.

主な目的は,Chronosモデルが,夜間のECGデータ(RRI系列)を入力として,翌日の安静時ECGデータ(RRI系列)から導出されるHRV指標を追加学習なし(ゼロショット)で予測する能力を評価することです.さらに,その予測において,SAS患者群と健常対照群の間で生理学的に妥当な差異(SAS群でのHRV複雑性の低下など)を検出できるかを確認することを仮説検証の対象としました.

サンプリング周波数に依存したLag-LLaMAと依存しないChronos

なお,RRIデータの分析に用いるモデルとして,ChronosとLag-LLaMAを比較検討した結果,Lag-LLaMAモデルへの入力データには,一定のサンプリング周波数で取得された等間隔データが必要であると判断しました.

しかし,分析対象である生のRRI系列は,心拍の発生タイミングに基づくイベントベースの時系列データであり,固有の一定サンプリング周波数を持たない不等間隔データです.このため,モデルが要求する入力形式とデータ特性が一致しないことから,Lag-LLaMAは生のRRIデータの直接的な分析には適さないと結論づけ,本研究ではChronosのみを用いることとしました.

Chronosは量子化により,連続的な時間依存性をトークンのシーケンスに変換するため,原理的には不等間隔データにも適用しやすいと考えられます.

5.2. 対象データと被験者群(SAS群 vs 健常群)

本実験では,公開データセット St. Vincent's University Hospital / University College Dublin Sleep Apnea Database (UCDDB, PhysioNet)を利用しました.このデータセットから,提供されている無呼吸低呼吸指数(AHI)に基づき,SAS群と健常対照群(例:AHI < 5)を定義しました.解析対象として,各被験者の夜間睡眠中に記録されたECGデータから抽出したRRI系列を使用しました.データ利用に先立ち,4.2節で述べた前処理(Rピーク検出,アーチファクト除去)を行いました.

5.3. 使用モデルと予測タスク(夜間ECG → 翌日HRV予測)

使用するモデルは,事前学習済みのChronos-T5-smallモデルです.このモデルに対し,UCDDBデータセットを用いたファインチューニングは行わず,ゼロショットでの予測性能を評価します.

予測タスクは,各被験者の夜間RRI系列を入力(コンテキスト)として与え,その被験者の翌日の特定の時間帯のRRI系列を予測対象(ターゲット)として生成させるものとします.コンテキスト長と予測長は,モデルの制約とタスクの性質を考慮して設定しました.Chronosは複数の予測サンプルを生成できるため,各被験者に対して複数の予測系列を得ました.

5.4. 評価指標と分析方法

モデルの性能評価と仮説検証は,以下の手順で行いました.

  1. 観測データに基づくHRV指標の群間比較:

    • 目的:
      実際に観測された夜間RRI系列データを用い,SAS群と健常対照群の間で主要なHRV指標に統計的な差が存在するかを確認する(ベースライン評価).
    • 手法:
      観測RRI系列(例:夜間全体)から,時間領域指標(SDNN, RMSSD)および非線形指標(DFA \alpha 1)を算出する.統計検定(データの分布に基づきMann-Whitney U検定など)を用い,両群間における各HRV指標の中央値に有意差が見られるかを確認する.
  2. 予測データに基づくHRV指標の群間比較:

    • 目的:
      Chronosによって予測された「翌日」RRI系列データを用い,SAS群と健常対照群の間で予測されるHRV指標の分布に統計的な差が存在するかを検証する.特に,観測データで見られた(あるいは生理学的に期待される)群間差が,予測結果においても再現されるかに注目する.
    • 手法:
      予測された各RRI系列から,観測データと同様のHRV指標(SDNN, RMSSD, DFA \alpha 1)を算出する.Chronosは各入力に対して複数の予測サンプルを生成するため,被験者ごとに複数の予測HRV値が得られるこのデータの構造(被験者内のばらつきと被験者間のばらつき)を考慮するため,線形混合モデル(Linear Mixed Model: LMM)を用いて統計的検定を実施する.
      LMMでは,群(SAS群/健常群)を固定効果,被験者をランダム効果としてモデル化し,群の効果(予測されたHRV指標の平均値の差)が統計的に有意か(p < 0.05)を評価する.

6. 予測結果におけるSAS影響の定量的評価

6.1. SAS群と健常群における観測HRV成分の統計的比較

まず,ベースラインとして,UCDDBデータセットの夜間RRI系列全体から計算したHRV指標について,AHIに基づき定義した低AHI群(健常対照群,n=34)と高AHI群(SAS群,n=25)の間で比較を行いました.Mann-Whitney U検定の結果を以下に示します.
表3: 観測夜間HRV指標の群間比較 (Mann-Whitney U検定)

指標 低AHI群 中央値 (IQR) 高AHI群 中央値 (IQR) p値
平均 RRI (ms) 883.55 (833.82-974.46) 909.48 (826.05-954.63) 0.8240
SDNN (ms) 137.95 (80.46-640.01) 93.56 (65.50-148.20) 0.0324*
RMSSD (ms) 63.32 (21.41-427.92) 33.41 (20.12-60.34) 0.0582†
DFA \alpha 1 1.35 (1.02-1.46) 1.41 (1.29-1.49) 0.1023
平均 HR (bpm) 67.92 (61.58-71.96) 65.97 (62.85-72.63) 0.8240
(* p < 0.05, † p < 0.1)

観測データからは,高AHI群(SAS群)において,SDNN(心拍変動全体の大きさ)が低AHI群と比較して有意に低いことが確認されました (p=0.0324).これは,SAS患者において自律神経系の全体的な調節能力が低下していることを示唆します.また,RMSSD(短期変動,主に副交感神経活動を反映)も高AHI群で低い傾向が見られました (p=0.0582).これらの結果は,SASがHRVに影響を与えるという既存の知見と一致します.一方で,非線形指標である DFA \alpha 1(フラクタル性・複雑性)については,この観測データ(夜間全体)では両群間に有意な差は見られませんでした.

心拍変動指標 SDNNとRMSSDの生理学的意義とSASとの関連

  • SDNN (Standard Deviation of NN intervals):
    全測定期間中の心拍間隔の標準偏差で,心拍変動全体の大きさを示します.交感神経・副交感神経双方の活動を含む,全体的な自律神経調節能力を反映します.SAS患者におけるSDNNの低下は,繰り返される低酸素や睡眠断片化による慢性的なストレスが自律神経系の柔軟性を損なっている可能性を示唆し,心血管リスク上昇との関連も指摘されています.

  • RMSSD (Root Mean Square of Successive Differences):
    隣接する心拍間隔差の二乗平均平方根で,拍動ごとの短期的な変動を捉えます.主に副交感神経(迷走神経)活動を反映すると考えられています.SAS患者におけるRMSSDの低下傾向は,交感神経の過剰興奮による相対的な副交感神経活動の抑制を示唆し,心臓保護メカニズムの減弱に関与する可能性があります.

6.2. SAS群と健常群における予測HRV成分の統計的比較

次に,Chronosモデルを用いて夜間RRIデータから予測された「翌日」RRI系列について,同様にHRV指標を計算し,線形混合モデル(LMM)を用いて群間比較を行いました.全被験者(n=59)について,各々複数の予測サンプル(合計5799サンプル)を解析しました.結果を以下に示します. (注: なお,Chronosは予測のサンプルを指定の数だけ予測します.今回の予測のサンプル数は100です.そのため,サンプル数が多い形になります)

表4: 予測「翌日」HRV指標の群間比較 (線形混合モデル)

指標 群効果 (高AHI vs 低AHI) 標準誤差 z値 p値
平均 RRI (ms) -192.455 264.120 -0.73 0.4662
SDNN (ms) -106.480 309.766 -0.34 0.7310
RMSSD (ms) 20.691 110.941 0.19 0.8521
DFA \alpha 1 -0.160 0.075 -2.15 0.0318*
(* p < 0.05)

予測されたHRV指標の比較結果において,最も注目すべき点はDFA \alpha 1です.線形混合モデルによる解析の結果,高AHI群(SAS群)は低AHI群(健常群)と比較して,予測された DFA \alpha 1 の値が平均して0.160有意に低いことが示されました (p=0.0318).これは,Chronosモデルが夜間のRRIパターンから,SAS患者において翌日の心拍変動の複雑性が低下する傾向を予測できたことを意味します.

一方で,予測された平均RRI,SDNN,RMSSDについては,両群間に統計的に有意な差は見られませんでした.観測データではSDNNに有意差が見られましたが,予測データでは再現されなかったことになります.

DFA \alpha 1 (Detrended Fluctuation Analysis Alpha 1) の生理学的意義とSASとの関連

  • DFA \alpha 1 とは?
    DFAは時系列の自己相関やフラクタル性を評価する手法であり,DFA \alpha 1 は短期的な相関特性(複雑さ)を数値化します.DFA \alpha 1 \approx 0.5はランダム(無相関),DFA \alpha 1 \approx 1.0は1/fノイズ様(長期相関,健康な状態を示唆),DFA \alpha 1 \approx 1.5はブラウンノイズ様(より滑らか)な変動を示します.

  • DFA \alpha 1 が反映するもの:
    自律神経系のダイナミクス,複雑性,適応能力を反映すると考えられています.値が1.0から逸脱すること(特に低下)は,システムの複雑性が失われ,より規則的または単純なパターンになっている可能性を示唆します.

  • SASとの関連(今回の予測結果に基づく考察):
    予測された DFA \alpha 1 が高AHI群で有意に低いという結果は,Chronosモデルが捉えた夜間のSAS関連パターンが,翌日の心拍変動における「複雑性の低下」という形で現れることを示唆しています.
    これは,SASによる慢性的な生理的ストレスが,自律神経系のダイナミックな調節能力を損ない,心拍変動パターンをより単純化・硬直化させるという仮説と整合します.自律神経系の複雑性の低下は,環境変化への適応能力の低下や心血管イベントリスク増加とも関連付けられています.

今回の解析で特筆すべき点は,観測データでは有意差が見られなかった DFA \alpha 1 において,Chronosによる予測では有意な群間差が検出されたことです.これは,TSFMが従来の線形指標(SDNN,RMSSD)では捉えきれない,あるいは特定の条件下(例:翌日の安静時)で顕著になる可能性のある,心拍変動の「質」や「複雑性」の変化を予測できる可能性を示唆しています.

7. TSFMsの生理信号解析への応用可能性と今後の展望

7.1. 考察

7.1.1. 結果の解釈:SASの翌日HRVへの影響予測の可能性

本研究の予備的な計算機実験結果,特にChronosモデルによって予測された翌日のHRV複雑性指標(DFA \alpha 1)におけるSAS群と健常群の有意差は,TSFMsが夜間の生理データ(RRI系列)から翌日の自律神経機能への持続的影響を予測できる可能性を示唆するものです.これは,SASが単なる夜間のイベントではなく,日中の生理機能にも影響を及ぼす慢性疾患であるという臨床的理解と一致します.

モデルが捉えた「夜間RRIパターン」と「翌日 DFA \alpha 1 低下」の関係性は,SASによる交感神経系の持続的な活性化や副交感神経系の抑制,あるいはそれらの相互作用による自律神経系のダイナミクスの変化といった病態生理の一部を反映している可能性があります.このアプローチは,従来のAHI(無呼吸低呼吸指数)のような夜間イベントの単純な計数だけでは捉えきれない,SASの生理学的な影響度,特に心拍変動の「質」の変化を評価する新たな非侵襲的指標となりうる潜在力を秘めています.

7.1.2. ファウンデーションモデルの生理学的信号分析における有効性

ChronosのようなTSFMsが,特定のタスク(この場合は翌日HRV複雑性予測)に対して追加学習なし(ゼロショット)である程度の性能を示したことは,これらのモデルが多様な時系列データから普遍的なパターン(トレンド,周期性,自己相関,フラクタル性など)を学習しており,それが生理学的信号にも応用可能であることを示しています.

特に,Transformerベースのアーキテクチャが持つ長期依存性を捉える能力は,HRVのような複雑な時系列データのモデリング,特に DFA \alpha 1 のような長期相関を反映する指標の予測に適していると考えられます.しかし,予測精度や他のHRV指標(SDNN, RMSSD)の再現性にはまだ改善の余地があり,生理学的信号特有のノイズや非定常性,個人差に頑健に対応するためのモデル改良や適用方法(例:ファインチューニング,プロンプトエンジニアリング)の工夫が今後の課題です.

7.1.3. 本研究の限界と今後の課題

本研究は予備的な計算機実験であり,いくつかの限界があります.第一に,結果は単一の比較的小規模なデータセット(UCDDB)に基づいています.より大規模で多様なデータセット(例:SHHS)を用いた厳密な検証が必要です.使用するデータセットの規模,質,被験者特性,記録条件などが結果に大きく影響する可能性があります.

第二に,ゼロショット性能に焦点を当てましたが,少量のタスク固有データを用いたファインチューニングによって性能がどの程度向上するかの検討も重要です.特に,生理学的データへのドメイン適応が有効である可能性があります.
第三に,モデルの予測根拠(なぜその DFA \alpha 1 値を予測したのか,どの夜間パターンが影響したのか)に関する解釈可能性(Explainable AI, XAI)の向上が,臨床応用に向けては不可欠です.アテンションマップの解析などが考えられますが,TSFMsにおける解釈可能性は依然として挑戦的な課題です.
第四に,ECG以外の生理信号(例:呼吸,SpO2,PPG)や臨床情報との統合(マルチモーダル化)による予測精度向上の可能性も探るべきです.例えば,夜間の低酸素レベルの情報などをモデル入力に追加することが考えられます. .

7.2. 結論

7.2.1. 主要な発見の要約

本稿では,時系列ファウンデーションモデル(TSFMs),特にChronosが,心拍変動(HRV)解析を通じて自律神経機能や睡眠時無呼吸症候群(SAS)の影響を評価する上で有望なツールとなりうることを論じました.予備的な計算機実験からは,Chronosモデルが夜間のECGデータ(RRI系列)のみから,追加学習なしで翌日のHRV複雑性指標(DFA \alpha 1)を予測し,さらにSAS患者群と健常対照群の間で予測された DFA \alpha 1 値に有意な差(SAS群での低下)を検出できる可能性が示唆されました.これは,TSFMsが複雑な生理学的ダイナミクスと疾患による影響をデータ駆動的に学習・予測できる潜在能力を持つことを示しています.

7.2.2. 将来展望:臨床応用への期待と研究の方向性

TSFMsを生理信号解析とヘルスケアに応用する研究はまだ発展途上ですが,大きな可能性を秘めています.今後の重要な研究方向性としては,以下の点が挙げられます.

  1. 大規模・多様なデータでの検証とベンチマーク:
    複数の大規模データセットを用いた厳密な性能評価と標準化されたベンチマークの確立.
  2. ドメイン知識の活用:
    生理学的ドメイン知識を取り入れたモデルアーキテクチャ(例:生理学的制約の導入)や損失関数の設計,ファインチューニング戦略.
  3. 解釈可能性の向上:
    予測根拠を明らかにするXAI技術の開発と適用.
  4. マルチモーダル統合:
    ECG以外の生理信号,ウェアラブルデータ,電子カルテ情報など,多様なモダリティのデータを統合するマルチモーダルTSFMの開発.
  5. 臨床応用を見据えた研究:
    実際の臨床現場での有効性を検証するための前向き研究やリアルワールドデータを用いた研究の実施.
  6. 異常検知・早期警告への展開:
    予測タスクだけでなく,4.3節で述べたような異常検知や早期警告システムへの応用研究の深化.

これらの研究開発を通じて,TSFMsが将来的には,疾患の早期発見,重症度評価,治療効果モニタリング,予後予測など,個別化・予測的ヘルスケアの実現に貢献することが期待されます.

付録

上記を再現するためのプログラムは以下のリンクから入手可能です.しかしながら,大規模な時系列ファウンデーションモデルの処理(高性能GPU環境推奨でも実行に数時間を要する場合があります)や心拍変動(HRV)計算・統計検定なども含め,実行には多くの計算リソースと時間を要するため,予めご留意ください.
※予測サンプル数を100から減らせば,実行の時間は減らせます.

Polaris.AIテックブログ

Discussion