🔥

AIが脳を測る未来の話 ~無意識をインターフェイスにする~

に公開

はじめに

今日は5月に大阪で開催された人工知能学会から脳波を用いたAI研究に関する論文を紹介します。
他の脳計測手法にくらべ脳波は機材が比較的安価で蓄積も多くいつか研究が見られました。
これらの研究は、脳波データの解析においてAIと機械学習技術を活用し、
様々な実用的な応用分野での課題解決を目指しています。

脳波を用いたAI研究の全体的な傾向と概要

紹介する研究発表は次の通りです。後の引用ではそれぞのIDを記しています。IDというのは発表の際につけられる記号で3F1-GS-10-04という形式のものです。

  • 三上 玄, 佐藤 洸誓, 小泉 光司, 上田 一貴, 長藤 圭介, 横山 悠久: 「生成AI支援下での工学設計における発散的思考の脳内メカニズムの解明」, 人工知能学会全国大会(第39回), 3F1-GS-10-04, 2025. link 論文
  • 横田 悠真, 鈴木 圭, 井上 健一, 菅谷 みどり: 「脳波の個人差評価によるドメイン適応手法の提案」, 人工知能学会全国大会(第39回), 4L2-GS-10-04, 2025. 論文
  • 井上 健一, 鈴木 圭, 菅谷 みどり: 「脳波を用いた機械学習によるうつ病の重症度レベル推定アンサンブルモデルの構築手法の検討」, 人工知能学会全国大会(第39回), 4L2-GS-10-05, 2025. 論文
  • 佐藤 洸誓, 三上 玄, 小泉 光司, 上田 一貴, 長藤 圭介, 横山 悠久: 「協調的な工学設計時における収束的思考の脳内メカニズムの解明」, 人工知能学会全国大会(第39回), 4I3-GS-11-03, 2025. 論文
  • 鈴木 駿太郎, 長嶋 隼矢, 平田 雅之, 杉浦 孔明: 「時間・空間・周波数を統合した深層状態空間モデルによる脳波からの行動予測」, 人工知能学会全国大会(第39回), 1Win4-70, 2025. 論文
  • 早川 諒, 佐久間 拓人, 加藤 昇平: 「ドメイン適応を用いたCNN-GRUハイブリッドモデルによる少量脳波データからの運動想起判別」, 人工知能学会全国大会(第39回), 3Win5-53, 2025. 論文
  • 濱崎 一, 藤原 幸一, 石﨑 友崇, 鈴木 崇宏, 山本 俊, 齋藤 竜太: 「てんかん外科手術とSEEG運用のための発作起始自動解析アルゴリズムの統合」, 人工知能学会全国大会(第39回), 1O4-OS-18a-02, 2025. 論文

0. 脳波の簡単な解説

論文の解説をするまえに脳波とは何かという話を簡単にします。もっと詳しく知りたい人はwikipediaを見てください。
wikipedia 脳波

脳波とは何か?という疑問ですが、一言でいうならば脳活動(神経細胞の情報伝播)に伴って生じる電位変化です。なんで電気が関係するのかと疑問に思う人もいると思いますが、細胞代謝の一つが細胞壁イオンチャネルによるCaとかK,Naなど特定イオンの取り込みや排出です。さらに神経細胞の中では神経軸索の膜電位伝播がおこり、軸索の先についているシナプスから次の神経細胞へ化学物質が放出され情報伝達されます。神経細胞の集まりは似たような処理をすることが知られています。簡単に言うとそういった集団から集団へ伝播が起こると、全体として電位が移動して見えるということと理解しています。実際、詳しいメカニズムは仮説はあるものの研究中のようです。
で、たくさんの神経細胞の活動が起こるとマクロに頭皮表面での電位の変化が0.01秒(10msec)から0.1秒(=100msec)のレベルのスピードで変わっていきます。それが脳波です。

ちなみに脳波計というのは簡単に言えば増幅器(と電極)です。脳波の電位変化というのはかなり微弱でノイジーです。電極の状態やつけられた皮膚の具合によっても電位の感度が違います。さらに言うと、頭皮の下の頭がい骨も一枚ではなく、組み合わされているので、その境目の位置によっても電気の伝わり安が違うそうです。詳しくは頭がい骨
更にいうと人によって少しずつ形が違い、実験ごとに付ける電極位置も少しずつ変わるので完全一致することはありません。
全くばらばらだとやりにくいので、10-20法などの方法で耳の位置や眉間の位置などを元にだいたいの場所を決めて計測しています。

1. 主な応用分野

論文の分野別にまとめました。
自分で解説していても、読んでいる人は単語がわからなくて挫折しそうと思ったので、最後の方に専門用語解説を付けましたのでそちらを見てください。

医療関連目的:

  • てんかん外科手術計画の支援
    • てんかん原性領域(EZ)および発作起始領域(SOZ)の正確な同定が目的とされています。
    • 従来の専門家による目視判読やEpileptogenicity Index(EI)を用いた解析の限界を克服するため、TAILOR(Tailored Algorithm for Ictal Localization and Onset prediction)などの自動発作起始解析アルゴリズムが提案されています。TAILORは、患者固有のパワースペクトラムパターンを用いて高時間分解能で発作起始を検出し、てんかんネットワークの推定を支援するのが目的です。
  • ブレイン・コンピュータ・インターフェース(BCI)
    • ブレイン・コンピュータ・インターフェースというのは脳(ブレイン)の信号を直接抜き出してコンピュータ入力するというものです。
    • 他の多くの研究と同様に身体麻痺患者のコミュニケーション支援やリハビリテーション支援、コンピュータやロボットなどの外部機器の直接制御を可能にすることが目的です。
    • 運動想起時の脳活動の多クラス分類(例:肘の伸展・屈曲、手の伸展・掌握、左右の手の開閉運動) や、音声想起信号の認識(例:母音音声の認識) が研究対象となっています。
  • 精神疾患の診断支援
    • 特にうつ病の診断において、問診に依存する主観的な診断を補完する客観的かつ高精度な診断支援を目指しています。
    • 健常者とうつ病患者の二値分類 や、うつ病の重症度レベル(健常、軽度、中等度、重度)の多クラス分類推定 が行われています。

脳のメカニズム解明:

  • 創造的思考の脳内メカニズム解明
    • 工学設計におけるアイデア発想、特に発散的思考と収束的思考に焦点を当てています。
    • 人間が単独で思考する場合と、生成AI(ChatGPT-4oなど)と協調して思考する場合の脳活動の差異を明らかにすることで、AIが人間の創造性や脳活動に与える影響を評価しています。

2. 共通する課題

脳波データをAIで解析する上で、いくつかの共通した課題に直面しています。

  • 脳波データの複雑さとノイズ
    • 他の脳計測手法でも同様ですが、脳波信号は運動による筋電ノイズ(例:瞬き、嚥下)に敏感です。瞬きしただけで脳波より大きいパルスが入ってきます。脳波の電位は微弱でノイズに影響を受けやすいので、結構深刻。
    • てんかん発作波のスペクトルパターンが多様であることや、高周波数帯域の活動を目視判読で十分に捉えることが難しい
  • 個人差とドメインシフト
    • 脳波データは個人の特性が大きく反映されるため、「ドメインシフト」と呼ばれる現象が発生し、学習データと異なる個人のテストデータを用いた場合に機械学習モデルの精度が低下する主要な要因となります。
  • データ量の限界と不均衡
    • 特に臨床データ(例:ALS患者のECoGデータ、重度のうつ病患者の脳波データ)においては、十分なデータ量を確保することが難しく、またクラス間でデータ数が大きく偏る「データ不均衡」がモデル構築の課題です。
  • 高い時間・空間分解能の必要性
    • てんかんネットワークのように数十ミリ秒単位で伝搬する活動や、脳深部のネットワークを正確に捉えるためには、高い時間分解能と空間分解能が必要です。
  • 計算コストとリアルタイム性
    • BCIのような実応用においては、低計算コストで高速応答が可能なモデルが重要です。
  • モデルの解釈性(説明可能性)
    • 深層学習モデルがどのような特徴に注目して予測を行っているのか、神経生理学的に意味のある形で解釈できることが重要です。脳反応について新しい発見をしたと思ったら、まばたきとか反射的な筋肉の電気パルスが原因だったなんてことも有り得ます。

3. 課題へのアプローチと解決策

上で挙げた課題に対して各研究は以下のようなアプローチを提案しています。

  • 深層学習モデルの活用と改良
    • 脳波信号の時間的、空間的、周波数的特徴を統合的に捉えるために、Convolutional Neural Network(CNN)(3Win5-53)、Gated Recurrent Unit(GRU)(3Win5-53)、Long Short Term Memory(LSTM)、Transformerベースのアプローチ、深層状態空間モデル(Deep State-Space Model) など、多様なモデルが用いられています。
    • てんかん発作のパターンに応じてエネルギー指標の計算方法を調整したり(1o4-OS-18a-02)、Wavelet-Convolutionにより決定的に得られた周波数成分と適応的に得られた周波数特徴を統合したりする(1Win4-70) など、脳波特有の性質を考慮したモデル構造が提案されています。
  • ドメイン適応(Domain Adaptation, DA)技術
    • 脳波の個人差に起因するドメインシフトを軽減するため、Domain-Adversarial Neural Networks (DANN) や、ワッサーシュタイン距離を用いた個人差評価に基づく学習データ抽出 が提案されています(3Win5-53)。これにより、少量データや異なる被験者間でもモデルの汎化性能を向上させることが期待されます。
  • アンサンブルモデル
    • うつ病の重症度分類のようにデータに大きな偏りがある場合、アンダーサンプリングやSMOTEなどの複数のサンプリング手法と組み合わせたアンサンブルモデル(バギングなど)が、過学習を防ぎ、分類精度や適合率を向上させるために提案されています(4L2-GS-10-05)。
    • ランダムフォレスト(4L2-GS-10-05) や多層ニューラルネットワーク(MLN)(2Win5-22) など、非線形かつ多クラス分類の手法が使われています。
  • 特徴量抽出とノイズ除去の洗練
    • パワースペクトラム解析、Morlet wavelet解析(1O4-OS-18a-02)、線形予測分析(LPA)によるスペクトラムの抽出(2Win5-22)、複雑度指標の算出(4L2-GS-10-04) など、目的に応じた多様な特徴量抽出手法が用いられています。
    • ノイズ除去のため、バンドストップフィルタ処理、common average referenceフィルタ、zスコア標準化、およびArtifact Subspace Reconstruction(ASR)や独立成分分析(ICA)によるアーティファクト除去(ノイズのこと) などの前処理が実施されています。
  • 視覚的説明可能性の追求
    • Grad-CAMを拡張した手法などを用いて、モデルが脳波信号のどの時間、空間、周波数領域に注目しているかを視覚的に説明可能にすることで、神経生理学的な解釈を支援しています(1Win4-70)。

4. 今後の展望

これらの研究は、脳波とAIを組み合わせることで、疾患の診断やBCIによるコミュニケーションまた人間の認知プロセスなどの分野で革新を起こすかもしれません。

今後の展望としては、AI支援による創造性への影響における個人差のさらなる検証、最適なパラメータの自動決定、限られた計算資源でのモデル運用、データの分布の最適化、多値分類への応用と個人差評価方法の見直し などの課題への取り組みが期待されています。

最後に

脳波AI研究はまだ進化の途中ですが、これらの論文は大きな可能性を示しています。
今後は、最適なパラメータの自動決定、脳波の個人差へのより頑健な対応、限られた計算資源でのモデル運用、など課題解決が期待されます。

脳波とAIの融合は、私たちの脳の謎を解き明かし、疾病の早期発見・治療から、より豊かなコミュニケーション、そして人間自身の創造性向上まで、これまでにない可能性を切り拓くことでしょう。このエキサイティングな分野の今後の発展に、ぜひご注目ください。

専門用語

ブログで使用された専門用語解説をgeminiに作ってもらったあとに、自分で手直ししました。
本文より手間かかってます。
間違いなどあれば教えてください。

  • 脳波 (EEG - Electroencephalography): 頭皮上に配置された電極で計測される脳の電気活動のことです。ブレイン・コンピュータ・インターフェース(BCI)において、人間の意図や認知状態を読み取るために利用され、医療分野では診断支援への応用が期待されています。脳波データは個人差やノイズの影響を受けやすいという課題があります。
  • 人工知能 (AI - Artificial Intelligence): 人間の知能を模倣する技術全般を指します。特に生成AIは、製品設計におけるアイデア発想支援などに活用が進んでいます。AIとの協調は、人間の創造性や思考プロセスに影響を与えることが研究されています。
  • スペクトルパターン: 音響のイコライザや聴覚の蝸牛間のしくみと同じ原理で、すべての連続的な波形は異なる周波数に分解できます。スペクトルパターンとは振動の周波数の異なる波に分解したときのパターンのことです。* てんかん外科手術: てんかんの発作を抑制するために行われる脳手術です。手術の成功には、発作を引き起こす最小限の脳領域であるてんかん原性領域(EZ)の正確な特定が不可欠です。
  • 発作起始領域 (Seizure Onset Zone: SOZ): てんかん発作の起点となる脳領域のことです。てんかん原性領域(EZ)を一部包含するとされています。SEEG(定位的頭蓋内脳波)データからこの領域を自動かつ高時間分解能で推定するアルゴリズムが開発されています。
  • TAILOR (Tailored Algorithm for Ictal Localization and Onset prediction): てんかん発作の起始を患者個別のパワースペクトルパターンに基づいて高時間分解能で自動検出するアルゴリズムです。発作起始の順序を決定することで、てんかんネットワークの推定に役立ちます。患者の発作パターンに応じたエネルギー指標の計算や境界周波数の選択を行う「オーダーメイド」の手法が特徴です。
  • Epileptogenicity Index (EI): てんかん原性領域(EZ)を定量的に推定するための指標の一つで、時間的・エネルギー的パラメータに基づいて算出されます。発作波の多様性や伝搬速度の速さにより、解析が困難な場合もあります。
  • ブレイン・コンピュータ・インターフェース (BCI - Brain-Computer Interface): 脳活動を計測し、コンピュータやロボットなどの外部機器と直接通信を可能にするシステムの総称です。特に身体麻痺患者のコミュニケーション支援やリハビリテーション支援、機器制御への応用が期待されています。普及には計算コストの低減と高い汎化性能が重要とされています。
  • 運動想起 (Motor Imagery: MI): 実際に身体を動かすことなく、特定の運動を心の中で想像する際の脳活動を指します。BCIにおける重要な研究対象であり、脳波・頭蓋内脳波(ECoG)から想起された行動を分類するタスクに利用されます。特定の脳領域や周波数帯域で信号強度の変動が見られることが知られています。
  • 多クラス分類: 複数の異なるカテゴリ(クラス)の中から、入力データがどのカテゴリに属するかを識別する機械学習のタスクです。例えば、運動想起で複数の異なる行動(肘の伸展、屈曲、手の伸展、掌握など)を分類するタスクや、うつ病の重症度を健常、軽度、中等度、重度の4段階に分類するタスクなどで用いられます。
  • 音声想起信号 / 母音音声想起信号: 音声言語を想起した際に脳波(EEG)に現れる信号のことです。特に本研究では、想起された短音節中の母音を認識することを目指しており、言語表象が周波数スペクトラム情報として脳波信号に畳み込まれると考えられています。
  • 生成AI (Generative AI): 新しいアイデアやコンテンツを生成する能力を持つ人工知能のことです。製品設計におけるアイデア発想の支援ツールとして利用され、人間の創造性に影響を与える可能性が研究されています。
  • 発散的思考 (Divergent thinking): 多様なアイデアや解決策を自由に生み出す思考プロセスを指します。工学設計におけるアイデア発想の際に用いられ、生成AIの支援によってパフォーマンスが向上する一方で、思考の均一化や抑制の可能性も示唆されています。
  • 収束的思考 (Convergent thinking): 生み出されたアイデアを評価し、選択する思考プロセスを指します。工学設計において重要であり、人間同士や人間とAIの協調下での脳内メカニズムが研究されています。
  • 左下前頭回 (Left inferior frontal gyrus: L-IFG): 脳の左前頭葉に位置する領域で、思考に制限をかけるように働くとされています。生成AI使用時にこの領域の脳活動(θ帯域)が活性化することが示され、発散的思考が抑制される可能性が示唆されています。
  • 左背外側前頭前野 (Left dorsolateral prefrontal cortex: L-DLPFC): 脳の左前頭前野の背外側部に位置する領域で、限られた経験から一般化し予測を行う帰納的推論に関連する領域とされています。AIとの協調による有用性評価時に活性化する傾向が見られました。
  • 右頭頂側頭接合部 (Right temporoparietal junction: R-TPJ): 脳の右頭頂側頭部に位置する領域で、相手の意図を推察することに関連するとされています。AIとの協調による有用性評価時に有意な活性化が見られました。
  • 生理学的アーティファクト: ファンタジーの世界とかでは遺物とか、工芸でいうと素晴らしい作品のようないい意味合いで使われますが、この業界では悪い意味で使われます。脳波(EEG)や頭蓋内脳波(ECoG)の記録中に混入する、生体由来のノイズ信号のことです。例えば、まばたきや嚥下などがこれにあたり、正確な脳活動の解析を妨げるため、前処理によって除去されます。もともと人為的な何かのことをアーティファクト(Artefact)と呼ぶようです。
  • ドメインシフト (Domain shift): 機械学習において、学習に用いたデータと、実際の運用環境で予測対象とするデータの性質(確率分布)が異なることで、モデルの予測精度が低下する現象を指します。脳波データにおいては、個人の特性が強く反映されるため、個人差によってドメインシフトが発生しやすいとされています。
  • Wavelet-Convolution: 深層状態空間モデルにおけるモジュールの一つで、決定的に得られる周波数成分と、適応的に得られる周波数特徴を統合します。これにより、周波数解析可能な特徴量を抽出しつつ、脳波の高精度な分類を目指します。
  • Frequency-SSM (Frequency-State-Space Model): 深層状態空間モデルにおけるモジュールの一つで、周波数成分ごとに独立して時間的・空間的特徴の依存関係を捕捉します。運動想起に関連する周波数成分ごとの強度変動を捉えることを期待されています。
  • Channel-SSM (Channel-State-Space Model): 深層状態空間モデルにおけるモジュールの一つで、電極ごとに独立して時間的・周波数的特徴の依存関係を捕捉します。これにより、運動想起に関連する局所的な脳領域の信号強度変動を検出することを目指します。
  • 深層状態空間モデル (Deep State-Space Models): 脳波・頭蓋内脳波信号の時間、空間、周波数領域における統合的な依存関係を捕捉するために拡張された深層学習モデルです。長系列信号の時系列依存関係の捕捉において、Transformerを上回る結果が報告されています。
  • CNN-GRUハイブリッドモデル: CNN(Convolutional Neural Network)による空間的特徴抽出と、GRU(Gated Recurrent Unit)による時間的特徴抽出を組み合わせたモデルです。計算負荷を軽減しつつ、少量の脳波データから運動想起を判別するために提案されました。
  • アンサンブル学習 / バギング (Bagging):
    • アンサンブル学習: 複数の異なる学習モデルを組み合わせることで、単一モデルよりも高い性能を目指す機械学習の手法全般を指します。
    • バギング (Bagging): アンサンブル学習の一種で、データセットから複数のサブセットを(重複を許して)ランダムに抽出し、それぞれのサブセットで独立したモデルを訓練し、それらの予測結果を統合する手法です。うつ病の重症度レベル推定において、データの偏り(クラス不均衡)に対処するために利用されました。
  • Domain-Adversarial Neural Networks (DANN): ドメイン適応のための敵対的学習手法です。特徴抽出器が、異なるドメイン(データセットなど)間で区別できない特徴を学習することで、ソースドメインで得た知識をターゲットドメインに転移させ、モデルの汎化性能を向上させます。
  • ワッサーシュタイン距離 (Wasserstein distance): 二つの確率分布間の「距離」を測る手法の一つです。ドメインシフト評価指標として用いられ、脳波データの個人差を定量的に評価するために活用されました。離散的な分布に適しており、特徴量の出現確率を考慮できる点で優れています。
  • うつ病の診断支援 / 重症度レベル推定:
    • うつ病の診断支援: 従来の医師による主観的な問診に加えて、脳波データのような客観的な指標を用いた機械学習により、診断の客観性や精度を高める取り組みです。
    • 重症度レベル推定: 単に「うつ病であるか否か」の二値分類だけでなく、うつ病の症状の程度(例:健常、軽度、中等度、重度)を複数段階で分類することです。これにより、より詳細な診断支援が可能になります。
ヘッドウォータース

Discussion