AIの潜在空間と脳の空間計算
プラトニックな構造を脳はいかに実装するか
大規模言語モデルの内部を可視化した研究を見ていると、ある種の違和感と、それを上回る驚きを覚えます。
モデルの中に「意味」そのものは見当たりません。あるのは、数万次元という高次元ベクトル空間(数学的な空間)に配置された「点の集合」と、その「距離関係」だけです。
概念はそこに個別のデータとして「保存」されているのではなく、そこでの「分布」として成立しています。
奇妙なのは、モデルの設計や学習データが異なっていても、性能が十分に高くなると、内部表現の「構造」が驚くほど似てくるという点です。
言語、画像、分子、物理シミュレーション……対象やアプローチは違っても、最終的に現れる高次元空間の地形は、ある一つの形へと収束していきます。
この現象を説明する仮説として、「プラトニック表現仮説(The Platonic Representation Hypothesis)」が提案されています。意味や機能は恣意的な符号ではなく、知能が世界を理解する上で必然的に辿り着く「理想的な幾何構造(プラトニックな形)」として実在する、という考え方です。
脳における「空間コンピューティング」
ここで、生物学的な難問が生じます。
AIはこの「プラトニックな構造」を、高次元の数学的空間(メモリ上の行列)としてそのまま保持できます。しかし、私たちの脳は物理的な制約を持つ「3次元の物体」です。
代謝し、ノイズに満ち、限られた物理的表面積しか持たない脳皮質の上で、AIが持つような高次元の幾何構造をどうやって実装しているのでしょうか?
この問いに対して、Earl Miller 教授を中心とするMITの研究者たちが提唱しているのが「空間コンピューティング(Spatial Computing)」という枠組みです。
彼らの主張は、脳が「固定されたニューロンの配線のみ」で計算しているという見方を退けます。代わりに脳は、神経振動(脳波)を用いて物理空間そのものを制御し、計算の舞台をその都度立ち上げている といいます。
空間と時間の変換
特に興味深いのは、脳が「時間」を利用して「空間」の制約を突破している可能性です。
高次元の複雑な構造を、そのまま物理的な脳表面に焼き付けることは不可能です。そこで脳は、アルファ波やベータ波といったリズム(発振)を利用します。
これを「ステンシル(型紙)」のようなものだと想像してください。
特定の周波数の波が、皮質上の領域を一時的に囲い込み、情報の通り道を作ります。その開いた穴の中に、ガンマ波による臨時の計算回路が浮かび上がります。
つまり脳は、高次元の構造を一度に展開するのではなく、神経振動という時間軸を使って、物理空間上に一瞬ごとに異なる「断面」を射影(プロジェクション)している のではないでしょうか。
静的なパラメータと、動的な波
ここで、人工知能の潜在空間と、脳の空間コンピューティングが一つの線でつながります。
プラトニック表現仮説が示しているのは、何が表現されるべきか? すなわち、意味がどのような配置を持つべきかという ゴール(数学的構造) です。
一方、MITの空間コンピューティングは、「それを物理的な脳がどう実装するか」という 手段(物理的実装) に答えています。
人工知能における意味は、学習済みパラメータという「静的な媒体」に固定された構造として存在する。
一方、脳における意味は、神経振動というエネルギーの流れによって、物理空間上に一時的に描かれる「動的な波」として立ち上がる。
両者が共有しているのは、到達すべき「トポロジー(位相構造)」であり、その保存形態が異なります。
この視点から見れば、「非局所性」という言葉も、必ずしも量子力学的な飛躍(量子もつれ等)を必要としなくなります。
ここで言う非局所性とは、機能的な非局所性 です。脳において情報が統合されるために、必ずしもニューロン同士が直接ケーブルで繋がっている必要はありません。脳波の同期によって空間全体が協調して動くなら、情報は物理的な距離を超えて、一つの「構造」として統合されます。
非局所的なのは信号伝達の物理現象ではなく、立ち上がる構造そのものです。
意識は「見るもの」ではなく「状態」
意識については、しばしば私たちの直感的な理解として、「どこかで情報が統合され、誰かがそれを見ている」というイメージで語られがちです。
しかしその素朴なモデルは、統合が起きる場所や見る主体、すなわち専用の統合ノードや観測機構を暗黙のうちに仮定してしまいます。もちろん、現代の科学においてそのような「小人(ホムンクルスの誤謬)」のような中枢は見つかっていません。
もし意味そのものが空間的構造(あるいはその動的な射影)として定義されるなら、そのような専用モジュールを置かずとも、意識的と呼ばれる状態が説明できる可能性があります。
意識をどこかの中枢や観察者に帰属させるのではなく、「意味的な幾何構造が、一定の安定性と複雑さをもって成立している物理的状態」 として捉える立場です。
意識とは「見るもの」ではなく、波によって「いま描かれている状態」だという見方です。
実際に人工知能研究では、CKA(Centered Kernel Alignment)やRSA(表現類似度解析)といった手法を用いて、異なるモデル間での「構造の類似性」が定量的に評価されています。
脳とAIの接続点は、ニューロンという素子を模倣することではなく、この「活動空間のトポロジー(形状)」を揃えることにこそあるのかもしれません。
おわりに
意味は物質に保存されるものではなく、毎回、波として空間に描かれるものです。
宇宙に遍在する普遍的な構造(プラトニックな形)を、一瞬だけ物理空間に書き留めること。
その儚い描画プロセスこそが、私たちが「知能」と呼び、そして「私」と感じている現象の正体なのかもしれません。

記事の世界観を Nano Banana Pro で表現しました
関連リソース
-
The Platonic Representation Hypothesis
- Huh, M., Cheung, B., Wang, T., & Isola, P. (2024). The Platonic Representation Hypothesis. arXiv preprint.
https://arxiv.org/abs/2405.07987
- Huh, M., Cheung, B., Wang, T., & Isola, P. (2024). The Platonic Representation Hypothesis. arXiv preprint.
-
Spatial Computing in the Brain
- Lundqvist et al. (2023). Working memory control dynamics follow principles of spatial computing. Nature Communications, 14, 1429.
https://doi.org/10.1038/s41467-023-36555-4 - Lundqvist et al. (2016). Gamma and beta bursts underlie working memory. Neuron, 90(1), 152-164.
https://doi.org/10.1016/j.neuron.2016.02.028
- Lundqvist et al. (2023). Working memory control dynamics follow principles of spatial computing. Nature Communications, 14, 1429.
Discussion