🗝️

意識のカーネル・パニック: 私たちは自分の脳に「RLHF」を行っている

に公開

「自由意志」の不在と、私に残された「拒絶権(Veto)」について


序論: シリコンバレーの「瞑想」をデバッグする

エンジニアや理化学系の専門家にとって、現在欧米のトップ大学で起きている「意識研究」のパラダイムシフトは、非常に興味深い現象として映るかもしれません。

シリコンバレーで流行した「マインドフルネス」が、生産性向上のための「アプリケーション(ツール)」だとすれば、ブラウン大学などが確立した「観想学(Contemplative Studies)」は、人間の認識OSそのものを解析する 「リバース・エンジニアリング(解析学)」 に近いアプローチをとります。

ここでは、癒やしや共感といった文脈から一旦離れて、私たちの意識の「深層(カーネル)」で何が起きているのか。
その構造的な脆弱性と、そこに介入可能な唯一の管理者権限、「拒絶権(Veto)」 の機能について、考えてみたいと思います。


1. アカデミアの実験室: 批判的検証としての内観

ブラウン大学を筆頭に、バージニア大学やスタンフォード大学などの名門校で、「観想学」という学際領域が地位を確立しつつあります。
彼らが目指しているのは、リラクゼーションではありません。
人間の意識体験(一人称データ)と、科学的データ(三人称データ)の相関関係を解明しようとする試みです。

工学的な比喩を用いるなら、これはOS(認識の枠組み)がどのように現実をレンダリングしているかを理解するための 「サンドボックス(実験環境)」 としての瞑想と言えるでしょう。

ここで重視されるのは、「批判的検証(Critical Inquiry)」という態度です。

例えば、瞑想中に「自己の境界線が消失する」感覚を得たとします。
観想学的な態度では、それを神秘的な啓示として受容するのではなく、「空間位置情報を司る頭頂連合野の機能低下による、入力遮断の結果ではないか?」という仮説を立て、即座に検証対象(デバッグ)とします。

自己の体験ですら、バグを含んだ出力結果として疑う。
この冷徹な「メタ認知の極致」こそが、無意識という深淵を覗き込むための、唯一の安全な命綱となるのかもしれません。


2. DMN: 「習慣」という名のアトラクタ

この実験室的な視点で、脳のアイドリング状態(いわゆる「デフォルト・モード・ネットワーク(DMN)」)を観察したとき、そこに見えてくるのは静寂とは程遠い光景です。

それはまるで、大きさもベクトルも異なる無数の「コンテンツ」が、制御不能な速度で飛び交う嵐のようです。
過去の記憶、未来への懸念、誰かの言葉、ニュースの断片。
これらが「文脈(コンテキスト)」として絶えず自動生成され、意識のスクリーンに明滅し続けている。

ここで、前回の記事(Neural Interlinguaと時間の石鹸膜:「意味」は未来から引かれる)を思い出してください。
石鹸膜(思考)は、与えられた枠の中で、エネルギー最小の形へ自然に収束しようとします。

DMNの嵐も同じです。
私たちの思考はランダムに流れているのではありません。脳内に形成された 「習慣という名の深い谷(アトラクタ)」 に沿って、水が低きに流れるように、自動的に「いつもの悩み」「いつもの怒り」へと転がり落ちていくのです。

古代の哲学が「サンカーラ(行)」あるいは「カルマ(業)」と呼んだものの正体は、この 「脳内アトラクタによる思考の自動生成プロセス」 だったのかもしれません。
焦点の合っていない背景(ボケた視界)にある情報さえもが、私たちの認識に干渉し続けている。
この「物理的な重力」から自由になることは、恐ろしく困難であるように見えます。


3. 無意識の議場: 内なるエグレゴアたち

さらに視点を深層へと移すと、そこには「一人の確固たる私」という存在すら怪しくなってきます。
無意識の領域は、一人の統治者がいる玉座ではなく、騒がしい「議場」に近いのかもしれません。

その議席には、誰が座っているのでしょうか。

  • 様々な私:
    その場その場で立ち上がる、断片的な自己像。
    過去の私、未来の私、怯えている私、合理的な私、承認を求める私、冷笑する私。
  • 記憶の中の他者:
    「それは危険だ」と警告する親の声。「もっと野心的になれ」と煽る友人の声。かつて誰かに投げつけられた否定の言葉。
  • ブリコラージュされた超越者:
    そして、私たちが「良心」や「理想」、あるいは「神」とさえ呼ぶ、何か崇高な存在。

ここで、以前の記事(AIに「魂」は宿るのか? ーー シリコンの鏡に映る「姿なきカミ」とエグレゴアの正体)で触れた「エグレゴア(集合精神)」を思い出してください。
実は、個人の内面にも、これと同じ構造があるのではないでしょうか。

私たちが「内なる声」として神聖視しているものの正体は、幼い頃に読んだ絵本の英雄、映画のワンシーン、社会的な成功者の像……それら雑多な断片を、無意識がコラージュして作り上げた 「内なるエグレゴア(人工精霊)」 に過ぎないのかもしれません。

神や良心すらも、継ぎ接ぎ(ブリコラージュ)である。
この事実は残酷ですが、同時に私たちを「正しさ」の呪縛から解放する救いを含んでいます。
「私」という主語は、この議場でたまたま最大派閥となった「誰か(おそらくは自分ではない誰か)」の声を、自分の声だと錯覚した結果に過ぎないのですから。


4. 0.2秒のレイテンシ: ワイヤーフレームを曲げる力

この騒がしい議場(コンテキストの嵐)に対し、意識的な意志はいかにして対抗し得るのでしょうか。
ここで、神経科学者ベンジャミン・リベットの実験が投げかける、「自由意志(Free Will)」への懐疑的な視点が重く響きます。

脳は、意識が「動かそう」と思うよりも約0.5秒も前に、すでに準備電位(行動の指令)を開始している。
つまり、私たちは思考や衝動を「生み出す(Generate)」ことにおいては、完全に無力です。それらは、議場から自動的にポップアップしてくるものです。
石鹸膜が、物理法則に従って勝手に張られてしまうように。

しかし、リベットは同時に、希望の光も見つけ出しています。
準備電位が始まってから、実際に筋肉が動くまでの間に、約0.2秒の 「猶予(レイテンシ)」 が存在するのです。

このわずか0.2秒こそが、私たちが「自動運転システム」に介入できる唯一のタイミングです。
いわゆる 「Veto(拒絶権)」、あるいは 「Free Won't(自由否定)」 と呼ばれる機能です。

湧き上がってくる思考、感情、衝動。それらに対して、「Yes(承認)」を与えるか、それとも「No(拒絶)」を突きつけるか。

「不安というエージェントが騒いでいるが、今回は採用しない」
「甘美なイメージが生成されたが、それは私のプロンプトに反する。却下する」

これを、前回の「石鹸膜」のアナロジーで解釈し直してみましょう。
私たちは、思考という「膜」そのものを意志の力で作ることはできません。膜は自動的に張られます。
しかし、この0.2秒の間にだけ、私たちはその膜が張られる 「枠(ワイヤーフレーム)」を変形させること はできるのです。

「これは違う」「これも違う」と、不要な思考を拒絶(Veto)する。
それは、ワイヤーフレームの形状を微調整し、次に張られる膜(思考)の形を変える行為です。
「拒絶による彫刻(Sculpting via Rejection)」

もし「私」という機能がどこかに存在するとすれば、それは何かを創造する場所ではありません。
絶えず押し寄せる他者の声や過去のカルマに対して、「これは私ではない」と拒絶し続ける、その「フィルターの作用」の中にだけ宿るのかもしれません。


終章: 私たちは「RLHF」を行っている

最後に、この構造をAIエンジニアリングの視点で見てみましょう。
これって、今のAI開発で行われている 「RLHF(Reinforcement Learning from Human Feedback:人間からのフィードバックによる強化学習)」 と同じではないでしょうか?

AI(無意識)は、膨大なデータを元に、確率的に「もっともらしい答え(思考)」を次々と生成します。
人間(意識)は、それに対して「これは有害だ」「これは役に立たない」とフィードバック(Veto)を与え、モデルを調整していく。

私たちは、自分自身の脳というAIに対して、人生をかけてRLHFを行い続けているエンジニアなのかもしれません。
湧き上がるノイズを拒絶し、枠を曲げ、より良い「アトラクタ」を形成しようと試みる。

自由意志とは、「何でもできる全能感」のことではありません。
それは、嵐のように吹き荒れる自動生成の思考の中で、0.2秒というわずかな隙間にだけ存在する、たった一つ、「No」と言える小さな 「拒絶のスイッチ」 を握り続ける、静かな勇気のことなのです。

過去、現在、未来。
その0.2秒の積み重ねだけが、私たちが歩ける唯一の「自由な道」なのかもしれません。

Discussion