人間の認知機能に倣ったAGIアーキテクチャの提案【論文要約】
はじめに
こんにちは、AIエンジニアを目指しているmitaです!
今回は、
A Universal Knowledge Model and Cognitive Architecture for Prototyping AGI
という2024年1月ごろにArtem Sukhobokov氏らが発表したAGIを構成するアーキテクチャを提案している論文を要約 & 考察していきます。
論文要約
- AGIを「人間のように多様な課題を解き、異なる領域に適応する存在」と定義
- それを作成するために人間の認知機能をモデル化することがAGI設計のベースになるという立場をとる
- 各々だと機能が部分的であり、AGI実現には全体を統合するアーキテクチャが必要だと考える
- 既存の認知アーキテクチャを分析しAGIに必要な要素を17つ選定、統合アーキテクチャを提案
論文詳細
論文の全体的な流れは以下のようになります。
1. 過去論文から人間の認知機能をモデル化したアーキテクチャを140種類抽出
2. その中からAGI作成に関わる条件を満たすアーキテクチャを42種類選定
3. 人間の認知プロセスと照合することによってコアとなるアーキテクチャ17種類を決定
この章ではそれぞれのプロセスに関して、詳しい条件や抽出されたアーキテクチャについてまとめていきます。
1. 過去論文から人間の認知機能をモデル化したアーキテクチャを140種類抽出
この過程では、本論文の研究対象となる母集団を選んでいます。
選定されたアーキテクチャは140種類ですが、これらは下記Iuliia Kotseruba氏らの先行研究から抽出されたものでした。
こちらの論文は2016年10月に発表されたもので、1970年代から2018年までの過去40年の間で提案された140種類以上の認知アーキテクチャをまとめた論文です。
Kotseruba氏の論文では下記2つの条件どちらかに適合するアーキテクチャを網羅的にまとめたものです。
1. 認知アーキテクチャとして自己申告されている
2. 研究で認知アーキテクチャと分類されている
認知アーキテクチャのカタログ的な存在で、質やAGI適正では選別していませんでした。
2. その中からAGI作成に関わる条件を満たすアーキテクチャを42種類選定
Sukhobokov氏は140種類の認知アーキテクチャから下記条件で42種類まで絞り込みました。
1. AGIを目指すことを明確に掲げているもの
2. 人間の包括的な認知プロセスをモデル化していること
3. 単一ドメインではなく複数領域に適用できる汎用性を想定していること
4. 理論的に「全体知能」の設計を意識していること
逆に下記のようなアーキテクチャは選定外となっています。
- タスク特化・ドメイン特化型
チェス専用AIや特定ゲーム専用アーキテクチャなど
汎用性がなく、多領域への転用を目的としていない - 人間の単一認知機能だけを模倣したモデル
視覚処理モデルなど
記憶や注意など、単一プロセスに限定されたもの - AGIを目指していない産業用システム
ロボット制御・軍事訓練・シミュレーション専用のフレームワーク
実用特化で、汎用的な認知設計思想を持たない - 知能ではなく「計算効率」が目的のフレームワーク
単なる高速推論エンジンや最適化アルゴリズム
3. 人間の認知プロセスと照合することによってコアとなるアーキテクチャ17種類を決定
上記の手順で選定されたアーキテクチャを、さらに下記手順に基づき17つまで選定した。
1. 42アーキテクチャの機能マッピング
2. 人間の認知プロセスと照合
3. 機能の重複を整理しコア機能に統合
4. カバレッジの検証
42アーキテクチャの機能マッピングでは、どの機能がどの認知機能を持っているかリストアップ。
具体的には意識、学習、記憶、推論、感情、目標管理などの機能でチェックリスト化している。
人間の認知プロセスと照合では、「AGIは人間レベルの知能に匹敵すべき」という前提の元、人間の知能を構成する主要なプロセスを心理学や神経科学から導き、機能を対応付けした。
機能の重複を整理しコア機能に統合では、複数のアーキテクチャが共通でもっている機能をまとめ、それらをAGIに必要な中核と定義した。
逆に1つのアーキテクチャしかない特殊機能は必須とみなされない。
カバレッジの検証では、先で定義した中核と、42アーキテクチャそれぞれを比較検討して、定義を100%満たしているアーキテクチャが存在しないことを確認。
それらより、既存アーキテクチャは部分的なものであり、統合できればAGIの骨格になると結論付けている。
選定された17アーキテクチャ
1. 意識
リアルタイム行動制御の役割。
現在の状況を評価し、外部環境と目標に基づいて行動を選択する。
複雑な状況での柔軟な意思決定に必須で、人間の「意識的思考」に相当する。
2. 無意識
定型的な行動や習慣の自動化が役割。
意識を使わずに高速に処理できるパターンを実行する。
リアルタイム制御での遅延回避に使用し、人間の「スキルや習慣化された行動」に相当する。
3. 目標管理
短期・中期・長期目標を生成・更新・優先付けする役割。
AGIに「自律的行動」を与える中枢。
4. 感情制御
状況や出来事に対する「感情的評価」を作り、他モジュールに影響を与える役割。
優先度付けや行動選択のバイアスを作り、人間のモチベーションや価値判断を模倣する。
5. 倫理評価
行動や出来事に倫理的な評価を付与する役割。
社会適合的な行動を取るために不可欠。
6. 世界観
AGIが持つ「世界のモデル」とその中での自己の位置付けを形成。
知識統合と自己の存在意義の基盤。
7. 自己反省
過去の行動・結果を評価し、改善策を生成。
継続的な学習と自己改善の中核。
8. 社会的インタラクション
他のエージェントや人間との関係性を管理。
単独ではなく社会システム内で動作するAGIに必須。
9. 学習
新しい知識を知識ベースに統合する役割。
AGIが「固定システム」ではなく「進化する存在」であるために必須。
10. モニタリング
外部環境と内部状態を監視する役割。
継続的な安定動作と自己調整に必須。
11. 課題設定
新しい問題やタスクを定義し、細分化。
AGIに「自分でやることを決める力」を与える。
12. 問題解決
与えられた課題に対して解を導出。
知能のコアとなる機能。
13. 自己組織化・メタ学習
自らの活動や学習手法を再構築。
長期的な適応と「自律進化するAGI」の基盤。
14. マルチモーダル入力
視覚、聴覚、言語、触覚など複数の感覚情報を統合し、知識に変換する。
単一データモードでは汎用性が生まれないので、人間と同じく複数の感覚から世界モデルを形成するために必須。
15. マルチモーダル出力
音声、テキスト、動作など複数の形式で情報を外部に出す。
人間との自然な対話や複雑なタスクの遂行に不可欠。
16. 運動制御
物理的な行動(ロボットの動作や仮想空間でのアクション)を生成する。
知識や思考を「行動」に変換する最後のレイヤー。
17. 知識ベース
全モジュールがアクセスする統合的な記憶装置。
知識の長期保存・再利用、学習の基盤。
上記17アーキテクチャを共通知識バスと呼ばれる、複数のモジュールが共有する知識の伝達経路を介して統合することが提案されている。
個人的な意見
学士レベルの論文以外あまり見たことがない私としては、過去の研究をまとめて新たな提案をする、という論文にいい思い出がなかったのですが(ド偏見)、いい意味で期待を裏切られました。
過去の論文をもとにしているだけあって、すでに個々は確立されていそうですし、感覚的にも既存LLMやAIエージェントで使用されている技術が活きそうですよね。
それでいくと難しそうなのは目標管理、感情制御、世界観あたりでしょうか。
「人間にとって何が善で何が悪か」はそれこそ状況によって変わり、「何を重要視するか」は個人によってまちまちです。
全人類に受け入れられるAGIは汎用的である者の機能として深みがなくなり、パーソナライズされたAGIはコストがかさんで現実味が薄くなるような気もします。
他には既存技術が多い中でそれらを統合することができていないという事実を考えると、技術的何かがそれを阻害しているということですよね。
いったい何がボトルネックになっているのでしょうか?
...今回得た知識と残った疑問点をまとめると下記のようになりました。
- AGIを構成するための必要最低限な条件が分かった
- 大体が既存研究でカバーできそうな領域
- 個人に依存する領域をどう学習・反映するのか
- 各技術を統合できない理由は何か
論文は読めば読むほど知識はつくし好奇心も搔き立てられてめちゃくちゃ面白いですね!
次回以降は今回残った疑問に回答できそうな論文を読みたいと思います。
よかったら次回もまた見てください!
Discussion