谷淳『ロボットに心は生まれるか 自己組織化する動的現象としての行動・シンボル・意識』(翻訳協力・山形浩生)

認知ロボティクスの観点から、記号接地問題や行動生成・自由意志について論じた本
現象学やダイナミックシステム(力学系)アプローチをベースにした研究で、ロボットについていうと、リカレントニューラルネットワーク(RNN)に予測符号化させている、というような感じになっている気がする。
正直、専門性が高くてむずいので、あんまり内容を理解できていない気がするが……。


本書を手に取ったきっかけは、以下の山形浩生のブログ

その意味でぼくが意識についての議論でいちばん納得がいくのは、谷淳の説。
この人はロボットに意識らしきものを発生させるというおもしろい研究をしているんだけれど、そもそもなんで意識なんてものがいるのか、と問う。
(中略)
意識というのが必要なのは、脳からのトップダウンの命令と、感覚器からのボトムアップの刺激反応とが矛盾する場合だ。その両方がぶつかることで、その判断の回路に決定論的カオスが生じる。それが意識なんだ、と谷は主張する。
これがおもしろいのは、自由意思問題からうまく逃げられること。
意識・知性・良心? Conscousnessの混乱 - 山形浩生の「経済のトリセツ」

カオスを用いた脳研究があるというのは知っていたけど、どういうものか知らなかったので、気になった。
「脳からのトップダウンの命令と、感覚器からのボトムアップの刺激反応とが矛盾する」というの、予測誤差っぽいなあと思ったら、ほんとに予測誤差の話をしていたし、なんなら、本書は予測誤差信号のことを意識と呼んでいるような感じもある。
決定論カオスが生じているのは、トップダウンの予測信号を出してるサブネットワークのことかな、と思う。


ところで、山形は、本書の翻訳協力としてクレジットされている。
本書は、もとは英語で出版されたもののようである。
博論を出版しようするもなかなか話がまとまらなかったところ、マイケル・アービブという神経科学者の目にとめり、『オックスフォード認知モデルとアーキテクチャシリーズ』というところから出版されたらしい(2016年)
筆者の谷は、大学出た後、一度プラント・エンジニアリング企業に就職した後に、大学院に入り直したという経歴で、職歴としては、ソニーの研究所→理研→KAIST→OISTらしい。


本書の構成は大きく二部に分かれており、
前半は、議論の前提になる基礎知識として、認知科学、現象学、脳科学、非線形力学、ニューラルネットワークについての解説がなされている。ただ、この中でも、筆者独自の論点提起が結構なされているという印象で、これが後半へとつながってくる。
後半では、筆者が実際に行ったロボティクス実験の結果を紹介しながら、筆者の提案する自由意志や意識についての理論が展開されていく。


意識についての理論、ではあるのだが、読んでいて思ったのは、ここでいわれている意識は、現象的意識ではなく反省的意識なのではないかな、と思った。
また、最終目標として、意識の説明がおかれているものの、そこに至るまでの道筋として、どうやったらニューラルネットワークを用いて行動が生成されるのか。そこに、意図や自発性、自由意志のようなものはどのようにしたら生じるのか、というのが多くを占めている印象だった。
このあたり、もちろん心身問題として大事だし面白い話ではあるので興味深く読んだが、こと意識という論点だけでいうと、自分の関心とは必ずしも合致しなかったかなあ、というところはある。

第Ⅰ部 心について
 第1章 心にどこから手をつけるべきか?
 第2章 認知主義
 第3章 現象学
 第4章 脳と脳科学入門
 第5章 身体化認知モデル化のためのダイナミックシステムアプローチ
 
第Ⅱ部 創発的な心――ロボティクス実験からの知見
 第6章 新しい提案
 第7章 行動の結果から世界について予測的に学習する
 第8章 感覚・運動フローの分節化によるミラー行動生成と認識
 第9章 行動のための機能階層を発達させる
 第10章 行動のための自由と意識化された認識
 第11章 結論

はじめに

謝辞のような感じで人名がたくさんあがっている
池上高志、津田一郎、フランシスコ・ヴァレラ、カール・フリストン、マイケル・アービブ、浅田稔、國吉康夫、伊藤正男、甘利俊一

 

第1章 心にどこから手をつけるべきか?

第2章 認知主義

2.1 表象システムにおける構成と再帰性

認知主義の背景に、合成性の原理と再帰性(無限)があることを確認する。
合成性の原理は、フレーゲの原理のように思うが、エヴァンズが引用されている。
再帰の話は、チョムスキーのそれ
チョムスキーは人間の言語の特徴として再帰性をあげ、これが無限な生成を可能にしているということをいっているが、筆者は、そもそも無限は必要か、現実的には有限で十分ではないか、ということを指摘している

2.2 いくつかの認知モデル

ニューウェルとサイモンの一般問題解決器についての紹介
行動のひとかたまりが「チャンキング」される(コップを手に取る、とか)
筆者は、チャンキングは、シンボルか連続的な知覚フローかという点を問題提起する(筆者は後者寄り)

2.3 シンボルグラウンディング問題(記号接地問題)

ハーナッドの提案
→上層部にシンボル系、下層部に非シンボル的パターン処理のハイブリッドシステム
これは、連続的な感覚・運動フローを離散的シンボルの集合に分類すること
筆者は、(この連続的なものを、離散的なシンボルに対応させるということを)心身問題・相互作用問題と同様に二元論であると指摘する。
また筆者は、グラウディングができたとして、マッチングプロセスが失敗したときに問題が生じると指摘する。
失敗した際に、停止してしまうのではなく、相互作用により回復しなければならないが、感覚・運動系の動的な相互作用が、離散空間で定義されたシンボル系に可能か、と。

2.4 文脈

文脈(背景情報)の指示は無限後退に陥る

第3章 現象学

筆者は、心や意識がどういうものか考える上で、現象学(とジェームズ)の考えを重視する。
本章より後の章では、神経科学や筆者のロボティクス実験の結果などを、現象学の照らし合わせたりしている。

  • 直接体験

マッハの例の絵→フッサール「直接体験」
主客未分離の状態(西田哲学など)

3.2 主観的な心と客観的な世界

感覚の直接体験である「現出」から、志向性により記号的表象である「現出者」へ至り、現出者から現出といつ体験が再構成される
知覚経験の現象はこの二重性の上に成り立つ
しかし、現象学は、直接体験と記号を別々の存在とするのではなく、最初は単一の存在だったものから、どうしても見かけ上の両極性が生じたか考える

3.3 時間の知覚――主観体験の流れはどうやって客観化されるのか?

フッサールにおける3つの時間

  • 先経験的時間(過去把持、原印象、未来予持)
  • 客観的時間

先経験的時間は「今性」をつくるが過去を持たない。今を過去にしていくと客観的時間

  • 絶対的流

筆者は「絶対的流」を「意識が流れると時間は淀む」と表現する

3.4 世界内存在
  • ハイデッガー

道具の存在
道具は基本的には透明な存在だが、統合構造が崩壊すると明らかにされる(ハンマーと釘、打ち損ねたときに意識される)
時間について、ハイデッガーとフッサールとの違い
→死という終わりを意識しているかどうか

3.5 心の身体化

メルロ=ポンティについて
盲人の杖、幻肢やシュナイダー事例、共感覚分析など

3.6 意識の流れと自由意志

ウィリアム・ジェームズ
『心理学』で、意識の流れの4つの特徴を挙げる
2つ目の特徴について、安定した「停止」と移行的な「飛行」との交替と表現
筆者はフッサールの時間意識を「意識が流れると時間は淀む」と解釈したが、それと類似
自己性は連続性から生じる


ジェームズは、自由意志の「2段階モデル」を提案
すわなち、ランダム性と決定論的な評価の2段階
ジェームズの脳プロセスの見方が、神経回路ダイナミクスモデルと似ており、先見の明があると評価

3.7 まとめ
  • ハイデガー

存在を関係性によって捉えることは、ロボットにとって冷蔵庫はどんな意味をもつかを考えること(冷蔵庫が云々は、筆者が第1章で書いていること。筆者にとっての冷蔵庫は、中にビールが冷えていて云々という意味がある、というような)

  • メルロ=ポンティ

身体化の中で主体と客体が相互作用的に互いに挿入

第4章 脳と脳科学入門

4.1 視覚認識と行動生成のための階層的な脳機構
  • 視覚の階層構造

→V1とかV2とかwhat経路とかwhere経路とかの話
下位で単純な処理がなされ、より上位でそれらが統合されていく
→下位でも輪郭に反応したり、大域の特徴に反応したりしているなど、一概に、下位が単純でそこからボトムアップとはいえない
→ラオとバラードによる「予測符号化」

  • 行動生成

SMA(補足運動野)やPMC(前運動皮質)とM1の階層構造
M1がプリミティブ運動を符号化、SMAやPMCは巨視的な操作
バイモーダルニューロン
=行動だけでなく知覚にも反応するニューロン
→運動行動生成だけでなく感覚知覚にも関わっている。

4.2 脳の行動生成と認識に関する新しい理解

知覚と運動はコインの両面
エレノア・ギブソンとアン・ピックやウォルター・フリーマン
→行動生成は、予知的プロセス(意図と感覚)


where経路は、マルチモーダルであり、how経路とも言われるようになっている
how経路のある頭頂皮質は、視覚と運動の各プロセスの統合をになっている。
小脳「フォワードモデル」(伊藤)(現在の感覚入力が次の時間ステップでどう変化したか予測)
→同様のものが頭頂皮質にも(オズトップ、川人、アービブなど)
→筆者:頭頂皮質は、運動命令ではなく、前頭前皮質などからの「意図」に対応しているのではないか
運動のあらゆる可能な組み合わせを予測しようとするとフレーム問題に陥る
→意図のみと関連した知覚を予測


「運動イメージ」(ジェナロッド)
予測符号化


予測モデルは、メルロ=ポンティの考えとも整合する


ミラーニューロンは、意図や予測と関わっている

4.3 意図はどうやって自発的にあらわれ、意識的な認識対象となるのか?

リベットの実験
(1)無意識の脳活動を自由に起こせるか
(2)なぜ意識的に感じるのは最後の段階で、どういう役割があるのか


(1)への答え
脳ダイナミクスの一環として生じる
池谷の観察やチャーチランドの研究によれば、脳には自発的な活動がある
フリーマンら
→神経回路の決定論的カオスによる生成


(2)への答え
→まだあんまりはっきりとはわかっていない
→筆者として仮説はある。詳しくはあとで

4.5 まとめ

(本章で取り上げた)神経科学は、神経対応物を探す還元主義的アプローチ
→これではハードプロブレムは解けない
→筆者は、モデル構成論的アプローチを提案している

第5章 身体化認知モデル化のためのダイナミックシステムアプローチ

行動ベースロボティクス、新人工知能研究、ギブソン心理学、ネオギブソン心理学
→身体化認知とダイナミックシステムによって特徴付けられる

5.1 力学系(ダイナミックシステム)

ある力学系の構造の特徴として、アトラクター構造がある。
固定点アトラクター、リミットサイクルアトラクター、カオスアトラクター(ストレンジアトラクター)など

  • 「ロジスティックマップ」(ロバート・メイ)

離散空間非線形力学の例として紹介されている。
ところで、このロジスティックマップについて、出力が0.5より大きいか否かでラベル付けしてみる
→2つのラベルが等確率ででてくる「単一状態確率有限状態マシン(FMS)」になる
パラメータをかえると別のFMSができる
=記号的ダイナミクス
→実数力学系と離散記号系(カオスダイナミックスとシンボル処理系)とをつなぐ


ここまで筆者は、従来の認知科学や古典的AIが、離散的なシンボルを認知にとって必要不可欠だと見なしていることに対して、批判的ないし懐疑的である
つまり、現実世界は連続的な時空間であり、脳も連続的な処理システムであって、そこに離散的なシンボル体系を想定すると、二元論的になってしまう、と。
で、この記号ダイナミクスの話は、その両者をつなぐような話として書かれているのだと思う(離散的なシンボル系をエミュレートできる、的なことか?)

  • 非線形力学の構造的安定性

非線形力学の創発的な性質=特定のアトラクターの登場
生物学系でリズム的パターンをもつもののほとんどは、リミットサイクルアトラクターで生成されている
→実際の物理学では散逸系
→エネルギー散逸とエネルギー供給が均衡すれば安定
→動揺を与えられると過渡的状態になるが元の状態に回復する
調和振動子(減衰しないバネなど)は、エネルギー保存系
→動揺を加えると回復しない

5.2 ギブソン派とネオギブソン派のアプローチ

ギブソンにおける、オプティカルフロー
→環境と脳内のダイナミックシステムに固定点アトラクターを仮定すれば保持できる
外野手のフライのキャッチは、計算ではなく、知覚変数恒常性の調整(アンディ・クラーク)

  • ネオギブソン派(1980年代)

ケルソの指振り
これはステファン・コイファー、アントニー・チェメロ『現象学入門』(田中彰吾・宮原克典訳)(一部) - logical cypher scape2でも紹介されていた。
指振りは相転移する
トロットからギャロップも相転移

  • 幼児発達心理学

U字型発達や「BではなくAタスク」についての説明
発達の過程で、できたことが一時的にできなくなる現象(U字型発達)が観察されているとかなんとか

  • (幼児による)模倣

メルツォフ:「自分のように」メカニズム
ナーデル:幼児が互いに模倣するとき、順番交代(ターン・テイク)があったり、相互に同期した模倣がみられたりすることを発見

5.3 行動ベースロボティクス
  • ブライテンベルク『模型は心を持ちうるか』

ブライテンベルクの名前は柴田崇『サイボーグ―人工物を理解するための鍵』 - logical cypher scape2にも出てきた。この本、形而上学の加地大介が翻訳している(!)
14種類の思考実験
単純なセンサーとモーターしかもっていなくて、それの組み合わせで、複雑な動きができる

  • ブルックス

古典的AIの問題は「直接経験」の欠如
環境の役割を強調している点について、ブルックスはギブソン派と同じ
包摂アーキテクチャ
→環境について獲得されたモデルはどのように表象されているのか、という問題
(例えばデネットは、表象が忍び込むだろうと指摘している)

  • ブライテンベルクの12号

ブライテンベルクについては4号まではよく紹介されるが、それ以降はあまり紹介されないという。
筆者は、12号が上述の問題に対する解決になるとして紹介している。
12号は、非線形ロジスティックマップの実装で外部から自由意思をもっているかのようになるという(表象の問題とどう関係しているのか、よく分からなかった)

5.4 様々なレベルで脳をモデル化

個々のニューロンの振る舞いすべてをモデル化した、脳シミュレータのような計画もある
→そういう案もあるが、筆者は、それが可能だとして、その脳シミュレータと環境との相互作用や、その脳シミュレータに色々教育したりとか、やらなきゃいけないことがたくさんあって、非現実的ではないか、と。
ある程度抽象化したモデルでいいのではないか、と。
ラメルハート、マクリーランド『PDPモデル』などもその方向
筆者は特に、リカレントニューラルネットワーク(RNN)に注目

5.5 神経回路モデル

まずは、フィードフォワードネットワークモデルについて説明した後、RNN(リカレントニューラルネットワーク)モデルについても説明している。
RNNについて、クローズループで運用すると入力をまったく受け取らずに動的パターンを自発的に生成することに注目
また、RNNは、学習スキームとして、時間を遡る逆伝搬を採用している、と

  • 連続時間神経回路モデル(CTRNN)

パラメータ次第で、固定点アトラクターやリミットサイクルから、カオスアトラクターまで


誤差逆伝搬は生物学的に可能か
→逆行性軸索信号で可能なのではないか

5.6 力学系から見たニューロロボティクス

神経系・身体・環境のカップリング(ランドール・ビーア)

5.6.1 リミットサイクルアトラクアーによるロコモーションの進化
  • 中枢パターン生成器

ビーアによるCTRNNでのシミュレーション実験

  • 感覚・運動協調を発達

シャイアー、ファイファー、國吉*1
→ケペラロボット
ガウシアーら
→ロボットの即時模倣行動生成

  • 筆者・福村のやまびこロボット実験

経路のナビゲート実験
内部ダイナミクスと環境のそれのカップリングから生じるアトラクターダイナミクスへの収束という形でナビゲーションタスクを達成


ここの章、当然のように難しいし、それぞれの節がお互いにどうつながっているのかという論理展開もうまく把握できているとも言いがたいのだが
話が変わるポイントは5.5節かなあ、と
急に、近年のディープラーニング系AIの話とかでも読んだことがあるような神経回路の話がでてくる(ちなみに数式が本書の中で一番ガシガシ出てくるパートだったかと)
で、何となく知ってる話かなと思って読んでいると、また力学系の話が出てくる
この神経回路の話って、いわゆる計算主義というか計算論的神経科学というか、そういう流れのものだと思うんだけど、この流れと、力学系の流れとは本来区別されるものっぽい。
その上で、RNNでにおいてこの2つの流れは合流しそう、みたいなことが吉田正俊・田口茂『行為する意識』 - logical cypher scape2に書かれていたことを思い出したりした。フリストンはフリストンで、ベイズ力学みたいなことをいっているみたいだし。
(つまり、ニューラルネットワークの話がでてきて、あれここで急に話変わったな? ってなるんだけど、どうも、話が変わったわけではなくて、ちゃんと繋がっているらしい、と。ただまあ、自分にはこのつながり方というのはあんまり理解できなかった)

第6章 新しい提案

この章から第二部となり、筆者によるロボティクス実験の話を中心に、意識や自由意志へと迫っていくことになる。

6.1 主観的な視点を持つロボット

主観的な視点を構築するための、出発になるヒントは、予測

6.2 神経力学モデルに主観的視点をエンジニアリングする

知覚・運動マッピングに基づく応答型行動生成ではなく、意図・知覚マッピングに基づく予知的行動生成への転換


「組み合わせ合成的」ないし「シンボル的」なモデル
→連続空間を分節化
→あたかも離散的に見える計算メカニズム(5.1節とも関連している話だったかと)


新しい行動シーケンスの創造
→パラメータ分岐による生成
→高位レベルの神経ダイナミクスが内在的カオスにより活動していれば見かけ上確率的に生成される。
トップダウンの主観的な意図と客観的な現実との誤差により、自己に気づく

第7章 行動の結果から世界について予測的に学習する

7.1 組み合わせ合成可能性の発達――シンボルグラウンディング問題

5章の最後にでていたやまびこロボットを使って、さらに発展的な実験
RNNによる学習
学習したRNNと環境のカップリングがどのような力学構造をしているか分析
定常状態遷移の軌道へ収束
揺らぎを受けても数ステップで回帰
内部状態が分岐ステップごとにセグメントを推移
→有限状態マシンにおける状態遷移に対応
しかし、有限状態マシンには、揺らぎに対する自動回復メカニズムはない(一方このロボットは、有限状態マシンではないので、上述の通り、揺らぎを受けても回復する(その上、有限状態マシン的な振る舞いもできる)、という話かと)
シンボルグラウディング問題と無縁。内部的にシンボルが存在しないから

  • 欠点

(1)フレーム問題があるので小規模な環境に限定
(2)このエージェントは何も意図を持たないが、意図や目標なしでは組み合わせ爆発の問題にいずれ直面


ロボット実験の結果を示した図やグラフとかが度々出てくるのだけど、見慣れない図で見方がよくわからない。
本文で、こことこことが対応してるよねとか説明があるので、「あー、これの形というか塗られている升目が同じというかー」みたいな感じで眺めてた。

 

7.2 予測力学と自己意識

注意制御機構を持つ視覚システムの導入
RNNによる予測担当部分と、what経路とwhere経路を持つ知覚担当部分とで構成
予測誤差が小さくなればトップダウンの圧力を増やし、予測誤差が大きくなるとトップダウン圧力が減らされる
学習を繰り返すと、ストレンジ・アトラクター(不安定フェーズ)とリミットサイクル・アトラクター(安定フェーズ)を間欠的に行き来するようになった
カオス的遍歴(に似た現象)
安定的フェーズ=予想が常に一致、主観的な心と客観的な世界の区別がない
不安定フェーズ=予測誤差により、この区別が明示化
不安定になると意識されるという点でハイデッガーの金槌の例に対応
また、安定と不安定の交代という点で、ジェームズの意識の流れ(飛行と停止の交代)とも対応
ギャラガーは、「瞬間的な自己」をヒュームのいう「最小限な自己」になぞらえた

  • なぜ安定フェーズは長持ちしないのか

不整合への崩壊は間欠的におきるのか
複数の局所プロセスの相互作用からの創発によって。
予測誤差が減ると認識タイミングが厳密になっていてき、その厳密性が頂点に高まると、認識の破局的失敗が起きる
→自己組織化臨界現象なのではないか
ジェイムズの意識の構造も


なぜ不安定なシステムを筆者は評価するのか
この非決定性が、ハイデガーのいう本来的な存在に対応するから
また、ハードプロブレムを解く道にもつながるから
主観性=客観世界へ意図をもって作用を試みる際の入力を予測するプロセス
→主観性についての気づきは予測誤差から
(注釈において、フリストンが予測誤差を偏差で割ったものである尤度指標から「驚き」を定めたことを指摘している。つまり、主観性に気づくというのは、正確には予測誤差ではなくこの「驚き」のことかもしれない、と。)

第8章 感覚・運動フローの分節化によるミラー行動生成と認識

物理世界は連続的
対して、日常行動は、チャンクまたは運動プリミティブの組み合わせで生成
ロボットがどうやって運動プリミティブの集合を獲得し、また、それを組み合わせて行動を生成するか

8.1 ミラーニューロンモデル――RNNPB
  • パラメトリックバイアスをもつ再帰的神経回路(RNNPB)

行動の学習、生成、認識を予測誤差最小化の問題として形式化(自由エネルギー原理に類似)

8.2 複数の行動を分散表現で学習する

RNNPBに行動を学習させて、それらの運動パターンをPBベクトル空間にマッピング
2つの異なる領域が創出(5つくらいの運動を学習させて、3つと2つの領域に分かれたとかなんとか)
ジェイムズの思想と整合的

8.3 他人の心的状態を読むことで模倣する

ロボットに人間の行動を模倣させる実験
人間の運動パターンが変わると、PBベクトルの値がステップ上に変化し予測パターンも切り替わる。
→チャンクの分割
予測可能なパターンの場合、単一のPBベクトルで符号化。予測可能なら一つのチャンクになる
→組み合わせ合成可能性は、潜在的な予測不可能性
→相手の意図を予測しきれず予測誤差が発生するタイミングでプリミティブが分割


フッサールの時間知覚の現象学とも整合的
過去把持と未来予持による「今性」が、RNNの文脈ダイナミクスに対応
今性は、経験のフローが分節化される時点で区切られる

  • 相互模倣ゲームの実験

ロボットの動きを人間(被験者)がまねし、ロボットが学習したパターンを被験者が見つけ出す実験。
ロボットも人間をまねするが、被験者の動きが学習にないと追従できない
人間とロボットの動きが同期するタイミングもあるが、崩壊する(→自己臨界性か)
イニシアチブの交代も見られた(→ナーデルの順番交替のよう)
相互模倣は、相互作用による新しいパターンの創造でもある

8.4 言語と行動を結びつける

チョムスキーがいう言語能力の生得性・独立性は近年疑問視されている
→模倣学習による言語獲得

  • 言語RNNPBと行動RNNPBで構成されるモデルによるロボティクス実験

「押す」とかの動詞3つ、「赤」とか「左」とかの名詞6つで構成される文と行為の学習
右と左と真ん中にそれぞれ、赤い物とか青い物とか置いてあって、「赤いものを押す」とかいった文と行為を両方学習させる。
あえて教えない文もあって、学習した内容を汎化できるかも確認

「各行為に関する意味は他の意味との距離空間の関係性の中に埋め込まれることを示唆している。そのような意味の距離空間は神経活動上の分散的表現の形で学習を経て獲得されるものであり、それがより低次元の空間に自己組織化されるときに、より汎化された意味空間が得られると考えられよう。」(p.139)
学習された内容が現実の空間と対応している。3色の物体の関係が、それらが置かれている位置関係と対応していたり、行為=動詞も似ているものが近くになっている。
PDPグループの考えを受け継ぐ
分散表現は局所表現と異なり、各意味の相互作用により距離空間が獲得される

第9章 行動のための機能階層を発達させる

9.1 複数のタイムスケールにおける機能階層の自己組織化
  • 複数タイムスケールRNN(MTRNN)

時間定数の異なる複数のサブネットワークからなる
遅い(速い)ダイナミクスのサブネットは長期(短期)の時間相関の学習を得意とする
なお、MTRNNは、運動イメージを実際に動くことなく生成できる機能を持つ
→自己の可能性について叙述的となる
神経科学との対応
→補足運動野とM1とでタイムスケールの差がある
→機能階層がタイムスケール差に関連しているという筆者らの仮説と整合的
(ただし、まだ決定的な説明は困難で可能性のレベルでの検討とのこと)

9.2 複雑な行動の発達訓練についてのロボティクス実験

物体操作タスクを、教示者がロボットの腕を物理的につかんで教えることで学習させる実験
セッションを何回か繰り返すことで、学習がなされる


実際の運動ができるようになるセッションの前までに、運動イメージを生成できるようになる
→発達心理学の知見と整合的(どういう動きをすればいいかわかるようになっても、実際その通りに動くことができない段階があって、その後、ちゃんと動けるようになる)


個人的には、この運動イメージとやらの方が、意識っぽいなと思った。現象的意識という意味での意識。


教示パターンのプロフィールもセッションを追うごとに発達する。
→ロボットと教示者の間の共発達プロセス
→ロボット内部にリミットサイクルアトラクターが自己組織化され、教示者と相互作用し、教示者の行動も変える(筆者自身の体験が語られている)
学習を進めると予測誤差がほとんどなくなり、行動は無意識に生成されるようになる


揺らぎを与えたとき、ロボットはどのように行動を生成するか
上下動4回のあと左右動4回という行動を学習した後、上下動している最中にロボットの腕を引っ張ると、4回繰り返す前に左右動へと切り替えた
高次のプロセスに可塑性があり、上下動という運動プリミティブと次の運動プリミティブを滑らかにつなげている。高位レベルと低位レベルの相互作用

9.3 まとめ

遅いダイナミクスの高位レベル
→プリミティブパターンの切り替えを抽象的に表現
→抽象的な行動計画を作る前頭葉に対応
速いダイナミクスと中間速度のダイナミクス
→運動プリミティブの詳細パターン
→感覚・運動の詳細を構成する頭頂葉に対応

脳内の割り当てはゲノムによってあらかじめ決められているのではなく、自己組織化の結果
(下方因果性が云々)


情報の抽象化能力→分節化された自己語り能力


空間方向の階層への拡張
意図ユニットの初期状態値は何によって与えられるのか

第10章 行動のための自由と意識化された認識

10.1 自発的行動の動的説明

自発性は、チャンク内部ではなくチャンクとチャンクの接続部に登場
(コーヒーをいれる際、それは「コップを持つ」とか「お湯を注ぐ」とかのチャンクの組み合わせによって成り立っているが、そうしたチャンク内部の動きを変えるような自発性はないが、チャンクとチャンクをどういう順番で組み合わせるかというところに自発性がある、という筆者の観察)

  • MTRNNに物体操作を教示学習させる実験

オフライン学習後、訓練シーケンスを模倣させる。
→摸倣を繰り返していると次第に学習したものから逸脱。これは初期値敏感性によるもの。
→ただし、行動プリミティブの遷移確率は学習ケースにおおむね対応


自発性にみえるものは、物理世界のノイズに起因するのではないか
→イメージ生成にもみられる。イメージ生成は物理世界からノイズ流入しない


高位の遅いダイナミクスではカオスが生じ、それ以外のサブネットではカオスが生じていない
→ブライテンベルクの12号とも整合
→自発性の起源は、高位ネットワークに自己組織化された決定論的カオス


新規の行動シーケンスも生成できるか
→視覚イメージを生成できる拡張MTRNN
→物理的に不可能な行動も生成
→実際の行動生成では物理的に可能な行動のみ

  • 何故、意図の意識は遅いのか

拡張MTRNNのロボットと、人間実験者が操作するロボットを用意し、前者に後者の運動をばくち的に予測させ、同じ運動を生成させる実験
誤差回帰の仕組みがある場合とない場合とで比較。ないとロボットの動きが乱れる。
誤差回帰によって、過去についての「事後再構成」、未来についての「予測」の動的構成が起きる
自分自身の行動は「事後的な再構成」により自分の行動意図が書き換えられる過程で気づかれる
予測誤差が全く生じないと、意図についての意識も生じない
予測誤差が生じるときに、意識が生じる
なお、外部世界との対立(予測誤差の発生)はいつでも起こりうるものである


自発性は、高位のサブネットの決定論的カオスで生じる。その点で、客観的には自由意志は存在しない。
その後、その意図が気づかれるが、脳内の無意識の因果プロセスを観察することはできないので、何の原因もなしに「自由に」生じたように思われる(主観的には自由意志があるように感じられる)

  • 実験者とロボットとの相互作用

ロボットだけでなく「私(筆者)自身」からも新たな運動パターンのイメージが生み出される
循環的な因果と臨界


第11章 結論

11.1 認知的な心における組み合わせ合成可能性

シンボルグラウディング問題は、心身二元論から生じた問題で、相互作用問題
認知メカニズムは、連続的な感覚・運動経験の学習から、自己組織化するという仮説
認知主義者は、認知の本質的側面が論理シンボル体系にあると想定しており、その強みは無限の再帰的な表現を可能にすることだが、そんな無限の長さは日常行動において必要なのか
MTRNNは、自己組織化する決定論的カオスにより、有限状態マシンの確率過程をまねできる


本当に脳内にシンボルは存在しないのか
「おばあさん細胞」
一対一対応しているのではなく、多対多になっている可能性。
分散表象
人間は、脳の外にある離散的なシンボルを利用している

11.2 現象学
  • 7章の実験とハイデッガー
  • 8章の実験とフッサール

もしある生物が感覚反射行動だけで生き、組み合わせ合成的な行動を認識も生成もできない場合、意識や自由意志の余地はないかも

  • 9章のロボットと省察的な自己
  • 10章の自由意志と意識

客観的には自由意志はなく、主観的な体験の一側面でしかない


主観=予測再構成するトップダウンの過程
客観=感覚現実のボトムアップな認識
→意識=両者のギャップを最小化するための負荷としてあらわれる
→クオリア=そのギャップが、低位の知覚階層で生成されたもの
(なお、フリストン的に言えば、誤差そのものではなく、誤差をその推定される分散で割ったもの)


筆者は、意識についてどのような理論を採用するにせよ、意識の根底にある構造を理解することが大事だという。
意識の構造というのは、意識状態と無意識状態の自発的な入れ替わりとしての意識の流れ(ジェイムズ)のこととか。
心と世界との循環的な因果性が、意識や自由意志の見かけの原因
オープンな力学構造が、意識や自由意志を説明する

11.3 客観的な科学と主観的な体験
  • 筆者の研究姿勢の二重構造

(1)ロボットがいかに最適な行動が生成できるか
(2)心が世界と相互作用する際の主観的経験の解明
観察者は相互作用の内部ループに含まれる

  • 認知的な心

目的志向性・安定点へ漸近しようとするプロセスと、安定から離反し不安定性をもたらるプロセスからなる
目的志向性自身が不安定性をもたらし、安定性と不安定性の共存が、自律的な遍歴の自由をもあたらす
認知メカニズムのモデリングを行う客観的な科学と、主観的体験の記述との円環が必要(例えば、ヴァレラの神経現象学)(筆者の研究姿勢の二重構造とも対応)
ロボット構成論的アプローチは科学と現象学を両輪とすべし

11.4 将来の方向性
  • 発火頻度コーディングのニューラルネットワーク

畳み込み神経回路

  • 神経現象学的ロボティクスの、精神疾患への探求
  • ニューロロボティクスのスケーリング

近年の深層学習のスケールアップによってクリアされることが期待される

  • 汎用的知性

学習経験をどうやって増やすか
学習における汎化の実現
→ピアジェを参照
学習経験を増やすためには、教示者が長期的に関わり続ける必要があり、教示者との感情の相互作用が必要になる(子育てするのに、親が子をかわいいと思うような)

  • 人工物と道徳
まとめ

1.心はトップダウンとボトムアップの相互作用を経て創発
2.組み合わせ合成的な操作などは、トップダウンとボトムアップの相互作用における誤差信号の最小化を達成するための神経回路の自己組織化によって獲得。神経力学系が相互作用する環境世界とおなじ距離空間を共有することで、自然に物理世界と接地
3.世界に関するイメージ・知識は、限られた経験から発達的に学習獲得
4.心のもう一つの重要な様相=循環的な因果性から生じる無根拠性
→主観性と客観性との不可分性
脳と環境の相互作用についての自己臨界性とハイデッガーの本来性などの融合で、意識のハードプロブレムや自由意志の問題へのヒントに
5.神経現象学的アプローチ、ニューロロボティクスは、構成論的アプローチに基づく有効な方法

感想

リベットの実験からの、意図に気づくのが遅れるのは何故かという疑問を解くという流れから、予測誤差によって意識が生じる、という話の展開になっていたかと思う。
終盤でクオリアという単語も一瞬出てきたが、基本的には、意図、自発性ないし自由意志の話と、それが自覚される・それについて気付くという意味での意識の話がなされていた。
で、冒頭にも述べたが、これはこれで確かに意識の一種ではあるが、反省的意識であって現象的意識ではないのではないか、と。
まあ、現象的意識と予測誤差云々も何かしら関わっている可能性はあるけれど、これだと現象性の説明にはなっていないように思えた。


記号接地問題についての整理が独特な感じ。で、マッチングに失敗した後にどう戻るかこそが問題という指摘が面白かった。


自由意志はカオスから、というのは、なかなかどう判断していいのかわからない。客観的に自由はないが、主観的には自由がある、というのはまあそうだよな、という感じはするけど。

余談

上記メモであまり言及できなかったが、神経科学的な知見として、チャーチランドがしばしば引用されていた。
チャーチランドってチャーチランド? と思って調べてみたところ、ポール&パトリシア夫妻の息子で神経科学者のマーク・チャーチランド、とのことだった。なお、2人の娘も神経科学者らしい。
最初にググったとき、マーク・チャーチランドのプロフィールページは出てきたけど、親子かどうかわからなかったから、顔写真をめっちゃ見比べてしまった。マークとパトリシアは似ている気がする(もう少しググっていたら、英語版Wikipediaに息子と娘が神経科学者であると書いてあった)。

追記

RNNと力学系、ひいては計算論と力学系の関係について、Copilot(GPT)に聞いたので、まとめる。


力学系とは
状態+更新規則+時間
状態→振り子ならその角度とか、天気なら気温や湿度など、ニューラルネットワークなら隠れ状態など
更新規則:離散時間ならx^t+1=F(x^t)、連続時間ならdx/dt=f(x)
時間:物理時間でなくてもいい。レイヤー番号でも


例えば
x^t+1=0.5x^t
→最終的に0へ 安定固定点(アトラクタ)


RNNもFFNもトランスフォーマーも拡散モデルも力学系
ただし、FFNやトランスフォーマーは、実時間に沿って変化するわけではない。層方向の力学系
実時間に沿う、というのは、データが持っている時間とモデル内部の計算の進行が一致している。状態が次の時刻へ
FFNやトランスフォーマーは、状態が次の入力に持ち越されない。時間発展する系ではない。


計算論的な潮流と力学系的な潮流の関係について
RNNというより、コネクショニズム・ニューラルネット自体が、どちらともいえるし、どちらにも属さないようなものであった、と。
RNNは、「計算するシステムが、そのまま力学系でもある」 という具体例
近年、2つの潮流が合流する機運はあるが、必ずしもRNNが中心というわけでもない、とGPTは言っている


「脳は力学系で動いていて、その上で計算的な振る舞いが現れる」
表象なり計算なりは、あくまでそれっぽいだけなのか、本当にあるのか、というあたりが最近の焦点とかなんとか