サブタイトルは「自由エネルギー原理とはなにか」
フリストンの自由エネルギー原理についての入門書
同じ作者による乾敏郎『感情とはそもそも何なのか』 - logical cypher scape2でも、自由エネルギー原理について解説しており、内容としては一部重複するが、本書は感情以外のトピックも多く扱っており、また「自由エネルギー原理」が中心におかれて説明されている。
ところで、自由エネルギー原理について触れる度に書いている気がするが、ネーミングなんとかならかったのか
この本のタイトルを、自由エネルギー原理というものが最近の神経科学で話題になっていることを知らない、または筆者を知らない、または出版レーベルを知らない人がみたら、トンデモ本だと思ってしまうのではないか、といらん心配をしてしまうw
あと、今はまだそこまで有名ではないけれど、有名になったら、トンデモに利用されてしまいそう
まあ、杞憂に過ぎないかもしれないし、仮にそうなったところで、フリストンや神経科学者には何の非もない話ではあるんだけど
実際、自由エネルギー原理という名前ではあるけれど、エネルギーの話をしているわけではない。
脳はベイズ推論をしている、という話
これ自体はよく言われている話なのだけど、ベイズ推論は実装しようとすると計算が複雑になってしまい、脳が直接ベイズ推論しているとは考えにくい。で、近似値を使って計算しているだろうという話で、その計算式が、ヘルムホルツの自由エネルギーの式と一致するために、自由エネルギー原理という名前がある。
一致するって何だよって話だが、情報量とかエントロピーとかが出てくるので云々ということになるが、このあたりは本書の付録で説明がある。
精度制御というのがわりとキーワード
ベイズ推論というのは、事前確率と条件付き確率で計算するが、事前確率を与えるのがもともと脳が持っているモデルで、条件を与えるのが感覚信号であると考えると、モデルを更新するか、感覚信号を修正するかという二通りの方法がありうる。
信号に従ってモデルを更新していくのが、知覚
モデルに従って信号を変化させるのが、運動
ということになるが、それのどっちをやるのかという点に関わってくるのが、信号の精度となる。
精度制御がうまくいっていない病気として統合失調症を捉え直す、という話も出てくる。
下の目次にあるとおり、とにかく様々な脳機能等への統一的な説明を与える理論と目されている。
最後に「認知発達と進化、意識」とあり、自由エネルギー原理と人間以外の他の動物の関係、意識との関係についても触れられており、ここらへんはまだうまくいっているのかどうかよく分からないが、統一理論への道を進もうとしているが分かる。
まえがき
脳の構造1 知 覚――脳は推論する
2 注 意――信号の精度を操る
3 運 動――制御理論の大転換
4 意思決定――二つの価値のバランス
5 感 情――内臓感覚の現れ
6 好奇心と洞察――仮説を巡らす脳
7 統合失調症と自閉症――精度制御との関わり
8 認知発達と進化、意識――自由エネルギー原理の可能性あとがき
参考文献
付録 自由エネルギー原理の数理を垣間見る
脳の構造
脳に関する本によくある、脳の断面図と側面図がどこそこが〇〇野ですって示してあるページなのだが、
島が側頭葉の奥に隠れている、というのが印象に残ったのでメモ
1 知 覚――脳は推論する
視知覚=視覚像がもつ性質に関する意識的な体験
視覚認識ないし視覚認知=見ているものが「何」であるかを知識に基づいて理解する機能
この区別が最初の方に説明されている。その後、特にこの説明が何かに効いてくるところはなかったように思うが、
乾敏郎『感情とはそもそも何なのか』 - logical cypher scape2の方では、知覚と認知の話をしていた。
脳は、最大事後確率推定によって、隠れ状態である外界を無意識的に推論している
ちょっと説明を色々とばすが、ベイズの定理の対数をとった式が
logp(u|s)=logp(s,u)-logp(s)
事後確率の対数=生成モデルの対数+シャノンサプライズ
となる。
uは隠れ状態、sは感覚信号で、p(u|s)は事後確率、p(s,u)は隠れ状態uと感覚信号sが同時に生じる確率で脳が持っている世界の生成モデルを示す。
で、-logp(s)は、感覚信号sが生じる確率p(s)が小さいほど大きな値をとる。つまり、予想外の信号がくると大きい値になるのでサプライズと呼ばれる。
ところで、実際には、事後確率を直接求めるのは計算が難しくなることが知られていて、脳は事後確率ではなく認識確立を計算しているとされる。
確率と確率との違いの量は「ダイバージェンス」と呼ばれる。
自由エネルギー原理においては、
ダイバージェンスを小さくするのが知覚=無意識的推論
シャノンサプライズを小さくするのが運動=能動的推論
と言われる。
2 注 意――信号の精度を操る
信号にはノイズがあり分散が生じる
分散が大きいとき、その信号の信頼度は減り、精度が低い信号とされる
分散が小さいとき、その信号の信頼度は増え、精度が高い信号とされる
フリストンの理論では、分散の二乗の逆数を「精度」とする
感覚信号の精度が高いとき、予測誤差信号の精度も高く、予測信号や自分の推論内容を変更する
感覚信号の精度が低いとき、予測誤差信号の精度も低く、その場合は、自分の推論内容を維持する
フリストンは、「注意を向ける」ということを「信号の精度をあげる」=「予測誤差を大きく捉える」ことだとする。
そして、信号の精度を制御するにあたっては、ドーパミンがその役割を果たしているとしている。
3 運 動――制御理論の大転換
従来、運動野が出力するのは、運動指令だと考えられていたが、自由エネルギー原理によれば、筋感覚の予測信号
「逆モデル」を想定する必要なくなる
運動によって信念が書き換えられることはないのか?
以下の3つにより、運動によって信念が書き換えられることはない
(1)感覚減衰
自分の運動で引き起こされる感覚は抑制される(自分で自分をくすぐってもくすぐったくない理由)
(2)精度制御
再求心性感覚信号の精度を低下させ、予測誤差の精度が低下している
(3)運動野には4層がない
大脳皮質は6層構造をしており、フリストン によれば、5・6層が予測信号を出力、2・3層が予測誤差信号を出力しているとされる。
一方、大脳皮質外からの信号は第4層に入力されることが知られている
が、運動野はこの層がほとんどない
以上、3点により、運動によって引き起こされる感覚はフィードバックされないので、信念が書き換えられることもない
他感覚ニューロン:外受容感覚と自己受容感覚をセットとして受け取り予測する
知覚と運動が循環するアフォーダンス機能
赤ちゃんは予期しない動きを見ると驚くだけでなく、手を伸ばす→外受容感覚の予測誤差が大きいと予測にあうように運動して予測誤差を低下させていると考えられる
ミラーニューロンも他感覚ニューロン
自己が運動するときと他者の運動を見てるときで同じ反応をするのに、他者の運動を見ている時は自分の体が動かないのか
→自己が運動するときと他者の運動を見ているときでは、運動制御信号の精度が違うから
自由エネルギー原理は、「予測誤差の最小化」と「精度制御」の2つの原理で説明する
4 意思決定――二つの価値のバランス
期待自由エネルギー=-認識的価値-実利的価値
認識的価値とは、随伴性の不確実性を低下させること
随伴性とは、環境の状態と感覚信号との関係の関係
実利的価値とは、目標状態に到達すること
目標志向行動は、この2つの価値を最大化すること
認識的価値を高める探索行動と、実利的価値を高める利用行動からなる。
認識的価値は、隠れ状態に関する事前確率分布と事後確率分布のダイバージェンス
実利的価値は、シャノンサプライズの期待値
脳の階層構造
モチベーションの仕組み
目標を実現できそうな行為系列に対する信念の精度をあげる
精度をあげるのはドーパミン
5 感 情――内臓感覚の現れ
ホメオスタシス
アロスタシス:体内の状態に関する設定値を予測的に変更する機能
アロスタシスもまた、随意運動と同じく能動的推論
アロスタシスは脳内にある生成モデル(エネルギーを使うと血糖値が下がるとか、何か食べると血糖値が上がるとか、過去の経験から学習されたある種の知識)により機能する
条件反射もアロスタシスと同じように説明できる。随伴性を学習すると、それをもとにした予測と実際の体内状態に誤差が生じるのでわそれを小さくするために唾液が出る
感情
内臓状態に変化をもたらした原因に関する推論(高次の認知情報)と内受容感覚が統合されて感情が生じる
6 好奇心と洞察――仮説を巡らす脳
脳はどうやってアブダクションするか
自由エネルギー原理は、これを二段階にわけて説明
(1)現象を説明できる生成モデルの学習(好奇心)
(2)得られた生成モデルの単純化(洞察)
(1)好奇心
期待自由エネルギー=-認識的価値-実利的価値-新奇性
自由エネルギー原理によれば、人間は不確実性を最小化するように行動する
一つ目は隠れ状態に関する不確実性で、探索行動によって最小化する
二つ目は成果(感覚信号)に関する不確実性で、利用行動によって最小化する
最後が、隠れ状態と成果の随伴性すなわち生成モデルの不確実性で、好奇心による行動によって最小化する
新奇なものを見たらそれを観察することで、その状態と感覚信号との随伴性を学習し、生成モデルを更新する
この学習はシナプス結合の変化によって実現される。自由エネルギーの経路積分の最小化によって得られるが、この式はヘブ学習と一致
(2)洞察
自由エネルギー=生成モデルの複雑さ(ダイバージェンスに対応)-生成モデルの正確さ(シャノンサプライズに対応)
自由エネルギー最小化とは、生成モデルの複雑さを小さくし、正確さを大きくすることで達成される
このようなモデルの最適化は、ベイズモデル縮約として知られる
フリストン は、縮約モデルが脳内で作られるプロセスとして、睡眠中のシナプスの刈り込みがあるのではないかとしている
また、起きている間も、脳は仮説を単純化するシミュレーションを行っている。これをここでは洞察と呼んでいる
睡眠中のシナプス結合の刈り込みについては、トノーニが提唱しているらしい
フリストン は、仮説を学習することを調べるとある心理学実験をコンピュータ上でシミュレーションし、自由エネルギー原理に従うと正しく反応できるようになることを示した
7 統合失調症と自閉症――精度制御との関わり
ある行為を自分で行ったと感じることを自己主体感と呼ぶ
3章に出てきた感覚減衰が自己主体感と関わっているとされ、感覚減衰が起こらないと、させられ体験が生じる
統合失調症では、感覚減衰が低下していることが知られている
このため、自己主体感が生じず、させられ体験が生じる。
能動的推論にも失敗し、統合失調症の症状の一つである無動が生じると考えられる
さらに、この失敗を補って運動するために、ドーパミンにより予測信号の精度を上げる。すると、予測誤差の重み付けが下がり信念の更新がされなくなる。これにより、事前の信念のみに従い、現実からは離れた知覚、つまり妄想が生じてしまう、というのが、自由エネルギー原理による統合失調症の説明
逆に、自閉症は、予測信号の精度が低いことに起因しているのかもしれない、と。
常にサプライズが生じていた、感覚信号を必要以上に過大に受け止めているのではないか、と。
8 認知発達と進化、意識――自由エネルギー原理の可能性
複数の時間スケールでの現象を、自由エネルギー原理から説明する。
自由エネルギー原理は、サプライズないし不確実性を小さくするという原理
知覚・行為→学習と注意→神経発達→進化
知覚や行為のスケールでは、生成モデルに基づき認識確率分布の最適化を行う
学習のスケールでは、シナプス結合の最適化を行う
一方、神経発達や進化のスケールにおいては、生成モデル自体の最適化を行っているのだ、と
意識について
時間的に幅のある生成モデルがあると未来のことを考えて行動することができる
フリストン は、これによって意識が生じるのでは、と考えているらしい
知覚でも生成モデルが必要だが、こちらは時間的な幅が狭いので「無意識」的推論なのだ、とも。
ところで、自由エネルギー原理では、精度制御が重要なポイントだが、これも意識と結びつけて考えられている
フリストン は、内受容感覚の精度が感情や意識と関わっていると考えている。精度が向上することで意識に上ってくる、と。
外環境についての意識は、単純に外受容性の知覚から生じるのではなく、同時に内受容感覚からの信号の精度が上がるときに生じるのではないか、と。
意識のところの感想
意識について、これが他の意識理論とどのような関係にあるかという点で、自分の理解がまだ進んでいない
未来についての生成モデル云々のあたりは、行動のシミュレーションとして意識が生じたのではないか的な話とつながりそうだが
心の哲学的には、意識の問題として重要なのは現象的意識で、知覚と精度の話は直接関わってきそう
精度が上がる=注意が向くで、注意と意識というのも関係のある概念だから
ただ、自由エネルギー原理でいうところの注意って必ずしも意識的な注意ではないだろうけど。
外界の知覚が直接意識になるのではなく、内受容感覚の精度が高い時、知覚が意識に上がる、というのも面白い。面白いけどまだあまりよく意味は分からない
付録 自由エネルギー原理の数理を垣間見る
何で、ベイズ推論の話なのに、自由エネルギーという熱力学の語彙が使われているのか、ということが数学的に説明されている章
本文と比べると数式も多いし確かに数学的な話をしてはいるが、タイトルに「垣間見る」とあるように、実際の数式の展開などはかなり省略されており、日本語で説明されているので、まあ数学分からなくても何となくはわかる、と思う
ヘルムホルツの自由エネルギー
=内部エネルギー-温度×エントロピー
シャノンの情報理論では、確率pの事象が起きたことを知らせる情報の情報量を-logpとしている。
起きる確率が少ないと情報量は大きくなる
自由エネルギー原理でいうシャノンサプライズというのはこれ。
次に、全ての事象について情報量を平均したものをエントロピーと呼ぶ
エントロピーが大きい=不確実性が大きい
で、物理学のエントロピーと情報理論のエントロピーが同じ量であることが示される。
2つの確率分布がどれくらいを似ているか評価するために用いられる物差しとして、カルバック-ライブラーのダイバージェンス(KL情報量とも)がある。
世界についての真の確率分布をそのまま使うのが難しい場合、近似した確率分布を用いる
この2つの分布は近い方がいい=ダイバージェンスを最小にしたい
ダイバージェンスを最小にする、(近似として用いる)確率分布は、変分自由エネルギーという量を最小化することが知られている。
この変分自由エネルギーが、フリストン の自由エネルギー原理
熱力学では、ある系がある状態をとる確率は内部エネルギーと関連づけられており、ヘルムホルツの自由エネルギーの式と結びつく
変分自由エネルギーの最小値とヘルムホルツの自由エネルギーは一致する
変分自由エネルギー=エネルギー-エントロピー(ここでは温度は無視)
近似した確率分布を用いてベイズ推論することを変分ベイズ推論と呼び、ダイバージェンスの式を使っていくと
ダイバージェンス=変分自由エネルギー-シャノンサプライズ
となり、つまり、
変分自由エネルギー=ダイバージェンス+シャノンサプライズ
となる。
同じ量をどのように解釈するかで色々応用できるのが自由エネルギー原理の面白いところであり、難解なところである、と述べられている。
インフォマックス原理
神経実装として勾配降下法
この方法なら神経回路で計算可能