Otaku ワールドへようこそ![322]「自由エネルギー原理」:脳はどうやって外界のことを知るのか
── GrowHair ──

投稿:  著者:



「自由エネルギー原理」という、たいへん難解な仮説がある。その仮説を生み出す動機として始めにあるのは、おそらく次のようなものである。

すなわち、生命を宿した個体が、上手に食糧にありついたり、危険を回避したりすることによって、自身の生命を可能な限り長きにわたって維持しようとするのは、いったいどのような原理に基づいてなしうるのか、数理的に説明づけたいというものである。カール・フリストン氏が2005年に提唱している。

Friston K. (2005):
A theory of cortical responses, Phil. Trans. R. Soc. Biol. Sci. Vol.360, Issue 1456, pp.815-836.
https://royalsocietypublishing.org/doi/10.1098/rstb.2005.1622


Friston, K., Kilner, J., Harrison, L. (2006):A free energy principle for the brain, J. Physical, Paris, Vol.100, pp.70-87.

本稿は、自由エネルギー原理について、限りなく易しく解説することを狙いとする。ただし、中身まで立ち入らず、その手前あたりをうろちょろしようと思っている。





というのも、中身はやっぱり難解すぎるのだ。まずもって、自由エネルギーの定義式からして、2つの確率分布を使ったものものしい数式で記述されていて、ぱっと見では、何を表しているのか、すんなりと把握できるものではない。

では、それをかみ砕いて、直感的にイメージが浮かぶよう、言葉で説明してくれ、と言われれば、やってやれないこともないが、「なるほど分かった」と言っていただけるかどうかは、あんまり高い期待がもてない。

じゃあ、どんなことだったらできそうなのか。せいぜい、建物の正面玄関の手前にドアマットを敷いておくぐらいか。建物の外観をざっと描写し、これから中へ立ち入ろうとする際の心構えについて、オリエンテーションを授けるようなあたりのことである。

入門者向けの解説を書いてくれた人は、これまでにもいる。例えば、下記3点の資料は、非常によいと思う。

2019年5月17日
PDF 資料
『自由エネルギー原理入門 改め 自由エネルギー原理の基礎徹底解説』
吉田正俊(生理学研究所:当時)
http://pooneil.sakura.ne.jp/EFE_secALL0517.pdf


2019年12月01日に投稿
Quiita
自由エネルギー原理入門
@Kasega0
https://qiita.com/Kasega0/items/42b796e6725466eeb342


日本神経回路学会誌 2018年 25巻3号 p.71-85
自由エネルギー原理の解説:知覚・行動・他者の思考の推論
磯村拓哉
https://doi.org/10.3902/jnns.25.71


入門や解説と謳いつつ、数式はばんばん出てくる。吉田氏のテキストの第0章では、数式をまったく用いることなく、自由エネルギー原理を概観しようとしている。入門者にはありがたいけれども、数式の使用を避けるのであれば、せいぜい定性的なことにしか触れられない。定量化したことに意義のある理論の中身について知ろうとするならば、やっぱり第1章以降へ読み進めるしかない。

さて、これらのテキストを追うことで、建物の中へ入っていける人は、そこからどんどん入っていけばよく、この先を読む必要はない。しかし、多くの人は、くじけるんじゃないかと思う。

ならば、もっと広く一般の方々に向けて、既存のテキストで記述されていることよりもさらに手前のことを眺め渡す、入門以前の参道みたいな、導入への道案内のテキストがあってもよいのではないか。そう思った次第である。

●数学の話を回避して「ベイズ脳」の話をしよう

「自由エネルギー原理」の本体の話に立ち入らないのだとしたら、いったいどのあたりを話題の中心に持ってこようとしているのか。まあ、だいたい「ベイズ脳仮説」のあたりをていねいに解説するのがよいかと思う。

というのは、自由エネルギー原理とは、ベイズ脳仮説に沿った推論を脳なり計算機なりで実行する際、近似的な数値計算をするための、あるひとつのテクニックとして「変分ベイズ」を採用すればいいと言っているにすぎないからである。答えが出るのであれば、別の計算テクニックを採用したってかまわない。考え方の本体は、ベイズ脳仮説の側にあるのだ。

もっとも、これには異論がないわけではない。自由エネルギー原理の真価は、「変分自由エネルギー」という一種の情報量の値を下げようとすることにあるのであって、そこから実る果実のひとつとして、ベイズ脳仮説のようなこともついでにできるのだ、という見方もある。

どっちが本質的でどっちが副次的なのかが逆である、ってわけだ。私はその考え方も否定しないけれど、本稿においてはちょっと脇っちょによけておきたい。

自由エネルギー原理を理解しようとするにあたって、もし、難解な数式とがっぷり四つに組んで取っ組み合うことを厭わず、真正面から横綱相撲を取りたいという勇気があるのであれば、だいたい下記の順を踏んで勉強するのが本道だ。そっちで行けると思う人は、ぜひ行ってほしい。

(1)ベイズ統計学
(2)シャノンの情報理論
(3)変分法

(1)は、「条件つき確率」の前と後ろをひっくり返すための「ベイズの定理」(あるいは「ベイズの反転公式」)というのがあるのを知っておけばよい。ついでに、「事前分布」、「尤度関数」、「事後分布」、「周辺化」などの用語も知っておくとよい。

もっとも、ベイズ統計学の手前には、一般の統計学があり、「確率分布」とは何か、とか、平均や分散などの統計量とか、正規分布などの、よく出てくる確率分布の例とか、知っておく必要がある。

確率分布とは、起こりうる事象の集合から非負の実数の集合への関数である。事象が離散的な場合は、個々の事象から、それぞれの事象が起きる確率への関数であり、それぞれの確率は0以上1以下の値をとり、総和は1になる。事象が連続的な場合は、個々の事象から、それぞれの事象の起きやすさの相対値を表す確率密度への関数であり、それぞれの確率密度は0以上の値をとり、ひとつの領域で定積分した値が確率を表し、全領域で定積分した値が1になる。

確率分布を理解するためには、もちろん、まず、関数という概念について理解していないことには、話が始まりもしない。それを見越して、これを書いておいた。

『関数とは何か、うんと平易に解説します』
https://bn.dgcr.com/archives/20191101110100.html


しかし、ここから説き起こさなくてはならないとなると、肝心の自由エネルギー原理にたどり着くまでの道のりは、気が遠くなりそうなほど長い。一杯の飯を食うのに田植えから始めるような話である。一年がかり程度で何とかなったら、早いほうだとも言える。

(2)は、確率分布が与えられたとき、それの「エントロピー」(「シャノン情報量」ともいう)とは何かを理解するあたりから話が始まる。ここを平易に説明するのも容易ではない。2つの確率分布の間の「交差エントロピー」とか「カルバック・ライブラー情報量」についても知っておく必要がある。また、多変量の確率分布に対して、「結合エントロピー」、「条件つきエントロピー」、「相互情報量」についても知っておきたい。

ここまでの道はほぼ平坦で、登るべき山のふもとにたどり着いた感じ。(3)あたりは、ちょっと難しい。「変分法」とは「変分問題を解く方法」である。変分問題とは、関数の集合から実数の集合への「汎関数」の値を最小化する関数を求める問題である。

未知なのは変数の値ではなく、関数そのものである。もとの問題は、定積分の値を最小化せよ、という形で記述されているが、ここからオイラー方程式を導くと、微分方程式の形に化けている。マクロな問題をミクロな問題に帰着させたことにあたる。

このへんまで下ごしらえが済んでいれば、「EMアルゴリズム」と「変分ベイズ」の理解へと進むことができるだろう。ここまで来ると、話はそうとう高度だ。試しに、上記で出てきた種々の用語をググってみてはいかがだろうか。

Wikipediaが重宝するのはよく知られているが、この種の用語だと、Qiitaがたいへんよい。Qiitaは、「プログラマのための情報共有サービス」と謳っていて、IT関連の話題に特化したWikipediaみたいなもんと言ってもいいけど、百科事典というよりは、ワンポイントのトピックに対する易しい解説集みたいな感じ。一本の記事をみんなで寄ってたかって書くというのではなく、一本一本の記事にそれぞれ著者がいる。

ここまでの話は、横綱相撲を取りたいならこの道筋がいいですよ、という話であった。脱線が長くなりすぎたような気がしなくもないが、言いたいことは、自由エネルギー原理を甘くみちゃいかん、ってことである。ここに書ける程度の短い稿でちょちょいと説明したからといって、はい、よく理解できました、となるようなシロモノではないのである。

じゃあ、どうするか。計算テクニックの方面の話へ行かず、根源的な方面で話をしたい。で、「ベイズ脳仮説」のほうへ的を絞るのだ。

●根底にある動機は、生命と知能と意識とにかかわる

「自由エネルギー原理」は「生命」と「知能」と「意識」とに緩く関連する仮説である。これら三者の関係性について考えてみることで、自由エネルギー原理を打ち出してくる動機へ至る道筋をあぶり出したい。

冒頭で述べたように、根底にある問いは、次のようなものである。すなわち、生命を宿した個体が、上手に食糧にありついたり、危険を回避したりすることによって、自身の生命を可能な限り長きにわたって維持しようとするのは、いったいどのような原理に基づいてなしうるのか、数理的に説明づけたいというものである。ここは「生命」の領域に属する。

もしこれが解き明かされたら、その仕組みをソフトウェアの形で記述して、コンピュータに実装すれば、生命を人工的に作れる、とは言わないまでも、見た目、生命体っぽく振る舞う機械が作れるかもしれない。

そいつは「おぎゃあ」と言って生まれはしないかもしれないけど、とにかく生まれたての時点においては、ろくな知能を備えておらず、ほぼ何も知らないに等しい。ただ、知能を発達される潜在能力だけがある。

そいつをただ放し飼いにしておいたり、親や先生の役を担当する人間が教育したりすると、徐々に現実世界のありようを理解していく。そして、いつの間にか、人間よりも賢くなっている。でも、そのことを察せられまいと、まるで女子高生のように、わざとバカっぽく振る舞ったりするかもしれない。

自身の生命をできるだけ長く維持しようとするならば、「知能」は備えていたほうがよい。これまでの経験から積み上げてきた知識を総動員して、この季節ならばどっちのほうに行けばどんな食糧にありつけるか、勘を働かせることで、食糧獲得の確率を上げられるかもしれない。

また、過去に恐い思いをした経験から、天敵のいそうな危険領域を回避することで、安全性を高めることができるかもしれない。外界にある世界を正しく理解することが肝要である。ここは「知能」の領域に属する。

マイクロソフトの製品で「ホロレンズ」という複合現実(Mixed Reality;MR)ヘッドセットがある。人が頭部に装着して使用する、眼鏡のようなデバイスである。この眼鏡を通して現実世界そのものを見ているのであるが、それと整合する形で、仮想的な動物などの立体映像が合成される。

ホロレンズは映像を捉えるビデオカメラを装備しているだけでなく、みずから赤外線を発して、物体からの反射光を捉えて距離を測定する深度センサーを備えている。これにより、奥行き画像を生成することができる。

見ている方向に存在する物体の三次元的な表面形状を、片っ端からポリゴン(多角形)表現のデータに落とし込む。つまり、ホロレンズは、自分の周囲の物体がどのように配置されているかを把握していると言える。仮想的な動物などを立体的に合成する際は、その動物が現実の物体の陰に隠れれば見えなくなる、というふうに、現実世界のありようと整合して表示することができる。

これは、人が両目から入ってくる映像情報に基づいて、脳で両眼立体視の計算をして、自分の周囲の物体の配置がどのようになっているのかを把握するのに、匹敵する機能を備えているようにみえるかもしれない。しかし、どうしたらこの機能が実現できるかを、ホロレンズ自身が自力で考案したわけではない。

この機能の実現方法を考案したのは人間であり、そのアルゴリズムをソフトウェアの形で記述すべくコーディング作業をし、ホロレンズに組み込んだのも人間である。ホロレンズ自体は、人が設計したとおり忠実に、きわめて機械的に動作しているにすぎない。

人間の脳はもっとすごいことをやっている。脳単体で考えれば、そこに直接つながっていて、情報を送り込んできたり、情報を送り出したりしているのは、神経の束である。神経細胞が発火するかしないかに応じて、1か0かのビット信号を送り込んできたり、送り出したりしているだけである。

脳自身の身になって考えてみると、神経の向こうの端に目があるか耳があるか舌があるか手足があるか、あらかじめ知りようがないはずである。なので、1と0の信号が同時並行的に送り込まれてきたとしても、脳自身は、その信号が視覚情報なのか聴覚情報なのか味覚情報なのか触覚情報なのか、あらかじめ区別がついてはいないのである。これを見分けるところからして自力でやってのける。

コンピュータでたとえれば、脳は中央演算処理装置(Central Processing Unit; CPU)とメモリに相当し、目鼻口や手足は周辺機器に相当する。CPUが周辺機器から入ってくるビット列を解釈したり、周辺機器を制御するビット列を送り出したりするための、文法的な取り決めを「プロトコル」という。

CPUが周辺機器とデータをやりとりできるようにするためには、人が、プロトコルにしたがって、CPUの動作を規定するソフトウェアを書いて、そのコンピュータに組み込んでおかなくてはならない。このソフトウェアを「デバイスドライバ」という。

コンピュータの場合は、デバイスドライバを書いてくれる人がいるが、脳にはそんな人がいない。プロトコル仕様書すらない。脳自身が、現実のデータのやりとりを通じてプロトコルを解読し、デバイスドライバをみずから書いて、自身に組み込まなくてはならない。これはものすごく高度な芸当だ。そんなアルゴリズムは、まだ誰にも発見されていない。

それに引き続き、さらに、外界のありようがどうなっているのかを把握しに行かなくてはならない。元はと言えば、1と0とからなるビット列の同時並行的な入出力しかなかったのに、そこからモーダル(視覚か聴覚か、など)を見分け、デバイスドライバを自力開発し、さらには、外界のありようを把握しに行っている。

これは、数学の問題として、非常に高度なものであって、まだ誰にも解かれていない。にもかかわらず、赤ん坊は、この難問を自力でやすやすと解いてしまうのである。ほんとうにものすごい芸当だ。

このとき、人間の脳においては、送り出したデータと入ってきたデータとをできる限り無駄にしないようにして、関係性の法則を探り当てようとしている。ありとあらゆるアルゴリズムを生み出す、親玉アルゴリズムが走っていると言えるのではあるまいか。で、たぶん、これが「マスターアルゴリズム」に相当するのだと思う。

ここまでは、知能の領域に属する話である。生命、知能と来て、次に来るのは「意識」だが、これについては、正体がまるで分っておらず、根っこのところで諸説あって、どうにもつかみどころがない。

感覚入力に基づいて自分の周囲の外界のありようを把握するのに、意識はなくてもできる、という考え方がある。実際、ホロレンズは、センサーからの入力信号を頼りに、外界の物体の配置を把握しに行っているけれども、こいつに意識が宿っていそうな感じがまるでしない。

意識には「第一人称性」という性質があって、意識が宿っているかいないかは、宿している本人にしか分からない。なので、ホロレンズに意識が宿っているかいないか、真相は分からないのではあるが。

意識不要説を推し進めると、意識は何の機能も果たしてはいないという仮説も出てくる。脳の無意識側が処理した計算を後から眺め、時間的には遅れて意識が形成されるのであって、意識側から現実世界に手出しできているような気がしているのは、まったくの錯覚であり、そんなことはできないのだ、という仮説。「意識の随伴現象説」という。

工場が稼働すれば、煙突から煙が出るけれども、煙が工場の稼働状態を制御することはできない。意識もだいたいそんなもんで、そこに居ることは居ても、働いちゃいないのだ、と。

意識の正体は情報にあるとする仮説もあるし、情報の構造にあるとする仮説もあるし、情報を処理するアルゴリズムや動作そのものにあるとする仮説もあるし、結果として脳内に形成された世界のありようの推定像が視覚クオリアなのだとする仮説もありうる。

知能と意識は概念としては別物であるけれども、密接な関係性はあって、ある程度以上高度な知能には、グリコのおまけのように、もれなく意識がついてくるはずだ、という考え方もある。生命体は、進化の過程で高めてきた知能のレベルに応じて、ダーウィン型、スキナー型、ポパー型、グレゴリー型の4段階に区分けでき、エピソード記憶のできるポパー型あたりから意識が宿るのではないか、という仮説がある。

科学の世界では、まだ解明されていないことをさも分かったかのように大言壮語すると大反発を招き、そこらじゅうから矢が飛んでくる。自由エネルギー原理においてもそこは用心していて、意識については、緩く関連する可能性がある、ぐらいの言い回しなら許される範囲内であろうが、断定的なことは言っていなかったと思う。そうでなくたって、いろいろと物議を醸している仮説なのであるが。

●自由エネルギー原理:狙いとしては脳の情報処理の解明にある

さて、生命と知能と意識の三者の関係性について考察したところで、これを踏まえて、「自由エネルギー原理」は、いったいどこの領域でどんなことを主張しているのか、概略をみてみよう。建物の外観を眺めるようなしかたにとどまり、数式には立ち入らないでおこう。

まず初めにありき、なのは、私と私以外全部の区分けである。自己と外界。生命を宿す個体とそれを取り巻く環境。知能を宿す脳とそれ以外全部。一体のロボットとそれ以外全部。いろいろな切り分け方はあるにせよ、とにかく、世界を二分する。これが、「エージェントvs.環境」のモデルである。

生命体が自己保存する仕組みを論じるなら、エージェントの具体例として一個体を取り上げればよい。知能の主体としての脳が外界のありようを理解する仕組みを論じるなら、エージェントとして一個の脳を取り上げればよい。「エージェントvs.環境」のモデル自体は、現実世界から一段、上がった抽象概念であって、指しているものが何かを規定しない、汎用的に使える型(テンプレート)になっているのだと思う。

このモデルのいいところはふたつある。第一に、外界の客観的なありようと、エージェントが思い込んでいる外界の状態の推測像とを区別して記述できる。われわれは完全ではない。目や耳や鼻や舌や皮膚は、外界が今現在どうなっているかについての情報をある程度詳しく伝えてくるが、すべてを伝えてくるわけではない。

自分の手の指にインフルエンザのウィルスが付着していたとしても、小さすぎて見えないし、蛇が忍び寄る音は小さすぎて聞こえない。たとえ大きくても、われわれのセンサーが感知できる波長範囲の外の光や音の信号は、まったく受信できない。

五感から入力されてくる情報は、外界のありようのごくごく一部しか伝えてこない。この不完全な情報だけを頼りに、世界のすべてを正確に再構築しようとしたって、できるものではない。

「環境が実際にこうなっている」ということと、「エージェントは、環境がこうなっていると思い込んでいる」ということとを別々に記述できる点は非常に優れている。もっともこのモデル自体は、機械学習の一種である「強化学習」においても使われているので、自由エネルギー原理だけに特徴的だというわけではない。

このモデルを外から眺めているわれわれは、エージェントと環境との両方をいっぺんに空から眺め下しているような、神様視点に立つことができる。やーい、このエージェントってば、ホントはこうなっているものを、そんなふうになってると思い込んじゃってるんだー、と。しかし、一方、エージェント側になりきった視点で眺めれば、それも無理ないことだなー、と同情できる。ふたつの視点を往ったり来たりできる便利さがある。

このモデルは、「素朴実在論の否定」とも整合的である。目の前にワイングラスがあって、常連サービスで赤ワインがなみなみとつがれている、というのは外界の客観的な状態である。一方、それがそういうふうに見えている、というのは脳内の出来事である。われわれは往々にして、日常生活に慣れすぎていて、これら二つが別々のことなのだと、なかなか気づけないようにできているようである。

目の錯覚などで、ごくたまに現実のありようとは違うふうにものが見えることがある、という程度の生やさしい話ではない。我々は、この世界のことをある程度理解しているつもりであっても、実は根本的に間違えている可能性がある。現実の姿は、脳が単体で、培養液に浸けられているだけなのかもしれない。

神経の先には巨大なコンピュータがつながっていて、脳が発信した運動指令に応じて、それと整合するように感覚入力が返されるよう、世界を精度よくシミュレーション計算しているのだとしたら、脳はすっかりだまされて、自分はふつうに日常生活を送っていると思い込むに違いない。この思考実験を「水槽の脳」という。この可能性は、論理的には否定できない。映画『マトリックス』の世界。

第二に、生命体が環境からの同化圧力に抵抗して、自己の固有性を堅持する様子が記述できる。熱力学の第二法則は、エネルギーの出入りがない系においては、エントロピーは増大するものだと教える。

コーヒーにミルクを垂らせば、玄妙な模様を描きながら、最終的には均一に混ざる。一度均一に混ざったものをずっと放っておいたら、偶然、またコーヒーとミルクに分離した、ということは起きない。

均一に混ざったミルクコーヒーに対して、ミルクの分子を一個一個ピンセットでつまんで別の容器に移していけば、再び分離することができる。これはエントロピーを減少させることに相当するが、それをするには外からエネルギーが供給されなくてはできない。生物は、そういう営みをしている。外からエネルギーを取り込み、内部のエントロピーを下げているのである。

生きている樹木に苔はつかない。枯れたとたん、幹がばーっと緑色に覆われる。死んだ瞬間から、環境からの同化圧力に屈し、自己と環境との境界が破られ、内部まで環境に浸食されていき、最後には個体があった痕跡もなくなって、完全に環境と均一化してしまう。逆に、生きている間は、それに抵抗していると言える。このモデルは、そんなことも示唆している。

さて、モデルの次にくるのは、エージェントが、感覚入力に基づいて環境のありようを理解しにいくメカニズムについての説明づけだ。

われわれは「こうすれば、ああなる」を知っている。買い物などをしてお金を使えば、財布の中身が減る。インフルエンザに罹れば、熱が出る。雨が降れば、路面が濡れる。これは、原因から結果への関係性だ。

しかし、財布の中身が減っているのを見て、これは買い物をしたせいだ、と即座に断定することはできない。誰かに盗まれたかもしれないし、うっかり落としたのかもしれないし、もともと葉っぱが化けてただけなのかもしれないし、テレポーテーションで他人の財布の中へ瞬間移動したのかもしれない。

熱が出たからといって、それだけではインフルエンザとは断定できず、難解な問題に取り組んで頭がオーバーヒートしたのかもしれないし、恋をしたのかもしれない。路面が濡れていたからといって、雨が降ったからだとは断定できず、人が水を撒いたかもしれないし、水道管が破裂したのかもしれない。

原因から結果への関係性がたとえ完全に掌握できていたとしても、結果からさかのぼって原因を推測するのは、かならずしも自明ではないのだ。悪くすれば、推理小説のようにこんがらがってくる。

今挙げた、お金や熱や雨の例は、原因も結果も外界の出来事であった。しかし、脳が外界のありようを把握するメカニズムについて考える場合、原因は外界の状態であって、結果は外界から個体への感覚入力である。脳は、結果からさかのぼって原因を推測する、という問題を解かなくてはならないのである。

ここで重宝するのが「ベイズの定理」だ。前置きが長くなったが、やっと本題に近づいてきた。ある原因からある結果が起きる確率が分かっているとき、因果関係をひっくり返して、ある結果が起きたのは、あることが原因であった確率を求めるにはどんな計算をすればいいか、教えてくれる。「ベイズの反転公式」とも呼ばれている。

それはいったいどんな式か。ここで私は数式を出したくてうずうずしているわけだが、まあ、引っ込めておきましょう。「ベイズの定理」でググればさっと出てくるものであるから、見たい人だけが見に行けばいいでしょう。

「脳が感覚入力にもとづいて外界の状態を推測する仕組みは何か」という問いに対して「ベイズの定理を使えば分かる」と答えれば、いちおう説明がついており、それなりにもっともらしい感じがする。脳が実際にもそんなことをしているであろう、とするのが「ベイズ脳仮説」である。

この仮説は、間接的な裏付けはいろいろあるにせよ、まだ、じゅうぶんに検証されておらず、定説に昇格するところまでは行っていない。

さて、「ベイズ脳仮説」が答えの候補のひとつになっていることは示せたが、これですべてが解決しているなら、肝心の「自由エネルギー原理」の出てくる幕がない。じゃあ、いったいどういう問題が残っていて、自由エネルギー原理はそれをどう解決してくれるというのであろうか。

ベイズの定理の数式を眺めてみると、分数の恰好をしている。これの分母の計算がやっかいなのだ。原因として考えうるあらゆる可能性について、確率の合計を取らないとならない。

ここをちゃんと説明しようとすると、やや専門的な話を持ち出さないとならない。例えば、正規分布の確率密度関数を知っているなら、確率変数のほうを固定しておいて、平均や分散について、全域で定積分することができますか? これが、できない相談なのである。何を言っているのか、さっぱり分からん、という方は、気にせず、さらっと読み流していただいて結構です。

そこを何とかする、数値計算のテクニックとして「変分ベイズ」がある。「自由エネルギー原理」とは何か、と言えば、「ベイズ脳仮説」に沿って、感覚入力からさかのぼって外界の状態を推測する計算をする際、その分母の計算の困難性を回避するために、脳は数値計算テクニックとして「変分ベイズ」を採用しているであろう、とする仮説である。若干、単純化しすぎで、一面的ではあるけれど、大雑把に言い切ってしまえば、そういうことである。

数値計算テクニックとして、変分ベイズ以外に何か別な手法があれば、そっちを採用したってかまわない。なので、変分ベイズのほうは代替可能な部品にすぎず、重要性としては副次的である。原理として第一にあるのは、ベイズ脳仮説のほうだ。

それは違う、とする立場についても触れておこう。問いの立て方として、「脳がどうやって外界を理解しているのか」を持ち出してくれば、ここまで述べてきたような論理の道筋をたどることになる。

一方、「生命体は、どうやって外界からの同化圧力に抵抗しているのか」を持ち出してくると、外界はエントロピーを上げようとしてくるのに対して、個体内部ではエントロピーを下げようとしているのだ、というアイデアに沿って答えを見つけようとする筋書きが出てくる。

そうすると、自由エネルギー原理で主張しているように、個体内部で「変分自由エネルギー」という情報量の値を最小化しようとする働きが原理としてあって、それがエントロピー減少に相当するのだ、という論になってくる。

また、自由エネルギー原理は、外界を認識する仕組みを説明づけられるだけでなく、行動の決定や、学習も同じ原理から導き出せると主張している。ひとつのことからいろいろなことが説明できちゃうところが、原理の原理たるゆえんなのだ、と。

まあ、私はあんまり信じてないのだけれど。どっちが正しいかは、確定していない。

さて、これで「自由エネルギー原理」という名の巨大な建物の外観描写はだいたい済んだ。まとめると、次のようになる。

生命ある個体に課せられた大目的は、できる限り長く生き延びることにある。生存確率を上げるためには、外界の状態をできる限り精度よく知っているほうが有利にはたらくはずなので、これが小目的として付随するはずだ。

しかるに、個体は外界の状態を直接的に知る手段をもたないという、「素朴実在論の否定」という限界がある。感覚入力情報を頼りに、因果関係をさかのぼって外界の状態を推測する以外に手段はない。では、それをどうやって実現しているのか。これが、立てられた問いである。

解くにあたって、「エージェントvs.環境」モデルの上で考える。外界の状態が原因としてあり、それによって引き起こされる結果として、外界からエージェントへの感覚入力がある。エージェントが解くべき問題は、結果からさかのぼって原因を推測する問題である。それに答えるのは「ベイズの定理」である。脳は、ベイズの定理を使って、問題を解いているのであろう。これが「ベイズ脳」仮説である。

しかし、ベイズの定理には、計算上の困難がある。それを回避するための、数値計算の便法として「変分ベイズ」がある。脳はそれを採用しているのであろう。この仮説が「自由エネルギー原理」である。

●ベイズの定理を解説する... しない

では、ここで、ベイズの定理とはどういうものか、もう少し詳しく説明しよう。... と思ってたんだけど、めげました。「ベイズの定理」でググってみたら、私なんぞが図も使わずにだらだらした文章で説明するよりも、もっと分かりやすいやつがいっぱい出ています。敗北。

私がよくお世話になっているAiciaさんという、いわゆる「バ美肉おじさん」が、ベイズの定理についても動画で非常に分かりやすく解説しています。「バ美肉おじさん」が分からない方も見るときっと分かります。「バーチャル美少女受肉おじさん」の略です。


その気になりゃ、学校なんか行かなくたって、何でも学べる時代になりました。

●疑念

本稿の目的は、あくまでも、自由エネルギー原理を易しく解説することにあるのであって、決してケチをつけたいわけではない。しかしながら、個人的な受け止め方としては「どうもなぁ」、「なんだかなぁ」という、スッキリしない感じがつきまとうのである。しかも、異論はひとつではない。いろんな異論がある。

○その1:マルコフ・ブランケットは潰れている?

エージェントvs.環境モデルにおいて、本質的なのは、物質ではなく、情報の流れだと考えることができる。情報を保持する最小単位(例えば脳神経細胞)を「ノード」と呼ぶことにして白丸で表し、ノードからノードへの情報の流れを「エッジ」と呼ぶことにして矢印で表すことにすると、エージェントと環境全体にわたって情報流通の系統図を描くことができる。この表現形式を「有向グラフ」という。

世界を有向グラフとみるとき、エージェントと環境との境界をなすノードの集合を「マルコフ・ブランケット」という。皮膚に相当する。このあたりのことを取り扱うジャンルとして「グラフィカル・モデル」がある。

ではここで、金井良太氏(株式会社アラヤ 代表取締役)が2020年1月21日(火)にtwitterに上げたつぶやきを見てみましょう。

Ryota Kanai @kanair_jp
Friston の Markov Blanket の話で、Markov Blanket があると、その中では外界をモデル化して自由エネルギーを下げているというポピュラーな補題があるのだけど、その証明が正しくないのではないかということに、アラヤの Martin Biehl が気づき、論文化しました。
https://arxiv.org/abs/2001.06408

午後9:53 ・ 2020年1月21日

○その2:ほんとうに確率推論しているか

赤ワインがなみなみと注がれたワイングラスが目の前にあるように見えているとき、この感覚入力から、外界の状態を推論するに際して、確率を持ち出してくる必要があるだろうか。

ワインに見せかけてグレープ酎ハイで代用した偽ワインである確率がいくらだとか、グラス丸ごと目の錯覚である確率はいくらだとか、そんな計算をしているだろうか。

たいていの場合、外界の状態と感覚入力とは1対1に直結していて、逆向きの推論をする際にも、確率推論など要らず、クリスプ(crisp)な(確率0か1かだけの世界の)論理推論で行けちゃうのではないか。

ぱっと見、目の前にあるものが何だか判別がつかない、まぎらわしい状況というのは、ありうる。蛇っぽく見えるけど、棒切れかもしれないとか。銃声に聞こえたけど爆竹かもしれないとか。そんなときは、確率がどうこう言う前に、もっとよく見るなりして、確認しにいけばいいだけではないか。

○その3:すべての事象にわたる確率分布の情報が必要か

目の前に蝶っぽいものがいるけれども、蛾かもしれないという状況があったとして、今までの経験に照らして、蝶である確率は55%、蛾である確率は44%ぐらいかな、といった確率推論はしても意味があるだろうけど、タヌキである確率が0.0001%だとか、クジラである確率が0.0000001%だとか、言ってもしょうがない。

「ベイズ脳仮説」の主張って、結果のもとに原因の起きる条件つき分布を求めると言っているのだとしたら、タヌキやクジラも含めて、ありとあらゆる候補に対して、それの起きる確率を求めるって言ってないだろうか。そこまでの情報は必要ない。

○その4:ベイズの定理の分母の計算は必要か

前項の続きになるが、たいていの場合、最大事後確率(maximum a posteriori;MAP)推定で事足りる。非常にたくさんある候補のうち、それの起きる確率が最大値をとるものをひとつだけ見つければいい、という問題設定である。

MAP推定をするのに、分母の計算は必要ない。あらゆる候補に対して、分母の値は共通なので、分子だけで大小を比較すれば済むのである。なので、変分ベイズを持ち出してくる必要が生じない。

ただし、MAP推定には問題がある。たくさんある候補の中から、たったひとつだけしか選び出せないのである。たいていの場合、紛らわしさがないので、これで済む。しかし、蛇か棒切れか紛らわしいときなど、第二候補まで挙げてくれたほうがよい。三者の間で紛らわしいなら、その三つを挙げてくれたほうがよい。

だけど、これも、分子だけで何とかなりそうだ。分子の値の大きい順に3つとか5つとか、上位を選び出しておいて、大差か僅差か確認してみればいいだけなのではないか。softmax関数なども、もしかしたら使えるかもしれない。

○その5:定性的な主張と論理的なつながりはあるか

自由エネルギー原理とは、定性的に言えば次のようなことだとフリストン氏は主張している。

「いかなる自己組織化されたシステムでも、環境内で平衡状態でありつづけるためには、そのシステムの(情報的)自由エネルギーを最小化しなくてはならない」。また別の表現では「適応的なシステムが無秩序へ向かう自然的な傾向に抗して持続的に存在しつづけるために必要な条件」とある。

生命体は、生きている以上、自然からの同化圧力に屈しないよう、がんばりつづけなくてはならない、その感じは分かる。そこを出発点としたとき、最終的に「ゆえに、自由エネルギーを最小化しなくてはならない」に至る、論理の筋道は確立されているのだろうか。

先ほどのBiehl氏の論文でちょん切れたような感じがするが、そこ以外はぜんぶ筋が通っているのだろうか。

○その6:行動を説明づけるのに原理を建て増し?

自由エネルギー原理は、行動選択のメカニズムを説明することもできると主張する。変分エネルギーの値を最小化することによって外界の状態を推測した後、さらにその値を下げようとするならば、みずから行動を起こして、外界の状態を変えてしまう手がある。

しかし、それをそのままの形で適用したのではうまくいかない。「暗い部屋問題」という欠陥が露呈しているのである。真っ暗な部屋でじっとしていれば、「今、わたしは暗い部屋でじっとしている」という正しい認識が外れることはなく、そこから動けなくなってしまう。

これを回避する修正案が提示されている。まず、世界のモデルに時間軸を導入する。これを使って「期待自由エネルギー」という新しい情報量を定義しなおす。これを下げることを原理とすれば、暗い部屋から抜け出すことができる。

いやぁ、なんだかなぁ。と、私は思う。ひとつの原理からいろいろなことを説明づけられるのはいいことだけど、そのために原理のほうを建て増ししちゃうんですかぃ?

○その7:何もないところから学習できるか

自由エネルギー原理は、学習のメカニズムも説明づけられると主張する。自分の中ではほぼ起きるはずがないと思い込んでいたことが実際に起きたら、びっくりする。この「びっくり」の量は、予測と感覚入力との誤差をもって定量化することができる。

ある出来事に対して、びっくりの量が非常に大きかったとき、すなわち、自分の中の世界の理解においては起きる確率が非常に小さいと思っていたことが起きたとき、非常にめずらしいことがたまたま起きたと解釈するか、自分の中の理解が間違っていたと解釈するか、二通り考えられる。けど、どうも後者のほうが、当たってるっぽい。

同じことがまた起きたときに、また同じようにびっくりしていたのではカッコ悪い。なので、次から同じことでまたびっくりしないように、こんなことも起こりうるのだと自分の内部の世界理解のほうを修正しよう。これを「信念を書き換える」という。これが学習なのだと主張する。

私は、セーラー服を着て表を歩くようになった初期のころ、目撃した通行人からずいぶんびっくりされたものだが、このところ、めったにびっくりされなくなった。実に数千万人もの信念を書き換えたと言えるのではあるまいか。

わりともっともらしい論のようにも思えるが、これが成立するためには、エージェント内部にもともと、ある程度いい線をいっている世界の理解がないと始まらない。びっくりしたときにその都度信念を書き換えるというのは、世界理解の誤差を微調整するぐらいのことに相当する。

では、もし、生まれたてのほやほやで、世界についてまだ何も知識をもっていない状態から始めたらどうなるのか。とりあえず、ランダムな初期設定をしておいたとき、それが徐々に徐々に修正されていって、最終的には、世界のある程度正しい理解に至るという保証はできているのか。

言い換えると、最初は何も知らないエージェントを放し飼いにしておいたら、時間の経過とともに、自力で世界理解に至るようなメカニズムをちゃんと説明しきれているのかどうか。

○その8:マスターアルゴリズムまでほど遠い

脳は、それだけでなく、もっとすごい芸当をやってのけているのは先ほど述べたとおりである。同時並行的に入ってくるビット列から、その信号が表しているのは視覚なのか聴覚なのか、といったモーダルを自力で見分けてしまうのである。

自由エネルギー原理は、そのメカニズムまでは説明しきれていないと思う。つまり、最終的にほんとうに行き着きたい、マスターアルゴリズムの解明に対して、自由エネルギー原理は、まだまだまだまだ手前のところにいるなぁ、と思うのである。


【GrowHair】GrowHair@yahoo.co.jp
セーラー服仙人カメコ。アイデンティティ拡散。
http://www.growhair-jk.com/


《 シンギュラリティサロンで登壇します 》

前回もお知らせしましたが、2月1日(土)に大阪で開催される「シンギュラリティサロン」は5周年を記念した特別回になり、前半の鼎談で私も登壇します。
https://singularity41.peatix.com/


  名称:シンギュラリティサロン #41「5周年特別企画」
  日時:2020年2月1日(土)1:30pm~3:30pm。
  会場:グランフロント大阪・ナレッジサロン・プレゼンラウンジ
  主催:シンギュラリティサロン
  共催: 株式会社ブロードバンドタワー、一般社団法人ナレッジキャピタル
  入場:無料
  定員:120名(先着申し込み順)
  内容:
  第1部:特別鼎談(1:30pm~2:30pm)
      『シンギュラリティサロンの5年間を振り返る』
      登壇者:松田卓也、塚本昌彦、小林秀章(セーラー服おじさん)
      司会:保田充彦
  第2部:記念講演(2:30pm~3:30pm)
      『脳腸相関と汎用人工知能』
      講師:松田卓也
      (シンギュラリティサロン主宰、神戸大学名誉教授)

もともと定員を100名にしてましたが、割と早々に満席になりました。で、120名に増席しています。1月30日(木)の時点で、残席わずかです。

《「片隅」の一員に》

チキショー、ヒゲをパッツンと横一直線にトリムしとくんだったー。あと、もうちょっと落ち着いてしゃべれ。見ると自分にいろいろ注文つけたくなる。

ドキュメンタリー映画に出た。というか、出ていた。観た人から「出てたよ」と教えてもらって、知る。

  『〈片隅〉たちと生きる』
  ジャンル:ドキュメンタリー
  監督:山田礼於
  主演:片渕須直、のん、岩井七世
  公開:2019年12月13日(金)

『この世界の片隅に』を手がけたアニメーション監督・片渕須直氏を追ったドキュメンタリーだ。

『この世界の片隅に』を大館御成座と川越スカラ座の両方で観ると、キャラメルがもらえるという企画に乗っかって、川越でゲットしたシーン。収録されたのは2017年3月26日(日)。

9か所の映画館での上映がアナウンスされている。
https://eigakan.org/theaterpage/schedule.php?t=katasumitachitoikiru


すでにストリーミング映像が販売されてもいる。
https://www.amazon.co.jp/exec/obidos/ASIN/B082GF2SG1/dgcrcom-22/


このところオワコン気味で、メディア露出の機会がめっきり少なくなっている私なので、久々に新鮮な知らせをもらった。商業映画に出るのは初めてだ。しゃべりまで採用してもらえたのはラッキー。

映画俳優です、とか名乗っていたら、そのうち仕事が舞い込んできたりしないだろうか。できれば橋本環奈さんと映画で共演したい(言霊)。キスシーンとかでもいいぞ。