確率推論とニューロン

自分でもよくわかっていない部分があるけど、重要な論文なので、がんばってエントリーを作ってみる。
あまり鵜呑みにしないでください。。。
(追記7/10:いろいろ誤解している点があったので、判明した範囲で訂正しました。下線部参照。他にもあると思うので、情報提供よろしくお願いします。

---
問題意識

意志決定する時、いろんな状況を確認しながら、最終的な選択をする。
例えば、最終的な選択がAかBの二つで、意志決定するまでに状況証拠・判断材料がいくつか与えられるとする。

ネットで買い物をするとき、購入者の口コミ情報を参考にするのと同じ。

判断材料が与えられるたびに、Aの決断を下す(買う)か、Bの決断を下す(買わない)か、意志が揺れる。

そんな時、脳の中でどんなことが行われていそうか説明する仮説として、"log likelihood ratio"なる確率情報を、意志決定のために計算している、という考えがある。

どういうことか?

例えば、Aの決断が正しいとした時、判断材料eが生じる確率をP(e|A)とする。(eは証拠、evidenceのe)

このありそうな確率をlikelihoodと呼ぶ。

ちなみに、Bが正しいとした時はP(e|B)。あるいは1-P(e|A)。

今、その2つの比をとったP(e|A)/P(e|B)を計算して、その値がある値よりも大きいなら、Aの決断を下す。
(logを取った方がいろいろ便利だからlogを取る。その場合、log likelihood ratioと呼ぶ)

そんなことを脳はやってるのではないか?
と考える説がある。

自分の頭の中ではそんな難しいことはやってないと突っ込まれても、そういう説があるから、そういう説としてとらえないといけない。もし直感的に違うと思うなら、この説を客観的に否定して、違う説を唱えなければいけない。

それがサイエンス。

この仮説に関しては
Annu Rev Neurosci. 2007 Jul 21;30:535-574.
The Neural Basis of Decision Making.
Gold JI, Shadlen MN.
というごく最近でた総説に詳しく説明されているようだ。

では、そんなlog likelihood ratioを計算してるようなニューロンがホントにいるのか?
というのが、この仮説を確かめる肝となる。

そんなニューロンを見つけましたよ、というのが
Nature. 2007 Jun 28;447(7148):1075-80. Epub 2007 Jun 3.
Probabilistic reasoning by neurons.
Yang T, Shadlen MN.

という論文になる。

---
何をやったか?

アカゲザル2頭に確率推論して意志決定する課題を覚えさせる。
そのサルの頭頂連合野の一つLIP野(lateral intraparietal area)からニューロン活動を計測する。
そして、記録したニューロンがlog likelihoodを計算しているような振る舞いを示すか解析している。

---
どんな課題か?

単純には、画面スクリーンに表示される2つのターゲットAかBのうち、どちらかを選べば報酬がもらえる課題。ターゲットは赤丸緑丸で、サッケードしてどちらかを選択する。

その二つのターゲットを選択するために、4つの判断材料が図形として与えられる。口コミ情報のようなものである。

その図形から、AかBどちらの答えがもっともらしいか推論して、意志決定することがサルに要求される。

表示される図形には、AかBかのヒントとして、「重み」が割り当てられている。アマゾンの口コミ情報の5段階評価に似ている。

もし表示された4つの図形の重みの合計がA寄りだったら、Aと答えれば報酬が得られる確率が高い。(もらえないこともある)

ちなみに、判断材料の図形は10種類用意し、0.5秒間隔で図形を表示していく。

つまり、時間が経過するにつれ、AかBの判断材料が蓄積されていく、という課題の設計になっている。


---
サルは学べるか?

学べた。
論文中図1に詳しい。

重みの合計値とサルが行った選択との関係は期待通りで(Fig.1b)、各図形に割り振られた重みと、サルの選択結果から計算された重みとの関係もほぼピッタリ(Fig.1c)ということがわかった。

つまり、サルは10種類の判断材料を区別して、確率推論的にAかBの選択をしていそうだ、ということになる。

ちなみに、サル2頭のうち、Monkey Jは相当優秀なようだ。。。

---
ニューロン活動は?

どちらのターゲットが正しそうか、その確率を計算していそうなニューロンの代表例が図2。

ニューロンの受容野を決めて、そこにターゲットが表示された場合Tin、受容野の外にターゲットが表示された場合Toutとして、ニューロンの発火確率を調べている。

Fig.2cがまとめ。
4回図形が表示されるどのエポックでも、累積的なlog likelihood ratioと発火頻度が正の相関を示している。

このデータはすごい!

---
今回、2頭のサルから64個のニューロン活動を記録している。
それをまとめたのが図3。ニューロン集団としてみても、同様の結果があることがわかる。

ちなみに、Fig.3cの↓が、図2のニューロンらしいので、図2は極端なケースではなさそうだ。

図4では、判断材料となる各図形と発火頻度との関係を調べ、ニューロン集団は確かに判断材料の重みに対応した活動の変化を示すことを明らかにしている。各エポックの直前の発火頻度で補正して解析し直しても、同様の結果が得られることを確認している。

---
このニューロン活動はホントに確率情報(log likelihood ratio)をコードしているか?

2つの対抗する可能性を考えている。
1.確率的な情報ではなく、図形そのものをコードしている
2.確率的な情報ではなく、コミットした(意志決定後の)情報をコードしている


1については、LIPのニューロンが図形に対する選択性を持っていても説明できる、としつつ、記録ニューロンの受容野に表示するターゲットの色は毎回ランダムだったので、個々の図形と報酬との関係を学習したという可能性は排除している。

個人的には、図形に重み情報が乗せられてはじめて生じた現象だろうから、この議論はどうってことはないと思う。つまり、図形と重みとの組み合わせを変えたら、おそらくニューロンの振る舞いとしては図形ではなく重み重視の振る舞いをしていそう。


2についてはしっかり議論している。
図5。

今度は、サルが選択したターゲットに基づいてデータを仕分けして同様の解析をしている。(これまでは、サルの選択ではなく、記録ニューロンの受容野にターゲットを表示したかで仕分けしていた。はず。)

結果は、サルの行動との関連は薄いということ。若干玉虫色な結果のようにとったが、このあたりの議論、自分にはちょっと難解だった。

さらに、反応のバラツキとの関係も調べている。これは、確率的なアナログ的なことをやってるか、それともAかBしかないデジタル的なことをやっているか、どちらの可能性がありそうかを調べるため。

もちろん、前者の方が良いわけだけど、それを確かめるためニューロン活動のバラツキに注目している。

なぜか?
もし、デジタル的な情報なら、Fig.5b白丸のどちらかの両極端な値を示すはずだから、データとしてはグレーの線のようなデータ分布になるはず。けど、アナログ的なら、白丸の中間もしっかり表現できているはず。

結果は、見事、中間も表現していそう、ということがわかった。

ということで、図5から、意志決定の結果もある程度コードしていそうではあるけど、判断材料が蓄積されていく過程はコードされていそうだと結論づけている。(Discussionで、log likelihood ratioにこだわる必要はない、としているから、「判断材料が蓄積されていく過程」といった表現にしている)

---
何を学ぶ?

Discussionの冒頭が面白くて、今回の課題は人では手続学習的な側面があることがわかっているので、線状体との関連が今後注目されるのでは?としている。
その根拠としているのが
Science. 1996 Sep 6;273(5280):1399-402.
A neostriatal habit learning system in humans.
Knowlton BJ, Mangels JA, Squire LR.
というSquireの研究。
そういえばこの論文、修士の頃、ジャーナルクラブで読んだ覚えがある。

パーキンソン病の患者さんは、この手の確率推論に困難があるらしい。非常に興味深い。

他には、判断材料の刺激として図形を使ったので、腹側経路でどんなことが行われるのかも一興、と述べてあった。

ちなみに、この論文のsupplementとしてリアルタイムなニューロン活動の映像がアップされている。こちら

どういう基準でこの映像を作ったのかは定かではない。(Appendix Dにビデオの解説有り

実際、サルになって課題を体験できる。
しかし、この課題、難しい。。。

この映像を数千、数万回見続ければ、おそらくその映像にあるような反応を示すニューロンが自分の頭頂葉に出てくるのだろう。

それはともかく、この研究、現在の意志決定の理論を裏付けるニューロンを見つけたという点で非常に重要な研究になりそうだ。

この確率情報を計算してそうなニューロンがどのように生じてくるのか(メカニズム)、最終的な意志決定と今回のニューロンのコードしている情報との関係はどうなっているのか(その先、機能)、といった点が少なくとも気になる。

一試行単位の解析がやはり面白そうな気がする。