まとめてスパースコーディング

スパースコーディング(sparse coding)とは?

情報表現法の一つ。
たくさんいるニューロンのうち、ホンの一部のニューロンだけが活動して、
情報の重複をできるだけ抑えて情報を表現する方法。(自分なりの定義)

関連用語は、お婆ちゃん細胞説、efficient codingなど
対立する考えは、デンスコードや極端な分散表現(completely distributed population code)など


以下、そんなスパースコーディング絡みの論文を備忘録的にまとめる。

なお、海馬の場所細胞の話は基本的にはほとんどがこの問題とリンクしそう。だけど、ここでは範囲をあまり広げずにまとめる。efficient codeとしてストーリーを展開している論文も扱い切れていない。

---
まずは総説から

Curr Opin Neurobiol. 2004 Aug;14(4):481-7.
Sparse coding of sensory inputs.
Olshausen BA, Field DJ.

スパースコーディングを語る時、この総説はMUST READ

総説では、まずスパースコーディングの4つのメリット
・情報保存量を増やす
・複雑な情報をより明示的に表現できる
・下流で情報を読み出しやすい
・省エネ

これらの点について、過去の研究例を紹介しながら説明している。

そして、より実践的な話になって、手持ちのデータからどうやってスパースさを計算するか、方法論的なことが紹介され、これまでどんな研究がこのスパースコーディングの説をサポートしているか解説している。

以下の文献は、この総説でも取りあげられている文献がほとんどだと思う。

---
V1の理論

Nature. 1996 Jun 13;381(6583):607-9.
Emergence of simple-cell receptive field properties by learning a sparse code for natural images.
Olshausen BA, Field DJ.

難解だけど、こちらも知っておきたい論文。
スパースコーディングは高次の統計量の独立性を持たせる方法で、その後の処理をより効率的にできる、ということを理論的に裏付けた論文。

画像処理のアルゴリズムの研究でもあり、視覚情報処理の解釈を与える研究でもある。

一次視覚野の単純細胞には、受容野があり、方位選択性があり、空間周波数の選択性がある。以前の画像処理の研究では、脳研究からわかってきたこの3つの要素を考慮にいれたアルゴリズムはなかったらしいが、その問題を克服している。

この研究では、まずピクセル間の統計的独立性を得るための方法として主成分分析をまず紹介している。しかし、これは3次以上の高次の統計情報をとらえられないという問題を指摘。(最近の文脈で考えると、skewnessという3次の統計量はPCAではとらえられないわけで、脳の情報処理とは違うでしょ、ということになるのか?勝手な解釈)

そこで、統計的独立性からエントロピーに注目して、Barlowの説にインスパイアされたアルゴリズムを提案している。

一言で言うとスパースネスの最大化を目的とした学習アルゴリズムを提案している。

この学習アルゴリズムによって、単純細胞の3つの特徴をすべて持った基底要素を獲得できることを明らかにしている。

---
マカクV1は?

Science. 2000 Feb 18;287(5456):1273-6.
Sparse coding and decorrelation in primary visual cortex during natural vision.
Vinje WE, Gallant JL.

これもよく引用される。
覚醒下マカクのV1でスパースコーディングが見れることを報告。

サルに自由に映像を見せる。見せる映像を、記録中ニューロンの古典的受容野サイズにあうように見せるか、それより広い映像を見せるかで、ニューロンの活動が違うか解析。

広く見せると、同じニューロンのコーディングがデンスからスパースに変わる、ということを発見。

解析法もシンプルで、エレガントな研究。
ニューロンが文脈によって、デンスからスパースコードと動的に変化させることを示した点がすごい。

---
フォローアップ

J Neurosci. 2002 Apr 1;22(7):2904-15.
Natural stimulation of the nonclassical receptive field increases information transmission efficiency in V1.
Vinje WE, Gallant JL.

上のサイエンスの論文で報告した結果をもっとしっかり定量して、確認し直したのがこの論文。

相互情報量を計算している。

上のサイエンスの論文で使ってる指標は、発火頻度の大小が効いてくる指標で、正規分布を仮定した統計量に基づいている。なので、データの分布について仮定をおかない情報理論を使って定量し直した、ということなのだろう。研究の質としては、上のサイエンスの論文より高い、と言って良いか。


---
高次視覚野は?

J Neurophysiol. 1995 Feb;73(2):713-26.
Sparseness of the neuronal representation of stimuli in the primate temporal visual cortex.
Rolls ET, Tovee MJ.
スパースコーディングについて洗練された解析方法を使っているという点でも非常に重要論文。

研究では、覚醒下マカクの側頭皮質からニューロン活動を計測。
マカクには合計68種の視覚イメージを見せて、その時の応答を解析。(タスクはfixation)

スパースネスは、彼らが初めて導入したバラツキ具合をもとに計算する方法、それから情報理論も使って定量している。

顔についてスパースな情報表現をしていることを明らかにしている。
ちなみに、この論文で導入したスパースネスの計算法、現在よく使われる計算法の元といって良い。(それを直感的にわかりやすくマイナーチェンジしたのは、上のVinjeとGallant)

---
ヒトは?

Nature. 2005 Jun 23;435(7045):1102-7.
Invariant visual representation by single neurons in the human brain.
Quiroga RQ, Reddy L, Kreiman G, Koch C, Fried I.

セクシーさ、この上なし!というエモーショナルにインパクトのある論文。
ヒトの海馬とその周辺のいわゆる側頭葉内側(MTL)に、ジェニファー・アニストン細胞、ヘリー・バリー細胞、シドニーオペラハウス細胞がいた、というトンデモのようなホントの報告。

ヒトの海馬でplace cell的なスパースコーディングを採用している細胞を見つけたという点がポイントか。
discussion部分が参考になる。

ちなみに、スパースさに関してはROCカーブを元に判断している。

このフォローアップは
J Neurosci. 2006 Oct 4;26(40):10232-4.
Sparse representation in the human medial temporal lobe.
Waydo S, Kraskov A, Quian Quiroga R, Fried I, Koch C.

---
聴覚系は?

Nat Neurosci. 2002 Apr;5(4):356-63.
Efficient coding of natural sounds.
Lewicki MS.

聴覚神経は独立成分分析的なことをやっていて、刺激によってフーリエ変換的だったり、ウェーブレット変換的なフィルター特性を示すことを明らかにした。

こちらを理論的にさらに発展させたのがこちらか。

Nature. 2006 Feb 23;439(7079):978-82.
Efficient auditory coding.
Smith EC, Lewicki MS.

聴覚系でいうと、Zadorたちのbinary spikingとWangのsustained responseの論争もsparse code絡みととって良いと思う。

---
鳥は?

Nature. 2002 Sep 5;419(6902):65-70.
An ultra-sparse code underlies the generation of neural sequences in a songbird.
Hahnloser RH, Kozhevnikov AA, Fee MS.

鳥がさえずる時に、その運動パターンを直接的に制御している神経核RAの上流HVCという神経核の細胞、しかもRAに投射している細胞が、お婆ちゃん細胞的なウルトラスパースコードをしているという話。

ストーリーはもちろん、この研究、技術的にもすごい。さすがFeeという研究。

---
昆虫も

Science. 2002 Jul 19;297(5580):359-65.
Oscillations and sparsening of odor representations in the mushroom body.
Perez-Orive J, Mazor O, Turner GC, Cassenaer S, Wilson RI, Laurent G.

アンテナローブにいる投射細胞でデンスコードしていて、その下流のキノコ体カニオン細胞でスパースコードになっていることを示した論文。

オシレーションとスパースコーディングとの関係も明らかにした点でも重要論文。

Laurentの一連の仕事の話は
Nat Rev Neurosci. 2002 Nov;3(11):884-95.
Olfactory network dynamics and the coding of multidimensional signals.
Laurent G.
をまず。

最近は、カニオン細胞の下流のβローブに研究対象を広げ、STDPとオシレーションの関係を明らかにしている。
Nature. 2007 Jun 20; [Epub ahead of print]
Hebbian STDP in mushroom bodies facilitates the synchronous flow of olfactory information in locusts.
Cassenaer S, Laurent G.

先日のPIミーティングで聞いた話。(リンク先にはほとんど関連情報はないです)
この研究もかなりインパクトあり。
Laurentはホントにすごい。

---
ポピュレーションスパースネス

Network. 2001 Aug;12(3):255-70.
Characterizing the sparseness of neural codes.
Willmore B, Tolhurst DJ.

テクニカル論文だけど、よく引用される。

スパースさをlifetime sparsenesspopulation sparsenessに区別している。(オリジナルはFieldが提唱したようだ)

lifetime sparsenessは、1個のニューロンの活動が(その生涯で)どれくらいスパースか、という点に注目したスパースネス。

population sparsenessは、オリジナルのスパースコーディングの発想に近く、どれくらいの細胞たちで情報をコードしているか、という点に注目したスパースネス。

前者は、1個1個の細胞データについてスパースネスを計算し、後者は1刺激に対してどれくらいの細胞集団が活動したかを計算する。

ちなみに、この論文では、どうやってsparsenessを定量したら良いか議論していて、実際にlifetimeとpopulationで異なるケースがあると言っている。

---
そしてシメはやはりBarlow

スパースコーディングを語る時、Barlowは絶対に外せない。
よく引用される文献は

Perception. 1972;1(4):371-94.
Single units and sensation: a neuron doctrine for perceptual psychology?Barlow HB.

ここでは、後の研究にいろんな影響を与える5つの「ドグマ」を謳っている。
そこで悪名高い?「お婆ちゃん細胞説」を提唱している。が、スパースコードの源流は、実はここにある。

ちなみに、そのドグマは
1.細胞間の相互作用が本質
2.スパースコード(必要最小限の細胞を使って感覚刺激の表象を完成させる)
3.選択性は経験と発達過程で生じる
4.知覚は高次のニューロンの活動と一致(お婆ちゃん細胞説)
5.高い発火頻度は高い「確かさ」に一致

(訳しにくい表現があったので、かなり意訳してます。)

---
スパースコードは情報理論との結びつきも強いので、ホントの源流はShannonの有名な
Bell System Technical Journal. 1948;27: 379-423, 623-656
A mathematical theory of communication
Shannon CE.
PDF

にあるかもしれない。実際、Barlowは情報理論に影響を受けている。

けど、脳との関係について議論し始めたのは、やはりBarlow、それからAttneaveという人か。

---
スパースコーディングを扱っている話は他にも山ほどある。
冒頭に挙げたOlshausenたちの総説は情報の宝庫。

こうしてみると、昆虫から人まで、感覚刺激を受容する神経から海馬まで、スパースコード everywhere!という感じではある。

スパースコードは確固としたコンセプト、と言って良いのではないだろうか?
もちろん、スパースコードでない側面にはある程度目を瞑ってみんな論文を通してきている、というリアルもあるのだろうが。。。

それはともかく、ジェニファー・アニストン細胞なんてどうやったら脳にできるのか?その細胞は知覚とどう関係があるのか?

スパースコード、現象としてはOKとしても、メカニズムと機能をしっかり調べていかないといけない。

Barlowが初めて言いだしたのは1960年代からだから、メカニズムと機能がわかるには、まだまだ時間がかかりそう。

追記7/21
これまで立てたスパースコーディング関連のエントリー(確認できた範囲で)
スパースな興奮性活動による大抑制
スパースコードのメカニズムは?
海馬周辺のコーディングストラテジー
コンセプト細胞?
感覚野の層と機能〜層で違う学習能力 Diamond et al., Science 1994〜
嗅球でのスパースコーディング
局所的にもヘテロ
感覚野の層と機能〜2/3層 Brecht, Roth, and Sakmann, JP 2003〜