「神経符号化」の版間の差分

33行目: 33行目:
 符号化と復号化は情報理論の用語で、文字・画像・音声などを送信者から通信路を介して受信者に伝達するために、送信者側で情報源・通信路に適した形に変換し、受信者側でそれを元に戻すことを指す。そのために用いられる機器あるいはアルゴリズムを符号器(エンコーダ)・復号器(デコーダ)と呼ぶ。神経科学の文脈では、符号化は刺激が神経活動に変換されることに対応し、刺激が与えられたもとで神経細胞の活動を表すモデルを符号器、神経活動が与えられたもとで刺激を表すモデルを復号器と呼ぶ。多くの場合、これらは統計モデルを用いて記述される。統計モデルによって符号器・復号器を記述することで、神経発火活動のどの特徴に情報があるかを調べる事ができる。以下に、神経符号化研究で用いられる符号化・復号化のアプローチを紹介する。
 符号化と復号化は情報理論の用語で、文字・画像・音声などを送信者から通信路を介して受信者に伝達するために、送信者側で情報源・通信路に適した形に変換し、受信者側でそれを元に戻すことを指す。そのために用いられる機器あるいはアルゴリズムを符号器(エンコーダ)・復号器(デコーダ)と呼ぶ。神経科学の文脈では、符号化は刺激が神経活動に変換されることに対応し、刺激が与えられたもとで神経細胞の活動を表すモデルを符号器、神経活動が与えられたもとで刺激を表すモデルを復号器と呼ぶ。多くの場合、これらは統計モデルを用いて記述される。統計モデルによって符号器・復号器を記述することで、神経発火活動のどの特徴に情報があるかを調べる事ができる。以下に、神経符号化研究で用いられる符号化・復号化のアプローチを紹介する。


 神経科学における符号化は外界の刺激を神経活動に変換する過程・機構を言う。単一神経細胞の発火頻度と刺激の関係を表す関数(チューニング関数・応答関数・活性化関数)は符号器の例であり、これらを組み合わせた人工ニューラルネットワークも符号器である。応答の確率的揺らぎも考慮すると、平均値がチューニング関数で与えられる確率分布が符号器となる。ただし、一般には平均発火頻度に限らず刺激に依存する神経活動を確率分布で表したものが符号器となる。複数の神経細胞による集団符号化の議論では、刺激に依存する神経活動の同時確率分布が符号器となる。 $N$個の神経細胞集団の活動を$\mathbf{x}=(x_1、x_2、\ldots、x_N)$で表し刺激を$\mathbf{y}$で表すと、同時確率分布は$p(\mathbf{x}|\mathbf{y}\mathbf{w})$と書くことができる。ただし、$\mathbf{w}$は分布のパラメータである。例えば神経活動として発火頻度を取り上げ、試行毎の実現にガウスノイズを仮定して神経活動を近似する場合には多変量正規分布が符号器となり、平均発火頻度もしくは共分散行列、あるいはその両方が刺激に依存する。神経スパイク活動に対しては刺激依存のパラメータを有する点過程モデルやイジングモデルを用いた集団活動の同時分布が符号器となる。  
 神経科学における符号化は外界の刺激を神経活動に変換する過程・機構を言う。単一神経細胞の発火頻度と刺激の関係を表す関数(チューニング関数・応答関数・活性化関数)は符号器の例であり、これらを組み合わせた人工ニューラルネットワークも符号器である。応答の確率的揺らぎも考慮すると、平均値がチューニング関数で与えられる確率分布が符号器となる。ただし、一般には平均発火頻度に限らず刺激に依存する神経活動を確率分布で表したものが符号器となる。複数の神経細胞による集団符号化の議論では、刺激に依存する神経活動の同時確率分布が符号器となる。 <math>$N$</math>個の神経細胞集団の活動を<math>$\mathbf{x}=(x_1,x_2,\ldots,x_N)$</math>で表し刺激を<math>$\mathbf{y}$</math>で表すと、同時確率分布は<math>$p(\mathbf{x}|\mathbf{y},\mathbf{w})$</math>と書くことができる。ただし、<math>$\mathbf{w}$</math>は分布のパラメータである。例えば神経活動として発火頻度を取り上げ、試行毎の実現にガウスノイズを仮定して神経活動を近似する場合には多変量正規分布が符号器となり、平均発火頻度もしくは共分散行列、あるいはその両方が刺激に依存する。神経スパイク活動に対しては刺激依存のパラメータを有する点過程モデルやイジングモデルを用いた集団活動の同時分布が符号器となる。  


 神経符号化研究では、神経細胞の活動のどの部分に外界の情報が表され、運ばれているのかを特定することが重要な課題になる。この課題に統計モデルを使用することのメリットは、使用するデータの特徴がモデルの十分統計量として厳密に定義される点にある。神経活動のどの特徴が外界に依存し、外界の変化とともに変わるのかについて複数の仮説が考えられる。代表的な例として、単一神経細胞の発火頻度によって刺激が符号化されるとする発火頻度符号化(rate coding)、神経スパイクの時間構造に刺激が符号化されているとする時間的符号化(temporal coding)、相関を伴う神経細胞集団の同時活動に刺激が符号化されているとする集団符号化(population coding)等が挙げられる。これらはそれぞれ符号器としてポアソン過程、非ポアソン過程、多変量ガウス分布/イジングモデル/一般化線形モデルを用いてモデル化することができ、仮説を数学的に明らかな形で取り扱うことができる。次節では、これらのうち神経符号化研究で中心的な役割を担う集団符号化について詳しく述べる。
 神経符号化研究では、神経細胞の活動のどの部分に外界の情報が表され、運ばれているのかを特定することが重要な課題になる。この課題に統計モデルを使用することのメリットは、使用するデータの特徴がモデルの十分統計量として厳密に定義される点にある。神経活動のどの特徴が外界に依存し、外界の変化とともに変わるのかについて複数の仮説が考えられる。代表的な例として、単一神経細胞の発火頻度によって刺激が符号化されるとする発火頻度符号化(rate coding)、神経スパイクの時間構造に刺激が符号化されているとする時間的符号化(temporal coding)、相関を伴う神経細胞集団の同時活動に刺激が符号化されているとする集団符号化(population coding)等が挙げられる。これらはそれぞれ符号器としてポアソン過程、非ポアソン過程、多変量ガウス分布/イジングモデル/一般化線形モデルを用いてモデル化することができ、仮説を数学的に明らかな形で取り扱うことができる。次節では、これらのうち神経符号化研究で中心的な役割を担う集団符号化について詳しく述べる。
39行目: 39行目:
 神経細胞による符号化の実現を考えるとき、下流の神経細胞がこれらの特徴を読み取ることができるか、すなわち符号化に用いる神経活動の特徴量の変化に応じて下流の神経細胞が活動を変えることができるかを考える必要がある。個々のシナプス前細胞の発火頻度に応じてシナプス後細胞の活動が変化することは容易に実現できるため、発火頻度を神経符号の仮説として採用することが多い。しかし、樹状突起上の電位依存性チャネルによる非線形な応答を考慮すれば、シナプス入力時系列の時間構造や同期的なシナプス入力などの2次以上の統計量に依存してシナプス後細胞が活動することも容易に考えられる。そのため神経細胞によって応答が可能(符号化が可能)な特徴量を実験的・理論的に考察する事が行われてきた<ref name=Diesmann1999><pubmed>10591212</pubmed></ref><ref name=delaRocha2007><pubmed>17700699</pubmed></ref>[Diesmann 1999; De La Rocha 2007]。実際、発火頻度符号化以外の符号化方式の存在も報告されており<ref name=Ishikane2005><pubmed>15995702</pubmed></ref><ref name=Jacobs2009><pubmed>19297621</pubmed></ref>[Ishikane 2005; Jacobs 2009]、神経系は単一の符号化方式を採用するのではなく種や部位により異なる符号化方式が採用されていると考えられている。
 神経細胞による符号化の実現を考えるとき、下流の神経細胞がこれらの特徴を読み取ることができるか、すなわち符号化に用いる神経活動の特徴量の変化に応じて下流の神経細胞が活動を変えることができるかを考える必要がある。個々のシナプス前細胞の発火頻度に応じてシナプス後細胞の活動が変化することは容易に実現できるため、発火頻度を神経符号の仮説として採用することが多い。しかし、樹状突起上の電位依存性チャネルによる非線形な応答を考慮すれば、シナプス入力時系列の時間構造や同期的なシナプス入力などの2次以上の統計量に依存してシナプス後細胞が活動することも容易に考えられる。そのため神経細胞によって応答が可能(符号化が可能)な特徴量を実験的・理論的に考察する事が行われてきた<ref name=Diesmann1999><pubmed>10591212</pubmed></ref><ref name=delaRocha2007><pubmed>17700699</pubmed></ref>[Diesmann 1999; De La Rocha 2007]。実際、発火頻度符号化以外の符号化方式の存在も報告されており<ref name=Ishikane2005><pubmed>15995702</pubmed></ref><ref name=Jacobs2009><pubmed>19297621</pubmed></ref>[Ishikane 2005; Jacobs 2009]、神経系は単一の符号化方式を採用するのではなく種や部位により異なる符号化方式が採用されていると考えられている。


 神経符号化研究では、神経活動から刺激や行動の意図等を推定する復号器を構築・適用することで神経細胞が保持する情報を明らかにすることが行われる。復号器の構築方法には2通りの方法がある。一つ目は復号器を神経細胞の活動から直接的に作る方法である。例として、神経活動の重み付け線形和によって刺激を推定する線形モデルが挙げられる。この方法の拡張として、刺激の分布として指数分布族を用い、その期待値を連結関数を通して神経細胞活動の線形和で表す一般化線形モデルがある。これらは確率モデルp(y|x、w)を直接構成する方法である。二つ目の方法は、符号化で用いたモデルを使用し、符号器のパラメータ推定として刺激を推定する方法である。例えば、符号器を用いた尤度関数を使って刺激の最尤推定を行うことは復号化にあたる。この方法は刺激に対して事前分布を仮定することで、ベイズの定理を用いた事後分布による刺激の推定に一般化される。
 神経符号化研究では、神経活動から刺激や行動の意図等を推定する復号器を構築・適用することで神経細胞が保持する情報を明らかにすることが行われる。復号器の構築方法には2通りの方法がある。一つ目は復号器を神経細胞の活動から直接的に作る方法である。例として、神経活動の重み付け線形和によって刺激を推定する線形モデルが挙げられる。この方法の拡張として、刺激の分布として指数分布族を用い、その期待値を連結関数を通して神経細胞活動の線形和で表す一般化線形モデルがある。これらは確率モデル<math>p(y|x,w)</math>を直接構成する方法である。二つ目の方法は、符号化で用いたモデルを使用し、符号器のパラメータ推定として刺激を推定する方法である。例えば、符号器を用いた尤度関数を使って刺激の最尤推定を行うことは復号化にあたる。この方法は刺激に対して事前分布を仮定することで、ベイズの定理を用いた事後分布による刺激の推定に一般化される。
 
\begin{equation}
<math>
p(\mathbf{y}|\mathbf{x}\mathbf{w})=\frac{p(\mathbf{x}|\mathbf{y}\mathbf{w})p(\mathbf{y}|\mathbf{w})} {p(\mathbf{x}|\mathbf{w})}
p(\mathbf{y}|\mathbf{x}, \mathbf{w})=\frac{p(\mathbf{x}|\mathbf{y}, \mathbf{w})p(\mathbf{y}|\mathbf{w})} {p(\mathbf{x}|\mathbf{w})}
\end{equation}
</math>


 このように復号器を符号化のモデルから作成する方法を2段階法(two step approach)と呼ぶ<ref name=Brown2004><pubmed>15114358</pubmed></ref>[Brown 2004]。
 このように復号器を符号化のモデルから作成する方法を2段階法(two step approach)と呼ぶ<ref name=Brown2004><pubmed>15114358</pubmed></ref>[Brown 2004]。
51行目: 51行目:
 ただし復号化で使用する神経活動の特徴量が複雑になってきた場合、その特徴に下流の神経細胞が反応する事は困難である事が予想される。そのため高度な神経補綴に用いられる神経活動がそのまま行動に繋がる神経符号として採用されるわけではない。また厳密には、こうして特定された神経細胞活動が行動に関わるかを調べるためには、これらの細胞を選択的に制御して行動に影響があるかを調べる必要がある。
 ただし復号化で使用する神経活動の特徴量が複雑になってきた場合、その特徴に下流の神経細胞が反応する事は困難である事が予想される。そのため高度な神経補綴に用いられる神経活動がそのまま行動に繋がる神経符号として採用されるわけではない。また厳密には、こうして特定された神経細胞活動が行動に関わるかを調べるためには、これらの細胞を選択的に制御して行動に影響があるかを調べる必要がある。


 最後に、符号器にも2通りの構築方法があることを紹介する。初めに紹介したように符号器p(x|y、w)として神経細胞が刺激に応答するモデルを直接構築する方法のほかに、符号器をベイズの定理を用いて表す方法がある。これを用いると符号器は復号器を用いて次のように表される。
 最後に、符号器にも2通りの構築方法があることを紹介する。初めに紹介したように符号器<math>p(x|y,w)</math>として神経細胞が刺激に応答するモデルを直接構築する方法のほかに、符号器をベイズの定理を用いて表す方法がある。これを用いると符号器は復号器を用いて次のように表される。
 
p(\mathbf{x}|\mathbf{y}\mathbf{w})=\frac{p(\mathbf{y}|\mathbf{x}\mathbf{w})p(\mathbf{x}|\mathbf{w})} {p(\mathbf{y}|\mathbf{w})}
<math>
 ここでパラメータ$w$は神経活動を生成する基盤としての脳の構造を表す。p(x|w)は神経活動に対する事前分布で神経活動に対する制約条件を表す。また、ここでの復号器は神経細胞活動による外界の表現/表象(representation)を記述する。事前分布と復号器を合わせた同時分布p(y、x|w) =p(y|x、w)p(x|w)をデータの生成モデルと呼ぶ。生成モデルはデータyが生成される過程を神経活動によって再現するモデルと見做す事ができる。従ってこの式は、刺激に対する神経細胞集団の応答活動をデータ生成のモデルによって解釈することができることを示している。
p(\mathbf{x}|\mathbf{y},\mathbf{w})=\frac{p(\mathbf{y}|\mathbf{x},\mathbf{w})p(\mathbf{x}|\mathbf{w})} {p(\mathbf{y}|\mathbf{w})}
</math>
 
 ここでパラメータ<math>$w$</math>は神経活動を生成する基盤としての脳の構造を表す。<math>p(x|w)</math>は神経活動に対する事前分布で神経活動に対する制約条件を表す。また、ここでの復号器は神経細胞活動による外界の表現/表象(representation)を記述する。事前分布と復号器を合わせた同時分布<math>p(y,x|w) =p(y|x,w)p(x|w)</math>をデータの生成モデルと呼ぶ。生成モデルはデータyが生成される過程を神経活動によって再現するモデルと見做す事ができる。従ってこの式は、刺激に対する神経細胞集団の応答活動をデータ生成のモデルによって解釈することができることを示している。


 これによれば、脳の内部構造に基づく神経細胞の自発活動、すなわち脳の内発的ダイナミクスは事前分布を構成する。刺激が提示されると、神経活動は刺激の影響を受けて変調され、復号器と組み合わされて事後分布を形成する<ref name=Brown1998><pubmed>9736661</pubmed></ref> <ref name=Fiser2010><pubmed>20153683</pubmed></ref>[Fiser 2010; Berkes 2011]。すなわち神経応答活動は刺激を再構成・予測するための推論を行なっていると考える事ができる。神経応答活動のベイズ的な見方によれば、脳内に刺激を推定する復号器の存在を陽に仮定する必要はなくなり、復号器の役割は自発活動から刺激応答活動への変化に内包される。   
 これによれば、脳の内部構造に基づく神経細胞の自発活動、すなわち脳の内発的ダイナミクスは事前分布を構成する。刺激が提示されると、神経活動は刺激の影響を受けて変調され、復号器と組み合わされて事後分布を形成する<ref name=Brown1998><pubmed>9736661</pubmed></ref> <ref name=Fiser2010><pubmed>20153683</pubmed></ref>[Fiser 2010; Berkes 2011]。すなわち神経応答活動は刺激を再構成・予測するための推論を行なっていると考える事ができる。神経応答活動のベイズ的な見方によれば、脳内に刺激を推定する復号器の存在を陽に仮定する必要はなくなり、復号器の役割は自発活動から刺激応答活動への変化に内包される。   
60行目: 63行目:
 生成モデルに基づく符号化研究は、正則化を課した画像の再構成という視覚野の計算論に関わる研究をその祖として古くから行われ、マルコフ確率場を用いたGeman & Gemanらによる画像再構成<ref name=Geman1984><pubmed>22499653</pubmed></ref>[Geman & Geman 1984]や、神経活動の事前分布としてスパース性を導入して自然画像を学習する事で、第一次視覚野の単純細胞の受容野の形成を説明したOlshausen & Fieldらの研究をその端緒として位置づけることができる<ref name=Geman1984><pubmed>22499653</pubmed></ref>[Olshausen 1996]。近年は、この生成モデル・ベイズの定理に基づく神経活動のモデリング・解析が盛んに行われている。詳しくは、予測符号化・自由エネルギー原理を参照のこと。
 生成モデルに基づく符号化研究は、正則化を課した画像の再構成という視覚野の計算論に関わる研究をその祖として古くから行われ、マルコフ確率場を用いたGeman & Gemanらによる画像再構成<ref name=Geman1984><pubmed>22499653</pubmed></ref>[Geman & Geman 1984]や、神経活動の事前分布としてスパース性を導入して自然画像を学習する事で、第一次視覚野の単純細胞の受容野の形成を説明したOlshausen & Fieldらの研究をその端緒として位置づけることができる<ref name=Geman1984><pubmed>22499653</pubmed></ref>[Olshausen 1996]。近年は、この生成モデル・ベイズの定理に基づく神経活動のモデリング・解析が盛んに行われている。詳しくは、予測符号化・自由エネルギー原理を参照のこと。


 なお、本項目では神経符号化を刺激が神経活動に変換される過程としたが、広義にはこの過程には神経活動生成の基盤となるメカニズムの構築、すなわち刺激によるシナプス結合等の脳の構造の変化(学習・記憶)を含む。この場合、符号器としてp(x、w|y)が使用され、生成モデルによるアプローチでは脳の構造も事後分布からのサンプリングとして形成されると考える。
 なお、本項目では神経符号化を刺激が神経活動に変換される過程としたが、広義にはこの過程には神経活動生成の基盤となるメカニズムの構築、すなわち刺激によるシナプス結合等の脳の構造の変化(学習・記憶)を含む。この場合、符号器として<math>p(x,w|y)</math>が使用され、生成モデルによるアプローチでは脳の構造も事後分布からのサンプリングとして形成されると考える。


==集団符号化==
==集団符号化==