「視覚系の順逆変換モデル」の版間の差分

編集の要約なし
編集の要約なし
編集の要約なし
13行目: 13行目:
</math>
</math>


 左辺は、二次元画像強度データを示し、左眼の画像<math>(&micro; 0)</math>か右眼の画像<math>(&micro; 1)</math>の網膜上の位置<math>(x,y)</math>での、時間<math>t</math>、波長<math>&lambda;</math>の光強度を示す。<math>S=(S1,S2,K,Sm)</math>とすると、右辺は視覚世界の状態や構造<math>S''から画像データ<math>I</math>が決まる画像生成過程を非線形関数<math>R</math>で表したものである。 の中の変数S1~Smはすべて視覚大脳皮質で別々に表現され再構成されていると考える。具体的な<math>Si</math>として、画像強度<math>I</math>のある方向への1階微分と2階微分、局所的な速度や、両眼視または単眼視によって得られた奥行きや面の傾き、面の色、照明光の色や光源位置、物体の3次元的空間位置、観察者自身の移動速度ベクトルなどである。
 左辺は、二次元画像強度データを示し、左眼の画像<math>(\mu 0)</math>か右眼の画像<math>(\mu 1)</math>の網膜上の位置<math>(x,y)</math>での、時間<math>t</math>、波長<math>\lambda</math>の光強度を示す。<math>S=(S_1,S_2...,S_m)</math>とすると、右辺は視覚世界の状態や構造<math>S</math>から画像データ<math>I</math>が決まる画像生成過程を非線形関数<math>R</math>で表したものである。 の中の変数S_1~S_mはすべて視覚大脳皮質で別々に表現され再構成されていると考える。具体的な<math>S_i</math>として、画像強度<math>I</math>のある方向への1階微分と2階微分、局所的な速度や、両眼視または単眼視によって得られた奥行きや面の傾き、面の色、照明光の色や光源位置、物体の3次元的空間位置、観察者自身の移動速度ベクトルなどである。


 視覚の目的は から を推定することである。マルコフ確率場(Markov random field)理論を用いると最大事後確率推定は、以下の事後エネルギーの最小化として定式化される。具体的には、<math>S</math>の事前確率(内部モデル)を 、<math>P(S)</math>、<math>S</math>が与えられたときの<math>I</math>の条件つき確率を<math>P(I|S)</math>で表す。そして、これらがGibbs分布に従うと仮定して、対応するエネルギーを<math>U(S)</math>、<math>U(I|S)</math>とすると、事後エネルギー<math>U(S|I)</math>は、
 視覚の目的は から を推定することである。マルコフ確率場(Markov random field)理論を用いると最大事後確率推定は、以下の事後エネルギーの最小化として定式化される。具体的には、<math>S</math>の事前確率(内部モデル)を 、<math>P(S)</math>、<math>S</math>が与えられたときの<math>I</math>の条件つき確率を<math>P(I|S)</math>で表す。そして、これらがGibbs分布に従うと仮定して、対応するエネルギーを<math>U(S)</math>、<math>U(I|S)</math>とすると、事後エネルギー<math>U(S|I)</math>は、
37行目: 37行目:
\frac{dS(t)}{dt}=R^\#\{I-r(S)\}-\frac{\partial U(S)}{\partial U}
\frac{dS(t)}{dt}=R^\#\{I-r(S)\}-\frac{\partial U(S)}{\partial U}
</math>
</math>
 図では,2次元画像データ<math>Iは視覚下位中枢に,視覚世界の様子Sは視覚上位中枢に表現されている.このモデルは視覚下位中枢を折返しにして鏡像対称となっている.このとき、領野間の前向きと後ろ向きの結合ループを信号が循環する間に正しい解に到達することが示された。
 図では,2次元画像データ<math>I</math>は視覚下位中枢に,視覚世界の様子<math>S</math>は視覚上位中枢に表現されている.このモデルは視覚下位中枢を折返しにして鏡像対称となっている.このとき、領野間の前向きと後ろ向きの結合ループを信号が循環する間に正しい解に到達することが示された。


 図に示したモデルは、<math>S</math> をひとまとめにして記述したモデルである.実際には、<math>s<sub>1</sub></math>から<math>s<sub>m</sub></math>が,一次視覚野から高次視覚野で別々に表現されており、各階層間で上記の順逆変換のループが働いて各属性が推定されると考えられている。これらの計算過程やそれを支持する生理学や解剖学の知見については、川人・乾 (1990) <ref name=川人1990></ref>や乾 (1993) <ref name=乾1993>乾 敏郎 (1993).<br>『Q&Aでわかる脳と視覚-人間からロボットまで』 サイエンス社.</ref>を参照。
 図に示したモデルは、<math>S</math> をひとまとめにして記述したモデルである.実際には、<math>s_1</math>から<math>s_m</math>が,一次視覚野から高次視覚野で別々に表現されており、各階層間で上記の順逆変換のループが働いて各属性が推定されると考えられている。これらの計算過程やそれを支持する生理学や解剖学の知見については、川人・乾 (1990) <ref name=川人1990></ref>や乾 (1993) <ref name=乾1993>乾 敏郎 (1993).<br>『Q&Aでわかる脳と視覚-人間からロボットまで』 サイエンス社.</ref>を参照。


 なお、知覚の計算を行うときには前向きと後ろ向きの神経回路が用いられるが、後ろ向きの結合は、順光学なので仮に外部刺激による信号がないときに働けば、知覚時と同じ活動を再現することが可能である。つまりこのような順逆変換が学習されれば(彼らの理論では学習アルゴリズムも与えている)外界の情報の処理と内的イメージの生成が同時に可能になるのである。具体的な視覚問題に適用された例は、Kawato, M., Hayakawa, H., and Inui, T. (1993)<ref> Kawato, M., Hayakawa, H., & Inui, T. (1993). A forward-inverse optics model of reciprocal connections between visual cortical areas. Network: Computation in Neural Systems, 4, 415-422. doi: 10.1088/0954-898X_4_4_001</ref>にある。なおこの理論は、Fristonの脳の統一理論である自由エネルギー原理において拡張された<ref><pubmed>17097864</pubmed></ref><ref>乾 敏郎・阪口 豊 (2020). <br>『脳の大統一理論 -自由エネルギー原理とは何か-』 岩波書店.</ref>(Friston, 2006: 乾・阪口, 2020)。
 なお、知覚の計算を行うときには前向きと後ろ向きの神経回路が用いられるが、後ろ向きの結合は、順光学なので仮に外部刺激による信号がないときに働けば、知覚時と同じ活動を再現することが可能である。つまりこのような順逆変換が学習されれば(彼らの理論では学習アルゴリズムも与えている)外界の情報の処理と内的イメージの生成が同時に可能になるのである。具体的な視覚問題に適用された例は、Kawato, M., Hayakawa, H., and Inui, T. (1993)<ref> Kawato, M., Hayakawa, H., & Inui, T. (1993). A forward-inverse optics model of reciprocal connections between visual cortical areas. Network: Computation in Neural Systems, 4, 415-422. doi: 10.1088/0954-898X_4_4_001</ref>にある。なおこの理論は、Fristonの脳の統一理論である自由エネルギー原理において拡張された<ref><pubmed>17097864</pubmed></ref><ref>乾 敏郎・阪口 豊 (2020). <br>『脳の大統一理論 -自由エネルギー原理とは何か-』 岩波書店.</ref>(Friston, 2006: 乾・阪口, 2020)。