「視覚系の順逆変換モデル」の版間の差分

ナビゲーションに移動 検索に移動
編集の要約なし
編集の要約なし
編集の要約なし
22行目: 22行目:
</math>
</math>


 左辺は、二次元画像強度データを示し、左眼の画像<math>(\mu 0)</math>か右眼の画像<math>(\mu 1)</math>の網膜上の位置<math>(x,y)</math>での、時間<math>t</math>、波長<math>\lambda</math>の光強度を示す。<math>S=(S_1,S_2...,S_m)</math>とすると、右辺は視覚世界の状態や構造<math>S</math>から画像データ<math>I</math>が決まる画像生成過程を[[非線形関数]]<math>R</math>で表したものである。 の中の変数S_1~S_mはすべて視覚[[大脳皮質]]で別々に表現され再構成されていると考える。具体的な<math>S_i</math>として、画像強度<math>I</math>のある方向への1階微分と2階微分、局所的な速度や、[[両眼視]]または[[単眼視]]によって得られた奥行きや面の傾き、面の色、照明光の色や光源位置、物体の3次元的空間位置、観察者自身の移動速度ベクトルなどである。
 左辺は、二次元画像強度データを示し、左眼の画像<math>(\mu=0)</math>か右眼の画像<math>(\mu=1)</math>の網膜上の位置<math>(x,y)</math>での、時間<math>t</math>、波長<math>\lambda</math>の光強度を示す。<math>S=(s_1,s_2...,s_m)</math>とすると、右辺は視覚世界の状態や構造<math>S</math>から画像データ<math>I</math>が決まる画像生成過程を[[非線形関数]]<math>R</math>で表したものである。<math>R</math>の中の変数<math>s_1 \sim s_m</math>はすべて視覚[[大脳皮質]]で別々に表現され再構成されていると考える。具体的な<math>s_i</math>として、画像強度<math>I</math>のある方向への1階微分と2階微分、局所的な速度や、[[両眼視]]または[[単眼視]]によって得られた奥行きや面の傾き、面の色、照明光の色や光源位置、物体の3次元的空間位置、観察者自身の移動速度ベクトルなどである。


 視覚の目的は から を推定することである。[[マルコフ確率場]](Markov random field)理論を用いると最大事後確率推定は、以下の事後エネルギーの最小化として定式化される。具体的には、<math>S</math>の事前確率(内部モデル)を <math>P(S)</math>、<math>S</math>が与えられたときの<math>I</math>の条件つき確率を<math>P(I|S)</math>で表す。そして、これらが[[Gibbs分布]]に従うと仮定して、対応するエネルギーを<math>U(S)</math>、<math>U(I|S)</math>とすると、事後エネルギー<math>U(S|I)</math>は、
 視覚の目的は<math>I</math>から<math>S</math>を推定することである。[[マルコフ確率場理論|マルコフ確率場]](Markov random field)理論を用いると最大事後確率推定は、以下の事後エネルギーの最小化として定式化される。具体的には、<math>S</math>の事前確率(内部モデル)を <math>P(S)</math>、<math>S</math>が与えられたときの<math>I</math>の条件つき確率を<math>P(I|S)</math>で表す。そして、これらが[[Gibbs分布]]に従うと仮定して、対応するエネルギーを<math>U(S)</math>、<math>U(I|S)</math>とすると、事後エネルギー<math>U(S|I)</math>は、


:<math>
:<math>
38行目: 38行目:
</math>
</math>


とする。そして大脳皮質[[一次視覚野]]から[[高次視覚野]]への上行性(前向き)神経結合によって<math>R^\#</math>の近似逆変換(すなわち近似逆光学)<math>R^\#</math>が計算され、高次視覚野から一次視覚野への下行性(後向き)神経結合によって順光学<math>R</math>が計算されると仮定する。そして事後エネルギー最小化が次式で表すような神経回路モデルで計算されていると仮定する('''図''')。
とする。そして大脳皮質[[一次視覚野]]から[[高次視覚野]]への上行性(前向き)神経結合によって<math>R</math>の近似逆変換(すなわち近似逆光学)<math>R^\#</math>が計算され、高次視覚野から一次視覚野への下行性(後向き)神経結合によって順光学<math>R</math>が計算されると仮定する。そして事後エネルギー最小化が次式で表すような神経回路モデルで計算されていると仮定する('''図''')。
[[ファイル:Inui forward reverse optic model.png|サムネイル|'''図. 大脳視覚皮質の順逆変換モデルの概要''']]
[[ファイル:Inui forward reverse optic model.png|サムネイル|'''図. 大脳視覚皮質の順逆変換モデルの概要''']]
:<math>
:<math>
45行目: 45行目:


:<math>
:<math>
\frac{dS(t)}{dt}=R^\#\{I-r(S)\}-\frac{\partial U(S)}{\partial U}
\frac{dS(t)}{dt}=R^\#\{I-R(S)\}-\frac{\partial U(S)}{\partial U}
</math>
</math>
 図では、2次元画像データ<math>I</math>は視覚下位中枢に、視覚世界の様子<math>S</math>は視覚上位中枢に表現されている。このモデルは視覚下位中枢を折返しにして鏡像対称となっている。このとき、[[領野]]間の前向きと後ろ向きの結合ループを信号が循環する間に正しい解に到達することが示された。
 図では、2次元画像データ<math>I</math>は視覚下位中枢に、視覚世界の様子<math>S</math>は視覚上位中枢に表現されている。このモデルは視覚下位中枢を折返しにして鏡像対称となっている。このとき、[[領野]]間の前向きと後ろ向きの結合ループを信号が循環する間に正しい解に到達することが示された。

案内メニュー