「視差エネルギーモデル」の版間の差分

提供:脳科学辞典
ナビゲーションに移動 検索に移動
編集の要約なし
編集の要約なし
(4人の利用者による、間の24版が非表示)
1行目: 1行目:
<div align="right"> 
英:disparity energy model [] 両眼エネルギーモデル binocular energy model
<font size="+1">[http://researchmap.jp/rtanaka 田中 宏喜]</font><br>
''京都産業大学 コンピュータ理工学部 インテリジェントシステム学科''<br>
DOI:<selfdoi /> 原稿受付日:2012年7月31日 原稿完成日:2012年8月13日<br>
担当編集委員:[http://researchmap.jp/ichirofujita 藤田 一郎](大阪大学 大学院生命機能研究科)<br>
</div>


英:disparity energy model
<br>


同義語: binocular energy model
 奥行きや立体構造を知るための強い手がかりである両眼視差は、網膜からの視覚経路において第一次視覚野(V1野)ではじめて検出される。この両眼視差の検出に特化したV1野細胞の受容野機構を記述したモデルが視差エネルギーモデルである。現在、視差エネルギーモデルは脳における両眼視差検出の標準的理論であり、また高次視覚野における両眼情報処理の神経機構を考える上でも重要な基礎となっている。1990年カリフォルニア大学バークレー校の大澤らによって提案された<ref name="ref1"><pubmed> 2396096  </pubmed></ref>。  
 
{{box|text=
 奥行きや物体の立体構造を知るための手がかりである[[両眼視差]]は、[[網膜]]からの視覚経路において[[第一次視覚野]](V1野)ではじめて検出される。この両眼視差(正確には絶対視差)の検出に特化したV1野細胞の[[受容野]]モデルが視差エネルギーモデルであり、現在、脳における両眼視差検出機構の標準モデルとなっている。1990年[[wikipedia:ja:カリフォルニア大学バークレー校|カリフォルニア大学バークレー校]]の大澤五住らによって提案された<ref name="ref1"><pubmed> 2396096  </pubmed></ref>。 以降、視差エネルギーモデルを出発点にして、相対視差など様々なタイプの両眼視差を検出する神経機構や、両眼対応点問題を解決するための脳内機構を調べる研究が数多く行われている。
}}


== 両眼視差  ==
== 両眼視差  ==


[[Image:BinocularDisparity.png|thumb|350px|<b>図1 両眼視差</b><br />両眼視差. A,2つの眼で黒丸を注視するとき、さまざまな奥行きにある刺激の網膜投影像。B, 左右の網膜を平にして、上下に並べたもの。注視している点(注視点という)に位置する黒丸の像は、網膜で視力の最も高い場所である中心窩に投影される。注視点と同じ奥行きにある刺激(青)の左右の像は、中心窩を基準とした網膜座標上の同じ位置に投影され、その両眼視差はゼロとなる。一方、注視点と異なる奥行き面上にある刺激(赤、緑)は、左右網膜の異なる位置に投影され、ゼロ以外の両眼視差をもつ。手前にある刺激(緑)と、奥にある刺激(赤)の両眼視差の方向は逆になり、前者を交差視差、後者を非交差視差とよんでいる。]]  
[[Image:BinocularDisparity.png|thumb|450px|<b>図1 両眼視差</b> 両眼視差. A,さまざまな奥行きにある刺激の網膜投影像。B, 左右の網膜を平にして、上下に並べたもの。注視点Fは、網膜で視力の最も高い中心窩(0で表す)に投影される。注視点と同じ奥行きにある刺激(青)の左右の像は、中心窩を基準とした網膜座標上の同じ位置に投影され、その両眼視差はゼロとなる。一方、注視面と異なる奥行き面上にある刺激(赤、緑)は、左右網膜の異なる位置に投影され、ゼロ以外の両眼視差をもつ。手前にある刺激(緑)と、奥にある刺激(赤)の両眼視差の符号は逆になり、前者を交差視差、後者を非交差視差とよんでいる。]]  


 われわれが両眼でものをみるとき、2つの眼が注視している点(注視点)と同じ奥行きにある刺激は、左右の網膜上の同じ位置に投影される(=いずれの網膜においても、網膜の中心である中心窩から同じ方向、量だけ離れた位置に投影される)のに対し、注視点と異なる奥行きにある刺激は水平方向にずれた位置に投影される(図1参照)。この網膜像の位置のずれのことを両眼視差という(単に視差ともいう)。両眼視差の量は刺激と注視点の奥行き距離に比例する。また刺激が注視点より手前にある場合と、奥にある場合とで両眼視差の方向(符号)は逆になる。慣習上、前者にはマイナス、後者にはプラスの符号をつけ、前者を交差視差 、後者を非交差視差とよぶ。
 われわれが両眼でものをみるとき、2つの眼が注視している点(図1のF)と同じ奥行きにある刺激(図1の青丸)は、左右の網膜上の同じ位置に投影される(=いずれの網膜においても、網膜の中心である中心窩から同じ方向、量だけ離れた位置に投影される)のにたいし、注視点と異なる奥行きにある刺激(図1の赤や緑の丸)は水平方向にずれた位置に投影される。この網膜像の位置のずれのことを両眼視差という(単に視差ともいう)。両眼視差の量は刺激と注視点の奥行き距離に比例する。また刺激が注視点より手前にある場合と、奥にある場合とで、両眼視差の方向(符号)は逆になり、慣習上、前者にはマイナス、後者にはプラスの符号をつける。手前にある刺激により生じる両眼視差を交差視差 、奥にある刺激により生じる両眼視差を非交差視差とよぶ。<br>


 われわれが両眼視差のみを手がかりにして奥行きを知覚できることは1838年にチャールズ・ホイートストン([[wikipedia:Charles Wheatstone|Wheatstone]])がハプロスコープ(ミラー式両眼視システム)を考案して証明した。
<br>


== V1野にみられる両眼視差選択性  ==
== V1野にみられる両眼視差選択性  ==


 網膜からの視覚処理経路において、左右両眼に受容野をもつ細胞はV1野で初めて現れる<ref name="ref2"><pubmed> 14403679 </pubmed></ref>。これらの細胞の一部は、刺激の両眼視差がある範囲に入るときには強く応答し、それ以外のときにはあまり応答しない特性、すなわち両眼視差選択性を示す<ref name="ref4"><pubmed> 6065881 </pubmed></ref>。ゼロ視差やさまざまな大きさの交差視差、非交差視差を最適とする細胞が存在する。初期の研究ではこれらの細胞は6つのタイプに分類されたが<ref name="ref7"><pubmed> 3199191  </pubmed></ref>、最近の研究結果は、これらは1つの連続体として捉えたほうがよいことを示している <ref name="ref8"><pubmed> 11784742  </pubmed></ref>。  
&nbsp; &nbsp;網膜からの視覚処理経路において、左右の眼に受容野をもつ両眼性の細胞がV1野にはじめて現れる<ref name="ref2"><pubmed> 14403679 </pubmed></ref>。うち一部は、刺激の両眼視差がある範囲に入るときには強く応答し、それ以外のときにはあまり応答しない特性、すなわち両眼視差選択性を示す<ref name="ref4"><pubmed> 6065881 </pubmed></ref>。ゼロ視差やさまざまな大きさの交差視差、非交差視差を最適とする細胞が存在する。初期の研究ではこれらの細胞は6つのタイプに分類されたが<ref name="ref7"><pubmed> 3199191  </pubmed></ref>、最近の研究結果は、これらは1つの連続体として捉えたほうがよいことを示している <ref name="ref8"><pubmed> 11784742  </pubmed></ref>。<br>   受容野構造の違いから、V1野の細胞は単純型細胞と複雑型細胞とに大きく分類され、いずれのタイプにも両眼視差選択性細胞は存在する。しかし、後述するように、単純型細胞よりも複雑型細胞のほうが両眼視差を検出するうえで理想的な振る舞いをする。この複雑型細胞の両眼視差選択性を説明する受容野機構のモデルが視差エネルギーモデルである。このモデルで複雑型細胞の応答は、複数の単純型細胞からの入力の和で生成される。以下に単純型細胞の両眼受容野機構を述べ、続いて視差エネルギーモデルを説明する。 <br>
 
 受容野構造の違いから、V1野の細胞は[[単純型細胞]]と[[複雑型細胞]]とに大きく分類され、いずれのタイプにも両眼視差選択性細胞は存在する。しかし、後述するように、単純型細胞よりも複雑型細胞のほうが両眼視差を検出するうえで理想的な振る舞いをする。この複雑型細胞の両眼視差選択性を説明する受容野モデルが視差エネルギーモデルである。このモデルで複雑型細胞の応答は、複数の単純型細胞からの入力の和で生成される。以下に単純型細胞の両眼受容野構造を述べ、続いて視差エネルギーモデルを説明する。


== 単純型細胞の受容野構造と両眼視差選択性  ==
== 単純型細胞の受容野構造と両眼視差選択性  ==


[[Image:BinocularSimple.png|thumb|350px|<b>図2 単純型細胞の受容野構造と両眼視差選択性</b><br />A. 単純型細胞の両眼受容野構造. 左右の受容野のx-y2次元構造とx-方向の1次元断面図を示している。これらの受容野を持つ細胞を丸で表し、その下の図で半波整流機構を表している。B-D. 単純型細胞の視差選択性。受容野の上の四角は、明るいスポット刺激の左右網膜像を表し、この細胞が最大応答を示すように配置されている。B. ゼロ視差を最適とする受容野構造. C. 位置モデルにより非交差視差に適刺激とする受容野。D. 位相モデルにより非交差視差を適刺激とする受容野。<br />]]  
[[Image:BinocularSimple.png|thumb|500px|<b>図2 単純型細胞の受容野構造と両眼視差選択性</b> A. 単純型細胞の両眼受容野構造. 左右の受容野はx-y2次元構造とx-方向の1次元断面図を示している。Sは細胞体、下の四角は半波整流機構を表す。B-D. 単純型細胞の視差選択性。上の四角は、刺激(明るいスポットとする)の左右網膜像を表し、すぐ下の受容野をもつ細胞にとって最適な両眼視差をとる場合の位置関係を表す。B. ゼロ視差を最適とする受容野構造. C. 位置モデルによる非交差視差選択性。D. 位相モデルによる非交差視差選択性。E. Bの細胞と同じ受容野をもつが、左眼刺激を中心より左へずらして固定した場合、細胞はゼロ視差より交差視差により強く応答する<br />]]  


 単純型細胞細胞は、明るい刺激に応答するON領域と暗い刺激に応答するOFF領域が分離した受容野をもつ。受容野の空間構造は[[wikipedia:ja:ガボール関数|ガボール関数]]で近似できる。
<br>  単純型細胞細胞は、明るい刺激に応答するON領域と暗い刺激に応答するOFF領域が分離した受容野をもつ。受容野の空間構造はガボール関数で近似できる。


 多くの単純型細胞は両眼に受容野をもつ。これら両眼性単純型細胞の応答は、両眼からの入力を左右の受容野で重みづけをして足し合わせたのち、さらに[[wikipedia:ja:半波整流|半波整流]]をしたものとして表すことができる(図2A)。
 多くの単純型細胞は両眼に受容野をもつ。これら両眼性単純型細胞の応答は、両眼からの入力を左右の受容野で重みづけをして足し合わせたのち、さらに半波整流をしたものとして表すことができる(図2A)。


 単純型細胞が視差選択性をもつ機構は、大きく分けて2種類ある<ref name="ref9"><pubmed> 2067576  </pubmed></ref><ref name="ref12"><pubmed> 11784743  </pubmed></ref>。1つは、左右の受容野の形は同じであるが、その位置がずれることにより視差選択性が生じる機構で「位置モデル」と呼ばれている。細胞は受容野の位置のずれと等しい両眼視差に最も強く応答する。たとえば、図2Bの受容野をもつ細胞はゼロ視差に最も強く応答し、図2Cの受容野をもつ細胞は非交差視差に最も強く応答する。第2の機構は、受容野の(中心)位置は同じであるが、受容野の形(位相)が異なることにより両眼視差選択性が生じる機構で、「位相モデル」とよばれている(図2D)。さらに実際の細胞には、位置と位相の両方ずれた受容野をもつものも多く、このような受容野に基づく視差選択性機構は「ハイブリッドモデル」とよばれている。様々な機構がある意義については、これら3種類の機構を利用することで対応点問題(後述)がより精度よく解けることが理論的に示されている<ref name="read"><pubmed> 17828262 </pubmed></ref>
 単純型細胞が様々な視差に選択性をもつ機構には、大きくわけて2種類のものが考えられる<ref name="ref9"><pubmed> 2067576  </pubmed></ref><ref name="ref12"><pubmed> 11784743  </pubmed></ref>。1つは、左右の受容野の形は同じであるが、その位置がずれることにより視差選択性が生じる機構で「位置モデル」と呼ばれている。このとき細胞は、受容野の位置のずれと等しい両眼視差刺激に最も強く応答する。たとえば、図2Bの受容野をもつ細胞はゼロ視差に最も強く応答し、図2Cの受容野をもつ細胞は非交差視差に最も強く応答する。第2の機構は、受容野の(中心)位置は同じであるが、受容野の形(位相)が異なることにより両眼視差選択性が生じる機構で、「位相モデル」とよばれている(図2D)。実際の細胞は、「位置視差タイプ」あるいは「位相モデル」で説明されるもの以外に、左右受容野の位置と位相が両方ずれた「ハイブリッドモデル」で説明されるものもある。このような様々な種類ものもがある意義については、後述する対応点問題を解決するのに有効であることが理論的に示されている。<br> 単純型細胞の両眼視差による応答の違いは非常にはっきりとしている。しかし、単純型細胞の両眼視差依存性は、刺激の左右投影像の単眼上での位置や、刺激のコントラストにも大きく依存するという問題がある。たとえば、図2Eのように、左右に同じ受容野をもつ細胞にたいして、明るいスポット光の左眼像の位置を受容野の中心よりもやや左に固定して呈示する場合、ゼロ視差ではなく交差視差が最適視差となる。このような問題のため、通常、単純型細胞がV1野の両眼視差検出器として取り扱われることはない。<br>  


 多くの両眼性単純型細胞は、両眼視差によって大きな応答の変動を示す。しかし細胞が最大応答する両眼視差は、刺激の左右投影像の単眼上での位置や、刺激のコントラストにも依存するという問題がある。このような問題のため、通常、単純型細胞がV1野の両眼視差検出器のモデルとして取り扱われることはない。
<br>


== 視差エネルギーモデル  ==
== 視差エネルギーモデル  ==


[[Image:DisparityEnergyModel.png|thumb|350px|<b>図3 視差エネルギーモデル</b><br />複雑型細胞を模倣したエネルギーユニット(Cの記号で表す)は、両眼性単純型細胞を模倣した4つのサブブユニット(S1, S2, S3, S4)が出す信号を線形加算し、外部に出力する。詳細は本文参照。<br />]]  
[[Image:DisparityEnergyModel.png|thumb|400px|<b>図3 視差エネルギーモデル</b><br />]]  


 単純型細胞の両眼視差選択性が視覚刺激の単眼位置やコントラストに依存するのに対し、複雑型細胞の両眼視差選択性はそれらに依存せず一定となる。この複雑型細胞の特性を説明するモデルが視差エネルギーモデルであり、図3のように表される<ref name="ref1" /><ref name="ref13"><pubmed> 9212245  </pubmed></ref>。このモデルにおいて、複雑型細胞(Cの記号で表す)は、両眼性単純型細胞をモデル化した4つのサブユニット(S1, S2, S3, S4)が出す信号を[[wikipedia:ja:線形加算|線形加算]]し、外部に出力する。4つのサブユニットの受容野の位相は、右眼、左眼のそれぞれにおいて90度ずつ異なっている。サブユニットの左右受容野の方位、空間周波数は全て同じである。
&nbsp; 単純型細胞の両眼視差選択性は、視覚刺激の(単眼)位置やコントラストに依存するのにたいし、複雑型細胞の両眼視差選択性はそれらに依存せず一定である。この複雑型細胞の特性を説明するモデルが、視差エネルギーモデルであり、図3のように表される<ref name="ref1" /><ref name="ref13"><pubmed> 9212245  </pubmed></ref>。このモデルにおいて、複雑型細胞(Cの記号で表す)は、両眼性単純型細胞をモデル化した4つのサブユニット(S1, S2, S3, S4)が出す信号を線形加算し、外部に出力する。4つのサブユニットのガボールフィルターの位相は、右眼、左眼のそれぞれにおいて90度ずつ異なっている。また各サブニットにおいて、左右ガボールフィルターの両眼間の位相差は同一である(この場合0である)。この両眼位相差を(4つのサブユニットで同一に保ちながら)変化させることで、モデルの両眼視差選択性を変化させることができる。あるいは、両眼位相差を0にしたまま、4つのサブユニットそれぞれにおいて、左右の受容野の位置を一定量ずらすことでも、モデルの両眼視差選択性を変化させうる。前者は単純型細胞の「位相モデル」に対応し、後者は「位置モデル」と対応する。<br>&nbsp; 刺激の左右の像が、複雑型細胞の最適な両眼視差をもつ場合(図3の場合はゼロ視差)、受容野内部のどの場所に刺激がくる場合でも、4つのサブユニットのいずれかが強く応答する。図3の場合、明るいゼロ視差の刺激が受容野の中心に呈示される場合にはS1が、左部分に呈示される場合にはS2が、右部分に呈示される場合にはS4がそれぞれ強く応答する。また、背景より暗いゼロ視差の刺激が受容野の中心、左部分、右部分に呈示される場合には、S3、S4、S2がそれぞれ強く応答する。このため、複雑型細胞は、受容野内部の刺激の位置やコントラストに影響されずに、同じ両眼視差選択性を示すようになり、両眼視差の検出器としては理想的な振る舞いをする。


 各サブニットにおいて、左右受容野の両眼間の[[wikipedia:ja:位相|位相]]差を(4つのサブユニットで同一に保ちながら)変化させることで、モデルの両眼視差選択性を変化させることができる。あるいは、両眼間位相差を0にしたまま、受容野の位置を両眼間で一定量ずらすことでも、モデルの両眼視差選択性を変化させうる。前者は単純型細胞の「位相モデル」に対応し、後者は「位置モデル」と対応する。図3の例では、サブユニットの左右の受容野は位相、位置ともにずれがなく、モデルはゼロ視差に選択性をもつ。<br>&nbsp; 刺激の左右の像が、複雑型細胞の最適な両眼視差をもつ場合、受容野内部のどの場所に刺激がくる場合でも、4つのサブユニットのいずれかが強く応答する。図3の場合、明るいゼロ視差の刺激が受容野の中心に呈示される場合にはS1が、左部分に呈示される場合にはS2が、右部分に呈示される場合にはS4がそれぞれ強く応答する。また、背景より暗いゼロ視差の刺激が受容野の中心、左部分、右部分に呈示される場合には、S3、S4、S2がそれぞれ強く応答する。このため、複雑型細胞は、受容野内部の刺激の位置やコントラストに影響されずに、同じ両眼視差選択性を示すようになり、両眼視差の検出器としては理想的な振る舞いをする。
&nbsp; 視差エネルギーモデルが行っている計算は、2枚の画像についての局所的な相関計算と類似性がある。2枚の画像の局所相関を計算する場合、2枚の画像を一定量ずらしたとき同じ位置にくる画素値をかけあわせて、その局所平均をとる。視差エネルギーモデルが行っている計算は数学的にはこのような計算と捉えることができる<ref name="qian"><pubmed> 9231233</pubmde></ref> 。


 視差エネルギーモデルは、最小4つのサブユニットの組み合わせで複雑型細胞の特性を表しうることを述べたものであり、複雑型細胞が必ず4つの単純型細胞の入力により生成されることを提唱しているわけではない。実際には、4つ以上の単純型細胞の入力により複雑型細胞の受容野は形成されていると推定されている<ref name="sasaki"><pubmed> 20943923</pubmed></ref> 。<br>  
&nbsp; 視差エネルギーモデルは、最小4つのサブユニットの組み合わせで複雑型細胞の特性を表しうることを述べたものであり、複雑型細胞が必ず4つの単純型細胞の入力により生成されることを提唱しているわけではない。実際には、4つ以上の単純型細胞の入力により複雑型細胞の受容野構造は形成されていると推定されている<ref name="sanada"><pubmed> 16394073</pubmde></ref><ref name = "sasaki"><pubmed> 20943923</pubmde></ref> 。<br>  


 視差エネルギーモデルが行っている計算は、2枚の画像についての局所的な相関計算と類似性がある。2枚の画像の局所相関を計算する場合、2枚の画像を一定量ずらしたとき同じ位置にくる画素値をかけあわせて、その局所平均をとる。視差エネルギーモデルが行っていることは数学的にはこのような計算と捉えることができる<ref name="qian"><pubmed> 9274767</pubmed></ref> 。
<br>  


== 視差エネルギーモデルの拡張による種々の両眼視差の検出 ==
== 視差エネルギーモデルの拡張による種々の両眼視差の検出 ==


=== 相対視差  ===
=== 相対視差  ===


 ここまで扱ってきた両眼視差は、[[中心窩]]を基準とした座標系における、左右網膜像の位置のずれとして定義されたものであり、絶対視差とも呼ばれる。これに対して、2つの刺激がもつ絶対視差の差異のことを相対視差と呼ぶ。われわれは隣接する刺激の奥行きを非常に精度よく弁別できるが、これには[[眼球]]の[[輻輳運動]]の影響をうけない相対視差が利用されていると考えられている。[[wikipedia:ja:サル|サル]]V1野の細胞の大部分は絶対視差をコードしているが、V1野から入力を受ける[[wikipedia:ja:V2野|V2野]]や[[wikipedia:ja:V4野|V4野]]には、相対視差に選択的応答を示す細胞が一定の割合で存在する<ref name="ref14"><pubmed> 11967544 </pubmed></ref><ref name="ref15"><pubmed> 17507498 </pubmed></ref>。この選択性は、異なる場所に受容野をもち、異なる絶対視差に選択性をもつ視差エネルギーモデルの出力を2段階的に統合することで生成できる。<ref name="ref14" />。  
 ここまで述べてきた両眼視差は、中心窩を基準とした座標系における、左右網膜像の位置のずれとして定義されたものであり、絶対視差ともよばれるものである。これにたいし、2つの刺激がもつ絶対視差の差異のことを相対視差とよぶ。われわれは隣接する刺激の奥行きを非常に精度よく弁別できるが、これには眼球の輻輳運動の影響をうけない相対視差が利用されていると考えられている。<br> サルV1野の細胞の大部分は絶対視差をコードしているが、V1野から入力を受けるV2野やV4野には、相対視差に選択性応答を示す細胞が一定の割合で存在する<ref name="ref14"><pubmed> 11967544 </pubmed></ref><ref name="ref15"><pubmed> 17507498 </pubmed></ref>。この選択性は、理論的には、異なる場所に受容野をもつ視差エネルギーモデルの出力を2段階的に統合することで生じうることが示されている。<ref name="ref14" />。<br>  
 
=== 視差の勾配  ===
 
 前額平行面から奥行き方向に傾いた物体表面をみるとき、その表面上の特徴点は網膜上で両眼視差の勾配を作り出す。受容野内部の場所によって、異なる視差選択性をもつサブユニットから入力を受け取るように、視差エネルギーモデルを拡張すると(このときサブユニットの数は4よりも多くなる)、この拡張モデルは視差勾配への選択性をもつようになる(ただしこの選択性は絶対視差にも強く依存する)。[[wikipedia:ja:ネコ|ネコ]][[V1野]]にはこのモデルに合致するほうな細胞が存在することが示されている<ref name="sanada"><pubmed> 16394073</pubmed></ref>。
 
=== 方位視差  ===


 前額平行面から奥行き方向に傾いた線分が網膜に投影されるとき、その左右の投影像の方位にはずれが生じる。この方位視差を手がかりに、われわれは線分の奥行き方向の傾きを知ることができる。4つのサブユニットにおいて、左右のガボールフィルターの方位が同じ角度だけずれることを許容すると、視差エネルギーモデルは方位視差に対する感受性を持つようになり、サルV1野には実際にこのような特性を示す細胞が報告されている。さらに、様々な受容野方位をもつサブニットからの入力を集めるようにモデルを拡張すると、この拡張モデルは、刺激の左右の網膜像の方位自身には依存しない方位視差選択性を示すようになるが、そのような特性を示す細胞は報告されていない<ref name="bridge"><pubmed> 11549739 </pubmed></ref>。
=== 2次特徴の両眼視差  ===


=== 二次特徴の両眼視差  ===
  視覚系が利用可能な両眼視差のうち、最も強力な奥行き手がかりとなるものは輝度のエッジで定義される両眼視差である。しかし、テクスチャーエッジ(例えば、縦縞と横縞の境界)など2次特徴とよばれる視覚特徴で定義された両眼視差からも奥行き知覚は可能である。2次特徴にたいして、輝度エッジは1次特徴と呼ばれている。<br> 視覚野の細胞の多くは、輝度エッジの両眼視差にしか応答しない。しかし、2次特徴の両眼視差に選択性をもつ細胞がネコ18野(細胞構築学的にはV2野とされる)で発見されている。2次特徴の両眼視差は、両眼視差エネルギーモデルの各サブユニットの左右受容野を、線形フィルターではなく、”フィルター&gt;整流&gt;フィルター”というカスケード型の非線形機構で置き換えることで検出できる。<br><ref name="ref16"><pubmed> 16624957 </pubmed></ref>。<br>


 視覚系が利用可能な両眼視差のうち、最も強い奥行き手がかりとなるものは輝度エッジから生じる両眼視差である。しかし、テクスチャーエッジ(例&nbsp;:&nbsp;縦縞模様の領域と横縞模様の領域の境界)など二次特徴とよばれる刺激により生じる両眼視差からも奥行き知覚は可能である。視覚野の細胞の多くは輝度エッジの両眼視差にしか応答しない。しかしながら、ネコ[[18野]](細胞構築学的にはV2野とされる)の一部の細胞は、二次特徴の両眼視差に選択性をもつことが示されている。このような細胞は、輝度のエッジにも同じ両眼視差に最大応答し、特徴手がかりに依存しない両眼視差選択性を示す。2次特徴の両眼視差は、両眼視差エネルギーモデルの各サブユニットの左右受容野を、線形フィルターではなく『フィルター&gt;整流&gt;フィルター』というカスケード型の非線形機構で置き換えることで検出できる<ref name="ref16"><pubmed> 16624957 </pubmed></ref>。
<br>  


== 視差エネルギーモデルと両眼対応点問題  ==
== 視差エネルギーモデルと両眼対応点問題  ==


 両眼視差を正しく検出するためには、左眼の網膜像のどの特徴と右眼の網膜像のどの特徴とが対応するのか(同じ外界刺激の投影像であるのか)を正しく決めることが不可欠である。この課題を両眼対応点問題とよぶ。刺激が視野の中にただ1つしか存在せず、左右の網膜上にはその投影像が1つずつしか存在しない状況では解は自明である。しかし、視野の中に似た刺激が多数存在し、左右の網膜上に似た特徴が多数存在する状況下では、この対応づけは容易ではない。
 ある刺激の両眼視差を正しく検出するためには、その左右の網膜像を正しく対応づけることが不可欠である。この課題を対応点問題とよぶ。刺激が視野の中にただ1つしか存在せず、左右の網膜上にはその投影像が1つずつしか存在しない状況では解は自明である。しかし、視野の中に似た刺激が多数存在し、左右の網膜上に似た特徴が多数存在する状況下では、左右眼の特徴を対応づけるのは容易ではない。組み合わせの総数が膨大なものとなり、正しい組み合わせ(コレクトマッチ)を、正しくない組み合わせ(フォールスマッチ)から選び出すが困難になるためである。<br> 上記の多数の刺激が存在する状況では、フォールスマッチが細胞の受容野内部に入る状況は頻繁に起こる。このとき視差エネルギーモデルはフォールスマッチにも応答することが示されている。しかしながら、われわれの視覚系は、フォールスマッチに基づいて奥行きを知覚することはなく、コレクトマッチに基づく正しい奥行きを知覚している。このためには視差エネルギーモデルが出力するフォールスマッチの信号を遮断し、コレクトマッチの信号を選び出す神経機構が必要となる。 <br> V1野細胞は、視差エネルギーモデルの予測どおりフォールスマッチにも応答する<ref name="ref17"><pubmed> 9212245  </pubmed></ref><ref name="ref18"><pubmed> 9305841  </pubmed></ref><ref name="ref19"><pubmed> 10844045  </pubmed></ref>。一方でサルV4野やIT野など腹側視覚経路の細胞はコレクトマッチには応答するが、フォールスマッチにはあまり応答しない<ref name="ref20"><pubmed> 15371518  </pubmed></ref><ref name="ref21"><pubmed> 12597865  </pubmed></ref>。このことは視差情報がこの経路に沿って処理されるなかで、対応点問題が解決されている可能性を示唆している。対応点問題を解決するための神経機構としては、空間周波数チャネルの収斂に基づく機構や、前述した異なる視差選択性モデル(位置モデル+位相モデル+ハイブリッドモデル)の集団活動に基づく機構などが提案されている。<br>


 上記の多数の刺激が存在する状況では、正しくない組み合わせ(=フォールスマッチ)が細胞の左右の受容野内部に入る状況は頻繁に起こる。このとき視差エネルギーモデルはフォールスマッチにも応答することが示されている。しかしながら、われわれの視覚系は、フォールスマッチに基づいて誤った奥行きを知覚することはなく、正しい組み合わせ(=コレクトマッチ)に基づいて奥行きを知覚している。このためには視差エネルギーモデルが出力するフォールスマッチの信号を遮断し、コレクトマッチの信号を選び出す神経機構が必要となる。 
== 参考文献  ==


 V1野細胞は、視差エネルギーモデルの予測よりは低いものの、フォールスマッチにも強く応答する<ref name="ref17"><pubmed> 9212245  </pubmed></ref><ref name="ref18"><pubmed> 9305841  </pubmed></ref><ref name="ref19"><pubmed> 10844045 </pubmed></ref>。一方でサルV4野や[[IT野]]など腹側視覚経路の細胞はフォールスマッチにはあまり応答しない<ref name="ref20"><pubmed> 15371518  </pubmed></ref><ref name="ref21"><pubmed> 12597865  </pubmed></ref>。このことは視差情報がこの経路に沿って処理されるなかで、対応点問題が解決されていることを示している。対応点問題を解決するための神経機構としては、空間周波数チャネルの収斂に基づく機構や<ref name="ref20"><pubmed> 8759452  </pubmed></ref>、位置モデル、位相モデル、ハイブリッドモデルが出す視差信号全体を利用した機構などが提案されている<ref name="read" />。V4野では周波数チャネルの収斂が実際に起こっていることが示されている<ref name="kumano"><pubmed> 17959744 </pubmed></ref>
  <references />


 V1野複雑型細胞の応答は、基本的には視差エネルギーモデルでよく説明できるが、前述したようにフォールスマッチへの応答が視差エネルギーモデルの予測より減弱する。さらに視差エネルギーモデルの予測より、自然界に実在する両眼視差のパターンにたいしてより大きな応答変動をすることも示されている。このような応答を説明する機構の1つして、複雑型細胞が4つ以上の単純型細胞から興奮および抑制入力を受けるモデルが提案されている<ref name="haefnar"><pubmed> 18184571</pubmed></ref> <ref name="tanabe2011"><pubmed> 21632950</pubmed></ref>。
(執筆者:田中宏喜 担当編集委員:藤田一郎) 


== 参考文献  ==
<br> <br>&nbsp;
 
<references />

2012年7月28日 (土) 03:30時点における版

英:disparity energy model [同] 両眼エネルギーモデル binocular energy model


 奥行きや立体構造を知るための強い手がかりである両眼視差は、網膜からの視覚経路において第一次視覚野(V1野)ではじめて検出される。この両眼視差の検出に特化したV1野細胞の受容野機構を記述したモデルが視差エネルギーモデルである。現在、視差エネルギーモデルは脳における両眼視差検出の標準的理論であり、また高次視覚野における両眼情報処理の神経機構を考える上でも重要な基礎となっている。1990年カリフォルニア大学バークレー校の大澤らによって提案された[1]

両眼視差

図1 両眼視差 両眼視差. A,さまざまな奥行きにある刺激の網膜投影像。B, 左右の網膜を平にして、上下に並べたもの。注視点Fは、網膜で視力の最も高い中心窩(0で表す)に投影される。注視点と同じ奥行きにある刺激(青)の左右の像は、中心窩を基準とした網膜座標上の同じ位置に投影され、その両眼視差はゼロとなる。一方、注視面と異なる奥行き面上にある刺激(赤、緑)は、左右網膜の異なる位置に投影され、ゼロ以外の両眼視差をもつ。手前にある刺激(緑)と、奥にある刺激(赤)の両眼視差の符号は逆になり、前者を交差視差、後者を非交差視差とよんでいる。

 われわれが両眼でものをみるとき、2つの眼が注視している点(図1のF)と同じ奥行きにある刺激(図1の青丸)は、左右の網膜上の同じ位置に投影される(=いずれの網膜においても、網膜の中心である中心窩から同じ方向、量だけ離れた位置に投影される)のにたいし、注視点と異なる奥行きにある刺激(図1の赤や緑の丸)は水平方向にずれた位置に投影される。この網膜像の位置のずれのことを両眼視差という(単に視差ともいう)。両眼視差の量は刺激と注視点の奥行き距離に比例する。また刺激が注視点より手前にある場合と、奥にある場合とで、両眼視差の方向(符号)は逆になり、慣習上、前者にはマイナス、後者にはプラスの符号をつける。手前にある刺激により生じる両眼視差を交差視差 、奥にある刺激により生じる両眼視差を非交差視差とよぶ。


V1野にみられる両眼視差選択性

   網膜からの視覚処理経路において、左右の眼に受容野をもつ両眼性の細胞がV1野にはじめて現れる[2]。うち一部は、刺激の両眼視差がある範囲に入るときには強く応答し、それ以外のときにはあまり応答しない特性、すなわち両眼視差選択性を示す[3]。ゼロ視差やさまざまな大きさの交差視差、非交差視差を最適とする細胞が存在する。初期の研究ではこれらの細胞は6つのタイプに分類されたが[4]、最近の研究結果は、これらは1つの連続体として捉えたほうがよいことを示している [5]
   受容野構造の違いから、V1野の細胞は単純型細胞と複雑型細胞とに大きく分類され、いずれのタイプにも両眼視差選択性細胞は存在する。しかし、後述するように、単純型細胞よりも複雑型細胞のほうが両眼視差を検出するうえで理想的な振る舞いをする。この複雑型細胞の両眼視差選択性を説明する受容野機構のモデルが視差エネルギーモデルである。このモデルで複雑型細胞の応答は、複数の単純型細胞からの入力の和で生成される。以下に単純型細胞の両眼受容野機構を述べ、続いて視差エネルギーモデルを説明する。

単純型細胞の受容野構造と両眼視差選択性

図2 単純型細胞の受容野構造と両眼視差選択性 A. 単純型細胞の両眼受容野構造. 左右の受容野はx-y2次元構造とx-方向の1次元断面図を示している。Sは細胞体、下の四角は半波整流機構を表す。B-D. 単純型細胞の視差選択性。上の四角は、刺激(明るいスポットとする)の左右網膜像を表し、すぐ下の受容野をもつ細胞にとって最適な両眼視差をとる場合の位置関係を表す。B. ゼロ視差を最適とする受容野構造. C. 位置モデルによる非交差視差選択性。D. 位相モデルによる非交差視差選択性。E. Bの細胞と同じ受容野をもつが、左眼刺激を中心より左へずらして固定した場合、細胞はゼロ視差より交差視差により強く応答する


 単純型細胞細胞は、明るい刺激に応答するON領域と暗い刺激に応答するOFF領域が分離した受容野をもつ。受容野の空間構造はガボール関数で近似できる。

 多くの単純型細胞は両眼に受容野をもつ。これら両眼性単純型細胞の応答は、両眼からの入力を左右の受容野で重みづけをして足し合わせたのち、さらに半波整流をしたものとして表すことができる(図2A)。

 単純型細胞が様々な視差に選択性をもつ機構には、大きくわけて2種類のものが考えられる[6][7]。1つは、左右の受容野の形は同じであるが、その位置がずれることにより視差選択性が生じる機構で「位置モデル」と呼ばれている。このとき細胞は、受容野の位置のずれと等しい両眼視差刺激に最も強く応答する。たとえば、図2Bの受容野をもつ細胞はゼロ視差に最も強く応答し、図2Cの受容野をもつ細胞は非交差視差に最も強く応答する。第2の機構は、受容野の(中心)位置は同じであるが、受容野の形(位相)が異なることにより両眼視差選択性が生じる機構で、「位相モデル」とよばれている(図2D)。実際の細胞は、「位置視差タイプ」あるいは「位相モデル」で説明されるもの以外に、左右受容野の位置と位相が両方ずれた「ハイブリッドモデル」で説明されるものもある。このような様々な種類ものもがある意義については、後述する対応点問題を解決するのに有効であることが理論的に示されている。
 単純型細胞の両眼視差による応答の違いは非常にはっきりとしている。しかし、単純型細胞の両眼視差依存性は、刺激の左右投影像の単眼上での位置や、刺激のコントラストにも大きく依存するという問題がある。たとえば、図2Eのように、左右に同じ受容野をもつ細胞にたいして、明るいスポット光の左眼像の位置を受容野の中心よりもやや左に固定して呈示する場合、ゼロ視差ではなく交差視差が最適視差となる。このような問題のため、通常、単純型細胞がV1野の両眼視差検出器として取り扱われることはない。


視差エネルギーモデル

図3 視差エネルギーモデル

  単純型細胞の両眼視差選択性は、視覚刺激の(単眼)位置やコントラストに依存するのにたいし、複雑型細胞の両眼視差選択性はそれらに依存せず一定である。この複雑型細胞の特性を説明するモデルが、視差エネルギーモデルであり、図3のように表される[1][8]。このモデルにおいて、複雑型細胞(Cの記号で表す)は、両眼性単純型細胞をモデル化した4つのサブユニット(S1, S2, S3, S4)が出す信号を線形加算し、外部に出力する。4つのサブユニットのガボールフィルターの位相は、右眼、左眼のそれぞれにおいて90度ずつ異なっている。また各サブニットにおいて、左右ガボールフィルターの両眼間の位相差は同一である(この場合0である)。この両眼位相差を(4つのサブユニットで同一に保ちながら)変化させることで、モデルの両眼視差選択性を変化させることができる。あるいは、両眼位相差を0にしたまま、4つのサブユニットそれぞれにおいて、左右の受容野の位置を一定量ずらすことでも、モデルの両眼視差選択性を変化させうる。前者は単純型細胞の「位相モデル」に対応し、後者は「位置モデル」と対応する。
  刺激の左右の像が、複雑型細胞の最適な両眼視差をもつ場合(図3の場合はゼロ視差)、受容野内部のどの場所に刺激がくる場合でも、4つのサブユニットのいずれかが強く応答する。図3の場合、明るいゼロ視差の刺激が受容野の中心に呈示される場合にはS1が、左部分に呈示される場合にはS2が、右部分に呈示される場合にはS4がそれぞれ強く応答する。また、背景より暗いゼロ視差の刺激が受容野の中心、左部分、右部分に呈示される場合には、S3、S4、S2がそれぞれ強く応答する。このため、複雑型細胞は、受容野内部の刺激の位置やコントラストに影響されずに、同じ両眼視差選択性を示すようになり、両眼視差の検出器としては理想的な振る舞いをする。

  視差エネルギーモデルが行っている計算は、2枚の画像についての局所的な相関計算と類似性がある。2枚の画像の局所相関を計算する場合、2枚の画像を一定量ずらしたとき同じ位置にくる画素値をかけあわせて、その局所平均をとる。視差エネルギーモデルが行っている計算は数学的にはこのような計算と捉えることができる[9]

  視差エネルギーモデルは、最小4つのサブユニットの組み合わせで複雑型細胞の特性を表しうることを述べたものであり、複雑型細胞が必ず4つの単純型細胞の入力により生成されることを提唱しているわけではない。実際には、4つ以上の単純型細胞の入力により複雑型細胞の受容野構造は形成されていると推定されている[10][11]


視差エネルギーモデルの拡張による種々の両眼視差の検出

相対視差

 ここまで述べてきた両眼視差は、中心窩を基準とした座標系における、左右網膜像の位置のずれとして定義されたものであり、絶対視差ともよばれるものである。これにたいし、2つの刺激がもつ絶対視差の差異のことを相対視差とよぶ。われわれは隣接する刺激の奥行きを非常に精度よく弁別できるが、これには眼球の輻輳運動の影響をうけない相対視差が利用されていると考えられている。
 サルV1野の細胞の大部分は絶対視差をコードしているが、V1野から入力を受けるV2野やV4野には、相対視差に選択性応答を示す細胞が一定の割合で存在する[12][13]。この選択性は、理論的には、異なる場所に受容野をもつ視差エネルギーモデルの出力を2段階的に統合することで生じうることが示されている。[12]

2次特徴の両眼視差

  視覚系が利用可能な両眼視差のうち、最も強力な奥行き手がかりとなるものは輝度のエッジで定義される両眼視差である。しかし、テクスチャーエッジ(例えば、縦縞と横縞の境界)など2次特徴とよばれる視覚特徴で定義された両眼視差からも奥行き知覚は可能である。2次特徴にたいして、輝度エッジは1次特徴と呼ばれている。
 視覚野の細胞の多くは、輝度エッジの両眼視差にしか応答しない。しかし、2次特徴の両眼視差に選択性をもつ細胞がネコ18野(細胞構築学的にはV2野とされる)で発見されている。2次特徴の両眼視差は、両眼視差エネルギーモデルの各サブユニットの左右受容野を、線形フィルターではなく、”フィルター>整流>フィルター”というカスケード型の非線形機構で置き換えることで検出できる。
[14]


視差エネルギーモデルと両眼対応点問題

 ある刺激の両眼視差を正しく検出するためには、その左右の網膜像を正しく対応づけることが不可欠である。この課題を対応点問題とよぶ。刺激が視野の中にただ1つしか存在せず、左右の網膜上にはその投影像が1つずつしか存在しない状況では解は自明である。しかし、視野の中に似た刺激が多数存在し、左右の網膜上に似た特徴が多数存在する状況下では、左右眼の特徴を対応づけるのは容易ではない。組み合わせの総数が膨大なものとなり、正しい組み合わせ(コレクトマッチ)を、正しくない組み合わせ(フォールスマッチ)から選び出すが困難になるためである。
 上記の多数の刺激が存在する状況では、フォールスマッチが細胞の受容野内部に入る状況は頻繁に起こる。このとき視差エネルギーモデルはフォールスマッチにも応答することが示されている。しかしながら、われわれの視覚系は、フォールスマッチに基づいて奥行きを知覚することはなく、コレクトマッチに基づく正しい奥行きを知覚している。このためには視差エネルギーモデルが出力するフォールスマッチの信号を遮断し、コレクトマッチの信号を選び出す神経機構が必要となる。 
 V1野細胞は、視差エネルギーモデルの予測どおりフォールスマッチにも応答する[15][16][17]。一方でサルV4野やIT野など腹側視覚経路の細胞はコレクトマッチには応答するが、フォールスマッチにはあまり応答しない[18][19]。このことは視差情報がこの経路に沿って処理されるなかで、対応点問題が解決されている可能性を示唆している。対応点問題を解決するための神経機構としては、空間周波数チャネルの収斂に基づく機構や、前述した異なる視差選択性モデル(位置モデル+位相モデル+ハイブリッドモデル)の集団活動に基づく機構などが提案されている。

参考文献

  1. 1.0 1.1 Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1990).
    Stereoscopic depth discrimination in the visual cortex: neurons ideally suited as disparity detectors. Science (New York, N.Y.), 249(4972), 1037-41. [PubMed:2396096] [WorldCat] [DOI]
  2. HUBEL, D.H., & WIESEL, T.N. (1959).
    Receptive fields of single neurones in the cat's striate cortex. The Journal of physiology, 148, 574-91. [PubMed:14403679] [PMC] [WorldCat] [DOI]
  3. Barlow, H.B., Blakemore, C., & Pettigrew, J.D. (1967).
    The neural mechanism of binocular depth discrimination. The Journal of physiology, 193(2), 327-42. [PubMed:6065881] [PMC] [WorldCat] [DOI]
  4. Poggio, G.F., Gonzalez, F., & Krause, F. (1988).
    Stereoscopic mechanisms in monkey visual cortex: binocular correlation and disparity selectivity. The Journal of neuroscience : the official journal of the Society for Neuroscience, 8(12), 4531-50. [PubMed:3199191] [WorldCat]
  5. Prince, S.J., Pointon, A.D., Cumming, B.G., & Parker, A.J. (2002).
    Quantitative analysis of the responses of V1 neurons to horizontal disparity in dynamic random-dot stereograms. Journal of neurophysiology, 87(1), 191-208. [PubMed:11784742] [WorldCat] [DOI]
  6. DeAngelis, G.C., Ohzawa, I., & Freeman, R.D. (1991).
    Depth is encoded in the visual cortex by a specialized receptive field structure. Nature, 352(6331), 156-9. [PubMed:2067576] [WorldCat] [DOI]
  7. Prince, S.J., Cumming, B.G., & Parker, A.J. (2002).
    Range and mechanism of encoding of horizontal disparity in macaque V1. Journal of neurophysiology, 87(1), 209-21. [PubMed:11784743] [WorldCat] [DOI]
  8. Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1997).
    Encoding of binocular disparity by complex cells in the cat's visual cortex. Journal of neurophysiology, 77(6), 2879-909. [PubMed:9212245] [WorldCat] [DOI]
  9. Resource not found in PubMed.
  10. Umeda, K., Tanabe, S., & Fujita, I. (2007).
    Representation of stereoscopic depth based on relative disparity in macaque area V4. Journal of neurophysiology, 98(1), 241-52. [PubMed:17507498] [WorldCat] [DOI]
  11. Tanaka, H., & Ohzawa, I. (2006).
    Neural basis for stereopsis from second-order contrast cues. The Journal of neuroscience : the official journal of the Society for Neuroscience, 26(16), 4370-82. [PubMed:16624957] [PMC] [WorldCat] [DOI]
  12. Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1997).
    Encoding of binocular disparity by complex cells in the cat's visual cortex. Journal of neurophysiology, 77(6), 2879-909. [PubMed:9212245] [WorldCat] [DOI]
  13. Cumming, B.G., & Parker, A.J. (1997).
    Responses of primary visual cortical neurons to binocular disparity without depth perception. Nature, 389(6648), 280-3. [PubMed:9305841] [WorldCat] [DOI]
  14. Cumming, B.G., & Parker, A.J. (2000).
    Local disparity not perceived depth is signaled by binocular neurons in cortical area V1 of the Macaque. The Journal of neuroscience : the official journal of the Society for Neuroscience, 20(12), 4758-67. [PubMed:10844045] [PMC] [WorldCat]
  15. Tanabe, S., Umeda, K., & Fujita, I. (2004).
    Rejection of false matches for binocular correspondence in macaque visual cortical area V4. The Journal of neuroscience : the official journal of the Society for Neuroscience, 24(37), 8170-80. [PubMed:15371518] [PMC] [WorldCat] [DOI]
  16. Janssen, P., Vogels, R., Liu, Y., & Orban, G.A. (2003).
    At least at the level of inferior temporal cortex, the stereo correspondence problem is solved. Neuron, 37(4), 693-701. [PubMed:12597865] [WorldCat] [DOI]

(執筆者:田中宏喜 担当編集委員:藤田一郎)