視差エネルギーモデル

提供:脳科学辞典
2012年7月28日 (土) 01:12時点におけるHirokitanaka (トーク | 投稿記録)による版

ナビゲーションに移動 検索に移動

英:disparity energy model [同] 両眼エネルギーモデル binocular energy model


 奥行きや立体構造を知るための強い手がかりである両眼視差は、網膜からの視覚経路において第一次視覚野(V1野)ではじめて検出される。この両眼視差の検出に特化したV1野細胞の受容野機構を記述したモデルが視差エネルギーモデルである。現在、視差エネルギーモデルは脳における両眼視差検出の標準的理論であり、また高次視覚野における両眼情報処理の神経機構を考える上でも重要な基礎となっている。1990年カリフォルニア大学バークレー校の大澤らによって提案された[1]

両眼視差

図1 両眼視差 両眼視差. A,さまざまな奥行きにある刺激の網膜投影像。B, 左右の網膜を平にして、上下に並べたもの。注視点Fは、網膜で視力の最も高い中心窩(0で表す)に投影される。注視点と同じ奥行きにある刺激(青)の左右の像は、中心窩を基準とした網膜座標上の同じ位置に投影され、その両眼視差はゼロとなる。一方、注視面と異なる奥行き面上にある刺激(赤、緑)は、左右網膜の異なる位置に投影され、ゼロ以外の両眼視差をもつ。手前にある刺激(緑)と、奥にある刺激(赤)の両眼視差の符号は逆になり、前者を交差視差、後者を非交差視差とよんでいる。

 われわれが両眼でものをみるとき、2つの眼が注視している点(図1のF)と同じ奥行きにある刺激(図1の青丸)は、左右の網膜上の同じ位置に投影される(=いずれの網膜においても、網膜の中心である中心窩から同じ方向、量だけ離れた位置に投影される)のにたいし、注視点と異なる奥行きにある刺激(図1の赤や緑の丸)は水平方向にずれた位置に投影される。この網膜像の位置のずれのことを両眼視差という(単に視差ともいう)。両眼視差の量は刺激と注視点の奥行き距離に比例する。また刺激が注視点より手前にある場合と、奥にある場合とで、両眼視差の方向(符号)は逆になり、慣習上、前者にはマイナス、後者にはプラスの符号をつける。手前にある刺激により生じる両眼視差を交差視差 、奥にある刺激により生じる両眼視差を非交差視差とよぶ。


V1野にみられる両眼視差選択性

   網膜からの視覚処理経路において、左右の眼に受容野をもつ両眼性の細胞がV1野にはじめて現れる[2]。うち一部は、刺激の両眼視差がある範囲に入るときには強く応答し、それ以外のときにはあまり応答しない特性、すなわち両眼視差選択性を示す[3]。ゼロ視差やさまざまな大きさの交差視差、非交差視差を最適とする細胞が存在する。初期の研究ではこれらの細胞は6つのタイプに分類されたが[4]、最近の研究結果は、これらは1つの連続体として捉えたほうがよいことを示している [5]
   受容野構造の違いから、V1野の細胞は単純型細胞と複雑型細胞とに大きく分類され、いずれのタイプにも両眼視差選択性細胞は存在する。しかし、後述するように、単純型細胞よりも複雑型細胞のほうが両眼視差を検出するうえで理想的な振る舞いをする。この複雑型細胞の両眼視差選択性を説明する受容野機構のモデルが視差エネルギーモデルである。このモデルで複雑型細胞の応答は、複数の単純型細胞からの入力の和で生成される。以下に単純型細胞の両眼受容野機構を述べ、続いて視差エネルギーモデルを説明する。

単純型細胞の受容野構造と両眼視差選択性

図2 単純型細胞の受容野構造と両眼視差選択性 A. 単純型細胞の両眼受容野構造. 左右の受容野はx-y2次元構造とx-方向の1次元断面図を示している。Sは細胞体、下の四角は半波整流機構を表す。B-D. 単純型細胞の視差選択性。上の四角は、刺激(明るいスポットとする)の左右網膜像を表し、すぐ下の受容野をもつ細胞にとって最適な両眼視差をとる場合の位置関係を表す。B. ゼロ視差を最適とする受容野構造. C. 位置モデルによる非交差視差選択性。D. 位相モデルによる非交差視差選択性。E. Bの細胞と同じ受容野をもつが、左眼刺激を中心より左へずらして固定した場合、細胞はゼロ視差より交差視差により強く応答する


 単純型細胞細胞は、明るい刺激に応答するON領域と暗い刺激に応答するOFF領域が分離した受容野をもつ。受容野の空間構造はガボール関数で近似できる。

 多くの単純型細胞は両眼に受容野をもつ。これら両眼性単純型細胞の応答は、両眼からの入力を左右の受容野で重みづけをして足し合わせたのち、さらに半波整流をしたものとして表すことができる(図2A)。

 単純型細胞が様々な視差に選択性をもつ機構には、大きくわけて2種類のものが考えられる。1つは、左右の受容野の形は同じであるが、その位置がずれることにより視差選択性が生じる機構で「位置モデル」と呼ばれている。このとき細胞は、受容野の位置のずれと等しい両眼視差刺激に最も強く応答する。たとえば、図2Bの受容野をもつ細胞はゼロ視差に最も強く応答し、図2Cの受容野をもつ細胞は非交差視差に最も強く応答する。第2の機構は、受容野の(中心)位置は同じであるが、受容野の形(位相)が異なることにより両眼視差選択性が生じる機構で、「位相モデル」とよばれている(図2D)。実際の細胞は、「位置視差タイプ」あるいは「位相モデル」で説明されるもの以外に、左右受容野の位置と位相が両方ずれた「ハイブリッドモデル」で説明されるものもある。このような様々な種類ものもがある意義については後述する[6][7]
 単純型細胞の多くは両眼視差に依存した応答を示す。ただし、単純型細胞の両眼視差依存性は、刺激の左右投影像の単眼上での位置や、刺激のコントラストにも大きく依存するという問題がある。たとえば、図2Eのように、左右に同じ受容野をもつ細胞にたいして、明るいスポット光の左眼像の位置を受容野の中心よりもやや左に固定して呈示する場合、ゼロ視差ではなく交差視差が最適視差となる。このような問題のため、通常、単純型細胞がV1野の両眼視差検出器として取り扱われることはない。


視差エネルギーモデル

図3 視差エネルギーモデル

  単純型細胞の両眼視差選択性は、視覚刺激の(単眼)位置やコントラストに依存するのにたいし、複雑型細胞の両眼視差選択性はそれらに依存せず一定である。このような複雑型細胞の両眼視差選択性を作り出す受容野内部機構として提唱されたモデルが、視差エネルギーモデルであり、図3のように表される[1][8]。このモデルにおいて、複雑型細胞(Cの記号で表す)は、両眼性単純型細胞をモデル化した4つのサブブユニット(S1, S2, S3, S4)が出す信号を線形加算し、外部に出力する。4つのサブユニットのガボールフィルターの位相は、右眼、左眼のそれぞれにおいて90度ずつ異なっている。また各サブニットにおいて、左右ガボールフィルターの両眼間の位相差は同一である。この両眼位相差を(4つのサブユニットで同一に保ちながら)変化させることで、モデルの両眼視差選択性を変化させることができる。
  刺激の左右の像が、複雑型細胞の最適な両眼視差をもつ場合(図3の場合はゼロ視差)、受容野内部のどの場所に刺激がくる場合でも、4つのサブユニットのいずれかが強く応答する。図3の場合、明るい刺激が受容野内部の中心付近に呈示される場合にはS1が、左部分に呈示される場合にはS2が、右部分に呈示される場合にはS4がそれぞれゼロ視差に強く応答する。また、背景より暗い刺激が受容野の中心付近、右部分、左部分に呈示される場合には、S4、S3、S2がそれぞれゼロ視差に強く応答する。このため、複雑型細胞は、受容野内部の刺激の位置やコントラストに影響されずに、同じ両眼視差選択性を示すようになり、両眼視差の検出器としては理想的な振る舞いをする。

  視差エネルギーモデルが行っている計算は、2枚の画像についての局所的な相関計算と類似性がある。2枚の画像について局所的な相関を計算するとき、画像を一定量ずらしたときに同じ位置くる画素の値をかけあわせ、その値の局所平均を計算する。視差エネルギーモデルが行っている計算は数学的にはこのような計算と捉えることができる[9]

  視差エネルギーモデルは、最小で4つのサブユニットの組み合わせで複雑型細胞の特性を表しうることを述べたものであり、複雑型細胞が4つの単純型細胞の入力により生成されることを提唱しているわけではない。実際には、4つ以上の単純型細胞の入力により複雑型細胞の受容野構造は形成されていると推定されている[10][11]


視差エネルギーモデルの拡張による種々の両眼視差の検出機構

相対視差

 ここまで述べてきた両眼視差は、注視点を基準とした座標系での左右像の位置のずれとして定義されたものであり、絶対視差(absolute disparity)ともよばれるものである。これにたいし、2つの刺激がもつ絶対視差の差異のことを相対視差とよぶ。視覚系は、隣接する対象の視差を非常に精度よく弁別できるが、これには、輻輳運動の影響をうけない相対視差が利用されていると考えられている。
 サルV1野の細胞の大部分は絶対視差をコードしているが、V1野から入力を受けるV2野やV4野には、相対視差に選択性応答を示す細胞が一定の割合で存在することが示されている[12][13]。この選択性は視差エネルギーモデルを拡張した次のようなモデルで説明されることが示された。第一段階では、異なる位置に受容野をもち、同じ絶対視差に選択性をもつ視差エネルギーモデルの出力が加算し2乗される。このような信号がさまざまな絶対視差に選択性をもつ視差エネルギーモデルから集められると、統合された信号は相対視差に選択性を示す[12]

2次特徴の両眼視差

視覚系が利用可能な両眼視差のうち、最も強力なものは輝度エッジで定義される両眼視差である。しかし、テクスチャーエッジ(例えば、縦縞と横縞の境界)などの2次特徴とよばれる視覚特徴で定義される両眼視差からも奥行き知覚は可能である。このような2次特徴の両眼視差に選択性をもつ細胞がネコの初期視覚野に存在している。2次特徴の両眼視差は、両眼視差エネルギーモデルの各サブユニットの左右受容野を、通常の線形フィルターではなく、『フィルター -> 整流 -> フィルター』というカスケード型フィルターで置き換えることで検出できる[14]


視差エネルギーモデルと両眼対応点問題

 左右の網膜像をもとに刺激の両眼視差を正しく検出するためには、対となるものを正しく対応づけることが不可欠であり、この課題を対応点問題という。正しく対応づけられたペアをコレクトマッチ、誤って対応づけられたペアをフォールスマッチと呼ぶ。多数のドットが密に並ぶ状況では、フォールスマッチが細胞の受容野内部に入る状況は頻繁に起こり、視差エネルギーモデルはフォールスマッチにも応答する。しかしながら、われわれの視覚系はコレクトマッチのみに基づいて正しく奥行きを知覚できる。したがって、視差エネルギーモデルが応答するフォールスマッチには応答せず、コレクトマッチにのみ応じる機構が必要となってくる。 
  V1野細胞は、視差エネルギーモデルの予測どおりフォールスマッチにも応答する[15][16][17]。一方でサルV4野やIT野などの腹側視覚経路の細胞はフォールスマッチに対応する応答が大きく減弱することが示された[18][19]。このことは視差情報がこの経路に沿って処理されるなかで、対応点問題が解決されている可能性を示唆している。

参考文献

  1. 1.0 1.1 Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1990).
    Stereoscopic depth discrimination in the visual cortex: neurons ideally suited as disparity detectors. Science (New York, N.Y.), 249(4972), 1037-41. [PubMed:2396096] [WorldCat] [DOI]
  2. HUBEL, D.H., & WIESEL, T.N. (1959).
    Receptive fields of single neurones in the cat's striate cortex. The Journal of physiology, 148, 574-91. [PubMed:14403679] [PMC] [WorldCat] [DOI]
  3. Barlow, H.B., Blakemore, C., & Pettigrew, J.D. (1967).
    The neural mechanism of binocular depth discrimination. The Journal of physiology, 193(2), 327-42. [PubMed:6065881] [PMC] [WorldCat] [DOI]
  4. Poggio, G.F., Gonzalez, F., & Krause, F. (1988).
    Stereoscopic mechanisms in monkey visual cortex: binocular correlation and disparity selectivity. The Journal of neuroscience : the official journal of the Society for Neuroscience, 8(12), 4531-50. [PubMed:3199191] [WorldCat]
  5. Prince, S.J., Pointon, A.D., Cumming, B.G., & Parker, A.J. (2002).
    Quantitative analysis of the responses of V1 neurons to horizontal disparity in dynamic random-dot stereograms. Journal of neurophysiology, 87(1), 191-208. [PubMed:11784742] [WorldCat] [DOI]
  6. DeAngelis, G.C., Ohzawa, I., & Freeman, R.D. (1991).
    Depth is encoded in the visual cortex by a specialized receptive field structure. Nature, 352(6331), 156-9. [PubMed:2067576] [WorldCat] [DOI]
  7. Prince, S.J., Cumming, B.G., & Parker, A.J. (2002).
    Range and mechanism of encoding of horizontal disparity in macaque V1. Journal of neurophysiology, 87(1), 209-21. [PubMed:11784743] [WorldCat] [DOI]
  8. Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1997).
    Encoding of binocular disparity by complex cells in the cat's visual cortex. Journal of neurophysiology, 77(6), 2879-909. [PubMed:9212245] [WorldCat] [DOI]
  9. Resource not found in PubMed.
  10. Umeda, K., Tanabe, S., & Fujita, I. (2007).
    Representation of stereoscopic depth based on relative disparity in macaque area V4. Journal of neurophysiology, 98(1), 241-52. [PubMed:17507498] [WorldCat] [DOI]
  11. Tanaka, H., & Ohzawa, I. (2006).
    Neural basis for stereopsis from second-order contrast cues. The Journal of neuroscience : the official journal of the Society for Neuroscience, 26(16), 4370-82. [PubMed:16624957] [PMC] [WorldCat] [DOI]
  12. Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1997).
    Encoding of binocular disparity by complex cells in the cat's visual cortex. Journal of neurophysiology, 77(6), 2879-909. [PubMed:9212245] [WorldCat] [DOI]
  13. Cumming, B.G., & Parker, A.J. (1997).
    Responses of primary visual cortical neurons to binocular disparity without depth perception. Nature, 389(6648), 280-3. [PubMed:9305841] [WorldCat] [DOI]
  14. Cumming, B.G., & Parker, A.J. (2000).
    Local disparity not perceived depth is signaled by binocular neurons in cortical area V1 of the Macaque. The Journal of neuroscience : the official journal of the Society for Neuroscience, 20(12), 4758-67. [PubMed:10844045] [PMC] [WorldCat]
  15. Tanabe, S., Umeda, K., & Fujita, I. (2004).
    Rejection of false matches for binocular correspondence in macaque visual cortical area V4. The Journal of neuroscience : the official journal of the Society for Neuroscience, 24(37), 8170-80. [PubMed:15371518] [PMC] [WorldCat] [DOI]
  16. Janssen, P., Vogels, R., Liu, Y., & Orban, G.A. (2003).
    At least at the level of inferior temporal cortex, the stereo correspondence problem is solved. Neuron, 37(4), 693-701. [PubMed:12597865] [WorldCat] [DOI]

(執筆者:田中宏喜 担当編集委員:藤田一郎)