視差エネルギーモデル

2012年7月28日 (土) 03:30時点におけるHirokitanaka (トーク | 投稿記録)による版

英:disparity energy model [同] 両眼エネルギーモデル binocular energy model


 奥行きや立体構造を知るための強い手がかりである両眼視差は、網膜からの視覚経路において第一次視覚野(V1野)ではじめて検出される。この両眼視差の検出に特化したV1野細胞の受容野機構を記述したモデルが視差エネルギーモデルである。現在、視差エネルギーモデルは脳における両眼視差検出の標準的理論であり、また高次視覚野における両眼情報処理の神経機構を考える上でも重要な基礎となっている。1990年カリフォルニア大学バークレー校の大澤らによって提案された[1]

両眼視差

 
図1 両眼視差 両眼視差. A,さまざまな奥行きにある刺激の網膜投影像。B, 左右の網膜を平にして、上下に並べたもの。注視点Fは、網膜で視力の最も高い中心窩(0で表す)に投影される。注視点と同じ奥行きにある刺激(青)の左右の像は、中心窩を基準とした網膜座標上の同じ位置に投影され、その両眼視差はゼロとなる。一方、注視面と異なる奥行き面上にある刺激(赤、緑)は、左右網膜の異なる位置に投影され、ゼロ以外の両眼視差をもつ。手前にある刺激(緑)と、奥にある刺激(赤)の両眼視差の符号は逆になり、前者を交差視差、後者を非交差視差とよんでいる。

 われわれが両眼でものをみるとき、2つの眼が注視している点(図1のF)と同じ奥行きにある刺激(図1の青丸)は、左右の網膜上の同じ位置に投影される(=いずれの網膜においても、網膜の中心である中心窩から同じ方向、量だけ離れた位置に投影される)のにたいし、注視点と異なる奥行きにある刺激(図1の赤や緑の丸)は水平方向にずれた位置に投影される。この網膜像の位置のずれのことを両眼視差という(単に視差ともいう)。両眼視差の量は刺激と注視点の奥行き距離に比例する。また刺激が注視点より手前にある場合と、奥にある場合とで、両眼視差の方向(符号)は逆になり、慣習上、前者にはマイナス、後者にはプラスの符号をつける。手前にある刺激により生じる両眼視差を交差視差 、奥にある刺激により生じる両眼視差を非交差視差とよぶ。


V1野にみられる両眼視差選択性

   網膜からの視覚処理経路において、左右の眼に受容野をもつ両眼性の細胞がV1野にはじめて現れる[2]。うち一部は、刺激の両眼視差がある範囲に入るときには強く応答し、それ以外のときにはあまり応答しない特性、すなわち両眼視差選択性を示す[3]。ゼロ視差やさまざまな大きさの交差視差、非交差視差を最適とする細胞が存在する。初期の研究ではこれらの細胞は6つのタイプに分類されたが[4]、最近の研究結果は、これらは1つの連続体として捉えたほうがよいことを示している [5]
   受容野構造の違いから、V1野の細胞は単純型細胞と複雑型細胞とに大きく分類され、いずれのタイプにも両眼視差選択性細胞は存在する。しかし、後述するように、単純型細胞よりも複雑型細胞のほうが両眼視差を検出するうえで理想的な振る舞いをする。この複雑型細胞の両眼視差選択性を説明する受容野機構のモデルが視差エネルギーモデルである。このモデルで複雑型細胞の応答は、複数の単純型細胞からの入力の和で生成される。以下に単純型細胞の両眼受容野機構を述べ、続いて視差エネルギーモデルを説明する。

単純型細胞の受容野構造と両眼視差選択性

 
図2 単純型細胞の受容野構造と両眼視差選択性 A. 単純型細胞の両眼受容野構造. 左右の受容野はx-y2次元構造とx-方向の1次元断面図を示している。Sは細胞体、下の四角は半波整流機構を表す。B-D. 単純型細胞の視差選択性。上の四角は、刺激(明るいスポットとする)の左右網膜像を表し、すぐ下の受容野をもつ細胞にとって最適な両眼視差をとる場合の位置関係を表す。B. ゼロ視差を最適とする受容野構造. C. 位置モデルによる非交差視差選択性。D. 位相モデルによる非交差視差選択性。E. Bの細胞と同じ受容野をもつが、左眼刺激を中心より左へずらして固定した場合、細胞はゼロ視差より交差視差により強く応答する


 単純型細胞細胞は、明るい刺激に応答するON領域と暗い刺激に応答するOFF領域が分離した受容野をもつ。受容野の空間構造はガボール関数で近似できる。

 多くの単純型細胞は両眼に受容野をもつ。これら両眼性単純型細胞の応答は、両眼からの入力を左右の受容野で重みづけをして足し合わせたのち、さらに半波整流をしたものとして表すことができる(図2A)。

 単純型細胞が様々な視差に選択性をもつ機構には、大きくわけて2種類のものが考えられる[6][7]。1つは、左右の受容野の形は同じであるが、その位置がずれることにより視差選択性が生じる機構で「位置モデル」と呼ばれている。このとき細胞は、受容野の位置のずれと等しい両眼視差刺激に最も強く応答する。たとえば、図2Bの受容野をもつ細胞はゼロ視差に最も強く応答し、図2Cの受容野をもつ細胞は非交差視差に最も強く応答する。第2の機構は、受容野の(中心)位置は同じであるが、受容野の形(位相)が異なることにより両眼視差選択性が生じる機構で、「位相モデル」とよばれている(図2D)。実際の細胞は、「位置視差タイプ」あるいは「位相モデル」で説明されるもの以外に、左右受容野の位置と位相が両方ずれた「ハイブリッドモデル」で説明されるものもある。このような様々な種類ものもがある意義については、後述する対応点問題を解決するのに有効であることが理論的に示されている。
 単純型細胞の両眼視差による応答の違いは非常にはっきりとしている。しかし、単純型細胞の両眼視差依存性は、刺激の左右投影像の単眼上での位置や、刺激のコントラストにも大きく依存するという問題がある。たとえば、図2Eのように、左右に同じ受容野をもつ細胞にたいして、明るいスポット光の左眼像の位置を受容野の中心よりもやや左に固定して呈示する場合、ゼロ視差ではなく交差視差が最適視差となる。このような問題のため、通常、単純型細胞がV1野の両眼視差検出器として取り扱われることはない。


視差エネルギーモデル

 
図3 視差エネルギーモデル

  単純型細胞の両眼視差選択性は、視覚刺激の(単眼)位置やコントラストに依存するのにたいし、複雑型細胞の両眼視差選択性はそれらに依存せず一定である。この複雑型細胞の特性を説明するモデルが、視差エネルギーモデルであり、図3のように表される[1][8]。このモデルにおいて、複雑型細胞(Cの記号で表す)は、両眼性単純型細胞をモデル化した4つのサブユニット(S1, S2, S3, S4)が出す信号を線形加算し、外部に出力する。4つのサブユニットのガボールフィルターの位相は、右眼、左眼のそれぞれにおいて90度ずつ異なっている。また各サブニットにおいて、左右ガボールフィルターの両眼間の位相差は同一である(この場合0である)。この両眼位相差を(4つのサブユニットで同一に保ちながら)変化させることで、モデルの両眼視差選択性を変化させることができる。あるいは、両眼位相差を0にしたまま、4つのサブユニットそれぞれにおいて、左右の受容野の位置を一定量ずらすことでも、モデルの両眼視差選択性を変化させうる。前者は単純型細胞の「位相モデル」に対応し、後者は「位置モデル」と対応する。
  刺激の左右の像が、複雑型細胞の最適な両眼視差をもつ場合(図3の場合はゼロ視差)、受容野内部のどの場所に刺激がくる場合でも、4つのサブユニットのいずれかが強く応答する。図3の場合、明るいゼロ視差の刺激が受容野の中心に呈示される場合にはS1が、左部分に呈示される場合にはS2が、右部分に呈示される場合にはS4がそれぞれ強く応答する。また、背景より暗いゼロ視差の刺激が受容野の中心、左部分、右部分に呈示される場合には、S3、S4、S2がそれぞれ強く応答する。このため、複雑型細胞は、受容野内部の刺激の位置やコントラストに影響されずに、同じ両眼視差選択性を示すようになり、両眼視差の検出器としては理想的な振る舞いをする。

  視差エネルギーモデルが行っている計算は、2枚の画像についての局所的な相関計算と類似性がある。2枚の画像の局所相関を計算する場合、2枚の画像を一定量ずらしたとき同じ位置にくる画素値をかけあわせて、その局所平均をとる。視差エネルギーモデルが行っている計算は数学的にはこのような計算と捉えることができる[9]

  視差エネルギーモデルは、最小4つのサブユニットの組み合わせで複雑型細胞の特性を表しうることを述べたものであり、複雑型細胞が必ず4つの単純型細胞の入力により生成されることを提唱しているわけではない。実際には、4つ以上の単純型細胞の入力により複雑型細胞の受容野構造は形成されていると推定されている[10][11]


視差エネルギーモデルの拡張による種々の両眼視差の検出

相対視差

 ここまで述べてきた両眼視差は、中心窩を基準とした座標系における、左右網膜像の位置のずれとして定義されたものであり、絶対視差ともよばれるものである。これにたいし、2つの刺激がもつ絶対視差の差異のことを相対視差とよぶ。われわれは隣接する刺激の奥行きを非常に精度よく弁別できるが、これには眼球の輻輳運動の影響をうけない相対視差が利用されていると考えられている。
 サルV1野の細胞の大部分は絶対視差をコードしているが、V1野から入力を受けるV2野やV4野には、相対視差に選択性応答を示す細胞が一定の割合で存在する[12][13]。この選択性は、理論的には、異なる場所に受容野をもつ視差エネルギーモデルの出力を2段階的に統合することで生じうることが示されている。[12]

2次特徴の両眼視差

  視覚系が利用可能な両眼視差のうち、最も強力な奥行き手がかりとなるものは輝度のエッジで定義される両眼視差である。しかし、テクスチャーエッジ(例えば、縦縞と横縞の境界)など2次特徴とよばれる視覚特徴で定義された両眼視差からも奥行き知覚は可能である。2次特徴にたいして、輝度エッジは1次特徴と呼ばれている。
 視覚野の細胞の多くは、輝度エッジの両眼視差にしか応答しない。しかし、2次特徴の両眼視差に選択性をもつ細胞がネコ18野(細胞構築学的にはV2野とされる)で発見されている。2次特徴の両眼視差は、両眼視差エネルギーモデルの各サブユニットの左右受容野を、線形フィルターではなく、”フィルター>整流>フィルター”というカスケード型の非線形機構で置き換えることで検出できる。
[14]


視差エネルギーモデルと両眼対応点問題

 ある刺激の両眼視差を正しく検出するためには、その左右の網膜像を正しく対応づけることが不可欠である。この課題を対応点問題とよぶ。刺激が視野の中にただ1つしか存在せず、左右の網膜上にはその投影像が1つずつしか存在しない状況では解は自明である。しかし、視野の中に似た刺激が多数存在し、左右の網膜上に似た特徴が多数存在する状況下では、左右眼の特徴を対応づけるのは容易ではない。組み合わせの総数が膨大なものとなり、正しい組み合わせ(コレクトマッチ)を、正しくない組み合わせ(フォールスマッチ)から選び出すが困難になるためである。
 上記の多数の刺激が存在する状況では、フォールスマッチが細胞の受容野内部に入る状況は頻繁に起こる。このとき視差エネルギーモデルはフォールスマッチにも応答することが示されている。しかしながら、われわれの視覚系は、フォールスマッチに基づいて奥行きを知覚することはなく、コレクトマッチに基づく正しい奥行きを知覚している。このためには視差エネルギーモデルが出力するフォールスマッチの信号を遮断し、コレクトマッチの信号を選び出す神経機構が必要となる。 
 V1野細胞は、視差エネルギーモデルの予測どおりフォールスマッチにも応答する[15][16][17]。一方でサルV4野やIT野など腹側視覚経路の細胞はコレクトマッチには応答するが、フォールスマッチにはあまり応答しない[18][19]。このことは視差情報がこの経路に沿って処理されるなかで、対応点問題が解決されている可能性を示唆している。対応点問題を解決するための神経機構としては、空間周波数チャネルの収斂に基づく機構や、前述した異なる視差選択性モデル(位置モデル+位相モデル+ハイブリッドモデル)の集団活動に基づく機構などが提案されている。

参考文献

  1. 1.0 1.1 Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1990).
    Stereoscopic depth discrimination in the visual cortex: neurons ideally suited as disparity detectors. Science (New York, N.Y.), 249(4972), 1037-41. [PubMed:2396096] [WorldCat] [DOI]
  2. HUBEL, D.H., & WIESEL, T.N. (1959).
    Receptive fields of single neurones in the cat's striate cortex. The Journal of physiology, 148, 574-91. [PubMed:14403679] [PMC] [WorldCat] [DOI]
  3. Barlow, H.B., Blakemore, C., & Pettigrew, J.D. (1967).
    The neural mechanism of binocular depth discrimination. The Journal of physiology, 193(2), 327-42. [PubMed:6065881] [PMC] [WorldCat] [DOI]
  4. Poggio, G.F., Gonzalez, F., & Krause, F. (1988).
    Stereoscopic mechanisms in monkey visual cortex: binocular correlation and disparity selectivity. The Journal of neuroscience : the official journal of the Society for Neuroscience, 8(12), 4531-50. [PubMed:3199191] [WorldCat]
  5. Prince, S.J., Pointon, A.D., Cumming, B.G., & Parker, A.J. (2002).
    Quantitative analysis of the responses of V1 neurons to horizontal disparity in dynamic random-dot stereograms. Journal of neurophysiology, 87(1), 191-208. [PubMed:11784742] [WorldCat] [DOI]
  6. DeAngelis, G.C., Ohzawa, I., & Freeman, R.D. (1991).
    Depth is encoded in the visual cortex by a specialized receptive field structure. Nature, 352(6331), 156-9. [PubMed:2067576] [WorldCat] [DOI]
  7. Prince, S.J., Cumming, B.G., & Parker, A.J. (2002).
    Range and mechanism of encoding of horizontal disparity in macaque V1. Journal of neurophysiology, 87(1), 209-21. [PubMed:11784743] [WorldCat] [DOI]
  8. Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1997).
    Encoding of binocular disparity by complex cells in the cat's visual cortex. Journal of neurophysiology, 77(6), 2879-909. [PubMed:9212245] [WorldCat] [DOI]
  9. Resource not found in PubMed.
  10. Umeda, K., Tanabe, S., & Fujita, I. (2007).
    Representation of stereoscopic depth based on relative disparity in macaque area V4. Journal of neurophysiology, 98(1), 241-52. [PubMed:17507498] [WorldCat] [DOI]
  11. Tanaka, H., & Ohzawa, I. (2006).
    Neural basis for stereopsis from second-order contrast cues. The Journal of neuroscience : the official journal of the Society for Neuroscience, 26(16), 4370-82. [PubMed:16624957] [PMC] [WorldCat] [DOI]
  12. Ohzawa, I., DeAngelis, G.C., & Freeman, R.D. (1997).
    Encoding of binocular disparity by complex cells in the cat's visual cortex. Journal of neurophysiology, 77(6), 2879-909. [PubMed:9212245] [WorldCat] [DOI]
  13. Cumming, B.G., & Parker, A.J. (1997).
    Responses of primary visual cortical neurons to binocular disparity without depth perception. Nature, 389(6648), 280-3. [PubMed:9305841] [WorldCat] [DOI]
  14. Cumming, B.G., & Parker, A.J. (2000).
    Local disparity not perceived depth is signaled by binocular neurons in cortical area V1 of the Macaque. The Journal of neuroscience : the official journal of the Society for Neuroscience, 20(12), 4758-67. [PubMed:10844045] [PMC] [WorldCat]
  15. Tanabe, S., Umeda, K., & Fujita, I. (2004).
    Rejection of false matches for binocular correspondence in macaque visual cortical area V4. The Journal of neuroscience : the official journal of the Society for Neuroscience, 24(37), 8170-80. [PubMed:15371518] [PMC] [WorldCat] [DOI]
  16. Janssen, P., Vogels, R., Liu, Y., & Orban, G.A. (2003).
    At least at the level of inferior temporal cortex, the stereo correspondence problem is solved. Neuron, 37(4), 693-701. [PubMed:12597865] [WorldCat] [DOI]

(執筆者:田中宏喜 担当編集委員:藤田一郎)