「視覚前野」の版間の差分

編集の要約なし
編集の要約なし
編集の要約なし
80行目: 80行目:
 運動からの構造の知覚(structure from motion)<ref><pubmed>9565031</pubmed></ref> 垂直に立てた透明な円筒を回転させた時に生じる円筒表面のドットパターンの各点が示す左右の動きを平面なスクリーンに呈示すると、回転する立体の円筒が知覚される。この時、両眼視差の情報がないので円筒の前面の点が左右どちら方向に動くかは画像からは分からず、知覚される見かけの回転方向は不定期に変化する。知覚される円筒の回転方向の変化に合わせて反応強度が変化するニューロンがV5/MTで見つかった。
 運動からの構造の知覚(structure from motion)<ref><pubmed>9565031</pubmed></ref> 垂直に立てた透明な円筒を回転させた時に生じる円筒表面のドットパターンの各点が示す左右の動きを平面なスクリーンに呈示すると、回転する立体の円筒が知覚される。この時、両眼視差の情報がないので円筒の前面の点が左右どちら方向に動くかは画像からは分からず、知覚される見かけの回転方向は不定期に変化する。知覚される円筒の回転方向の変化に合わせて反応強度が変化するニューロンがV5/MTで見つかった。


 ドットパターンの運動方向や奥行きの知覚<ref name=ref11 /><ref  name=ref12 / ><ref name=ref13 /> 各点がランダムに動くドットパターンの中で一定の割合の点が同じ方向に運動する時、その割合(コヒーレンス)が高い程、それらの点が示す運動方向が知覚されやすくなる。コヒーレンスが高いほど運動方向を識別する課題の正答率が高くなることから、正答率により運動の見えを評価できる。記録中のV5/MTニューロンの最適な運動方向あるいはその反対方向へ動く点を含むドット刺激を用い、サルに強制選択課題で2方向から選択させたところ、①コヒーレンスの度合いによりニューロンの反応強度が変化した、②ニューロンの反応強度から運動方向の見えを確率的に推測できた、③V5/MTを局所的に破壊、麻痺、電気刺激してサルの正答率を操作できた、④曖昧な刺激(コヒーレンスなし)に対する知覚判断の試行ごとの変動がニューロンの反応の変動と相関していた(choice-probability)、⑤これらの対応や変調が知覚判断の表示法(視線の移動、手によるレバー押し)によらなかった。これらの結果から、比較的少数のV5/MTニューロンの活動が運動方向の知覚判断を左右することが示された。
 ドットパターンの運動方向や奥行きの知覚<ref name=ref11 /><ref  name=ref12 /><ref name=ref13 /> 各点がランダムに動くドットパターンの中で一定の割合の点が同じ方向に運動する時、その割合(コヒーレンス)が高い程、それらの点が示す運動方向が知覚されやすくなる。コヒーレンスが高いほど運動方向を識別する課題の正答率が高くなることから、正答率により運動の見えを評価できる。記録中のV5/MTニューロンの最適な運動方向あるいはその反対方向へ動く点を含むドット刺激を用い、サルに強制選択課題で2方向から選択させたところ、①コヒーレンスの度合いによりニューロンの反応強度が変化した、②ニューロンの反応強度から運動方向の見えを確率的に推測できた、③V5/MTを局所的に破壊、麻痺、電気刺激してサルの正答率を操作できた、④曖昧な刺激(コヒーレンスなし)に対する知覚判断の試行ごとの変動がニューロンの反応の変動と相関していた(choice-probability)、⑤これらの対応や変調が知覚判断の表示法(視線の移動、手によるレバー押し)によらなかった。これらの結果から、比較的少数のV5/MTニューロンの活動が運動方向の知覚判断を左右することが示された。


==視覚情報処理のメカニズム==
==視覚情報処理のメカニズム==
88行目: 88行目:
 V1ニューロンはある種の時空間フィルタと考えられ、ニューロンの反応と視覚入力の物理特性との関係を説明する数理モデルが提案されている([[視差エネルギーモデル]]を参照)。視覚前野のニューロンは複数の領野を経て視覚情報を受け取ることから、直接視覚刺激に含まれる刺激要素との関係に着目するのではなく、隣接する階層間での情報の集約の課程に焦点が当てることが多い。特定の刺激要素を合成しパラメトリックに変化させた視覚刺激に対する反応については、多くのモデルが、個別の刺激要素(線成分、色(輝度)成分、空間周波数成分)に対するニューロンの反応ないしは隣接階層からの入力を模したモデルの出力を、刺激要素の組み合わせや空間的な配置をもとに合成して、ニューロンの反応の再現を試みている。V1モデル(時空間フィルタ)の出力の線形加算によりV2<ref><pubmed>21841776</pubmed></ref><ref name=refb /><ref name=refc />やV5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>のニューロンの反応選択性の形成過程をある程度は説明できることが示されている。またV4ニューロンが輪郭線の形状に対して示す選択的な反応が曲線要素(V2モデルの出力)の組み合わせにより説明されることが示されている<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>17596412</pubmed></ref>。また、不特定多数の自然画像を視覚刺激として、ニューロン活動に関与する刺激要素を割り出すデータ駆動型の解析が行われるようになった。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、いったん画像をV1モデルで処理し、その出力を合成した自然画像様の人工刺激に対する反応を比較することにより、視覚刺激に含まれる空間周波数成分の分布や高次統計量に選択性を示すニューロンがV2,V4にあることが示された<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref>。一方、こうしたモデルの多くは、輪郭線の表現、面の表現、修飾作用、普遍性の獲得などの特定の機能に特化しており、視覚前野がもつ重層的ネットワークの性質を説明するにはほど遠い。
 V1ニューロンはある種の時空間フィルタと考えられ、ニューロンの反応と視覚入力の物理特性との関係を説明する数理モデルが提案されている([[視差エネルギーモデル]]を参照)。視覚前野のニューロンは複数の領野を経て視覚情報を受け取ることから、直接視覚刺激に含まれる刺激要素との関係に着目するのではなく、隣接する階層間での情報の集約の課程に焦点が当てることが多い。特定の刺激要素を合成しパラメトリックに変化させた視覚刺激に対する反応については、多くのモデルが、個別の刺激要素(線成分、色(輝度)成分、空間周波数成分)に対するニューロンの反応ないしは隣接階層からの入力を模したモデルの出力を、刺激要素の組み合わせや空間的な配置をもとに合成して、ニューロンの反応の再現を試みている。V1モデル(時空間フィルタ)の出力の線形加算によりV2<ref><pubmed>21841776</pubmed></ref><ref name=refb /><ref name=refc />やV5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>のニューロンの反応選択性の形成過程をある程度は説明できることが示されている。またV4ニューロンが輪郭線の形状に対して示す選択的な反応が曲線要素(V2モデルの出力)の組み合わせにより説明されることが示されている<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>17596412</pubmed></ref>。また、不特定多数の自然画像を視覚刺激として、ニューロン活動に関与する刺激要素を割り出すデータ駆動型の解析が行われるようになった。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、いったん画像をV1モデルで処理し、その出力を合成した自然画像様の人工刺激に対する反応を比較することにより、視覚刺激に含まれる空間周波数成分の分布や高次統計量に選択性を示すニューロンがV2,V4にあることが示された<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref>。一方、こうしたモデルの多くは、輪郭線の表現、面の表現、修飾作用、普遍性の獲得などの特定の機能に特化しており、視覚前野がもつ重層的ネットワークの性質を説明するにはほど遠い。


 近年、畳み込みニューラルネットワーク(CNN)の深層学習を利用した視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。自然画像のカテゴリー分類においてヒトに匹敵する能力を持つニューラルネッワークモデルが登場しており、その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、視覚入力と知覚判断の間の情報処理の課程を構築するという点と、特定の刺激特徴に特化するのではなくより汎用的なモデルを構築するという点で、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。近年のモデル解析は、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]によるモデルの学習などを基調とする階層的なネットワークモデルが多数提案されている<ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。
 近年、畳み込みニューラルネットワーク(CNN)の深層学習を利用した視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。自然画像のカテゴリー分類においてヒトに匹敵する能力を持つニューラルネッワークモデルが登場しており、その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、視覚入力と知覚判断の間の情報処理の課程を構築するという点と、特定の刺激特徴に特化するのではなくより汎用的なモデルを構築するという点で、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。近年のモデル解析は、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]によるモデルの学習などを基調とする階層的なネットワークモデルが多数提案されている<ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。


==各領野の解剖学的特徴とその機能==
==各領野の解剖学的特徴とその機能==
106行目: 106行目:
 腹側部はV2(細い縞、淡い縞)から入力を受け、側頭葉(V4、VTF、VOF)に投射するので、腹側視覚路に属するとされている。反対側の上視野を表す。ニューロンは色選択性を示す。背側部はV2(太い縞)とV1(4b層)から入力を受け、V3a、V4、V5/MT、V6と後頭頂葉(DP,VIP,LIP)に出力するので、背側皮質視覚路に属するとされている。反対側の下視野を表す。ミエリン染色で濃く染まり、ニューロンは輝度や奥行きに選択性を示すが、色選択性を示さない。広域的な動きや奥行き方向の傾き、テクスチャの充填(欠損部の補完))<ref><pubmed>7477262</pubmed></ref>に関わる。
 腹側部はV2(細い縞、淡い縞)から入力を受け、側頭葉(V4、VTF、VOF)に投射するので、腹側視覚路に属するとされている。反対側の上視野を表す。ニューロンは色選択性を示す。背側部はV2(太い縞)とV1(4b層)から入力を受け、V3a、V4、V5/MT、V6と後頭頂葉(DP,VIP,LIP)に出力するので、背側皮質視覚路に属するとされている。反対側の下視野を表す。ミエリン染色で濃く染まり、ニューロンは輝度や奥行きに選択性を示すが、色選択性を示さない。広域的な動きや奥行き方向の傾き、テクスチャの充填(欠損部の補完))<ref><pubmed>7477262</pubmed></ref>に関わる。


 V2とV4の間の領域を3次視覚皮質複合体と総称する。ヒトでよく発達しており、サルとの違いが顕著な領域である。V3AはV3d前方に隣接し、上視野と下視野をあわせた視野地図を持つ領野である。V1、V2、V3dより入力を受け、MT、MST、LIPへ出力する。サルのV3AはV3dよりも速度や奥行きに選択性を示すニューロンが少なく、ドットパターンよりも線刺激に強く反応する。注意の効果が顕著に見られる<ref><pubmed>10938295</pubmed></ref>。視線の向きによらずに、頭部の向きを基準とする位置に選択性を示すものがある<ref name=ref41 />。一方、ヒトのV3AはV3dよりもドットパターンで表される運動刺激によく反応し、経頭蓋電気刺激(TMS)を与えると速度の知覚が障害される<ref><pubmed>18596160</pubmed></ref>。ヒトでは隣接する別の領域(V3B)が存在し<ref><pubmed>9593930</pubmed></ref><ref><pubmed>11322977</pubmed></ref>、両眼視差による奥行き表現と運動視差による奥行き表現が統合される<ref name=ref52><pubmed>30925163</pubmed>。しかし、サルではこの統合はV5/MTに生じる。V3A,V3Bとも主に周辺視野を表す<ref name=ref51><pubmed>17978030</pubmed>。
 V2とV4の間の領域を3次視覚皮質複合体と総称する。ヒトでよく発達しており、サルとの違いが顕著な領域である。V3AはV3d前方に隣接し、上視野と下視野をあわせた視野地図を持つ領野である。V1、V2、V3dより入力を受け、MT、MST、LIPへ出力する。サルのV3AはV3dよりも速度や奥行きに選択性を示すニューロンが少なく、ドットパターンよりも線刺激に強く反応する。注意の効果が顕著に見られる<ref><pubmed>10938295</pubmed></ref>。視線の向きによらずに、頭部の向きを基準とする位置に選択性を示すものがある<ref name=ref41 />。一方、ヒトのV3AはV3dよりもドットパターンで表される運動刺激によく反応し、経頭蓋電気刺激(TMS)を与えると速度の知覚が障害される<ref><pubmed>18596160</pubmed></ref>。ヒトでは隣接する別の領域(V3B)が存在し<ref><pubmed>9593930</pubmed></ref><ref><pubmed>11322977</pubmed></ref>、両眼視差による奥行き表現と運動視差による奥行き表現が統合される<ref name=ref52><pubmed>30925163</pubmed></ref>。しかし、サルではこの統合はV5/MTに生じる。V3A,V3Bとも主に周辺視野を表す<ref name=ref51><pubmed>17978030</pubmed></ref>。


===V4野===
===V4野===
112行目: 112行目:
 19野の一部。V3に隣接する領域。背側部(V4d)と腹側部(V4v)を合わせて一つのV4とする。背側部は上視野の垂直子午線に近い部分を表す。腹側部は上視野の水平子午線に近い部分を含む残りの視野を表す。新世界ザルの背外側野(DL)、マーモセットのVLAに相当する。V2(細い縞、淡い縞)、V3、V3Aから強い入力を受け、側頭葉(TEO、TE)、後頭頂葉(MT、MST、FST、V4t、DP、VIP、LIP、PIP)、前頭葉(FEF)へ出力する。V1、V2、V3にフィードバック投射を返す。中心視領域はV1から直接投射を受け<ref><pubmed>7690064</pubmed></ref>、側頭葉(TEO、TE)とつよい結合を持つ。周辺視領域はV3、V5/MTから強い入力を受け、後頭頂葉からも広く入力を受ける。
 19野の一部。V3に隣接する領域。背側部(V4d)と腹側部(V4v)を合わせて一つのV4とする。背側部は上視野の垂直子午線に近い部分を表す。腹側部は上視野の水平子午線に近い部分を含む残りの視野を表す。新世界ザルの背外側野(DL)、マーモセットのVLAに相当する。V2(細い縞、淡い縞)、V3、V3Aから強い入力を受け、側頭葉(TEO、TE)、後頭頂葉(MT、MST、FST、V4t、DP、VIP、LIP、PIP)、前頭葉(FEF)へ出力する。V1、V2、V3にフィードバック投射を返す。中心視領域はV1から直接投射を受け<ref><pubmed>7690064</pubmed></ref>、側頭葉(TEO、TE)とつよい結合を持つ。周辺視領域はV3、V5/MTから強い入力を受け、後頭頂葉からも広く入力を受ける。


 1970年代には、色に選択的なニューロンが多く、その一部が色恒常性を示すことから、V4が色表現の中枢であるとする説が提案された<ref name=ref7 /><ref><pubmed>4196224</pubmed></ref>。しかし、1980年代になると輪郭線の傾きに選択性を示すニューロンも多数あることが明らかにされた<ref><pubmed>418173</pubmed></ref><ref name=ref6 /><ref><pubmed>3803497</pubmed></ref>。近年、色と形のサブ領域(グロブ)に分かれることが示されている<ref><pubmed>21076422</pubmed></ref><ref><pubmed>17988638</pubmed></ref>。曲線の曲率と傾きの組み合わせ<ref><pubmed>10561421</pubmed></ref><ref name=ref2 />、縞模様の空間周波数成分と傾きの組み合わせ、輪郭線の形状に複雑な応答特性を示すニューロンもある。3次元方向の線の傾き<ref><pubmed>15987762</pubmed></ref>、受容野内外の相対的な奥行き(relative disparity)<ref><pubmed>3559704</pubmed></ref>、ドットパターンの印影方向<ref><pubmed>11404436</pubmed></ref>、自然画像に含まれる高次の統計量成分に選択的に反応するニューロンもある<ref><pubmed>21841776</pubmed></ref><ref><pubmed>25535362</pubmed></ref><ref><pubmed>23685719</pubmed>。大局的な選択性(色恒常性、逆相関ステレオグラム)を示すニューロンもある。注意により強い修飾作用を受ける。多くの領野と結合しており、多様な機能を持つ<ref><pubmed>22500626</pubmed></ref><ref><pubmed>32580663</pubmed></ref>
 1970年代には、色に選択的なニューロンが多く、その一部が色恒常性を示すことから、V4が色表現の中枢であるとする説が提案された<ref name=ref7 /><ref><pubmed>4196224</pubmed></ref>。しかし、1980年代になると輪郭線の傾きに選択性を示すニューロンも多数あることが明らかにされた<ref><pubmed>418173</pubmed></ref><ref name=ref6 /><ref><pubmed>3803497</pubmed></ref>。近年、色と形のサブ領域(グロブ)に分かれることが示されている<ref><pubmed>21076422</pubmed></ref><ref><pubmed>17988638</pubmed></ref>。曲線の曲率と傾きの組み合わせ<ref><pubmed>10561421</pubmed></ref><ref name=ref2 />、縞模様の空間周波数成分と傾きの組み合わせ、輪郭線の形状に複雑な応答特性を示すニューロンもある。3次元方向の線の傾き<ref><pubmed>15987762</pubmed></ref>、受容野内外の相対的な奥行き(relative disparity)<ref><pubmed>3559704</pubmed></ref>、ドットパターンの印影方向<ref><pubmed>11404436</pubmed></ref>、自然画像に含まれる高次の統計量成分に選択的に反応するニューロンもある<ref><pubmed>21841776</pubmed></ref><ref><pubmed>25535362</pubmed></ref><ref><pubmed>23685719</pubmed></ref>。大局的な選択性(色恒常性、逆相関ステレオグラム)を示すニューロンもある。注意により強い修飾作用を受ける。多くの領野と結合しており、多様な機能を持つ<ref><pubmed>22500626</pubmed></ref><ref><pubmed>32580663</pubmed></ref>


 サルのV4を破壊すると、①大きさの変化、遮蔽、色恒常性、主観的輪郭線に対応できなくなる、②混在している複数の刺激要素を区別することができなくなる、③同一物体の持つ奥行き,明暗,色,位置などの情報を同一物体のものとして関連付けることができなくなる<ref><pubmed>8466667</pubmed></ref><ref><pubmed>8338809</pubmed></ref><ref><pubmed>8782380</pubmed></ref><ref><pubmed>10412066</pubmed></ref>などの影響が生じる。
 サルのV4を破壊すると、①大きさの変化、遮蔽、色恒常性、主観的輪郭線に対応できなくなる、②混在している複数の刺激要素を区別することができなくなる、③同一物体の持つ奥行き,明暗,色,位置などの情報を同一物体のものとして関連付けることができなくなる<ref><pubmed>8466667</pubmed></ref><ref><pubmed>8338809</pubmed></ref><ref><pubmed>8782380</pubmed></ref><ref><pubmed>10412066</pubmed></ref>などの影響が生じる。
77

回編集