77
回編集
細編集の要約なし |
細編集の要約なし |
||
85行目: | 85行目: | ||
視覚前野における視覚情報処理のプロセスや仕組みを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解が必要である([[Marrの計算論]]を参照)。ニューロンが示す刺激選択性が形成される過程について様々な神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。計算機技術の進歩に伴い大規模なモデルのフィッティングや学習によるパラメータの最適化と統計学的な解析が可能になってきたことから、近年はニューロンが示す反応を定量的に説明するモデル研究が増えている。また、ニューロンごとに最適されたモデルのパラメータを利用して、個々のニューロンの特性を求めることも行われている。 | 視覚前野における視覚情報処理のプロセスや仕組みを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解が必要である([[Marrの計算論]]を参照)。ニューロンが示す刺激選択性が形成される過程について様々な神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。計算機技術の進歩に伴い大規模なモデルのフィッティングや学習によるパラメータの最適化と統計学的な解析が可能になってきたことから、近年はニューロンが示す反応を定量的に説明するモデル研究が増えている。また、ニューロンごとに最適されたモデルのパラメータを利用して、個々のニューロンの特性を求めることも行われている。 | ||
V1ニューロンはある種の時空間フィルタと考えられ、ニューロンの反応と視覚入力の物理特性との関係を説明する数理モデルが提案されている([[視差エネルギーモデル]]を参照)。視覚前野のニューロンは複数の領野を経て視覚情報を受け取ることから、直接視覚刺激に含まれる刺激要素との関係に着目するのではなく、隣接する階層間での情報の集約の課程に焦点が当てることが多い。特定の刺激要素(線成分、色(輝度)成分、空間周波数成分)を組み合わせて人工的に合成した視覚刺激に対する反応については、個別の刺激要素に対するニューロンの反応ないしは隣接階層を模したモデルの出力を組み合わせて、反応選択性の再現を試みるものが多い。V1モデル(時空間フィルタ)の出力の線形加算によりV2<ref><pubmed>21841776</pubmed></ref><ref name=refb><pubmed>11967544</pubmed></ref><ref name=refc />やV5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>のニューロンの反応選択性の形成過程をある程度は説明できることが示されている。またV4ニューロンが輪郭線の形状に対して示す選択的な反応が曲線要素(V2モデルの出力)の組み合わせにより説明されることが示されている<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>17596412</pubmed></ref>。また、重層的ネットワークの性質として、修飾作用(受容野を横切る輪郭線の折れ曲がり、傾きの向きが異なる縞模様の組みあわせ、境界線を挟んだ図と地の向き対する反応)について、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルが提案されている<ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。一方、近年は不特定多数の自然画像を視覚刺激として、ニューロン活動に関与する刺激要素を割り出すデータ駆動型の解析が盛んになっている。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、いったん画像をV1モデルで処理し、その出力を合成した自然画像様の人工刺激に対する反応を比較することにより、視覚刺激に含まれる空間周波数成分の分布や高次統計量に選択性を示すニューロンがV2,V4にあることが示された<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref>。 | V1ニューロンはある種の時空間フィルタと考えられ、ニューロンの反応と視覚入力の物理特性との関係を説明する数理モデルが提案されている([[視差エネルギーモデル]]を参照)。視覚前野のニューロンは複数の領野を経て視覚情報を受け取ることから、直接視覚刺激に含まれる刺激要素との関係に着目するのではなく、隣接する階層間での情報の集約の課程に焦点が当てることが多い。特定の刺激要素(線成分、色(輝度)成分、空間周波数成分)を組み合わせて人工的に合成した視覚刺激に対する反応については、個別の刺激要素に対するニューロンの反応ないしは隣接階層を模したモデルの出力を組み合わせて、反応選択性の再現を試みるものが多い。V1モデル(時空間フィルタ)の出力の線形加算によりV2<ref name=ref71><pubmed>21841776</pubmed></ref><ref name=refb><pubmed>11967544</pubmed></ref><ref name=refc />やV5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>のニューロンの反応選択性の形成過程をある程度は説明できることが示されている。またV4ニューロンが輪郭線の形状に対して示す選択的な反応が曲線要素(V2モデルの出力)の組み合わせにより説明されることが示されている<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>17596412</pubmed></ref>。また、重層的ネットワークの性質として、修飾作用(受容野を横切る輪郭線の折れ曲がり、傾きの向きが異なる縞模様の組みあわせ、境界線を挟んだ図と地の向き対する反応)について、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルが提案されている<ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。一方、近年は不特定多数の自然画像を視覚刺激として、ニューロン活動に関与する刺激要素を割り出すデータ駆動型の解析が盛んになっている。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、いったん画像をV1モデルで処理し、その出力を合成した自然画像様の人工刺激に対する反応を比較することにより、視覚刺激に含まれる空間周波数成分の分布や高次統計量に選択性を示すニューロンがV2,V4にあることが示された<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref>。 | ||
近年、畳み込みニューラルネットワーク(CNN)の深層学習を利用した視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。自然画像のカテゴリー分類においてヒトに匹敵する能力を持つニューラルネッワークモデルが登場しており、その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、視覚入力と知覚判断の間の情報処理の課程を構築するという点と、特定の刺激特徴に特化するのではなくより汎用的なモデルを構築するという点で、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。視覚前野のモデル研究においても、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]によるモデルの学習などを基調とする階層的なネットワークモデルが多数提案されている<ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。 | 近年、畳み込みニューラルネットワーク(CNN)の深層学習を利用した視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。自然画像のカテゴリー分類においてヒトに匹敵する能力を持つニューラルネッワークモデルが登場しており、その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、視覚入力と知覚判断の間の情報処理の課程を構築するという点と、特定の刺激特徴に特化するのではなくより汎用的なモデルを構築するという点で、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。視覚前野のモデル研究においても、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]によるモデルの学習などを基調とする階層的なネットワークモデルが多数提案されている<ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。 | ||
111行目: | 111行目: | ||
19野の一部。V3に隣接する領域。背側部(V4d)と腹側部(V4v)を合わせて一つのV4とする。背側部は上視野の垂直子午線に近い部分を表す。腹側部は上視野の水平子午線に近い部分を含む残りの視野を表す。新世界ザルの背外側野(DL)、マーモセットのVLAに相当する。V2(細い縞、淡い縞)、V3、V3Aから強い入力を受け、側頭葉(TEO、TE)、後頭頂葉(MT、MST、FST、V4t、DP、VIP、LIP、PIP)、前頭葉(FEF)へ出力する。V1、V2、V3にフィードバック投射を返す。中心視領域はV1から直接投射を受け<ref><pubmed>7690064</pubmed></ref>、側頭葉(TEO、TE)と強い結合を持つ。周辺視領域はV3、V5/MTから強い入力を受け、後頭頂葉からも広く入力を受ける。 | 19野の一部。V3に隣接する領域。背側部(V4d)と腹側部(V4v)を合わせて一つのV4とする。背側部は上視野の垂直子午線に近い部分を表す。腹側部は上視野の水平子午線に近い部分を含む残りの視野を表す。新世界ザルの背外側野(DL)、マーモセットのVLAに相当する。V2(細い縞、淡い縞)、V3、V3Aから強い入力を受け、側頭葉(TEO、TE)、後頭頂葉(MT、MST、FST、V4t、DP、VIP、LIP、PIP)、前頭葉(FEF)へ出力する。V1、V2、V3にフィードバック投射を返す。中心視領域はV1から直接投射を受け<ref><pubmed>7690064</pubmed></ref>、側頭葉(TEO、TE)と強い結合を持つ。周辺視領域はV3、V5/MTから強い入力を受け、後頭頂葉からも広く入力を受ける。 | ||
多くの領野と結合しており、多様な機能を持つ<ref><pubmed>22500626</pubmed></ref><ref><pubmed>32580663</pubmed></ref>。1970年代には、色に選択的なニューロンが多く、その一部が色恒常性を示すことから、V4が色表現の中枢であるとする説が提案された<ref name=ref7 /><ref><pubmed>4196224</pubmed></ref>。しかし、1980年代になると輪郭線の傾きに選択性を示すニューロンも多数あることが明らかにされた<ref><pubmed>418173</pubmed></ref><ref name=ref6 /><ref><pubmed>3803497</pubmed></ref>。近年、色と形のサブ領域(グロブ)に分かれることが示されている<ref><pubmed>21076422</pubmed></ref><ref><pubmed>17988638</pubmed></ref> | 多くの領野と結合しており、多様な機能を持つ<ref><pubmed>22500626</pubmed></ref><ref><pubmed>32580663</pubmed></ref>。1970年代には、色に選択的なニューロンが多く、その一部が色恒常性を示すことから、V4が色表現の中枢であるとする説が提案された<ref name=ref7 /><ref><pubmed>4196224</pubmed></ref>。しかし、1980年代になると輪郭線の傾きに選択性を示すニューロンも多数あることが明らかにされた<ref><pubmed>418173</pubmed></ref><ref name=ref6 /><ref><pubmed>3803497</pubmed></ref>。近年、色と形のサブ領域(グロブ)に分かれることが示されている<ref><pubmed>21076422</pubmed></ref><ref><pubmed>17988638</pubmed></ref>。他にも、曲線(円弧、非カルテジアン図形(同心円、らせん、双曲線))<ref><pubmed10561421</pubmed></ref><ref name=ref71 /><ref name><pubmed>8418487</pubmed></ref>、曲線の曲率と傾きの組み合わせ<ref><pubmed>10561421</pubmed></ref><ref name=ref2 />、縞模様の空間周波数成分と傾きの組み合わせ、3次元方向の線の傾き<ref><pubmed>15987762</pubmed></ref>、受容野内外の相対的な奥行き(relative disparity)<ref><pubmed>3559704</pubmed></ref>、ドットパターンの印影方向<ref><pubmed>11404436</pubmed></ref>、自然画像に含まれる高次の統計量成分<ref><pubmed>21841776</pubmed></ref><ref><pubmed>23685719</pubmed></ref><ref><pubmed>25535362</pubmed></ref>などに選択性を示すニューロンがある。さらに、大局的な選択性(色恒常性、逆相関ステレオグラム)を示すもの、注意により強い修飾作用を受けるもの、複雑な輪郭線の形状に選択性を示すもの<ref><pubmed>8201425</pubmed></ref>、視覚刺激の位置、大きさ、刺激手がかりの変化に対して反応選択性の不変性を示すもの<ref><pubmed>27194333</pubmed></ref><ref><pubmed>16267116</pubmed></ref><ref><pubmed>8899641</pubmed></ref><ref><pubmed>11698538</pubmed></ref>などのニューロンがある。 | ||
サルのV4を破壊すると、①大きさの変化、遮蔽、色恒常性、主観的輪郭線に対応できなくなる、②混在している複数の刺激要素を区別することができなくなる、③同一物体の持つ奥行き,明暗,色,位置などの情報を同一物体のものとして関連付けることができなくなる<ref><pubmed>8466667</pubmed></ref><ref><pubmed>8338809</pubmed></ref><ref><pubmed>8782380</pubmed></ref><ref><pubmed>10412066</pubmed></ref>などの影響が生じる。 | サルのV4を破壊すると、①大きさの変化、遮蔽、色恒常性、主観的輪郭線に対応できなくなる、②混在している複数の刺激要素を区別することができなくなる、③同一物体の持つ奥行き,明暗,色,位置などの情報を同一物体のものとして関連付けることができなくなる<ref><pubmed>8466667</pubmed></ref><ref><pubmed>8338809</pubmed></ref><ref><pubmed>8782380</pubmed></ref><ref><pubmed>10412066</pubmed></ref>などの影響が生じる。 |
回編集