「視覚前野」の版間の差分

ナビゲーションに移動 検索に移動
編集の要約なし
編集の要約なし
編集の要約なし
83行目: 83行目:
==視覚情報処理のメカニズム==
==視覚情報処理のメカニズム==


 視覚前野における視覚情報処理のプロセスやメカニズムを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解する必要がある([[Marrの計算論]]を参照)。V1ニューロンは視覚情報(画像情報)に対してある種の時空間フィルタ([[受容野]][[視差エネルギーモデル]]を参照)として機能すると考えられるが、視覚前野のモデル研究では階層なネットワークとしてV1、V2からの入力からどのようにV2,V4,V5/MTの刺激選択性が形成されるのかがテーマとなる。各領野のニューロンが示す刺激特徴(輪郭線の形状、面の特性、運動パターン)の検出、さらには反応選択性の不変性(位置、サイズ、手がかり刺激など)や修飾作用を説明する神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。
 視覚前野における視覚情報処理のプロセスやメカニズムを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解する必要がある([[Marrの計算論]]を参照)。V1ニューロンは視覚情報(画像情報)に対してある種の時空間フィルタ([[受容野]][[視差エネルギーモデル]]を参照)として機能すると考えられるが、視覚前野のモデル研究では階層的なネットワークの枠組みでV1、V2からの入力をもとにV2,V4,V5/MTの刺激選択性がどのように形成されるのかがテーマとなる。各領野のニューロンが示す刺激特徴(輪郭線の形状、面の特性、運動パターン)の検出、さらには修飾作用や反応選択性の不変性(位置、サイズ、手がかり刺激など)を説明する神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。


 計算機技術の進歩に伴い、大規模なモデルのフィッティングや学習によるパラメータやネットワークモデルの最適化と統計学的な解析が可能となった。今日のモデル研究においては、ニューロンが示す反応を定量的に説明するモデル研究が盛んである。当初は、特定の刺激要素(線成分、色(輝度)成分、運動成分、空間周波数成分)への反応を組み合わせるタイプのモデル研究が多かった。例えば、輪郭線の表現であれば、傾き、長さ、位置で表される線分(パーツ)を用意し、複数のパーツを組み合わせて輪郭線を表現すると考える。これを説明するモデルでは、実際の入力の代わりに、パーツ単体に対するニューロンの反応ないしはパーツを表す入力(例えばV1モデルの出力)をもとに輪郭線に対する反応を計算する。このタイプのモデルでは、個々のニューロンの反応に対してモデルのパラメータを最適化する<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>。また、重層的なネットワークの性質として、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルも提案されている<ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。その後、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]のように入力層(例えばV1モデルの2次元配列)の出力を組み合わせるタイプのモデル研究が多くなった。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、時空間フィルタ(V1モデル)の出力を組み合わせることで、視覚刺激に含まれる空間周波数成分の分布や高次統計量が寄与することが示された(V2,V4)<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref><ref name=ref91><pubmed>21841776</pubmed></ref><ref name=ref92><pubmed>23685719</pubmed></ref><ref name=ref93><pubmed>25535362</pubmed></ref>。近年では、不特定多数の自然画像を視覚刺激とするデータ駆動型の解析も増えている。スパース符号化(sparse coding)や[[wikipedia:ja:深層学習|深層学習]]をキーワードにして、ネットワークモデル自体を最適化するタイプの研究が盛んになっている<ref><pubmed>17596412</pubmed></ref><ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。
 計算機技術の進歩に伴い、大規模なモデルのフィッティングや学習によるパラメータやネットワークモデルの最適化と統計学的な解析が可能となった。今日のモデル研究においては、ニューロンが示す反応を定量的に説明する研究が盛んである。当初は、特定の刺激要素(線成分、色(輝度)成分、運動成分、空間周波数成分)への反応を組み合わせるタイプのモデル研究が多かった。例えば、輪郭線の表現であれば、傾き、長さ、位置で表される線分(パーツ)を複数用意し、それらの組み合わせて輪郭線を表現すると考える。これを説明するモデルでは、実際の入力の代わりに、パーツ単体に対するニューロンの反応ないしはパーツを表す入力(例えばV1モデルの出力)をもとに輪郭線に対する反応を予測する。このようなモデルでは、個々のニューロンの反応に対してはモデルのパラメータを最適化する<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>。また、重層的なネットワークの性質として、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルも提案されている<ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。その後、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]のように入力層(例えばV1モデルの2次元配列)の出力を組み合わせるタイプのモデル研究が多くなった。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、時空間フィルタ(V1モデル)の出力を組み合わせることで、視覚刺激に含まれる空間周波数成分の分布や高次統計量が寄与することが示された(V2,V4)<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref><ref name=ref91><pubmed>21841776</pubmed></ref><ref name=ref92><pubmed>23685719</pubmed></ref><ref name=ref93><pubmed>25535362</pubmed></ref>。近年では、不特定多数の自然画像を視覚刺激とするデータ駆動型の解析も増えている。スパース符号化(sparse coding)や[[wikipedia:ja:深層学習|深層学習]]をキーワードにして、ネットワークモデル自体を最適化するタイプの研究が盛んになっている<ref><pubmed>17596412</pubmed></ref><ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。


 近年、深層ニューラルネットワーによる視覚情報処理技術が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳のメカニズムをそのまま再現することが目的のネットワークモデルではないが、モデルのリバースエンジニアリングが視覚前野のメカニズム研究の手がかりを与えることが期待される<ref><pubmed>29163117</pubmed></ref>。
 近年、深層ニューラルネットワークによる視覚情報処理技術が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳のメカニズムをそのまま再現することが目的のネットワークモデルではないが、モデルのリバースエンジニアリングが視覚前野のメカニズム研究の手がかりを与えることが期待される<ref><pubmed>29163117</pubmed></ref>。


==各領野の解剖学的特徴とその機能==
==各領野の解剖学的特徴とその機能==
77

回編集

案内メニュー