「視覚前野」の版間の差分

ナビゲーションに移動 検索に移動
編集の要約なし
編集の要約なし
編集の要約なし
85行目: 85行目:
 視覚前野における視覚情報処理のプロセスやメカニズムを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解する必要である([[Marrの計算論]]を参照)。V1ニューロンはある種の時空間フィルタ([[受容野]][[視差エネルギーモデル]]を参照)と考えられるが、視覚前野のニューロンでは階層的ネットワークの枠組みでV1、V2からの入力からどのようにV2,V4,V5/MTの刺激選択性が形成されるのかがモデル研究のテーマとなる。刺激特徴(輪郭線の形状、面の特性、運動パターン)の検出、さらには反応選択性の不変性(位置、サイズ、手がかり刺激など)や修飾作用を説明する神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。
 視覚前野における視覚情報処理のプロセスやメカニズムを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解する必要である([[Marrの計算論]]を参照)。V1ニューロンはある種の時空間フィルタ([[受容野]][[視差エネルギーモデル]]を参照)と考えられるが、視覚前野のニューロンでは階層的ネットワークの枠組みでV1、V2からの入力からどのようにV2,V4,V5/MTの刺激選択性が形成されるのかがモデル研究のテーマとなる。刺激特徴(輪郭線の形状、面の特性、運動パターン)の検出、さらには反応選択性の不変性(位置、サイズ、手がかり刺激など)や修飾作用を説明する神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。


 計算機技術の進歩に伴い大規模なモデルのフィッティングや学習によるパラメータの最適化と統計学的な解析が可能になり、ニューロンが示す反応を定量的に説明するモデル研究が盛んになった。特定の刺激要素(線成分、色(輝度)成分、運動成分、空間周波数成分)をもとに合成した視覚刺激に対する反応について、刺激要素の組み合わせをベースにしたモデル研究が多い。例えば輪郭線の表現であれば、傾き、長さ、位置で表される線分(パーツ)を用意し、複数のパーツを組み合わせて輪郭線を表現すると考える。モデルでは、実際の入力の代わりに、パーツ単体に対するニューロンの反応ないしはパーツを表す入力(例えば線の傾きと位置を表すV1モデル)をもとに輪郭線に対する反応を計算する。あとは個々のニューロンの反応選択性にあわせて、モデルのパラメータを最適化する(V4<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref>、V5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>。また、重層的ネットワークの性質として、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルが提案されている<ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、時空間フィルタ(V1にモデル)の出力を組み合わせることで、視覚刺激に含まれる空間周波数成分の分布や高次統計量の役割が示された(V2,V4)<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref><ref name=ref91><pubmed>21841776</pubmed></ref><ref name=ref92><pubmed>23685719</pubmed></ref><ref name=ref93><pubmed>25535362</pubmed></ref>。近年は、不特定多数の自然画像を視覚刺激として、ネットワークの枠組み自体を学習させる、データ駆動型の解析が盛んになっている。[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]等をキーワードにした研究が盛んになってきている<ref><pubmed>17596412</pubmed></ref><ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。
 計算機技術の進歩に伴い大規模なモデルのフィッティングや学習によるパラメータの最適化と統計学的な解析が可能になり、ニューロンが示す反応を定量的に説明するモデル研究が盛んになった。当初は、V1などで抽出される特定の刺激要素(線成分、色(輝度)成分、運動成分、空間周波数成分)への反応の組み合わせをベースにしたモデル研究が多かった。例えば、輪郭線の表現であれば、傾き、長さ、位置で表される線分(パーツ)を用意し、複数のパーツを組み合わせて輪郭線を表現すると考える。モデルでは、実際の入力の代わりに、パーツ単体に対するニューロンの反応ないしはパーツを表す入力(例えば線の傾きと位置を表すV1モデル)をもとに輪郭線に対する反応を計算する。あとは個々のニューロンの反応にあわせて、モデルのパラメータを最適化する<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>。重層的ネットワークの性質として、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルも提案されている<ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、時空間フィルタ(V1にモデル)の出力を組み合わせることで、視覚刺激に含まれる空間周波数成分の分布や高次統計量の役割が示された(V2,V4)<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref><ref name=ref91><pubmed>21841776</pubmed></ref><ref name=ref92><pubmed>23685719</pubmed></ref><ref name=ref93><pubmed>25535362</pubmed></ref>。近年は、不特定多数の自然画像を視覚刺激としてネットワークの枠組み自体を学習させる、データ駆動型の解析が盛んになっている。[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]等をキーワードにした研究が盛んになってきている<ref><pubmed>17596412</pubmed></ref><ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。


 近年、深層ニューラルネットワーによる視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。
 近年、深層ニューラルネットワーによる視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。
77

回編集

案内メニュー