「視覚前野」の版間の差分

編集の要約なし
編集の要約なし
編集の要約なし
83行目: 83行目:
==視覚情報処理のメカニズム==
==視覚情報処理のメカニズム==


 視覚前野における視覚情報処理のプロセスやメカニズムを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解する必要である([[Marrの計算論]]を参照)。V1ニューロンはある種の時空間フィルタ([[受容野]][[視差エネルギーモデル]]を参照)と考えられるが、視覚前野のニューロンは複数の領野を経て視覚情報を受け取ることから、V1、V2からの入力からどのようにV2,V4,V5/MTの刺激選択性が形成されるのかがモデル研究のテーマとなる。輪郭線の形状、面の特性、運動パターンの検出、さらには反応選択性の不変性(位置、サイズ、手がかり刺激)、様々な修飾作用を説明する様々な神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。計算機技術の進歩に伴い大規模なモデルのフィッティングや学習によるパラメータの最適化と統計学的な解析が可能になり、ニューロンが示す反応を定量的に説明するモデル研究が盛んになった。階層的ネットワークの特定の刺激要素(線成分、色(輝度)成分、運動成分、空間周波数成分)をもとに合成した視覚刺激に対する反応については、神経モデルにおいても刺激要素の組み合わせをベースにしたモデル研究が多い。例えば輪郭線の表現であれば、傾き、長さ、位置で表される線分(パーツ)を用意し、複数のパーツを組み合わせて輪郭線を表現すると考える。そこで実際の入力の代わりに、パーツ単体に対するニューロンの反応、ないしはパーツを表す入力(例えば線の傾きと位置を表すV1モデル)をもとに輪郭線に対する反応を計算するモデルを考える。あとは個々のニューロンの反応選択性にあわせて、モデルのパラメータを最適化する(V2<pubmed>21841776</pubmed></ref><ref name=refc />、V4<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>17596412</pubmed></ref>、V5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>。一方、不特定多数の自然画像を視覚刺激として、ニューロン活動に関与する刺激要素を割り出すデータ駆動型の解析も盛んになっている。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、いったん画像データをV1モデルで処理し、その出力を合成した自然画像様の人工刺激に対する反応を比較することにより、視覚刺激に含まれる空間周波数成分の分布や高次統計量に選択性を示すニューロンがV2,V4にあることが示された<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref><ref name=ref91><pubmed>21841776</pubmed></ref><ref name=ref92><pubmed>23685719</pubmed></ref><ref name=ref93><pubmed>25535362</pubmed></ref>。また、重層的ネットワークの性質として、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルが提案されているV2<ref name=ref71><ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。
 視覚前野における視覚情報処理のプロセスやメカニズムを解明するには、ニューロンや機能的領野の結合関係、視覚刺激とニューロンの反応特性と知覚判断の間の因果関係に加えて、背後にある計算理論の理解する必要である([[Marrの計算論]]を参照)。V1ニューロンはある種の時空間フィルタ([[受容野]][[視差エネルギーモデル]]を参照)と考えられるが、視覚前野のニューロンは複数の領野を経て視覚情報を受け取ることから、V1、V2からの入力からどのようにV2,V4,V5/MTの刺激選択性が形成されるのかがモデル研究のテーマとなる。輪郭線の形状、面の特性、運動パターンの検出、さらには反応選択性の不変性(位置、サイズ、手がかり刺激)、様々な修飾作用を説明する様々な神経モデルが提案されている(詳細は[[wikipedia:ja:計算論的神経科学|計算論的神経科学]]を参照)。計算機技術の進歩に伴い大規模なモデルのフィッティングや学習によるパラメータの最適化と統計学的な解析が可能になり、ニューロンが示す反応を定量的に説明するモデル研究が盛んになった。階層的ネットワークの特定の刺激要素(線成分、色(輝度)成分、運動成分、空間周波数成分)をもとに合成した視覚刺激に対する反応については、神経モデルにおいても刺激要素の組み合わせをベースにしたモデル研究が多い。例えば輪郭線の表現であれば、傾き、長さ、位置で表される線分(パーツ)を用意し、複数のパーツを組み合わせて輪郭線を表現すると考える。そこで実際の入力の代わりに、パーツ単体に対するニューロンの反応、ないしはパーツを表す入力(例えば線の傾きと位置を表すV1モデル)をもとに輪郭線に対する反応を計算するモデルを考える。あとは個々のニューロンの反応選択性にあわせて、モデルのパラメータを最適化する(V2<ref><pubmed>21841776</pubmed></ref><ref name=refc />、V4<ref name=ref2><pubmed>11698538</pubmed></ref><ref><pubmed>12426571</pubmed></ref><ref><pubmed>17596412</pubmed></ref>、V5/MT<ref><pubmed>8570605</pubmed></ref><ref><pubmed>17041595</pubmed></ref>。一方、不特定多数の自然画像を視覚刺激として、ニューロン活動に関与する刺激要素を割り出すデータ駆動型の解析も盛んになっている。ドットパターン、テクスチャ、自然画像に特定の刺激要素を見いだすことは難しいが、いったん画像データをV1モデルで処理し、その出力を合成した自然画像様の人工刺激に対する反応を比較することにより、視覚刺激に含まれる空間周波数成分の分布や高次統計量に選択性を示すニューロンがV2,V4にあることが示された<ref><pubmed>16987926</pubmed></ref><ref><pubmed>19778517</pubmed></ref><ref name=ref91><pubmed>21841776</pubmed></ref><ref name=ref92><pubmed>23685719</pubmed></ref><ref name=ref93><pubmed>25535362</pubmed></ref>。また、重層的ネットワークの性質として、フィードバック投射や受容外から作用する興奮性/抑制性の修飾作用を取り入れたモデルが提案されている<ref name=ref71 /><ref name=refc><pubmed>21091803</pubmed></ref><ref><pubmed>16768360</pubmed></ref><ref><pubmed>8261126</pubmed></ref>。
 近年、畳み込みニューラルネットワーク(CNN)の深層学習を利用した視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。自然画像のカテゴリー分類においてヒトに匹敵する能力を持つニューラルネッワークモデルが登場しており、その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。視覚前野のモデル研究においても、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]によるモデルの学習の考え方をとりいれた階層的なネットワークモデルが提案されている<ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。
 近年、畳み込みニューラルネットワーク(CNN)の深層学習を利用した視覚情報処理技術の研究開発が著しく進歩している(詳細は[[wikipedia:ja:人工知能|人工知能]]を参照)。自然画像のカテゴリー分類においてヒトに匹敵する能力を持つニューラルネッワークモデルが登場しており、その中間層(隠れ層)のノードがV1ないしV4のような特性を持つことが示されている<ref><pubmed>30570484</pubmed></ref>。脳機能をそのまま再現するモデルではないが、ネットワークのりバースエンジニアリングが視覚前野のメカニズム研究の手がかりとなることが期待される<ref><pubmed>29163117</pubmed></ref>。視覚前野のモデル研究においても、[[wikipedia:ja: ニューラルネットワーク|ニューラルネットワーク]]、スパース符号化(sparse coding)、[[wikipedia:ja:深層学習|深層学習]]によるモデルの学習の考え方をとりいれた階層的なネットワークモデルが提案されている<ref><pubmed>26203137</pubmed></ref><ref><pubmed>27140760</pubmed></ref><ref><pubmed>22114163</pubmed></ref><ref>'''H Lee, C Ekanadham, A Y Ng'''<br>Sparse deep belief net model for visual area V2.<br>''Advances Neural Information Processing Systems, Vol.20'' (J C Platt, D Koller, Y Singer, S T Roweis, eds. ,pp873-880,2008.</ref>。


77

回編集