「サリエンシー」の版間の差分

ナビゲーションに移動 検索に移動
編集の要約なし
編集の要約なし
編集の要約なし
9行目: 9行目:
もし夜空に月が光っていれば月にすぐに目が向くだろう。これは月が目立つ(salient)からだ。このように感覚刺激がボトムアップ性注意を誘引する特性を「サリエンシー」と呼ぶ。 夜の月がsalientであるのは周りの空と比べて明るいからであって、昼の月はsalientではない。つまり、サリエンシーは刺激の時間的または空間的配置によって決定づけられるものであって、その刺激自体の特性ではない。明るいスクリーンに暗い部分があればそこはsalientになる。つまり刺激強度が高いこと(たとえば輝度が高いこと)とサリエンシーが高いことは等価ではない。
もし夜空に月が光っていれば月にすぐに目が向くだろう。これは月が目立つ(salient)からだ。このように感覚刺激がボトムアップ性注意を誘引する特性を「サリエンシー」と呼ぶ。 夜の月がsalientであるのは周りの空と比べて明るいからであって、昼の月はsalientではない。つまり、サリエンシーは刺激の時間的または空間的配置によって決定づけられるものであって、その刺激自体の特性ではない。明るいスクリーンに暗い部分があればそこはsalientになる。つまり刺激強度が高いこと(たとえば輝度が高いこと)とサリエンシーが高いことは等価ではない。


しかし、'salience/saliency'という言葉が一般名詞として(物理的な強度と対比させて)心理的な強度自体を表していることもあるので注意。
しかし、一般名詞としてsalience / saliencyという言葉を(物理的な強度と対比させて)心理的な強度自体を表していることもあり、かならずしも上記の用法で統一されているとは言えない。


== 視覚探索 ==
== 視覚探索 ==
23行目: 23行目:
== サリエンシー・マップ(saliency map)  ==
== サリエンシー・マップ(saliency map)  ==


特徴統合理論はあくまで心理学的な理論であったが、実際の脳でどのようにボトムアップ性注意が計算されているかを説明することを目的とした計算論的モデルとして、「サリエンシー・マップ」が提唱された<ref name=ref1><pubmed> 3836989 </pubmed></ref>。
特徴統合理論はあくまで心理学的な理論であったが、計算論的立場からどのようにボトムアップ性注意が計算されているかを説明するモデルとして「サリエンシー・マップ」が提唱された<ref name=ref1><pubmed> 3836989 </pubmed></ref>。


サリエンシー・マップとは、視覚刺激のサリエンシーをスカラー量として計算して、特徴に依存しない単一の二次元マップとして表現したもののことを指す。
サリエンシー・マップとは、特徴に依存しない視覚刺激のサリエンシーをスカラー量として計算して、二次元マップとして表現したもののことを指す。


サリエンシー・マップの機能的な特徴としては以下の二つがあげられる。
サリエンシー・マップの機能的な特徴としては以下の二つがあげられる。


+平行処理:特徴統合理論からの影響を受けているため、サリエンシーはまず各特徴ごとに計算されて、特徴マップを作る。
* 平行処理:特徴統合理論からの影響を受けているため、サリエンシーはまず各特徴ごとに計算されて、特徴マップを作る。
+Winner-take-allルール:これら複数の特徴マップが足しあわされて計算されたサリエンシー・マップの中からいちばんサリエンシーの高い部分が選択される。
* Winner-take-allルール:これら複数の特徴マップが足しあわされて計算されたサリエンシー・マップの中からいちばんサリエンシーの高い部分が選択される。


Koch and Ulman 1985<ref name=ref1></ref>においてはあくまで計算の原理のモデルであったのだが、それを実際の画像から計算できるようなモデルとして実現したのがItti, Koch and Neiburによるサリエンシー計算論モデルだった<ref name=ref2>'''L. Itti, C. Koch, & E. Niebur'''<br>A Model of Saliency-Based Visual Attention for Rapid Scene Analysis.<br>''IEEE Transactions on Pattern Analysis and Machine Intelligence'': 1998,  20(11):1254-1259.</ref>。
Koch and Ulman 1985<ref name=ref1></ref>においてはあくまで計算の原理のモデルであったのだが、それを実際の画像から計算できるようなモデルとして実現したのがItti, Koch and Neiburによるサリエンシー計算論モデルだった<ref name=ref2>'''L. Itti, C. Koch, & E. Niebur'''<br>A Model of Saliency-Based Visual Attention for Rapid Scene Analysis.<br>''IEEE Transactions on Pattern Analysis and Machine Intelligence'': 1998,  20(11):1254-1259.</ref>。
36行目: 36行目:
このモデルのアルゴリズムレベルでの特色としては、
このモデルのアルゴリズムレベルでの特色としては、


+ 各特徴ごとのサリエンシーを計算するため、center-surround抑制を用いる
* 各特徴ごとのサリエンシーを計算するため、center-surround抑制を用いる。
+ さまざまな解像度(pyramids)でこの作業を平行して行う(画像処理の分野でのmulti-scale representationに対応)  
* さまざまな解像度(pyramids)でこの作業を平行して行う(画像処理の分野でのmulti-scale representationに対応)
+ 以上の操作を繰り返して正規化する(iterative normalization)  
* 以上の操作を繰り返して正規化する(iterative normalization)


がある 。
がある 。
47行目: 47行目:


このソフトウェアを使って図1の画像のサリエンシーを計算したのが図2となる。
このソフトウェアを使って図1の画像のサリエンシーを計算したのが図2となる。
ほかにもMatlabでのサリエンシー・マップを計算するプログラムとして以下のものがwebから入手可能である。
* [http://www.saliencytoolbox.net/ SaliencyToolbox]
* [http://www.klab.caltech.edu/~harel/share/gbvs.php Graph-Based Visual SaliencyおよびItti, Koch, Nieburのサリエンシー・マップ]
* [http://www.cse.oulu.fi/CMV/Downloads/saliency Matlab codes for measuring image saliency]


Itti, Koch and Neibur<ref name=ref2></ref>以降、サリエンシー・マップはさまざまな実装が報告されており、たとえば三次元への拡張、トップダウン注意への拡張などcomputational visionにおいて重要な分野の一つとなっている。
Itti, Koch and Neibur<ref name=ref2></ref>以降、サリエンシー・マップはさまざまな実装が報告されており、たとえば三次元への拡張、トップダウン注意への拡張などcomputational visionにおいて重要な分野の一つとなっている。


== サリエンシー・マップの脳内表象 ==
== サリエンシーの脳内表象 ==
 
サリエンシー・マップはあくまで計算論的概念であるので、脳にサリエンシー・マップが表現されている保証はない。オリジナルの定義からすればサリエンシー・マップは単一のものであるはずだが、複数の処理レベルのサリエンシー・マップが脳内で分散して表現されていると主張しているものもある (たとえば<ref><pubmed> 15581921 </pubmed></ref>)。


サリエンシー・マップはあくまで計算論的概念であるので、脳にサリエンシー・マップが表現されている保証はない。しかしながら、サリエンシー・マップが表象されている部分としてこれまでに、V1,、上丘、視床枕、LIP、FEFなどがその候補として挙げられている。
サリエンシーが表象されている部分としてこれまでに、V1<ref name=ref3><pubmed> 11849610 </pubmed></ref>、上丘<ref name=ref4><pubmed> 19757885 </pubmed></ref>、視床枕<ref name=ref5><pubmed> 1374970 </pubmed></ref>、LIP<ref name=ref6><pubmed> 9461214 </pubmed></ref>、FEF<ref name=ref7><pubmed> 15581711 </pubmed></ref>、V4<ref name=ref8><pubmed> 12628175 </pubmed></ref>などがその候補として挙げられている。


オリジナルの定義からすればサリエンシー・マップは単一のものであるはずだが、サリエンシーは脳内で分散して表現されていると主張しているものもある (たとえば<ref><pubmed> 15581921 </pubmed></ref>)。
== サリエンシー・マップの応用  ==


画像や映像を見ているときの視覚探索をサリエンシー・マップによって予測するという一連の研究がある。そのなかではたとえば視覚探索時の眼球運動のデータからADHD患者やパーキンソン病患者を分類することに成功したもの<ref name=ref9><pubmed> 22926163 </pubmed></ref>やマカクザルの視覚探索時の眼球運動のデータから第一次視覚野損傷の影響を解明したもの<ref name=ref10><pubmed> 22748317 </pubmed></ref>などがある。


== 関連項目 ==
== 関連項目 ==
27

回編集

案内メニュー