「マーの視覚計算理論」の版間の差分

ナビゲーションに移動 検索に移動
編集の要約なし
編集の要約なし
10行目: 10行目:


==Marrの視覚計算理論とは==
==Marrの視覚計算理論とは==
 David Marr (1945-1980)は、視覚研究において独創的な理論体糸を残し、一つの総合的アブローチを提唱した。ここでは、一般の情報処理システムを理解するための3つのレベル、視覚情報処理を理解するための3つのレベルについて紹介した後、視覚情報処理の3段階について具体的に説明する。Marrの視覚研究の枠組みは当時としてはきわめて独創的なものであった。現在でもそれは脳のメカニズムのレベルでさまざまな検討が進められている。
 David Marr (1945-1980)は、視覚研究において独創的な理論体糸を残し、一つの総合的アブローチを提唱した<ref name=ref1 /><ref>'''乾 敏郎 (1994).'''<br>視覚の計算理論.伊藤正男・安西祐一郎・川人光男・市川伸 一・中島秀之・橋田浩一(編)岩波講座「認知科学」第3巻『視覚と聴覚』''岩波書店'' 89-127</ref>。ここでは、一般の情報処理システムを理解するための3つのレベル、視覚情報処理を理解するための3つのレベルについて紹介した後、視覚情報処理の3段階について具体的に説明する。Marrの視覚研究の枠組みは当時としてはきわめて独創的なものであった。現在でも脳研究は3つのレベルでさまざまな検討がなされている<ref>'''Mather, G. (2015).'''<br>Computational approaches to perception: Beyond Marr’s (1982) computational approach to vision. In: Eysenck, M.W. and Groome, D. (Eds.) Cognitive psychology : Revisiting the classic studies, SAGE Publications, 38-46.<br>'''乾 敏郎 (訳, 2017)'''<br> 知覚の計算論的アプローチ- Marr(1982)による視覚の計算論的アプローチを超えて. 箱田 裕司, 行場 次朗(監訳)『古典で読み解く現代認知心理学』, ''北大路書房'', 49-60.</ref>。


==情報処理システムを理解するための3つのレベル==
==情報処理システムを理解するための3つのレベル==
22行目: 22行目:


==視覚系を理解するための3つのレベル==
==視覚系を理解するための3つのレベル==
 情報処理糸の研究をするためにはまずシステムの目的をはっきりさせねばならない。視覚系の目的はいろいろ考えられるが、Marr (1982)<ref>'''Marr, D. (1982).'''<br>Vision: A computational investigation into the human representation and processing of visual information.  New York, NY: W. H. Freeman & Company.<br>'''乾 敏郎,安藤広志(訳,1987)'''<br>『ビジョン-視覚の計算理論と脳内表現-』 産業図書.</ref> はまず網膜像の強度変化から実世界の3次元構造を推測することが視覚情報処理系の目的であると考えた。各過程はこの目的を遠成するために合理的に作られているはずである。そこでまずそれぞれの過程では何がどのような目的で計算されているのかを明らかにする必要がある。これが計算理論であり、システムの入出力の関係の記述と言える。
 情報処理糸の研究をするためにはまずシステムの目的をはっきりさせねばならない。視覚系の目的はいろいろ考えられるが、Marr (1982)<ref name=ref1>'''Marr, D. (1982).'''<br>Vision: A computational investigation into the human representation and processing of visual information.  New York, NY: W. H. Freeman & Company.<br>'''乾 敏郎,安藤広志(訳,1987)'''<br>『ビジョン-視覚の計算理論と脳内表現-』 産業図書.</ref> はまず網膜像の強度変化から実世界の3次元構造を推測することが視覚情報処理系の目的であると考えた。各過程はこの目的を遠成するために合理的に作られているはずである。そこでまずそれぞれの過程では何がどのような目的で計算されているのかを明らかにする必要がある。これが計算理論であり、システムの入出力の関係の記述と言える。


 対象のさまざまな視覚属性は2次元網膜像から推定される。推定すべき属性の多くは、奥行きや3次元形状である。2次元データから3次元属性の推定は一般には解けない不良設定問題(ill-posed problem)である。ここで重要なことは、この計算が何らかの暗黙の仮定(制約条件)のもとでなされているということである。制約条件なしに計算しても解が一意に決まらないことが多い。しかし、我々は常に一つの知覚を経験している。これは何らかの制約条件が働いているからである。
 対象のさまざまな視覚属性は2次元網膜像から推定される。推定すべき属性の多くは、奥行きや3次元形状である。2次元データから3次元属性の推定は一般には解けない不良設定問題(ill-posed problem)である。ここで重要なことは、この計算が何らかの暗黙の仮定(制約条件)のもとでなされているということである。制約条件なしに計算しても解が一意に決まらないことが多い。しかし、我々は常に一つの知覚を経験している。これは何らかの制約条件が働いているからである。
49行目: 49行目:
==参考文献==
==参考文献==
<references />
<references />
Mather, G. (2015) Computational approaches to perception: Beyond Marr’s (1982) computational approach to vision. In: Eysenck, M.W. and Groome, D. (Eds.) Cognitive psychology : Revisiting the classic studies, SAGE Publications, 38-46. 乾 敏郎 (訳, 2017) 知覚の計算論的アプローチ-Marr(1982)による視覚の計算論的アプローチを超えて. 箱田 裕司, 行場 次朗(監訳)『古典で読み解く現代認知心理学』, 北大路書房, 49-60.

案内メニュー