神経経済学

英語名：neuroeconomics

我々は日常生活の中で、お金や食べ物などの「報酬」に関わる様々な選択問題を解いている。それはどのような脳の働きによるものだろうか？この疑問に答えようとするのが、「神経経済学（ニューロエコノミクス）」である。

神経経済学のなりたち

脳科学の分野では、古くから報酬に基づく動物や人間の意思決定のメカニズムが調べられてきた。その中で、価値や期待値、予測との誤差などの数理的なモデルを脳の情報処理モデルとして仮定し、実験的手法で検証する計算論的アプローチが用いられるようになった。これらのアプローチは始め、脳の情報処理の基本単位である神経細胞（ニューロン）やその回路レベルでの振る舞いを対象にして行われていたが、近年の機能的磁気共鳴画像法 (fMRI)などの、脳への外科的手術を必要としない、非侵襲的計測手法の発達と普及により、経済的選択などの複雑な問題を解いている時の人間の脳の様子を調べることが容易になってきた。伝統的経済学では、経済行動の意思決定は経済人的合理性を持って行われるという仮定を置くので、意思決定のメカニズムはブラックボックスとして扱い、解明しようとはしない。一方、脳科学のアプローチでは、実際の人間の経済行動が生み出される脳の仕組みに注目し、外からは観測できない意思決定のメカニズムを重要視する。つまり、人間本位の経済理論を作るという行動経済学の目指すところを脳の仕組みの解明の側面から探究するものであるといえる。

このような背景から、経済学と脳科学は出会い、1990年代後半から2000年代前半にかけて神経経済学という新しい分野が誕生したのである。まとめると、神経経済学とは、経済行動を生み出す脳の働きを、脳科学の手法を用いて解明し、実際の人間の経済行動をより良く説明できるような新しい経済理論を作ろうとする学問である。行動経済学は、初期には心理学実験を主要な手法として経済行動を探究したのであるが、近年になって神経経済学の手法も、従来の手法と補完的に用いられている。ここでは、この新しい分野である神経経済学の歴史的背景と主な研究分野について簡単に解説したい。

「報酬」に基づく意思決定

我々の日常生活を思い浮かべても実感できるように、人間をはじめとする動物の行動は、食べ物やお金などの「報酬」に大きく左右される。報酬の効果を実験によって確かめたのが、20世紀初頭から行われた動物を用いた一連の条件付け実験である。ロシアの生理学者パブロフは、犬にベルを鳴らすのと同時に、餌を与えることを繰り返すと、ベルを鳴らすだけで犬は唾液を出すようになることを発見した。これは後に古典的条件付けと呼ばれる。また、コロンビア大学のソーンダイクは、レバーを押すと外に出られる仕組みの箱の中にネコを入れ、たまたまレバーを押して箱の外に出てエサを食べることができた、という試行錯誤を繰り返すことで、ネコがレバーを押して外に出るまでの時間が短くなることを発見した(Thorndike, 1911)。これは後に道具的条件付けと呼ばれる。ハーバード大学のスキナーは、これらの条件付けを定式化し、報酬の効果を、「ある刺激と報酬を伴う反応との間の連合を強め（強化）、その反応の生起確率の増加をもたらす」と定義した。心理学では、報酬のことを「強化因子」とも言う。報酬は、経済学における「インセンティブ（人の意欲を引き出すために、外部から与える刺激）」とほぼ同意であるといえる。
　実験心理学の分野では、主に動物を対象にして、報酬と行動の関係を調べてきた。具体的には、報酬のスケジュールや量などの属性を変化させることで、それが意思決定にどのように影響を与えるか、またその処理が脳でどのように行われているかを、実験的手法で調べてきた。近年では、人間の被験者に、金銭的報酬を用いて擬似的に経済活動を行っているときの脳活動を非侵襲的な計測手法を用いることで、報酬に関わる人間の脳の働きを明らかにする動きが活発になっていている。非侵襲的手法で近年もっとも普及したのは、機能的核磁気共鳴画像法 (fMRI) であろう。これは、脳内の神経活動に伴う血流変化を、局所磁場の変化から測定し画像化する手法である。

効用関数の脳内表現

実験心理学や生理学の分野でのこれまでの研究において、「報酬の大きさ」「報酬の不確実性」「報酬までの時間遅れ」などが意思決定にかかわる報酬の属性として報告されている。

V = u(outcome)×h(probability)×g(delay)

この式は、経済学で用いられる効用モデルと類似している。つまり、報酬に基づく意思決定の脳機構を調べることは、効用理論の脳内表現を調べることに他ならないといえる。これまでの研究で、このような機能に関わる、いわゆる「報酬系」と呼ばれる脳部位が特定されつつある。

報酬に関わる脳部位

「報酬系」とは、報酬の情報処理に関連する脳部位の総称として用いられている。例えば、ジュースやお金などの報酬を用意し、特定の刺激と報酬の関係を学習させて、正しく反応したら報酬を与えるなど、報酬を得るための様々な実験室的状況を作り出し、その際の脳の様子を測定することで同定される。これまで多くの実験で、線条体と呼ばれる脳の部位が報酬の情報処理に関連するという報告がされている。この線条体という部位は、大脳皮質の内側にある大脳基底核という組織の一部である。線条体は大脳皮質からの入力を受け、それを処理して視床などを経由して皮質に送り返すという役割をしている。また、前頭葉や頭頂葉といった特定の皮質も報酬に関わることが分かっている。線条体はドーパミンニューロン（ドーパミンを作る神経細胞）からの投射を強く受ける部位でもあることから、皮質から線条体を通るネットワークレベルで報酬の情報処理が行われていることが提案されている。

不確実性に関わる脳部位

脳は、確率を読み取り、期待値を計算して、それをもとに意思決定をしている、という脳内メカニズムが明らかになりつつある。カリフォルニア工科大学のCamererらのグループは、確率がわかっている「リスク」と、前章で説明した確率さえ分からない「あいまいさ」を含む選択問題では、脳の異なる場所が活動したことを報告した(Hsu et al., 2005)。またこの他にも、前頭葉の下部、眼窩皮質などいくつかの部位でも、確率を表現するニューロン活動が報告されている (Padoa-Schioppa and Assad, 2006)。

時間選好に関わる脳部位

時間選好という概念はもともと実験心理学から導入された (Ainslie, 1975)。ネズミやハトに、目の前にある餌1粒か、何秒か後にもらえる餌10粒かを選ばせる、といった「異時点間選択問題」によって、割引率を推定する手法が用いられてきた。

これまでの神経科学の実験から、セロトニンという脳内物質が時間選好に関わっていることが、主にラットを対象とした実験で示されてきた (Mobini et al., 2000)。ヒトでも、脳には様々な割引率で報酬を計算している回路が並列的に存在しており、状況に応じた割引率の回路が活動することで、一人の人間が状況に応じて異なる割引率で選択していることを示唆する結果が報告されている (Tanaka et al., 2004; Tanaka et al., 2007)。これは「同じ人間は常に同じ割引率で計算する」というモデルを用いている伝統的経済学では、一見非合理的な行動に見えるが、動的に変化する環境に適応するためには、合理的なシステムではないだろうか。そして、通常は状況に応じて割引率を選択しているシステムが、セロトニンレベルの変化や、回路の損傷によって、近視眼的な計算しかできなくなるなど、偏った行動に陥ることも示唆している。肥満や多重債務などの社会問題と時間割引の関係が指摘されているが、これらを一種の疾患としてとらえ治療することで、問題の解決策や予防を目指すという、脳科学的なアプローチが期待されている。

「社会性」と意思決定

従来の経済理論が仮定する人間と、実際の人間で最も異なる点の一つは、他者の存在を考慮するかどうかだと言える。経済理論上の人間は、自分の利得のみを追求し、効用を最大限にすることを目的とする。しかし私たちは、社会で生きていくなかで、他者に大きく影響を受けている。例えば、同僚が自分より高い収入を得ていると嫌な気持ちになったり、見返りを期待しない寄付や募金などをしたりすることもある。このような社会的な感情や行動を説明しようとする効用モデルが提唱されている。これは、自己の利得しか考慮しなかったモデルに、他人の利得という「社会的効用」の要素を加えたものである。このような、他人の利得を考慮する社会的効用のメカニズムが、神経経済学で調べられている。たとえば、自分と他者の所得の差額が最小で、自分と他者の総額が最大になる選択を選ぶ傾向のある「向社会的」な人は、「不公平」の度合いを情動にかかわる脳部位である扁桃体で判断していること (Haruno and Frith, 2010) など、社会的効用の仕組みが明らかになりつつある。

おわりに

繰り返しになるが、行動経済学は、より人間本位の経済モデルの構築を目指す学問である。神経経済学は、脳科学の手法を用いて、究極の人間本位の経済モデル、つまり「脳の経済モデル」の構築を目指す学問であり、目指すところは同じである。しかし現状は、人間の非合理的な行動にフォーカスするのみで、なぜ非合理的な行動になるのか、というメカニズムの解明までには至っていない。今後は、経済学者は脳を分子レベルから、ネットワークレベルまでの一連の流れを持つ一つのシステムとしてとらえることが、また神経科学者は経済問題への応用が可能な実験パラダイムの開発が必要になるであろう。

引用文献 Ainslie G (1975) Specious reward: a behavioral theory of impulsiveness and impulse control. Psychol Bull 82:463-496. Haruno M, Frith CD (2010) Activity in the amygdala elicited by unfair divisions predicts social value orientation. Nature neuroscience 13:160-161. Hsu M, Bhatt M, Adolphs R, Tranel D, Camerer CF (2005) Neural systems responding to degrees of uncertainty in human decision-making. Science 310:1680-1683. Mobini S, Chiang TJ, Ho MY, Bradshaw CM, Szabadi E (2000) Effects of central 5-hydroxytryptamine depletion on sensitivity to delayed and probabilistic reinforcement. Psychopharmacology 152:390-397. Padoa-Schioppa C, Assad JA (2006) Neurons in the orbitofrontal cortex encode economic value. Nature 441:223-226. Tanaka SC, Doya K, Okada G, Ueda K, Okamoto Y, Yamawaki S (2004) Prediction of immediate and future rewards differentially recruits cortico-basal ganglia loops. Nature neuroscience 7:887-893. Tanaka SC, Schweighofer N, Asahi S, Shishida K, Okamoto Y, Yamawaki S, Doya K (2007) Serotonin differentially regulates short- and long-term prediction of rewards in the ventral and dorsal striatum. PloS one 2:e1333. Thorndike EL (1911) Animal intelligence; experimental studies. New York: The Macmillan Company.

神経経済学

目次