「目的指向行動」の版間の差分

目的指向行動 (ソースを閲覧)

2023年5月11日 (木) 08:44時点における版

102 バイト除去、 2023年5月11日 (木)

細

編集の要約なし

WikiSysop

ビューロクラット、管理者

15,998

回編集

@@ 11行目: / 11行目: @@
 == 定義 ==
-　目的指向行動とは、ある行動とその結果の関連性を学習する[[Response-Outcome連合学習|<u>R</u>esponse-<u>O</u>utcome (R-O)連合学習]]により形成される行動であり、目的達成のための意思決定の下、遂行される。該当する行動の範囲は広く、「テレビを見るためにリモコンスイッチを押す」といった単純な動作から、「大学合格のために勉強をする」といった長期的な目標へ向けた複雑な認知/行動プロセスを必要とするものまで多様である。また（一方？）、自転車の運転など、意識的な制御をあまり必要としない技能や習慣行動も、行動の学習初期は意識的な目的指向行動として学習され、その後反復して行うことでより自動的な応答として確率されると考えられている。この場合、自動的な応答の確率には、特定の状況刺激と行動の連関([[Stimulus-Response連関|<u>S</u>timulus-<u>R</u>esponse relationship]])の学習（S-R連合学習）が行われていると考えられている。多くの場合、R-O連合学習により形成される目的指向行動と、S-R連合学習により形成される[[習慣行動]]は対をなす概念として議論される。
+　目的指向行動とは、ある行動 (response)とその結果(outcome)の関連性を学習する[[Response-Outcome連合学習|<u>R</u>esponse-<u>O</u>utcome (R-O)連合学習]]により形成される行動であり、目的達成のための意思決定の下、遂行される。該当する行動の範囲は広く、「テレビを見るためにリモコンスイッチを押す」といった単純な動作から、「大学合格のために勉強をする」といった長期的な目標へ向けた複雑な認知/行動プロセスを必要とするものまで多様である。また、自転車の運転など、意識的な制御をあまり必要としない技能や習慣行動も、行動の学習初期は意識的な目的指向行動として学習され、その後反復して行うことでより自動的な応答として確率されると考えられている。この場合、自動的な応答の確率には、特定の状況刺激 (stimulus)と行動 (response)の連関([[Stimulus-Response連関|<u>S</u>timulus-<u>R</u>esponse relationship]])の学習（S-R連合学習）が行われていると考えられている。多くの場合、R-O連合学習により形成される目的指向行動と、S-R連合学習により形成される[[習慣行動]]は対をなす概念として議論される。
 == 特徴 ==
 === 行動選択の柔軟性 ===
-　多くの場合、R-O連合学習では選択可能な行動のうち、様々な条件においてどの行動をとることが目的達成への最適解か、という[[心的モデル]]が形成されると考えられている<ref name=Dolan2013><pubmed>24139036</pubmed></ref>。こうしたモデルは、現在の状況から目標へのナビゲーションを行うといった点から、[[wj:エドワード・トールマン|Tolman]]が提唱した心的な空間表象に倣って[[認知地図]](cognitive map)と呼ばれる<ref name=Tolman1948><pubmed>18870876</pubmed></ref>。（または、行動と想定される結果を網羅的に樹形図として表わした[[決定木]](decision tree)と呼ばれる場合もある。）目的指向行動を実行する際は、こうした心的モデルから状況に合わせた最適な行動が選択されるため、状況の変化に応じて行動を柔軟に変化させることができる。また、既存のモデルから逸脱した結果が得られた場合には、新しいR-O連関の学習、モデルの切り替えを柔軟に行うことができる。
+　多くの場合、R-O連合学習では選択可能な行動のうち、様々な条件においてどの行動をとることが目的達成への最適解か、という[[心的モデル]]が形成されると考えられている<ref name=Dolan2013><pubmed>24139036</pubmed></ref>。こうしたモデルは、現在の状況から目標へのナビゲーションを行うといった点から、[[wj:エドワード・トールマン|Tolman]]が提唱した心的な空間表象に倣って[[認知地図]] ([[cognitive map]])と呼ばれる<ref name=Tolman1948><pubmed>18870876</pubmed></ref>。（または、行動と想定される結果を網羅的に樹形図として表わした[[決定木]](decision tree)と呼ばれる場合もある。）目的指向行動を実行する際は、こうした心的モデルから状況に合わせた最適な行動が選択されるため、状況の変化に応じて行動を柔軟に変化させることができる。また、既存のモデルから逸脱した結果が得られた場合には、新しいR-O連関の学習、モデルの切り替えを柔軟に行うことができる。
 　例えば、先述の「テレビを見るためにリモコンスイッチを押す」といった行動では、「テレビを見る」という目的達成のためには、「手元のリモコンスイッチを押して電源を入れる」という行動が最適であるが、もしリモコンが壊れていた場合、（テレビ本体にもスイッチがあるという知識があれば）「テレビ本体の電源スイッチを押して電源を入れる」という別解をとることができる。
@@ 28行目: / 28行目: @@
 ==実験的手法 ==
-　目的指向行動の実験的な評価は、R-O連合学習の評価（学習・遂行機能の評価）と学習済みの行動における目的指向性の評価（遂行様式の評価）に大別される。R-O学習には、[[オペラント条件づけ]](operant conditioning もしくは 道具的条件づけinstrumental conditioning)を用いた[[強化学習]]法が主に用いられる。強化された行動を示す速度や回数、正確性などからR-O学習機能や学習の効率などが評価される。こうした行動課題の学習・遂行は、[[記憶]]力、[[報酬予測]]・評価能力、注意力、[[衝動性]]など様々な要因の影響を受けるため、目的とする評価項目に合わせて実験パラダイムの工夫が必要である。特に、神経精神疾患患者や病態[[モデル動物]]では、これらの機能自体に障害が認められる場合があり、その場合は強化学習に依存しない試験系の併用によるR-O連合学習障害の原因検証が必要となることもある。
+　目的指向行動の実験的な評価は、R-O連合学習の評価（学習・遂行機能の評価）と学習済みの行動における目的指向性の評価（遂行様式の評価）に大別される。R-O学習には、[[オペラント条件づけ]]([[operant conditioning]]もしくは[[道具的条件づけ]][[instrumental conditioning]])を用いた[[強化学習]]法が主に用いられる。強化された行動を示す速度や回数、正確性などからR-O学習機能や学習の効率などが評価される。こうした行動課題の学習・遂行は、[[記憶]]力、[[報酬予測]]・評価能力、注意力、[[衝動性]]など様々な要因の影響を受けるため、目的とする評価項目に合わせて実験パラダイムの工夫が必要である。特に、神経精神疾患患者や病態[[モデル動物]]では、これらの機能自体に障害が認められる場合があり、その場合は強化学習に依存しない試験系の併用によるR-O連合学習障害の原因検証が必要となることもある。
 　一方で、目的指向性の評価は、連合学習の結果形成された行動が目的指向行動としての特徴を備えているのかどうかを目的指向性と対をなす概念である習慣的行動選択との対比、または心的モデルの有無(model-based/model-free learning)といった文脈で議論されることが多い。心的モデルの有無で議論が行われる場合は、R-O連合学習は心的モデルの形成を伴うことから、多くの場合ではmode-basedの場合を目的指向行動、model-freeの場合を習慣行動と見なしてる。（一方で、model-free=習慣という分類は必ずしも常には成立しないとして、価値判断の有無など、別の指標から習慣行動を分類する試みもなされている<ref name=Miller2019><pubmed>30676040</pubmed></ref>。）
-　目的指向/習慣、model-based/model-freeのいずれの場合も、対立する2つの性質は独立（絶対的なもの？）ではなくスペクトラム状（連続したもの？相対的なもの？）になっており、個体の行動がスペクトラムのどの位置に分布するのか、の相対的評価が主目的となる。こちらの試験においても、記憶力、報酬予測・評価能力、注意力、衝動性などの影響を受けるため、結果の解釈には一定の注意が必要となる。以下、目的指向性の評価に用いられる代表的な試験系を紹介する。
+　目的指向/習慣、model-based/model-freeのいずれの場合も、対立する2つの性質は排反関係ではなくスペクトラム状になっており、個体の行動がスペクトラムのどの位置に分布するのか、の相対的評価が主目的となる。こちらの試験においても、記憶力、報酬予測・評価能力、注意力、衝動性などの影響を受けるため、結果の解釈には一定の注意が必要となる。以下、目的指向性の評価に用いられる代表的な試験系を紹介する。
 === 価値減弱試験 ===
-　目的指向行動の動機である目的（[[報酬]]）の価値を低下させたときに行動の実行が抑制されるかどうかで目的指向性を評価する手法を[[価値減弱試験]](outcome devaluation test)と呼ぶ。例えば、[[オペラント条件づけ]]により、レバーを押すと報酬としてエサが獲得できるという学習を行った個体に対し、レバー押し実験前に報酬のエサを自由に摂食させると、満腹によってエサの報酬価値は相対的に低下する(devaluation)。この条件でレバー押し実験を行った時のレバー押し回数を、devaluationを行っていない条件でのレバー押し回数と比較する。仮に、実験個体のレバー押し行動が目的指向的であった場合、レバー押し行動(response)の動機はエサの獲得という結果(outcome)の相対的価値に依存するため、エサの報酬価値が低下するとレバー押し回数は減少すると予測される。一方で、習慣的にレバー押しを行っていた場合は、レバー押し実験装置への移動という状況刺激(stimulus)に応答してレバー押し行動(response)を行うというS-R連関に従っており、報酬価値の変動には影響されにくい。よって、devaluationによるレバー押し回数の変動は、目的指向行動と比較して小さくなる。
+　目的指向行動の動機である目的（[[報酬]]）の価値を低下させたときに行動の実行が抑制されるかどうかで目的指向性を評価する手法を[[価値減弱試験]](outcome devaluation test)と呼ぶ。例えば、[[オペラント条件づけ]]により、レバーを押すと報酬としてエサが獲得できるという学習を行った個体に対し、レバー押し実験前に報酬のエサを自由に摂食させると、満腹によってエサの報酬価値は相対的に低下する([[devaluation]])。この条件でレバー押し実験を行った時のレバー押し回数を、devaluationを行っていない条件でのレバー押し回数と比較する。仮に、実験個体のレバー押し行動が目的指向的であった場合、レバー押し行動(response)の動機はエサの獲得という結果(outcome)の相対的価値に依存するため、エサの報酬価値が低下するとレバー押し回数は減少すると予測される。一方で、習慣的にレバー押しを行っていた場合は、レバー押し実験装置への移動という状況刺激(stimulus)に応答してレバー押し行動(response)を行うというS-R連関に従っており、報酬価値の変動には影響されにくい。よって、devaluationによるレバー押し回数の変動は、目的指向行動と比較して小さくなる。
 　比較的単純な試験デザインであることから、[[げっ歯類]]でも行いやすい試験方法であり、[[破壊実験]]、[[オプトジェネティクス]]や[[ケモジェネティクス]]を用いた神経活動操作、[[Ca2+インジケーター]]を用いたin vivo神経活動記録などの多くの検討が行われている。[[眼窩前頭皮質]]、[[内側前頭前皮質]]、[[島皮質]]、[[線条体]]、[[視床]]、[[扁桃体]][[基底外側部]]、[[海馬]]など、様々な脳領域がdevaluationに対する感受性に関与することが報告されている<ref name=Gremel2013><pubmed>23921250</pubmed></ref><ref name=Tran-Tu-Yen2009><pubmed>19614748</pubmed></ref><ref name=Smith2012><pubmed>23112197</pubmed></ref><ref name=Hart2016><pubmed>27881782</pubmed></ref><ref name=Parkes2013><pubmed>23678118</pubmed></ref><ref name=Vandaele2023><pubmed>36636348</pubmed></ref><ref name=Bradfield2017><pubmed>28242795</pubmed></ref>。
 === R-O連関変更時の柔軟性の評価 ===
-　学習済みのR-O連関を実験的に変化させた場合に、既存のR-O連関に起因する行動の減弱、および新しいR-O連関の学習が認められるか否かで柔軟性/固執性を評価する。目的指向行動では、行動に対して予測した結果が得られなかったり、学習した行動が取れなくなったりした際に目的達成のために柔軟な行動変化が行われるが、習慣的に行動する個体では行動変化は緩やかである。R-O連関を実験的に変化させる手法は様々であり、選択式課題において正解の選択肢を変化させる[[反転学習]]試験 ([[reversal learning]])試験、学習済みのresponseを起こしてもoutcomeを提示しない[[contingency degradation試験]]（日本語は？）(または[[消去試験]] ([[extinction試験]])、responseを起こさないことによりoutcomeが提示される[[omission試験]]（日本語は？）などが行われる。これらの評価系においても、目的指向性、習慣性の発現には、眼窩前頭皮質、内側前頭前皮質、線条体、扁桃体基底外側部などの関与が報告されている<ref name=Zimmermann2018><pubmed>29326434</pubmed></ref><ref name=Whyte2019><pubmed>30940719</pubmed></ref><ref name=Barker2017><pubmed>29302616</pubmed></ref><ref name=Nadel2021><pubmed>34615966</pubmed></ref><ref name=Parkes2013><pubmed>23678118</pubmed></ref>。
+　学習済みのR-O連関を実験的に変化させた場合に、既存のR-O連関に起因する行動の減弱、および新しいR-O連関の学習が認められるか否かで柔軟性/固執性を評価する。目的指向行動では、行動に対して予測した結果が得られなかったり、学習した行動が取れなくなったりした際に目的達成のために柔軟な行動変化が行われるが、習慣的に行動する個体では行動変化は緩やかである。R-O連関を実験的に変化させる手法は様々であり、選択式課題において正解の選択肢を変化させる[[反転学習]]試験 ([[reversal learning]])試験、学習済みのresponseを起こしてもoutcomeを提示しない[[contingency degradation試験]](または[[消去試験]] ([[extinction試験]])、responseを起こさないことによりoutcomeが提示される[[omission試験]]などが行われる。これらの評価系においても、目的指向性、習慣性の発現には、眼窩前頭皮質、内側前頭前皮質、線条体、扁桃体基底外側部などの関与が報告されている<ref name=Zimmermann2018><pubmed>29326434</pubmed></ref><ref name=Whyte2019><pubmed>30940719</pubmed></ref><ref name=Barker2017><pubmed>29302616</pubmed></ref><ref name=Nadel2021><pubmed>34615966</pubmed></ref><ref name=Parkes2013><pubmed>23678118</pubmed></ref>。
 === Three-Phase Instrumental Learning Task===
 [[ファイル:Asaoka 目的指向行動 Fig1.jpg|サムネイル|'''図1. Three-phase instrumental Learning Task''']]
-　Three-Phase Instrumental Learning Task (Slips-of-Action test) とは、意図した行動とはうっかり違う行動をとってしまう、という[[実行機能]]のエラーを表し、習慣的な行動をとる際に出現しやすい。そこで、認知行動課題におけるSlips-of-Actionの発生を評価することで、被験者の意思決定が目的指向的/習慣的であるかどうかを相対的に評価する。この課題では、既に存在する行動の目的指向性評価ではなく、新たに学習した行動の目的指向性/習慣性の評価を行うものであり、被験者の意思決定特性(連合学習が行われる際にR-O連関、S-R連関のどちらが優位であるか)の評価として行われる。
+　[[Three-Phase Instrumental Learning Task]] ([[Slips-of-Action test]]) とは、意図した行動とはうっかり違う行動をとってしまう、という[[実行機能]]のエラーを表し、習慣的な行動をとる際に出現しやすい。そこで、認知行動課題におけるSlips-of-Actionの発生を評価することで、被験者の意思決定が目的指向的/習慣的であるかどうかを相対的に評価する。この課題では、既に存在する行動の目的指向性評価ではなく、新たに学習した行動の目的指向性/習慣性の評価を行うものであり、被験者の意思決定特性(連合学習が行われる際にR-O連関、S-R連関のどちらが優位であるか)の評価として行われる。
 　主に[[ヒト]]もしくは非ヒト[[霊長類]]の試験で用いられる課題であり、モニターに表示された画像に応じて手元のスイッチ(左右２つ)を押し分けることで報酬を獲得するという基本パラダイムの下、３つの段階により進行する<ref name=Gillan2011><pubmed>21572165</pubmed></ref>。
@@ 73行目: / 73行目: @@
 　上述の通り、眼窩前頭皮質や前頭前皮質、背内側線条体の活動性と目的指向的な行動様式の発現の関連性については数多くの報告がなされている<ref name=Tran-Tu-Yen2009><pubmed>19614748</pubmed></ref><ref name=Smith2012><pubmed>23112197</pubmed></ref><ref name=Hart2016><pubmed>27881782</pubmed></ref><ref name=Gillan2011><pubmed>21572165</pubmed></ref><ref name=Delorme2016><pubmed>26490329</pubmed></ref><ref name=Gremel2013 /><ref name=Valentin2007><pubmed>17428979</pubmed></ref><ref name=Yin2005><pubmed>16045504</pubmed></ref><ref name=Barker2017><pubmed>29302616</pubmed></ref>。一方で、各脳領域が関与する段階(R-O学習時に必要か、目的指向性の維持に必要か)や関与様式(神経活動の増加、減少のどちらが目的指向性に寄与するのか)については矛盾した結果も報告されている。例えば、眼窩前頭皮質に関しては、活動抑制によりdevaluation試験おける目的指向性が障害されるという報告と、活性化により[[contingency degradation試験]]における目的指向性が障害されるという報告の両方が存在する<ref name=Gremel2013><pubmed>23921250</pubmed></ref><ref name=Duan2021><pubmed>34171290</pubmed></ref>。こうした矛盾する結果の要因としては。試験デザインや動物種などが考えられる。先述の通り、目的指向行動の評価試験系はバリエーションが大きいため、注意して考察を行う必要がある。
-== 神経精神疾患による目的指向行動の障害 ==
+== 神経精神疾患での障害 ==
-=== 目的指向行動の実行面での障害 ===
+=== 実行面での障害 ===
 　[[アルツハイマー病]]や[[パーキンソン病]]のような[[神経変性疾患]]、[[脳梗塞]]や[[頭部外傷]]などの脳損傷によって[[前頭皮質]]機能に異常がおこると、多くの場合で目的指向行動の実行に障害が発生する。例えば、[[アパシー]]([[apathy]])と呼ばれる症状では、行動への動機づけがうまく行われず、目的指向行動の実行自体が減少する<ref name=Levy2006><pubmed>16207933</pubmed></ref>。前頭皮質は目的指向行動の遂行機能(executive function)にも関与しており、この機能が障害されると、目的指向行動を実行しようとする意図はあるが、計画的、効率的に実行することが困難となる<ref name=Friedman2022><pubmed>34408280</pubmed></ref>。