5
回編集
細編集の要約なし |
Yoshiosakurai (トーク | 投稿記録) 細編集の要約なし |
||
3行目: | 3行目: | ||
同義語:道具的条件づけ | 同義語:道具的条件づけ | ||
動物(人間を含む)が自発した反応の直後に報酬など特定の刺激を与えることで、その反応が生起する頻度を変化させる手続きであり、アメリカの心理学者スキナー(B.F. Skinner)が考案した条件づけの手法である。<ref>'''Reynolds'''<br>A Primer of Operant Conditioning<br>''Scott, Freeman and | 動物(人間を含む)が自発した反応の直後に報酬など特定の刺激を与えることで、その反応が生起する頻度を変化させる手続きであり、アメリカの心理学者スキナー(B.F. Skinner)が考案した条件づけの手法である。<ref>'''Reynolds'''<br>A Primer of Operant Conditioning<br>''Scott, Freeman and Company, Glenview'':1975(浅野俊夫訳、オペラント心理学入門、サイエンス社(東京)、1978</ref>。動物にさまざまな課題を訓練するための方法として広く活用されている。 | ||
== 基本的な用語と手続き == | == 基本的な用語と手続き == | ||
条件づけの対象とする自発反応をオペラント反応またはオペラント行動、その直後に与える報酬などの刺激を強化子(reinforcer)、強化子を与える操作を強化(reinforcement)と呼ぶ。オペラント条件づけの基本は、オペラント反応-強化子の関係(強化随伴性contingency of reinforcement)を設定し操作することである。報酬のように、与えることで反応の生起頻度を増大させる強化子を正の強化子(positive reinforcer)、嫌悪性の刺激(嫌な匂いや暗闇など)のように、それを取り去ることで反応の生起頻度を増大させる強化子を負の強化子(negative reinforcer)と呼ぶ。例えばラットにレバー押し反応を行わせるためには、レバー押しというオペラント反応と餌という正の強化子の間に強化随伴性を形成し訓練することになる。訓練を効率的に進める上でもっとも肝心な手続きは、オペラント反応の直後に強化子を与えること(即時強化 immediacy of reinforcement)である。 | |||
なお、オペラント反応の直後に与えることでその生起頻度を減少させる刺激は、強化子ではなく罰(punishment)と呼ばれる。レバー押しの後に罰として電気ショックを与えると、当然ラットはその後レバーを押さなくなる。罰を用いると、動物は実験事態そのものを嫌悪するようになり訓練が進まなくなることも多いため、特別な目的がない限り用いない方が望ましい。 | なお、オペラント反応の直後に与えることでその生起頻度を減少させる刺激は、強化子ではなく罰(punishment)と呼ばれる。レバー押しの後に罰として電気ショックを与えると、当然ラットはその後レバーを押さなくなる。罰を用いると、動物は実験事態そのものを嫌悪するようになり訓練が進まなくなることも多いため、特別な目的がない限り用いない方が望ましい。 | ||
13行目: | 13行目: | ||
== 強化スケジュール == | == 強化スケジュール == | ||
オペラント反応を1回ごとに強化する手続きを連続強化(continuous reinforcement)、反応の回数や時間間隔ごとに強化する手続きを部分強化(partial reinforcement)と呼ぶ。条件づけの後、強化をやめてしまうと反応は次第に生じなくなり消去(extinction)するが、あらかじめ部分強化で条件づけすると、強化をやめても反応はなかなか消去せず持続することがわかっている。この持続性を消去抵抗(resistance to | オペラント反応を1回ごとに強化する手続きを連続強化(continuous reinforcement)、反応の回数や時間間隔ごとに強化する手続きを部分強化(partial reinforcement)と呼ぶ。条件づけの後、強化をやめてしまうと反応は次第に生じなくなり消去(extinction)するが、あらかじめ部分強化で条件づけすると、強化をやめても反応はなかなか消去せず持続することがわかっている。この持続性を消去抵抗(resistance to extinction)と呼ぶ。 | ||
部分強化の方式を強化スケジュール(schedule of reinforcement)と呼び、大きく、定率(fixed ratio FR)、変率(variable ratio VR)、定間隔(fixed interval FI)、変間隔(variable interval VI)の4つの基本スケジュール分けることができる。その違いにより、オペラント反応が生起する頻度やパターンが異なる。FRスケジュールは、一定の反応数が生起したとき強化する方式であり、例えばレバーを3回押したら強化する(FR3)などである。この方式ではオペラント反応がコンスタントに生起し続ける。日常生活では出来高払いの給与などが例となる。VRスケジュールは、何回目の反応で強化するかはその都度ランダムに変動するが、平均してある反応数が生起したとき強化する方式である。例えばレバーを1~5回押したら(平均3回)強化する(VR3)などである。反応が常に高頻度で生起するという特徴があり、消去抵抗がもっとも高い。ほとんどのギャンブルがVRで強化されている。FIスケジュールは、一定時間が経過した後の反応を強化する方式であり、たとえば先の強化から10秒経った後の反応を強化する(FI10秒)などである。設定された時間が近づくにつれ徐々に反応の生起頻度が上がるというパターンを生む。実社会では、時間給、週給、月給などが相当する。VIスケジュールは、いつ反応を強化するかはその都度ランダムに変動するが、平均してある時間が経過した後に生起した反応を強化する方式である。先の強化から5~15秒(平均10秒)経った後の反応を強化する(VI10秒)などである。反応の生起頻度は低いが安定して生じ続けるという特徴がある。釣りなどがその例とされている。 | 部分強化の方式を強化スケジュール(schedule of reinforcement)と呼び、大きく、定率(fixed ratio FR)、変率(variable ratio VR)、定間隔(fixed interval FI)、変間隔(variable interval VI)の4つの基本スケジュール分けることができる。その違いにより、オペラント反応が生起する頻度やパターンが異なる。FRスケジュールは、一定の反応数が生起したとき強化する方式であり、例えばレバーを3回押したら強化する(FR3)などである。この方式ではオペラント反応がコンスタントに生起し続ける。日常生活では出来高払いの給与などが例となる。VRスケジュールは、何回目の反応で強化するかはその都度ランダムに変動するが、平均してある反応数が生起したとき強化する方式である。例えばレバーを1~5回押したら(平均3回)強化する(VR3)などである。反応が常に高頻度で生起するという特徴があり、消去抵抗がもっとも高い。ほとんどのギャンブルがVRで強化されている。FIスケジュールは、一定時間が経過した後の反応を強化する方式であり、たとえば先の強化から10秒経った後の反応を強化する(FI10秒)などである。設定された時間が近づくにつれ徐々に反応の生起頻度が上がるというパターンを生む。実社会では、時間給、週給、月給などが相当する。VIスケジュールは、いつ反応を強化するかはその都度ランダムに変動するが、平均してある時間が経過した後に生起した反応を強化する方式である。先の強化から5~15秒(平均10秒)経った後の反応を強化する(VI10秒)などである。反応の生起頻度は低いが安定して生じ続けるという特徴がある。釣りなどがその例とされている。 |
回編集