「ドリフト拡散モデル」の版間の差分

2021年6月25日 (金) 16:52時点における版

片平健太郎
国立研究開発法人産業技術総合研究所人間情報インタラクション研究部門
国里愛彦
専修大学人間科学部心理学科

英語名：drift diffusion model

類義語：逐次サンプリングモデル (Sequential sampling model)

ドリフト拡散モデルは，刺激呈示から反応が起こるまでの意思決定プロセスを説明する数理モデルの一つである。反応選択と反応時間の分布を説明するモデルとして，心理学や神経科学の研究において幅広く用いられている。その性質は確率過程に関する数学的理論や計算機シミュレーションにより詳細に調べられている。実際の反応データからモデルのパラメータを推定することも可能であり，パラメータの個人差や群間差を定量化することにも用いられている。また，モデルの振る舞いに類似する神経活動も観測されており，意思決定の神経基盤のモデルとしても注目されている。

ドリフト拡散モデルとは

ドリフト拡散モデルは，刺激呈示から反応が起こるまでの経過時間（反応時間）と反応選択の分布を説明するモデルである。ドリフト拡散モデルは，Ratcliff (1978) が提案し，心理学や神経科学における反応時間のモデリングにおいて，幅広く用いられている　^[1]。

ドリフト拡散モデルは，逐次サンプリングモデル（Sequential sampling model）の一種である。逐次サンプリングモデルでは，刺激が呈示されると生体は時間経過とともに確率的に情報を蓄積していき，その蓄積が境界を越えた時に反応が出力されると仮定する。図1に示すように，行動課題を実施した際に，反応までにかかる時間は，(1)刺激の読み込み，(2)エビデンス（判断を下すのに必要な情報）の蓄積，(3)反応（ボタン押しなどの運動）に分解することができる。(1)刺激の読み込みと(3)反応は，判断に関わる過程ではないので，非決定時間(Non decision time)と呼ばれる。(2)エビデンスの蓄積は，決定時間(Decision time)と呼ばれる。ドリフト拡散モデルをはじめとする逐次サンプリングモデルを用いることで，非決定時間の推定と決定時間の生成に関わるパラメータの推定を行うことができる。

ドリフト拡散モデルにおけるエビデンスの蓄積過程は，開始点 $z$ から始まり，一定のドリフト率に従ってエビデンスが蓄積される(図1)。そして，境界の $a$ もしくはその反対側の境界までエビデンスが蓄積されると反応が出力される。図1の場合， $a$ に到達すると反応Aが出力され，0に到達すると反応Bが出力される。開始点と境界(a)との距離が遠いほど，エビデンスの蓄積にかかる時間が長くなる。また，開始点から境界までの蓄積過程における速度は，ドリフト率にも依存する。ドリフト率が大きいほど，境界まで到達する時間は短くなる。開始点，ドリフト率，境界，そして非決定時間がドリフト拡散モデルの主なパラメータである。

モデルの定式化

ここでは，反応Aと反応Bのいずれかの反応が求められる強制二肢選択課題を想定し，基本的なドリフト拡散モデルを考える。上側の境界を $a$ ，下側の境界を0, 開始点を $z$ とする。上側の境界に決定変数 (decision variable) $x$ が到達した場合，そのタイミングで反応Aが起こり，下側の境界である0に到達したらそのタイミングで反応Bが起こると仮定する。刺激が呈示されてから，刺激情報の読み込みや反応の準備に必要な時間が経過してからエビデンスの蓄積が行われ， $x$ が変化する。エビデンスの蓄積過程は以下の式のように連続時間上で定義される確率過程である，ウィーナー過程 (ブラウン運動) に従うとする。

$dx=vdt+\sigma dW$

ここで， $dx$ は微小な時間間隔 $dt$ の間の $x$ の変化を表す。 $v$ はドリフト率パラメータであり， $v>0$ であれば，反応Aが正解であり， $v<0$ であれば反応Bが正解であるとする。 $\sigma dW$ は平均が0で分散が $\sigma ^{2}dt$ となる正規分布に従うホワイトノイズを表す。ウィーナー過程は連続時間上で定義されるが，計算機上でシミュレーションする場合は，離散時間で近似する必要がある。ここでは理解が容易なシンプルな近似法を考える。微小な時間幅 $\Delta t$ を考え， $\epsilon _{i}$ が平均0, 分散1の標準正規分布に従うとする。この時間幅 $\Delta t$ あたりの変数 $x$ の変化量は，以下の式で記述される。

$\Delta x=v\Delta t+\sigma \epsilon _{i}{\sqrt {\Delta t}}$

この式で $x$ を更新していくことによりエビデンスの蓄積過程をシミュレートできる。図Xはこの計算により得られたものである。

　生体が注意深く反応するほどパラメータ $a$ は大きくなり，境界の間は広がると考えられる。逆に，素早く反応することが求められる場合は $a$ は小さくなる。開始点パラメータ $z$ は刺激に関する事前の期待を表すと考えられる。例えば，反応Aを起こすべき刺激が期待されるときは，このパラメータは大きい ( $a$ に近い) 値をとる。

　標準的なドリフト拡散モデル (Ratcliff, 1978) では，開始点とドリフト率，および非決定時間は，試行間で変動すると仮定される。ドリフト率の試行間変動は，刺激に対する注意の変化などに対応すると考えられ，正規分布に従って変動するとされる。この変動を仮定することで，正反応より誤反応の方が反応時間が長くなるということが説明可能となる。これは，ドリフト率が小さくなる試行において，誤反応が起こりやすくなり，かつ反応時間が長くなるためである。開始点の試行間変動は一様分布に従うと仮定され，ある特定の刺激がどの程度呈示されやすいかについての期待が試行間で変動することを表現する。この変動により，誤反応が起こる試行で反応時間が短くなることが説明できる。なぜなら，開始点が誤反応側の境界に寄っているときに，反応が早くなり，かつ誤反応が起きやすいためである。

　以上のように，標準的なドリフト拡散モデルのパラメータは，開始点(z),開始点の試行間変動幅 ( $s_{z}$ ),ドリフト率の平均( $m_{v}$ )，ドリフト率の標準偏差( $\eta$ ), 境界( $a$ ),非決定時間の平均( $T_{er}$ )，非決定時間の試行間変動( $s_{t}$ )の７つとなる。

反応時間分布および選択確率とモデルパラメータの関係

二つの選択に関する上記のモデルにおいて，各パラメータを固定した場合 (試行間変動は仮定しない場合)，それぞれの選択肢を選ぶ確率，およびその反応時間の分布は次のように解析的に導出される (Ratcliff, 1978)。下側の境界 (0) に到達し，反応Bが起こる確率は，

$x={\frac {-b\pm {\sqrt {b^{2}-4ac}}}{2a}}$

${\frac {e^{B}/\sigma ^{2}}{A}}$

構文解析に失敗 (構文エラー): {\displaystyle \frac{e^{-2 v a / \sigma^2} – e^{- 2 v z / \sigma^2}}{ e^{- 2 v a / \sigma^2} – 1}}

となる。ただしドリフト率 $v$ が0だった場合はこの確率は構文解析に失敗 (構文エラー): {\displaystyle 1 – z/a } となる。さらに，反応Bが起こり，かつその反応時間が $T_{er}+t$ となる条件付きの確率密度関数は

構文解析に失敗 (SVG（ブラウザのプラグインで MathML を有効にすることができます）: サーバー「https://wikimedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \frac{\pi \sigma^2}{a^2} e^{-av/\sigma^2} \sum_{k=1}^\inf k \sin \left(\frac{\pi z k}{a} e^{-\frac{1}{2} (v^2/\sigma^2 + \pi k \sigma^2/a^2) t}}

で与えられる。境界 $a$ に到達し反応Aが起こり，その反応時間が $T_{er}+t$ となる確率密度は，上の式において $v$ を $-v$ で, $z$ を $a-z$ で置き換えることで得られる。図Xの上下の曲線はこれらの式により得られた条件付きの確率密度関数である。シミュレーションにより得た反応時間のヒストグラムもサンプルが増えるにつれてこの関数に近づいていくことがわかる。これらのように解析的に得られる反応時間が実際の反応時間の分布に近づくようにパラメータを調整することで，明示的にドリフト拡散過程をシミュレートせずともモデルのパラメータを推定することができる。また，複数ある候補のモデルからデータをよりよく説明するモデルを選択することも可能となる。パラメータの推定やモデル選択をする作業を総称してモデルフィッティングと呼ぶ。

モデルフィッティング

実験で収集された反応データに対して，モデルフィッティングをする方法として， $\chi ^{2}$ 最小化，最尤法，重み付き最小二乗法，ベイズ推定等がある。(Ratcliff, R., & Tuerlinckx, F. (2002). Estimating parameters of the diffusion model: approaches to dealing with contaminant reaction times and parameter variability. Psychonomic Bulletin & Review, 9(3), 438–481) モデルフィッティング用のソフトウェアとしては，以下がある。

Fast-dm: Voss & Voss (2007)が開発したWindowsで動作するソフト（最尤推定，Kolmogorov-Smirnov， $\chi ^{2}$ 最小化などの方法が可能）
DMAT: Vandekerckhove & Tuerlinckx (2008)が開発した，ドリフト拡散モデル用MATLABツールボックス。
EZ2: Wagenmakers, Van Der Maas, & Grasman(2007)によって提案されたドリフト拡散モデルから施行間変動の推定を除いたシンプルなEZ拡散モデルを用いてモデルフィッティングするRパッケージ
HDDM: Wiecki, Sofer, & Frank(2013)が開発した，ドリフト拡散モデルを階層ベイズ推定するPythonパッケージ
hBayesDM: Ahn, Haines, & Zhang(2017)が開発した，意思決定課題に対して階層ベイズモデリングを行うRパッケージ。ドリフト拡散モデルを使ったモデルフィッティングができる関数が含まれている。
rtdists: ドリフト拡散モデルをはじめとする反応時間のモデリングに有用な関数が含められたRパッケージ。

それぞれのモデルや推定方法には仮定がおかれていることがあり，モデルフィッティングに用いるデータがその仮定に合っているかどうかは事前に確認する必要がある。各種推定法に関する専門家による推奨については，Boehm et al.(2018)にまとめられている。また，ドリフト拡散モデルでのモデルフィッティングにあたっては，十分なデータ数が必要になる。特に反応時間の分布の情報を用いてパラメータ推定する方法の場合は，試行数が100程度の場合は，ドリフト拡散モデルの試行間変動性にかかわるパラメータの推定が真値からずれることが示されている(Vandekerckhove, & Tuerlinckx, 2007)。そのため，試行間変動性にかかわるパラメータの推定を行う場合は，できるだけ多くの試行数が必要になるが，試行数を増やすと参加者の動機づけが低下する，疲れの影響が出る，などの問題も生じる。また，そもそも試行数を増やすことが難しい実験状況も多い(Boehm et al., 2018)。そこで，パラメータ推定にあたり，参加者集団のパタメータの分布も仮定した階層ベイズ推定を行うことで，各参加者の試行数は少なくとも安定した推定する方法も提案されている(Wiecki, Sofer, & Frank, 2013; Ahn, Haines, & Zhang, 2017)。

適用事例

ドリフト拡散モデルを用いることで，反応分布の形状の情報を利用することが可能となり，単純な平均反応時間の解析では取りこぼされていた情報を利用して詳細なプロセスを検討することができる。例えば，開始点パラメータ $z$ を増加させることと，ドリフト率 $v$ を増加させることはいずれも反応Aの選択確率を増加させ，その平均的な反応時間を短くする効果があるが，その反応時間分布の形状に与える影響が異なる。図Xの左では，開始点パラメータ $z$ を固定し，ドリフト率を増加させた場合である (実線が増加後)。この場合，反応Aの確率が高くなり，速い反応時間の密度が増加するため平均反応時間は短くなるが，その分布のピーク (最も密度が高くなる地点) はほとんど変化しない。一方，開始点パラメータ $z$ を $a$ に近づけた場合 (図X右図) は，分布の形状が大きく変わり，反応Aの反応時間分布のピークが速い時間帯にシフトし，分布の歪みが大きくなる。

ヒトやその他の動物の意思決定には，現在の感覚入力や過去の選択の結果のみならず，過去の選択履歴が次の選択に影響することがよく知られている (Akaishi et al.)。同じ選択を繰り返す傾向は選択の慣性 (inertia) や固執性 (perseverance) と呼ばれている。そのような傾向はドリフト拡散モデルではエビデンスの蓄積の開始点にバイアスを与えるという解釈が可能である。しかし，実際の知覚的意思決定課題における選択データにおいては，過去の選択と同じ選択が選ばれる効果は，図X左のように比較的反応が遅い場合でも見られ，そのようなデータは開始点よりはむしろドリフト率が過去と同じ選択をする方向にバイアスがかかるとするモデルでよく説明されることが報告されている (Urai et al.)。この結果は，選択履歴の効果が，知覚的なエビデンスの蓄積過程に影響するということを明らかにしている。

参考文献

↑ Ratcliff, R., Smith, P.L., Brown, S.D., & McKoon, G. (2016).
Diffusion Decision Model: Current Issues and History. Trends in cognitive sciences, 20(4), 260-281. [PubMed:26952739] [PMC] [WorldCat] [DOI]

[1] Ratcliff, R., Smith, P.L., Brown, S.D., & McKoon, G. (2016).
Diffusion Decision Model: Current Issues and History. Trends in cognitive sciences, 20(4), 260-281. [PubMed:26952739] [PMC] [WorldCat] [DOI]

[1]

@@ 45行目: / 45行目: @@
 <math>x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}</math>
-<math>\frac{e^B}{A}</math>
+<math>\frac{e^B/ \sigma^2}{A}</math>
 <math>\frac{e^{-2 v a / \sigma^2} – e^{- 2 v z / \sigma^2}}{ e^{- 2 v a / \sigma^2} – 1}</math>

「ドリフト拡散モデル」の版間の差分

2021年6月25日 (金) 16:52時点における版

目次

ドリフト拡散モデルとは

モデルの定式化

反応時間分布および選択確率とモデルパラメータの関係

モデルフィッティング

適用事例

参考文献

案内メニュー

「ドリフト拡散モデル」の版間の差分

2021年6月25日 (金) 16:52時点における版

ドリフト拡散モデルとは

モデルの定式化

反応時間分布および選択確率とモデルパラメータの関係

モデルフィッティング

適用事例

参考文献

案内メニュー

検索