松本 敦
国立研究開発法人 情報通信研究機構 脳情報通信融合研究センター
DOI:10.14931/bsd.6724 原稿受付日:2016年12月29日 原稿完成日:2016年月日
担当編集委員:伊佐 正(自然科学研究機構生理学研究所)
一段落程度の抄録をお願い致します。
事象関連電位とは
通常、脳が活動している際には脳内に電気的な活動が発生している。頭皮上においた2つの電極から計測されるわずかな電位差を脳波と呼び、これは脳内で起こった電気的活動の一部を計測したものである。脳波は、ある特定の事象、例えば記憶の想起や注意の方向の変化、視覚刺激や聴覚刺激の特徴抽出に際して特有の変化を起こす場合がある。
事象関連電位(Event-Related Potentials; ERP)とは、そのようなある特定の事象に関連して発生する脳波の総称である。事象関連電位という言葉をその字義通りに考えてみれば、「ある特定の出来事(事象)に関連して発生する一過性の脳波」であるが、最近では加算平均法によって得られたものを事象関連電位と呼ぶのが普通である。例えば、特定の視覚刺激を呈示し、その際の脳波を記録すると刺激呈示後100-200msの間に波形の変化を観察できるが単一の試行では多くのノイズに埋もれて観察が難しいため、複数回(数十回)刺激を呈示し、刺激呈示のオンセットに合わせた脳波を試行分切り出してきて加算平均することによって、ランダムに発生するノイズは相殺されて全試行において現れる振動(deflections)が残り、これを事象関連電位と呼ぶ。
事象関連電位は知覚や認知処理に対応して出現し、これらの処理の過程を検討するための有用な指標として、心理学や神経科学分野で頻繁に用いられてきた。一つの課題の中では複数の波の振れが観察され、この振れのことを一般的には成分と呼び、多くの成分には特定の名前が付けられて検討されることが多い。例えばoddball課題と呼ばれる課題で得られる刺激呈示後300msあたりに頂点を持つ極性がプラス(陽性)の成分はP300と呼ばれる。また、単語処理に関わる成分で有名なものはN400と呼ばれる成分である。ここでいうPやNはそれぞれPositiveとNegativeを表しており、振れの極性を表している。すなわち、極性が陽性(+)ならPではじまる成分名を、陰性(-)ならばNではじまる成分名を持つ。PやNの後に続く数字はその成分が見られる潜時を表すことが多い。つまり、P300というのは刺激提示後300ms近辺に頂点を持つ陽性成分ということになる。また、振れが現れる順番をとってP1やN2などと名をつけることもある。N2というのは2番目に現れた陰性成分という意味である。各成分はそれぞれ固有の頭皮上分布と課題に対する反応を持ち、これらの成分の振る舞いを検討することによって認知処理を推測していくことになる。新しい課題を用いて事象関連電位を検討する場合にはまずターゲットをどの成分において検討するのかを決めておくと、効率よくデータを解釈することができるだろう。
事象関連電位の計測に関してはこれまでの研究からどのように計測するべきかという方法論が確定しているといっても言い過ぎではない。Society for Psychophysiological Researchが2000年に発表した「ヒトの事象関連電位を認知研究に利用するためのガイドライン」では事象関連電位計測、解析、結果の解釈まで網羅的にまとめられており、このガイドラインの通りに計測や解析を行えばまず間違いはない。また、入戸野[1]は事象関連電位研究において必要となる知識が詳しい説明とともに網羅されており、事象関連電位研究を行う前には一読しておくことを薦める。最近では事象関連電位解析はオープンソースのフリーソフトで行われることが多くなってきた。その中でもよく使われているのはカリフォルニア大学サンディエゴ校が提供しているEEGLABであるが、開・金山[2]ではその使用法や理論的背景を初学者にもわかりやすく概説しており、参考になる。
発生のメカニズム
事象関連電位の発生に関しては最近の研究からいくつかの生理学的なモデルが考えられている。
一つ目は従来から考えられていたモデルで、脳波中の事象関連電位成分が課題に関連して時間的に同期して発生するというものである。ランダムに発生するノイズに信号は埋もれている。加算平均によってこの信号は姿を現す。この場合は加算平均によって消される「ノイズ」は認知処理とは全く関係なく発生しているものと考え、生理学な意味を持つ活動からは切り離して考える。
二つ目の考え方では、ノイズは全くランダムに発生し、生理学的に意味を持たない振れではなく、脳内の特定の部位から発生しているoscillationの特異な形であると想定する。特定の周波数の振れがあるイベント(刺激の呈示など)が起こることで時間を同じくしてリセットされ位相が瞬間的にそろう。その結果として加算平均した時に成分として検出されるというものである。3つ目のモデルは1つ目と2つ目のモデルを合わせたようなものであり、イベントによってoscillationがリセットされ位相がそろうと同時にその振幅が増強し、大きな成分として観察されるというモデルである。
もちろんこれらのモデルは相互に排他的なものではなく、特定のモデルが正しく、どれかが間違っているということではない。
長所と短所
当然のことだが、事象関連電位を用いた研究には利点もあれば欠点もある。
利点
事象関連電位の最大の利点はその研究量の豊富さからくる研究結果の蓄積である。例えば、ある課題においてある特定の成分が注意の配分量を反映することが明らかになれば、以後の研究ではその成分を注意割り当ての指標として使うことが可能になる。これまでの長い研究の歴史から、各事象関連電位成分の特徴については多くのことが明らかになっており、心理学的な問題を検討する際の「指標」としてのアドバンテージはとても大きく、事象関連電位が心理学的研究で用いられる所以である。また、加算平均法はノイズと信号の非である信号雑音非(signal-noise ratio; s/n比)に優れ、頑健なデータが得られやすいという点も大きな利点である。さらに、事象関連電位はデータ量、算出のための計算量ともに小さく、解釈を単純化しやすく、比較的手軽に扱える脳機能データである点も魅力である。
欠点
一方、欠点としては、
- 位相のそろわない成分の検討が不可能である点
- 20Hz以上の高周波成分の検討が不可能である点
の2つが挙げられる。1.の理解に関しては、evokedな成分とinducedな成分という考え方を知る必要がある。加算平均法ではイベントに対して常に特定の時間帯に特定の位相で出現する成分のみが抽出される。このような成分はevokedな成分と呼ばれ、イベントに対して特定の時間に出現するが、位相はランダムである成分(inducedな成分と呼ばれる)とは別に考えられる。加算平均法ではinducedな成分は「ノイズ」としてキャンセルされてしまうため、これを検討するためには時間-周波数解析を行う必要がある。
また2.の高周波成分に関しては、evokedな反応であれば加算平均法によってキャンセルされることはないが、事象関連電位上での定量化が難しく、現実的には検討は不可能である。Inducedな成分、高周波成分ともに認知処理との関連で近年大きな注目を浴びており、無視してしまうのは非常にもったいない。このような成分を検討するには事象関連電位を算出すると同時に時間-周波数解析を行い、データを多面的に検討する必要があるだろう。
代表的な事象関連電位成分
視覚誘発電位
visual evoked potentials; VEP
VEPは様々な視覚刺激によって惹起される後頭部優位の事象関連電位成分の総称である。後頭葉の視覚野に起源をもつと考えられており、200msくらいまでの比較的早い潜時で観察される。VEPは様々な成分を含み、その潜時や呼び方も呈示された刺激の特性によって異なる。
C1
もっとも初期にみられる成分は後頭部に刺激提示後65-85msに現れる陰性成分である。Jeffreys[3]は後頭中心部に見られる陰性成分をC1と名付けている。この陰性成分の頭皮上分布は刺激の網膜上の位置に対応し、その特性から一次視覚野(V1)の活動を反映していると考えられている[4] [5] [6]。
P1
C1の後に観察されるのは刺激提示後70-130ms付近に現れる陽性成分P1である。P1成分も極初期の視覚処理を反映していると考えられるが、V1よりは高次な有線外皮質(extrastriate cortex)に起源をもつと考えられている。Hillyard et al.[7]によれば、この成分は選択的注意の影響を受け、注意によってその振幅が増強する最初の成分であるが、近年の研究ではP1より前のC1成分にすでに注意の影響が表れるという報告もある[8]。
N1
P1の後(130-200ms)には後側頭領域において大きな陰性成分が観察され、N1成分と呼ばれる。N1の信号源は高次視覚野に存在すると考えられている。N1の振幅と潜時は呈示された刺激のもつ情報に影響を受け、この時点で多くの刺激の特徴弁別が行わることを示している。例えば、顔刺激を提示した際には、特に右半球においてこのN1成分が増強し、N170という名前で呼ばれることが多い。また、このN170は文字刺激に対しては左半球で増強することが知られている。この成分の活動源は紡錘状回の顔領域や文字領域に存在すると考えられており、顔や文字の物理的特徴を符号化していると考えられている。
聴覚誘発電位
auditory evoked potentials; AEP
聴覚刺激によって惹起される成分は聴覚誘発電位と呼ばれる。もっとも早く観察されるAEPは聴性脳幹反応(ABR)と呼ばれる。聴性脳幹反応はクリック音提示から10-12ms後に観察される7つの電位で構成される。聴性脳幹反応は個体間の変動が少なく、麻酔や睡眠の影響をほとんど受けず、比較的簡単に脳深部の電気活動を得られるため臨床検査に用いられることがある。異常が発生するとこれらの成分は潜時が遅れたり消失したりし、障害によってその挙動は変化する。従って聴性脳幹反応の変化からその障害を推定することが可能である。聴性脳幹反応に続く10-50ms区間ではいくつかの成分が観察される(N0、P0、Na、Pa、Nb)。
発生源は側頭葉にある聴覚領域のヘッシェルの横側頭回や視床ではないかと考えられている。刺激後100-200msには大きな陰性と陽性の成分が観察される。N1やP2と呼ばれるこの成分はNaatanen & Picton[9]によれば6種類の下位成分によって構成される[10]。これらの成分は刺激強度や周波数の増加といった刺激の物理的特徴に対して敏感に反応するという点で、内的な要因によって変化する後述のミスマッチ陰性電位とは区別して考えられている。なお、これらの成分は視覚刺激によって惹起するN1やP1成分とは別物である。
ミスマッチ陰性電位
mismach negativity; MMN
Naatanen et al. [11]は、高い音と低い音を1:9の割合でランダムに被験者に呈示した。被験者は時折呈示される低頻度音でも高頻度音でもないターゲット音に対して反応することを求めた。この様な課題はoddball課題と呼ばれる。すると、低頻度刺激呈示条件では高頻度呈示条件に比べて、刺激提示後200ms近辺で陰性の成分が観察され、この成分はミスマッチ陰性電位と名付けられた。(編集部コメント:「すると、」が若干おかしいような気がします)
ミスマッチ陰性電位は刺激に対して注意を向けているか向けていないかに関係なく惹起され、自動的で受動的な脳の定位反応成分と考えられている。ミスマッチ陰性電位は聴覚刺激のみで反応するわけではなく、視覚刺激の逸脱に対しても反応し、各感覚モダリティーに特異的に観察されると考えられる。ミスマッチ陰性電位に関しては、先行刺激の記憶痕跡との照合過程を反映するという説や予測コードとの照合のエラーを反映するという説などが提唱されているが、現状ではまだ議論があるところである。
P300
P300(P3と呼ばれることもある)はもっとも有名な事象関連電位成分といってもいいかもしれない。Sutton et al. [12]によって発見されたこの成分は、一般的にはoddball課題で観測され、検討されることが多いが、内的な判断を求めるほとんどの課題で観察される。
P300は頭頂中心部で最大になり、潜時は300msから900msくらいにまで延長することもある。一般的に潜時は課題が簡単であれば短くなり、課題が難しく判断に時間がかかるほど長くなる。Makeig et al.[13]では、P300はボタン押し反応の直後にピークを迎えているのが見て取れる。このことからP300は「刺激評価時間の指標」としてよく使用される。ボタン押しなどの直接の反応を求めなくても、P300の潜時を見ることで処理の終了を知ることができるからである。P300がどのような認知的処理を反映するのかは諸説あるが、一時形成された作動記憶(ワーキングメモリ)内の情報の更新や注意の割り当てなどを反映すると考えられている。
ただし、P300は複数の領域から発生している活動の複合波であって、単一の処理だけを反映していると考えるのはおそらく正しくない。一般的にP300と呼ばれるのはP3bと呼ばれる頭頂中心部の陽性成分であるが、これよりも若干早い潜時で前頭部で最大になるP3aという成分があることは古くから知られていた[14]。さらにMakeig et al.[13]は独立成分分析(ICA)を用いて、P300が観察される潜時帯には少なくとも8つの陽性成分が存在していることが明らかにしている。
P300は多くの課題で観察され、頭皮上の広い部位から計測されるが、それは一つの活動源から発生した活動が体積伝導で計測されたものだけではなく、複数の活動源から発生した成分が重畳している可能性があることを考慮にいれる必要があるだろう。
後期陽性複合
Late Positive Complex; LPC
記憶や感情、言語処理など高次な処理を行うような課題で観察される長潜時の陽性成分は後期陽性複合と呼ばれる。その潜時からP600と呼ばれることもある。Rugg[15]によれば後期陽性複合の振幅は記憶における相対的熟知度を反映する。
例えば、記憶実験では学習項目に含まれない新刺激(NEW)は含まれていた旧刺激(OLD)と比較して小さな後期陽性複合を惹起させる。Van Petten et al.[16]によれば、この成分は意味やエピソードといった情報を長期記憶から取り出し、ワーキングメモリ内での情報を統合するのを反映するとされる。この考え方は前述のP300の解釈とよく似ており、後期陽性複合を時間的に遅れて惹起したP300であると捉える考え方である。実際、後期陽性複合は多くの点でP300と共通点を持つ。感情研究においては画像や単語刺激などに対して事象関連電位を計測すると、感情価を含まない刺激と比較して感情価を含む刺激では後期陽性複合振幅は大きくなる。これは、感情価を含む刺激の方が含まない刺激と比較してより多くの注意資源を割り当て、より多くの処理を行うためであるからと考えられる[17]。この解釈でも同様に後期陽性複合をより遅く、そして長く発達したP300であると捉えている。
一方で、言語研究では後期陽性複合はよりアクティブな役割が想定され、特に統語的(文法的)な処理に重要な役割を果たしていると解釈されている[18]。このように後期陽性複合は統一的な解釈によって説明されるよりもむしろ、その研究分野に合わせて説明されることが多い。従って、後期陽性複合を理解し解釈するためにはその研究分野でどのように解釈されているかを事前に充分調べる必要があるといえるだろう。また、P300と同様、後期陽性複合は多くの成分の複合波であることも考慮に入れる必要がある。
N400
P300やミスマッチ陰性電位は刺激の持つ物理的な逸脱に対して惹起するが、N400では刺激の持つ意味的な逸脱に対して惹起する。
Kutas & Hillyard[19]は被験者に対して文を構成する7つの単語を1秒間隔で次々に呈示し、(例 It was his first day at work.)その時の事象関連電位を計測した。すると意味的に逸脱した単語を呈示すると(例 He spread the warm bread with socks.)最後の意味的に逸脱した単語に対して刺激提示後400ms近辺で頂点を持つ大きな陰性成分が観察され、この成分はN400と名付けられた。
N400は意味的逸脱だけでなく世の中に対する一般的な知識における逸脱にも惹起されることが示されている[20]。またこの成分は単語を単独で呈示した際にも観察され、反復プライミングや意味プライミングによってその振幅は減少する。このことからN400に関してはいくつかの機能的仮説が提唱されている。ひとつは単語の意味表象に対するアクセスを反映するという仮説と意味的な文脈統合に関係するという仮説である。しかし、P300と同じようにN400は複数の信号源から発生する複数の成分からなる複合波であり、複数の処理と対応していると考えるのが妥当である。
参考文献
- ↑ 入戸野宏
心理学のための事象関連電位ガイドブック
北大路書房 2005 - ↑ 開一夫・金山範明(編)
脳波解析入門
東京大学出版会 2016 - ↑
Jeffreys, D.A., & Axford, J.G. (1972).
Source locations of pattern-specific components of human visual evoked potentials. I. Component of striate cortical origin. Experimental brain research, 16(1), 1-21. [PubMed:4646539] [WorldCat] [DOI] - ↑
Gomez Gonzalez, C.M., Clark, V.P., Fan, S., Luck, S.J., & Hillyard, S.A. (1994).
Sources of attention-sensitive visual event-related potentials. Brain topography, 7(1), 41-51. [PubMed:7803199] [WorldCat] - ↑ Clark VP, Fan S, Hillyard SA.
Identification of early visual evoked potential generators by retinotopic and topographic analyses.
Hum Brain Mapp, 2, 170-187. 1995 - ↑
Di Russo, F., Martínez, A., Sereno, M.I., Pitzalis, S., & Hillyard, S.A. (2002).
Cortical sources of the early components of the visual evoked potential. Human brain mapping, 15(2), 95-111. [PubMed:11835601] [WorldCat] - ↑
Hillyard, S.A., Vogel, E.K., & Luck, S.J. (1998).
Sensory gain control (amplification) as a mechanism of selective attention: electrophysiological and neuroimaging evidence. Philosophical transactions of the Royal Society of London. Series B, Biological sciences, 353(1373), 1257-70. [PubMed:9770220] [PMC] [WorldCat] [DOI] - ↑
Kelly, S.P., Gomez-Ramirez, M., & Foxe, J.J. (2008).
Spatial attention modulates initial afferent activity in human primary visual cortex. Cerebral cortex (New York, N.Y. : 1991), 18(11), 2629-36. [PubMed:18321874] [PMC] [WorldCat] [DOI] - ↑
Näätänen, R., & Picton, T. (1987).
The N1 wave of the human electric and magnetic response to sound: a review and an analysis of the component structure. Psychophysiology, 24(4), 375-425. [PubMed:3615753] [WorldCat] [DOI] - ↑ 諸富隆・沖田庸嵩
事象関連電位 宮田洋(監修) 藤沢清 柿木昇治 山崎勝男(編)
新生理心理学1巻 北大路書房 104-123. 1998 - ↑
Näätänen, R., Gaillard, A.W., & Mäntysalo, S. (1978).
Early selective-attention effect on evoked potential reinterpreted. Acta psychologica, 42(4), 313-29. [PubMed:685709] [WorldCat] [DOI] - ↑
Sutton, S., Braren, M., Zubin, J., & John, E.R. (1965).
Evoked-potential correlates of stimulus uncertainty. Science (New York, N.Y.), 150(3700), 1187-8. [PubMed:5852977] [WorldCat] [DOI] - ↑ 13.0 13.1
Makeig, S., Delorme, A., Westerfield, M., Jung, T.P., Townsend, J., Courchesne, E., & Sejnowski, T.J. (2004).
Electroencephalographic brain dynamics following manually responded visual targets. PLoS biology, 2(6), e176. [PubMed:15208723] [PMC] [WorldCat] [DOI] - ↑
Katayama, J., & Polich, J. (1998).
Stimulus context determines P3a and P3b. Psychophysiology, 35(1), 23-33. [PubMed:9499703] [WorldCat] - ↑
Rugg, M.D. (1990).
Event-related brain potentials dissociate repetition effects of high- and low-frequency words. Memory & cognition, 18(4), 367-79. [PubMed:2381316] [WorldCat] [DOI] - ↑
Petten, C.V., Kutas, M., Kluender, R., Mitchiner, M., & McIsaac, H. (1991).
Fractionating the word repetition effect with event-related potentials. Journal of cognitive neuroscience, 3(2), 131-50. [PubMed:23972089] [WorldCat] [DOI] - ↑
Schupp, H.T., Junghöfer, M., Weike, A.I., & Hamm, A.O. (2004).
The selective processing of briefly presented affective pictures: an ERP analysis. Psychophysiology, 41(3), 441-9. [PubMed:15102130] [WorldCat] [DOI] - ↑
Friederici, A.D. (2005).
Neurophysiological markers of early language acquisition: from syllables to sentences. Trends in cognitive sciences, 9(10), 481-8. [PubMed:16139558] [WorldCat] [DOI] - ↑
Kutas, M., & Hillyard, S.A. (1980).
Reading senseless sentences: brain potentials reflect semantic incongruity. Science (New York, N.Y.), 207(4427), 203-5. [PubMed:7350657] [WorldCat] [DOI] - ↑
Hagoort, P., Hald, L., Bastiaansen, M., & Petersson, K.M. (2004).
Integration of word meaning and world knowledge in language comprehension. Science (New York, N.Y.), 304(5669), 438-41. [PubMed:15031438] [WorldCat] [DOI]
Squires NK, Squires KC, Hillyard SA. (1975). Two varieties of long-latency positive waves evoked by unpredictable auditory stimuli in man. Electroencephalogr Clin Neurophysiol., 38, 387-401.