語彙

2012年4月29日 (日) 21:13時点におけるToshikiiwabuchi (トーク | 投稿記録)による版

 脳科学における語彙とは,個人の脳内に記憶された語に関する知識の総体を指す.一般的な用法と区別するため,単に語彙という代わりにメンタル・レキシコン(mental lexicon)という用語を用いることも多い.メンタル・レキシコンには心的語彙,心内語彙,心的辞書,心内辞書など多くの訳語が存在する.

語彙とは

 私たちは非常にたくさんのword)をほとんど無自覚に覚えている.たとえば,英語の母語話者は高校卒業時点で平均60,000語ほどの語彙量を持つと推定される.あらゆるphrase)やsentence)は語を文法的なルールに従って組み合わせることで構築される.このことからも,語に関する知識が言語を用いる上で重要であることは疑う余地がない.

 このように語は言語表現の基本的な要素であるが,一般的に「語」といわれるものの多くはそれ自体が内部構造を持っていて,より小さな要素へと分解され得る.たとえば「おみそしる」という語は「お」と「みそしる」の2つの部分に分けることができ,さらに「みそしる」は「みそ」と「しる」の2つの部分に分けられる,といった具合である.上のような分解を繰り返して意味的に最小となった単位のことを形態素morpheme)と呼ぶ.語は単一の形態素,あるいは複数の形態素の結合から成る.ちなみに言語的音声の最小単位を音素phoneme)と呼ぶが,形態素はひとつ以上の音素から構成される.

 健常者は状況に応じて多彩な語を使い分けることができるが,使用し得る全ての語がその人の脳に記憶されているかどうかは定かでない.たとえば,「おみそしる」は単語として記憶されているのだろうか.それとも「お」と「みそしる」が別々に記憶されており,それらを脳内でオンライン的に組み合わせることで「おみそしる」という表現が形成されるのだろうか.この種の問題は言語研究におけるホットな話題のひとつであり,今も多くの研究者によって議論されている.そこで,メンタル・レキシコンに記憶されている個々の要素を指す場合は語彙項目lexical item / lexical entry)という用語を使用し,語あるいは形態素といった用語と区別することにする.語彙項目には形態素や語,イディオムなどがリストされ得る.

 ある語彙項目が適切に使用されるには,それがどんな音素の組み合わせから構成されるか(音韻情報,phonological information),どういう意味に対応するか(意味情報,semantic information),どのような形態素の構成を持つか(形態情報,morphological information),そして文や句を構成する時にどういう規則に従うか(統語情報,syntactic information)といった情報が少なくとも必要である.ある語彙項目の知識が脳内にあるということは,これらの情報が適切な関係づけの下で保持されていることを意味している.こうした相互に関連する知識の総体が語彙,すなわちメンタル・レキシコンである.

語彙情報へのアクセス

 ことばを発したり理解したりするには基本的に語彙情報に対するアクセスが不可欠である.この語彙アクセスがどうやって実現されるかは,ことばに対する応答や発話といった行動を詳細に分析することで間接的に調べられる.行動に基づく語彙アクセスの研究はメンタル・レキシコンの特性を調べる上で中心的な意義を担ってきた.脳内の情報を直接的に観察することは難しい,という技術的問題もその一因である.以下では語彙アクセスに関する心理学的知見やモデル研究を紹介する.

語彙アクセスに影響する要因

 語彙の認識や理解に関する心理学的研究は以前から盛んに行われてきており,単語によってアクセスのしやすさが異なるということが分かっている.このような違いを生む要因としては出現頻度(word frequency)や親密度(word familiarity)といったものがある.使用される頻度が高かったり親密度が高かったりする単語ほど,処理に要する時間は短くなる.

 こうした知見を得るための手法としては,たとえば言語理解中の眼球運動計測が挙げられる.この手法では,ある語に対する実験被験者の注視時間が長いほど意味的処理に時間がかかっているのだと解釈される.ほかには語彙判断課題(lexical decision task)と呼ばれる実験的方法もある.これは実験の被験者に文字列を提示し,それが単語であるか非単語であるかを迅速にボタン押しで判断させるものである.語彙判断課題においては出現頻度が高い単語に対するほど反応が早く,かつ正確になる.こうした出現頻度効果は提示された語の理解だけでなく,それを実際に発音する課題においても観察される.また,単語を瞬間的に提示したときの認知閾(認知に要する最低の提示時間)は出現頻度の対数と直線関係があることも報告されている.

 単語の具体性(concreteness)あるいは心像性(imageability)と呼ばれる要因も語彙アクセスに影響する.心像性とは,ある名詞がどのくらい意味を想像しやすいかを示す指標である.基本的に「りんご」のような具体語(concrete word)ほど心像性は高く,「自由」のような抽象語(abstract word)ほど心像性は低い.そして名詞は心像性あるいは具体性が高いほどより早く正確に処理することが可能である.

 また,同じ単語であっても文脈(コンテクスト)的な効果によって処理に要する時間は変化する. Tulvingらは9語から成る英語の文を作成し,その文末の語を瞬間的に提示して認知させる実験を行った.被験者には文脈情報として,先行する文中の語が0,2,4,8語のいずれかだけ提示される.この実験の結果,より多くの文脈が与えられるほど正答率が向上することが明らかとなった.これは単語認知における文脈効果(context effect)の一種である.

 視覚的な認知過程における単語優位効果(word superiority effect)も広い意味での文脈効果であるといえる.この効果は以下のようなものである――ある文字列を被験者に瞬間提示したのち,そこに含まれていた文字を2択で判断させる課題を考えてもらいたい.2択の文字が“K”と“D”だとすると,文字列が単語(例.WORDやWORK)の場合にランダム文字列(例.ORWD)の場合よりも正答率が上がる.これは単語という文脈に埋め込まれることで文字の検出率が上昇することを意味する.これが単語優位効果である.

そのほか,ある単語(ターゲットもしくはプローブ)の理解が直前に別の単語(プライム)などを提示することによって促進されたり抑制されたりする現象も知られている.これは語彙的プライミング効果(lexical priming effect)と呼ばれるもので,ターゲットに対して語彙判断課題などを行うことで測定する.たとえばプローブとターゲットのあいだに意味的関連がある場合,ターゲットの理解は促進されることが知られている.

語彙アクセスのモデル

単語認知に関するモデル

 ことばを見聞きしたとき,われわれは苦も無く語彙情報にアクセスして意味を理解する.こうした単語認知研究の初期における重要なモデルとして,Mortonのロゴジェン・モデル(logogen model)がある.このモデルではメンタル・レキシコンの構成ユニットはロゴジェンと呼ばれ,個々の単語に対応する.ロゴジェンは感覚入力(たとえば単語の視覚刺激)に対して応答するが,この応答値がある閾値を超えたときにのみ「対応する単語が認識された」ものとする.さらに,ロゴジェンは単語の使用頻度や文脈の効果を受け,それによって閾値が低下するという特徴を持つ.以上がロゴジェン・モデルの概要である.このモデルは出現頻度効果や文脈効果による語彙アクセスへの影響をある程度定量的に説明することができる.

 ロゴジェン・モデルに続く重要な単語認知モデルとしては,相互作用活性化(interactive activation: IA)モデルが挙げられる.IAモデルは特徴レベル・文字レベル・単語レベルの3つの階層から成るニューラルネットワーク・モデルである.ロゴジェン・モデルとは異なり,IAモデルには上述した3つのレベルごとに構成ユニットが存在する.たとえば垂直な線分に対応する特徴ユニット,“A”の文字ユニット,“CAT”の単語ユニットなどがそれぞれの層を構成するのである.特徴ユニットは,対応する特徴を含む文字ユニットに対しては興奮性の,そうでない文字ユニットには抑制性の結合を持つ.文字ユニットと単語ユニットは相互に結合しており,前者の文字が後者の単語に含まれる場合(例.“T”と“TIME”)には両者の結合は興奮性,そうでない場合には抑制性である.また単語レベルのユニット間には強い相互抑制が存在する.IAモデルではこれらの結合を通じてレベル内およびレベル間の相互作用が生じる.単語の視覚入力を最初に受けるのは特徴ユニットであるが,レベル間の結合があるためにその後の処理は各階層で並列的に進行する.またIAモデルの構成ユニットは閾値を持たないが,入力と合う特定の単語ユニットが最も強く活動することで単語認知が実現される.IAモデルもロゴジェン・モデルと同様,頻度や文脈による単語認知の促進効果を再現することが可能である.さらに高次(単語レベル)から低次(文字レベル)へのフィードバックを組み込むことで,先述した単語優位効果も説明できるようになっている.

 単語の聴覚的認知に関してはコホート(Cohort)・モデルと呼ばれる概念モデルが有名である.このモデルが提唱する枠組みでは,単語の聴覚的認知は以下3つのステージに大別される.単語(例.stack)が聴覚的に入力されると,1)最初の100-150ミリ秒時点での音素系列(例.sta-)と合致する単語表現(例.stab,stack,stagger…)がまず全て活性化され,2)継起する音や文脈に基づいて候補が絞られていき,3)最終的にひとつの単語(stack)が特定される.この最初に活性化される単語群を語頭コホート(word-initial cohort)という.コホートとはもともとローマの歩兵隊を指すことばであり,単語の大群が徐々に選択されていく過程を軍隊の行進になぞらえているのである.コホート・モデルは,たとえば「captain(船長)-captive(捕虜)」実験などの結果によって支持される.この実験では被験者にcaptainあるいはcaptiveのような語が音声で提示されていき,その途中で視覚的に表示される語の語彙判断が求められた.このとき,音声が「capt-」の時点で視覚刺激が提示されると,captainおよびcaptiveと意味的に関連する「boat(船)」「guard(看守)」といった語に対する反応が促進されたのである.これは語彙的プライミング効果の一種であると言え,聴覚提示が「capt-」の時点ではcaptainとcaptiveが共に活性化されていることを示唆するものといえる.McClellandとElmanの提案したTRACEというニューラルネットワーク・モデルはコホート・モデルの枠組みと合致しており,聴覚提示される単語が複数の候補から徐々に選択されていく過程をシミュレートすることができる.

音読・発話に関するモデル

 上で見てきた単語の視覚認知モデルは,文字列の視覚的形状をもとに語彙情報へ直接アクセスすることを通常のやり方として仮定していた.しかし,私たちは「モクホジ」のような非単語でも発音することは可能である.つまり語彙に含まれない文字列であっても,視覚情報を音韻情報に変換する経路は脳内に存在しているのだと考えられる.こうした背景に基づき,Coltheartらは音読過程の二重経路カスケード・モデル(dual-route cascaded model)を提案した.このモデルでは非単語を読むときには語彙情報を介さず,書記素‐音素対応規則(Grapheme-Phoneme correspondence rule)にしたがって文字列を音素に変換するという過程を経る.一方で語彙情報へのアクセスを介して音素に変換するプロセスもあり,例外的な発音をする単語はこの経路のみで処理される.

 SeidenbergとMcClellandの並列分散処理モデル(parallel distributed processing model)も,非単語や例外的発音の音読を説明することができる.このモデルの最も際立った特徴は,そもそもメンタル・レキシコンの存在を仮定しないという点にある.これまで言及した他のモデルでは語彙項目を単一のユニットで表象していたが,並列分散処理モデルでは語の意味情報・音韻情報・書字情報が3つのユニット群に分散され,これら3つのユニット群は中間層を介して互いに異なるユニット群と結合している.このモデルは三角形の構造を持つことからトライアングル・モデルと呼ばれることもある.このモデルは綴りと発音などの正しい組み合わせを学習することができるが,その場合も特定の文字や音を表象するような単一ユニットは存在せず,特定の入力に対してユニット群が特定の活性化パターンを示すようになるだけである.二重経路カスケード・モデルとトライアングル・モデルは共に音読過程をある程度うまく説明することができるが,どちらが実際の脳内機構とより合致しているかについては今なお議論が続いている.

 最後にLeveltの言語産出モデルを紹介する.言語産出過程の具体的な例として,絵画中に描かれた対象が何であるかを呼称する課題を考えてみよう.まず提示された絵をもとに,前言語的な概念表象が産出すべきメッセージとして活性化される.このステージを概念準備(conceptual preparation)という.続いて,メッセージに含まれる語彙概念が対応するレンマ(lemma)を活性化する.「レンマ」とは辞書でいうところの「見出し語」,すなわち語彙項目に相当するものである.ただし,ここで言うレンマは形態情報や音韻情報を含まず,基本的には語彙項目の統語的特性を表す情報である点に注意されたい.たとえば英語のHORSEに対応するレンマが活性化されると,それが可算名詞であること,単数形ないし複数形であること,といった情報が利用可能となる.ドイツ語やフランス語であれば,それに加えて単語の性(gender)も特定される.ここまでが言語産出における語彙選択(lexical selection)の過程である.それから形式符号化システム(form encoding system)が駆動され,選択されたレンマに対して形態的・音韻的な符号化が為される.たとえばHORSEの複数形は2つの形態素から構成されるものである.これらのそれぞれについて音韻的コード(例.<horse> と<iz>)が検索される.検索された音素は音節syllable)へ統合されたり,強勢stress)パターンが付与されたりといった処理を受けるが,これらのプロセスを音韻的符号化(phonological encoding)という.このプロセスの出力は抽象的な音韻表象であり,音韻語(phonological word)と呼ばれる.音韻語は音声的符号化(phonetic encoding)の過程を経て調音スコア(articulatory score)として出力される.最後にこの調音スコアの指示により,実際に調音器官が動かされ音声が発せられる.

語彙の脳内表象

 語彙的知識は脳内でどのように組織されているのだろうか.これまでの研究から,左側頭葉の広い範囲に単語情報の表現があると考えられている.Damasioらは側頭葉の一部に損傷を持つ被験者に対して名詞の呼称課題を実施した.この実験で用いた語は,著名人の名前,動物,道具の3つのカテゴリに分類される.この実験ではまず被験者に絵を提示し,それが何であるかを口頭で答えさせている.障害されている脳部位と各カテゴリにおける課題成績の関係を調べた結果,人名は側頭極,動物名は下側頭回,道具名は後部下側頭回/後頭頭頂側頭接合部の障害により,最も成績が低下していることが明らかとなった.


音韻的な語彙表象

視覚的な語彙表象

意味のネットワーク