首页 » 语言本能:探索人类语言进化的奥秘 » 语言本能:探索人类语言进化的奥秘全文在线阅读

《语言本能:探索人类语言进化的奥秘》语音模式

关灯直达底部

不同的音素库存给不同的语言带来了独特的语音模式。例如在日语中,[r]音与[l]音是不分的。当我在1992年11月4日抵达日本的时候,日本语言学家山梨正明(Masaaki Yamanashi)见到我的第一句话就是:“我们日本人非常关注克林顿的勃起(erection)。”[2]

即便是面对一段并不包含真实单词的语音流,我们往往也可以辨析出某种语音模式,例如《布偶秀大电影》(The Muppets)中的瑞典厨师所说的“瑞典话”,或者约翰·贝鲁西(John Belushi)扮演的日本武士所说的“日本话”。语言学家萨拉·汤姆森(Sarah G. Thomason)对声称能够与亡灵交流或者“说方言”[3]的人进行过研究,发现他们所说的神秘语言与实际语言有着相似的语音模式。例如一位进入催眠状态的通灵师宣称自己是某个生活于19世纪的保加利亚妇女,正在和自己的母亲谈论乡间遭受的兵燹之灾。这段“伪斯拉夫语”听起来就像这样:

Ovishta reshta rovishta. Vishna beretishti? Ushna barishta dashto. Na darishnoshto. Korapshnoshashit darishtoy. Aobashni bedetpa.

当然,如果用一种语言的语音模式来拼读另一种语言的单词,这就是“外国口音”。以下这段文字摘自鲍勃·贝尔维索(Bob Belviso)编写的童话故事《杰克与魔豆》(Jack and the Beanstalk),它是用意大利语的语音模式来拼读英语单词的:

GIACCHE ENNE BINNESTAUCCHE

Uans appona taim uase disse boi. Neimmese Giacche. Naise boi. Live uite ise mamma. Mainde da cao.

Uane dei, di spaghetti ise olle ronne aute. Dei goine feinte fromme no fudde. Mamma soi orais, “Oreie Giacche, teicche da cao enne traide erra forre bocchese spaghetti enne somme uaine.”

Bai enne bai commese omme Giacche. I garra no fudde, i garra no uaine. Meichese misteicche, enne traidese da cao forre bonce binnese.

Giacchasse!

到底是什么规范了语言的语音模式呢?它显然不只是音素的简单相加,例如下面这些字母组合:

以上出现的所有音素都可以在英语中找到,但任何一个以英语为母语的人都能发现它们的区别:虽然“thale”“plaft”“flutch”不是英语单词,但却可以成为英语单词;而剩下的组合则既不是英语单词,也不可能成为英语单词。可见,说话者一定具备了某种隐性知识,知道本民族语言的音素的连接方式。

音素并不是以直线的形式、从左到右地装配成单词的。与单词、短语一样,它们先是组成一个个单元,然后再组成更大的单元,最终形成一种树形结构。每个音节开头的辅音群(C)被称作“首音”(onset),跟着的元音(V)和所有辅音被称作“韵脚”(rime)。

音节的生成规则规定了单词的合法结构。在英语中,首音可以由一组辅音构成,例如“flit”“thrive”和“spring”,但也必须遵从一定的限制,例如“vlit”“sring”这样的组合就不行。韵脚则可以由一个元音加上一个或一组辅音构成,例如“toast”“lift”和“sixths”。然而在日语中,首音只能由单个辅音构成,韵脚则必须是一个元音。因此,“strawberry ice cream”(草莓冰激凌)用日语口音来读就是“sutoroberi aisukurimo”,“girlfriend”(女朋友)用日语口音来读就是“garufurendo”。在意大利语中,首音可以由辅音群构成,但韵脚尾部不得出现辅音。因此在讲述《杰克与魔豆》的故事时,贝尔维索特意使用了这一规则来模仿意大利语的语音模式,所以“and”变成了“enne”,“from”变成了“fromme”,“beans”变成了“binnese”。

首音和韵脚不仅规定了某种语言中可能出现的语音,同时,它们也是人们最为敏感的语音——词音的构成部件,因此常常被用于各种诗歌或者文字游戏中。押韵的单词拥有相同的韵脚,叠声的单词拥有相同的首音(或者仅仅是起头的辅音)。诸如“Pig Latin”“eggy-peggy”“aygo-paygo”等儿童暗语游戏往往是在首音与韵脚的交界处大做文章,比如英语中的“fancy-shmancy”“Oedipus-Shmoedipus”等意第绪式构词法。在1964年的热门歌曲《名字游戏》(The Name Game)中,如果舍丽·艾丽丝(Shirley Ellis)能够采用首音和韵脚的说法,就可以不必费那么多口舌来解释这些规则了(“Noam Noam Bo-Boam, Bonana Fana Fo-Foam, Fee Fi Mo Moam, Noam”)。

再进一步,音节可以组成更大的节奏单位:“音步”(foot)。

音节和音步可以依据其他规则分为强音(s)和弱音(w),这种强弱分布决定了每个音节发音时的轻重程度。与首音和韵脚一样,音步也是词音中的敏感成分,我们常常在诗歌和双关语中使用到它。“韵律”(meter)是不同音步的排列方式。如果一串连续音步以“由强到弱”的方式排列,就是“扬抑格”(trochaic)韵律,例如“Mary had a little lamb”(玛丽有只小羊羔);如果以“由弱到强”的方式排列,就是“抑扬格”(iambic)韵律,例如“The rain in Spain falls mainly in the plain”(西班牙的雨区多是平原)。在日常对话中,我们通常将咒骂语置于重读的单词之前,例如有人问多罗茜·帕克(Dorothy Parker)[4]为什么最近没有去听交响乐,她回答道:“I’ve been too fucking busy and vice versa.”(我不是忙着做事,就是忙着做爱)。此外,虽然一些年轻人喜欢将咒骂语插入单词中间,但也总是置于重读的音步之前,比如“fan-fuckin-tastic”(太他妈的棒了)、“abso-bloody-lutely”(绝对地)、“Phila-fuckin-delphia”(该死的费城),可见这一规则依然被严格地遵守,如果你硬要说“Philadel-fuckin-phia”,恐怕连街头的不良少年都要嘲笑你了。

语素和单词中的音素组合存储于我们的记忆之中,它们在被实际说出之前还要经历一系列调整,这些调整进一步规范了语言的语音模式。你不妨读一读“pat”和“pad”这两个单词,然后再读一读它们的“-ing”形式:“patting”和“padding”。在英语的许多方言中,这两个单词的读音完全相同,[t]和[d]的差别不复存在,而消弭二者差别的是一种叫作“闪音”的音位规则:如果一个舌尖塞辅音出现在两个元音之间,这个辅音的发音方式不再是舌头静止抵住齿龈,以积累足够的气流,而是改成舌尖轻弹齿龈,旋即离开。这种闪音规则不但适用于两个语素相连的情况下,例如“pat”和“ing”,也同样适用于由一个语素构成的单词。虽然对许多说英语的人来说,“ladder”和“latter”似乎是由不同的音素构成的,并且在心理词典中代表不同的意思,但它们的读音其实是一样的(尤其是在故作庄重的场合下)。因此当谈话内容涉及母牛时,一些诙谐之士就会大谈特谈“udder mystery”(乳房的秘密)、“udder success”(乳房的成功)等谐音词。[5]

有趣的是,音位规则的应用是一种有着固定步骤的有序操作,就如同一条生产流水线,将单词依次装配起来。比如“write”和“ride”,在大多数英语方言中,这两个单词中的元音在发音上是有一定区别的,至少“ride”中的“i”发音比“write”中的“i”要更长一些。在某些方言中,比如新闻评论员彼得·詹宁斯(Peter Jennings)、冰球明星韦恩·格雷茨基(Wayne Gretzky)以及笔者所说的加拿大英语(也就是电视剧《加拿大》中麦肯齐兄弟所操的搞笑口音),这两个元音发音完全不同。“ride”包含的是一个从元音[ɑ]滑向元音[ee]的双元音,而“write”包含的是一个从更高的元音[ʌ]滑向[ee]的双元音。但是,无论这个元音如何改变,它都遵循着一个统一的规则:[t]之前不得出现长/低的“i”音,[d]之前则不得出现短/高的“i”音。在电影《超人》(Superman)中,女主人公露易丝·莱恩(Lois Lane)最终以非常难得的理智推断出克拉克·肯特(Clark Kent)就是超人:他们从来没有在同一时间出现在同一地点。我们也可以同理推断说,心理词典中只有一个“i”,在它被读出来之前,音位规则会根据它是出现在[t]之前还是[d]之前进行发音上的调整。我们甚至可以猜测,储存在记忆中的原始的“i”在发音上近似ride中的“i”,而“write”中的“i”则是音位规则的产物。证据是当“i”音的身后没有[t]和[d]时,比如在“rye”中,它的发音与“ride”中的“i”相同,这显然是没有被规则改造的原始形态。

现在请再读一下“writing”和“riding”。在闪音规则的操作下,[t]和[d]的读音已经完全一致,但两个“i”的读音却仍旧不同。这是怎么回事呢?根据上文所述,“i”音的不同完全是因为[t]和[d]的区别,而[t]和[d]的区别已经被闪音规则消除。这表明在规则的应用上,“i”音的变化规则优先于闪音规则。换句话说,这两个规则在应用上有固定的顺序,元音变化在前,闪音变化在后。之所以如此,可能是因为闪音规则的存在是为了让发音变得更加容易,因此它在由脑到口的加工链条中处于更为下游的位置。

元音变化规则还有另一个重要特征。“i”音不只会在[t]前发生改变,它在许多辅音之前都会发生改变,试比较:

这是否意味着“i”音有5种不同的变化规则,分别用在[z]与[s]、[v]与[f]等5种不同的区别上?显然不是。这些引起变化的辅音[t]、[s]、[f]、[p]、[k]与它们各自的对应辅音[d]、[z]、[v]、[b]、[g]有一个共同的区别:它们都是清音,而它们的对应辅音都是浊音。因此我们只需要一个规则:“i”的读音在清辅音之前发生变化。我们可以通过一个事例来证明它是存在于人们头脑中的真实规则,而不是为了节省笔墨而将5个规则硬凑成一个规则。如果一个以英语为母语的人能够正确地读出德语中的“ch”(如the Third Reich),他就会将德语中的“ei”读成“write”中的“i”,而非“ride”中的“i”。英语中没有辅音[ch],所以以英语为母语的人不可能知道关于它的任何音位规则。但是,由于它是清辅音,因此只要元音变化规则对于任何清辅音都有效,那么以英语为母语的人便会清楚地知道该怎么做。

这种选择性变化不仅出现在英语中,也在所有语言中有所体现。音位规则很少由单个音素触发,它们往往适用于一整类有着某种共同特征的音素,例如同为浊音,同为塞音或擦音,或者有相同的发音器官。这表明,音位规则并不是将音素看成一串符号,而是透过音素的外在形式,把握其内在的发音特征。

因此,音位规则操纵的是发音特征,而不是音素。请读一读下面这些动词过去式:

在“walked”“slapped”和“passed”中,“-ed”读作[t];在“jogged”“sobbed”和“fizzed”中,“-ed”读作[d]。现在你或许已经能够推断出这种差别背后的原因了:读作[t]是因为它跟在[k]、[p]、[s]等清辅音之后,而读作[d]是因为它跟在[g]、[b]、[z]等浊辅音之后。由此可见,我们的头脑中必定存在一个特定的规则,它能够回头查看词干的末尾音素,以确定其是否属于浊音,然后依据检查的结果来调整后缀“-ed”的读音。为了证实这一假设,我们可以要求人们念下面这句话:“Mozart out-Bached Bach”(莫扎特比巴赫还巴赫)。动词“out-Bach”包含了“ch”音,但英语中并没有这个音。然而,每个说英语的人都会将“out-Bached”的后缀“-ed”读作[t],因为“ch”是一个清辅音。我们甚至可以用一些例子来证明后缀“-ed”是以[d]音储存于记忆之中的,而[t]音则是规则变化的结果。例如单词“play”“row”不是以辅音结尾的,而每个人都将它们的过去式读成“plade”和“rode”,而非“plate”和“rote”。在没有辅音触发音位规则的情况下,我们听到的显然是存储于心理词典中的最初读音,也就是[d]。这一现象揭示了现代语言学的一个重要发现:语素能够以与其实际发音不同的形式存储于心理词典之中。

偏好理论的读者恐怕还要忍耐一会儿,等我把下一段内容讲完。请注意,在“[d]→[t]”变化规则的背后存在着一种奇特的模式:首先,[d]本身是个浊音,它也必须跟在浊辅音之后;[t]是一个清音,它则必须跟在清辅音之后。其次,除了清、浊之外,[t]和[d]在发音上是相同的:它们的发音器官都是舌尖,而且发音方法也相同,即用舌尖抵住齿龈,阻塞气流,然后再释放出来。因此,这条变化规则并不是随意地变更音素,比如在高元音之后将[p]变成[l],或者随机挑选其他音素。整个变化过程就像是针对后缀“-ed”实施的一场“外科手术”,将它的发音调整为与其浊音相对应的清音,而保留其他的发音特征。换言之,在将“slap ﹢-ed”的读音转变为“slapt”的过程中,音位规则是将清浊指令连同“slap”的[p]音一起打包,作用于后缀“-ed”之上的,如下所示:

“slapped”中的[t]音与“slapped”中的[p]音形成了匹配关系,是因为它们都是清音。它们在心理词典中被视作同一个特征,从而将两个音段联系起来。这种情形在其他语言中也很常见。例如清浊、元音音质、语调等特征可以为单词中的各个音素提供一种横向联系,仿佛每个特征都住在自己的“音层”(tier)中,而不是与某个单独的音素拴在一起。

可见,音位规则关注的是特征,而不是音素。它们调整的也是特征,而不是音素。前文说过,正是一类类特征的排列组合,才形成了语言中的各种音素。这些事实表明,语音的原子是特征,而不是音素,这些特征存储于大脑之中,成为大脑的操作对象。音素只不过是一组特征的集合。因此,即便是在最小的语言单位——特征的层面上,语言也是以组合系统的方式进行工作的。

所有的语言都有自己的音位规则,可它们又有什么用呢?你或许已经注意到,这些规则可以使发音变得更加容易。对两个元音之间的[t]或[d]进行闪音处理,可以帮助我们更快地发音,而不必让舌尖为了积累足够的气压而长时间地保持不动。将单词词尾的清音特征作用于后缀之上,可以使说话者不必先关闭喉头发词尾的音,再打开喉头发后缀的音。乍看之下,音位规则仅仅是一组偷懒的方法。从这个角度出发,人们很容易注意到其他方言中的语音调整现象,并将这种调整归结为说话者的懒惰。这种心理非常普遍,无论是英国人还是美国人中。例如萧伯纳写道:

英国人不尊重他们的语音,不肯教他们的孩子好好说它。他们无法正确地拼读,因为他们拥有的是一套古老的外来字母系统,其中只有辅音(而且不是所有辅音)有一致的发音规则,因此只要一个英国人开口说话,就注定要遭到其他英国人的鄙视。

莱德勒在《如何听懂美国人的含混口音》(Howta Reckanize American Slurvian)中写道:

一直以来,语言爱好者都在为美国人说话时的拙劣发音而伤神。那些听觉敏锐的人不得不承受极大的痛苦和愤懑,听着人们把“government”念成“guvmint”,把“accessories”念成“assessories”。事实上,无论走到哪里,我们都受到含混不清的口音的围攻。

但是,如果这些悲愤者的耳朵能够再敏锐一些,他们或许就能注意到这样一个事实:没有任何一种方言允许人们在发音上敷衍了事。音位规则一手提供方便,一手又把它拿走。一个乡下人也许会因为将“Nothin’ doin’”中的“g”音省略而遭到嘲笑,但他却很有可能清晰地发出“pólice and accidént”中的元音[ə],而那些自以为高人一等的知识分子却会把它弱化为中性元音[uh]。当布鲁克林道奇队的投手韦特·霍伊特(Waite Hoyt)被球击中的时候,一位球迷在看台上大声叫道:“Hurt’s hoit!”(受伤了霍伊特)。喜欢“pahk their cah in Hahvahd Yahd”(即“park their car in Harvard Yard”,把车停在哈佛校园)的波士顿人也喜欢把自己的女儿叫作“Sheiler”(Sheila)和“Linder”(Linda)。1992年,马萨诸塞州韦斯特菲尔德市(Westfield)的居民提交了一份法案,禁止本市学校雇用任何“带有口音”的外来教师——这可是千真万确之事。一位具有怀疑精神的女士曾给《波士顿环球报》(Boston Globe)写信,说自己当年的老师—— 一位土生土长的新英格兰人曾用“orphan”和“often”来解释“同音词”,另一位搞笑的读者也说自己当年因为将“cuh-rée-uh”拼写成“Korea”,将“cuh-rée-ur”拼写念成“career”而让老师气愤不已。不过,很快,这个提议就被撤回了。

我们有充足的理由说明为什么音位规则要对发音上的“懒惰现象”实施严格监管,为什么所有的方言都不允许它的使用者随心所欲地偷工减料。说话者的每一次偷工减料都会让听者付出脑力上的代价。如果一个社会由懒惰的说话者构成,那么它也必然是一个勤奋的听者社会。如果这个社会由说话者说了算,那么所有的音位规则都将被取消;但如果由听者说了算,语音就会走上相反的道路,它会迫使说话者在发音时严格遵守音位规则,以扩大易混音素的听觉差异。事实上,许多音位规则也正是这么做的。例如英语中有这样一条规则:一个人在发[sh]音时必须将双唇撮圆,而在发[s]音时则不必如此。这个额外动作的好处是:撮起的双唇拉长了共振腔的长度,从而加强了将[sh]和[s]区分开的低频噪声,听者也就能够更加容易地识别出[sh]音。虽然每个说话者同时也是一个听者,但人性的伪善使我们不敢贸然依靠说话者的远见和体贴。相反,语言社区的每个成员都宁愿接受一套相对严格、有张有弛的音位规则,并在牙牙学语的孩提时代就已掌握这套规则。

即便音位规则并未扩大易混音素的听觉差异,它也可以给听者带来好处。它使得语音模式具有可预测性,从而增加了语言的“羡余性”(redundancy)。据估 计,就携带的信息量而言,英语文本的实际长度是其所需长度的2~4倍。例如,本书在我的计算机磁盘中占了900 000个字符,但我的压缩软件可以利用字母排列顺序的羡余性,将其压缩到400 000个字符,而不含英语文本的计算机文件则无法压缩到这个程度。逻辑学家奎因解释了为何许多系统都具有羡余性特征:

这是对最低需求的一种明智超越。这是一座设计精良的大桥在承受始料未及的压力时依然屹立不倒的原因所在。这是未雨绸缪的保护之策。这也是为什么我们在填写邮寄地址时尽管已注明邮政编码,却仍要写下城市和州名的原因,否则的话,一旦邮政编码中的某个数字写得不太清楚,就可能搞砸一切……据传说,有个王国曾经因为缺少一个马掌钉而灭亡。羡余性正是我们防范这种不稳定因素的手段。

多亏了语言的羡余性,即便将句子中的元音全部替换成“x”,你也能读懂我所写的内容(yxx cxn xndxrstxnd whxt x xm wrxtxng xvsn xf x rxplxcx xll thx vxwxls wxth xn“x”);而如果把句中的元音都去掉的话,辨别起来就更难一些(t gts lttl hrdr f y dn’t vn kn whr th vwls r)。在倾听别人说话的时候,音位规则所提供的羡余性能够补偿声波上的模棱两可之处。例如,当听者听到“thisrip”这个音时,他知道这一定是“this rip”而不是“the srip”,因为在英语中,[sr]这个辅音连缀是不合法的。