首页 » 决策与判断 » 决策与判断全文在线阅读

《决策与判断》第二部分 问题如何影响答案

关灯直达底部

本书的第一部分探讨了刺激的情境影响人们的知觉方式。在这一部分中,我们扩展了这一命题,探究问题的形式对人们回答的影响。第5章和第6章主要解决以下两个问题:(1)人们的决策与判断在多大程度上取决于问题的措辞?(2)问题的措辞以哪些具体方式影响人们的回答?

第5章 可塑性

任何刺激的发生总离不开一定的情境,问题也一样。本章将讨论问题的语境和措辞对决策与判断的影响。

在一些情况下,在两种不同语境下提供同一个选项会得到不同的回答。例如,假设你面临如下的选择:

选择A:100%的概率输掉50美元。

选择B:25%的概率输掉200美元,75%的概率什么也不输掉。

你会如何选择?(参见你在读者调查中第2题的答案。)在保罗·斯洛维奇等人(Paul Slovic, Baruch Fischhoff,&Sarah Lichtenstein, 1982)的实验中,80%的人会选择B。当面临损失时,很多人都属于“风险偏好”的,他们往往愿意冒风险去承受更大的损失(在这个例子中为200美元),也不愿意承受具有相同期望值但却是确定的损失(25%的概率输掉200美元与100%的输掉50美元具有相同的期望值,因为从长期来看,二者具有相同的期望收益)。

然而,稍微想一想就会发现其中的问题。如果人们在面临损失时更愿意承受风险,那么保险公司就没有什么生意可做了。保险行业的运营基础就在于,人们愿意承担一个确定的损失(保险费)去避免更大但不确定的损失。以保险业的术语来讨论确定的损失时,人们是否会表现得不同?如果这个确定的50美元的损失被说成是能够用来避免潜在的200美元损失的保险费,人们会如何在A和B中做出选择?

斯洛维奇,菲施霍夫和利希滕斯坦发现,在这种情况下,65%的人更倾向于承受确定的50美元损失。这可能是因为保险费着重突出了潜在的更大损失,也可能是因为保险公司成功地塑造了一种社会规范,在这种规范之下,人们表现得更加审慎,因此更倾向于支付保费而不是承受更大的损失。不管是哪种原因,当以保险业的术语来重述这一问题时,同样的问题确实导致了不同的选择结果。如果确定的损失是以保险费的形式来表达,大多数的人会变得“风险规避”而不是“风险偏好”;他们倾向于承担确定的损失而不是冒损失更多的风险。

斯洛维奇,菲施霍夫和利希滕斯坦(1982)也发现,当面临付出5美元还是以千分之一的概率输掉5000美元的选择时,人们会表现出相似的偏好逆转。

表5.1 你会做什么样的选择

注释:从右边的两列可以看出,保险条件下的人数百分比要比赌博条件下高出20%到40%以上。数据引自赫尔希和休梅克(1980)的研究。

虽然在简单偏好的语境下,只有大约2/5的人会选择付出5美元,但如果将5美元说成是保险费时,就会有大约2/3的人选择确定的损失。约翰·赫尔希和保罗·休梅克(John Hershey&Paul Schoemaker, 1980)的实验也得到了同样的结果(见表5.1)。

顺序效应

人们的答案也可能受到问题或者选项顺序的影响。这些影响通常很小,但在某些情况下,其影响却可能变得非常深远。比如说,如果两个问题都是关于同一主题,而且回答者需要表现得一致,那么回答者就会照着前一个问题的答案的思路来组织后一个问题的答案。

在霍华德·舒曼和斯坦利·普雷瑟(Howard Schuman&Stanley Presser)《态度调查中的问题与答案》(1981)一书中,他们以一项有关新闻自由的态度调查的结果来阐明了这一效应。舒曼和普雷瑟随机选取一组美国成年人作为实验样本,向他们询问了以下两个问题:

1.你认为一个共产主义国家,比如前苏联,是否应该允许美国的新闻记者进入其境内采访,并将他们所得到的新闻发回美国?

2.你认为美国是否应该允许其他共产主义国家的新闻记者入境采访,并将他们所得到的新闻发回他们所在的报社?

一半的被试会按照上面这种顺序来回答问题,而另一半的被试则以相反的顺序来回答问题。

舒曼和普雷瑟发现,如果被试被问到的第一个问题是有关美国的新闻记者,82%的人认为美国记者应该被允许自由进入共产主义国家。与这一答案一致的是,75%的人也认为美国应该允许共产主义国家的记者自由进入美国采访。另一方面,如果被试被问到的第一个问题是有关共产主义国家的新闻记者,那么只有55%的人认为应该让共产主义国家的新闻记者自由进入美国进行新闻报道。在这种情况下,大概是为了保持一致,避免让自己看起来有双重标准,只有64%的人认为应该允许美国记者自由进入共产主义国家(相较于82%,64%的比例更接近于55%)。所以说,相同问题的不同顺序会产生截然不同的答案。

选项的顺序不同也能够影响到人们的回答。选项顺序效应通常比较微弱,而且如果问题的答案只是简单的二选一(例如“同意”和“不同意”),或者答案选项非常多,那么选项顺序效应基本是不存在的。顺序效应中最常见的是近因效应,也就是说,当某一答案选项出现在备选答案中的最后时,其被选择的频率更高。

舒曼和普雷瑟(1981)发现,在有关离婚问题的两种不同表达方式中,出现了较强的近因效应。在一次全国性的民意调查中,一半的调查对象被问到:“你认为在这个国家里,离婚程序应该更容易、更难、还是维持现状?”

在对这一问题的回答中,23%的调查对象认为,离婚程序应该变得更加容易一些,36%认为应该更加难一些,另外41%的人则认为应该维持现状。

剩下的另一半实验对象也回答了相同的问题,但最后两个答案选项的顺序被调换:“你认为在这个国家里,离婚程序应该更容易、维持现状、还是更难?”

在这种情况下,26%的实验对象认为,离婚程序应该变得更加容易一些,29%倾向于维持现状,另外46%的人则认为应该更加难一些。在两种表达方式下,最受欢迎的答案总是最后被提到的选项。

图5.1 在有关离婚的两种版本的问题中,回答者都倾向于选择最后一个选项(引自Howard Schuman和Stanley Presser于1981年所做的一项全国调查的数据)。

虚假意见

虽然人们回答问题的方式受到语境和顺序的很大影响,答案的可塑性也是有限度的(研究者将答案的可延展性称为可塑性)。如果人们对一个问题已经非常熟悉,那么语境和顺序产生的边际变化一般小于30%(“边际”指的是调查对象给出每一个答案的百分比)。但是,如果人们对一个问题所知甚少,那么他们就会更容易受到语境和顺序变化的影响。另外,如果人们对一个问题一无所知,一部分人会表现出完全可塑性;在某些特别的询问方式下,一部分人会对这一问题发表意见,但实际上他对此并不真正了解。这种看法被称为“虚假意见”。[1]

尤金·哈特利(Eugene Hartley)在1946年发表的实验是有关虚假意见普遍程度最早的几个实验之一。在对几百名大学生的调查当中,哈特利发现,超过80%的人倾向于从“社会距离”(一种被广泛用于评价社会中人们彼此之间的感受的指数)的角度来评价Danireans、Pireneans、Wallonians和其他32个民族。这里的蹊跷在于,实际上并不存在所谓的Danireans、Pireneans或者Wallonians——哈特利只是人为地设置了这些民族,以检验有多少学生会假装他们对此持有自己的意见。

第二年,Tide杂志上刊登了一个类似的民意调查,就一个虚构的《Metallic Metals法令》向被试询问如下问题:

以下哪种说法与你对《Metallic Metals法令》的看法最为一致?

a.对全美国来说,这是一项很好的措施。

b.这是一项不错的措施,但应该留待各个州独立解决。

c.对其他国家来说或许不错,但不应该在这里实行。

d.没有任何意义。

虽然实际上并不存在《Metallic Metals法令》,但却有70%的被试表达了他们对该法令的意见。其中41%的人认为应该将它留待各个州独立解决,15%的人认为对全美国来说这是一项很好的措施,11%的人认为不应该在这里实行,另外3%的人则认为这项法令没有任何意义(Gill, 1947年3月14日)。

这篇文章同时还讨论了另一项调查的结果,在这项调查中,被试被问到:“你支持还是反对乱伦?”(在20世纪40年代,“乱伦”一词并不如今天这样为人们所熟知。)在发表意见的被试中,有2/3的人反对乱伦,而竟然有1/3的人支持乱伦!

政治事件中的虚假意见

在回顾了有关虚假意见的实验之后——其中包括舒曼和普雷瑟(1981)自己的一些实验,舒曼和普雷瑟得出的结论是,这一问题固然很重要,但并不像早期研究所认为的那么严重。在他们自己所做的调查中,只有1/3或1/4的被试对一个模糊的立法问题给出了虚假意见。其他一些研究者也得出了类似的结论(Bishop, Oldendick, Tuchfarber,&Bennet, 1980)。

被试中有25%~35%的人给出了虚假意见,这也许不算十分严重。但应该记住,在许多民主国家(包括美国),只要有30%的民众便可以选出一国的总统。政治论战的结果往往都是由一个差距很小的百分比来决定的。所以说,虚假意见对许多政治事件具有决定性的影响。一般说来,那些对某一问题知之甚少的人加上那些对此闻所未闻的人,往往能够形成一个绝对的多数。

在有关外交和军事政策的判断中,虚假意见实际上非常普遍。这是由于人们只有很低的政治参与程度和很少的政治意识,却面临一种不得不对此发表意见的社会压力。可以参考一下普劳斯(1989年3月)所给出的一些有关美国“政治文盲”的例子:

1988年的一项对美国成年人的盖洛普调查中,有近一半的人不知道南非是一个存在官方种族隔离制度的国家,有3/4的人不能说出官方已经承认拥有核武器的四个国家的名字。

1985年针对大学生的一项调查发现,45%的人不能说出曾遭受核武器袭击的两个城市的名字。

根据《纽约时报》所刊登的1979年的一项政府调查的结果,40%的高中高年级学生误以为以色列是一个阿拉伯国家。

1983年的一篇名为“萨尔瓦多不在路易斯安那”的《华盛顿邮报》文章指出,在一项全国性的调查中,有3/4的人不知道萨尔瓦多的地理位置(这篇文章的题目是从一名调查对象的答案得来)。

其他调查显示,68%的回答者不知道美国并没有有效对付弹道导弹的装备,81%的人错误地认为,只有当前苏联先动用其核武器时,美国才会动用核武器。“政治文盲”现象的存在,使得解释有关外交和军事政策的公众意见变得更加困难了。例如,如果以色列被误认为是阿拉伯国家,支持以色列有何意义?如果很多人认为美国能够抵御弹道导弹的进攻,那么支持战略防御行动还有何意义?要使这类政治判断有意义,必须首先将真实意见和虚假意见区分开来。

过滤虚假意见

历史上,很多民意调查都没有对问题进行过滤。大多数这样的调查都没有采取措施排除那些实际上没有意见的人,回答选项中也没有包括诸如“没有意见”或者“不知道”这一类的选项。不过,越来越多的研究者都开始意识到“过滤器”的作用。设置过滤器正是为了排除掉那些实际上对某一给定问题并没有什么意见的人。

设置过滤器的方式有很多种。在一些民意测验中,被试首先会被问到他们是否听说过某件事情或是读到过有关某个问题的报道。如果回答是肯定的,他们才被要求发表有关这个问题的意见。如果不是,则回答其他问题。在另一些民意测验中,则首先询问被试是否就某一问题进行过深入的思考,或者更直接地询问他们是否对某一问题有自己的看法。还有一种过滤方法就是明确地设置“没有看法”或是“不知道”这样的选项。

一般来说,设置过滤器能够有效地排除那些虚假意见。但在某些情况下,却可能使调查结果产生偏差。例如,“不知道”往往与受教育程度或是对某一问题的关注程度呈负相关。如果过滤掉那些教育程度或是关注程度相对较低的人,那么调查结果就很难代表全体民众的看法。

为了评价过滤器的效果,舒曼和普雷瑟(1981)进行了一系列实验性民意调查来比较有过滤器条件下和无过滤器条件下的效果。根据其发现,他们得出以下结论:在大多数有过滤器的情况下,(1)至少有1/5的人会选择“不知道”;(2)做出某一特定回答的相对人数比例并没有受到显著影响(例如,回答“是”的人数与回答“不是”的人数的比例);(3)不同问题答案之间的相关关系并没有受到很强的影响。

比如,1974年的一次全美民意调查中,以下这样一组问题的答案就典型地反映了舒曼和普雷瑟的实验结果:

无过滤器的条件:“阿拉伯国家在试图与以色列达成真正的和平。你是否同意以上的说法?”

同意(17%)

不同意(60%)

不知道(主动提到)(23%)

有过滤器的条件:“阿拉伯国家在试图与以色列达成真正的和平。你对此有看法吗?(如果有)你同意以上的说法还是不同意?”

同意(10%)

不同意(45%)

没有看法(45%)

虽然在有过滤器的条件下,回答“没有看法/不知道”比无过滤器的条件下多出了22%,但是回答“不同意”与回答“同意”的人数比例在两种条件下基本上是一样的(回答“不同意”与回答“同意”的人数比例大约为四比一)。

当然,人数比例接近并不意味着过滤器不重要。比如说,假设一个民意测验人希望民意测验的结果表明,绝大多数人并不同意这样的说法:“阿拉伯国家在试图与以色列达成真正的和平。”这种情况下,民意测验人就可能不使用过滤问题。而如果民意测验人希望民意测验的结果表明,绝大多数人同意这样的说法,那么使用过滤问题就是一个好方法。这种操纵手法已经产生了不少极具煽动性的新闻。

令人困惑的态度矛盾

选择和意见的可塑性与态度矛盾密切相关。可塑性通常指的是人们对同一个问题的不同版本的回答的差异程度,而矛盾则指的是两种相关态度之间的差异(态度-态度的矛盾)。詹姆斯·普罗思罗和查尔斯·格里格(James Prothro&Charles Grigg)于1960年发表的实验是有关这一矛盾的最有说服力的实验之一。

普罗思罗和格里格感兴趣的是,美国民众是否会支持一些广为流传的民主原则的具体运用。这些民主原则在当时确实已经为绝大多数美国人所接受。比如说,这些原则包括:

1.公务员应该由大多数人投票选举产生。

2.每个公民应该有平等的机会影响政府政策。

3.少数派可以自由地批评多数派的决策。

普罗思罗和格里格概括出这些一般性原则后,列出了10个由此派生的问题,这些问题要么描述这些原则,要么与这些原则相矛盾。例如:

如果一个共产主义者想在这个城市里发表支持共产主义的演讲,应该允许他做这样的演讲。

或者:

在城市公投中,只有那些对公投问题有充分认识的人才有资格进行投票。

然后,普罗思罗和格里格在密歇根州的安阿伯(地名)和佛罗里达州的塔拉哈西(地名)随机抽取了一组已登记的选民作为样本,询问他们对这10个问题的态度。

研究结果非常惊人。对于每个问题,调查对象都难以达成90%的一致。而且,他们对于这些民主原则具体运用的态度判断往往与这些民主原则本身相矛盾。例如,51%的调查对象认为,只有那些对公投问题具有充分认识的人才有资格进行投票。这无疑是反民主的。另外,79%的人认为只有纳税人才有资格进行投票,也只有44%的人认为可以允许共产主义者公开宣传共产主义。普罗思罗和格里格(1960, p. 293)对这些具有讽刺意味的结果进行了总结:“假如我们承认美国是一个民主社会,我们就不能完全肯定地说,民众对民主原则的普通认同是一个民主社会存在的必要条件。”

这一研究只是态度-态度矛盾的一个极端的例证。一些后续的研究进一步证实了普罗思罗和Grigg的结论。人们对某一原则所持有的抽象态度往往与人们对这一原则的具体运用所持的态度无关。因为,在面临具体运用时,往往存在许多不可避免的复杂因素,如情境约束、其他与之相冲突的原则,等等。而且,正如本章下一部分将要说明的,关于态度-行为矛盾的研究显示,抽象态度与具体行为也只有很微弱的联系。

故地重游

1930年,斯坦福一个名为理查德·拉彼埃尔(Richard LaPiere)的社会学家与一对中国夫妇结伴周游美国。两年间,拉彼埃尔和那对夫妇游遍了全国,总共到过184个餐馆,67个旅馆、汽车旅馆和专门招待旅行者的家庭。虽然在当时存在着很严重的反华倾向,但在这些接待过他们的251个地方中,只有一次让拉彼埃尔感受到了种族歧视。事实上,拉彼埃尔认为,有72次他的同伴甚至受到了“超出一般规格”的优待。由此,拉彼埃尔认为,美国人对中国人并不存在偏见。

但在抽象概念的意义上,这种偏见却十分明显。旅游结束的6个月之后,拉彼埃尔向他到过的地方的业主送去一份调查问卷:“你会接待中国人吗?”在他坚持不懈的努力之下,回收了128份问卷,其中81份来自餐馆、咖啡厅,47份来自旅馆、汽车旅馆和专门招待旅行者的家庭。在这些问卷中,有118份问卷表示他们不会接待中国客人,有9份表示要视情况而定,只有1个汽车旅馆的妇女很肯定地说她曾经在夏天接待了一对中国夫妇。拉彼埃尔抽取了相同区域内的一些他们没有到过的地方进行调查,也得到了完全一样的结果:118份回答否定,9份回答视情况而定,1份肯定(如欲了解更多细节,参见LaPiere,1934)。这些发现说明,人们可能会有一些抽象概念,但这与他们的实际行为只有很微弱的联系,或是完全无关。

在拉彼埃尔的研究结果发表3年以后,斯蒂芬·科里(Stephen Corey,1937)也发表了具有相同结论的实验。科里感兴趣的是对待作弊的态度和作弊的实际行为之间的关系。为了测量对待作弊的态度,他让67名大学生完成了一个关于作弊的态度的实验。该实验看起来好像是匿名的,但科里用了一种很隐秘的手段来识别这些被试。利用这种方法,他能够将这些真实的看法与作弊的具体行为所联系起来。

科里度量作弊行为的方法如下:让这些学生每周参加一次考试,连续5周。对每次考试进行秘密评分,然后将看起来没有评分的试卷返回给学生,让他们自行评分并将评分结果返回。学生报告的分数与他们实际分数的总差异就是作弊的实际行为度量。作弊的平均程度为:每40~45道题中有两题不符。

科里的发现表明,人们的态度和行为之间的相关关系几乎为零。这些学生对待作弊的态度似乎与他们自己的作弊倾向没有多大联系。真正与作弊有关的是他们在考试中的表现。用科里(1937, p. 278)的话来说:“学生是否会在考试中作弊,很大程度上取决于他是否为这次考试做了充分的准备,而不是他自己所宣称的对待作弊的态度。”

我们这个时代的寓言

1973年,约翰·达利和丹尼尔·巴斯顿(John Darley&Daniel Baston)发表了他们的实验结果,这是有史以来最为生动的有关态度-行为矛盾的说明。达利和巴斯顿感兴趣的是,哪些因素决定人们会对处于困境中的人施以援手。被试是神学院的学生,他们要从一幢大楼走到另一幢大楼去做一场演讲,演讲的主题可以是这些学生擅长的某项工作,也可以是一个撒玛利亚人寓言(圣经中帮助处于困境中的人的故事)。实验助手会告诉学生,这些演讲的时间应该控制在3~5分钟内,而且会有另外的实验助手为他们作记录。然后,在学生去往目的地的途中,他们会遇到一个需要帮助的人。达利和巴斯顿想知道,究竟帮助他人的行为是否与下列因素有关:(a)学生要做的演讲主题是否与帮助他人有关,(b)他们在途中的匆忙程度。

在非常匆忙的条件下,实验助手会突然对被试学生说:“噢,你已经迟到了。你本来应该几分钟以前就到那儿的,我们最好马上去。那边的助手已经等你一会儿了,所以你最好快点,最好一分钟就赶到。”在一般匆忙的条件下,实验助手则会告诉学生:“那边的助手已经准备好了,请赶快过去吧。”而在不太匆忙的条件下,实验助手则会说:“还有几分钟那边才能准备好,但你最好现在就走,即使要等,也不会等太久的。”

为了到达对面的大楼,每个学生都必须穿过一条胡同。在这条胡同中,达利和巴斯顿安排了一个衣着破烂、垂头丧气地坐在门口的人,他垂着头,闭着眼睛,面无表情。当被试经过的时候,这个人会咳嗽两声,低着头痛苦地呻吟。如果学生停下来询问他有什么不舒服,或者提出要帮忙,这个人会含糊不清地说:“噢,谢谢(咳嗽)……不用了,我还好。(停顿一下)我早就有这个气喘的毛病了(咳嗽)……医生已经给我开了这些药,我刚才吃了一片……我只要坐下来休息一下就好……但还是很谢谢你的关心。”

如果学生坚持要将这个人送进大楼,这个人会接受学生所提供的任何帮助,并感谢他停下来帮助。学生离开后,这个人会马上按以下的五点量表对学生做出评价:

0=完全没有注意到这个人可能需要帮助

1=察觉到这个人可能需要帮助,但是并没有停下来帮助他

2=没有停下来,但间接地提供了帮助(比如,将这个人的情况告诉其他人)

3=停下来,询问这个人是否需要帮助

4=停下来询问后,坚持要将这个人送进大楼里去

达利和巴斯顿(1973)发现,相对于不是很匆忙的学生来说,匆忙中的学生停下来提供帮助的可能性要小一些。但是,演讲主题并没有明显地影响到学生是否会停下来提供帮助。事实上,有些要去讲有关撒玛利亚人寓言的学生为了不迟到,在经过胡同时甚至跨过了那个人!这些结果生动地说明,抽象概念——在这一案例中,也就是帮助他人脱离困境的重要性——与实际行为有极大的区别。

对矛盾的再研究

态度和行为是否总是这样的矛盾呢?1969年,心理学家艾伦·威克(Allan Wicker)发表了一篇研究回顾文章,文章认为答案是肯定的。威克的这个结论对态度研究来说是一个很大的打击。威克列举了46项研究作为其文献回顾的基础。在这些研究中,有关态度和相对应行为的实验是在不同条件下进行的。被试的来源十分广泛,包括了大学生、保险经纪人、工厂工人、妇产科护士,等等。同样,研究的主题也非常宽泛,包括了公共住房、足球、民权运动,等等。

在这46项研究的基础之上,威克(1969, p. 65)总结道:“态度与行动并不是那么密切相关。态度与表露在外的行为实际上是无关的,或只有很微弱的联系。”根据他的研究,态度与行为的相关系数往往趋近于零,只有在很少的情况下这一系数会超过0.30。两年之后,威克(1971)做了更进一步的研究,他认为,即使抛弃“态度”这一概念也未尝不可。

可以想像,这些结论当然会令态度研究者们感到十分不安。没有多久,修正学派诞生了。修正学派的拥护者们认为,在某些条件满足的情况下,态度与行为是一致的。这些条件包括:(1)必须仔细选择态度和行为的测量方法,应该尽可能有效和可靠;(2)只要有可能,应该尽量以多种方式来研究态度和行为;(3)为了避免出现干扰变量,研究态度和行为的时间应该被安排在一起;(4)在行动、行动的对象、行动发生的情境以及行动发生的时间方面,态度和行为的测量手段应该相匹配。

在1977年发表的一篇文献回顾中,艾克·阿杰增和马丁·菲什拜因(Icek Ajzen&Martin Fishbein)说明了其中一些条件的重要性。阿杰增和菲什拜因从具体对象和行动的角度来定义态度和行为的符合程度,并将100多项研究中的态度-行为关系分为三类:高符合程度,中等符合程度和低符合程度。当态度和行为的符合程度较低时,阿杰增和菲什拜因发现,大多数情况下,态度和行为之间不存在显著相关。而另一方面,如果对态度和行为进行了仔细测量,且它们在具体对象和动作方面的符合程度较高时,态度-行为的相关系数则至少为0.40。也就是说,如果态度是关于某项特定的动作,且这一动作指向某个特定的对象,那么态度就能很好的预测行为。但是,如果态度指向的对象并不是行为所指向的对象,态度和行为相一致的程度就降低了。阿杰增和菲什拜因认为,拉彼埃尔(1934)之所以认为态度和行为只有很微弱的一致性,是因为其研究中态度的对象(普遍意义上的中国人)和行为的对象(一对特定的中国夫妇)相距甚远。

结论

可以用一句俄罗斯名言来概括了本章所讨论过的大多数研究结果。正如那位著名的俄国沙皇亚历山大所说的(大意如下):“跨越人生并不是像跨越一片田野那么简单。”应用到决策与判断的研究上来说,也就是:“衡量一种态度、看法或是偏好,并不是像问一个问题那么简单。”

态度、意见和选择往往具有惊人的可塑性。在许多情况下,问题的措辞对人们的回答有非常重大的影响。因此,我们对问题的结构和情境要特别小心。第6章将给出一些例子来说明,微妙的措辞变化是如何影响决策和判断的。

第6章 问题的措辞和框架的影响

1986年英国举行的一项盖洛普民意测验中的一个问题是:自己的国家拥有核武器是否会让他们感到“安全”时。40%的人对此持肯定态度,而50%的人则对此持否定态度(剩下的10%没有明确意见)。然而,当测验问卷中的“安全”被改为“更加安全”时,答案的百分比却倒转了过来:50%的人认为拥有核武器让他们感到更加安全,36%的人认为拥有核武器让他们感到更加不安全(Lelyveld, 1986年10月5日)。

这些结果说明了措辞微妙变化的重要性。有时候,即使只改变一两个词语——不管是问题本身变化还是答案选项变化——也会对人们回答问题产生深刻影响(Borrelli, Lockerbie,&Niemi, 1987)。考虑一下下面这个例子。

一项取巧的任务

这是在1969年。你是一名卓越的盖洛普民意测验组织的民意测验专家,同时也是一个为达到目的而不择手段的人。你的一项秘密任务就是要进行一次民意测验,并使这项测验的结果表明,美国公众希望美国加快从越南战争撤军。你怎样才能够达到目的呢?

在这一年的6月,盖洛普告知问卷回答者:尼克松总统已经宣布,未来的3个月内将有25000军队将从越南撤出。回答者需要回答“撤军应该加快还是应该减速”(“保持现状”并没有被直接包括在答案选项中,但如果回答者主动提到,采访者仍然需要记录这个答案)。几乎一半的回答者(42%)认为应该“加快”, 16%认为应该“减速”,另外29%认为应该“保持现状”(Converse&Schuman, 1970年6月)。

你将这些结果向媒体公开,第二天全国报纸的头条都是:美国民众希望加快撤军速度。现在,你便可以轻松地坐在椅子上,偷偷享受自己的成功了。

但不久之后,另一家民意调查机构哈里斯(Harris)做了一个类似的调查,只是问题变成了:“你认为总统的撤军速度是过快,过慢,还是恰到好处?”在对这一问题的回答中,有半数的人(49%)认为撤军速度刚刚合适。只有29%的人倾向于加快撤军速度,而6%的人认为撤军速度过快(Converse&Schuman, 1970年6月)。

拿起报纸,现在你看到的头条又成了:美国民众希望维持现在的撤军速度;先前的民意测验是错误的。

“先前的民意测验是错误的?”你问自己。盖洛普进行的这次民意测验肯定是没有错误的。但如果先前的民意测验也没有错误,那么究竟哪个测验是正确的呢?

其实,与其探究究竟哪个民意测验是正确的——两种情况都可能成立——还不如仔细考虑一下这两个测验结果各自有什么样的含义。盖洛普使用的是一个没有明确包括中间选项的“迫选”问题。因此,即使人们只有非常非常小的偏好,也只能选择加快或减速撤军。没有中间选项的问题,常常能够有效地检测出人们的一般倾向。但如果要做到十分严谨,报道盖洛普测验结果的头条应该改为:如果只能在加快或减速撤军中选择一项,美国民众希望加快撤军速度。因为,盖洛普民意测验的结果并不代表真正不满意撤军速度的美国民众的比例。

与之形成对照的是,哈里斯调查为回答者提供了一个明确的中间选项。增加一个中间选项的效果与增加一个“没有看法/不知道”过滤器的效果差不多;通常,会有10%到40%的人转而选择中间答案,但是边际比例基本上会维持不变(在这个例子中,边际比例是认为“过快”和“过慢”的人之比)。但是设置这样一个中间选项也有缺点。这是一个“安全”答案,因此在某些情况下可能会产生虚假信息。

开放式问题

引入一个中间选项可能会鼓励人们选择中立。另外,引入一些其他选项也

表6.1 有关重要性的问题

注释:这些数据来自舒曼和斯科特(1987)所做的调查,他们在调查中询问了8名被试一个开放性问题“你认为这个国家当今所面临的最重要的问题是什么?”,询问171名被试一个封闭式问题“你认为以下哪个问题是这个国家当今所面临的最重要的问题:能源短缺,公立学校的质量,堕胎合法化还是污染问题,如果其中没有你想要选择的答案,你可以填写其他答案。”

可能导致选择这项答案的人数增多。霍华德·舒曼和杰奎琳·斯科特(Jacqueline Scott)于1987年发表的研究便说明了这样一种现象。

在一次全国性调查中,舒曼和斯科特要求调查对象回答:“当前我们国家所面临的最重大的问题是什么?”正如表6.1的第一行所列,如果以“开放式问题”(调查对象给出自己的回答)的形式来询问调查对象,那么只有2%的人认为,当前最重大的问题是能源短缺、公立学校教育质量、合法堕胎或是污染问题(参见你在读者调查中第27题的回答)。然而,当舒曼和斯科特将这些回答频率不高的答案纳入到“封闭式问题”中时,情况就完全不同了(在封闭式问题中,调查对象需要从答案列表中选出答案)。正如表6.1的第二列所示,大部分的调查对象选择了一个不常见的答案作为国家现在所面临的最重大问题。将这些不常见的回答在答案选项中列出后,它们的被选频率就提高了30倍。

封闭式问题有时候可能会把那些平时很少想到的不常见答案纳入选项中,这样做确实会扭曲调查结果。但有时开放式问题同样也会对回答产生误导。比如说,当人们被问到“近代世界上发生过的最重大的事件是什么”时,只有不到2%的人提到了计算机的发明。但当计算机作为一个答案选项出现时,大约有30%的人都选择了这个答案(Schuman&Scott, 1987)。在这个例子中,使用封闭式问题比使用开放式问题更能够体现人们真实的看法。

即便是回答一些非常普通的问题也容易受到答案选项的数量和类型的影响。比如说,一项研究就发现,被试对电视使用时间的回答会随着问题答案的种类而变化(Schwarz, Hippler, Deutsch,&Strack, 1985)。在这一实验中,被试用了两种量度来表示他们每天看电视的时间。每种量度都以半小时为间距,分为六种水平。第一种以“最多半小时”开头,以“超过两个半小时”结尾。

表6.2 什么才是事实

注释:第一对问题摘自伊莉莎白·洛夫特斯的研究(1975),第四对问题摘自理查德·哈里斯的研究(1973)。所有差异都具有统计学上的显著性。

而第二种则以“最多两个半小时”开头,以“超过四个半小时”结尾。对于第一种问题,有84%的人回答说每天看两个半小时左右的电视。而对于第二种问题,则只有63%的人表示每天看两个半小时左右的电视。

正如诺伯特·施瓦茨(Norbert Schwarz)和他的同事(1985)所说:“量表不仅仅是被试用来描述他们行为的‘衡量工具’。更确切地说,被试在评价他们自身的行为时,往往利用了答案选项中所提供的行为范围作为参照框架。”框架化的答案选项——正如问题本身一样——从来都无法做到完全中立,它们通常传递了一种隐含的可以接受的答案(见表6.2,一些隐含了答案的问题)。正如下一部分将要阐述的那样,当一些答案比另外的答案更能具有社会称许性时,答案偏差也可能产生。

社会称许性

1982年,曾经负责为里根总统做民意测验的理查德·沃思林(Richard Wirthlin)在一次全国性调查中发现,58%的调查对象同意这一说法:“我们应该反对美国冻结其核武器,因为这对于减少那些业已存在的数以万计的核武器来说毫无益处,而且还会使前苏联处于核优势状态。”但就在几分钟后,又有56%的调查对象表示同意这样的说法:“我们应该赞成美国冻结其核武器,因为这样才能开展我们现在迫切需要实施的行动,那就是阻止世界上其他国家建立核武器储备,减少爆发核战争的可能性。”实际上,有27%的调查对象同时赞成两种说法。沃思林这样描述道:“这是我们所问过的问题中,最具有矛盾性的一个问题。”(Clymer, 1982年5月6日)

为什么会出现这种情况?当调查对象对冻结核武器缺乏一个坚定的看法时,他们就可能会试图给出最具有社会称许的答案。第一个问题将支持冻结核武器与让前苏联占据核优势等同,而第二个问题则将冻结核武器与世界和平相联系起来。几乎没有一个美国人会赞成让前苏联占据核优势,但也没有人会反对世界和平。

当人们对一个问题并没有很坚定的信念时,他们通常会对那些“最广为流传的句子”做出反应,这些句子使得人们的态度往社会所赞许的方向靠拢。例如,《美国新闻与世界报道》曾经公布了一项民意调查的结果。在这一调查中,58%的调查对象赞成对尼加拉瓜反抗者进行援助以“防止共产主义影响的扩散”,但只有24%的人赞成对“试图推翻当权政府的人们”进行援助(Budiansky, 1998年7月11日)。对于大多数的美国人来说,“预防共产主义”是一项被认可的行为,而“推翻当权政府”则不然。

其实早在1940年,哈德利·坎特里尔(Hadley Cantril)在两次有关美国是否应该参加第二次世界大战的民意测验中就得出了相同模式的结果。只有13%的调查对象同意“美国应该做出比现在更多的努力去帮助英国和法国”。但当第二组调查对象被问到“你认为美国是否应该做出比现在更多的努力,去帮助英国和法国打败希特勒”时,这个数字就攀升到了22%。在当时,帮助“打败希特勒”比单纯地帮助英国和法国更具有社会称许性。

允许还是禁止

在另一组早期的民意测验中,鲁格(Rugg, 1941)向不同的调查对象分别询问了以下两个问题之一:

你认为美国是否应该允许公开发表反民主的演说?

你认为美国是否应该禁止公开发表反民主的演说?

虽然这两个问题看起来好像是问的都是同一件事情,但鲁格却发现它们导致了完全不同的回答。当人们被问到美国是否应该允许公开发表反民主的演说时,62%的人持否定看法。另一方面,当人们被问到美国是否应该禁止公开发表反民主的演说时,只有46%的人作出肯定回答(从逻辑上来讲,禁止与不允许发表这类演说是等同的)。在对此发表意见的调查对象中,回答“不允许”发表反民主演说的人竟然比回答“禁止”发表反民主演说的人多出20%!

舒曼和普雷瑟(1941)曾在20世纪70年代将鲁格的实验重复做了3次,每次都得到了与鲁格(1941)类似的结果。在跨越了30年的4次调查中,相对于“允许”类问题来说,“禁止”类问题使得支持演说自由的人数大增(有可能是因为“禁止”更容易让人联想到自由的丧失)。舒曼和普雷瑟的实验与鲁格的实验只有一个明显区别,那就是,20世纪70年代的美国人更能够容忍自由演说一些。所以在对这两个问题的回答中,70年代支持自由演说的人都比40年代支持自由演说的人多出了将近30%。

允许-禁止的差异在其他话题的一些实验中也得到了验证。例如,希普尔和诺伯特·施瓦茨(Hans-J. Hipper&Norbert Schwarz, 1986)就发现,在偷窥、(青少年禁看的)X级片、高速公路上用盐来化雪等问题上,“不允许”和“禁止”就存在明显的差别。其他一些民意测验还发现,调查对象中只有29%的人赞成进行“反堕胎”的修宪,但却有50%的人赞成进行“保护未出生生命”的修宪(Budiansky, 1988年7月11日)。

框架

正如以上研究结果所示,人们对损失(比如禁止)和获得(比如允许)的反应是有差别的。但直到心理学家阿莫斯·特韦尔斯基和丹尼尔·卡尼曼(Amos Tversky&Daniel Kahneman)普及了“框架”这一概念之后,这一差别的重要性才得到人们的广泛认识。特韦尔斯基和卡尼曼(1981)认为,决策框架是“决策者所拥有的有关动作、结果以及某一特定选择可能引发的有关情况的一系列概念”。特韦尔斯基和卡尼曼(1981)认为,决策框架部分是由问题形式决定的,部分是由社会规范、习惯和决策者的性格特征决定的。在特韦尔斯基和卡尼曼的研究中,他们着重研究了不同问题形式所产生的不同效果。

这些效果可以通过下面这个赌钱的例子看出来(特韦尔斯基和卡尼曼的一个实验)。在决策1中,你必须从选项A和选项B中选择一个:

选项A:肯定会获得240美元

选项B:25%的概率获得1000美元,75%的概率什么也得不到

你会做何选择?(可以参考你在读者调查中第25题的答案。)记录下你的选择后,再来看决策2:

选项C:

肯定会输掉750美元

选项D:75%的概率输掉1000美元,25%的概率什么也不会输掉

特韦尔斯基和卡尼曼(1981)发现,在决策1中,人们更喜欢选择A。84%的被试选择了选项A而不是选项B。正如第5章所提到的,当面临获利时,人们往往是规避风险的(“二鸟在林”对人们来说往往不如“一鸟在手”),但在决策2中面临损失时,人们则往往更喜欢赌一赌运气。特韦尔斯基和卡尼曼实验的被试中,有87%的人选择了选项D。因为当面临损失时,人们更乐于冒风险。这种风险偏好和风险规避同时存在的情况非常普遍,因此在特韦尔斯基和卡尼曼(1981)的实验中,有73%的被试同时选择了选项A和D,只有3%的人同时选择了选项B和C。

有趣的是,选择B和C实际上比选择A和D更加有利。只要将已选选项的结果加总(见图6.1)就可以看出来。选择A和D,不但可以肯定地获得240美元的同时,而且输1000美元的概率只有75%。也就是说,输掉760美元的概率是75%,获得240美元的概率是25%。而如果选择B和C,则只有25%的概率获得1000美元,75%的概率一无所获,扣除掉一个确定的750美元的损失之后,得到的是25%的概率获得250美元和75%的概率输掉750美元。

也就是说,将选项组合后得到的选择方案是:

A和D:75%的概率输掉760美元,25%的概率获得240美元

B和C:75%的概率输掉750美元,25%的概率获得250美元

如果你选择了A和D,那么相对于选择B和C,你将获得更少的钱或是输掉更多的钱。不管是输钱还是赢钱,选择B和C都比选择A和D更为有利。

图6.1 虽然选项B和C比A和D的结果更有利,特韦尔斯基和卡尼曼(1981)发现,与B和C相比,人们更多地选择了A和D。

良药苦口难下咽

在医疗问题上,框架效应显得尤为重要。由特韦尔斯基和卡尼曼(1981)进行的“亚洲疾病”问题的研究是有关医疗方面框架效应的最早也是最有名的实验:

假设美国正在为亚洲即将爆发的一场非比寻常的疾病做准备,这场疾病可能会导致600多人丧生。如何与这场疾病作斗争,这里有两套方案。假设对每种方案结果的科学估计如下:

如果实施方案A,能够挽救200人的性命。

如果实施方案B,有1/3的概率挽回600人的性命,有2/3的概率无法挽救任何人。

你支持哪一个方案?

特韦尔斯基和卡尼曼发现,在这一框架下回答问题的人中,有72%的人属于风险规避型;他们选择能够肯定挽回200人生命的方案,而不是以如此多人的生命作赌注。

但如果改变问题的框架,特韦尔斯基和卡尼曼却得到了完全不同的答案。他们给了另一组调查对象同样的问题,只是改变了对方案结果的描述:

如果实施方案C,400人会死亡。

如果实施方案D,有三分之一的概率没有人死亡,有三分之二的概率600人都会死亡。

虽然这种框架下的方案C和D和前述框架下的A和B从数字上来说是等同的,但却有78%的回答者变得更愿意冒风险了;他们更愿意赌一赌,而不愿意接受400条生命的丧失。

有关医疗决策的其他研究也得到了类似的结果(Wilson, Kaplan,&Schneiderman, 1987)。例如,《新英格兰医学杂志》(New England Journal of Medicine)上发表的一项实验显示,框架影响到了内科医生对肺癌治疗的决策(McNeil, Pauker, Sox,&Tversky, 1982)。这一实验的被试包括424名放射科专家,491名学习过统计学和决策理论的研究生,以及238名患有各种慢性病但无需卧床的病人。他们向所有的1153名被试展示了两种肺癌治疗方法的信息概要(外科手术和放射性治疗)。读完这些概要后,他们要马上在两种治疗方法中做出选择。

一半被试所读到的信息概要是从病人的存活概率的角度来描述(比如说,68%的概率能够多活一年)。而另一半的回答者所读到的信息概要,则是从死亡概率的角度来描述(比如说,一年之后死亡的概率为32%)。由于肺癌手术的最大缺点就是在手术进行中或者手术结束后的短时间内死亡率较高,因此实验者推断,如果信息概要是从存活率的角度而不是从死亡率的角度来表述,那么选择外科手术的频率应该会高一些。

事实上,实验结果也的确如此。当以存活率表述时,选择手术而不是放射性治疗的人数百分比为75%,而以死亡率表述时,则为58%。这种选择结果不仅存在于病人中,也存在于内科医生和研究生中。因此说,即使是那些受过高等训练的专家所做出的生死攸关的决策,也会受到问题框架形式的深刻影响。

税收抵减的逻辑

在一篇引人深思的关于“经济推理”的文章中,哈佛经济学家托马斯·谢林(Thomas Schelling, 1981)向人们举了一个十分有趣的例子,在这个例子中,“重构”问题能够产生惊人的结论。谢林注意到,当时美国的所得税法规定,征收家庭所得税时,每个孩子可以抵减1000美元的家庭收入(也就是说,在将家庭总收入转换为应纳税收入时,有一个孩子就可以少算1000美元的收入)。这一抵减金额是固定的,它并不因家庭总收入的变化而变化。

但谢林对此提出一个问题,不允许那些富有家庭在每个孩子身上得到更大的税收抵减是否合理?毕竟,相对于贫穷家庭来说,富有家庭在每个孩子身上的花费更多一些,而且一个富有家庭生育孩子的费用也比贫穷家庭的花费高出许多。

大多数的人都反对这一政策。人们认为,“完全没有道理进一步扩张富人的特权——更不能以牺牲公众的利益为代价。”

但谢林提出,如果税法以另外一种方式表达,情况也许不同。假设税法这样规定:一般来说典型的家庭都有2~3个孩子,那么对每个家庭征税时,加征一个“无子女附加税”以代替原来的税收抵减。也就是说,如果一个没有子女的家庭需要多缴税(而不是给有孩子的家庭予以税收抵减),那么一个无子女的贫穷家庭和一个无子女的富有家庭是否应该缴纳一样多的税收?

在这种情况下,人们就会说,富有家庭应该比贫穷家庭缴纳更多的税收。由于富有家庭在孩子身上的花费往往要比贫穷家庭更多,因此可以推断,相对于无子女的贫穷家庭来说,无子女的富有家庭能够负担更高的附加税。但问题在于,这一论述恰恰与刚才的有关富有家庭不能享受更多税收递减的论述相冲突。用谢林(1981, p. 55)的话来说:“所得税可以以无子女夫妇的家庭收入为基础,然后对有子女的家庭收入税予以调整;也可以是以有子女夫妇的家庭收入为基础,然后对无子女的家庭收入税予以调整。既然二者都能够得到相同的收入税,那么无论选择哪种方式应该不存在任何区别。”

但事实上却是有区别的。因为只要实施税收抵减,人们就会认为——并且好像有很好的理由——抵减额应该是固定的。

心理分账

决策者不仅会构架他们的选择——他们也会构架选择的后果。特韦尔斯基和卡尼曼(1981)将这种过程称为“心理分账”。心理分账(psychological accounting)是指,某一结果只是从动作直接结果的角度来描述(特韦尔斯基和卡尼曼称之为“简单账户”),还是需要综合考虑这一动作与其他行为的先前关系(特韦尔斯基和卡尼曼称之为“综合账户”inclusive account)。

下面这组问题(摘自特韦尔斯基和卡尼曼1981年所做的一个实验)就是心理分账的一个例证:

问题1:假设你想看一场戏剧,门票是10美元。当你走到戏院门口时,发现自己掉了10美元。你还会花10美元看戏吗?

在特韦尔斯基和卡尼曼调查的183名对象中,有88%的人表示他们仍然愿意花10美元看戏。大多数人并未将这10美元的损失与买票联系起来;相反,他们将这一损失划分到一个单独的账户上。

现在来看一看第二个问题:

问题2:假设你想看一场戏剧,并花了10美元买票。当你走到戏院门口时,发现自己把门票丢了。座位并没有被标记出来,门票也不可能再找到。你会再花10美元买一张票吗?

在特韦尔斯基和卡尼曼调查的200名对象中,只有46%的人表示他们愿意再买一张票。虽然丢一张票的损失与丢10美元的损失从金钱上来说是等同的,但大多数的回答者显然将买第二张票的成本与买第一张票的成本加在了一起——而且认为这20美元是额外的花销。

特韦尔斯基和卡尼曼还做过另外一个有关心理分账的实验:

假设你准备买一件价值125美元的夹克和一个15美元的计算器。卖计算器的人告诉你,另一家分店里的计算器正在减价,只卖10美元。但是开车到那里需要20分钟,你会到那家分店去买吗?

对这一问题的回答中,有68%的被试表示愿意开20分钟的车以节约5美元。

但是如果计算器要125美元而夹克只要15美元呢?特韦尔斯基和卡尼曼就此问题询问了88名被试:

假设你准备买一件价值15美元的夹克和一个125美元的计算器。卖计算器的销售员告诉你,另一家分店里的计算器正在减价,只卖120美元。但是开车到那里需要20分钟,你会到那家分店去买吗?

在特韦尔斯基和卡尼曼的实验中,只有29%的被试表示他们愿意开车去。当计算器被标价为125美元时,多于2/3的被试表示他们不会为了节省5美元而开20分钟的车,虽然这一削价与先前问题中提到的削价没有什么区别。

这是为什么呢?特韦尔斯基和卡尼曼(1981)认为,被试是从简单账户的角度来结构化第一个问题的,因为20分钟的车程是直接与5美元的节省相比较的。而在第二个问题中,被试将整体购买价格综合进了账户中,因此5美元显得就不那么重要了,甚至可以忽略。乔治·夸特龙(George Quattrone)和特韦尔斯基(1988)进一步解释道,人们是根据“比率-差异原则”来做选择的,两个金额之间的固定(正)差额的影响随着它们之间比率的增加而增加。20美元与15美元的比率为1.33,这当然比125美元与120美元的比率1.04更有影响力。理查德·塞勒(Richard Thaler, 1985)在研究心理分账在消费选择中扮演的角色时也发现了类似的框架效应。

这些发现以及本章先前所提到的其他实验结果并不意味着一个聪明的销售员或是民意测验专家可以得到他们想要的任何结果。它们只是说明,问题的措辞和框架往往具有非常大的影响力,十分值得人们去关注。虽然这些结果看起来好像是不言自明的,但实际上——正如接下来的3章所表明的那样——人们花了很长时间来认识它们。

结论

人们在得知某一公众民意调查的结果时很少会想到,这些问题是否经过了过滤,答案选项中是否包括了中间选项,问题是从收益还是从损失的角度来提问的,等等。大多数人往往会相信,被访者是按照他们自己的信念来回答问题的。但大量的研究表明,框架和问题的措辞能够显著地影响人们的回答。

对于那些有关决策与判断的调查和研究,一定要考虑人们的答案是否会随着以下因素而发生变化:

问题呈现的顺序

问题出现的情境

问题是开放式还是封闭式

问题是否经过了过滤

问题是否包含了某些时髦词句

答案选项的范围

答案选项出现的顺序

是否提供了中间选项

问题是从收益还是从损失的角度来提问的

如果你觉得这些因素的变化可能会改变人们的回答,那么在经过措辞改变测试之前,你的研究结果是不具有可信度的。正如保罗·斯洛维奇、戴尔·格里芬和特韦尔斯基(1990, p. 25)所说:“如果结果在经过了多种程序的测试之后仍然是一致的,那么我们就有理由相信这些判断;如果不是,就需要更进一步的分析。”由于判断往往容易受到问题措辞和框架的影响,最安全的做法就是以多种方法来测试和比较结果。

[1]正如汤姆·史密斯(Tom Smith, 1984)所说,意见和虚假意见(或者有时候被称为态度和虚假态度)实际上是一种连续状态的两个终端,但并没有清晰和定量化的定义。然而,区别这二者仍然是非常有用的(正如冷和热都是一种连续状态的一部分,但却是截然不同的)。

对这一术语的另一点补充:全书中,“意见”和“判断”通常是可以互换的,而“态度”则通常指带有评价性的判断(在好-坏,喜欢-不喜欢,同意-不同意等维度上面进行判断)。例如,对于罐子里有多少豆子,人们形成的是意见或是判断,而很少是一种态度。大多数的心理学家在使用“态度”这一术语时,指的都是带有评价性的判断。而在实际中很难区分态度、意见和判断。