开始这一节之前,让我们先来看几个小测验。请阅读每个问题,并写下一个数值区间,确保你有九成的把握让准确答案落在该区间内。
好了,现在请开始写下你的答案:
1.我有九成的把握认为马丁·路德·金去世时的年龄是_____岁到岁之间。
2.我有九成的把握认为旧约全书的总卷数在_____卷至_____卷之间。
3.我有九成的把握认为沃尔夫冈·阿玛迪斯·莫扎特诞生于_____年到_____年之间。
4.我有九成的把握认为亚洲象的妊娠期是_____天至_____天。
5.我有九成的把握认为已知的海洋最深点是_____英尺[1]至_____英尺。
这些问题涉及认知的一个重要方面,在这里,人人都是“我方立场信息加工员”。该认知领域关注人们如何调控自己对已有信念的自信程度。心理学家使用一种称为“知识标尺范式”的实验设计完成了大量研究[2]。在这种实验范式中,需要形成对知识自信度概率判断的集合。毫无疑问,单一事件的概率判断是无法评估的。比如,你说你的外甥今年有95%的可能性会结婚,我们怎么能判断这个概率估计是否正确呢?但是,概率判断的集合却是可以被评估的,因为该集合必须遵循特定的统计标准。
举例来说,气象预报员说明天的降水概率是90%,而实际上明天却是一个艳阳天。虽然天气预报不准确,但我们也不能说预报员的判断错误。气象预报员也许已经充分分析了所能获取的所有数据,并对数据进行了正确的处理。根据现有的气象数据来看,降水概率很大,只不过今天刚好没有下而已。但是,如果天气预报员预测降水概率90%的所有日子里,其中有一半都是晴天,那么我们就有理由质疑天气预报的准确性了。在天气预报员预报降水概率是90%的所有日子中,你会期望有90%的时间会下雨。虽然气象预报员不能确定10%的晴天会发生在哪一天(不然的话就可以说是100%的降水概率了),但是,如果天气预报员有50天预测“降水概率90%”,那么50天中至少应该有45天是下雨的。
对人们知识标尺的评估过程,就好比我们评估气象预报员的准确性一般。研究者让被试对一些多项选择题或判断题进行作答,每道题目都注明了被试对答题正确性的把握程度,即被试认为答案正确的主观概率。只有当主观概率与正确率一一对应时,才能说他具备了知识理性。也就是说,被试对标注为70%把握度的所有问题集合,答题正确率应达到70%;对标注为80%把握度的所有问题集合,答题正确率应达到80%,以此类推。如果比率一一对应,就可谓是拥有优秀的知识标尺。如果两个比率差距较大,未达到一一对应,那么他就不能称为具有知识理性。知识标尺失准会导致个体无法选择出最佳的行动方案。
在很多不同种类的知识标尺实验中,我们都可以看到过分自信现象的身影。这些实验发现,人们的主观概率估计始终都高于实际的答题正确率。比如说,当被试认为自己有100%的把握可以正确回答问题时,实际正确率往往只有88%;当被试说他们有90%的把握能够回答正确时,实际正确率大概是75%。在判断正误题中,通常来说,当被试对自己的答案有七八成的把握时,他们的实际表现和瞎猜差不多,正确率只有50%左右。
对于知识标尺的过度自信效应,部分源自于我们对首先跳出脑海的念头的执着。我们会对这个念头是哪儿来的稍作思考,之后,本着节省认知资源的原则,我们会快速得出答案:这个想法是“我自己思考后得出的”。被试会将这个首先跳出的答案作为焦点假设(类似于我方立场偏差),并将注意力着重放在这个焦点假设上,进而忽视了其他的非焦点答案。简而言之,“导致过度自信的原因之一,是未能找到自己错误的理由”(Baron,2000)。对最终答案的信心,来自于排除其他答案的证据,但是被试并没有意识到提取证据的过程是存在偏差的——只有首选的答案才有机会获得认知资源的垂青,为其寻找支持的证据,那些非焦点答案只有少得可怜的认知资源可供使用。这种做法的结果就是被试对于他们的答案信心爆棚。
下面是本节伊始提出的那些问题的精确答案,你可以对照答案了解一下你是否也是过度自信现象的受害者[3]:
(1)39岁;
(2)39本;
(3)1756年;
(4)645天;
(5)36.198英尺。
请回想一下,在回答这些问题之前,实际上本节的标题已经警告过我们要小心过度自信现象,在已经收到提示的情况下,你还会不会中招呢?我们拭目以待!由于所回答的问题都是你有九成把握回答正确的,按理说,你的答题正确率应该有90%。10道题中应该只有1题的答案不在你给出的数字区间。由于我们只出了5道题,因此你给出的数字区间应该全对,最差的情况也是仅错一道。基于我们过去的研究经验来看,如果你给出的数字区间错误数多于一次,说明和多数人一样,在进行概率判断时受到过度自信的影响(虽然本节题目已提出过警告)。
研究者在知觉、运动领域以及知识标尺实验范式中都证实了过度自信效应的存在。过度自信现象不仅仅只出现在实验室中,在现实生活中也非常常见。比如,人们会高估自己对体育比赛结果、行为后果、经济走势等未来事件的预测准确性。过度自信在称为“计划谬误”的现象中表现得淋漓尽致。所谓计划谬误,是指人们常常会低估自己完成某项任务(比如完成一篇优秀论文、完成当年的税务表格、完成一项基建项目等)所需的时间。诺贝尔获奖者丹尼尔·卡尼曼曾经讲述过一个有趣的故事,告诉我们计划谬误有多么棘手,甚至连决策研究领域的专家也难免中招。数年前,卡尼曼加入了一个由决策研究专家组成的委员会,该委员会致力于开发一门适用于高中生的决策与判断课程。这个委员会成员每周定期开会以商讨课程内容并完成教科书的写作。在一次会议上,卡尼曼让大家估计课程设计和教科书写作全部完成所需要的时间。包括教务长和卡尼曼在内的专家给出的答案是最短为18个月,最长为两年半。当时正值20世纪70年代,很多课程和教科书都处于重新设计阶段。卡尼曼问教务长,他负责过多少门课程的开发工作?那些和当前课程相似的课程大概用了多久才能全部完成?教务长想了一会儿,面带羞愧地说,他负责的课程中,大概有40%的课程建设半路夭折,从未完成。听闻教务长这句话,房间里立刻弥漫着尴尬的气氛。卡尼曼觉察到这一点,为了缓和氛围,问教务长:“那些完成的项目呢?用了多长时间?”教务长再次陷入尴尬,告诉课程编撰委员会,那些已完成的项目,用时全部是7年以上[4]!
对知识标尺过度自信的认知偏差带来了很多严重的现实后果。那些自认为懂得很多、实则并非如此的人,继续学习或修正错误的动机和意愿较弱。那些自认为拥有卓越的动作与知觉技能的人,常常会对他人的表现吹毛求疵,但对自己的错误却浑然不知,也不愿意接受批评。举例来说,很多调查表明,绝大多数人认为自己的驾驶技术处于中上游水平。加拿大安全委员会的一项调查表明,75%的驾驶员承认他们曾经有过驾车时打电话、吃东西、刮胡子或化妆的行为。奇怪的是,同一批被调查者中有75%的人报告说,当他们看到其他驾驶员一边驾车一边吃东西或打电话时,会因此而抓狂和害怕。成千上万的驾驶员过度自信地认为,自己开车时打电话对驾驶行为不会造成干扰。这些“自信”的驾驶员为自己缺乏知识理性所付出的代价是惨重的。数据表明,由于驾驶环境中增加技术性干扰而导致的交通事故在逐年增加。缺乏精确的概率标尺是人类缺乏知识理性的一种表现形式,它无处不在,往往会带来深远的后果。例如,医生群体中的过度自信现象就是广泛存在且非常危险的[5]。
人们对自己的驾驶技术标尺失准和社会心理学研究中的自我评价偏差有着密切的联系。人们常常会扭曲对自我的知觉,虽然并非每一次的扭曲方式都相同,但绝大多数时候,扭曲的结果倾向于自我提升[6]。在一项以参加SAT测试的800000名学生为调查对象展开的评估中,仅有不到2%的学生认为自己的领导能力低于同龄平均水平。有超过60%的学生认为自己与人交往的能力位居同龄人中的前10%。贾斯汀·克鲁格(Justin Kruger)和大卫·唐宁(David Dunning)的研究发现,在一项逻辑思维测试中,得分为倒数25%的学生的自评成绩平均是年级前38%,也就是说,即使是得分最低的学生也认为他们的测验成绩高于平均水平!
最后,为大家介绍我方立场信息加工的螺旋循环。普林斯顿大学的心理学家艾米丽·普罗宁(Emily Pronin)通过调查研究发现,人们的自我评估偏差还表现在对自我评估偏差程度的评估[7]。普罗宁对研究社会和认知心理偏差的文献进行了总结归纳,比如光环效应、自我服务归因偏差(成功时归因于自己,失败时逃避责任)等。在这些研究中,让被试对自己受到各种偏差影响的易感性进行了自我评估,同时,也评估了他人的易感性。普罗宁和她的同事发现,在8类社会认知偏差研究中,人们一致认为他人对认知偏差的易感性高于自己,也就是说,认为他人比自己更容易受到认知偏差的影响。简而言之,人们承认认知偏差的存在,但却坚信自己是不受影响的特殊个例。
为何会出现这种称为“偏差盲点”的现象呢?根据普罗宁的推测,当估计他人的认知偏差程度时,人们依赖的是对通俗心理学理论的肤浅了解。可是,当评估自己的认知偏差时,他们却栽在了对意识层面内省过程的监控上,这也是我方立场信息加工的一部分。现代通俗心理学理论的传播让人们对各类认知偏差略知一二,认为自己可以预测他人的认知偏差。可是,绝大多数社会和认知偏差是在被试对偏差毫无意识的情况下发现的。因此,当人们在意识层面寻找自己的认知偏差时,会一无所获。在预测他人的认知偏差行为时,我们依据的是心理学理论;而在预测自己的认知偏差行为时,使用的却是内省法,因此会得出他人更易受认知偏差影响的结论。
我方立场信息加工的另一个重要方面是人们对事件控制力的不合理自信。心理学家艾伦·兰格(Ellen Langer)对“控制错觉”(illusion of control)现象进行了研究。所谓控制错觉,是指个体相信通过个人的能力和努力,可以控制随机事件的结果。在一项研究中,两名员工在两家不同的公司向同事兜售彩票。他们卖给一部分人的彩票号码已随机选好;而卖给另一部分人的彩票则可以自选号码。毫无疑问,在一个随机抽奖的奖池中,自选号码和随机号码的获奖概率没有任何区别。第二天,这两名员工告诉那些买彩票的同事,他们希望买回昨天卖出的彩票。结果发现,自选号码被试开出的价格比那些分配到随机号码被试的价格高出4倍!朗格通过一系列类似的实验设计进一步验证了她的理论假设,即人们误以为自己的能力、技巧可以决定随机事件结果。
那些屈从于控制错觉的人,常常会基于错误的因果关系理论而采取行动,最终导致差强人意的结果。在马克·芬东-欧克里夫(Mark Fenton O扖reevy)及其同事的一项研究中,为我们充分展现了如果依控制错觉行事,会产生怎样的实际后果。他们对伦敦4家投资银行的107位交易员进行了研究。首先,研究者让交易员完成一项实验室任务,以评估他们的控制错觉特点。在该任务中,交易员被告知按键行为也许会对一个即时变化的指标产生影响。而实际上,按键并不会影响任何指标的变化。被试认为按键对指标变化的影响程度,即代表了该名被试的控制幻觉特征。芬东-欧克里夫发现,被试的控制幻觉特征与他们的绩效指标之间存在着密切的联系。交易员的控制幻觉水平越高,年度收益越少,控制幻觉水平每增加一个标准差,平均年收益减少高达58000英镑[8]。
[1] 1英尺=0.3048米。
[2] 知识标尺范式已有30余年的研究历史(例如Fischhoff,Slovic,and Lichtenstein,1977;Griffin and Tversky,1992;Koriat,Lichtenstein,and Fischhoff,1980;Lichtenstein and Fischhoff,1977;Schaefer,Williams,Goodie,and Campbell,2004;Sieck and Arkes,2005;Tetlock,2005;Yates,Lee,and Bush,1997),很多文章对这种范式的研究结论和方法论进行了综述(Baron,2000;Fischhoff,1988;Griffin and Varey,1996;Lichtenstein,Fischhoff,and Phillips,1982)。
[3] 这5个问题来自普劳斯等人的研究(Plous,1993;Russo and Schoemaker,1989)。
[4] 过度自信效应也存在于知觉和运动领域(Barenski and Petrusic,1994,1995;West and Sanovich,1997;Wright and Ayton,1994)、竞技运动结果预测(Robins and Yates,1987)、阅读理解(Pressley and Ghatala,1990)、根据笔迹猜测性别(Schneider,1995)、预测某人的行为或生活(Hoch,1985;Vallone,Griffin,Lin,and Ross,1990)以及经济和政治形势预测(舠tebro,Jeffrey,and Adomdza,2007;Braun and Yaniv,1992;Tetlock,2005)。更多关于计划谬误的研究,请参考比勒等人的文章(Buehler,Griffin,and Ross,2002)。卡尼曼的轶事源自他发表于2007年9月27日的演讲“A Short Course in Thinking About Thinking”,来源网址为:https://www.edge.org/3rd_culture/kahneman07/kahneman07_index.html.
[5] 开车时使用手机,无论是手持手机还是使用耳机,都会使个体的驾驶能力下降,增加车祸的发生风险(Mcevoy et al.,2005;Strayer and Drews,2007;Strayer and Johnston,2001)。百乐对加拿大安全委员会的研究进行了更为深入的讨论(Perreaux,2001)。斯文森对多数司机认为他们的驾驶能力高于平均水平的现象进行了研究讨论(Svenson,1981)。Groopman(2007)研究了外科医生的过度自信现象。
[6] 以800000学生为被试的研究来自弗里德里希(Friedrich,1996)。克鲁格等人对参加测试的被试进行了研究(Kruger and Dunning,1999)。关于自我评估偏差方法论和统计学复杂性的讨论参见摩尔等人的研究(Moore,2007;Larrick,Burson,and Soll,2007)。围绕该研究的结果,近些年不断有新的争论,可参考唐宁等人的文章(Dunning,Heath,and Suls,2004;Dunning Johnson,Ehrlinger and Kruger,2003;Friedrich,1996;Kruger and Dunning,1999;Larrick et al.,2007;Moore and Small,2007;Myers,1990)。Larrick等人研究了自我评估以及以他人为参照物的自我评估两者之间复杂的关系(Larrick et al.,2007;Moore and Small,2007)。尽管存在着很多理论争论,但这些现象似乎都是由我方立场信息加工导致的,这种信息加工方式使得个体以自我信念为焦点对后续信息进行处理。
[7] 近期出现了很多关于偏见盲点的研究(Mcevoy et al.,2005;Strayer and Drews,2007;Strayer and Johnston,2001)。
[8] 控制幻觉的研究来自朗格的文章(Langer,1975)。芬东等人完成了交易员的研究(Fenton-O扖reevy,Nicholson,Soane,and Willman,2003)。