我敢打赌,研究方法的章节可能会令你畏惧。你可能认为它们是阅读“精彩内容”之前的鸡肋。比如,爱情、性爱和嫉妒等都是吸引人的主题,而实验设计和程序却不是你关注的内容。
然而,由于各种原因,掌握一些研究方法的基础知识对于正确理解人际关系科学十分有必要。举例来说,与其他领域相比,在人际关系方面似乎有更多一知半解、不懂装懂的所谓专业人士吸引着你的眼球(Stanovich,2004)。在书店里或者在网络上,充斥着指导人际关系发展的各种建议和意见,大部分所谓的专家根本就没有研究过人际关系,他们要么根据自己的个人经历得出结论,要么直接凭空虚构(Honeycutt,1999)。如果你能辨析真实可信的科学结论和小道传播的经验之谈,就能避免不必要的精神和物质损失。而且,人际关系学中的错误信息给人们带来的伤害远大于其他科学。比如说,对天文学上黑洞性质的错误认识不太可能使人做出危及自身的事情,但是,如果有人错误地报告离婚对子女的影响,其危害将是真实而具体的。人际关系研究的结果的确影响到人们日常生活的方方面面(Bradbury,2002)。
的确,本书所涉及的内容对你私人生活的影响将超过你所读的大部分其他书籍。因此,你应该责无旁贷地做一名见识广博的读者,从而能分辨确凿的事实和虚浮的奇谈。
要做到这一点并不容易。正如我们在本章看到的,探讨某个特定研究课题的方法很多,各有利弊。严谨的科学家会系统而认真地收集和评价各种信息,但没有任何一种单一的研究方法能得出绝对明确的答案。要深入理解人际关系,需要综合许多研究的结果,需要以明智而审慎的态度评价和辨别不同的信息。本章将介绍人际关系总的研究方法以及研究历史,这有助于你做出正确的判断。
这里我们只介绍一些基本的原则,这些原则能帮助你判断哪些证据可以接受,哪些则应该存疑。我希望你在读完本章后,能分辨出有实用价值的研究结果和无用的趣闻轶事或臆想。要想更详细地学习研究方法,可以阅读相关的书籍(如Robins et al.,2009;Leary,2011)。
关系科学研究简史
早在1687年,牛顿就发现了物理学的基本规律。生物学和化学也有了好几百年的历史。但是系统地研究人类人际关系却是科学界最近的创举。这个领域的研究才刚刚起步,许多研究人类亲密关系的科学家都还健在!这可不是件小事。因为人际关系科学只有短暂的历史,并不如大多数其他科学那样广为人知,更别提人们对它有什么深刻的理解了。在大学院校和学术机构之外没有几个人真正了解这门新兴学科在过去45年所取得的长足进步。
直到20世纪中期,仔细思考人际关系的主要是哲学家和诗人。他们有许多看法(我们大家难道不是一样),但这些观点也仅仅是个人之见,很多还是错误的。因而,行为科学家首次对真实人际关系所进行的实证观察可谓重大的进展。我们可以说,关系科学始于1930年代,当时有一系列具有历史意义的重要研究,如对儿童友谊的研究(参见Moreno,1934);求爱和婚姻的研究(参见Waller,1937)。然而,在第二次世界大战之前关系研究相对较少。之后,一些重要领域的研究赢得了社会的注意和尊重,如怀特(Whyte,1955)的街角社会(Street Corner Society)研究,费斯廷格、沙赫特以及巴克(Festinger,Schachter,Back,1950)对大学寄宿生友谊的研究。但直到20世纪60~70年代,随着人际关系科学在整个科学领域中研究的激增,关系科学才真正成为一门引起广泛关注的学科。
在此期间,人际关系科学研究最有影响力的进展是社会心理学对实验室研究的重新关注。为求精确地获得明确的结果,研究者开始研究他们能够控制和操作的影响人际关系的特殊因素。例如,伯恩和同事(Byrne & Nelson,1965)所做的一项著名的研究,考察了态度相似性对喜欢他人的影响。研究者要求参与者仔细阅读一份态度调查表,并告诉参与者调查表是由隔壁房间的陌生人填写的;然后要求参与者报告喜欢这个陌生人的程度。参与者并不知道研究者在调查表上做了控制,调查表要么和参与者自己的态度一致,要么不一致(参与者的态度倾向稍早已经测评过了)。这种对态度相似性的处理产生了明显的效果:态度一致比不一致更能让参与者喜欢陌生人。
这类实验程序表明,我们可以通过实验室实验来了解影响人们喜欢他人的因素,实验方法的严谨性也能满足研究者对研究过程精简和明晰的要求。伯恩等人对人际吸引的研究得到了学界的认可并开始推广开来,第一次使人际关系成为社会心理学教科书中必不可少的部分。然而现在看来,这些研究在表现现实人际关系的天然复杂性上做得并不好。伯恩实验中的参与者实际上从来就没有与那个填写调查表的陌生人遇到过或者交往过。的确,在伯恩的实验程序中,参与者与陌生人谋面是不可能的,因为所谓的陌生人根本就不存在!在这种“不存在的陌生人”的实验程序里,人们只是对一张纸上的各项内容打钩或打叉,他们也是研究中惟一真正的参与者。研究者测量的人际吸引实际上根本不存在。伯恩和同事是为了有力地得出研究结论,才选择这一实验方法,把人际关系研究局限在一个精心控制的方面(即态度相似性)。然而,他们创设的实验情境相当僵化,参与者缺乏与陌生人第一次会晤时面对面交谈的那种即时性和趣味性。
但是不要低估这类研究的重要性:它们表明对人际关系也能进行科学的研究,这种研究还有着广泛的应用前景。它们第一次真正地使同行的专家学者们注意到人际关系科学。此后的几十年,经过家庭学者、心理学家、社会学家和传播学研究者的共同努力,人际关系学已经成长和发展为一门包含复杂研究方法的新兴学科。今天的人际关系学:
● 经常从社会各阶层抽取不同的人群样本作为研究对象;
● 考察家庭、朋友和爱情等多种不同类型的关系;
● 经常对这些人际关系做长期研究;
● 既研究人际关系令人愉快的一面,也研究消极的一面;
● 经常在自然状态下追踪人际关系。
以下是人际关系领域所做研究的一些例子:
● 在美国西北大学,芬克尔和同事(Eastwick et al.,2010)进行了“速配约会”研究,研究中的单身人士可以轮流和10位可以约会的异性伙伴短暂交谈。参与者有4分钟与人谈话的时间,研究者记录他们在交往中的反应,然后参与者开始与下一个异性接触。约会可能成功,因为如果交谈的双方表示愿意再见到对方,就可约会见面。研究者给了他们一个网址以便交流信息。这样研究者也能考察人们在追求新的伴侣时产生浪漫爱情的影响因素(视频请观看https://www.youtube.com/watch?v=4hOKtyQMZeE)。
● 在阿灵顿的德克萨斯大学,威廉·伊克斯(William Ickes)和同事研究了人们自发的即兴交往过程(这些人刚刚才认识)。他们把参与者安排在一张舒适的沙发上待上几分钟,同时用隐蔽的摄像机拍摄下他们的谈话场面(Ickes,2009)。摄像机隐藏在通过大厅的另外一个房间里,即使你直接面对着它也觉察不到(见图2.1)。然后研究者邀请参与者到放映室观看他们交往的录像带,并报告在交往的每一个关键点自己心中的感想(包括认为对方是怎么想的)。这种方法能客观地记录交往过程,并获取参与者的想法、情感以及对对方的知觉(实验室网址: https://www.uta.edu/psychology/faculty/ickes/social_lab/)。
图2.1 威廉·伊克斯在阿灵顿德克萨斯大学的实验室平面图
研究中的参与者将被单独地留在图(1)的沙发上——在宽敞的房间内惟一能坐的地方。麦克风藏在图(2)的咖啡桌下,参与者看不到的摄像头藏在图(3)的房间内来记录他们谈话的场面。随后,参与者可以在独立的放映室[图中(4)和(5)]观看录像带,同时说出在他们交往时的所思所想。
● 在亚利桑那大学,马赛厄斯·梅尔(Matthias Mehl)和同事给参与者装备了可以随身携带的袖珍录音机,以获取他们白天的社会生活片段(Mehl & Robbins,2011)。这种微型设备一天能记录参与者身边发生的各种声音70次,每次持续30秒。从这些记录的声音可以判断参与者独处及交往的次数,他们的交谈轻松愉快还是起了争执。这种方法可以让研究者了解参与者自然展露的真实生活(在以下网址你可以录下自己的声音:https://dingo.sbs.arizona.edu/~mehl/EAR.htm)。
● 在西雅图(https://www.gottman.com/research/family/),约翰·戈特曼(John Gottman)和同事们邀请一些已婚夫妇去一个舒适的环境,在那里夫妻们可能要花上几个小时来重温引起他们上次争吵的冲突。他们知道现场会进行拍摄,但片刻后就忘记摄像机的存在而专注于两人的互动上。研究者甚至对参与者进行了诸如心率和皮肤电反应的生理学测量。戈特曼等人不辞辛劳地分析观察到的生理的、情感的和行为反应方面的即时数据,从而能以93%的精确性来预测数年后这些夫妇的婚姻能否持续(Gottman & Levenson,2000)。
● 奥布琪和威若夫在他们的“婚姻早期岁月”(Early Years of Marriage,EYM)研究项目中(Birditt et al.,2010),从美国密歇根州底特律市附近抽取了1986年结婚的199对白人夫妻和174对黑人夫妻,自结婚后每隔几年就进行回访。此一研究项目特别关注社会和经济条件对人们婚姻满意度的影响。到了2002年,此项目已进行了16年,有36%的白人夫妻和55%的黑人夫妻已经离婚了(Orbuch & Brown,2006)。随着时间推移,研究者追踪了所有婚姻从起始到结束的过程(访问此一研究项目的网站:https://projects.isr.umich.edu/eym/)。
希望你能被这些研究方法所体现出的创造性和丰富性所打动(我就是)!虽然这些研究方法引人注目,但对于人际关系科学研究的现状而言,也只不过是沧海一粟。人际关系科学虽然年轻,在全世界却有来自各个科学领域的成千上万的学者投身其中,他们的研究结果也发表在各种人际关系的专业学术期刊上。如果你是大学生,你可能看到过这类期刊:《婚姻与家庭杂志》《社会和人际关系杂志》以及《人际关系》。你也可以在国际人际关系研究会(International Association for Relationship Research,最大的国际性人际关系学家组织)查阅最新的人际关系研究资料,其网址是:https://www.iarr.org。
问题的提出
这些学者是如何研究人际关系的?任何科学研究的第一步就是提出问题。像人际关系这样一个领域,一些问题来自于个人经验。人际关系研究者与其他科学家相比,更能异常方便地接近他们的研究课题;他们自己在亲密人际关系中的经验能提醒他们注意某些重要的过程,有时候他们还阴差阳错地掉进了自己曾力图避免的陷阱中(Miller,2008)!广泛存在的社会问题也能提示他们某些值得仔细研究的问题。比如,美国离婚率在20世纪60~80年代的激增引起了对离婚现象的大量研究,正如社会学家注意到文化变迁产生的影响。
问题也可能来自先前的研究:为回答某个问题所做的研究可能引发新的问题。还有些问题来自那些想要对关系事件提供解释的理论。科学的理论既能解释已有的事实,又能做出新的预测,而研究的目的通常是检验这些预测。亲密关系研究所涉及的问题来自所有这些根源:科学家把他们的个人观察、他们对社会问题的认识、他们对前人研究的了解以及他们自己的理论视角结合在一起去挖掘要回答的问题(Fiske,2004)。
问题本身分为两大类。第一类,科学家可能尝试对某些事件或一系列事件的自然发生过程进行描述。这种情况下,科学家的目标是尽可能全面和精确地描述事件的性质。另一类是,研究者要确定事件之间的因果联系,以确定哪些事件对随后的结果有显著影响,哪些没有影响。对所有主持研究和参与关系研究的人而言,这种区分具有重要的意义。第一,不同的研究具有不同的目的,有辨别力的读者应该判断出这些研究的原本目的。如果某项探索性研究主要是为了描述新发现的现象,我们不应因为它确定不了该现象的因果联系而去苛评,这些是第二步才能解决的问题,首先需要确定出现的现象是什么。第二,更加重要的是,有思想的读者要抵制诱惑,不要试图从以描述为目的的研究中得出因果联系。只有某些特定的研究设计才能让我们洞察事件之间的因果联系,聪明的读者不要匆忙得出研究结果并不支持的虚假结论。本章稍后还会谈到这个问题。
参与者的选取
那么,人际关系的研究对象该怎样选取?研究者通常采用两种方法来招募参与者。第一种方法是使用容易接触到的任何人,只要他们同意参加实验,这种方法叫方便取样(convenience sample),因为它(相对地)方便研究者获取参与者。研究亲密关系的大学教授常常以大学生为研究的参与者,参加研究本身就是这些大学生的课程作业。研究者还会通过大众媒体或者当地的社区组织来招募参加研究的志愿者。虽然有时参与者需满足一些特点(例如研究需要那些认识不到两个月的正在约会的恋人),但研究者利用方便取样通常能轻松地得到研究的参与者。
相反,采用代表性取样(representative sample)的研究项目要努力确保参与者大体要与研究的整个总体相似。例如,对婚姻真正有代表性的研究必须包括所有已婚人士——涵盖所有的年龄、国籍和社会经济水平。这很难做到,甚至不可能实现,因为如果没有其他原因,那些同意参加研究的参与者和不愿意参加研究的人可能存在某些差异(见48页专栏2.1)。不过,有些研究中的(志愿者)样本能代表某个国家或特定人群的成人总体。那些能够放到网络上进行的公开研究,比在大学校园或者某个国家进行的研究能吸引到更加多样化的庞大样本(Gosling et al.,2010)。
一方面,如果我们要寻找适用于大多数人的基本原理,毫无疑问,代表性样本比方便样本更好。采用方便样本常常有一个缺陷,研究所获得的结果很特殊,只适用于与我们的参与者(如某个大学的学生、某个地区的人)相似的人。虽然全世界都在进行关系科学的研究,但本书介绍的大部分研究都来自特定的文化,即西方的、受过良好教育的、工业化的、相对富裕和民主的文化,所以研究参与者都显得有点怪异。(明白了吗?)事实上,来自“怪异”文化的人与落后国家的人相比,行为有时的确存在差异(Heinrich et al.,2010)。从一个群体到另一个群体,态度无疑存在巨大的差异。另一方面,人际关系的研究者所考察的许多过程非常基础,人口统计学上不同的人群在基本的人际过程上可能并不存在过大的差异:比如世界各地的人们对外在美的判断标准是相似的(详见第3章)。就考察人们交往基本过程的研究而言,由于其基础性较强,采用方便样本也无不可。
让我们看一个特例。1978年拉塞尔·克拉克(Russell Clark)派出男性和女性助手在佛罗里达州立大学校园里闲逛,碰到异性的学生就发出邀请。他们各自接近毫无戒备心的学生,并从三个邀请问题中随机选一个(见表2.1)提问;有些助手只是提出约会的要求,而另一些助手则直接要求发生性关系!最引人注目的结果是,没有女性接受来自陌生人的性要求,但75%的男性接受了性要求——这比接受约会要求的人还多!
表2.1 “今晚能和我上床吗?”
这一研究结果如此惹人注目,但那又怎样?该项研究只使用了大学校园的一个小方便样本。或许结果告诉我们的是,佛罗里达州立大学的男生比一般男性有更强烈的性渴求。实际上,克拉克连发表这项研究都很困难,因为评审人看重研究结果的普遍性。所以,在1982年克拉克和哈特菲尔德再一次进行了这项研究,在佛罗里达州立大学重复进行的这项研究,得到同样的结果(Clark & Hatfield,1989)。
嗯,为什么还有问题?已经是4年之后了,但这套实验程序仍然在塔拉哈西(Tallahassee,美国佛罗里达州首府)进行。对这个案例你只要稍加思索,就能找出若干条理由,说明为什么结果只能限定在特定时间和特定地点。
我们先从另一个不同的视角来审视这项研究。先不要对那些同意和陌生人发生性关系的佛罗里达大学男生或者其他地方男性的人数比例大惊小怪。这种特定的态度在人口统计学上不同的人群之间的确存在一定的差别。然而不要无穷无尽地批评,或者更糟糕地,完全否定克拉克和哈特菲尔德(Clark & Hatfield,1989)的研究结果。我们既要认识到他们研究的局限性,又不要疏忽问题的关键:男性一般比女性更能接受偶然的性关系。如果有人发出实际的要求,男性比女性更有可能接受陌生人的性邀请。而且,这正是最近对世界各国20 000多名参与者进行调查所得出的结论(Schmitt & the International Sexuality Description Project,2003),克拉克和哈特菲尔德正是发现这种性别差异的最早的研究者之一。他们的方法简单,样本也有局限性,但他们的确发现了新事物,他们的实验程序探测到了确实存在的人类行为基本模式。[1]
当然毫无疑问,克拉克和哈特菲尔德的研究并不完美。他们自己也承认了这一点!但只要审慎而又公正地来考察他们的结论,即使像这样采用方便样本的小研究对人际关系科学也有着重要的贡献。代表性样本能确保研究结果应用的广泛性,但代表性样本较难获得,而且成本很高。即使研究者能接触到代表性样本中的人群,他们也支付不起参与者报酬和各项其他支出,因为大多数参与者不仅仅只回答几个简单问题。
代表性样本中的人群反映了研究者想研究的总体人群在人口统计学方面的某些特征(性别、年龄、种族等)。
人际关系学经常出现这样左右为难的情况:必须做出选择,但没有一个选项是完美无缺的。在这样的情况下,我们对人际关系的正确理解就依赖于采用各种不同方法进行研究而日积月累堆积起来的知识(Reis,2002)。这里,多样性就是财富。不同的研究者使用不同的方法研究某个特定的课题。任何单一的研究都可能存在不足,但这些缺点却能为另一项研究所弥补。采用一系列不同的研究,每项研究都从不同的角度趋近某个问题,我们就能逐渐地描绘出事实真相。作为人际关系科学的明智读者,你应该尝试像科学家那样思考:没有一项研究是完美的。再次提醒你,各种不同的研究方法都是有价值的。智慧需要时间的历练,但真理就在不远处,我们正不断地向它靠近。
研究的设计
既然提出了研究的问题并获得了一些参与者,我们就需要安排一种观察方法来解答我们的问题。这部分内容要介绍关系科学研究中常用的几种不同的研究设计。
相关设计
相关(correlation)能回答这样的问题,“X和Y这两个事件在一起变化吗?也就是说变量X和Y有某种关联吗?”。表示相关程度的数值即相关系数在-1.00和+1.00之间。相关值越大(绝对值),两个事件联系就越紧密。如果X和Y完全正相关(这意味着他们一起上升或降低——即X上升时Y也上升,Y下降时X也下降),相关系数就等于+1.00。如果X和Y完全负相关(也即他们按相反的方向变化——X上升时Y下降,X下降时Y上升),相关系数就等于-1.00。如果X和Y没有任何关系,它们之间的相关系数就是0。这些相关模式的例子见图2.2。
两个事件是否一起变化,这个问题很重要也很普遍。考虑下面这个问题(第3章会解答):具有类似的态度和价值观的人们是否倾向于喜欢彼此呢?此类问题的相关研究一般会评价伙伴们在自然条件下知觉到的相似性和吸引力,并不会对配对伙伴的行为进行任何的干预或影响。研究者会仔细测量参与者的情感,从而发现相似性和吸引力之间的可靠关联,帮助我们理解新建立的人际关系中伙伴感到满意的原因。
另一方面,即使在吸引力和知觉到的类似性之间存在相关,仍有很多信息我们并不知道。的确,很多读者经常错误地理解相关设计得出的研究结果。相关只告诉我们两个事物之间存在联系,但是它并没有告诉我们为什么它们会相关。相关并不能表明事件之间存在因果联系。当你得出相关结论时,当心不要推导出其他没有根据的结果,相关只是相关;相关的存在意味着可能有很多不同的似是而非的因果关联。这里给出三条简单明了的可能性:
● X可能引起Y——在相似性和吸引力的例子中,知觉到的相似性可能引起了更多的喜欢。
● Y可能引起X——可能是喜欢上某个人让我们认为自己与他有许多共同点。
图2.2 相关模式
● 其他影响因素,第三方变量可能同时引起X和Y,X和Y之所以相关的惟一原因是他们存在共同的影响因素。两个事件X和Y可能对彼此没有一点影响,而是其他影响因素,如他人的俊美长相,致使我们喜欢他们,并且认为他们和我们非常相像。
当X和Y存在相关,上述三种可能性以及许多其他更复杂的结果都有可能是正确的。如果我们得到的只有相关,我们所知道的也只是这两个事件存在关联。我们并不知道其中的因果联系涉及哪些因素。[2]
实验设计
如果有可能,考察因果关系更简单的方法是采用实验设计。实验(experiment)提供了原因和结果的最直截了当的信息,因为实验者创造并控制了他们要研究的条件。在真正的实验中,研究者有意操作一个或多个变量,并把参与者随机分配到这些预设的不同条件下,从而观察这些条件变化怎样影响人们的行为。因而,实验不会问“X和Y是否一起变化”,而是问“如果我们改变X,Y会发生什么变化”。
让我们重新看看伯恩对态度相似性和吸引力的经典研究(Byrne & Nelson,1965),以阐明实验研究和相关研究的差别。假如伯恩只是测量同伴的态度和他们喜欢彼此的程度,他会得出相似性和喜欢程度存在正相关,但他不能确定为何它们有关系。
伯恩于是做了一个实验。一旦参与者来到实验室,伯恩会以投掷硬币的方式来随机确定参与者遇到的是一个与自己类似的人,还是一个和自己完全不同的人。他控制了伙伴的相似程度,这也是这两种条件下参与者的惟一差别。利用这种实验程序,如果伯恩观察到参与者对相似的陌生人表现出更多的喜欢,就可以合理地推导出:更高的一致性引起更多的喜欢。为什么能得出这个结论?因为参与者是随机分配到这两种实验条件下,所以喜欢程度的差别不能归之于每种条件下个体的差异;平均来看两组参与者是一样的。而且,参与者除了和陌生人在相似性上有明显差别外,他们在实验中的程序全部是一样的。伯恩观察到的行为差别惟一合理的解释就是:相似性引起人们的喜欢。他的实验清晰地展示了被操纵的原因(态度相似性)对结果(喜欢程度)的显著影响。
实验比其他设计能更清晰、更精确地测定因果联系。如果实验控制得好,就能清晰地揭示因果联系。那么,为什么研究者还要进行其他设计?答案在于这样一个事实:实验者必须能够控制和操纵他们要研究的事件。伯恩能够控制参与者所接收到的关于从未谋面的陌生人的信息,但他操纵不了亲密关系中的其他重要因素。我们也做不到。(你怎么去创造一段在实验室发生的浪漫爱情体验?)在一些无法控制的事件上不能采用实验设计。
所以,相关设计和实验设计各有自己的优势。采用相关设计,我们能研究现实世界中引人注目的事件——亲密关系的承诺、火热的爱情、不安全的性行为——并考察它们之间的关联。采用实验设计,我们能考察因果联系,但我们研究的事件范围有限。再次强调,没有完美的研究设计——这也是用不同的研究设计、从不同方面研究同一个课题的又一原因。
发展性研究设计
发展性研究设计研究行为或事件随时间而改变的方式。发展性研究设计主要有三种类型。
横断设计
最常见的发展性研究设计是横断设计(cross-sectional design),即比较处在不同人生阶段或者不同年龄人的发展过程。例如,如果我们要考察在婚姻的不同阶段导致离异的危险因素,我们可以询问那些有着不同婚龄的离异夫妇的主要抱怨。我们或许会发现婚姻持续的时间和离婚原因之间的关系。
正如在这个例子中看到的,横断设计是相关设计,所以我们要当心从中推导出的结论。如果我们比较那些婚龄25年的夫妇和婚龄只有5年的夫妇,我们比较的就不仅是婚龄不同的人,我们还比较了在不同社会环境下成长的人,两者相差20年。我们所知道的仅仅是他们对婚姻的抱怨并没有随着年岁而变化,他们的担忧也许只是反映了他们结婚时的时代差异。
正如你所看到的,从横断设计得到的相关总会受到某些不确定性的影响:参与者所经历的不同社会、文化和政治事件。只要人际关系研究的结果涉及年龄,我们就得质问结果究竟真的是年龄差异,还是不同年龄参与者的成长背景差异。
纵向设计
横断设计混淆了年龄和经历的相对影响。然而,如果我们招募的参与者年龄一样,并长时期跟踪研究,那么参与者的经历相同但年龄在变化。这就是纵向设计(longitudinal design),即对同一群人在一段时间里反复进行测量。如果我们既监测参加研究时新婚夫妇的抱怨,又监测继续参加研究的已婚多年夫妇的抱怨——正如奥布琪的婚姻早期岁月(EYM)研究项目(Orbuch & Brown,2006)所进行的——我们采用的就是纵向设计。
在横断设计中,研究者从不同年龄组的人获取信息。例如考察不同年龄的人对音乐偏好的差异,我们可以请20岁和60岁的人来评价不同的艺人。
这种设计与横断设计相比,在分离经历和年龄的影响方面做得非常好,但它们仍不完美。社会文化的巨大变化仍然会混淆年龄和经历的影响。如果我们发现,随着时间的推移,家庭夫妻为金钱发生的争执越来越频繁,又能说明什么呢?如果我们在经济萧条时期收集数据,研究看似关注婚姻的时间发展变化,却可能反映暂时性的文化变动所带来的影响,而且这种文化影响对大多数未处于经济萧条时期的婚姻根本没有影响!
如果我们能够坚持也足够聪明,就可以把纵向设计和横向设计结合起来以排除历史因素的影响。我们可以选择两组参与者,平均年龄分别是20岁和40岁,然后对这两组人都追踪到55岁。如果在55岁时,两组参与者都表现出对婚姻类似的抱怨,那么我们才能真正地相信找到了婚姻发展的基本趋势。
当然,做这样一项研究并不轻松。实际上,要做这样一项耗时35年的研究存在巨大的困难。纵向研究设计面临的最大问题就是参与者流失(participant attrition),即随着时间推移参与者变得越来越少。人们会搬家或失去联系,或变得很忙,或对研究感到厌倦而不愿意再继续参加研究。研究持续的时间越长,这些问题就越严重。有些长期的纵向研究结束时,那些自始至终参与研究的人少之又少。的确,即使纵向研究开始时采用的是代表性样本,但当研究结束时就不再是了。
回溯设计
由于纵向研究与参与者保持联络比较困难,为什么我们不追踪事件的时间变化,问问人们过去的经历?当然可以,很多亲密关系的研究使用的就是回溯设计(retrospective design)。有时,回溯的时间很长(“你们结婚前最主要的争议是什么?”);有时回溯的时间相当短暂(“在过去的24小时内,你和配偶的交往有多愉快?”)。
回溯设计非常灵活。如果我们担心历史事件对人们的影响,我们可以请不同年龄的人回想他们在某个相同年龄是否有类似的体验。的确,如果人们的记忆力完美,回溯研究会非常有用。不幸的是,回忆肯定不精确,并且如果询问很久以前发生的事件,回忆的难度就会大大增加(Frye & Karney,2004)。无论何时我们看到回溯研究报告,我们都无法确切知道报告内容是过去的清晰图像,还是受到近期事件影响的错误记忆。
总之,对发展性设计的了解支持了我们早先提到的观点:没有一种研究设计是完美的,但每种设计都有它的应用价值。发展性研究设计对时间推移的关注对于关系科学特别有价值。人际关系通常也是长期事件,我们需要理解关系是怎样随着时间而变化的。
场景的选择
我们的研究在不断推进,现在已经提出了要研究的问题,招募了参与者,选择好了实验设计,我们还需选择一个场景来实施我们的研究。研究场景通常有:(1)实验室;(2)自然的日常生活环境,如一对夫妻的家里。每一种选择都有它的优点和缺点。(你现在正在习惯这些,不是吗?)实验室的优点是能有效地控制外在的、无关变量的影响。研究者能精确控制参与者要经历的体验,还能安排符合研究目的客观环境。自然场景的优点是参与者在日常的环境中感到舒适和放松,从而使研究者能了解更多的典型行为。这两种研究场景的优缺点恰好互补。实验室场景可能引发参与者的虚假行为,使我们对他们的典型行为认识不足。另一方面,自然场景可能难以控制,充满与研究问题无关的干扰变量。
不论研究的场景在哪里,某些行为因为很少发生,或者让人痛苦,又或太过亲密(或三者兼而有之),很难进行研究。克服这些困难的方法是让参与者进行角色扮演(role-play),以便研究者了解某些行为——例如,参与者装作“好像”产生了妒忌心,或者发生争吵,或者试图诱惑他人上床。角色扮演的研究往往与真实场景相差很大。在一种极端情况下,请参与者阅读与要研究的行为有关的故事,并想象这些事情发生在自己身上。这种戏剧脚本研究往往没有生活中的真实事件逼真生动,允许参与者以一种超然而从容的方式来演绎,这和真实事件中人们所表现出的冲动性和情感反应差别很大。在另一种极端情况下,模拟研究要求参与者扮演虚构情境中的特定人物。例如,研究者可能要求一对夫妇假装双方都感到很生气,然后观察他们的行为反应。这种研究方法参与者较投入,但他们仍然知道自己只不过是在假装。角色扮演研究在考察一些牵涉感情较深的问题时,不会违背社会的道德伦理规范。但人们可能是按自己所认为的、在这些情境中应该实施的方式来行动,而不是事件真正发生时他们将会实施的行动方式。再一次看到,这种方法既有优点也有缺点。
数据的性质
现在我们实际收集到什么类型的数据?我们记录的是他人对人际关系的判断和知觉,还是我们自己考察的某种特定的人际交往?两种最主要的测量是:(1)人们对自己的思想、情感和行为的自我报告,以及(2)对他人行为的观察。我们还要考察这两种测量中的一些变量。无论我们采用何种数据,对行为的测量应该同时具备心理测量学上的效度(validity)和信度(reliability)。也就是说,我们测量到的事件真正是我们试图测量的(这就是效度);如果这些事件不会发生变化,那么我们在不同时间的测量结果应该一样(这就是信度)。
自我报告
亲密关系研究最普遍的方法是直接询问人们的体验。人们的回答就是自我报告(self-reports),自我报告的获取形式有很多种:书面问卷、口头访谈、非结构性的日记(参与者随时记录心中所想)等。这些技术的共同特点是参与者要把自己的体验告诉研究者——研究者并没有亲眼观察到。
自我报告得到的资料有着重要价值。举例来说,自我报告能让我们“走进报告者的内心”,了解外在观察者不易觉察的个人观点。自我报告的数据成本较低,也容易获得。研究者并不需要精密的仪器;他们只需要一些纸和笔及自愿的参与者。请思考一下表2.2中简短的自我报告测验:这七个问题能很好地评价人们亲密关系的满意程度。多数情况下,没有必要去问一些更详细的问题,或者采用其他的方法来区分快乐、满意的爱人和不很满足的伴侣,因为这七个问题直截了当,恰到好处(Hendrick et al.,1998)。自我报告的方法非常有效率,信息量丰富。然而(这可能没什么奇怪的了!)自我报告也可能出现一些潜在的问题。下面是三个最主要的问题。
表2.2 爱情关系评价量表
资料来源:Hendrick,Dicke,& Hendrick,1998.
参与者对问题的解释
自我报告常在研究者给出指导语或者提问之后进行。如果参与者错误地理解了研究者的意思或目的,他们随后的自我报告就会误导人。例如:“你和多少个人有过性行为?”如果男性来回答这个问题,他们往往会包括仅发生过边缘性行为的伴侣,而女性一般只计算真正发生过性交的那些伴侣(Gute et al.,2008)。这也是为什么男性报告与异性发生性关系的人数往往多于女性报告的一个原因。[3]实际上,人们描述性行为的词语常会产生难以觉察的理解问题,这或许是性行为研究中的一个重大缺陷(Wiederman,2004)。
回忆或觉知的困难
即使人们能准确理解研究者提出的问题,他们也可能无法客观地回答问题。举一点来说,他们可能对自己的行为缺乏洞察力,以致自己认为的真实情况未必完全准确。比如,根据人们的自我报告,在恋爱问题上,外表吸引力对于女人并不如对于男人重要;女人说外貌对于她们并不如对于男人那般重要。然而,在速配研究中当她们同时遇见和评价几个候选对象时,外貌对于女性的确如对于男性一样重要(Eastwick & Finkel,2008),外貌是影响男女两性喜欢对方最重要的影响因素(Luo & Zhang,2009)。有时,人们对自己喜好和行为的描述并不完全符合实际。
记忆错误也是个问题。人们在描述最近发生的具体客观事件时最准确。如果询问参与者很久以前发生的事情,他们可能会发生错误(Feeney & Cassidy,2003)。具体的细节信息更容易遗忘。比如,在一项研究(Mitchell,2010)中,大样本的离异群体中有50%的人不能准确地说出他们在哪一个月离婚。而过往的情感经历尤其可能发生记忆错误。具体而言,如果火热的爱情以痛苦和不满收场时,失落的恋人们往往很难回忆起数月前他们刚刚坠入爱河时的快乐和激情(Grote & Frieze,1998)。
参与者报告的偏差
自我报告数据的最后一个严重问题是,人们的报告可能存在系统性偏差或歪曲。例子之一就是自我服务偏差(self-serving bias,在第4章还会谈到),它会使人们高估自己在人际关系积极事件中的作用,而低估在消极事件中的过失。人们喜欢用积极眼光看待自己,所以会把自己的成功归于自己,而面对失败则推脱自己的责任。如果没有其他因素影响,操持家务的伴侣会认为自己做的家务比实际上的要更多(Ross & Sicoly,1979)!这类错误并不是不诚实所引起的,而是的确反映了人们真实的(然而也是特异的)观点。尽管如此,通过自我报告所获得的参与者对客观事实的主观知觉,或许与其他观察者的预测结果有所不同。
如果人们不愿意说出看到的事实,就会出现更严重的问题。最有名的例子是社会赞许性偏差(social desirability bias),指的是人们希望给他人留下好印象而歪曲事实。参与者常常不愿意承认让他们看起来不好的事情或者任何不符合期望的描述。例如,由于对社会接纳的顾虑,参与者不敢诚实地向研究者报告他们的同性恋取向和行为。因而,在同性恋的普遍性上一直存在争议(Tourangeau & Yan,2007)。再看另一个例子,离婚已经好几年的人(研究者事先在法院看过他们的离婚判决书)中有4%的人宣称他们从未离过婚(Mitchell,2010)。匿名程序有助于减少这类社会赞许性偏差,例如允许参与者参加网络调查而非面对面访谈(Brown & Vanable,2009),但如果研究涉及敏感问题,这种偏差仍然会出现。
观察法
另一种收集亲密关系信息的方法是直接观察行为。科学观察并不是轻松随意的工作。研究者要么采用复杂的工具测量行为,要么细心地训练助手以使观察尽量准确、可靠和详尽。
一些研究直接观察正在发生的行为,而另一些则采用记录设备,后者可以在行为发生之后分析。有一种观察法,叫体验式取样(experience-sampling),它采用间断式的、短时间的观察,从而获取较长时间内实际发生的行为。在体验式取样中,当目标行为可能发生时研究者可以随机抽取若干较短的时间段,在这些时间段中,目标行为可能发生,研究者可能把观察分散在不同日期不同时间的几个阶段。梅尔(Mehl & Robbins,2011)利用能放入口袋的微型录音设备所做的研究就是这种技术的最好例子。这种设备叫电子激活录音机(electronically activated recorders,EARs)。(你还记得吧?)在白天这种设备每间隔一段时间就自动打开开关,并录下参与者身边发生的任何声音。结果在伴侣的交谈中捕捉到许多愤怒和轻蔑等不良情绪,伴侣们并不太满意,他们的关系在6个月之后变得更为脆弱(Slatcher & Ranson,2011),对此你或许不会感到奇怪。
这类观察有若干种记录结果的形式。研究者有时会使用比较综合的(通常也是主观的)词语来评价他们所目睹事件的特征。例如,根据争吵是“建设性和有助于解决问题的”或“充满火药味和敌意的”可对争吵进行评价。观察者也可以使用编码程序来对非常特殊的行为进行记录,如一次交往中人们说话的时间长度、出现笑容的次数、彼此肢体接触的次数等等。这些能知觉到的具体行为往往比主观评价更为客观,借助于某些技术手段研究者可以更客观地进行观察。比如,研究者开发了一种软件,可以计算人们说话或写字时使用的各类词语,还能自动分析人们的谈话内容。(不好的结果是,如果人们太过频繁地使用“你”这个词,他们往往比不常使用“你”的人更不满意自己的人际关系[Tausczik & Pennebaker,2010]。)
科技发展为行为的测量提供了新方法。最近一项研究革新采用眼动跟踪的方法来评价人们对他人的视觉兴趣(Lykins et al.,2006)。在眼动跟踪研究中,参与者要戴上特殊的头盔,上面安装有拍摄眼睛活动的微型摄像头。然后,当参与者查看不同的图片时,眼睛的移动就能揭示他们正在看什么图片,看了多长时间。例如,通过并列呈现两张只有头发颜色差别的人像,我们能确定你喜欢金发还是黑发:在你认为更有吸引力的图片上你看的时间会更长。
这类观察一般可以避免自我报告的缺点。受过训练的观察者通常不会错误理解研究者的研究目的,参与者也不会有错误的记忆或者自我服务偏差。但另一方面,如果我们要理解人们对自己经验的个人知觉,就离不开自我报告。观察研究也可能很昂贵,花费观察者的大量时间,有时还需要昂贵的设备。有项了不起的研究在一周时间里拍摄了32个不同家庭中每天早上起床后的互动情况,长达1 540个小时的拍摄视频需要花几千个小时来仔细察看、编码和归类(Carey,2010)。
观察研究还面临反应性(reactivity)问题的影响:如果人们知道有人观察自己就会改变行为。(安装在起居室的摄像头可能会改变你的某些行为——至少在你习惯之前。)参与者知道有人正在看着自己时会极力营造好印象,这正如人们面试时的表现一样。因此,研究者更乐于进行那些不大可能改变参与者行为的观察研究。有一项这样的研究,人际关系学家追踪了某大学1 640名学生大学期间在脸谱网的个人页面情况(Lewis et al.,2008)。研究者跟踪个人页面中的公开信息,从而确定学生的品位和价值观怎样影响他们建立的友谊。研究者有具体而认真的研究目的——并不是日常那般随意浏览网页——也不会有对参与者的行为造成不必要的影响,因为参与者都不知道有人观察自己!毫无疑问,将来我们会看到更多的网络社交行为的正式研究。(这让人厌烦吗?为什么?)
生理测量
如果我们观察到的行为人们无法有意识地加以控制,就可以避免反应性问题。对人体自主的和生化的反应进行的生理测量就能做到这一点。生理测量的项目包括心率、肌肉张力、性唤起和荷尔蒙水平等,通过生理测量可以确定生理状态是怎样和社会行为关联的。
有些研究者考察生理机能影响人际交往的方式。例如你血液中神经肽催产素(oxytocin)有助于确定你的同理心和信任程度(Campbell,2010);引人注目的是,如果你摄入一定剂量的催产素,短时间内不太容易对人起疑(MacDonald & MacDonald,2010)。我们的依恋类型也存在生理基础。依恋类型不安全的人面对社会压力会出现更强烈的自主神经反应,包括诸如肾上腺素等荷尔蒙的分泌;社交威胁往往会引起焦虑或回避类型之人不安的唤醒,但安全型的人却能保持清醒和沉着(Diamond & Fagundes,2010)。
其他一些研究探索人际交往怎样改变人们的生理状态。宽恕对我们有益(第10章还会谈到),具体地说,那些能够宽恕冒犯者的人比睚眦必报的人表现出更弱的心率和肌肉张力(Witvliet et al.,2008)。还有一些研究试图识别社会行为的生理标签地图。例如,已有研究者识别出调控爱情和性欲的大脑结构(参见Aron,2010),研究者让参与者体验到这些心理状态,同时用fMRI(功能性磁共振成像)技术考察他们的大脑。fMRI图像能显示哪一部分的大脑消耗了更多的营养,因而比其他部分更激活——正如结果所示,亲密的爱情和饥渴的性欲看起来是由大脑不同部分控制的。(对此你感到奇怪吗?)
生理测量一般成本较高,但其应用在不断增加,因为生理测量能让研究者考察我们社会行为的生理基础。生理测量也是人际关系科学一直以来变得越来越错综复杂的一个很好的例证。
档案材料
历史档案(archives)也能避免反应性的问题。个人记录如照片和日记,公共媒体如报纸和杂志,政府记录如结婚证和人口统计信息等,都是人际关系研究的重要数据来源。当这些信息过时了,就变成了“档案”信息。有一项研究考察了人们过去的长相吸引力和现在的收入之间的相关,研究者对大学年鉴相册中的学生照片进行了外貌吸引力的评定,以确定数年前外貌俊美的人是否现在赚的钱更多(Frieze et al.,1991)。(他们发现了什么结果呢?请阅读第3章!)
档案材料是“无反应性的”,因为查阅档案资料不会改变要研究的行为。而且档案研究较为廉价。但档案材料存在局限性。具体而言,那些在很久以前就保存的材料可能没有包括研究者想知道的所有信息。
研究应遵循的道德规范
档案研究通常不会让人感到尴尬,但人际关系研究有时的确要询问敏感话题或者观察隐私行为。有必要刺探他人的私人事务吗?
这的确是个不容忽视的问题。虽然这类信息非常有价值,也很必需,但人际关系科学却处在严重的道德两难困境之中。仅仅让参与者填写描述他们人际关系的问卷,就可能对他们的人际关系产生微妙而又持续的影响(Zhaoyang & Cooper,2011)。比如,要求参与者明确说明从人际关系中得到些什么或者要求他们评价对伴侣的爱时,研究者就把参与者的注意力指向他们平时没有仔细考虑的细节事务上了。我们鼓励他们评价自己的人际关系,启发他们思考。而且,研究者还唤起了他们对于伴侣会怎样回答同样问题的好奇心。总之,研究者不经意的探询可能警醒人们注意那些他们不曾意识到的人际关系问题或者挫折。
模拟和其他观察研究也可能存在更严重的问题。让我们来看看戈特曼(Gottman & Levenson,2000)的研究方法,他要求夫妇重温引起上一次争吵的分歧:他并不是要鼓励人们去争吵,但有些夫妇的确发生了争执。结果发现,那些尖酸刻薄、大吵大闹的夫妇比那些优雅而幽默地探讨分歧的夫妇更容易离婚,戈特曼的研究表明特定的行为风格能预测将来的婚姻问题。这项工作非常重要。但它有破坏作用吗?我们真的应该要求那些夫妇重温可能损害他们将来婚姻满意度的争吵场面吗?
问题的答案并不简单。人际关系学家通常会非常注意保护参与者的权益(Kimmel,2004)。在研究开始之前研究者会向参与者介绍有关研究的具体信息,以让参与者根据充分的信息来决定是否参加研究。他们参加研究完全是出于自愿,并且能随时退出。在数据收集完毕后,研究者会立即向他们提供反馈,解释所有的实验操作过程,介绍研究的目的。研究完成后,参与者常能看到研究结果的最终报告。不仅如此,如果研究的是一些难处理的问题,而参与者想解决这些问题,研究者还会提供婚姻咨询的信息,甚至还免费提供某些心理服务。
正如你所看到的,人际关系学是建立在对参与者的幸福深切关注的基础之上。在研究中参与者会得到应有的尊重,他们的付出会得到由衷的感谢,甚至还会因占用了他们的时间而得到报酬。他们也会在研究过程中体验到乐趣并从中获益(Zhaoyang & Cooper,2011)。在一项婚姻的纵向研究中,经常进行自我报告的参与者更多地感到自己是个合格称职的配偶,这比控制条件下很少报告自己情况的参与者强,密切关注关系进展的状况显然有益(Veroff et al.,1992)。因此,参与人际关系研究有时很有趣,也很有启发性。那么,我们还应不应该研究亲密关系中这类私密问题呢?
回答是绝对的有必要。道德还有另一方面我们没有提到:科学在道义上必须履行的责任是求得真知造福人类。无视这点将会付出惨重的代价。例如,美国卫生部(DHHS)当前正拨出很多金钱资助一项健康婚姻新方案(Healthy Marriage Initiative),这项工程计划教会非裔美国人维持婚姻的技巧。美国黑人是这项婚姻幸福计划的受益者,因为黑人与白人相比更不可能结婚,也更可能离婚(Orbuch& Brown,2006)。这项新方案背后的假设是:如果非裔美国人能珍视婚姻,那么他们的婚姻就会更加稳定——所以纳税人的钱就花在了教育黑人尊重和欣赏婚姻生活的课程上。这里的问题——正如人际关系学家所看到的(Karney & Bradbury,2005)——是非裔美国人和其他族群一样看重婚姻。他们甚至比白人还渴望结婚,但面对窘迫的经济前景又结不了婚。具体来说,黑人妇女不想和没有稳定工作的男人结婚(Gibson-Davis,2009)。即使黑人结了婚,却经常遇到经济困难,因而婚姻一般也不稳定(Hardie & Lucas,2010),任何夫妻只要为金钱而痛苦挣扎,其婚姻满意度都会下降。因而,非裔美国人的婚姻容易破裂似乎更多地与社会经济地位而非个体的态度有关(Karney & Bradbury,2005)。
所以在此例中我们可以看出,政府或相关部门希望价值观的教育能起作用就太愚昧了。试图改善人际关系的政府工程如果把钱用在训练黑人的工作技能或者提高最低工资,比去教育他们尊重婚姻会更加有效(Gibson-Davis,2009)。显而易见,如果我们要提升人们的幸福,不仅需要善良的意图,而且更需要丰富的知识。在诸如《爱情风味》(Flavor of Love)和《爱情摇滚》(Rock of Love)等电视节目(在这些节目里现实的婚姻更像是人生败笔而不是成功)大肆流行,传递怪异“爱情”的文化中,不去理解人际关系的运作过程才是真正的不道德。亲密关系可以带给人类最伟大、最荣耀的幸福体验,但它也可以使人绝望痛苦和万劫不复。关系学家相信,努力探索增加人们快乐和减少痛苦的方法,是人际关系研究最根本的道德。
结果的解释和整合
这不是一本统计学课本(对此你感到心中窃喜吧),但人际关系学家整理数据的一些统计技术,仍是明智的读者应该掌握的。许多人际关系研究要对所获得的数据进行统计分析以确定结果是否具有统计学上的“显著性”。这是一种计算研究结果(如观察到的相关或实验中操纵变量所得的效应)偶然发生的概率有多大的方法。如果结果偶发的可能性很低,那么结果就是“显著的”。本书所有的研究结果都是显著的。你也可以放心,得到这些结果的研究都经过了其他科学家严格的审查。然而,这并不意味着我们提及的每一个结果都是完全正确的:有些结果可能是偶然发生的,反映了有偏样本特殊人群的影响或各种没有预计到的失误。如果心理学、社会学或传播学研究的结果具有统计学上的显著性,就表明这种结果不太可能随机发生,但并非完全不可能随机发生。还请牢记,我们碰到的结果通常描述了普通人群明显的行为模式,但因为存在个体差异(参看第1章),这些模式适合特定个体的程度存在差别。请不要太天真,幼稚地以为实际上的确符合大多数人的研究结果是错误的,只因为该结果似乎并不适合你认识的某个人。我希望你能成熟点,辩证思考,富有理性。
此外,我们还要注意,人际关系研究所得到的数据也会表现出独特的挑战性和复杂性。以下是三个例子。
配对的相互影响的数据。多数统计程序都假定不同参与者的分数是各自独立的,不会发生任何的联系(也就是说,一个参与者的反应不会受到任何其他参与者的影响)。但是,如果夫妇双方都参加研究,情况就不同了。妻子对夫妻关系的满意度非常有可能受到丈夫是否快乐的影响,所以妻子的满意程度并不独立于丈夫。从人际关系伴侣所取得的数据常常会相互影响,明智的做法是用特殊的统计程序来分析这类数据(如Kashy et al.,2006)。
不同的分析水平。人际关系研究者还必须在两个完全不同的分析水平上做出选择,一种水平是构成夫妇的个体,另一种水平是夫妇两人一起(Kashy et al.,2006)。例如,研究者要考察个体的依恋类型对他(她)自己社会交往的影响,或者要考察两个伴侣的依恋类型组合如何影响他们之间的人际关系质量。第一个问题是在个体水平上进行分析,第二个问题则是在成对的数据水平上分析。研究者必须小心确保所使用的统计程序适合数据的不同分析水平。
影响人际关系的三个根源。而且,人际关系来自各个伙伴的单独贡献和他们组成一对的独特组合。比如,假设梁山伯和祝英台拥有幸福的婚姻。原因之一或许是梁山伯是一个特别令人愉快的家伙,他能和任何人很好地相处,包括祝英台。又或者(也可能同时)祝英台是个很容易生活在一起的人。然而,梁祝比梁与其他女性或祝与其他男性有更好的亲密关系,也可能是因为他们两人个人特质独特组合的结果:整体大于部分之和。人际关系研究者常常会遇到这三种影响因素结合起来的现象,即两个单个伴侣和他们共有的独特伴侣关系。同时一起分析所有这些成分需要高级的统计分析方法(Kenny & Ledermann,2010),这是人际关系科学复杂性的又一证明。
那么我的观点究竟是什么呢?我已经指出研究亲密关系要处理的问题的复杂性,也提到统计显著性检验针对的是可能性而不是确定性。你就应该怀疑每一个研究结果,怀疑每一种观点和理论吗?答案既是肯定的又是否定的。我希望你能慎思而不盲信,也希望你了解你要学习的内容的复杂性。记住要像科学家那样思考:没有一项研究是完美无缺的,但真理就在前方。我更相信不同的科学家采用不同的参与者样本进行研究得出的结果。如果研究结果用不同的方法得到重复,我们就更有信心。
由于这些原因,科学家现在做了很多元分析(meta-analyses)研究,即把先前许多不同的研究得出的结果结合在一起进行统计分析(Roberts et al.,2007)。在元分析中,研究者把针对某一特定现象的所有现存研究汇编到一起,分析整合它们的结果以识别它们包含的共同规律。如果所有的先前研究都得出基本相同的结果,元分析使这一结果一目了然;如果存在不一致,元分析有可能揭示出原因。
由于有了这一称心如意的分析工具,尽管人际关系学历史短暂,研究内容复杂,却仍取得了巨大进步。虽然前面我不时提出警告,但本书提到的大多数结论都是可靠的,如果你重复研究者的工作也将得出同样的结果。不可思议的是,大部分人际关系的研究结果在你父母出生时都还没有发现呢。
最后要点
为帮助你提高识别能力,我用了大部分篇幅来说明不同研究方法的优缺点,通常的结论是没有哪一种方法是最好的。我希望能鼓励你审慎地思考一项优秀研究的复杂性。但作为结论,我想让你放心,人际关系学的学科体系严谨、状态良好,并不像它所包含的所有那些不确定的复杂因素给人的印象。如果进行人际关系科学研究,最典型的研究是从来自大学生的方便样本获取自我报告的横断研究(Cooper & Sheldon,2002)。[4]许多研究仍然使用这种方法。然而,研究者现在一般运用更精细的设计、更复杂的测量,研究更多样化的样本。研究者在研究人际关系用到多种方法是一种优势,而不是缺陷(Ickes,2000)。而且,人际关系科学这种区分知与不知的明断能力,标志着这门科学的诚实、日趋成熟和智慧。
人们喜欢轻松容易的答案,喜欢简单干脆的信息。如果科学事实难于掌握,很多人实际上更喜欢简单的谬论,如“男人来自火星、女人来自金星”这样的观点。然而,作为刚刚接触人际关系科学的读者,你有义务崇尚事实,反对迷信,即使弄清人际关系的复杂性要颇费一番周折。勿将科学的谨慎误解为缺陷。相反,我们希望你持有这样一种信念,恰恰是这种谨慎体现了科学的尊严,使人们能坦率地面对本领域的优势和不足。那些声称自己一直正确的人,毫无疑问是招摇过市的江湖骗子,谨慎的科学家不会这样做,他们只会努力使自己不断接近真理。
请你思考
克里斯和吉尔如果要通过心理学导论课程,就必须参加研究实践,所以他们签字参加一项“人际关系过程”的研究。他们恋爱已经有两个月了,这项研究正在找“未结婚的恋人”。如果他们参加这个研究,会得到5美元,这让他们有点高兴。就这样,他们和十多对其他恋人聚在了一个大房间里,然后分别相对而坐。随后他们阅读了研究的注意事项,注意到自己可以在任何时候退出这个研究,便签名同意参加研究,开始填写长长的问卷。
有些问题比较敏感。他们要回答去年与多少个人发生过性关系,未来5年他们希望与多少个人发生性关系。隔一段时间后,他们要再次回答同样的问题,这一次他们都认为伴侣也要回答这些问题。克里斯以前从来没考虑过这些问题,一想到这些问题他就意识到自己对吉尔的性经历和未来的想法知之甚少。那天晚上,他有点焦虑,想知道又有点担心吉尔的回答。
据你看来,这一研究程序符合道德规范吗?你愿意完成类似的问卷吗?为什么?
[1] 比如,2009年5月和6月在丹麦城市地区进行了同样的调查,结果发现38%的男人接受了邀请,愿意与陌生人发生性关系,而只有2%的女人接受了此种邀请(Hald & Hogh-Olesen,2010)。
[2] 然而,我必须指出,如果有很多个变量存在许多相关,或者测量是在某段时间里多个不同的场合下得出的,那么高级统计分析通常能排除某些可能存在的因果联系(这种不存在的因果联系通常会混淆相关研究结果)。尽管我们要小心,不要把简单的相关关系错误理解成因果关系,但是运用高级统计技术却有可能在相关设计的结果上得出一些因果联系的可靠结论。
[3] 291页专栏9.3中我会详细考察这一颇具争议的性别差异。
[4] 这个句子中包含了若干个术语,在学习本章之前或许你并不了解它们,但现在你知道了。请回忆一下。