首页 » 惊人的假说 » 惊人的假说全文在线阅读

《惊人的假说》3

关灯直达底部

第14章 视觉觉知[116]

宇宙就像一部展现在我们眼前的伟大的著作。哲学就记载在这上面。但是如果我们不首先学习并掌握书写它们所用的语言和符号,我们就无法理解它们。

——伽利略

现在让我们总览一下到目前为止我们所涉及的领域。本书的主题是“惊人的假说”,即我们每个人的行为都不过是一个拥有大量相互作用的神经元群体活动的体现。克里斯托弗·科赫(Christof Koch)和我认为探索意识问题的最佳途径是研究视觉觉知,这包括研究人类及其近亲。然而,人们观看事物并不是一件直截了当的事情,它是一个具有建设性的、复杂的处理过程。心理学研究表明,它具有高度的并行性,又按照一定的顺序加工,而“注意”机制处于这些并行处理的顶端。心理学家提出过若干种理论试图来解释视觉过程的一般规律,但没有一种更多地涉及脑中神经元的行为。

脑本身是由神经元及大量支持细胞构成的。从分子角度考虑,每个神经元都是一个复杂的对象,常具有无规则的、异乎寻常的形状。神经元是电子信号装置。它们对输入的电学和化学信号快速地作出反应,并将它们的高速电化学脉冲沿轴突发送出去,其传送距离通常比细胞体直径还要大许多倍。脑中的这些神经元数目巨大,它们有许多不同的类型。这些神经元彼此具有复杂的连接。

与大多数现代计算机不同,脑不是一种通用机。在完全发育好以后,脑的每一部分完成某些不同的专门任务。另外,在几乎所有的反应中,都有许多部分相互作用。这种一般性观念得到了人脑研究结果的支持,这些研究包括对脑损伤者的研究以及使用现代扫描方法从头颅外进行的对人脑的研究。

视觉系统的不同的皮质区的数目比人们预料的要多得多。它们按一种近似等级的方式连接而成。在较低级的皮质区,神经元到眼睛的连接最短,它们主要对视野中一小块区域中的相对简单的特征敏感,尽管如此,这些神经元也受该区域所处的视觉环境影响。较高级皮质区的神经元则对复杂得多的视觉目标(如脸或手)有反应,对该物体在视野中的位置并不敏感。(目前看来)似乎并不存在单独的皮质区域与视觉觉知的全部内容相对应。

为了理解脑如何工作,我们必须发展出描述神经元集团间如何相互作用的理论模型。目前的这些模型对神经元进行了过分的简化。尽管现代计算机比其上一代在运算速度上快得多,但也只能对数目很少的一群这类简化神经元及其相互作用进行模拟。尽管如此,虽然这些不同类型的简化模型仍显得原始,却经常表现出一些令人吃惊的行为。这些行为与脑的某些行为有相似之处。它们为我们研究脑所可能采取的工作方式提供了新的途径。

以上阐述的是背景知识。在此基础上,我们着手解决视觉觉知问题,即如何从神经元活动的角度来解释我们所看见的事物。换句话说,视觉觉知的“神经关联”是什么?这些“觉知神经元”究竟位于何处?它们是集中在一小块地方还是分散在整个脑中?它们的行为是否有什么特别之处?

让我们首先回顾一下第2章曾概述的各种观点。视觉觉知究竟包括哪种心理学处理过程呢?如果我们能够找出这些不同的处理过程在脑中的确切位置,或许会对定位我们所寻找的觉知神经元有所帮助。

菲力普·约翰逊—莱尔德认为,脑和现代计算机一样,具有一个操作系统。该操作系统的行为与意识相对应。他在著作《心理模型》(Mental Models)一书中,在更加广阔的背景下提出了这一思想。他认为,有意识和无意识过程的区别在于后者是脑中高度的并行处理的结果。正如我已在视觉系统中描述的那样,这种并行处理就是大量的神经元能够同时工作,而不是序列式一个接一个地处理信息。只有这才能使有机体有可能进化成具有特殊的、运转快速的感觉、认知及运动系统。而更为序列式的操作系统对所有这些活动进行全局控制,这样才能够快速、灵活地作出决定。粗略地打个比方,这就好像一个管弦乐队的指挥(相当于操作系统)控制着乐队所有成员同时演奏一样。

约翰逊—莱尔德假定,虽然这个操作系统可以监视它所控制的神经系统的输出,它能利用的只是它们传递给它的结果,而不是它们工作的细节。我们通过内省只能感觉到我们脑中所发生的情形的很少一部分。我们无法介入能产生信息并传给脑的操作系统的许多运作。因为他将操作系统视为主要是序列式的,所以他认为“在内省时,我们倾向于迫使本来是并行的概念进入序列式的狭窄束缚中”。这是使用内省法会出现错误的原因。

约翰逊—莱尔德的观点表达得很清楚,又很有说服力。但是,如果我们希望从神经的角度理解脑,还必须要识别该操作系统的位置和本质。它不一定与现代计算机的许多特性相一致。脑的操作系统可能并不是清晰地定位于某一特殊位置上。从两层意义上说,它更像是分布式的:它可能涉及脑中相互作用的若干分离的部分,而其中某一部分的活动信息又会分散到许多神经元。约翰逊—莱尔德对脑的操作系统的描述使人多少想起丘脑,但是丘脑的神经元太少了,以至于无法表达视觉觉知的全部内容(虽然这是可以验证的)。似乎更有可能的是,在丘脑的影响下新皮质的部分神经元(而不是全部神经元)可以表达视觉觉知。

我们寻找的觉知的神经关联会处于脑功能等级的哪个阶段呢?约翰逊—莱尔德认为,操作系统处在处理等级的最高层次,而雷·杰肯道夫认为觉知与中间层次有更多联系。究竟哪种观点更合理呢?

杰肯道夫关于视觉觉知的观点[117]是基于戴维·马尔(David Marr)的2.5维图而不是三维模型的思想的(大致说的是第6章所描述的以观察者为中心的可见表面的表象)。这是由于人们直接感受到的只是视野中物体呈现的那一侧;物体后面看不见的部分则仅仅是推测。另外,他相信对视觉输入的理解(即我们感觉到的是什么)是由三维模型和“概念结构”(conceptual structure,即思维的另一种堂皇的说法)决定的。以上就是他的意识的中间层次理论。

下面的例子有助于理解这个理论。如果你看见一个背对着你的人,你只能看见他的后脑勺,而看不见他的脸。然而,你的脑会推断出他有一张脸。我们会这样进行推理,因为如果他转过身来,表明他的头的正面并没有脸,你会感到十分惊讶。以观察者为中心的表象是与你所看见的他的头的后部相对应的。这是你所真实感觉到的。你的脑所作出的关于其正面的推断是从某种三维模型表象得到的。杰肯道夫认为你并不直接察觉这个三维模型(就此而言,同样你也没有直接察觉你自己的思想)。正如一句古语所说:未闻吾所言,安知吾所思?

由于初读杰肯道夫的著作[118]时不容易理解他的语言,我把他的理论的倒数第二种说法放在脚注中。[119]如果我对他的理论的理解正确的话,他的观点应用于视觉即“形态上的差异”(包括一个视觉目标的位置、形状、颜色、运动等)是与一种短时记忆有关(或由它引起/支持/投射)的表象,这种表象是一种“胜者为王”机制(一种选择机制)的结果,而注意机制的作用使它更加丰富。

杰肯道夫的观点的价值在于,它提醒我们不要假设脑的最高层次必定是视觉觉知中涉及的唯一层次。我们面前的场景在脑中的栩栩如生的表象可能涉及了许多中间层次。其他层次可能不够生动,或者如他所推测,我们可能根本不能察觉它们(的活动)。

这并不意味着信息仅仅是从表面表象流向三维表象:几乎可以肯定双向流动是存在的。在上面的例子中,当你想象一张脸孔的正面时,你所感觉到的正是由无法感知的三维模型产生的可感知的表面表象。随着这一主题的发展,两种表象之间的区别或许还需进一步明确,但它对我们试图解释的问题给出了一种最初的、粗略的看法。

目前尚不清楚这些层次在皮质中的准确位置。就视觉而言,它们更可能对应于脑的中部(如下颞叶及某些顶区),而不是脑的额区。但是杰肯道夫所指的究竟是视觉等级系统(图52)中哪个部分,仍有待于探索(第16章将就此进行更详细的讨论)。

在看了一些心理学家对这个问题的观点之后,我们现在再从那些了解神经元、它们的连接以及发放方式的神经科学家的角度来看这个难题。与意识有关(或无关)的神经元的行为的一般特征是什么?换句话说,意识的“神经关联”是什么?从某种意义上说,神经元的活动对意识是必不可少的,这看起来是合理的。意识可能与皮质中某些神经元的一种特殊类型的活动有关。毫无疑问它具有不同的形式,这取决于皮质的哪些部分参与了活动。科赫和我假设其中仅有一种(或少数几种)基本机制。我们认为,在任意时刻意识将会与瞬间的神经元集合的特定活动类型相对应。这些神经元正是具有相当潜力的候选者的集合中的一部分。因此,在神经水平上,这个问题为:

·这些神经元在脑中位于何处?

·它们是否属于某些特殊的神经元类型?

·如果它们的连接具有特殊性,那其特殊性是什么?

·如果它们的发放存在某些特殊方式,那其特殊方式是什么?

怎样去寻找那些与视觉觉知有关的神经元呢?是否存在某些线索暗示了与这种觉知相关的神经发放的模式呢?

正如我们已经看到的,心理学理论对我们有若干提示。某些形式的注意很有可能参与了觉知过程,因而我们应当研究脑选择性注意视觉目标的机制。觉知过程很有可能包括某些形式的极短时记忆,因而我们还应探索神经元储存和使用这种记忆时的行为。最后,我们似乎可以一次注意多个目标,这对觉知的某些神经理论提出了问题,因此我们从论述这个问题开始。

当我们看见一个物体时,脑子里究竟发生了些什么呢?我们会看到的可能存在的、不同的物体几乎是无限的。不可能对每个物体都存在一个相应的响应细胞(这种细胞常被称为“祖母细胞”)。表达如此多具有不同深度、运动、颜色、朝向及空间位置的物体,其可能的组合多得惊人。不过这并不排除可能存在某些特异化的神经元集团,它们对相当特定的、生态上有重要意义的目标(如脸的外貌)有响应。

似乎有可能的是,在任意时刻,视野中每个特定的物体均由一个神经元集团的发放来表达。[120]由于每个物体具有不同的特征,如形状、颜色、运动等,这些特征由若干不同的视觉区域处理,因而有理由假设,看每一个物体时经常有许多不同视觉区域的神经元参与。这些神经元如何暂时地变成一个整体同时兴奋呢?这个问题常被称为“捆绑问题”(binding problem)。由于视觉过程常伴随听觉、嗅觉或触觉,这种捆绑必然也出现在不同感觉模块之间。[121]

我们都有这种体验,即对物体有整体知觉。这使我们认为,对于已看见的物体的不同特征,所有神经元都产生了积极的响应,而脑通过某种方式相互协调地把它们捆绑在一起。换句话说,如果你把注意力正集中在与你讨论某个观点的朋友身上,那么,你脑中有些神经元对他的脸部运动反应,有些对脸的颜色反应,听觉皮质中的神经元则对他讲的话有反应,还可能挖掘出储存这张脸属于哪个人的那些记忆痕迹,所有这些神经元都将捆绑在一起,以便携带相同的标记以表明它们共同生成了对那张特定的脸的认知(有时候脑也会受骗而作出错误的捆绑,比如把听到的口技表演者的声音当作被模仿物发出的)。

捆绑有若干种形式。一个对短线响应的神经元可以认为把组成该直线的各点捆绑在一起。这种神经元的输入和行为最初可能是由基因(及发育过程)确定的,这些基因是我们远古的祖先的经验进化的结果。另一种形式的捆绑,如对熟悉物体的识别,又如熟悉的字母表中的字母,可能从频繁的、重复性的体验中获得,也就是说,是通过反复学习得到的。这或许意味着参与某个过程的大量神经元最终彼此紧密地连接。[122]这两种形式的相当永久的捆绑可以产生一些神经元群体,它们作为整体可以对许多物体(如字母、数字及其他熟悉的符号)作出反应。但脑中不可能有足够多的神经元去编码几乎无穷数目的可感知的物体。对语言也是如此。每种语言都有大量的但数目有限的单词,而形式正确的句子的数目几乎是无限的。

我们最为关心的是第三种形式的捆绑。它既不是由早期发育确定的,也不是由反复学习得到的。它特别适用于那些对我们而言比较新奇的物体,比如说我们在动物园里看见的一只新来的动物。在多数情况下,积极地参与该过程的神经元之间未必有较强的连接。这种捆绑必须能够快速实现。因此它主要是短暂的,并必须能够将视觉特征捆绑在一起构成几乎无限多种可能的组合,只不过也许在某一时刻它只能形成不多的几种组合。如果一种特定的刺激频繁地出现,这种第三种形式的瞬间的捆绑终将会建立起第二种形式的捆绑即反复学习获得的捆绑。

遗憾的是,我们并不了解脑如何表达第三种形式的捆绑。特别不清楚的是,在集中注意的觉知时,我们究竟每次仅仅感知一个物体,还是可以同时感知多个物体。表面上看,我们每次能感觉的绝不仅一个物体,但这是否可能是错觉呢?脑真的能如此快速一个接一个地处理多个物体的信息,以致它们好像同时出现在我们脑海中吗?也许我们每次只能注意一个物体,但在注意之后,我们可以大致记住其中几个。因为我们并不确切知道真相,所以我们必须考虑所有这些可能性。让我们先假设脑每次只能处理一个物体。

究竟哪种类型的神经活动可能与捆绑有关呢?当然,意识的神经关联可能仅包含一种特殊类型的神经元,比如某个特殊皮质上的一种锥体细胞。一种最为简单的观点是,当这个特殊神经元集团的某些成员以一个相当高的频率发放(比如大约400或500赫兹),或维持一段适当长时期的发放,此时觉知便出现了。这样,捆绑仅对应于皮质神经元中相当小的一部分,它们在皮质中若干不同的区域同时高频发放(或都发放很长一段时间)。看起来这会有两个结果:这种快速或持续性的发放将增强这个兴奋的神经元集团对所投射到的神经元的影响,而这些被影响的神经元对应于此时脑所觉知的物体的“意义”。同时,这种快速的(或持续的)发放将激活某种形式的极短时记忆。

然而,如果脑能同时精确地觉知不只一个物体,那么这种观点就不能成立。即便脑每次只处理一个物体,它也必须区分目标和背景。为了理解这一点,不妨想象在一个视野中靠近视觉中央的地方,恰好有一个红色的圆和一个蓝色的方块。那么,对应于觉知的某些神经元将会快速发放(或持续发放一段时间),有些标识红色,有些标识蓝色,其他一些标识圆,当然还有一些标识方块。脑又怎样知道哪种颜色与哪种形状相互搭配呢?换句话说,如果觉知仅仅对应于快速(或持续)的发放,脑多半会将不同物体的属性混在一起。

有许多方法可以解决这个困难。或许只有当脑注意某个物体时才会形成对它的生动的觉知。或许注意机制使对被注意的物体反应的神经元的活动增强,同时削弱对其他物体反应的神经元的活动。倘若如此,脑只能随着注意机制从一个物体跳跃到另一个物体,一个接一个地进行处理。毕竟,当我们转动眼睛时,情形是这样的。我们先注意视野中的一部分区域,然后转而注意另一区域,如此下去。由于我们不动眼睛就能同时看见多个物体,故注意机制的速度必须比上述情况要快,并能在眼的两次转动之间工作。

另一种替代的解释是,注意机制以某种方式使不同的神经元以多少不同的方式发放。此时的关键在于相关发放。[123]它基于这样一种观点,即重要的不仅仅在于神经元的平均发放率,更是每个神经元发放的精确时间。简单起见,让我们仅考虑两个物体。对第一个物体的特征反应的神经元都在同一时刻以某种模式发放,相应于第二个物体的神经元也都同时发放,但发放的时间与第一个神经元集团不同。

用一个理想化的例子可以把这个问题讲得更清楚。假设第一集团中的神经元发放很快,或许它们还会再次发放,比如说是在100毫秒以后。同样,在第二簇发放后过100毫秒又再次发放,如此下去。假设第二群神经元也同样每隔大约100毫秒发放一簇高速脉冲,但是只在第一群神经元处于静息状态的时候才发放。这样,脑中的其他部分不会把这两群神经元的发放混在一起,因为它们从不会同时发放[124](图57)。

图57 时间轴上每根短的竖线表示一个神经元在某一时刻的发放。第一条水平线显示了标识“红色”的神经元的发放,下一条线则是标识“圆”的神经元的行为,等等。因为表示红色的神经元和表示圆的神经元大致在相同时间发放,而它们与表示蓝色的神经元的发放时间相差很大。脑因此可推断出圆是红色的而不是蓝色的。这种情况常被说成表示“红色”和“圆”的神经元的发放是相关的(表示“蓝色”和“方块”的神经元也是如此),而互相关(比如“红色”和“方块”之间)为0(为了说明问题,这个例子被大大地简化了)

此处的基本观点是:同时到达一个神经元的许多脉冲将比不同时刻到达的同样数目的脉冲产生更大的效果。[125]其理论要求是同一群神经元的发放有较强的关联,同时不同群的神经元之间关联较弱,甚至根本没有关联。[126]

让我们回到主要问题上,即定位“觉知”神经元并揭示使它们的发放象征着我们所看见的东西的机制是什么。这就像试图侦破一个神秘的谋杀案。我们了解受害者(觉知的本质)的一些线索,还知道可能与犯罪有关的许多杂乱的事实。哪方面进展看来最有希望呢?由此下一步又该怎么做呢?

最直接的线索将是在现场捉住嫌疑犯。我们能否发现那些行为一直与视觉觉知有关的神经元呢?一种可能的办法是设置一种环境[如第3章描述过的观看内克(Necker)立方体]使进入眼睛的视觉信息保持不变,但知觉会发生变化。当知觉改变时,哪些神经元会改变其发放,或改变发放的方式,而哪些神经元不会改变?如果一个特定神经元的发放不随知觉改变,这就提供了一个“它不在现场”的证据。另外,如果它的发放确实与知觉有关,我们还需确定它是“真凶”还是“从犯”。