我通过大脑神经生理和动态特性找寻意识的机制,似乎偏离了关系到意识体验的一些根本问题。例如,我们的神经模型如何解释意识主体的体验特性?我认为澄清这个问题最好的方式是首先强调神经机制,然后交替探讨现象问题和这些机制,来证明两方面相互一致。
意识体验的一个突出的现象特征是通常它都是一个整体。任何意识体验时刻都同时包含感知输入、运动反馈、想象、情感、瞬时记忆、身体感和外围感觉。通常情况下它都不会仅仅包含“我正用来写字的铅笔”,而且我也不可能将意识缩减成这样。然而,与此同时,统一的场景会自行流动变化为另一个复杂而统一的场景。有时候,通过自主选择或面对压力时,它会变为不着边际的白日梦,或者变为注意力的高度集中。
可以这样说,意识体验高度整合,同时又高度分化。在很短的时间内,它可以经历众多内部状态。然而,无论何时,这种似乎无止境的变化和可变性却又无法通过人对主观状态的体验分割成独立的部分。这并不是要否定意识能通过集中注意力进行调整。后面我们在思考意识与非意识活动的关系的时候再来探讨意识场景的这种集中专注现象。
对丰富的内在意识状态的主观体验,必须与意识主体无法同时进行3个以上意识行为的局限性相对照——例如,同时进行打字、朗诵诗歌和回答问题。这种同时执行多个任务的局限使得一些人认为意识的作用非常有限。但事实上,这种表面上的局限有可能是由于进化需要,好让运动行为和计划在完成之前不被打断。还有一些人认为,既然同时进行的意识活动最多只能“模块化”为2个或3个,这就表明意识状态的效能有局限,这种观点误解了意识状态与未来所采取工具性行动的关系。我们将会看到,意识及其底层神经机制的一项主要功能就是进行计划和预演,为此,相继内部状态的各种复杂性正是所需要的。为了进行计划,站在有利于个体的角度,也就是主体的第一人称观点的角度,我们必须能预演不同行为的不同后果。执行动作或计划时往往需要意识预演,但是通过学习,主体可以更高效地执行这些行动,而无需直接的意识监督,除非出现了新的情况。毫不奇怪,当我们试图执行两项或更多必须完成的行动时,很有可能会被意识干扰打断。
那么现象体验本身又如何呢?对意识主体来说它是怎么样的?他们有何感觉?“感质”一词指的是感觉体验,比如绿色感、温暖感、痛感。哲学家们认为对感质的理解是意识研究的关键。一些哲学家关注神经活动和结构与感质“感觉”之间明显的不一致。我会用一些篇幅来论述这个问题,简而言之,这里探讨的是身为某物种的意识个体是什么感觉——就像哲学家托马斯·内格尔(Thomas Nagel)说的,“身为一只蝙蝠是什么感觉?”
讨论这个问题之前,还要处理一些附带问题。第一个问题涉及一个观念,即科学观测者所测量和理解的神经活动完全不具有我们赋予感质的任何特性。记得我们说过感质意识体验是某种过程。其动态结构与其属性毫无类似之处,包括意识属性也是一样:一场爆炸与一堆炸药并不相似。第二个问题涉及主观性和第一人称观点。意识是一种过程,与个体的身体和大脑以及它们的历史都有关系。从外界的角度来看,第一人称体验并不像可转让的货币那样,可以完全流转到第三人称的科学观察者。不过可以合理地假定,特定物种的个体的第一人称体验具有一些共通之处。这也就是为什么,作为人的我可以在一定程度上猜测作为人的你可能是什么感觉,而另一方面,我们又很难设想身为蝙蝠是何感觉。
稍后我会深入阐释我们的初级意识模型,并尝试用其来描述身为一只蝙蝠可能是何感觉。不过首先最好指出一点,我们已经掌握大量神经科学证据,说明为何不同感质会带来不同感觉。视觉神经的构造和动力学基础不同于嗅觉,触觉和听觉也不一样,其他官能同样如此。对于这些通路和感官活动,无论怎样的科学描述,都无法描绘出读者大脑中具体的感质,尽管如此,如果我们假定他们的神经系统功能健全,他们就能将这样的描述与第一人称体验联系到一起。无论某种感官是以哪种结构为基础,都可以与其他感质区分开。或者可以说:“如果不是这种方式,就是那种方式。”感质需要有一个具体的身体和一个具体的大脑处于一个具体的环境中才能产生,不过这并不十分妨碍我们对不同感质的来源进行总体分析。
根据广义神经元群选择理论,感质是在复杂场景中的高级辨识。意识场景体验是统一的,这意味着所有意识体验都是感质。根据这种观点,感质可以划分为单一、狭隘的感觉,例如红色、温暖,等等,这样做虽然可行,也可以用语言来描述,却没有充分认识到其中涉及的辨识能力。举个例子,作为科学家,我们可以用各种定义特征描述颜色体验,例如视网膜三种色素的频谱特征,以及某个视觉系统的神经响应。然后我们可以将所体验的特定色彩的不同特征绘制成三维空间中的点。但除非我们身处较高维空间,其他各种感质也在其中描绘成图,从而展现其互异特性,否则我们又怎么知道这些色彩感质就是实际色彩的原貌呢?以冷热感为例,在一幅统一的场景中,意识却能在色彩等无数感质中辨识出冷热的细微差别,这也正是意识辨识与比如说恒温器的冷热分辨的不同之处。要产生意识,就要能够在多维度辨识或区分的基础上做出这种判断。
不同意识状态的丰富性与各状态的统一性初看似乎矛盾,不过只要对产生这些特性的神经系统的组织给出让人满意的解释,就能证明它们并不矛盾。这也正是在复杂系统中发现的特征,因此我会先对复杂系统的特征进行简要介绍。复杂系统是由各种较小部件构成的系统,各部分有可能功能不同。随着这些不同的部分以各种方式交互组合,往往会出现更加整合的系统特征。我和我的同事们对这类系统给出过形式化描述。这里我会给出一个定性解释,我相信这对于我们的目的已经足够了。刻画复杂系统的术语和数学度量借用自统计信息论,但我们的分析并不以这个理论为前提。这些术语包括“独立性(independence)”“熵(entropy)”“互信息(mutual information)”和“整合性(integration)”。对于它们的使用我会给出一些例子,可以解释清楚它们的意义,又不用涉及数学细节。我的目标是说明复杂系统如何表现出其组成部分的整合,同时又具有由各部分组合成的各种不同状态。
首先来看看两个非复杂系统的极端例子(图8)。粒子随机弹性碰撞的理想气体就不是复杂系统。粒子之间相互独立(互不粘连),碰撞时也不会有信息的交互增减(“互信息”)。另一个极端,完美的晶体也不复杂。其完美的规律性表现出高度的整合性和单元之间的互信息。一旦我们知道了所谓的空间群和晶体的任一个单元的组成,其他任何单元就不会再给我们新的信息。
图8 大脑与复杂度极低的两种系统(理想气体和完美晶体)的比较。大脑是复杂系统,由构造互异并且功能不同的各部分组成,这些部分的体积较小,彼此也相对独立。大脑各部分通过各种神经生理结构连接在一起,通过这种生理结构的功能性连接,产生的大量状态就会被整合起来。就气体而言,这种整合不会出现,而晶体虽然高度整合,却又没什么变化
现在再来看看复杂系统。这种系统怎么可能既是整合的同时又是分化的呢?我们可以用所谓的信息熵来量度系统的整合度。如果要将一个系统从所有“组分”相同(只从“组分”出现的相对概率来考虑)的类似系统中分辨出来,需要一定的信息量,这个量就是信息熵。整合度就是系统各部分的熵的总和减去系统作为整体时的熵。对于理想气体,这个差值为零——将分开的气体合到一起并不会增加任何新的信息。但如果系统的各部分之间互动,并共享互信息(晶体中就是这样),系统的熵就会低于各部分熵的总和,整合度为正值。对于完美的晶体,这个值没有上限。
现在可以用一种更精确的方式来刻画复杂系统并将其应用到神经系统了。与完美晶体这类完全整合的系统不同,如果考虑复杂系统越来越细分的组成部分,就会发现它们偏离了整体的线性依存关系,展现出更多独立性。而如果从另一个方向考虑这些互动部分组成的子集,随着子集越来越大,就会越来越接近完全整合的系统。这正是在大脑的互动网络中发现的特性。它们表现出功能分化现象(皮质区V1负责定向,V4负责色彩,V5负责目标的运动,等等),但各分区也通过折返的绑定整合起来——也就是说,当它们连接到一起时,表现出了更多统一的特性。
这种思想也可以用来分析丘脑皮质系统,来揭示意识场景或感质空间——表示所有不同感质的空间——统一却又分化的特性的神经机制。不过在此之前,除了上面的这些,我们还必须考虑两件事情。一是丘脑皮质系统是动态的。由于神经元连接的数量十分庞大,加上兴奋型、抑制型神经元的折返式交互以及网状核与皮质下价值系统的门控作用,丘脑皮质系统的功能性连接会在瞬息间快速变化。第二件事情是系统内部的交互要多于与皮质下系统的交互,例如调节大脑非意识活动的基底核。动态折返的丘脑皮质系统似乎主要同自己交流。这其实就是所谓的功能性聚团(functional cluster):大部分神经交互发生在丘脑和皮质内部,大脑各部分之间的交互则相对较少。后面我们会看到,这是一个重要特性,可以区分哪些神经活动服务于意识,哪些没有。
这个功能性聚团及其大量动态折返式交互——主要出现在丘脑皮质系统——被称为动态核心(dynamic core,图9)。动态核心有着极度复杂的神经回路,瞬息之间不断变化,正是统一而又分化的意识过程所需的那种复杂神经结构。它的折返式结构能整合或绑定各种丘脑核和功能区隔的皮质区的活动,从而产生出统一的场景。通过这种交互,动态核心将价值范畴记忆与感知分类联系起来。此外,它还负责让概念和记忆映射彼此相连。动态核心响应内部信号,状态不断变化,而且在短暂时期内,不与各具动态分化功能的新生回路沟通联系,这个特性解释了组成意识状态的相继场景的分化现象。最重要的是,由于其组成回路和神经元群的简并性和联想特性,核心的活动使得意识动物能执行高级辨识功能。
感质就是这种辨识。之所以能涌现大量辨识,是因为动态核心是一种复杂系统,能维持功能区隔的部分,同时又能以丰富多样的组合方式来整合这些部分的活动。简并核心回路的暂态就可能对应于一个场景,在很短的时间内又会更新,从而产生出变化的场景。当然这里的整幅图景与神经元群选择理论是一致的,与其将大脑视为选择系统的观念也相吻合,表现出既稳定又变化的特性。
对于成熟的个体,整个感质空间的整合范围可以通过经验放大或通过注意力动态地缩小。两个过程对于意识的计划能力都很重要。例如,可以想象,品酒专家通过反复品尝各种酒,并进行越来越细致的讨论后,会产生微妙变化。但单独一个人如何能得出这类不同的辨识呢?折返式动态核心能不能解释意识场景属于主观自我的事实?
图9 动态核心。丘脑皮质系统——动态核心的来源——表示为皮质和丘脑区细密的网状结构和折返式连接。核心由功能性聚团组成,聚团主要和自己交流,通过折返式网络传递大量不断波动的复杂信号。折返式动态核心触发的反应也能激发非意识反应。这些反应沿着并行脱离皮质的多突触单向通路传输,抵达基底核不同部位和部分丘脑核,最终又回到皮质区(见图3中)。通过这种方式,服务于意识的反应,就能与非意识区域的活动模式相连,这些活动主要由基底核负责,但不是全部。为了清晰起见,图中将基底核和丘脑挪了位置并放大。核心之外的皮质区在一些特定的时间也能与这些非意识活动模式互动。但再过几百毫秒之后,这些区域的神经元群就能加入到核心
后面讨论高级意识的时候我们会深入思考这个问题。这里简单解释一下在发育阶段和早期经验中可能发生的变化。意识最早的辨识能力关注的必然是与身体本身有关的感知分类。各种感知分类由映射身体状态的信号调节,这些信号来自脑干和各种价值系统(图7)。前面曾提到,来自“自我”系统的信号,负责报告身体和内外环境的关系。这些信号包括所谓的本体感、运动感或躯体感,以及自主部件。这些部件的信号,分别对应身体姿态、肌肉和关节的活动,以及对内部环境的调节,影响及于我们生命的几乎一切层面。它们调节的身体功能,就算成熟个体,也只是隐约意识到。同发送信号指明各种内外事件意义的价值系统一样,这些部件位于意识体验的深层核心。初期基于身体的自我意识(甚至早期的胎动也会增强这种意识)有可能为我们的感质空间提供了最初的引导,随后而来的基于外部信号(“非自我”)的记忆才逐渐变得复杂。因此,在高级意识出现之前,基于身体的神经参照空间,或以身体为中心的场景就会建立起来。动物或新生儿会体验到参照相对自我的场景,却不会有由内部分化成形的可指名自我。随着语义和语言能力以及社会交往的增多,人类的高级意识发展起来后,可指名自我才会涌现出来。在此之后个体才能指名和明确地区分感质。但在此之前,个体已经能够辨识感质,而且初级意识自我不断进行的分类,也几乎肯定是以之为参照。在意识背后的复杂系统中,已经含有了组成所有意识状态的可被辨识的感质。动态核心的活动通过学习不断丰富,终生都会受新的分类过程影响,而且这些类别范畴都与身体自我有关。不过重要的是要认识到,无论何时,组成核心的功能性聚团都不能等同于皮质或丘脑的整体,即使其部件不断地与非意识区域交互。
还有一个问题是自我是如何意识到持续的场景的。我们必须正视第一人称体验与第三者对体验背后的神经状态的描述的区别。就此问题,我们可以想象一个小妖观察者,它的任务是将亚稳态的核心状态解释为体验。假想大脑中有这样一个观察者,它能观察并解读某一物种的意识个体的动态核心中价值范畴记忆的大量神经运作。这种记忆系统是基于特定的物种,并与过去的感知体验有关。同时设想自我类别位于最前沿,即使各种类别与关系到非自我的感知分类混在一起。随着折返式动态核心持续的活动导致新场景的产生,小妖会观察到产生这个场景的神经活动,并注意到“自我”——通过身体的线索不断地动态构建——也与这个场景有关。然而,即使有了这些能力,这个假想的小妖也无法察觉或控制这个个体的意识活动背后的高级辨识。这个小妖也体验不到这些活动所伴随的感质。
这个有些古怪的构建推断表明,即使具备分析能力,这个小妖也永远不会知道,身为一个有意识的人是什么感受。我们将其放入大脑,并赋予它观察核心的能力,让它尝试理解意识体验的特殊本质。无论小妖是从外部还是内部来观察,只要它不具备那个动物的身体,就无法完全重复体验这种隐私的内涵。但通过观察参照自我的范畴记忆如何处理新的类别以生成场景,也许会带来启发,帮我们认识该如何弥合主观意识与神经活动之间的鸿沟。当然,小妖并不存在。实际上,这个设想的构造是用来迫使我们面对核心的问题。这个问题与意识的因果效力(causal efficacy)有关,下面我们就进入这个问题。