祁新世界观：了解意识现象与奥秘

人类思想史上，对于意识的理解各不相同。如果钻入书堆里去探究它们，我会发现自己开始若有所得，最终双手空空。大部分对意识理解，要么是一些故弄玄虚的名词堆砌或者无聊的学术纷争，偶尔一鳞半爪的真知灼见，淹没在那无边无际的名词海洋之中。

探究意识这个极为主观的现象，我们只有对自己下手，观察自己，反照内心，体察思维的细微之处，并结合神经科学的新进展，庶几可得一二。然而，其核心秘密，却仍然潜藏在亿万神经元之下，等待进一步的科学发现。

本节中，我对于意识的解释，综合了许多现有的新理论，也有一部分自己的独创。本着不违背常识，不违背科学，具有解释力，具有简洁性的这几项原则，我为意识的发生进行简明建模。这个模型是通俗易懂的，也符合前面章节中我讲到的三个基本出发点，即时间性、有限性和演化性三个原则。考虑到意识本质上的微妙，以及我们身在庐山中，不识真面目的困难，这无疑是一个艰难挑战。

好在前面章节已经做了很多铺垫，领域中的先行者们珠玉在前，凭着无知无畏的业余精神，我勉为其难，大胆一试。

意识的现象

意识是什么？

让我们暂且回避这个终极问题，一开始就贸然下定义，是有很大风险的。“什么是什么” 其实是一个思维定式，它是对事物本身做语义表达，企图用一堆概念限定某个事物。对于意识这样的关乎我们自身的精妙现象，我们先应该问问，它表现出什么样子？或者说，我们是怎么感觉到它的？

这里，要跳出笛卡尔的所谓 “我思故我在” 这个毫无操作价值的循环表述。意识的现象，是我们探索的出发点。在具有反思内省能力之后，我们完全可以探究自己的意识状态，使用一部分意识来观察另一部分意识，就像我们观察自己的双手双脚一样，从中获得启发。古代东方哲学和现代的心理治疗都依赖于此。所以，作为一开头的入口，观察意识是为了发现一些初步线索。之后，随着探究的深入，基于前述章节的论述，我们将逐步引入神经科学的新成果，来获得整体全面的模型。

首先，经过自我观察，我们都可以发现，在有意识的时候，我们是清醒的。

意识是大脑在清醒状态时的内部现象。当然，清醒状态是一个连续的范围值，从高度警觉，到日常状态，再到混乱烦躁，谵妄失序，直至没有了对刺激的反应而失去清醒。在这个范围内，我们都认为意识可以存在。意识存在于大脑的清醒状态中，或者说我们有意识的时候，才是清醒的。其实，我们在深度睡眠时，在昏迷和喝得断片时，我们的人活着，但是不能说我们是有意识的。这意味着，意识也许人脑中的附加模块，而不是维系生存的基本功能。

此外，在清醒的时候，我们是有注意力的。一件事物引发了我们的注意，我们才会思考它。我们的注意力是非常有限的，基本上一次只能想一件事情，再多一件就不行。当我们注意到外部事物时，我们不自觉地将眼睛朝向它，聚焦它，我们全神贯注地看着它。而当我们专注在某件心事时，我们的眼睛就好像失去了焦点一样，对外面的事物视而不见。所以，注意力是意识清醒时的主要特征。

注意力使得我们在大量信息中选择性地关注某些，忽略其余。注意力也有助于维持意识中的焦点，例如在阅读时，注意力使我们能够连贯地理解文字的意思，而不会每个字都认得却不知道它们合在一起后的含义。

本质上，注意力是大脑筛选信息的能力，它就像舞台上的聚光灯一样，只要进入了注意力范围，意识才会处理它。那么，从注意力联想开来，既然大脑的全部神经活动中，只有一小部分进入意识，是不是意识也是一种类似的信息筛选机制呢？如果这样想，你就大约触碰到了意识的本质。

再顺着注意力继续观察自己，我们发现，进入我们注意范围的事物，都是和我们有某些利害关系的事物。它们要么是环境中出现了意外情况，需要我们处理。要么是某种危险，机遇，或者我们感兴趣的东西，比如肚子饿了，路上突然飞驰而过的车辆，下雨天一个走过得美丽身影等等。

我们在与人交流中，我们此时自然会注意到对方，因为这次谈话也是关乎自身境遇的，或者具有某些价值。总之，我们的注意力总是被我们的内在需要所驱动，在我们注意到这些事物的时候，有时还附带有明显的倾向性，喜欢它，厌恶它，渴望它，嫌弃它，如此等等，这些情绪都与我们的内在需要有关。

其次，在清醒状态下，我们的大脑中似乎有一个话事人，它在随时感受着质感，并对之进行认知，做出决策。我们称之为自我，它是内部模型的使用者。没有意识的时候，自我不知道躲在何处，但是只要我们处于清醒状态下，自我就冒出来形影不离了。我们对于外界的感受，对于事物的反应，对于我们自己的关照，都是从自我出发的。自我给我们一种整体感，似乎每一个人都只有一个自我，它代表了我们的利益与诉求。但是，这其实是有很大疑问的，我们自己也常常发现，不同时候不同情况下得自我其实并不一致，它常常前后矛盾，顾此失彼，既要又要的。但是只要想一想，我们每一天说过的话中，有多少句以 “我” 开头，就知道自我的核心地位了。

然后也颇为微妙的是，我们的意识在说话。这其实是很多人会忽略的一点，我们的意识是以语言来表达的，想法是一个个前后接续的句子。即使一个想法最开始是模糊的，是 “一闪念”，但是如果这个想法被意识抓住，继续探究，“转念一想”，它就会具体化为一个句子，成为语言表达。此时，这个想法也就清晰明确了。意识具有语义，这是意识为何存在的最确切的线索，我们后面详述。

在意识说话的时候，不知道大家有没有注意到，我们常常使用一些视觉词汇来表达思维过程，比如：历历在目，眼见为实，看到未来，想象，谋画，愿景等等。我们还使用空间方位来表达时间，比如从前往后，跨越历史，瞻前顾后等等。或者我们还用一些视觉景象来表达抽象事物，比如崇高，光明，伟大，低劣、阴暗，渺小，蓝图等等。在意识中想起某事物的时候，即使这个事物是虚构的从未发生的，我们心中闪过念头也往往是一些用视觉建构的图景，被称之为心理图景。我们还主要通过视觉途径来获得知识，比如阅读、观察和模仿。我们的文化中充斥着各种视觉符号，文字书籍，艺术影视，视频动画，这些都依赖于我们的视觉能力。

因此，我观察到这个隐藏得很深的现象。我们的 意识其实是以视觉为基底的，也就是说，我们前述的内部模型，是以视觉为主。这其实并非偶然，在探讨人类理性的时候，我们将深入这个主题。

具体而言，意识可以分为三类，对外界事物的感知，对身体的感知，以及非感觉体验——意愿、情绪、记忆、联想和判断等等，它们合在一起，构成我们大脑中意识的奔流。如果将这个流拆解开来的话，我们就看到了一个个想法，或者更通俗的说法——念头。可以说 意识就是想法的序列，是此起彼伏的想法。我们每天大约有6到8万多个想法，如果清醒时间以16小时计算，那么每秒钟至少一个想法，意识是很繁忙的。

但是请注意，大脑的全部神经活动中，只有很一小部分进入意识。因为，意识实际上是很耗能的，在各种神经活动中，意识尤其耗能。

比如，就像我们前面讨论到的，人眼会对环境进行每秒大约4次的快速扫描，这个感知活动就不会进入我们的意识，否则我们会就像在颠簸的车厢里看外面一样发生眩晕。此外，诸如我们对于飞向眼前的物体的快速闪避，熟练后骑自行车或者驾车时的不假思索，程序员的键盘盲打，日常的穿衣刷牙，这些活动都不会出现在我们的意识中。

而且，注意力是一项很有限的资源，我们每天可以用的注意力，大约只能维持四小时。所以，只有那些有必要的神经活动，才需要进入意识层面。哪些神经活动需要进入意识呢？我们后面也会讨论。

综上，对于意识的主要现象可以总结如下：

意识发生在清醒状态下。
意识离不开注意力。在注意力中，大脑似乎加载了额外模块来处理信息。
意识是内部模型的使用者。
意识是有语义的，用语言阐述的。
自我出现在意识中，它扮演话事人的角色，是语言阐述的出发点。
意识中的图景是以视觉呈现的，意识与视觉息息相关。
神经活动的大部分，不会出现在意识中。

注意，此处总结的意识之现象，特指人的意识。它与以觉知为基础的更广泛意义上的动物意识的根本差别在于，人的意识是唯一具有语义的，我认为这是根本差异。

下面，我们开始为微妙的意识来构建模型。

意识为语言交流而生

过去我们获得的知识中，将人作为唯一具备意识的生物。后来，随着对演化的了解，这个武断的观点逐渐被更加符合科学发展的新观点所取代，其实意识并非人类独有。某些哺乳动物特别是灵长类动物，具备某种程度上的意识。那些养猫养狗的人也许能够理解这一点。我曾看到一些新闻，在老去的耕牛将要被拖去屠宰之前，它会默默流泪。老去的大象在临死前，会独自走向远方，消失在丛林里。海豚会救助落水者，将他们推向岸边，甚至用自己的身体保护落水者不受鲨鱼的袭击。有一个网上的视频展示了一只猴子看到游客手里有一个香蕉，然后当游客变魔术用手法将香蕉藏起来后，向它们展示双手空空的时候，猴子会露出不可思议的惊诧表情。还有人举了这个例子：

上次去动物园，人与猩猩间隔着玻璃墙，玻璃墙接缝处有一个小孔，猩猩看到有人吃瓜子，指了指那个小孔，让人把瓜子塞进去，结果瓜子卡到缝隙里。我心想，这下吃不到了吧？谁知猩猩从地上捡起一根小木棍，愣是从缝隙里把瓜子扣了出来！

此时，我们很难相信这些动物没有任何意识。

但是，人类与动物的意识，仍然存在一个根本差异：人类的意识是有语义的。

我们的念头是一条条的语句表述，任何动物都做不到这一点。所以，后面我们谈论意识时，明确指的是用语义表达的分析式意识，而非动物那种直觉的混沌的反射式的意识。

那么，人类为什么具有这样的意识呢？

此时，我们还需要注意到意识与人脑本身的一个根本差异，正是这个差异揭示了意识的起源之谜。

意识与人脑，在工作方式上，存在一个根本矛盾，这就是 串行与并行 的差异。

在意识中，我们通常只能在某个时刻想一件事情，我们的注意力只能在这个点上。这个事情处理完了，我们会对自己说 “好了，这件事情就这样吧”。然后，我们就可以转移注意力，去想另外一件事情。当然，在我们想一桩事的时候，另外的念头也会时不时冒出来，比如想到了连带的事情，或者有另外的想法来打岔。但是，意识的主要工作方式还是一次做一件事，特别是我们处于专注中，或者在与他人讲话的时候，我们的意识是串行的。强行进入一心二用的状态，会让我们觉得很辛苦，而且往往没法持续。我们无法有意识地用双手各自画出不同的形状，但是讽刺的是，我们却可以将另一件事情挪到意识以外去做，而实现一心二用，比如一边开车一边聊天，一边听音乐一边看手机。我们在专注某事时，会对其他的信息充耳不闻。所以，意识具有非常强烈的串行倾向，而排斥并行的干扰。

但是，我在前面的 特征与编码 中有详细表述，人脑本身的工作方式，如同大自然中其他的信息处理方式一样，是分散的并行计算。人脑中有数以千计的模块和神经链路，各自完成独特的任务，它们可能前后级联，产生像链式反应那样的连锁激活，但是总体来看，是并行的方式，有很多个执行序列在同时工作。这是由于神经网络的天然结构，不同的感官信息来源，以及大脑作为生存工具，必须做出快速反应的需要而共同决定的。

为什么意识是串行的，而大脑本身是并行的？这是一个深刻问题。其实在问题中，答案已经昭然若示。

大家自己说话的时候，是不是每一时刻只能在讲一句话？我们每个人都只有一张嘴，由于咽喉与声带的限制，任意时刻声带只能振动在一个频率上，所以这张嘴每次只能一次发出一种声音。因此，我们在任意时刻，只能在讲一句话。

如果意识是为了讲话而存在的，它就必须顺应这个模式，从大脑本身的并行，转化到了语言发声的串行。

意识为说话而产生！因而意识是有语义的。

就是这么简单。人的意识是有语义的，本身就揭示了这一点。

因此，人类意识应该是在群体中演化而来，其目的在于与同类沟通。关于群体生活对于人类大脑发育的促进，我在群体与博弈以及能说会道的智人有详细表述。我将这些内容概括一下，就是：

群体选择促进了竞争与协作的发生，群体生活中的人与人之间的博弈则促进了人脑发育和语言的形成。语言沟通对于生活在群体中的人们至关重要，因而促进了语言的产生与人脑的发展。二者相辅相成同时并进，二者共同塑造了现代人类。由于语言交流的需要，具有语义的意识同时在人脑中出现。

意识是人对自己说的话。

由于发声器官的天然限制，使得意识由并行产生而规约到串行表达，因而具有语义的人脑意识也是串行的，它们内则成为思维，外则表达为语句。

群猴抢麦

再说一说并行与穿行的问题。

在分散计算的大脑中，各种神经活动在同时发生，而到了意识层面，则某时刻只能有一个主要想法，这好有一比：群猴抢麦。

对，这就是意识的工作方式。每一只猴子代表着大脑中一个正在运行的模块，数千个模块，就像是数千只猴子，我们称之为心猿意马。它们可不听意识的指挥，在自发地独立运行。不仅如此，这些猴子都争相走到舞台中央的聚光灯下，进入注意力范围，夺得麦克风，从而获得发言权。

尽管我们觉得自己是完全有自控力的主体，其实大多数神经活动无需意识也能正常运作。比如，维持心跳、呼吸、血糖、消化、体温等生理活动，或者自觉地走路、开车、骑自行车，从事熟练操作等等。意识的最高优先级始终是说话交流、表达看法、获得同伴的支持，维系在群体中的地位。这在群体聚居，团队狩猎，共同抚育，竞争严酷的远古人类身上，是非常大的生存优势。即使在现在，我们也看到显贵、政客、官僚，理论家们，大多是能说会道巧舌如簧之辈。我们左耳上方高高鼓起的颅骨，以及出现在几乎所有聪明人面孔上的大脑门子，都显示着在灵长类中最发达的前额叶和人类独有的布罗卡区，这都与语言表达与语义分析相关，进而都与意识息息相关。

猴子们争相进入的舞台中央的聚光灯下，这在学术上称之为 全局工作空间 。

全局工作空间可以用剧院来解释。在剧场中，聚光灯会在舞台上照出一个亮圈。这个照明圈揭示了意识的内容，猴子们——也就是大脑的各个模块中的神经冲动——你争我夺，争相到这里对着麦克风——也就是语言发生模块——发言。当前没轮到发言的猴子们则在黑暗中——也就是即无意识或者潜意识中——听取正在进行的发言。

此时，有幸进入聚光灯下的那只猴子，也就是那个取得了竞争优势而被注意到的神经冲动，还不是具有语义的。在幕后，有编剧——也就是大脑中的布罗卡区——专门将这个神经冲动阐述为语义。

但是，人脑的高级之处在于，在这句说最终通过嘴巴说出口之前，有一个小小的不到一秒钟的时间窗口，舞台的下面坐着导演——也就是人脑中的价值模块——和其他的观众——这些观众要么是争抢话筒的失败者，要么是一直躲在暗处的其他猴子——一起先在内部听取这个发言，有一点点时间做出反馈。这些猴子要么支持，要么反对，最后进行表决。如果投票通过了，这个被阐述为语言的神经冲动，就通过人的嘴巴说了出来，或者成为指导我们行为的心理活动——也就是对我们自己说的话。如果表决没有通过，这句话就哽在心里被抛弃。

每一次这样的内部发言，我们称之为想法。大部分想法要么憋在心里被遗弃，要么成为指导行为的心理活动，如果想法被说出来，就是我们的日常谈话。

形成想法的这个过程的时间窗口并不长，这是因为大脑是生存工具，需要满足时间性的原则，要尽快做出决策，否则在现实生活中就会面临反应迟缓，错失机遇的惩罚。

聚光灯是一个关键道具。聚光灯所照射的范围不大，很有限，全局工作空间也一样。它使用的是一个容量不大的持续时间不到10秒的工作记忆，用于存放此时竞争获胜的这个神经冲动的上下文信息。研究表明，它是快速刷新的，一句话讲完，它就清空了内容，这就像CPU内置缓存器一样。它的有限性也侧面印证了意识首先仅仅用于交流的有限目的。

注意，舞台上发言的猴子和听众之间的反馈，其实是多轮的连锁反应，有时候这只猴子还没有讲完，就会被轰下台，换另一只猴子上台。或者，如果这个内部发言引起了群猴的共鸣，甚至会有几只猴子爬上舞台，帮助那只发言者一起来完善想法。

这有点像是十几年前软件行业在人工智能兴起之前所使用的规则引擎一样。这个过程是事件驱动的，各个模块是独立运作的，它们之间可以形成连锁反应，而且连锁反应的规模和深度是不受限制的。

更直观的来打个比方，舞台和这群猴子的运作，也有点像古罗马的元老院，议员们轮流发言，下面的人鼓噪喝彩，你说完了我说，中间夹杂着投票表决。我们张嘴说出的话语，就像元老院颁布的政令。但是有一点不同之处在于，元老院每天议员们可能只关注一两个共同议题。在人脑中，每个猴子都有自己的议题，一个议题只持续几秒钟。

这些内心活动在现实中体现为，有时候一个想法启发了其他想法，它们都出现在我们的意识中，我们一下子灵光乍现，百感交集。或者一个想法出现后，我们自己也觉得没意思，不会将它说出口。还有的想法，我们觉得直接表述有点莽撞或者尴尬，需要将它包装一下，换个说法更好。

以上的这个舞台比喻与通常的 笛卡尔剧院 不同，因为它并没有暗示有一个名为 “自我” 的君主坐在贵宾包厢里观看这场演出，他一票顶一万票，全权决定着一切。这样，就不会有任何超然于所有的大脑模块之上的心灵存在，也避免了所谓的心灵与物质的二元对立。

以上这个名为 群猴抢麦 的游戏，只是我们大脑中意识运作的一个概念模型，一个类比，借助它，我们可以快速地直观地理解意识的运作，但是它仍然只是粗糙的概念模型，不是精确的物理模型。它的成立，需要很多大脑生理机制的支持。

下面，我们进入正题，开始探讨在大脑内部真正发生的事情。

比如，抢到麦克风的猴子的发言，是如果传递到其他猴子那里去的？

折返网络

在回答前述问题之前，我们需要大致了解大脑的整体结构，特别是几个主要的脑部构造：丘脑、大脑皮质、灰质、白质、边缘系统。

这里面，丘脑是我们的关注点。丘脑位于大脑的中心位置，向上联通着大脑皮质的各个部分，侧面联通着负责记忆的海马体和与边缘系统——进行神经递质投放的奖励系统——相关的基底核，下方则直连感官信号输入的信息通道脑干，以及负责运动控制的小脑。大脑的860亿个神经元中，大约有300亿个最复杂的神经元位于丘脑和皮质中，其余的则在小脑中，这所有的神经元都与丘脑相连，除了嗅觉之外的所有感知信号也经由丘脑连接到皮质中更高级的区域。

丘脑充当着枢纽的作用，在皮质下区域和大脑皮层之间传递信息。每个感觉系统（嗅觉系统除外）都在丘脑有一个神经元模块——丘脑核——与之对应，丘脑核负责接收这类感觉信号并将其发送到相关的大脑皮质。

我们在这里可以看到丘脑的立体结构。

因此，丘脑实际上是大脑的信息中枢。大脑的其他的信息处理模块，包括古老的皮质下区域和大脑皮质上的更多模块，都插在丘脑这个信息中枢上，成为可扩展的部分。最初只有小脑、边缘系统等插在丘脑上，随着演化进行到哺乳动物阶段，丘脑上新插入了大脑新皮质这个巨大的组织。

可以说，丘脑是连接新脑与旧脑的信息中枢。

另外，我们需要了解大脑中的两类组织，灰质与白质。简单来说，灰质是进行信息处理的，白质是进行信息传递的。下图给了我们一个关于它们的整体印象。

图片来自互联网文章。

在图中，我们可以看到大脑的侧切面。大脑最下面是联通脊柱的脑干，它传来感官信息。脑干上面的半球形深色组织是我们关注的丘脑，丘脑的周边是小脑和其他一系列边缘组织，这些都是深灰色的，属于灰质。再往上，是一层厚厚的不规则的白色填充物，被称为白质，这是连接丘脑与大脑皮质的长长轴突及其髓鞘构成的纤维簇，我说的神经簇就是指这些轴突所属的神经元群体。再往上，就是大脑最外边的进行信息高级处理的新皮质了，它们也是深灰色的灰质，它们统称为新脑。

所以，白质联通着丘脑与新脑的信息管道。

从图片的右边黄色方框中可以看到，新脑，也就是大脑新皮层是一群群密集的神经元的构成的分层结构，它们还是一个个纵向集成在一起的，被称为皮质柱，这是我们目前所知的最先进最精密的大脑部件，大脑皮层上有大约一百万个皮质柱，每一个由大约二十万个神经元组成。皮质柱在智能的发生中发挥关键作用，前面我们讨论过它，后面还会继续讨论它。

如果从信息流向来看，我们会对大脑获得一个更直观的认识，如下图。

人脑的信息连接，图片来自维基百科。

如果上图让你犯晕的话，下图是一个更加简明的概括。

图片来自书籍《第二自然》

上图中，信息以丘脑为枢纽，在丘脑与大脑新皮层之间形成放射状互联，被称为 丘脑<->皮层互联。在皮层的各个模块之间，也形成横向互联，被称为 皮层<->皮层 互联。在丘脑与各处皮层之间，白质充当信息通道的作用。请注意，上图中的互联都属双向的。

边缘系统 在演化中出现得远比比大脑皮质早，在爬行动物中就有了，它属于旧脑。物理上，它是包裹在丘脑周围的一些零碎结构，如海马体、伏隔核和杏仁核等等，下图中的红色区域属于边缘系统。

上图中红色区域为边缘系统，图片来自维基百科。

边缘系统中的一部分是我们最关心的，被称为价值系统，它帮助大脑确定应该追求什么，避免什么，喜欢什么，厌恶什么。它帮助我们生存繁衍。边缘系统的个体差异解释了为什么不同的人对相同的事情会有不同的看法。每个人的价值系统还会受到文化、经历和信仰的影响，从而表现出多样性。价值系统是一个笼统的逻辑表述，它指边缘系统中与欲求取舍相关的部分。

价值系统的选择大部分是经由神经递质的释放来进行的。

好了，了解这些大脑的基本构造之后，我们可以继续有关意识的讨论了。

大脑的运行

首先要澄清，大脑不是一台计算机。

大家通常认为大脑是一台计算机，就信息处理这个目的而言，二者相似。但是就信息处理的方式而言，二者相差很大。

第一个原因在于，大脑完全以模块化来运作。各种模块数以千计，仅仅与视觉相关的模块就有几十个。比如，V1负责物体方位，V4负责颜色，V5负责物体运动。但是，不存在一个总指挥，来控制其他模块。在识别一个形状复杂的组成部分颜色各异的运动物体时，各个模块分别识别轮廓、形状、颜色、材质、类型，然后这些信息在大脑皮层处汇聚后，事物的整体概念以某种方式浮现出来，不存在控制和协调所有其他模块的一个特定模块。这是由长期演化形成的分散计算机制所决定的，与我们常见的有核心CPU与数据总线的冯诺依曼架构的计算机大相径庭。

第二个原因在于，大脑接受的是模糊信号，而非精确信号。并且，大脑在处理信息的过程中，还可以进行学习，调整突触的阈值，重组树突和轴突，这相当于运行时自己修改自己的硬件架构和源代码。这些都与传统的计算机两样。

因此，不能将计算视作大脑的基本能力。

那么，怎么理解大脑的信息处理机制呢？

其实，前面我们在谈单个神经元已经有了答案。

在数学意义上，一个神经元的计算能力可以简化描述为，对于输入的一个n维向量，神经元可以判断它是位于向量空间的某个基准平面的左侧还是右侧。也就是说，单个神经元可以视作一个过滤器，对于任何输入，它都可以判断出，该输入是不是符合某种内定的筛选标准。因而，神经元是一个 非线性选择器。

单个神经元的作用是在接受了电信号之后，做出一次选择——激活或者不激活。该选择的依据是非常初级的特征，这些特征往往不具备宏观意义，只有程度小大的差异，无法用词语表达。

由于大脑的无尺度网络特点，多神经元聚集而成的神经簇也是在进行选择。由于多个神经元组成的前后级联的结构，神经簇的选择在一般意义上具有了某些宏观意义。可以认为，其选择是根据特征进行的，比如形状、大小、颜色、类别等等。

再往上的模块级别所做出的选择则有了更具体的含义，此时的选择往往是根据事物的不同组分的多个特征之组合，而不是某单一特征。不同特征在选择中的权重还可能不一样，是为综合的权衡。

所以，大脑的感官信息的初步处理过程，可以视作对于原始信号的采样，滤除噪音，获得特征的过程，是对事物进行 甄别和分类 的过程。这一过程是基于选择完成的。

下图是一个有关视觉信号处理过程，它可以给我们展现信息处理的大致印象。从该图中可以看到，从浅蓝色的位于头颅枕部的初级视觉皮质出发，密密麻麻的信息在很多模块之间同时传递，最后逐步到达大脑的顶叶。信号的颜色也逐渐变化为红色与橙色，表示大脑从视觉信号中逐渐知道了该事物是什么，获得了该事物的一些特征与概念。

图片来自论文。

在达尔文演化论中，大自然在不同种群的个体之间进行选择。那些更具有适应性的个体得以存续，这被称为自然选择。作为大自然38亿年演化的结晶，大脑之运作也是如此。它本质上是一个演化发生的沙盘，是各种信息的试炼场。

那么，大脑中的自然选择是如何发生的呢？

大脑中自然选择，体现为对同一组输入信号的不同阐释之间的竞争。

如果以为，几百亿个神经元所组建的巨大网络，只会对某次事件所输入的一组信号只进行单一阐述，这就太小看了大脑的能力。

从脑干传来的感官信息，经过丘脑的分发，引出无数个链路，向着大脑皮质进发。这个过程中，这些链路各自对信号按照自己的方式进行采样、解析、特征提取与整合，这些过程同时进行着。这些并发过程，由于各自所经链路的差异，不同神经元的倾向性，信号的模糊性，神经元的随机偶然性等因素的作用，它们最终所得到的特征结论不会完全一样。

这样，对于同一组输入的感官信号，就会产生多种不同的阐述。比如，远远地看到50米外人行道上的一块深色的影子。对这个信息，也许大脑中一条链路认为这是一个陌生行人。另一条链路认为这是树干上一块颜色深的地方，还有一个条链路认为这只是一台清洁推车。这三个结论都是很多神经元参与之后的处理结果，处理过程发生在几十到上百毫秒内。

这是一个信息发散的过程，它相当于演化公式中变化的发生，它给大脑以很多可选项。

丘脑参与了这一部分的初级处理，除了作为信息中枢之外，丘脑自己也是灰质，它包含大约60个神经核，也就是神经元聚集在一起形成的团块。神经核与大脑皮层相比，可以认为是皮层的原始版本。这里可以做很多事情。实际上，我认为，内部模型是在丘脑这里维护的。因为，只有丘脑是与大脑的所有其他模块都紧密连接的，这符合内部模型被广泛引用的需要。

这些链路的信息首先会进一步向更高级皮质传递，在那里完成整合。

感觉整合

为什么初步信息需要整合呢？因为事物的特征是多方面的，它们来自不同的感官，代表事物的不同面向，大脑在获得这些信息之后，需要进一步认定这些特征是属于同一个事物，它们是一个整体的不同面向。

比如，我坐在公交车上，眼前有许多乘客。他们有高矮胖瘦的，穿着不同衣服，有的拎着包，有的玩着手机。他们的样貌、体态、年纪、身形、衣服都是不同的特征，这些特征需要各自归总为一个个的乘客，他们各有特点，每个人在我们脑中的信息，都是这些特征整合之后得到的。在整合完成之后，我们脑中就只有一个个的人了，而不会出现“黑色方形口袋”、“三角形的肉嘟嘟的鼻子”、“一股厨房的味道”等等各种支离破碎的信息。

但是，整合是如何完成的呢？这是一个被称为 感觉整合 的难题：既然视觉信息在大脑的一个区域处理，听觉信息在一个区域处理，触觉信息在另一个区域处理，那么，大脑是怎样产生出整合的世界景象的呢？

毫无疑问，感觉整合发生在大脑的新皮层中，特别是高级皮层，比如前额叶和颞叶。新皮质构成了人脑最外面的充满沟回和褶皱的那部分表面，它是意识产生的基础，只有哺乳动物才具有。

关于这个主题，维基百科上的条目已经很好的解释了它的概念和目前的研究进展，我大致总结如下：

感觉整合涉及大脑如何利用多种感官输入，包括本体、视觉、听觉、触觉、嗅觉、前庭系统、内感觉和味觉，并将其整合为事物的对象及其状态。
多种感官同时输入所导致的冗余，是整合的关键。因为，不同感官的信息是互补的。单一感官的偏差，可以籍由冗余而得到纠正。
嗅觉常常与味觉整合，而视觉常常与听觉整合。
人类作为两足动物，视觉和平衡感特别重要，它整合为我们自己的本体感。
整合还结合了位置时间等等信息，它们成为神经编码的一部分。
感觉整合过程，信号经由大脑的不同区域，在梯度上不断提炼递变而完成的。
感觉整合过程，实际上也是大脑建立内部模型的过程。
内部模型的正确性，除了经由感官冗余保障之外，还需要受到实际活动的校验和更新。
手眼协调、腹语效应、视听同步等等现象，都是感觉整合的结果。

还有一些观点，认为感知整合与丘脑与新皮质之间的 $gamma$ 脑电波共振有关，这类观点过于玄幻，我不采纳。

其实，整合很好理解。我们在后面章节中将要讲到 信号折返 时，会得出了整合的过程：

由于感觉信号在神经簇构成的稀疏网络中可以形成循环，往复传递，这将触发霍布学习过程，或者说霍布学习过程就是这样达成的。折返过程中信号的正负反馈都将发生。但是，与通常的反馈回路不同，信号折返不是单一的闭环，它同时在多路上并行，并且会交叉影响。其结果是，大脑在短时间的震荡之后，将发生状态转变。如果这些折返主要发生在新脑与旧脑之间，而且触发了价值系统的介入，引发神经递质的分泌，则这些折返很可能改变网络中部分突触的强度，并引发意识的产生。

折返过程的后果是，神经元网络作为一个整体，将发生某种状态转变，比如由A转换到了B。

这其中不存在什么形式逻辑，纯粹是一个巨繁无比的信号收敛过程，它主导了神经元网络的时空协调，使之最终以一个整体的方式，达成状态转换。在折返过程中，各种感觉信号得以整合。比如，对象的颜色、运动方向和速度等等特征就能通过信号折返整合到一起了。这样，功能不同的各个脑区针对各种属性的活动就能互相结合，不需要一个上级来指挥与协调。

感觉整合之后，我们头脑中的内容就不一样了，出现了概念。

为了交流方便，每个概念都有其语音表达，被称为词语。之后，大脑就可以用名词语表达事物了。

词语使得意识成为可能。因为，具有语义的意识是词语组成的语句。词语是一个个的指针，它们指向的是客观事物在大脑中的表征集合，而它本身只是符号。词语意味着信息的极大简化以及压缩，它使得大脑中的不同模块之间快速共享信息成为可能。

注意，上述这些过程都还是发生从丘脑出发前往大脑皮质的前馈网络中，此时信息流还是单向的。

此时，人脑中有没有意识发生？

还没有。还缺少一个关键助力——注意力。

注意力是如何驱动意识发生的？让我们继续。

折返回路与注意力

信息在大脑皮质处完成整合之后，再通过皮质下的白质，往下重新传递到丘脑处，这被称为折返。

大脑新皮质下层的神经元的通向丘脑的轴突，图片来自互联网文章。

在折返回路上，从新皮质到丘脑的连接数量是从丘脑到皮层的10倍，为什么会这样？因为折返有一个关键作用：

新皮质通过折返更新丘脑处的内部模型，其他模块得以依据更新后的内部模型，产生自己的预测。

内部模型需要即时更新，其原因也很简单，因为我们所处的外部环境是随时改变的。大脑作为生存工具，必须及时反应这种变化，否则就不能做出正确的预测。

诺贝尔奖获得者杰拉尔德·埃德尔曼这样表述折返在生物演化史上的意义：

证据表明，意识来自皮质区域和丘脑间的折返活动以及皮质与自身和皮质下结构的交互。随着丘脑皮质系统进化得越来越完善，丘脑核的数量随之增多，大脑皮质也不断增大，使得原始意识出现。这一系列进化事件可能始自爬行动物向鸟类进化并在大约2.5亿年前分化出哺乳动物的时候。

折返将感知信息和价值判断、记忆进行连接，原始意识才得以涌现出来。丘脑皮质折返式神经网络的整合活动将创造出原始意识的当下场景，这个场景使得动物可以进行计划与决策。

简言之，通过丘脑的信息枢纽作用，大脑皮质的处理结果——也就是霸麦猴子的发言——在折返到丘脑之后，得以广播给所有其他的猴子，它们据此做出自己的反应和表决。在这个过程中，意识的萌芽浮现了。

我试图从控制论的不同角度来看待折返的意义。

信息从丘脑经由白质到达皮层，再由皮质经由白质返回丘脑，这在脑科学中被称为丘脑—皮质回路。

在丘脑——皮质双向回路中，我们特别要注意上行系统，它是一组穿过丘脑和下丘脑的不同通路将后中脑和前脑桥的背侧部分连接到大脑皮层的神经元纤维。简单来说，就是从丘脑上行到大脑皮质的神经连接，简称上行系统。上升系统被认为有助于唤醒皮质，是意识的动因。上行系统的病变可导致意识丧失、昏迷或死亡。我们熟知的帕金森病也与这一系统有直接关系。

丘脑——皮质双向回路构成了一个信息环路，在控制理论中被称为反馈系统。

反馈是指将系统的输出返回到输入端并以某种方式改变输入，进而影响系统输出的过程。

在各类的反馈系统中，有一种 误差调节环路 值得注意，它可以帮助系统维持在某个基准状态附近，这对于生命体这类复杂系统至关重要。以下是误差调节环路的信息流简图：

误差调节环路是这样工作的：

假设系统所在的环境中存在着各种干扰，使得系统处于非稳定状态。此时，系统测量一项关键指标，然后将之与期望值进行比较，得到二者的差异，再将该差异值重新输入系统本身，以期改变系统的行为，使之回归到期望值上。

人体内存在很多的这样的反馈过程。

例如，我们的血糖应当在正常范围内波动。当吃饭后食物被消化，血糖水平会升高，导致胰腺中的β细胞释放胰岛素。胰岛素的作用是让肝脏吸收血糖并以糖原的形式储存，从而降低血糖水平。但如果我们长时间不吃饭，血糖下降太多，另一种α细胞就会被激活，它会释放胰高血糖素激素，让肝脏和脂肪细胞分解糖原并将葡萄糖释放回血液中，从而维持血糖水平。相应的，大脑也会做出类似的反应。在饱腹时我们不会马上想着下一顿，而在低血糖时我们会流冷汗，手脚发凉，恨不得马上吃一口热乎的。低血糖时我们的反应程度，与血糖值与正常值的差异大小成正比。血糖越低，人们的反应程度越是强烈，甚至最后可以昏倒。

我们身体中的各项基本指标的调整，大抵如此。

可见，折返使得人脑成为反馈回路，其作用是人体维持的常态。误差调节是它的主要运作方式。

折返在意识中发挥了巨大作用的观点，在脑科学中被称为 循环处理理论，该理论还在发展之中，我认为它很有潜力。但是，该理论主要解释了视觉信息的处理，而我认为：

💡

价值系统介入了折返过程，这才是意识发生的根源。

在误差调节环路中，期望值 是一项非常重要的设定。

那么，人脑中的期望值是怎么设定的呢？它如何介入到大脑的信息回路之中的呢？它与意识的发生是什么关系呢？

这些问题非常深刻，直指意识的本源。本着简明扼要的初衷，我以几句话来概括：

💡

价值系统介入折返回路促使了意识的产生。人的基本欲望以及它们的反面，体现为我们的好恶，这就是人脑中的期望值。人脑中的价值系统在生理的最深层次上体现了人的基本欲望，决定了我们的好恶。价值系统通过神经递质的释放，介入到大脑的折返回路中。当该介入带来的广泛的神经网络的活跃时，意识产生了。

我们所说的价值系统大抵是紧密围绕着丘脑的边缘系统，它包括杏仁核、伏隔核、下丘脑、脑垂体、海马体、中隔內核等等许多零碎物件，它们最早出现在爬行动物的演化时期，它们要么直接与欲望与情绪相关，要么存储着相关经历。价值系统在生理上体现了我们大脑中的原始欲望。我们的其他愿望，或者是其直接表达，或者是其经过修饰后的晦涩曲折的表达。

让我们以电影《黑客帝国》中的一个著名场景——红衣女郎——开始，探讨在反馈系统中价值模块的作用。

街上的红衣女郎，截图来自《黑客帝国》

在熙熙攘攘的大街上，人来人往。此时，墨菲正在和尼奥解释说，矩阵的本质是一个幻象。正在此时，一个体态丰满的红衣女郎，带着明眸与热力，从尼奥身边擦身而过，投来惊鸿一瞥。尼奥这个帅小伙子，不自觉地回头望过去，完全不理会在一边正在讲话的大佬墨菲。

此时，在尼奥的头脑里发生了什么？

平时走在大街上，如果没有什么特别的事情，我们会处于放松状态下，头脑中会有各种各样的念头不时冒出来，但是基本上没有注意力。但是，如果出现了如上的红衣女郎，情况就不一样了。

首先，所有的视觉信号会在大脑皮质处完成整合，得到一个整体认知：一位鲜明的红衣女郎正向你走来，贴得很近，她很迷人，她在向你微笑。此时，这个整体认知从大脑皮质处折返到丘脑处，更新为内部模型的新内容，供大脑的其他模块使用。

价值模块实际上一刻没停地巡视着内部模型，在获得更新信息之后，它基于本能马上找到了感兴趣的内容——美丽热情的红衣女郎。几乎是在瞬间，一个新的期望值被价值系统建立起来了：接近她，认识她，给她好感！但现实情况是，尼奥不知道她是谁，不了解她的人生过往。此时，期望值与现实值之间的差距很大。这个差距值被立即投放到大脑的信息反馈回路中，改变了它的均衡状态，激发了巨大的阶跃响应。

让我们具体看一看其内部机制。

首先，从大脑皮质向下延申的神经元的轴突，构成了皮层——丘脑的双向信息回路，也就是大脑皮层与丘脑之间的白质，对于意识的形成至关重要。

先看一看其中的上行通路。丘脑负责将来自感官的信息传递给大脑皮层，做进一步的整合处理。丘脑采用如下图的方式，通过上行通道向大脑皮层投射感觉信号：

图片来自论文。

根据丘脑上神经核——也就是丘脑中的神经元团块——的类型不同，其投射模式也不同。红色的特定核接收大部分感觉输入，并将其主要发送到皮质第4层。绿色的非特定核则投射到皮质第1层。这么看来，非特定核的信号将在大脑皮层中获得更多的分阶段处理。

再看一看下行通路。大脑皮质会将处理之后的整合信号，折返回传到丘脑，用来更新内部模型。这个传播是通过从大脑皮层的神经元出发的长长的穿越白质的轴突来完成的。

大脑皮质下层的神经元的通向丘脑的轴突，图片来自互联网文章。

注意，当整合后的信号从新皮质下行到丘脑之后，发生了一些新情况。

丘脑中的神经元可以在价值系统的帮助下，对它们所接受的信号进行有选择地反馈。一些信号及其传递的轴突获得了进一步激活，其他一些信号则被忽略甚至抑制。这个反馈机制本身，称为树突综合理论，是一个发展中的解释意识的理论框架。价值系统在其中的介入，是我的创见。

大脑皮层——丘脑的神经元轴突的耦合与解耦，图片来自论文。

上图左侧 A 中可以看到，这些轴突上面从大脑新皮质中的神经元出发，向下延申到了丘脑，然后分散为很多轴突侧枝，连接丘脑本地的神经元树突。中间长长的轴突中段，就是我们常常说的白质。在一般情况下，大部分轴突处于解耦状态，大脑皮质与丘脑之间的可连接性不高。

上图中的右侧 B 中，来自丘脑（thalamus）中神经元的反馈信号使得从大脑新皮层伸过来的长长轴突得以保持耦合，连接得以维持。如果没有丘脑的反馈，则连接解耦，通路断开了。

从丘脑向来自大脑新皮层所进行的反馈使得二者的长连接得以保持住，这是反向传播。一些科学家认为，反向传播的存在，与是否能够维持白质中长长的轴突管道内外钠离子的浓度差异，从而保持其内外电位差，有直接关系。

要点是，在尼奥看到了红衣女郎之后，经过新皮层的整合，红衣女郎信息出现在丘脑后，丘脑附近的价值系统得以介入进来，判断这是否为一个有兴趣的信号。

价值系统的作用机制是释放神经递质，每一种价值大致与一种神经递质相关联，与动机关联的就是 多巴胺。多巴胺可以视作大脑中的通用货币，在人脑860亿神经元中只有约四十万个可以分泌多巴胺，它们只出现在特定区域中。但是，它们的轴突可以一直延伸到脑的其它区域，对其他神经元造成强烈影响。下图中的紫色区域是多巴胺神经元的分布区域。

图中紫色区域为多巴胺分泌区，图片来自维基百科。

可以看到，紫色区域分为两类。一类是上图中伏隔核，腹侧被盖区，海马体，纹状体，黑质等等这些围绕着丘脑的区域，我称之为价值系统。一类是前额叶皮质，这是人类进行思维的主要区域，是理性与德性的居所。

大家通常认为多巴胺是产生愉悦的物质。但是目前的研究认为，多巴胺其实是记录我们前述的期望值与现实值差异的物质。期望值与现实值之间的差异，可以简单地表达为动机。多巴胺多少与动机大小紧密相关。

此时，红衣女郎激发了尼奥的价值系统的兴趣，离丘脑不远的腹侧被盖区开始释放多巴胺，这些多巴胺主要作用于尼奥丘脑中红衣女郎信息相应的区域。得到这些刺激后，丘脑通过前述的反向传播，激活了传递这些信号的神经元轴突，使之保持活跃，这又带来了一系列后续反应。

此外，还有一种可能的情况是，在尼奥的初级视觉皮质解析出女郎的面孔，特别是其动人的眼睛后，经过视觉皮质到价值系统的旁路——这些都是出现在演化早期的速度飞快的硬连接——跳过了后续的大脑皮层的整合过程，直接传递信号给了价值系统，价值系统马上表达出兴趣，并刺激了丘脑。

总之，在多巴胺的作用下，这些相关的轴突开始活跃，处于耦合连接状态。于是，红衣女郎的信息得以在大脑皮质与丘脑之间来回循环，就像在回音壁之间来回震荡的音波一样。同时，信号经由丘脑广播给给其他模块，引起了广泛的涟漪。

这样，在价值系统精准投放的多巴胺的作用下，此时的尼奥突然感觉自己眼中的红衣女郎形象登时鲜明生动了起来，一股热力扑面而来。

💡

价值系统促使丘脑只会有选择性地维持那些传递红衣女郎信息的轴突的连接性，那些无关的轴突则被抑制。所以，价值系统扮演了一张滤网，滤除了它不感兴趣的东西，只为特定的信息网开一面。过滤机制依赖于神经递质的精准投放。此时，在尼奥的脑白质中，那些传递红衣女郎信息的轴突的连接性保持得非常好，而其他连接则相对阻塞。这就像透过有色眼镜看周围的环境一样，只有价值系统认可的信息才得以在皮层——丘脑间保持连接性，后续的信息循环与反馈才得以延续。这种信息过滤，就是注意力的发生机制。

额前页和价值系统都能分泌多巴胺，说明它们都可以引发注意力。前者体现理性，后者体现本能。

这里，我要插一句题外话，说一说麻醉药和毒品。它们与这种反馈机制也是密切相关的，它们从侧面证明了反馈机制的存在与强大。

麻醉药和毒品

几乎所有的麻醉药都以丘脑为靶点，麻醉药的作用是阻断连接丘脑到大脑皮层的连接，使它们完全解耦。此时，被麻醉者当然也就不会有任何意识发生。

毒品——主要指兴奋剂——的作用则相反，它会促使价值系统释放大量的神经递质，或者通过其他方式维持丘脑和白质中的神经递质浓度，这样不加选择地，无条件地激活所有白质中的神经纤维簇，使得它们都处于良好的连接状态。此时，吸毒者就会觉得所有的感知都鲜活明亮、无比生动，所有的刺激都非常强烈。

自闭症和多动症是这件事的两个极端，正常人类则处于以上二者之间。

在丘脑以及其周边的价值系统，对大脑皮质传来的信息进行的有选择的反馈过程中，选择范围的精准程度，以及维持的时间长度，是可以后天习得的，是一种宝贵的能力，我们称之为专注。一些现代媒体，比如电视、短视频、游戏、手机应用等等，会频繁即时地刺激人脑的价值系统，使之不断释放神经递质，带来了对这种选择性的侵蚀。

此外，由于注意力需要神经递质的投入。在常态下，神经递质存放在神经元轴突末端的突触小泡中，储量有限。释放后的神经递质，要么被酶消解，要么被神经元回收。这是因为，神经系统需要在大部分时间里保持常态。这样，每天中大脑能保持专注的时间是有限的。大部分脑力劳动者和程序员都知道，真正有产出的干活时间，一天不会超过四小时。

为什么演化要赋予我们注意力这种机制？因为，大脑是生存工具，能力是有限的，需要分轻重缓急。哪些是当前最要紧的事情，则要由价值系统以及前额叶来决定——它们都能分泌多巴胺。

那么，此时注意力有了，意识发生了吗？

它还在路上。

意识的发生

在尼奥对红衣女郎投入了注意力之后，接下来发生了什么呢？

到目前为止，尼奥对红衣女郎的感知是全面的，她的明眸善睐、丰满身姿、款款步态、粉面含春的妩媚笑容，所有这些特征被大脑皮层整合在一起，构成了“红衣女郎”这个整体，传递给了丘脑，更新了内部模型，并激发了价值系统的注意，价值系统据此产生了一个期望值。由于这个期望值与现实值之间的差异很大，于是，大脑中的神经反馈网络获得了一次阶跃响应，产生巨大的波动，扩散到了很多其他模块。

反馈系统中的一次阶跃响应，图片来自维基百科。

这些模块分为两大类，一类是在动物演化初期就有的基本模块，它们位于旧脑中，围绕在丘脑附近，比如负责运动控制的小脑，负责咀嚼吞咽的模块等等。一类是在演化后期，特别是哺乳动物时期才有的新模块，它们是新脑，都位于大脑皮层中，它们的大致功能是分析与规划，提供预测。比如，负责控制在群体中的行为规范的大脑前额叶区域，以及负责语言的布罗卡区。

前一类模块，激活后会立即采取行动，这些行动往往发生在意识之外，迅雷不及掩耳。

于是，尼奥不自觉地回头，呼吸暂停，目送红衣女郎款款而去。此时，墨菲的画外音也就充耳不闻了。

后一类模块则在自己被激活后，首先要做的事情，是了解当前发生了什么，这被称为探究。

那么，这些模块会直接接触红衣女郎的一堆具体特征吗，比如衣着材质、体重、头发长短、口红颜色、运动姿态之类的？不，因为此时内部模型中已经有了一个现成的表征——红衣女郎，它在当前场景下是简明清晰的，具有足够的指代精确性。而且，就信息传播的效率而言，其他模块也不需要了解红衣女郎的所有特征细节，因为这些特征分散地存放在各自的处理模块中——也就是大脑皮质的各处，没有一个统一的地方。但是，通过“红衣女郎”这个表征，它们通通可以被找到。

所以，在其他模块发出探究之后，它们得到的是关于本次事件的简要概括，学者们称之为 内部报告。因为使用了整合后的词语，内部报告具备了语义，它大约是这样的：

“一位闪亮的红衣女郎正朝我走了过来，好兴奋！”

尼奥头脑中终于有了一个念头，意识出现了！

谁来负责提供内部报告呢？

这涉及多个大脑区域的复杂交互。这些区域包括：前额叶皮层、后扣带皮层、颞顶联合区、岛叶等等。不出意料，它们都位于大脑新皮层上。这些区域通过前述的皮质——皮质互联保持畅通，共同整合与生成内部报告。

实际上我认为，生成内部报告与感觉整合是一回事。所谓的生成内部报告的过程，就是神经编码的不断压缩的过程，由原始的特征编码，逐步转化为中间阶段的宏观特征编码，比如女郎，迷人，红衣服，丰满，微笑，走来，等等，最后再进一步压缩整合为一个编码：红衣女郎。于是，红衣女郎成为了内部报告。

因为意识是零碎信息的整合与概括，我们可以将意识看作报纸的头条新闻。比如，上海有一家报纸叫做《新民晚报》，它的头条大多是上海本地新发生的要紧事体。意识就是当下头脑中发生的最重要事情的新闻头条，它往往简单到一句话。但是，如果你自己——这个“自己”其实也是值得深究的——有了动机，想进一步了解情况，你可以在头脑中继续探究下去，获得进一步的细节。

其实说白了，意识就是 大脑与它自己交谈。

大脑复用了人与人的对话机制，将它用到自己的一部分与另一部分的交流上。

由于交谈的时效性和能耗，信息需要简约。意识就是信息摘要。它缺乏大量详细信息，并不总是准确的，并且本质上是不完整的。但是，虽然意识是提纲挈领，但是它作为索引的起始处，可以经由词句中的指代，不断深究到各种细节上，这是意识的强大，这也和感知整合是一脉相承的。

此外，正如我们拥有针对自身的注意力一样，我们也有针对他人的注意力。这个观点的基础是，处理我们内在体验的大脑回路也可以同样处理我们对他人想法的感知。例如，当我们观察到另一个人看着苹果时，我们会模仿他的状态并明白他此刻的注意力在苹果上。我们使用共情来预测他人的内心想法，通过模仿他人的注意力状态，一样地为他人生成信息摘要。

报纸无法直接控制城市中发生的事情，但它通过提供简要信息，对读者施加间接影响力。这就是报纸头条的威力。

而意识也一样，通过有选择地披露筛选后的细节，意识塑造了我们的内在。

如前所述，信息只有出现在折返循环中，在大脑不同部分之间广泛传播时，才能形成意识。感觉皮层能够提供内容，但只有当这些内容被更广泛的引用时，它才会出现在意识中。这些内容尚未成为意识，但有潜力成为意识。

这让我想起了丹尼尔·丹尼特的多重草稿理论。

在很多感官信息及其不同阐述中，只有某阐述被探究时，该部分作为一个草稿才会被选中，被选中的草稿是那些获得了多巴胺投票的版本。

在与别人交谈前后，我们都要与自己交谈。其实，大脑主要同自己交谈。

头脑中的信息反馈的循环始终在进行中，一个动机浮现，激发了一些涟漪，然后消沉。然后，另一个动机又浮现，激发一些涟漪。意识没有终点，意识是流。

另外还有一点要澄清的是，注意力的来源可以是自上而下，也可以自下而上。例如你阅读这篇博文时的注意力是自上而下的。当我们手臂上被蚊子叮咬的时候，手臂获得了我们的注意力，此时是自下而上的。它们的共同点在于，都存在期望值与当前状态的差异，前者差异来自大脑前额叶设定的获取信息的期望，后者差异来自手臂的常态与反常的对比。

这些感官信号不断涌入你的大脑，每个信号都在不断争取注意力。大脑内部进行着一场场竞争，信号们不时变得突出，逐渐退居幕后，给新信号让出注意力。

意识不等同于注意力。我们的注意力可能会被吸引到某样东西上，而我们却没有意识到。这是每个魔术师都知道的事实。他们经常在你没有意识到的情况下误导你的注意力，这让他们能够表演把戏。

好了，到目前为止，我大致论述了以下的意识发生的逻辑链条：

💡

预期值与现状的差异 -> 注意力 -> 探究 -> 生成内部报告 -> 意识

这个过程不断延续往复发生，构成了我们头脑中的意识流。

当我们用语言与别人交谈时，头脑中发生的意识流也是基于同样的机制。不过，此时的预期值被大脑中的额前页设定，并随着交流进行而不断变化，由此也带来的话题的不断转移。

由于大脑的分散并行处理与内部竞争的存在，大脑必须以冗余的方式处理信息，大脑还因此具备了试错与容错的好处，就这样，大自然的演化在人脑中重演。

感知信号及其不同阐释被价值系统与额前页选择，成为众多草稿中的定稿，以语义表现为意识，用于我们与别人的交流，以及自我沟通。

好了，我们终于回到前述的群猴争麦上来。

群猴是如何决定谁抢到了话筒的？

是价值系统与额前页，它们用多巴胺投票，决定谁抢到了麦克风。

但是，问题并没有彻底解决。意识中无处不在的那个“我”是怎么来的？

这就是下一章要做的探讨。在那之前，我们先补完一些有关意识的内容。

意识的语义

前面提到，经过大脑新皮质中的信息整合之后，意识中出现了词语，词语本质上是事物的象征符号，它们出现在大脑的内部报告中，使得我们的意识带有语义。为了让词语具备更多意义，需要将词语进行组合，这就是语法。具备语法的语言，是演化过程中的重大突破。

我们此前探讨了，在激活的神经链路中传递的信号，是神经编码。

词语与神经编码是同构的。

这很好理解。神经链路可以看似树状网络结构，它的各个节点是一些负责特征筛选的神经元。每一个激活了的神经元，代表了一个被选择的特征，可以由一个词语表达，比如“一”、“高大的”、“有果实的”、“树”。由于神经链路的树状网络结构，这些激活的节点可以串接起来，就成为了一个词组：一颗高大的果树。

这里面的关键跨越，是符号象征能力的出现，也就是用头脑里的象征符号——或者说词语——来指代外部环境里的事物。

在距今7.5万年前，远古人类还在非洲游荡，一场气候灾难使得人类陷入了瓶颈，人口数量剧减。正是在这场危机中，具有符号象征能力的少数人出现了，他们熬过了天灾，终于走向整个世界。与符号象征能力同时出现的，是象征性装饰物。

图片来自维基百科。

在南非的布隆伯斯洞窟中发现的7.5万年前用蜗牛壳制作的项链，另外有两片红色的赭石，被雕刻成叶片的形状。在当地还发现了用红色赭石画有图案的一块小石头。这些古人无疑具有与符号象征的能力，因为这些东西都没有一点功能，只具有某些想象的作用。

第一个吱吱呀呀地比比划划的人出现后，他能与谁进行交流呢？也许他会首先与族群中一起狩猎的其他人交流，这些亲属有类似的基因。沟通带来的极大优势，这种基因突变因此扩散到人群中，这个大家族最终将成为第一批会说话的人群。

象征性符号和词语为智人提供了新的认知能力，它们能够赋予事物唯一标识，提升了信息效率，使得用声音沟通成为可能。进而，人们能够构造一个大脑内部的抽象世界。

与这些能说话的古人类相比，早就走出了非洲的尼安德特人没有语言能力。他们对象征符号的理解能力并不比直立人强到哪里去，尽管他们已经能够生火、用石头制造精细的工具。

按照伊恩·塔特索尔的说法，尼安德特人的行为是由情感和直觉来主导的，是一种无意识的过程。尼安德特人的生活很务实。他们无法将记忆碎片拼装起来，进行场景想象。他们既不期待也不担忧，他们永远活在当下。这种状态也在我们的日常生活中出现，我们常常下意识地采取行动，然后大脑为行为编织理由。

尼安德特人不会讲故事，也不会自问，我们为何在此，为什么有死亡？基于其脑容量，尼安德特人也许已经启动了通向符号认知的演化，但是在这条演化路径上，智人走得最远。

妄想

妄想是指某人看见别人看不见的东西，相信不存在的事物的现象。

正是这种能力给了我们强大力量。

妄想的重复激发，不断的仪式化，引入象征意义，编成故事，传递给其他人，这就是文化的起源。那些具有想象力而又坚信之的人，那些被称为妄人的人，那些祭祀、萨满、巫婆与传教者，是最初的演化催化剂。

按照演化公式来看，妄想提供了 “变化”，而变化是否成立，则需要在时间中检验。

当这些想象上升到集体层面之后，恍如魔法一般，又一轮更大的演化发生了。基于共同的神话传说来构建族群，用象征性符号来表示身份后，两个人无需相互认识，就能将对方认作自己的兄弟姐妹。这样一来，部落的规模就能实现飞跃。

我们的大脑中有整整一半来负责幻想，这就是右脑，它负责想象、创造和艺术。

无意识

有意识的自我只不过是大脑活动中极小部分。意识之外的大脑随时都在运转，只是它太过顺滑，只有它停工的时候，我们才察觉缺了什么。

比如，就算闭上眼睛，你也能知道自己的四肢在哪里：左胳膊是向上还是向下？腿是伸直的还是弯曲的？背是挺直的还是弓着的？这种知道自己体态的能力，叫作本体感觉，这是无意识的一部分。当病人因为病症失去了本体感觉后，需要有意识来操控身体，此时每一步都格外艰难。

通过生长出新的突触并巩固之，将后天程序刻录进大脑的神经元结构中，从有意识转变为无意识，是大脑的高明之处。

人们用的是前额叶的认知软件来学习，熟练后则把获得的技能刻录到神经元结构当中，变成了硬链接，沉到意识层面之下。有人把这叫肌肉记忆，实际上，技能并不在肌肉里，而在头脑里。

技能变成硬连线后，其运作就基本上无需意识参与了。因为，只要其运行中没有“意外”发生，就不用激活意识。在某些情况下，技能的物理连线很深，甚至埋到了脊髓里面。实验中，猫被拿掉了大部分大脑还可以行走，被砍头的鳝鱼还可以游动。

一旦刻入脑中，这些技能就可以不假思索地运行，无须意识的介入，从而释放了资源，让“有意识的自我”投入到其他任务当中。

那些不带保护措施的极限攀岩者的动作快又精确。尽管攀岩充满凶险，可他们的大脑却很平静，这就是无意识在运作时的状态。此时，不能有意识的介入，因为这些动作干系重大，以至于不能被意识所干扰。为了活下去，攀岩者把控制权完全交给了无意识，充分利用大脑中的硬连线，进入了心流状态。

心流中，前额叶皮质的一部分不活跃了。这些皮质是用于抽象思维、规划未来、自我意识的。将这些高能耗且速度迟缓的操作挂起，这是因为极限攀岩这样的惊险活动，容不得任何分心。

无意识大脑是硬链接，能够高速运转，而有意识大脑，是软件运行，既慢且能耗高。

在短跑比赛时，如果你不停地对自己说 “听了发令枪响后千万要快一点起步”，你就肯定起步不够快。只有摒弃杂念，心如平湖，什么都不想，你才能快起来。

有意识的介入，会大大拖慢系统的速度。

念头的出现也是一样。我们会认为 “自己” 是所有想法的源泉，所有功劳都是我们有意识完成的。实际上，是无意识的大脑在为这些想法操劳，它在后台不停地查询记忆，尝试新组合，评估结果。在我察觉并宣布“我刚刚有了一个新点子”之前，它已经辛苦了几个小时，甚至好几个月。

意识只是神经活动的冰山一角，无意识操纵着大部分底层活动。

比如，你坐在一把硬椅子上，你在谈判中就会更强硬。如果坐在软椅子上，你则更愿意妥协。如果你握着一杯热饮，就会把自己跟家人的关系描述得更为温暖。如果你握着一杯冷饮，则会把这段关系形容得更为冷漠。

此类事实表明，在大多数时候，意识并不参与，无意识做出决策，此时是大脑的自动模式。

只有出现意外之后，意识才会介入。意外，指的是预期与现实的差别，以及大脑中不同部分的预期差别。

想象自己顺着一条熟悉的街道行走，心里想着自己的事。突然之间，什么东西抓住了你的视线：前面的一个人穿着一套西服，提着公文包，却脚踩一双拖鞋。此时，意外出现了，意识就上线了。

或者，你发现自己正伸手去拿巧克力，但你知道吃了就会后悔。此时，你的大脑的不同部位对于同一件事产生了不同的预期，它们之间有了矛盾，你必须做个决定。这时候，意识出现了，它才能做出这个决策。

所以，意识是为了处理意外才出现的，如果我们需要在复杂多变的环境中随机应变，我们就离不开意识。

自我意识

前面在谈论意识时，我提到：

在清醒状态下，我们的大脑中似乎有一个话事人，它在随时感受着质感，并对之进行认知，做出决策。它是内部模型的使用者，我们称之为自我。没有意识的时候，自我不知道躲在何处，但是只要我们处于清醒状态下，自我就冒出来形影不离了。我们对于外界的感受，对于事物的反应，对于我们自己的关照，都是从自我出发的。自我给我们一种整体感，似乎每一个人都只有一个自我，它代表了我们的利益与诉求。但是，这其实是有很大疑问的，我们自己也常常发现，自我其实并不一致，它常常前后矛盾，顾此失彼，既要且要。但是，只要想一想，我们每一天说过的话中，有多少句以“我”开头，就知道自我的核心地位了。

这只是对 "自我" 现象的概要描述。其实，我们可以进一步从演化的角度出发，深入分析"自我"这个习以为常，不可或缺的指代物的确切来源。

许多科学家认为，一些哺乳动物、鸟类、章鱼等许多脊椎动物和非脊椎动物，都有感觉体验和相应的情绪起伏。它们具备内在感受，能体验活生生的经历，它们能够以其个体的主观视角观察外界。在这个过程中，它们能够体会到喜悦、抑郁、愤怒、紧张、恐惧等情绪。

从主观视角来感知外界，这意味着有一个与外界对应的内部世界，那就是动物自己的躯体。因为躯体属于自己，它发起了所有的感官体验，它能响应大脑指挥，这样，“自我” 就有了物理基础。这副躯体及其连带的感觉，就是它所依附的基础。

自我存在于意识之中。但是，并非所有动物都有意识。根据我们前面的讲述，意识只发生在大脑新皮质中。

新皮层只存在于哺乳动物的大脑中，人类脑组织的 90% 由新皮层构成。所有脊椎动物都具有一定程度的知觉。但是，自由其中很少一些物种才具备意识。据实验观察，这些具备意识的物种都是 社会性动物，这是一个有趣的发现。

为什么只有社会性的哺乳动物才具有意识？

因为，在群体中感知同类，是非常重要的知觉能力。

群体中的动物们需要通过基本的共情来模拟和感知彼此的情绪。然后，经由协作或者博弈来促进自身的利益，进而在竞争中占优。能够进行设身处地模拟出同类感受的这些动物，将自己放到对方的境遇中，感知了的对方感受。观察表明，一些社会性哺乳动物能够体验到所谓的同情心，会对同类所遭受的不公待遇表示愤慨。

大脑中的镜像神经元提供了共情的生理基础。科学家发现，典型的镜像神经元目前仅在灵长目和部分鲸目动物中被确认。但是，类似认知功能的趋同进化广泛存在于社会性脊椎动物中。

群体生活中，共情带来了极大的优势。

一只黑猩猩悲伤时，其他黑猩猩会上前安慰它。黑猩猩会分享食物，它们知道这样做可以获得回报。在争夺食物时，一只黑猩猩先假装不感兴趣，然后趁对方松懈时突然抢夺。低地位的黑猩猩会仔细观察高地位黑猩猩的情绪，察觉到它们是否处于“虚弱”状态。它们可能在这个时候，通过施压来提升自己的地位，甚至挑战其权威。

在熙熙攘攘的群体中，自我是区分 “我” 与 “他者” 的一个重要表征，也是进行共情的基本前提。因为，同情是将 “我” 带入到 “他者” 的位置，通过设身处地模拟来发生效用的。

极少数动物，比如黑猩猩、亚洲象可以通过镜子测试，发现镜中的形象是它们自己，这表明了它们已经具备某种程度的自我。但是，自从人类出现后，自我的意涵就更丰富了。

共情对人类尤其重要。知道其他人会如何看自己，如何看其他人，这很有用处。因此，人们可以塑造自己的形象，进而影响他人，大家才如此在意自己的形象。

我们最强烈的共情是对死亡的恐惧。

尽管黑猩猩有一定的自我认知，但它们对死亡一无所知。当一只黑猩猩幼崽死去后，它的母亲会带着孩子尸体，几天之后才将其丢弃。其他个体对这位失去幼崽的母猩猩也缺乏同情心。

但是人类不一样。人们祭奠逝者，人们在活着的时候就知道终有一死。

尼安德特人的墓葬是人类历史上最早出现的葬礼。6万年前伊拉克北部扎格罗斯山区发现的墓葬，一个成年男子被埋葬在洞口，根据其骨骼化石周围土壤中的花粉判断，他的身体当时被放在有医药价值的花上，他可能是一名巫师。

作为生存工具的人脑，其本质能力是预测，预测就是想象场景并植入自我。为了切实引入自身的利益，人们不仅在头脑中构筑某个场景，还将自我作为一个角色置入其中，然后进行推演和模拟，这就像在棋盘上放上一枚代表自己的棋子一样。人们不仅用自我指代肉身，还用它指代其他人，进行换位思考。因为，心同此心，理同此理。人们通过这个过程来预测自身利益的得失，预测他人的好恶，这是群体生活中的必备能力。

由此，“我” 成为肉身的一个占位符，它几乎出现在意识中每一处。

在进行植入自我的场景想象时，人们检索过去的记忆片段，将它们拼接新的场景，就像剪辑电影一样。因此，记忆对于意识的产生是不可或缺的。如果一个人只有七秒钟的记忆，那么，他将真的只活在当下，人们常指责这类人“没心没肺”。

自我意味着 “我” 与 “他者” 之间的边界。因此，具有自我的人们既能观察外部事物，也能体察自己的内部感受，并在二者之间建立联系，反思出现了。人们就像吃下了苹果的亚当一样，不再无忧无虑地生活在伊甸园里，而是 “觉醒” 了，有了从自我出发的判断，这就是 自由意志。这样，自我和意识就开始互相纠缠，再也无法分开。

想象你在一家黑暗的电影院里，全神贯注地观看一部精彩电影，你完全被吸引住了，甚至感觉不到时间的流逝。你被带入了跌宕起伏的情节中，时而忧虑，时而喜悦，但却完全不会对这些情绪进行思考或审视。此时的你是没有自我的，你不会跳出来思考自己与角色之间的主客关系，也不会环视周围的其他观众。

那些没有自我的动物是否就是这样生活的？

有了自我，周围的环境、伙伴、事件，它们都有了意义，因为它们具备了对我而言的价值。

看完电影后你走出影院的那一刻，室外的阳光打上额头，你感到刺眼和灼热，不自觉的伸手遮住眼帘。此时，散场的拥挤人群簇拥着你，你听到了肚子咕咕叫。于是，自我又回到了你身上。

自我出现了，意识随之发生，二者不可须臾分离。

同时，语言也离不开 “我” 这个词。

要产生语言，重要的一步是实现用符号——手势或简单发声——来标识事物。当这类符号积累到足够多的时候，意识的范围就会得到扩展，通过类比可以进行联想。随着这类活动的持续进行，经验增长，随之而来的是时间感和叙事能力的进步。

自我的当下体验反应了真实时间，而头脑中的籍由记忆碎片所建构的场景演绎，则使得自我可以在过去与未来间穿行，构建一条持续的时间线，串接过往体验与未来想象。这种体验与叙事、类比与感知在一起，并以语言作为表达媒介，将意识拔到了新高度。从而，人脑中出现了纯粹的基于语义的思维活动。

在这个过程中，“我” 作为肉身的占位符，无处不在。“我” 这个词也成为了词频最高的词汇。

每当人们进行语言表达时，需要有一个叙事的立足点，以该点为叙事视角。这个视角往往由 “我” 来承担，它要么是主语，要么是宾语。“我” 以精炼的方式——往往是语言中音节最少的词——来指代自身。

下面，我顺着这个思路，聊一聊现在的人工智能是否能够产生通常而言的自我意识。

人工智能有意识吗？

ChatGPT 出现以后，人工智能已经有了很大的进步。在象棋和围棋这样的博弈领域轻易打败了人类之后，出现了像 Deepseek 这样的能够进行高智商推理，解决一般人无法解决的逻辑难题，演绎 “内心” 活动的AI。

但是，机器依然没有一丝产生自我意识的迹象，因为智力和意识是截然不同的两样东西。

AI可以在棋类比赛中击败世界冠军，但它却不会感到一丁点兴奋或者骄傲，更是没有表现谦虚或者幽默。原因在于，意识的产生，身体与感官不可缺少。

刨开那些纯粹的内心活动，意识其余的大部分内容来自感官信号，以及身体赋予这些感官信号的重要的质感。质感包括颜色、音色、震动、触感、胃痛、发热、寒颤等等，甚至痛苦与喜悦，它们与感官密不可分。质感构成了自我意识的基本成分。没有它们，我们就没有真切的感受，失去了好恶，失去了冲动。意识不能脱离感官与肉身而单独存在。可以说，质感是产生意识所要跨越的最低门槛。

灵肉不二，身心合一。

意识的发生，并非是深度学习中的所谓 “训练” 过程，而是 具身认知 的过程。

意识是发生在感官与环境的互动中的。我们伸手触摸键盘打字，看着眼前的屏幕，边听着音乐，因此想到一些事情，产生一些念头，和家人说上几句话，这都需要身体的参与。身体具备质感，身体发起欲求，身体产生情绪，身体做出行动。如果没有身体，就无法生成主观经验，无法产生意识。

也许，只有当人工智能也被塞入了一副能够驱动的躯体，能将躯体各部位的感质信息及时传送至中央数据处理区，并且有了驱动其行为的内在动机之后，人工智能的质感也许会逐渐涌现，才会有朝一日浮现出意识。那之后，人工智能也许还能够用质感构造内部模型，展现出学习和推理能力。

此外，这架机器还必须处于动荡多变的群体环境中，它才会产生与同伴沟通的巨大需要，并以同类为镜，发展出边界感和同理心，从而涌现出自我。

总之：

💡

自我意识的产生需要有身体及其感受，以及围绕着身体所进行的利益攸关的想象与博弈。

自我意识一旦确立，就不会消散。因为，群体生活中，自我意识淡漠的个体会处于不利的竞争地位，那些由于具备自我意识而稍占上风的个体则会在一次次博弈中不断扩大优势。同类之间的军备竞赛使这个过程持续进行，不断地提高人们的自我意识。于是，整个人群都逐渐具备了强烈的不可磨灭的自我意识。

在意识、自我、语言之后，我们终于可以前去碰触人脑中的核心秘密——智能了。

意识