世界为什么是可以理解的?


世界的可理解性是一个艰深问题。作为一个业余研究者的好处是,我可以兼收并蓄,掠过复杂的中间推导,舍弃论证的完备性,使用简明的语言,直接表达思路和结论。
在这个章节,我不创造新的术语,不纠结于繁文缛节,不进行复杂的逻辑论述,而是直抒胸臆,直指本质。
首先,我们看一看那些学者们是如何看待这个问题的。
最不可理解的事情是,世界是可理解的。 —— 爱因斯坦
大科学家爱因斯坦在1936年的文章《物理学与实在》中提到:“我相信,世界的结构是理性的,即可以通过简单的数学规律来描述。” 他认为,可理解性源于理性与自然规律之间的 同构性 。我认为,爱因斯坦所说的同构性就是中国古代朴素的 天人合一 观念。我们在后面的阐述中可以看到,爱因斯坦对于同构性的直觉判断的确切中要害。
数学一种奇妙的礼物,我们既不理解它,也不配得上它。 —— 维格纳
另一位诺贝尔物理奖获得者 维格纳 在1960年发表的《数学在自然科学中不合理的有效性》中认为,数学作为一种人类发明的抽象工具,竟然能如此精确地描述物理世界,这是一个奇迹。自然规律可以用数学表达,这个现象缺乏合理的解释。因而,人们需要审视数学与现实的深层关系,而非盲目相信人造的数学规律及其推论。
我们对世界的认识是由我们的心智框架塑造的。 —— 康德
大哲学家 康德 在《纯粹理性批判》中也对这个问题进行了探讨。他认为,现象是我们感知到的世界。现象和本质是两码事情。现象与我们的认知能力密切相关。经验是现象的集合。通过经验的积累,我们使用大脑中天然存在的一些认知工具——比如空间、时间与因果性——来为世界建模,构建一个简化的、能理解的世界模样,这就是我在前面强调的 拟合 过程。进而,康德认为,事物的本质永远不可能被完全知悉。
康德认为因果性是心智中的天然结构,我不这么认为,后面在讨论逻辑存在性时会详述。
当代学者 理查德·道金斯 认为,宇宙的可理解性是 自然选择 的结果。人类的认知能力是在适应环境的过程中演化出来的。我们存活是因为我们能够认知和利用环境。那些不能认知环境的物种甚至在其萌芽时刻就会死于非命,遑论存续至今。
以上这些见解各有道理,他们分别阐述了问题的一个方面,如能整合到一个框架中,则距离完整答案就不远了。
首先我要澄清一下,什么叫做 “世界的可理解性”。
我是这样理解的:
因此,世界的可理解性可以转化为另一个问题:知识为什么有用?
相对而言,这个问题要明确得多。我们知道,知识由两样东西组成,如果它们都成立,那么知识就是有用的。
概念是知识的基本成分,逻辑规范了如何提炼概念,如何在概念间建立关系。如果这两样东西都是有效的,那么我们就可以认为,知识是有效的了。
概念何以有效?
感觉是分类,概念化是分类,学习是分类,决定是分类。 —— 布鲁纳
在讨论概念的产生时,逻辑实证主义哲学家 卡尔纳普 的名著 《世界的逻辑结构》提供了极好的思路。该书认为:
哲学命题是语言陈述,它运行在概念之上,非真非假,仅仅是关于某些概念的定义和澄清。
科学命题则是关于外部环境的事实陈述,其真假可以通过观察来检验。
实践活动——也就是经验——是我们了解外部世界,获得知识的唯一源泉。
可以看到,卡尔纳普也认为,概念与事实是两码事。
在前面讲述人脑结构和智能的章节中,我提出:
概念是人脑神经活动的产物,是由神经元树状结构的中上层节点来指代其下层的众多表征节点,它体现了这些下层表征的共性。所有的表征都最终指向数量有限的天生内置的表征,也就是质感。质感决定了表征,表征组合成对象,对象抽象为概念。
我们从神经元活动中得出的结论,与卡尔纳普的推导是一致的,但是我们的表述更简明。
关于概念的来源,哲学家 罗素 在《我们关于外间世界的知识》中也有类似的精彩阐述。
罗素指出,知识是我们的感觉材料与物质、空间、时间等等认知结构的关系。我们能够把概念还原为感觉材料在时空结构中的组合,又能从感觉材料把概念在时空中构造出来,这是同一认知过程的正反方向。一切外间世界的对象都是感觉材料的 逻辑虚构。罗素强调:
逻辑虚构是一把奥卡姆剃刀,可以把一切不属于感觉材料的东西统统剃掉。
也就是说,我们不能感知的事物,对于我们来说是不存在的。
想一想,暗能量、暗物质、不可见光和超声波,对于没有感知手段的古人而言,它们不存在。
罗素认为,构造一切其他对象的感觉材料是 “在认识上先于一切他物的东西”,是不经任何中介而被直接体验到的东西,是先天具备的。当我们首次有感知体验时,尚未有主客之分,自我与对象乃是其加工的结果。
其实大家心里明白,罗素说的感觉材料就是我们的惯用概念——质感。
现在,让我们回到卡尔纳普这里来。
通过感官对于质感的感受与加工获得经验。要用经验构造知识,我们需要对经验之间的关系进行安排。
卡尔纳普认为,经验之间关系可以很多,但是最终追溯到一个就足够了。这个唯一的基本关系是:
经验间相似性的记忆。
这个结论是卡尔纳普的天才闪光。
这个描述中包括两项经验,其中一个先于另一个,且与另一个相同或相似。要判断这两个体验是相似的,我们必须把发生在先的体验与当下的体验相比较,这里已然包含了记忆与先后。
比如,我现在抬眼看到上海的蓝天,发现它与三日之前我在洛阳看到的蓝天很像。那么,首先我对于三日前的洛阳的旅游经历有记忆。先有洛阳的蓝天,后有上海的蓝天,这两个体验有时间先后。然后,天空位于我们头顶上方的无限远处,我只有抬眼才能看到,这是其空间位置。另外,天空的蓝色是由其色调、饱和度、亮度、纯度等等几项眼睛能够感知的基本属性所组成,这几项属性就是质感。上海蓝天与洛阳蓝天都是它们的组合,如果任何一项都相差不远,我就会觉得这两个蓝天类似。
可以看到,任何经验都被布置在时空结构中,由质感组合而成。
下面为了简化起见,我将时空结构这套最基础的天生感知维度,也视作质感。
卡尔纳普认为,知觉世界就是这样构造起来的。但是,哲学概念与命题不是这样构造出来的,它们不能被还原成质感,因而不能被证实。
有了对质感的记忆与相似性判断,我们就可以构造对象了。
那些常常在时空中一起出现的,具有某些相似度的经验,大脑将它们打包在一起,成为 对象。
在人脑的神经元网络中,对象对应着一组常常同时被激活的神经元所组成的链路。这个链路是由分布在高级皮质到低级皮质的、互相联通的许多神经元组成的形如植物的根须结构。在根须结构中,越是位于扎入地下的细小根须的神经元,越是接近表征质感。根须末端的神经元则直接指向质感本身。越是靠近树根主干的神经元,越接近表征对象的整体。树根主干在中高级皮层中,根须则在丘脑、低级皮层甚至脊髓中。
有许多这样的对象存在于我们的记忆中之后,籍由质感的相似性判断,我们发现它们中的某些存在一些相同的质感,也就是共性。在人脑中的神经网络中,许多对象的共性,由指向树根主干的某个特定的神经元来指代,这可以极大提升人脑内部的信息处理效率。这个神经元或者说这个神经元的状态,就是 概念 。
相似性判断 是人脑中的最基础操作,它是通过SDR编码之间的运算达成的。我们可以将SDR编码视作为二维点阵。逻辑上,如果两个点阵进行异或运算得到值为零,则这两个点阵完全一样,如果得到的值接近零,则可以认为二者相似。人脑中的比较机制大概率不是这样实现的,它们通过插接在神经链路中间的专门神经元来完成对抗性比较,或许通过记忆回放的前后比较来达成。这类比较出现在事物表征的不同层级和不同区域的SDR操作中,这样,大脑就可以感知两个事物之间在不同层级和不同局部的种种表征相似性。
其实,相似性判断还可以用另外一个词语表示:模式匹配。
可以看到,概念忽略了我们体验到的对象的完整细节,而仅仅关注其共性,是一种信息裁剪。信息裁剪有两层递进的含义:
质感不能反映客观事物的全部属性。我们不能感知的事物属性,对于我们来说是不存在的。
对于记忆中的对象,概念提取了它们的共性,忽略了差异。
好了,下面进入核心环节。
为什么经过了信息裁剪,忽略了细节,仅仅抽取共性的概念是有用的呢?
我想原因有二:
人类的质感是在演化中发展出来的,具有环境适应性。我们的身体在大自然的无数属性中,选取了与存续相关的那些属性来感知,提供其质感。
这些被选取属性在状态空间中,以在某处聚集后向外扩展而逐渐削弱的分布方式而存在。因而,这些属性的聚集,可以作为事物的某个主要维度,提供有效性。
第一点表示,如同道金斯所言,自然选择赋予我们理性,很好理解,我们不再详述。 第二点表示,概念有效性的根本动因在于大自然本来这样,生物从而适应之。
我将 “属性在状态空间中,以在某处聚集后向外扩展而逐渐削弱的分布方式而存在” 这种事物属性的分布方式,称为 秩序。它表示,事物的属性改变是平滑发生的,量变引起质变。与秩序相反的,属性的随机分布、跳跃性改变、突然出现又突然消失,我则称之为 混乱。
这样还是太抽象,我们从视觉上感受一下混乱与秩序,请看如下两张图片:
在上图中,除了噪音,我们得不到什么信息。在下图中,我们看到了不同的颜色构成的梯度渐变,它们排列成区块,有间隔和边界,边界是流畅的曲线。暖色聚集在左边,冷色聚集在右边。我们进而可以说,该图左侧如同清晨天空中紫色云霄包裹着朝阳,该图右侧则如同大雨前天空上低垂的湿润雨云。这些质感进而赋予我们美感。
上图是混乱,下图是秩序。混乱中只有噪音,秩序中才有我们的质感。
正是由于秩序的存在,大脑可以仅仅选择那些聚集的属性进行表征,并用它们指代事物本身,从而开启了对象化与概念化的认知进程。由此,这个世界可以被概念表达。客观事物中那些凝聚在一起的属性被大脑注意到,成为对象。对象之间的共性再被提取,称为概念。
这一切的源头在于秩序。没有秩序,就没有对象和概念。
大家会说,这难道是一个问题?这不是很自然的吗?
这其实就是根本问题,它潜藏在大家眼皮子底下未被我们注意到。
让我们先看一段文字:
街道上挤满了无形的狂热分子,尖叫着从一具尸体跳到另一具尸体,空气中弥漫着烧焦的金属和腐烂的果肉气味……时间被切成碎片,像一块烂掉的蛋糕,散落在发光的尘埃中。没有人知道下一秒会发生什么,或者是否还有下一秒。眼睛在墙上爬行,墙壁在融化,像融化的蜡,流进下水道,发出嘶嘶声……一切都在震动,一切都在崩溃,规则被踩踏,秩序被嘲笑。 —— 威廉·巴勒斯 《裸体午餐》
你能从这段文字中得到什么信息,发现它描述的是什么时代和地区的人们吗?不能。因为这段文字描述整个就是一片混乱,毫无头绪,就像它自己说的:规则被踩踏,秩序被嘲笑。
下面摘取物理学家的有关混乱与秩序的另一段文字:
在最深的层次上,物理世界可能是完全无序的混沌。没有固定的规则,没有确定的因果链。量子力学的核心告诉我们,事件并非总是以可预测的方式发生。它们可能以概率的形式随机显现。在这样的世界中,时间、空间甚至物质本身都可能失去明确的定义,变成一种模糊的、波动的可能性集合。混乱不是例外,而是宇宙本质的基石。 —— 卡洛·罗韦利 《时间的秩序》
混乱不是例外,而是宇宙的本质。
完全混乱的物理世界中能够有对象、概念、类别吗?别开玩笑了。
物理规律揭示出了一个矛盾:为什么我们眼中的世界并非混乱无序,而是井井有条?这些可以提取属性的、聚合为对象的、被提取共性、进而分类的秩序究竟从何而来?
答案很简单:秩序从演化而来。
这里面又有两层意思。
首先,我们是一种生物,生活环境中最重要的就是其他各类生物:同类、猎物、食物、天敌、家畜、树木、作物、植被等等。让我们看一张大图——生命之树:
图中物种的分布是不是井井有条?物种之间按照其差异从大到小,以树状结构进行分类,从树根到树枝树叶依次为:域,如真核域、细菌域、古菌域。界,如动物界、植物界、真菌界。门,如脊索动物门、被子植物门。纲,如哺乳纲、鸟纲。目,如灵长目、食肉目。科,如猫科、犬科、人科。属,如豹属、人属。种,如狮子、老虎、智人。
38亿年前只有唯一的单细胞生命。之后,由于环境改变与细胞分裂,以及遗传物质的变异、选择与保留,演化过程启动了。生物之间的差异逐渐扩大,物种沿着树状结构不断分裂,分枝散叶,形成了如今的枝繁叶茂的生物种群。它们的继承结构,就是上面这棵生命之树。
由于遗传物质的变异是微小的、逐步的,所以生物个体之间、种群之间是以共性为主,差异逐渐扩大。这完全符合秩序的要求。树状结构本身就是秩序,甚至我们大脑中也演化出类似结构的神经链路。二者的结构匹配,这就是爱因斯坦所说的,理性与自然规律之间的 同构性 。或者说,自然选择促使人脑采取了和生物界一样的信息结构。
在这棵由遗传物质的继承性与差异性构成的大树中,识别对象、提取概念和进行分类,是水到渠成的事情。
那么,物种的树状结构是不是人脑概念化的本质了呢?还可以更进一步。
在大自然中,除了生物,还有更广泛存在的无机界。山川大河、浩瀚星辰、广袤时空、物理规律,它们都不是生物,但是也可以被聚集成对象,提取概念,进行分类。它们也具备秩序。它们的秩序从何而来?
答案还是很简单,秩序从演化而来。
此处的研究比较前沿,缺乏公认的理论,我简单谈谈我认可的 圈量子理论 观点。
我相信,宇宙有起点与终点。本宇宙不是唯一的,而是众多宇宙中的一个。我们存在于这个宇宙中也不是偶然的。因为,宇宙作为一个超乎想象的存在,同样有其演化规律。那些不符合演化规律的宇宙要么无后继者,要么存在短暂——虽然我们无从感知。只有那些符合演化规律的宇宙,才得以存在并持久,而且有后继者。在这一类成功的宇宙中,秩序是存在的,混乱被抑制在一定尺度之内。
最重要的是,这一类宇宙都有一个异乎寻常的低熵起点,这样它就有了无穷尽的能量可以被利用。这些能量,比如质量和空间势能,既可以为宇宙中各个层级的演化提供基础推动力,还可以导致质量在空间中的压缩,最终成为黑洞,而黑洞是宇宙繁衍的途径。
生物演化的数据结构是遗传物质DNA,宇宙演化的数据结构是 物理学常量。DNA的改变由随机变异达成,物理学常量的变化是通过 对称性破缺 来实现的,这也是一个随机过程。上一代宇宙的物理学常量——一套大约20多个参数的基础设定集——被稍作改变,传递给了下一代宇宙。子宇宙从母宇宙的黑洞中诞生。我们所在的宇宙中可以观测到众多黑洞。从这个现象可以看出,本宇宙是演化成功的子嗣众多的一个宇宙。
主要的物理学常量:
光速(c):299,792,458 m/s
普朗克常数(h):6.62607015 × 10⁻³⁴ J·s
约化普朗克常数(ħ):1.054571817 × 10⁻³⁴ J·s
引力常数(G):6.67430 × 10⁻¹¹ m³·kg⁻¹·s⁻²
玻尔兹曼常数(k):1.380649 × 10⁻²³ J·K⁻¹
阿伏伽德罗常数(Nₐ):6.02214076 × 10²³ mol⁻¹
电子电荷(e):1.602176634 × 10⁻¹⁹ C
真空介电常数(ε₀):8.8541878128 × 10⁻¹² F·m⁻¹
真空磁导率(μ₀):1.25663706212 × 10⁻⁶ N·A⁻²
电子质量(mₑ):9.1093837015 × 10⁻³¹ kg
质子质量(mₚ):1.67262192369 × 10⁻²⁷ kg
中子质量(mₙ):1.67492749804 × 10⁻²⁷ kg
精细结构常数(α):7.2973525693 × 10⁻³
里德伯常数(R∞):10,973,731.568160 m⁻¹
玻尔半径(a₀):5.29177210903 × 10⁻¹¹ m
这一组物理学常量的数值都非常精确,它们的任一数值的微小变化都将导致物理规律的巨变,甚至驱使宇宙分崩离析,不复存在。它们都恰到好处地处于目前的精确值上,这对于生活在其中的人类而言,简直是个奇迹。对于这种现象,我不认可 人择原理 的解释。我认为,母子宇宙的继承与变异过程,在我们无法想象的无穷时空中以恒河沙数的演化序列推进着的,所有的这些参数都在永恒的调校过程中,无数宇宙就像沸水里的气泡一样,此消彼长。因此,我们在本宇宙观察出这套可以演化出生命的物理参数组合,这并非偶然,而是演化的必然结果。因为,只有这样的有秩序的宇宙才能够存续到产生众多黑洞,从而演化至今。
有关理论构想可以参考 圈量子理论,其大意如下:
在广义相对论中,黑洞中心和宇宙大爆炸的起点存在奇点。圈量子理论通过量子效应避免了奇点,取代奇点的是高密度的量子态。圈量子宇宙学认为,大爆炸不是宇宙的起点,而是一个量子反弹事件。在极高密度下,引力表现出排斥性,导致宇宙从收缩阶段反弹到膨胀阶段,避免了经典理论中的奇点问题。
黑洞中心的奇点被量子效应取代,形成一个高密度区域,类似于宇宙初始状态。这种区域可能通过量子隧穿效应反弹,形成一个新的时空区域。一些物理学家(如 李.斯莫林 和 Nikodem Popławski)提出,黑洞内部的量子反弹导致一个新宇宙的诞生,是为子宇宙。子宇宙与母宇宙在因果上分离,但可能继承某些物理特性。
理论物理学家 李.斯莫林 专门写了一本书 《宇宙的生命》来阐述上述像生命演化一样的宇宙演化历程。这类理论构想远超我们的感知与能力范围,就不继续拓展了。
当人们能够以概念指代客观事物之后,词汇与语言也随之出现,知识以语言为载体。以语言为工具的有意识的思维过程构成了理性的运作方式。可以说,概念是通往知识的一次飞越。
但是,随概念而来的也有很多局限。
概念本质上是一个 简化,是一种 拟合,是大脑作为能力有限的生存工具,以有限应对无限,被迫采取的对环境的采样,是离散的 切片。为了形成易于理解的概念,人们会忽略事物的细节、特殊性与动态复杂性。
当我们使用概念时,往往只具备指代的含义,无法触及事物本身。概念的使用必须限定在一定的层级上,作用在固定的维度上,不可越界。比如,我们可以说:一个人加上另一个人是两个人,但是我们不能说:小王加上小李是两个小王或者两个小李。其次,概念化会忽略事物属性的平滑过渡,强行划出边界。比如,人们常常用好坏、对错、成败等等词语评价事物,忽略了事物属性的渐进改变与互相渗透,及其不同部分在时间线上的不同肌理。
概念与语言紧密相连,概念的局限也带来了语言的局限。如 萨丕尔-沃尔假说 所指明的那样,不同语言对世界的概念划分有所不同,这导致不同文化人群之间的偏见。
维特根斯坦 在其后期著作《哲学研究》中认为,实体、因果等等概念是文字游戏。这些词语的意义并非指向某个真实本质,而是随语境而变化。试图通过抽象概念和因果关系来捕捉世界本质的努力注定徒劳无功。
但是,概念也为知识的增长带来了极大好处,我们将在下一节讨论它。
小结一下,有关“世界的可理解性”这个问题,我对概念有效性的主要观点是:
世界可理解是因为人们能够使用知识进行预测。
知识是由概念与逻辑组成。知识有效性依赖于概念与逻辑的有效性。
属性在状态空间中,以在某处聚集后向外扩展而逐渐削弱的分布方式而存在。我称之为秩序。
秩序的存在使得事物在共性的基础上逐渐出现差异,其类别不断分叉,构成树状结构。
能够记忆有秩序之事物并判断其相似性的能力,是人脑识别对象、抽取概念、进行分类的基础。
人脑神经元网络结构与大自然秩序的同构,是世界可理解性的一个解释。
生物秩序来自物种的演化。
宇宙秩序来自宇宙的演化。这是一个由圈量子理论阐述的尚待验证的猜想。
如果我们只关注对象的固定属性,则可以将之以概念表达。
概念是对事物的必要的切片、采样、简化、限定以及拟合,它为知识的增长带来了巨大好处。
那么,为了继续探讨知识的有效性,让我们深入理性的底层,探索藏在其中的逻辑之有效性。
世界是否是逻辑的?
形式哲学虽能提供庇护,但终究是虚掷光阴。—— 罗素
实践是检验真理的唯一标准。 —— 《光明日报》
上一节我们探讨了概念的由来。
客观实在的事物本身,由于其聚合了无数的粒子,存在于时空之中,因此,它处于永恒的运动之中,其组分的庞大数量体现出局域性、随机性和涌现性。本质而言,客观事物的属性是众多的、变化的、甚至不可穷尽的。但是,由于概念是一个人造物,是能力有限的大脑对客观事物的切片、采样、简化和拟合,所以概念可以有,但是有其适用范围的限制。这简单表达为:
比如,我们可以说:1 + 1 = 2。这是因为我们只关心事物的数量。我们也可以说: 一个点 + 一个点 = 两个点。这是因为我们只关心事物的数量和形状。但是我们不能说:张三 + 李四 = 两个张三。这是因为,张三和李四的属性都是不固定的,在没有明确限定我们所关心哪些属性之前,无法这样陈述其关系。如果我们改一下:张三一位 + 李四一位 = 两位,这就行了,此时我们只关心他们作为人的数量。或者也可以说:张三的一根头发 + 李四的一根头发 = 两根头发,这也是正确的,因为头发的属性是基本固定的。
当我们在概念之间建立关系的时候,逻辑出现了。概念之间的关系使用逻辑来表达,逻辑的载体是语言。
此时我们应该分外小心,因为,逻辑仅仅作用于概念之间。
由于概念是客观事物的简化,所以,将正确的逻辑推广到客观事物上时,不一定成立。
很多数学上成立的理论,在实验中不符合实际情况,就是因为这个道理。
在逻辑中有一个核心概念:因果关系。
因果关系描述了属性的变化机制:一个属性的变化会导致另一个属性的变化。这种关系不是属性之间的概率关联,而是一种 “如果……,那么……” 的直接关联。例如:
吸烟容易得肺癌。
按下开关,灯就会亮。
这里,我们可以细心体察因果关系与 相关性 之间的微妙差异。如果两件事之间存在因果,通常它们会有相关性。但是,有相关性的两件事之间不一定存在因果。比如,有研究表明,女孩子的裙子长度与当时的经济繁荣度有相关性,女孩子的裙子越短,经济就越繁荣。但是,我们却不能说,因为女孩子的裙子短,所以经济繁荣。
可以看出,相关性是更普遍的存在,它表达事物之间从小到大的各种程度的关联。因果关系则是经过人脑分析提纯后得到的直接关联,它往往代表着事物之间 “一定会” 这样的纯粹联系。
基于 宇宙是不可知的 朴素世界观,我不禁怀疑:客观世界中是不是真存在因果?
其实,学者们对于这个问题早有思考。哲学家康德认为,因果关系是人脑中的先天认知模式。在现代科学中,因果关系更多被视为一种描述现象之间关联的框架,是一种假设。哲学家休谟指出,因果性更多是人们对事件先后关联的习惯性预期,并非必然的铁律。图灵奖获得者 珀尔 将也因果视作一种解释性框架,是人造的预测工具。
在复杂系统比如社会群体或者生态环境中,事物表现出反馈、迭代、震荡和涌现现象,因果关系难以精确定义。量子力学中的概率性关联直接挑战了经典因果观。不同文化对因果关系的理解更是不同。比如,中医认为身体整体的阴阳失调是病症来源,西医则认为具体器官与组织的病变导致疾病。
对于这个问题,我的明确观点是:
也就是说,因果关系只在你我的头脑中才有,不是大自然的本来属性。大自然中只存在概率相关性。但是,人脑作为能力有限的生存工具,必须对大自然中无穷复杂的现象进行简化处理。如同将事物简化为对象、概念、类别一样,人脑将事物之间直接的高概率相关性简化表达为因果关系。
比如,我们用手推动在桌面边缘的玻璃杯,然后杯子摔倒地面碎了。此时,我们可以说:杯子摔碎了,是因为我碰到了它。但是,真正原因是地球的引力以及杯子与地面之间的碰撞冲量。而且,如果这个玻璃杯是钢化玻璃做的,它就不会破碎。所以,我们所说的因果关系往往是对真实的概率相关性链条中的几个相邻节点之间关系的方便表达,它和自然规律本身存在着误差。
数学中的因果关系是存在的。比如,因为 A > B,B > C,所以 A > C。这是因为,数学是由纯粹概念构成的学科,数学概念的属性是有限的固定的,概念之间的因果关系不容置疑。但是,就像概念不能简单地应用到真实世界的情况一样,数学中的因果关系也不能简单地复制到真实世界。天体物理学中,很多数学计算的理论值在实验观察中存在精度误差,就是因为这个原因。数学中的因果关系,和其他人们所谈论的因果关系一样,只有不断地考虑到更多的因素及其变化,不断地调教其逻辑与参数,才能逐渐地 拟合 真实现象。这是一个渐进的,可以接近但是无法到达的过程。
本质上,这还是一个演化的过程。
知识是有限的假设,科学理论是渐进的解释,而非终极真理。—— 罗素
回到人脑中来。
在思索大脑的内在机制时,卡尔纳普的观点启发了我。结合前述的有关稀疏编码的内容,我认为,人脑中的最基本运算就是 相似性判断。前面我们提到,神经信号以稀疏编码SDR的形式在神经元网络中传递。SDR序列则记录了事物在时间上的改变。SDR的本质是二维点阵,用数学语言来讲就是 向量。SDR之间的相似性比较,是简单的异或操作,非常便捷。
经由相似性判断,人脑可以很快地觉察到事物之间的相似性,并能觉知其相似程度。
真实事物的感知信号进入人脑后,其信号分布在感知它的所有感受野上,这些感受野都有其对应的新皮质微柱来处理。而且,微柱内部的分层,微柱之间存在并联串联的关系,构成更多的层级。所以,一个真实事物的感知信号,就这样被拆解为很多个细微部分,每个部分都是SDR序列,它们的总和构成了有关事物的 冗余 信息。它们被各自微柱在本地处理,然后再溯层级而上,不断被加工整合,逐渐融为对象整体,再提炼为概念和类别。在这个过程中,每个局部层级上的SDR都可以被用于和记忆中的SDR进行比较。如果此中发现了相似性,人脑就会认为,它们之间是有共性的,这被称为 模式匹配。
比如,人们认为蛇、蝙蝠和猴子之间,尽管样态差异巨大但是仍然有共性:它们都会出生,成长、死亡。
如果将这种相似性判断作用在稀疏编码,也就是SDR序列上,当前的SDR节点与记忆中的SDR节点类似,则大脑会认为,下一个将要出现的SDR节点也会与记忆中下一个SDR节点类似。这样,概率相关性 就构建起来的,这就是预测。和模式匹配一样,SDR序列的相似性判断,同样体现在局部与层级上,与模式匹配共存。
而且,人脑还能进一步根据预测与事实的相符程度来调整预测概率,这就是 贝叶斯定理。近年以来,越来越多的实验证据直接证实人脑的贝叶斯理论框架。
贝叶斯定理
过去发生 A 事件的概率是 X。现在情况有了一点变化,发生 A 事件的概率是:Y。X 在这里可以称为先验概率,或者说期望值,也就是预先假定的初始概率值。对于任何你想要考察的事件,你都可以选择一个先验概率作为起点,然后根据后续经验不断调整这个概率值,直到它和你的经验相吻合,最后,你就可以基本确定了 A 事件的发生概率了。
举个例子:在一个封闭盒子里有红绿两种球。刚开始你不知道二者的比例,你可以拍脑袋说,二者各一半。然后,你开始从盒子里摸球。头两个球都是红色的,你的信心有些动摇了,还好第三个球是绿色的。此时你可能会调整自己的假设,认为盒子里每三个球中有两个红球一个绿球。然后,你继续摸出了一个红色两个绿色球。这时,你会将这三个球与前面三个球一起考虑,一共六个,各占一半。此时,你又回到最早的期望值上来。直到最终,你摸出了大约 100 个球,红 51 个,绿 49 个,你可以基本确定盒子里二者各一半了。
对于任何关心的事件,大脑都试图先给出一个期望值,该值来源于经验。如果经验中没有,大脑干脆就拍脑袋假设一个值。然后根据感官输入,不断调整这个值,直到最后证实。该结果又会作为新的经验更新到大脑中。
随着新的事实而不断调整预期概率的方式,就是贝叶斯定理,其本质是通过经验预测未来。
记忆的相似性判断才是人脑最底层的机制。经由发生在空间、时间上的相似性判断,人脑假设了对象、概念、类别、语言、逻辑这些东西,它们构成了知识。
现在,我们可以大致回答前面的问题:世界是否是逻辑的?
在以有限应对无限的困境中,逻辑因果是人脑构建内部模型的一套假设。
逻辑的本质是相似性判断,或者说模式匹配。
逻辑有效性的源自演化规律在客观世界中建构的秩序。
经由大量局部与层级的整合,人脑以对象、概念、类别、逻辑因果来简化客观世界,构建知识。
知识并非终极真理,它在实践中逐渐拟合客观现象,它体现了有限的效用。
生活中,我们使用了不同词汇来表示相似性判断,诸如类比、比喻、隐喻、模式匹配等等。
深度学习之父,图灵奖与诺奖得主 杰弗里·辛顿 最近也指出,人脑只是浅层推理,本质上是类比机器。
综上,人脑其实就只有一样真本领:记忆的相似性判断。经由发生在众多局部与层级上的相似性判断,人脑得以比较事物在各方面的信息的相似性,实现模式匹配,也就是辛顿所言的类比。事物信息经由感觉器官输入,传递到大脑中后,经由中脑丘脑、初级皮质、高级皮质等等一系列处理之后,最后达到大脑前额叶,只有在这里,事物的信息才被整合为对象、概念和类别,包装上薄薄的一层逻辑外衣。
其实,与计算机相比,人脑的逻辑能力很有限。人脑无法进行深度递归,无法缓存大量中间信息,这是因为人脑非常有限的工作内存,只能短暂记住 7-9 个数字,运算速度缓慢。人脑远远算不上一个强大的逻辑推理机。
相反,模式匹配才是人脑的大杀器。就像我们日常使用了众多成语一样,我们通过模式匹配所能快速处理的事情,比如联想、比喻、图像识别、察言观色、举一反三、符号象征等等,这都是计算机无法匹敌的。例如,科学家沃森就是从睡梦中的缠绕之蛇这个隐喻获得了灵感,发现了DNA的双螺旋结构。
为了节约篇幅,我还要补充以下简要观点:
逻辑是从无限中裁剪出有限部分的人造物,具有不可避免的不完备性。
模式匹配和逻辑的关系,如同演化公式的 变化与选择 两个关键项一样。
模式匹配产生大量的可能性,提供演化公式中的“变化”,它具有逻辑不可比拟的创造性。
逻辑用来消除模式匹配的过剩,裁剪其多余分支,提供演化公式中的“选择”。
模式匹配是主人,逻辑是管家,二者在意识中互动,表述为语言。
由于对象、概念、类别是人脑对客观世界的切片、采样和拟合,逻辑因果是人脑对于概率相关性的简化表征。这些东西都是人造物,存在不可避免的固有缺陷。那么,它们是否没什么用了?我们不用它们,回到以类比思维为主的时代,那不是挺好的吗?古人的诗词歌赋都以类比为主,也一样美好经典。为什么还是要用死板的逻辑呢?
这种想法很自然舒适。只是,我们还需要认识到逻辑的价值。
逻辑推理的意义
大语言模型,简称LLM,是近年来炙手可热的人工智能工具。
苹果公司最近的一篇 论文 表示,像 GPT4 这样强大的LLM虽然表面上看起来像是在推理,其本质还是基于大数据的模式识别和概率相关性判断,与逻辑推理毫不沾边。一个明显的证据是,如果输入LLM的数据中塞入明显不相干的误导信息,LLM也会随之出现问题,它不会使用简单的逻辑推理过滤掉这些明显不相干的信息。
华尔街日报文章《我们终于知道AI如何“思考”了——基本没啥思考》对这个问题讲得很好,大意如下:
越来越多的研究者发现,也许人工智能压根就不会像人类这样思考,其底层架构上存在根本限制。LLM 通过学习大量数据来实现的。人类则能以多种方式对事物进行感知,然后建立“世界模型”来理解事物如何运作,这其中就包括逻辑因果关系。
通过对像ChatGPT的研究,人们发现这些模型接近通用人工智能的观点站不住脚。研究表明,LLM会建立巨大的 “启发式规则集”,而不是构建内部世界模型。“启发式”是LLM解决问题的捷径。
研究者将一个人工智能接受谷歌地图的曼哈顿地图导航训练,然后分析训练后人工智能的内部数据。他们发现,这些数据看起来一点也不像曼哈顿的街道地图,更像一团乱麻,包含各种脱离现实的虚拟路线,比如直接越过中央公园或斜穿许多街区的路线。但是,此模型居然能成功给出了曼哈顿任意两点之间的可用路线,准确率高达99%。
这张乱七八糟的地图会让人类驾车者抓狂,但人工智能已经学会了从每个可能的起点出发进行导航的规则集。人工智能的庞大算力和存储,使它们能够以杂乱无章的暴力方式来解决问题,这是人类不能做到的。
比如,一些研究发现了LLM进行数学运算时所表现出的特殊性。这些模型从前不擅长数学运算,但如今表现得越来越好。研究表明,模型在做某个数值范围内的乘法,比如200到210之间数字的乘法时,会用一套单独的规则,在做其他数值范围内的乘法时,则会用另一套规则。人类通常会认为这种方式不太理想,确实。
在其简单外壳下,如今的LLM像是复杂拼凑的鲁布·戈德堡机械,充满了回答我们提问的临时方案。如果理解了这些系统是一长串拼凑在一起的经验法则,就能很好地解释,为什么当它们被要求做未经训练的事情,哪怕只是超出训练范围一丁点儿的事情,也会非常困难。
前述导航例子中,当研究者阻断了仅仅 1% 的虚拟道路,迫使人工智能绕道,它的表现就会直线下降。
这说明了人工智能与人脑的重大差异。人脑无法准确地记住纽约地图,但是可以记住大方向和地标,它们构成了头脑中的内部地图。如果某路段堵塞了,人们通过在此内部模型上的逻辑推理达成灵活变通。
该研究也揭示了为什么现今的LLM会如此庞大:它们必须记住无穷无尽的经验法则,而无法像人脑一样,把知识浓缩为模型。
该研究也说明了,为什么人工智能必须从海量数据中学习,而人类只需要经过几次有限尝试就能掌握知识。训练人工智能必须让它们尽可能地穷尽单词、图像、规则等所有可能的组合,并让它们反复看这些组合,获得权重。而且,为什么不同公司推出的LLM似乎都大体相似,性能趋同且趋于停滞?因为可用的数据集已经接近极限。
原来:
生物是节省的,物理规律符合最小作用量原理。与人脑本身一样,逻辑推理也是生存工具,够用就好。在绝大多数情况下,我们只关心事物无穷属性中的很小部分。此时,逻辑推理与内部模型,也就是知识,都是极其有效的。
逻辑推理尽管只是人类智能的一层薄薄外皮,却仍然是我们的强项,人工智能暂时还赶不上。
好了,行文至此,我们终于可以答复最初的问题:世界为什么是可以理解的?
演化给大自然带来了秩序,大自然演化的结晶——人脑因此获得了与秩序的同构性。
作为能力有限的生存工具,人脑对于大自然进行了采样、切片和简化,使用对象、概念和类别来表征事物现象,通过模式匹配来探索未知,使用虚构的因果关系来简化事物之间的概率相关性,从而构建了大脑中的内部模型来 拟合 外部世界,裁剪无限为有限,为我们提供了基本预测能力。因此,世界在一定限度内是可以被理解的。
但是,世界可理解性之根本在于:上述过程也是一个演化过程。只有不断地在实践中检验和改进,人脑的拟合才会逐渐接近事物的真实现象。
也许有一天,人工智能可以将真正的逻辑推理嵌入其中。即使如此,由于 质感 与 具身认知 的存在,人脑中的意识还是无法被复制,它仍然是我们独有的伟大天赋。
Subscribe to my newsletter
Read articles from David Qi directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by

David Qi
David Qi
程序员与思考者,期待以朴素简单的方式认识这个世界。