Chapter Content
哎,大家好。这一期咱们聊聊数学,嗯,一个挺有意思的话题。话说回来,其实数学在咱们人类的历史上,一直都跟科学技术分不开。你看,很早的时候,人们就用算术来搞农业计划、做贸易、算税啥的。几何呢,就用来设计建筑物,安排材料。古时候的日历也用数学来记录时间,了解天体的运行规律。统计方法啊,经济理论啊,也都是建立在数学原理上的。爱因斯坦的相对论,还有量子力学,它们的根基也是数学。早期的计算机,也利用了数学的计算理论。
现在吧,数学常常被认为是所有科学里头最纯粹的一门。人们普遍觉得,有了数学,科学才能变得严谨。理论越精确、越数学化,推理就越严密、越谨慎。更重要的是,大家普遍认为数学是自然的语言,因为大多数自然系统都展现出很多数学本身的对称性和结构。
但实际上呢,数学的应用,往往是在非自然的情况下才比较成功。比方说,扑克牌游戏。数学可以帮助人们在扑克牌游戏中做出更好的决策,利用概率和数学策略来提高胜率。但是,扑克牌游戏 hardly 是一个真实世界的场景啊。它有一套非常明确的规则,一旦脱离这些规则,你就没法好好玩牌了,对不对?扑克牌是一种游戏,而不是生活本身。
要是觉得这个例子有点牵强,咱们再看看路线优化。路线优化就是要在一大堆可能的路线里找到最佳路线,这个数学可以帮上忙。路线优化算是一个很困难的问题,而且似乎比扑克牌游戏更贴近现实,毕竟人类一直都需要找到方向嘛。在寻找最佳路线的问题里,可能性空间非常大,而且没有直接找到解决方案的路径。然而,路线寻找仍然是一件 contrived 的事情。自然界里根本没有路线啊!森林里有树叶、树冠、灌木和树木、树枝,各种各样的有机物,但就是没有路线。路线是人类创造出来的东西,像是小路、路径和道路。路线是咱们现代世界低维运作的副产品。
虽然扑克牌游戏和路线优化都有现实世界的对应情况,像是砍价买车,或者是找最快的上班路线,但它们仍然是在相对人为的环境下运作。买车是在一套结构化的规则和社会习俗下进行的。这种情况下, wiggle room 并不大,而是会出现一些微小的优势,然后被人们利用。这跟在森林里遇到熊完全不一样。遇到熊可没有任何规则,只有对模式的本能识别和快速的情绪性决策。但这并不代表不存在谈判。你必须考虑到熊的位置、它的意图,以及它可能造成的威胁。你必须评估威胁等级、行为和潜在的危险。我们不会把这些事情当成是谈判,只是因为它们发生得太快了。我们看不到信息是以精确和数学的方式被利用的,但请放心,它绝对是被利用了。
数学优化可以找到最快的上班路线,但这只是因为我们是在一个网格状的环境里开车,而且有明确的规则。数学之所以能应用到我们现代生活的很多方面,是因为我们很多情况下都是在玩游戏。当某件事情是一场游戏的时候,它的各个部分都是清晰可见、可以解释的。正是这种简单性让数学可以依附到系统的各个部分。
但是,当我们从游戏的领域走向更自然的环境时,我们就失去了那种“可依附性”。原本清晰、透明、可控的东西,在复杂性的 turbulence 里变得模糊不清。在复杂性的作用下,数学失去了对它希望描述的系统的控制。这通常被归结为近似,但是,就像我之前说的,复杂性不是确定性系统的超级强化版,它完全是另一种东西。再多的数学也无法帮助你与熊谈判,或者是在茂密、未开发的森林里找到出路。
这时候,可能会有人反驳说,应用数学是有价值的,因为我们的大部分生活都是由现代的、类似游戏的结构所组成的。我们大多数人并不会在上班路上遇到熊,或者是在森林里艰难跋涉。但是,复杂性时代挑战了这种框架。虽然我们的社会确实越来越基于类似游戏的规则,这些规则很适合数学的运作机制,但是,当复杂性成为我们的运作方式时,情况就会发生巨大的变化。
我们不仅不再追求制造简单的机器,而且我们对自然的推理现在必须考虑到复杂性是如何运作的。复杂性不是科学中某个小众领域,它是所有的一切。我们对自然的理论、我们对知识和技能的定义,以及我们对更柔和、启发式思维的应用,才是现在最重要的东西。这使得使用数学来描述自然变得越来越有问题,因为我们开始意识到,复杂性是无法被忽视的。
但是,并不是所有的数学都是超精确和确定性的。概率学就超越了精确的预测和推导,而是试图考虑到现实世界中的不确定性和随机性。有了概率,我们就有了一个量化和推理不可预测情况的框架。
但是,概率学仍然存在依附性的问题。在任何概率评估中,都存在“某物除以某物”的概念,也就是两个东西进行比较。如果我们要计算从一副牌中抽到一张 A 的概率,我们首先要确定所有可能结果的总数(分母),然后确定有利结果的数量(分子),最后用有利结果的数量除以所有可能结果的数量。因此,从一副标准的 52 张牌中抽到一张 A(总共有 4 张 A)的概率是 4/52(0.077)。我们之所以能够计算出抽到 A 的概率,只是因为我们可以将我们的概率框架依附到特定、类似游戏的情境中。
当然,概率学里还有比计算基本比率更高级的方法,但是,它们仍然会进行这种比较。使用概率意味着仍然存在一种隐含的对比,也就是某个事件发生的可能性和它不发生的可能性之间的对比。
一副牌是一回事,但是现在想想,在自然环境下进行比较是多么不现实。分子必须是某个事件发生的次数,而分母是可以发生的事件的总数。这种比较怎么可能被计算出来呢?或许可以对分子做出一个合理的猜测,但是分母呢?想都别想!根本不可能知道可以发生的事件的总数,因为在自然环境下,事件的数量几乎是无限的。
如果觉得这些关于比率的讨论太过于简单,无法描述概率的本质,那我们可以转向分布。当我们在图表上看到一个概率分布时,我们是在可视化一个数学函数的值,这个函数代表一个随机变量(一个未知或变化的量,其值基于随机现象的结果)的每个可能结果的可能性。换句话说,就是自然事物产生的结果。
保险公司会使用概率分布来评估风险和计算保费,在金融建模中使用概率分布来管理风险,在质量控制中使用概率分布来监测和提高产品标准,在医学研究、流行病学和临床试验中使用概率分布来分析与健康相关的数据,使用概率分布来预测天气状况和供应链需求,优化库存,以及在人工智能中使用统计方法和机器学习算法。
如果概率在反映自然情况方面的能力如此有限,那么为什么它被如此广泛地使用呢?原因还是在于,前面列出的所有东西都是在咱们创造的世界里结构化的规则和社会习俗下运作的。
概率起源于赌博,这很合理。从逻辑上讲,事物的起源并不能使其无效,但是,它确实向我们展示了概率最初是如何被设想的,也就是作为一种在机会游戏中做出决策的工具。概率很可能永远不会在自然环境中被发现。这并不意味着机会在现实世界中不起作用,只是说自然版本的机会并不按照人类制造的框架的简单规则运行。
只有游戏才能被约束到可以计算出一个数字,这个数字告诉我们某件事情发生的可能性。这意味着数学,包括它的概率版本,与自然的本质以及它的运作方式是高度脱节的。如果我们在受限的环境中运作,那么数学就是做出决策和描述内部过程的绝佳工具。但是,一旦进入到现实世界的复杂性领域,数学就会失去对事物运作方式的控制。这并不会威胁到纯数学的领域,因为纯数学只关心抽象概念和理论上的后果。但是,当涉及到数学的应用时,包括它在基础物理理论中的使用,它就暗示着它的有效性存在着深刻的局限性。
当我们制造的东西很简单的时候,应用数学与我们的挑战高度相关,它提供了一种严谨的方式来推理我们系统的设计。但是,当我们进入到一个创造真正复杂事物的时代时,默认的假设,也就是我们在数学中会找到严谨性,就非常值得怀疑了。
很多人都明白数学与现实之间的脱节。大多数学生都抱怨数学对他们的生活没有用处。这种抱怨通常会被忽略,人们会用通常的借口,也就是数学即使不能直接应用,也能让我们更好地思考。这种说法在启蒙运动和工业革命时期或许是成立的,但是,当我们制造的东西是真正复杂的时候,这种说法就不成立了。事实上,如果我们实话实说,数学很容易鼓励我们以错误的方式思考,就像之前讨论的比率例子所展示的那样。
不仅仅是学生注意到了数学缺乏现实世界的效用。如果我们看看那些在股市中使用数学的人,我们会发现那些有资源来榨取资产价格之间的差异,或者某种形式的信息不对称的人,才会有优势。但是,这些优势是很微妙的,而且只对那些已经考虑过更基本的事情的人才有用。如果数学真的那么厉害,那在股市上发大财的人就会多得多。体育博彩也是如此。对于那些希望获得可重复利润的人来说,可能会有一些微小的优势,但是,这些优势并不足以让大多数人受益。而且,所有这些都忽略了幸存者偏差。
数学和概率映射到现实世界的潜在假设,来自于一个它们确实做到了这一点的时代。但是,我们现在要进入的不是那个时代。勉强从市场或体育博彩中挤出一点利润是一回事,但是,创造真正复杂的事物又另当别论。
我们现代世界使类似游戏的计算变得有用的论点,正开始站不住脚。STEM 相关的知识需要进行重大改革,才能在面对复杂性时保持相关性。当我们不断提高我们所建造的东西的物理抽象水平时,我们就会离内部知识越来越远,转而走向可以通过反复试验、启发式方法和模式识别来处理的事情。
这与其说是一个反对数学的论点,不如说是一个反对当前数学应用方式的论点。数学更多的是关于抽象,而不是计算,而抽象是复杂性的关键所在。不仅仅是在信息层面,而且是在物理层面。但是,数学在很大程度上是以因果关系的意义来运用的,就好像它在谈论我们所创造的系统的内部运作方式一样。这种方法在复杂性时代将被证明是完全站不住脚的。
我们经常被告知,人工智能是数学使之成为可能的。毕竟,深度学习使用了来自线性代数的各种方法,比如矩阵运算、向量空间、特征值和特征向量等等。深度学习使用了微积分,包括梯度和导数,以及积分和优化。概率论中有分布、期望和方差,还有贝叶斯统计、马尔可夫链、图论、组合数学等等。人们可能会被原谅,因为他们将人工智能归结为数学在计算机中的实现。这一切似乎都是应用数学的一个伟大的成功案例。
从某种意义上来说,这是没错的,但是,这具有高度的误导性。数学被用来构建人工智能系统的脚手架,但它绝对不是使人工智能工作的根本原因。人工智能之所以能工作,是因为一些并没有被设计到系统中的涌现属性。数学就像蚁群中的蚂蚁。单独来看,蚂蚁具有重要的特征,但是,特定的蚂蚁并不能解决难题,而是一个蚁群才能解决难题。正是无数“蚂蚁”的释放,才能让人工智能的实质显现出来,并计算出所需的输出。数学是我们构建高级流程各个部分的方式,我们需要 enact: 反复试验 paired with 启发式方法。在那之后,系统会以我们无法理解的确定性、因果关系的方式收敛。
为了能够布置好可以确保在软件中进行反复试验的脚手架,人工智能工程师需要一种方法来计算距离、比率和混合等东西。每当人工智能试图缩小模型的最佳猜测与实际数量或标签之间的差距时,它都会使用距离计算。当人工智能利用微积分来计算参数值时,它会使用比率。当人工智能将大型矩阵相乘来转换数据时,它会使用混合。在今天的人工智能系统中,数学肯定是被使用到的。但这并不是因为数学正在挖掘复杂系统产生其输出的本质,而是因为数学是我们将距离、比率和混合编码到机器中的唯一方式。
数学为我们提供了一种在计算上定义距离、比率和混合的方式。但是,距离、比率和混合的概念并不属于数学,而是任何希望通过反复试验和高级启发式方法来进行的过程的必要方面。可能存在比数学可以表达或捕获的任何东西都更好的方法来实施距离、比率和混合,但就目前而言,数学是我们所拥有的全部。数学的向量和矩阵是有用的,但是,我们没有理由相信它们的(潜在的柏拉图式的)存在是自然的运作方式。
使人工智能运转起来的不是数学,而是位于反复试验和启发式方法使用核心的概念。必须将数学理解为只不过是自然界发生的事情的残余,而不是对自然内部运作方式的明确说明。
但是,今天的科学和工程范式沉浸在这样一种假设中,那就是数学本身就是复杂事物运作的方式。我们在今天的科学家和工程师对人工智能的“炼金术”所感到的持续不适中看到了这种心态。让科学和工程界中的许多人感到痛苦的是,人工智能看起来更像是一门艺术,而不是一门科学。人工智能系统的改进,不是通过仔细的设计或深入的因果推理,而是通过高级的混合和匹配,添加更多的数据和处理能力来实现结果。这一切听起来都是如此的不严谨。
与人工智能研究的炼金术作斗争才是问题所在。今天的人工智能研究人员想要找到一种更严谨的方式来描述人工智能内部是如何运作的。但是,没有什么可找的。我们知道人工智能是如何运作的,只要我们远离“如何”的因果关系版本。只有与信息、计算和进化相关的表面层面的知识才能描述人工智能正在做什么。在复杂性的作用下,深入系统内部并找到由一个优雅的数学理论所讲述的确定性故事的学术练习是虚假的。数学不是人工智能的工作方式,而是人工智能的设置方式。
数学只不过是现实的残余这一说法,说明了我们必须如何构建复杂事物。我们必须重新构建我们对数学所代表的意义的理解。它不是某种可以描述复杂事物内部如何运作的东西,也不能指导我们如何构建复杂的解决方案。永远不会有一个关于复杂事物内部运作方式的适当的数学理论。充其量,数学是一种有用的工具,可以用来编程确保在机器中进行反复试验所需的计算脚手架。
这极大地改变了我们对应用数学的看法,更广泛地(也更重要地)改变了将严谨性带入科学和工程的意义。数学不是某种我们可以用来理解宇宙的通用语言,而是一种用于创建和思考计算结构的框架,这些计算结构设置系统,但不支配其运作。
即使数学和概率在本质上与复杂性内部的运作方式是脱节的,概率确实提供了一种有用的类比工具。我们可以将自然现象视为根据一系列可能的值来产生其输出。这就是概率分布试图捕获的。
大多数概率分布都有峰值,峰值是值最集中的地方。这意味着峰值是我们最有可能观察到的一组值。我们最有可能观察到这些值,因为它们出现的频率最高。如果我们一次又一次地掷一个公平的六面骰子,我们预计每个数字出现的次数大致相同,从而产生一个均匀的(直线)分布。但是,如果我们偏向骰子,使其主要落在数字 6 上,那么值分布中会出现一个峰值,这表明 6 是更有可能的结果。
我们可以将峰值分布的概念与熵和多重可实现性联系起来。分布的峰值代表最有可能的统计配置。这正是熵如何将各个部分的一种排列映射到给定的宏观状态。最常发生的排列会导致我们期望看到的东西。与此一致的是多重可实现性的概念,正如你将记得的那样,这意味着复杂系统中最不变的属性可以通过尽可能多的方式来实现。由于分布的峰值是我们期望看到的,并且对应于熵落在不变结构和行为上的机制,这意味着我们可以将概率分布的峰值视为涌现的结构或行为。
所有这些中的一个关键认识是,没有分布的其余部分,峰值就什么都不是。峰值向我们展示了我们期望看到的东西,因为它代表了系统最有可能的统计微观配置。但这并不意味着其他的配置是不相关的。恰恰相反,这些不太可能的配置在塑造整体分布方面起着关键作用。更重要的是,如果不存在所有其他的配置,那么最有可能的配置就不会存在。如果没有这些不太可能的配置,那么系统的统计属性就会不复存在。
为什么这很重要,这与在复杂性时代构建事物有什么关系呢?它告诉我们,自然界必须使用整个分布才能使复杂性发挥作用。这对现代科学中试图通过隔离来理解事物这种谬论产生了重大影响。它告诉我们,还原论的所有表现形式都一定是根本错误的,因为它在本质上与我们观察、测量和体验到的东西是脱节的。
试图通过挑选东西来逆向工程自然界,没有任何“严谨”或“科学”可言。这在科学上和对我们所构建的事物来说都是正确的。我稍后会详细阐述这些后果。现在,请理解,还原论所做的隔离甚至与当前范式 supposedly 崇拜的数学和科学原则不符。
我们有两种方法可以使用数学来做出决策。我们可以运行计算并按照结果行事,或者我们可以理解数学所说的普遍属性。对于前者,请考虑一下今天如何应用数学和概率。在投资中,我们计算投资的预期回报和风险。在会计中,我们计算与预算和财务规划相关的结果。在工程中,我们模拟和分析结构在不同条件下的行为,分析和处理信号,并研究各种控制系统的稳定性和性能。在科学中,我们模拟物理现象并预测实验结果。在所有这些情况下,使用数学都是为了运行计算以获得一些结果。
但是,数学的另一方面与它的属性有关,而不是它的计算。正如之前讨论的,属性是对象或现象的描述性方面。属性回答的是对象是什么样的,而不是它如何产生其输出。数学充满了重要的属性,这些属性向我们展示了一个形式系统是如何运作的,以及它所遵循的约束。如果将数学视为其自身的现象,那么数学可以阐明系统的重要和普遍的属性。与直觉相反的是,这对于纯数学比对于应用数学来说更真实。纯数学研究的是数学本身的内部模式,而不是试图触及物理现象来描述正在发生的事情,它也不会试图进行具体的统计或预测。纯数学较少受到它与现实脱节的影响,因为它不是试图发现任何东西,而是试图发现它自身内部的结果。这可以说使得纯数学比今天的应用数学更与构建复杂事物相关。
尽管数学只不过是现实的残余,但它并不需要被抛弃。我已经展示了对概率分布的概念性理解是如何成为在构建复杂事物的框架中一个强大的盟友。但是,这与运行计算并查看计算结果是截然不同的。运行计算来了解复杂情况的结果表明数学可以告诉我们一些它不能告诉我们的东西。但是,欣赏数学的属性可以阐明系统,因为数学本身就是一个系统。一个简单的例子是欣赏概率学所说的风险与回报之间的权衡,而不是试图计算一个实际的风险值。前者是一种说明信息动态的模式,而后者则表现得好像数学本身反映了感兴趣系统的内部运作方式一样。
在复杂性下做出决策应该利用数学和概率的属性,而不是它们的计算。计算会将确定性强加到系统上。它将决策框架从一个使用一般行为的框架转变为一个假装知道系统将具体做什么的框架。前者是做出决策的强大工具,后者是危险和幼稚的工具。
数学是自然的残余,但它是一个值得研究的系统,因为它能告诉我们普遍正确的属性。我们可以将决策建立在数学的基础上,通过将数学的内在属性(而不是其计算)与我们理性论证的前提相结合。除此之外,正如我稍后将讨论的那样,事实证明数学可以不仅仅是模式的描述。它实际上可以创造事物。
生活的游戏化与设计的概念之间存在直接的关系。当我们假设世界可以被建模为游戏时,我们会将此类模型移植到我们现实世界系统的设计中。我们假设在游戏中可以看到的因果关系也一定存在于复杂情况中,并且对内部的具体控制仍然可以有效地工作。
但是,现实世界并不是我们在游戏中看到的东西的混乱延伸。这就是为什么从学术界的简单模型中发现的东西应用到现实生活中是如此深刻和成问题的。正如我之前讨论的那样,自然并没有做简单系统所做的事情,无论是字面上还是作为近似。
对于今天的科学和工程范式来说,不依赖内部因果知识的想法听起来很不切实际。最佳实践在哪里?设计模式在哪里?行业标准在哪里?我们是不是应该只是瞎混,然后寄希望于最好的结果?但事实是,这种“瞎混”远比当前的还原论范式所能提供的任何东西都更严谨。当我们看看真正困难的问题是如何变得可处理的时候,我们就会清楚地看到,naive 行动和模式识别确实是构建复杂事物最有效和最有效的方式。正如之前讨论的,使反复试验更易于处理的原因在于以最高级别的 meta 运行,这样就不会遇到难以克服的计算限制。通过尽可能地保持问题陈述的通用性并创建高度灵活的内部结构,瞎混就成为构建解决方案的更有效手段。
今天的工程师很难理解如何在没有设计的情况下完成人工智能。像前几代人一样,他们以他们当前的起点为基础,并试图设计下一个抽象级别。想象一下,一位工程师正在努力改进一种新的存储结构,比如今天使用的矩阵或张量。他们会调用设计原则和行业标准来构建他们的创作。在这种情况下,工程师正在处理整个系统中的一个组件,而这个组件本身本质上是确定性的。
但是,我们不能再假设存储结构所扮演的角色。我要再说一遍:知道某件事扮演了一个角色和知道那个角色是什么是两件非常不同的事情。在复杂的对象中使用完整分布时,存储结构的所谓角色会失去意义。正确的存储结构将是在整个人工智能系统的上下文中进行考虑时出现的那一个。使正确的存储结构出现的唯一方法是从外部构建它,而不是关心更好的孤立组件的具体设计。正如之前论证的那样,我们构建的东西的内部结构必须是灵活的,而不是具体的。我们不应该知道存储结构应该是什么样子的,只应该知道它的出现是更大的图景的一部分。
设计是生活游戏化的副产品。它在我们历史上构建的几乎所有东西中都很好地发挥了作用,因为我们的世界已经围绕着简单机器的结构化规则和惯例而形成。但是,复杂性使现实生活中发现的行为更接近于我们构建事物的方式。设计,就像游戏一样,无法使生活变得可处理。
人们越来越意识到科学有多么的不可重复。这显然会让人质疑科学期刊上发表的原始发现的可靠性。毕竟,如果我们无法重现科学家报告的发现,我们又怎么能相信它曾经被发现过呢?
众所周知,对于较软的科学来说,再现性危机更加严重。自心理学诞生以来,它一直受到再现性问题的困扰。事实上,较软的科学更容易受到不可再现性的影响并不令人惊讶。像物理学这样的领域会根据简单的系统来测量事物,而像心理学这样的领域则试图测量和解释思想,思想源于所有事物中最复杂的,人类的大脑。多位科学家测量原子发出的光的相同频率是一回事,但是让许多科学家测量相同的情绪(无论那意味着什么)是另一回事。
当然,这并没有阻止心理学家试图使他们的领域成为类似于物理学的领域,具有精确的定义和因果解释。仅仅指出个人焦虑的属性是不够的。要被认为是“真正的科学家”,心理学家必须在焦虑和某种扭曲思维的定义之间建立因果关系。必须确定一组根本原因,并拼凑出一个故事来展示从源头到结果的路径。
正是较软科学中的这种物理学嫉妒导致了它们的再现性危机版本,因为人们试图测量那些定义不明确的东西。行为科学家将试图表明人类行为具有根本原因。他们可能会测量某人在明显表现出某种行为时大脑中某个特定区域的活动,以此来解释该行为背后的神经机制。但是,人类行为具有根本原因的观点在很大程度上是虚构的,因为这不是复杂对象产生其输出的方式。此外,知道某人确实表现出某种特定行为也是一个挑战。
无论哪个领域,不可再现性通常归因于糟糕的科学技术。有缺陷的实验设计、不一致或定义不明确的方法论、统计方法的错误应用、糟糕的数据管理和报告、设备校准的差异,以及一系列认知偏差都被认为是再现性危机的罪魁祸首。
但是,不可再现性的真正根源是自然界缺乏确定性。虽然再现性被认为是高质量研究的重要因素,但对于除最简单的系统之外的任何事物来说,它都是完全不现实的。还原论科学已经选择根据隔离和提取来定义知识。我们应该控制变量,分离和限制感兴趣的区域,并测量非常具体的事物。但这并不是自然界的工作方式。自然界没有根本原因和确定性路径。我们没有理由期望自然界具有再现性,因为根据多重可实现性,我们没有理由认为自然界会两次走相同的道路。
想象一下,有两根金属杆从地面伸出来,大约相隔 4 英尺。现在想象一下,我告诉你退后几英尺,然后将飞盘扔到两根杆子之间,不要让飞盘碰到杆子。这很简单。但是现在想象一下,我把杆子拉得更近了,比如说相隔 2 英尺。现在这个挑战更难了,但仍然可以做到。但是,如果我移动杆子,使它们之间的距离小于飞盘的直径呢?我们仍然可以做到,以垂直的方式投掷飞盘。但是,我们越约束系统,就越难让飞盘穿过间距。
我们的杆子和飞盘的例子类似于自然界和我们用来测量自然界的工具之间的不匹配。杆子是自然现象,而我们试图让飞盘穿过杆子是我们的测量。我们越是通过还原论来人为地约束现象(将杆子拉得更近),我们就越不能期望我们的测量具有再现性(让飞盘穿过杆子而不碰到它们)。
还原论科学告诉我们通过隔离、控制和约束来对世界进行游戏化。我们将自然放入实验室并检查它的各个部分,然后期望其他人测量相同的东西。这类似于将杆子越拉越近,并期望许多人总是将飞盘扔到杆子之间。当然,一个人可以培养出重现良好投掷的“技巧”,但是让许多人都这样做是不太可能的。
人类并不应该在受限的环境中工作。人类,作为自然界的解决方案之一,具有高度的灵活性。我们在复杂环境中解决绝对困难的问题时表现最好。我们有很多种扔飞盘的方式,包括反手、正手、 flick、 hammer、 thumber、 upper hand、 roller、 overhand、 push 等等。这是因为人类是高维的,我们应该在高维或高于我们自身维度的环境中运作;用我们的能力来填补可能性的空间。但是,一旦创建了一个游戏,我们就被限制在约束规则内运作。环境越游戏化,我们就越必须人为地限制我们的自然能力。
还原论对自然进行游戏化。它将自然挤压到狭窄的空间,并假装它比实际要简单得多。通过这样做,我们可以通过精确的测量来摆脱困境,因为我们现在表现得好像自然本身就是精确的一样。但自然并非精确的。当然,物理学可以将引力常数、光速和精细结构常数测量到小数点后几位,但这些与自然的运作方式无关。它们本身没有任何意义。它们只不过是被统计地涂抹到自然界定义不明确的集合中的各个部分。它们在任何有意义的方式上都不是因果关系。物理学更具有再现性,仅仅是因为它更人为地定义了自然界。任何其他遵循其做法的科学都将随着其现象的复杂性增加而遇到再现性问题。
按照今天对“更好”的定义来尝试进行更好的科学研究并不能帮助对自然进行诚实的研究。无论在实验设计、方法论的一致性、统计数据的适当使用、更好的数据管理、卓越的设备校准或减少人为偏差方面做出多少改进都无法解决这个问题。问题在于还原论,因为它在我们在研究的东西和我们测量它的能力之间造成了不匹配。
科学是创造受约束的测量工具的故事,目的是进行精确的测量。但是,这种对我们工具的约束与迫使我们的飞盘投掷进入低维度、不自然的形式没有什么不同。隔离的部分说明了聚合的结构和行为(也就是现实世界)这一隐藏且错误的 premise 允许科学通过精确的测量来摆脱困境。物理学可以侥幸成功,因为它们首先主要对非复杂的事物感兴趣。但是,随着我们攀升复杂性的阶梯,情况就不能这么说了。可以预期化学的再现性会更差,生物学更差,社会科学会极差。
只要研究人员都像物理学家一样行事,他们就会过度约束自然,以至于无法测量太多有意义的东西,更不用说可以重现的东西。行为科学家使用 fMRI 机器来隔离大脑的某个区域,就是将他们对飞盘的投掷改变为非常特定的类型,以便让飞盘穿过杆子。可以进行测量,但它在自然界的游戏化版本中运作。
大多数科学家都错过了这一点。我们知道这一点,因为问题几乎总是归因于技术错误。但问题不在于所使用的技术,而在于当今科学所依据的游戏化基础。人工智能在科学中的使用证明了这种荒谬性。在科学中应用人工智能作为一种工具是有意义的。人工智能可以检测到人类错过的模式,并发现大量数据集之间的相关性。但是,那些将人工智能应用于其科学研究的人遇到了与以往相同的可再现性问题,研究人员未能重现相当数量的研究。这归因于诸如人工智能炒作导致过于乐观的期望、缺乏关于模型是如何创建的文档,以及各种来源的“泄漏”,例如用于训练模型的数据与用于测试它的数据重叠。
但是,人工智能作为一种工具无法像科学中的其他工具那样受到约束。这是因为人工智能本身就是一个复杂的对象,更接近于自然。试图迫使人工智能降低到还原论科学的低维度是迫使飞盘玩家只以非常具体的方式投掷。人工智能研究人员遇到再现性问题完全不出乎意料。不是因为过于热情的感情、缺乏文档或数据泄漏,而是因为人工智能无法在受限的环境中有效地运作。它本来就不是要这样运作的。回想一下深度学习对魔方的解决方案;只要它建模的系统本身是复杂的,人工智能就会尽可能地灵活。再现性危机只是对我们的世界进行游戏化的又一个副产品。
科学需要再现性吗?科学家应该重现他人的工作以确认发现似乎是显而易见的。但是我们说的是什么发现?我们需要的不是孤立的结构和因果解释。我们需要有效的东西。我们需要构建的东西。我们构建的东西不是要被复制的,而是要以许多不同的方式实现的。我们需要的知识不是再现性的受限部分;它是元级别的属性,这些属性被证明在许多不同的实例中都是成立的(幸存下来)。与重新定义知识相一致的是,有必要重新构建发现的意义。
我相信最好将数学视为一种值得研究的现象,而不是作为一种支撑自然界本身的通用语言。数学会在人们将符号重排成新形式时,落在可重复和可识别的模式上。这意味着可以期望数学具有其自身的元结构,并且可以通过其自洽性和内置的不变模式带来发现。
这似乎表明数学是发现的而不是发明的。这是一个长期的哲学辩论,它对比了两种可能性:1)数学真理独立于人类思想而存在,我们只是通过探索来发现这些真理,或者 2)数学是人类思想的发明,是作为描述和理解我们世界的便利而开发的。
我认为发现与发明的问题实际上是错误的。这是一个哲学上的悖论,它似乎表明两个答案不能都是真的。但是悖论只来自表达它们的系统内部,而不是当我们走出系统来评论它们的有效性时。
考虑一下,数学可能只不过是思想如何安排思想并找到逻辑一致性的反映。使用数学就是举起一面镜子来映照我们自己的思想,其中保持数学自身封闭的规则和结构正是使人类思想成为可能的约束。如果是真的,数学很可能是复杂对象定期进行的自我参照的副产品而出现的。
就像我之前说的, going meta 是物理抽象产生的方式。复杂系统会折叠回自身,以建立其涌现的结构和行为。人类大脑会在 meta 意义上“观察”自身,就像所有复杂对象一样,但是,由于有知觉的头脑,这种自我参照会产生人类水平的意识。除了在所有自然解决方案中看到的原始的机械版本的自我参照之外,人类将其外化为绘制在纸上的符号。使用数学就是采用头脑用于孕育涌现推理的相同约束,并亲自使用它。
这并没有使数学变得不那么有趣或不那么重要。毕竟,人类思维是我们所拥有的一切,可以用来推理我们的世界如何以及为什么会运作。但这确实使数学降级为人类思维的现象,而不是作为一种支撑所有现实的通用语言。这并不像人们想象的那样具有局限性。对于在计算中释放的数学带来了极大的灵活性,今天的 AI 系统证明了这一点。正如之前讨论的那样,使 AI 运转起来的不是数学本身。计算结构是使用数学创建的,但是,系统被释放并允许自行收敛。数学仅仅充当了规则,使数据能够被混合在一起,但是,这种混合导致了在数学语言中没有发现的事物的出现。
这使得数学更多的是一种创造性的事物,而不是一种描述性的事物。数学是我们设置机器以进行混合和匹配的方式。数学的属性可以帮助我们确定这种混合和匹配可能如何发生。但是,数学的内部规则并没有将其符号推理借给它。这就是为什么符号人工智能从未解决难题,但今天的人工智能却可以。
数学是大脑用于涌现推理的约束的心理反映,而这些约束正是带来复杂系统中看到的灵活性的原因,这使我们了解到为什么数学是自然的残余:数学代表了自然用于实现涌现的起点,但它不代表涌现本身。
由于数学只能代表复杂性的起点,而不能提供自然运作的实际机制,这意味着数学的天然家园是计算。回想一下,自然界中发生的过程意味着自然正在进行计算。但是,自然使用其涌现的物理抽象来进行计算,而不是使用某种确定性的机器将各个部分碰撞到各个部分。数学属于计算,因为它的残余形式代表了涌现计算的起点。
我们在数学中看到了悖论的产生,因为它是被错误地应用于语言本身,而不是被释放为涌现的创造性燃料。当以非 meta 方式看待时,发现与发明的辩论只是一个悖论。事实上,对于所有悖论来说都是如此。当在语言之外看待时,悖论就会得到解决,因为 supposedly 相互不兼容的各个方面仅仅是更大的真理的各个方面;只能从外部看到一个方面。
如果数学没有导致矛盾,数学就说某件事是真的。这就是为什么像归谬法(拉丁语中的“归结到荒谬”)这样的方法被用来通过展示相反的情况会导致矛盾来确立一个主张。在一种形式语言中,期望事物能够一致且完整地运作。虽然有哥德尔不完备性定理,但数学是在这样的前提下运作的,即可以通过缺乏矛盾来证明事物的真实性。但是,正是数学的约束才使得更深层次的真理看起来好像是矛盾。相对于自然的功能而言,数学推理的内在简单性会导致形式化实体之间的冲突。但是走出这种语言,矛盾就会消失。
如果我说“这句话是假的”,我们就会称之为矛盾或悖论。所有的悖论都具有这种本质,即系统的各个部分看起来是相互不兼容的。但是,我们可以审视这样一句话并仍然对其进行推理这一事实意味着外部运行,在我们评论的系统之外,可以缓解悖论。例如,这句话可能说明的是一些更高级别的东西,一些对于这句话本身来说是 meta 的东西。想象一下,我们真正的目的是为了突出矛盾这个话题,就像我们现在所做的那样。现在这句话是完全合乎逻辑的,因为它充当了更高层次实现的演示。一个更具哲学性的例子可能是看似矛盾的信念,即世界上既有上帝又有苦难。在系统内部,上帝和苦难确实存在悖论,但是在系统外部,可以理性地论证说,苦难可能会服务于更大的目的(例如在生活中找到意义)。
数学的内在不完备性不会对它产生不利影响,因为它的真正效用不是来自它的内部规则,而是来自其他的东西;那种东西就是计算。数学内部的矛盾不会干扰计算现实,因为这种现实存在于孕育其存在的数学起点之外。对于复杂性下的任何系统来说都是如此。在现实生活中,创造性的灵活性是由系统的约束来实现的,而不是通过无限的自由和自主来实现的。
如果数学的正确家园是计算,那么为什么大多数的数学及其在理论中的使用都不是