一、集体反思
梳理近一年来人工智能领域顶尖专家和学者的观点,发现许多值得深思的问题,比如:当前依托大参数、大数据与自回归预测架构的大语言模型,是否存在一定的结构性局限。行业长期侧重算力与数据规模的迭代路径,是否并没有完全触及通用智能的底层本质?
通过李飞飞、杨立昆、朱松纯等人的访谈及研究与分享,我将现有主流AI的局限性总结为三点。其一,对物理现实的认知缺失,缺乏完整的时空理解能力(这个去年的文章谈过)。大语言模型的训练依托人类后天形成的语言符号体系,仅学习符号间的统计关联,难以复刻生物长期演化形成的物理时空认知。模型无法稳定理解三维空间结构、物理约束与时间演化逻辑,其对话与推理输出,本质是符号层面的概率生成,并非基于物理实在的真实认知。
其二,因果推理能力薄弱,推理过程存在表象性。现有模型的思维链输出,多为基于海量数据的事后拟合与合理化表述,并非主动的因果推演与目标导向规划。由于缺乏稳定、可迭代的内部世界模型,模型难以持续跟踪事物状态变化与因果关联,这也是模型幻觉、常识推理偏差等问题难以彻底优化的重要原因。
其三,由于市场转化的追求,研究视角存在一定偏向性。目前AI领域多聚焦大模型能力迭代与AGI相关探索,对智能本质的基础研究比较弱。从工程视角来看,AI的核心价值在于赋能人类、解决现实问题,过度追逐规模化参数迭代与商业化目的的宏大叙事,可能会让行业偏离智能研究的核心方向。
综上:真正的智能不仅是符号层面的统计拟合,更要包含扎根物理时空、具备因果认知与环境交互的综合能力。这个结论加上直觉,指引我重新关注物理时空规律在人工智能研究中的核心价值。
二、真实智能必然嵌入时空体系
接上前面的结论,我觉得应该超越参数、数据、模型等技术概念,回归智能的第一性原理,核心认识是:所有生物智能与真正的机器智能,都必须建立在对时空体系的认知与交互之上。我们所处的物理世界,由空间、时间两大不可分割的基础维度构成,二者共生统一、不可割裂,这是一切客观规律的底层前提。
空间是万物结构的载体,定义了物体的形态、位置、拓扑关系与几何约束,是静态世界的秩序基础;时间是万物演化的载体,定义了事物状态更迭、因果传递、持续变化与不可逆演进,是动态世界的运行基础。真实物理世界的一切现象,都是空间结构与时间演化的结合产物。
人类与生物的自然智能,底层天然适配时空一体的运行规则,能够同步完成空间感知与时序推演,基于过往因果积累判断当下、预测未来。而大模型的弊端,正是割裂了符号与物理、空间与时间的关联,仅学习语言符号的表层关联,未建立对真实时空世界的底层认知,因此无法实现真正的理解与推理。
我对智能的理解:智能体的核心能力,在于感知、理解时空运行规律,并依托规律适配物理世界、完成合理决策与交互行动。这一认知,也是我理解时空智能研究的基础第一性原理。
三、欧拉公式的数理启示
是否存在简洁的数学结构,能够适配物理世界的动态运行规律,为机器世界模型的构建提供基础先验?很自然会想到一个非常耳熟的名字:欧拉公式。它是简洁基础的数学工具,能够同时刻画几何结构与动态演化两类核心特征,可为时空智能的底层认知建模提供重要参考。
公式融合了两类基础函数,恰好对应物理系统运行的两大核心维度,也对应智能认知必须具备的两种基础能力。
第一,三角函数与π,对应系统的空间结构、几何约束、周期与对称关系。cos、sin描述的是平面旋转、周期振荡、几何投影等静态与结构性关系,是一切空间形态、拓扑结构、对称约束的数学基础。在智能认知中,这对应机器对三维场景结构、物体形态、空间约束、相对位置的理解能力,是空间感知与几何推理的数理模板。
第二,复指数函数与自然常数e,对应系统的连续时间演化、增量累积、因果动态过程。e的核心数学特性是描述连续、平滑、可累积的变化过程,无论是衰减、增长、振荡演进、状态迭代,都遵循e的指数演化逻辑。在智能认知中,这对应时序推演、状态预测、因果累积、未来状态预估的能力,是机器建立时间维度动态认知的数理模板。
因此,欧拉公式以极简的数学形式实现了几何结构约束(对应空间属性)与连续性动态演化(对应时间属性)的统一表达。物理世界中多数基础动态系统,如旋转、波动、振荡、状态迭代等,都可以通过这一数理结构进行简化描述。它不是诠释时空规律的唯一框架,但在我们当下计算能力超级跃进的时代,依然最简洁、最易落地的基础模板之一。
结合时空智能的研究场景,若将欧拉体系蕴含的“结构+演化”耦合逻辑作为模型先验补充,可让机器建模过程更贴合物理世界的运行逻辑,依托π相关几何逻辑理解空间结构,依托e相关指数逻辑拟合时序变化。为时空一体认知的机器智能建模,提供了可落地的数理参考方向。
四、对人工智能与时空智能学习的启示
结合对欧拉公式的数理内涵学习,形成了几点学习启示。
第一,认知框架的优先级高于单纯的数据与算力堆叠。从诸多研究案例来看,智能能力的上限,很大程度取决于底层认知框架的合理性。大模型的局限性,源于其建模架构割裂了时空关联、脱离物理实在,即便依托海量数据训练,也难以形成本质化的物理认知。这提示我们,时空智能研究需更侧重贴合物理规律的底层框架搭建。
第二,AI研究范式可从纯数据拟合,向“规律先验植入+数据学习”结合的方向优化。传统数据驱动模式依赖海量样本拟合规律,存在泛化性弱、可解释性差等问题。而基础数理体系证明,物理世界存在诸多可量化、可结构化的稳定规律。在时空智能建模中,适度植入这类先验数理、物理规律,能够辅助模型建立更稳健的时空认知,提升学习效率与泛化能力。
第三,智能研究需完善“感知-认知-行动”的物理闭环。脱离物理交互的符号智能存在天然短板,真正的时空智能需要扎根真实物理场景。依托高精度传感、三维建模、虚实融合等技术,打通空间感知、时序捕捉、认知推演、自主交互的完整闭环,是弥补传统AI知行分离问题的重要路径。
第四,目前的具身智能与时空世界模型,只是工程层面的改良,没有本质突破:一是多数模型的时空结合是后天拼接架构,并未形成原生统一的时空认知逻辑,距离贴合基础数理规律的原生认知框架有差距;二是物理先验植入较为浅层,多为外挂约束、规则限制,尚未将“空间结构+时间演化”的统一数理逻辑内化到底层建模;三是因果推理仍为短板,模型可完成简单物理交互,但难以建立长期、可累积的时序因果推演,复杂开放场景泛化能力依旧薄弱;四是尚未形成统一、通用的时空智能底层范式,各类框架碎片化、场景定制化,通用性不足。
小结:
这些梳理主要是填补一下我近期的精神虚空,特别是对欧拉公式中几个字母的理解让我有点感动,似乎再一次升华了之前的许多认识。码字甚至纯粹为了阐述欧拉公式的美妙才来用它分析人工智能和时空智能发展的问题。
维特根斯坦的时空预言:大语言模型为何无法真正理解世界?