献给同样对数字世界怀有好奇心和乃至充满焦虑的朋友。
写在前面
今年春节,延续着放假前讨论的PLT本体论建模的话题,沿着哲学方向,做了一些尝试和探索。尽管只是走马观花似的到此一游,浅浅的了解到一些皮毛知识,但依然给自己带来不少的触动。
假期结束前,以导游图形式发了一篇《春节总结:我的本体论之旅》。原本是不打算写文字的。一来许多想法天马行空,二来想法也很不成熟,发出来数千字无端耽误朋友们的时间,乃是罪过。
想不到还引起不少朋友的兴趣,就当自己的学习笔记,发出来供大家消遣。如果因此能够引发朋友们对数字世界的一些哲学思考,那就当共同学习了。
期望对此感兴趣的朋友留言交流。

第一站:本体论建模
过去几个月,PLTR的本体论建模被过于神化。官方机构甚至也开始参与进来(见《一声叹息:本体论要开始出行业规范了》)。
抛开那些不明真相而盲目跟风者或者借此为自己产品营销者的夸张言论不谈,本体论建模有其合理性。
在信息化年代,数据建模特指数据结构建模。实体关系模型(E-RM)是主流的数据结构建模方法。
上世纪70年代,一位华人老兄Peter Chen发表了论文《The entity-relationship model-toward a unified view of data》。

以此为理论基础,Oracle、IBM等西方大厂先后推出关系型数据库管理系统,统治了数据库市场数十年。
最近十年这两曾经的数据库大鳄风光不再,不过后来者并非本体论建模派系,而是MySQL等分布式数据库。
正如《数字化时代,需要本体论建模,更需要本体论思维》总结的,本理论建模早在1993年被提出,W3C建立RDF、OWL标准为其背书,Google推出知识图谱。
与E-RM相比,本体论模型相对完整的保留了对象(实体)之间业务关系含义。以经典的业务场景为例,客户和订单两个对象,E-RM中被抽象为简单的“一对多”的数量关系;而本理论模型则可以保留为“下单”这一业务关系。
为此,并非说后者比前者更聪明,都是为了解决“机器可读可计算”的问题。变聪明的是机器而已。
PLTR在此基础上增加Action这一传统属于程序逻辑的功能元素。元数据与大模型语义处理能力二者加持下,应该是可行的。
既然是到此一游,我尽可能暂时克制自己内心冲动。打算另外专门写一篇展开讲讲,题目暂且定为《本体论建模:让计算机更容易理解这个世界》,敬请朋友们关注。
第二站:哲学本体论
当年,本体论建模“鼻祖”Gruber明确指出其思想和方法的灵感来源于古希腊哲学本体论。本人向来对西方哲学史有些许兴趣。过去曾被19世纪欧洲的“存在主义”绕得云里雾里,对于古希腊哲学家们探讨的“存在”概念索性就选择忽视。
重新找出《西方哲学史》,从柏拉图提出的二重世界(理念世界和物质世界),再到亚里士多德的《形而上学》。
“柏拉图式”的爱情为大家熟知。柏拉图更加经典的“洞穴”之喻,用来表达人们所看到的不一定真实世界的观点。尽管过去多次路过柏拉图的“洞穴”,但大概不清楚或者不关心他要表达的观点,因此基本是过目即忘的效果。
春节假期,大概闲得有点过于无聊,对着文字手绘了一张洞穴图。

亚里士多德在老师理念论基础上,提出“形而上学”,意为超越物质世界。由此也就开启了西方纯粹理性学说的探索之旅,最典型的莫过于几何学、数论。
如果形而上学只是理念层面的,那亚里士多德还总结了《工具论》。工具论包含范畴学说、形式逻辑体系等。本体论建模借鉴之一便是范畴学说。《范畴篇》(Categories)里,他提出了十个基本范畴,除了实体以外,还包括描述实体九个基本范畴,即数量、性质、关系、地点、时间、姿态、状况、活动、遭受。
关于形而上学,我最近两年才有了些新的认识。

不由自主的感叹,从小到大,为了升学、毕业、工作,从书本上学习了太多的知识,可惜没有学会自己思考。
第三站:李约瑟难题
好几个朋友问我,李约瑟难题怎么会被“插队”进来的。
直接理由是,在亚里士多德的《工具论》除了提出了范畴学说,还提出了形式逻辑体系(《前分析篇》)。
某一天想起曾经听过王德峰的节目“听懂中西方文化底层差异”,其中好像李约瑟难题跟此有关。
英国学者李约瑟在《中国科学技术史》系列著作首先提出问题,“尽管中国古代对人类科技发展做出了许多重要贡献,但为什么科学和工业革命没有在近代的中国发生?”
这便是著名的李约瑟之问,也被称为李约瑟难题。
随后在著作中他指出,中国缺乏古希腊的“形式逻辑体系”和“通过实验验证因果关系”的科学传统。
爱因斯坦认为这两大基础是西方科学革命的根基。
难以想象,近现代西方科学飞速发展的种子,竟然在近两千年便种下了。尽管中间还经历了漫长的中世纪黑夜,跨域千年的因果论仍然生效。
人类正走向智能时代,隐隐约约感觉到柏拉图提出的理念世界思想天然就是未来数字世界的“本体”。
我们民族下一个千年发展之因的“种子”又在哪里呢?春节闲着嘛,思想不觉天马行空的跑飞了。
这才是我将李约瑟难题加入本理论之旅的真正原因。
第四站:哲学与科学
模型一词,对我们来说既熟悉又陌生。
之所以说熟悉,模型的概念我们中国文化里自古有之。早在商代开始青铜器铸造技术里,模和范都用得非常纯熟了。但我们所应用的模型都是物质的模型。而西方从哲学到科学领域非常重视理念、理论模型。
沿着这个思路,我向大模型提了个问题:
在西方哲学中自从本体论提出之后,非常强调理论建设,尤其是体系化的模型。我想知道,西方理论、科学发展中,有哪些典型案例,先有理论模型,再逐步成为物理世界的科学发明。
大模型提供了麦克斯韦方程组与无线电通讯、量子数学形式体系与激光、广义相对论与全球定位系统(GPS)。
我挑了GPS案例进一步追问了解到, 如果不根据广义相对论(和狭义相对论)对卫星上的时钟进行修正,GPS的定位精度会每天累积超过10公里的误差。此处不多啰嗦,GPS卫星上的原子钟比地球上的原子钟每天快38微秒。背后的理论支撑是相对论,其中狭义相对论效应是运动导致时钟变慢;广义相对论效应是引力势导致时钟变快。
怎么样,看到这个案例后,不知道朋友们也跟我一样感到惊奇。自高中了解相对论之后,一直以为跟我们日常生活没有任何关系。
到这里,我想在李约瑟之问的答案上增加一条,中国文化里缺乏纯理性思维。尤其是近现代强调“实践出真知”后,哲学与纯粹理性更加被视之为思想“毒药”。
而我隐隐约约觉得,纯理性思维对于未来的数字世界更加重要。数字世界不仅仅只是物理世界的映射。
不过要特别说明的是,这样说并非鼓吹自亚里士多德师徒提出的形而上学。形而上学自有它的缺陷,毕竟这个世界注定不是一个完美的世界。
第五站:信息本体论
早在2021年的《多视角看数字化》一文中提到,“哲学视角,物质精神融合的新世界”。结束前总结了一句“信息化创造了无数的系统;数字化将创造一个新世界。”
最近收到本理论建模现象的刺激,更加勾起了我对数字世界哲学探索的冲动。大模型是个好东西,它帮我快速了解到早已有之。
美国物理学家恵勒早在1990年提出了“It from Bit”(万物源于比特)的哲学思想。
西安交大邬焜教授提出信息本体论的概念,主张:世界=物质(直接存在)+信息(间接存在)。
当即下单买了一本邬教授的理论著作,希望从中得到启发,让我自己重新思考正在进入的数字世界。
过去几年,在不那么严肃的培训场合,偶尔会讲讲下面这张PPT。

可惜感兴趣的朋友并不多。
写在最后
正如我上篇所说,哲学这玩意,容易天马行空(走火入魔)。
这篇学习总结中相关的知识点大部分是通过大模型查找或者验证的。深切感受到,知识本身几乎触手可得。那我们有剩下什么呢?
我想说,知识是大模型的,但想法是我自己的。
PLTR将一个技术概念从后台推向前台。希望大家不仅仅知道本理论建模本身,更能引起一些哲学思考。