
GPT-5 发明了新数学:这是通用人工智能吗?
山姆·奥特曼一直在大肆宣称GPT-5具备博士级智能,如今初步迹象已经显现。一位推特用户称,GPT-5展示了一些前所未见的新数学内容,互联网上找不到相关信息,且它能用新的数学算法和方法给出正确证明。
实际情况是怎样的
“
塞巴斯蒂安·布贝克是微软的正统数学家,他给GPT-5-Pro出了一道凸优化领域的题目。
这不是教科书上的题,也不在arXiv学术预印本平台上,不是自动补全的内容,而是一道开放性难题。具体来说:
任务是改进优化领域中与光滑凸函数相关的已知收敛界,将下限从
1/L
提升到更优的数值。
GPT-5-Pro用了17分钟处理这道题(可能是在借助工具的提示工程环境中),并给出了正确证明,将收敛界从1/L
收紧到了1.5/L
。
我再强调一遍:这个模型发现了一个新的、更严格的不等式。
而且这不是幻觉。布贝克验证了这一数学内容。
这只是博眼球的热门噱头,还是确有其事?
确有其事。布贝克已证实此事,他不是那种为博转推的网络红人,而是有着扎实学术履历的理论计算机科学家。
此外,数学推导也站得住脚。第二张图片中的幻灯片是基于余强制性和布雷格曼散度界等已知定理的形式化推导。
“
这篇博文的目的不是解释数学原理,而是要表明人工智能不仅能证明数学定理,还能创造新的数学内容。
这不是魔法,而是对已知知识的整合——但这种整合就连人类都没能利落完成。
所以没错,GPT-5没有死记硬背。它为一个部分开放性问题创造了新证明。这并非最终结论——人类后来将收敛界进一步改进到了1.75/L
,但GPT-5确实独立推动了进展。
这不是博眼球的无稽之谈,而是研究成果。
这有多重要?
意义重大。但并非因为这个证明会给凸优化领域带来革命。
意义重大的原因在于:
- 这是研究级别的工作。
- 它不是暴力破解,涉及符号推理、不等式运算和概念性数学。
- 这暗示着大语言模型正从机械复述和检索,迈向主动探索。
打个比方:这就像给研究生出一道稍超其能力范围的数学题,而他们最终给出了一个通过同行评审的全新证明。
只不过这个“研究生”是硅基的,从不睡觉,也并不真正理解“理解”是什么意思。
这带来的影响
短期影响
- 预计所有研究实验室都会开始用GPT模型测试未解决或部分解决的问题,尤其是数学、物理和形式逻辑领域的问题。
- Lean和Coq等证明辅助工具可能会与大语言模型整合,实现形式化证明生成的自动化。
- 人工智能可能会开始被列为数学论文的合著者(这在其他领域已出现,而此事会让这一做法合法化)。
长期影响
- 这可能会重塑理论研究的方式:人类可能成为问题提出者,人工智能则成为初步求解者。
- 最终可能在人类直觉受限的领域(如高维几何、代数拓扑)带来新发现。
- 若顺着这一趋势推测:理论上,经过充分训练和合理范围设定,人工智能或许能发现新的物理学理论。
喧嚣背后被掩盖的风险
1. 过度炒作等同于错误信任
人们会开始过度信任大语言模型,期望每个答案都是“经验证的天才之作”。但大多数时候,GPT仍会出现幻觉或过拟合。一次成功无法抵消上千次失败。
2. 无法验证的进展
除了布贝克这类人手动验证输出的情况,许多人工智能生成的“证明”会未经检验就流传开来。哪怕其中一个包含细微缺陷,也会融入未来的研究中,悄然损害数学领域的严谨性。
3. 数学直觉的丧失
如果机器开始解决我们解决不了的问题,或使用我们无法完全理解的技术,我们可能会把数学变成黑箱——讽刺的是,这正是数学一直试图避免的。
4. 称其为通用人工智能的诱惑
这不是通用人工智能。它仍然是模式匹配,只是规模大得惊人。GPT-5并没有“理解”问题,只是通过大量嵌入和推理步骤进行强力模式匹配。算智能吗?或许算。但有意识的理解?算不上。
这不是奇点,但却是一个分水岭。
我们刚刚见证了一台机器:
- 读取一道从未见过的题
- 用17分钟推理
- 提出新的不等式界
- 写出简洁的证明
- 并得到顶尖人类研究者的验证
如果你没有丝毫触动,至少没有深深好奇,那可能是没认真关注。但别轻信“机器已经解决数学问题”的幻想。更恰当的说法是:
本文转载自AIGC深一度
