人工智能帮助解决以前无法解决的数学问题的案例越来越多。
据报道,OpenAI 的 GPT-5.2 解决了 Erdős 问题 #728,这似乎是一个重要的里程碑,标志着人工智能首次在任何人类数学家之前自主解决了一个未解的数学猜想。
剑桥大学数学系学生 AcerFur 在 X 平台上宣布了这项突破性进展,此前他曾与他人合作进行验证。该问题旨在探究是否存在无穷多个整数 a、b、n,满足特定的整除性和涉及阶乘的不等式条件。自提出以来,该问题一直未得到解决。具体而言,该问题是:“设 C>0 且 ϵ>0 足够小。是否存在无穷多个整数 a、b、n,满足 a≥ϵn 且 b≥ϵn,使得 a!b!∣n!(a+b−n)! 且 a+b>n+Clogn?”
根据 AcerFur 的描述,GPT-5.2 生成了初始解决方案和证明,随后 Harmonic 的 Aristotle 系统使用 Lean 中的形式化验证对其进行了验证。Lean 是一款证明辅助工具,可提供机器可验证的正确性保证。Aristotle 最初解决了一个稍弱的变体,但能够自主修复其证明,最终无需人工干预即可获得完整的结果。
重要注意事项
AcerFur强调了这项成就的三个关键缺陷。首先,原始问题描述含糊不清,该模型求解的是一种数学界普遍认为最有可能产生非平凡解的解释。其次,该解决方案似乎深受数学家Carl Pomerance先前工作的启发,这引发了人们对人工智能贡献究竟有多新颖的质疑。第三,目前尚不清楚有多少尚未发表的文献探讨了如何解决此类问题的特殊情况。
该解决方案源于 AcerFur 和 X 用户 Liam06972452 的合作。Liam06972452 首先收到了 GPT-5.2 的响应并请求验证。AcerFur 解释说,GPT-5.2 完成了繁重的数学运算,而 GPT-5.2 Pro 则随后将证明结果格式化为完整的 LaTeX 论文格式,并在格式化过程中可能进行了验证并填补了其中的空白。
人工智能数学领域的发展势头
这项成就紧随Harmonic公司近期另一项成果之后。Harmonic是一家数学人工智能初创公司,由Robinhood首席执行官Vlad Tenev创立。去年11月,Harmonic宣布其亚里士多德系统解决了埃尔德什问题124,该问题自1995年发表以来,已悬而未决近30年。
然而,数学界对这一说法反应较为谨慎。维护埃尔德什问题网站的托马斯·布鲁姆承认这一成就令人印象深刻,但他指出,所解决的版本只是埃尔德什提出的两个变体中较简单的一个,而且事后看来,解决方案相对简单直接,难度与人工智能已展现出强大实力的数学竞赛题目相当。
埃尔德什问题指的是保罗·埃尔德什提出的数学猜想。埃尔德什是20世纪最多产的数学家之一,一生发表了1500多篇论文。解决埃尔德什问题被认为是数学界的一项重大成就,埃尔德什本人也根据他对问题难度的评估,为解答者提供奖金。
形式化验证的优势
这两项成果都凸显了形式化验证在验证人工智能生成的数学运算结果方面的重要性。Harmonic 的方法以 Lean 为核心,Lean 是一种形式化语言,它允许对每个解决方案进行验证,直至其基本公理,从而无需人工数学家手动检查输出结果的准确性。
2025年初,Harmonic宣布其模型Aristotle在2025年国际数学奥林匹克竞赛中取得了金牌级别的成绩,在六道题目中给出了五道可验证的正确答案。这使得Harmonic与谷歌DeepMind和OpenAI等科技巨头并驾齐驱,这两家公司也分别凭借各自的模型取得了类似的成绩。
启示与问题
如果这些论断得到更广泛的数学界的验证,它们可能标志着人工智能系统发展的一个转折点,人工智能系统将不再仅仅满足于掌握现有的问题集,而是开始贡献原创性的数学发现。然而,关于这些解决方案的真正创新性、它们在多大程度上受到训练数据的影响,以及它们究竟代表了真正的数学洞察力还是复杂的模式匹配,仍然存在诸多疑问。
第 728 题最初表述的模糊性,以及 GPT-5.2 的解决方案大量借鉴了前人研究成果这一事实,凸显了评估人工智能对数学贡献的复杂性。尽管这些系统展现出了令人瞩目的能力,但它们究竟是在进行全新的研究,还是仅仅以新的方式重组了现有知识,仍然是一个值得探讨的问题。可以肯定的是,人工智能系统正在迅速接近,甚至可能已经达到了对数学研究做出有意义贡献的门槛。这是否标志着人工智能与人类在数学领域合作的新时代——或者更具变革性——还有待观察。
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
https://wx.zsxq.com/group/454854145828
未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。