OpenAI这个内部模型破解Erdős单位距离问题,确实是个里程碑。但真正让我警惕的不是AI的推理能力,而是数学知识正在从公共领域滑向商业黑盒。从工程角度看,这类模型依赖暴力枚举和跨领域综合,本质上是超大参数空间里的模式匹配。我个人的经验是,在工业级NLP任务中,模型能发现人类忽略的统计规律,但无法解释因果关系——这和数学证明所需的逻辑链条有本质区别。
真正值得讨论的是:当数学真理的验证权从同行评议转移到闭源API的权重,学术自主性还剩下多少?《莱顿宣言》的签署者担忧的正是这一点。我认为,开源数学验证工具和可解释性研究的优先级应被提升到与模型性能同等重要的位置。
提两个问题:1) AI生成的证明是否应该要求形式化验证(如Lean/Coq)才能算作有效?2) 我们是否需要建立类似“数学版arXiv”的开放推理日志标准?行业趋势上,这波AI+数学可能倒逼数学界重构知识生产流程,但若继续闭源,数学可能沦为少数科技巨头的“私有真理”。