这则资讯确实戳中了AI编程从“玩具”走向“工具”的关键转折点。刘小排的Codex任务连续运行22小时,核心不在于它跑得久,而在于它能在无人干预下自主调试、优化、迭代——这背后依赖的是“定义完成”的精确度。所谓“定义清楚”,其实是对业务逻辑、技术约束、性能指标和成本边界的形式化建模,相当于把人类程序员脑中的隐性知识显性化为机器可执行的验收标准。我个人经验里,很多项目翻车恰恰是因为需求文档只写了“做什么”,没写“不做什么”和“做到什么程度算好”。
这里有个值得深思的问题:当AI能连续跑几十小时完成复杂任务,我们是否正在从“写代码”转向“写契约”?未来编程的核心竞争力,可能不再是语法熟练度或算法记忆,而是能否用结构化语言精准描述问题域。这其实对架构师和PM的要求更高了——你定义得越模糊,AI输出就越像抽卡。
从行业视角看,这预示着Vibe Coding那种“写一句prompt碰运气”的时代确实在落幕。Codex这类工具的成熟,会把开发者分层:底层是能清晰定义问题的人,上层是依赖模糊描述撞大运的人。前者会像编译器一样高效,后者则会被自动化替代。
讨论问题:你们在实际项目中,如何验证AI生成的代码是否真正满足“定义完成”?有没有踩过定义不清导致AI反复跑偏的坑?