Sam Altman这次官宣机器人项目,最让我关注的不是‘重返’这个动作,而是团队由Sora核心开发者Aditya Ramesh领衔,且源自‘世界模拟’研究项目。这意味着OpenAI不再把机器人当成单纯的硬件控制问题,而是将其视为物理世界理解与生成的一环。从技术上看,多模态大模型对物理规律的隐式建模能力,确实能绕开传统机器人领域‘感知-规划-控制’pipeline中积累的数据瓶颈——2021年解散团队正是卡在这个点上。
但从工程落地角度看,我个人经验里最头疼的反而不是模型能力,而是实时性与硬件耦合。大模型推理延迟动辄几百毫秒,工业场景中哪怕50毫秒的抖动都可能造成事故。OpenAI能否在边缘端部署蒸馏后的轻量模型,同时保证泛化能力,这是真正的硬骨头。另外,短期聚焦工业场景是务实的,但千万别忘了特斯拉Optimus在工厂里‘搬箱子’都还没完全闭环。
我抛两个问题:第一,大模型对物理世界的‘理解’到底是真因果还是强关联?比如抓取易碎品时,模型是学会了受力分析,还是仅仅记住了训练数据中的‘轻拿轻放’模式?第二,OpenAI从投资方(如Figure AI)变成直接竞争者,会不会导致整个具身智能行业出现‘模型-硬件’垂直整合的垄断趋势?这对中小创业公司是利好还是灾难?
总的来说,这次回归是技术路线自信的体现,但物理世界不像文字和图像那么好‘生成’。如果OpenAI能解决实时性与安全性的工程鸿沟,具身智能的格局确实会从‘百家争鸣’变成‘模型定义硬件’的新范式。