300美元跑通世界模型，具身智能断线起飞

具身智能领域迎来一个里程碑式的转折。X-Era Lab（拓元智慧）与星宸科技联手，将自研的世界动作模型VWA成功部署到指甲盖大小的端侧芯片上，实现了从感知到控制的完整闭环。这相当于给机器人剪断了那根永远拴在云端的线——过去，一个倾倒的杯子、一场骤雨就足以让机器人崩溃，因为真实世界等不起信号往返云端的延迟。现在，机器人第一次真正拥有了自己的“大脑”，能够自主决策，不再依赖远程指令。

这一突破背后是技术路径的根本性变革。传统的云端方案依赖VLA或多模态大模型，但语言模态的表征存在本质缺陷——你问机器人水瓶距离多远，它能答“大概三十厘米”，实际误差可能高达数倍。而视频生成模型停留在2D像素空间，对真实3D世界的刻画力不从心。X-Era Lab的VWA模型从设计之初就为端侧而生，而非事后裁剪。它直接在芯片上完成“感知-预测-控制”全链路，延迟从秒级降至毫秒级，在工业场景中实现亚毫米级精密放置，家庭场景中几十公斤机器人的动作响应也足够安全。

成本是另一大杀手锏。相比英伟达Thor-U芯片动辄3000多美元的方案，X-Era Lab将成本砍到两三百美元级别，降幅超过90%。这不仅仅是硬件成本优势，更关乎商业模式的根本变革。云端方案按Token使用量收费，但世界模型处理多传感器、多模态数据所需的Token量远超大语言模型，一台机器人售价二十万，其生命周期内消耗的Token可能是个天文数字，导致厂商看不到利润空间，客户估不准落地成本。把模型放到端侧，成本变成一次性买断的确定性支出，正如X-Era Lab CTO陈添水所言：“芯片装上去，怎么用都是那个成本。”

隐私问题同样在推动这一趋势。世界模型持续处理大量视觉与空间信息——家里长什么样、生产线在做什么，这些数据远比文本敏感。一旦必须上传云端，许多场景从一开始就不会敞开大门。延迟、带宽、成本、隐私，四重压力共同指向同一个答案：世界模型必须走到端侧。这不再是选择题，而是必答题。X-Era Lab的实践表明，只要模型从娘胎里为端侧而生，就能在指甲盖芯片上跑出可靠的世界模型。未来，具身智能的商业化落地将不再受制于云端束缚，而是像鸟一样，真正飞在自己的翅膀上。

300美元跑通世界模型，具身智能断线起飞

相关推荐

Claude Fable 5安全防线72小时被攻破

月之暗面发布Kimi K2.7 Code，编程Token消耗直降30%

YouMind 1.0发布：打破AI创作同质化困局

Claude Fable 5安全防线72小时被攻破

月之暗面发布Kimi K2.7 Code，编程Token消耗直降30%