在具身智能领域,当大多数公司还在追逐大模型和数据堆砌时,一家名为橡木果机器人的初创公司却选择了截然不同的道路。由9名清华博士组成的核心团队,基于创始人姜峣在哈佛认知实验室的研究,提出一个颠覆性观点:机器人操作应该像人类一样,拥有“本能”。这种本能无需数据训练,仅靠底层机制就能让机器人完成抓取等基本动作,直接挑战当前主流的VLA和世界模型路线。
姜峣的灵感源于对人类行为的长期观察。他在哈佛认知实验室发现,语言和操作是两种完全不同的智能:语言依赖后天环境,而操作行为却高度一致,无论年龄、文化如何,人类抓取物体的方式几乎相同。他将这种先天机制称为“本能”。团队将机器人操作拆分为任务规划和操作执行两个层次,前者依赖知识,后者则基于本能。与主流路线不同,他们不试图用端到端的大模型统一处理视觉、语言和动作,而是先赋予机器人一套类似人类的底层机制,再让技能从交互中自然生长。过去一年,VLA和世界模型的发展瓶颈——如数据需求无限增长、算力成本高企——似乎验证了他们的判断。
技术细节上,团队强调“操作一定要自下而上”。他们通过模拟人类的触觉和视觉感知,设计出无需数据即可执行的抓取算法。例如,在实验中,机器人能像人类一样自动调整抓取角度,即使传感器被干扰。这种机制避免了传统方法中“无限堆数据、堆算力”的困境。姜峣指出,语言可以自上而下,但操作必须适应具体的物理硬件,而用海量数据去拟合无尽物理差异并不健康。这一路线虽非主流,却可能为具身智能的产业化提供更高效的路径。
展望未来,橡木果机器人的路线若被验证可行,将重新定义机器人学习范式。对于AI从业者而言,这提醒我们:在追求大模型的同时,不应忽视底层机制的研究。具身智能的瓶颈或许不在于数据量,而在于对物理世界的理解深度。团队计划进一步优化本能机制,并探索其在工业场景的应用。对于技术社区,这是一个值得关注的信号:有时,回归本能才是真正的创新。