知天下天使轮融资的消息在空间智能圈内引起了一些讨论,特别是其“中国版World Labs”的定位。从技术角度看,高斯泼溅(3DGS)确实是目前三维重建与生成领域中效率较高的方案之一,但距离真正的“世界模型”还有不小的鸿沟。

首先,3DGS的核心优势在于其显式表示和快速渲染,相比NeRF在训练和推理速度上有明显提升。知天下在2024年初就推出了免费的3DGS重建与发布服务,这一点值得肯定,说明团队在工程化上下了功夫。不过,从我个人的落地经验来看,3DGS在复杂动态场景、大规模城市场景的稳定性上仍有不少坑,比如对输入视角密度的敏感度过高,以及内存占用随着点数增长而爆炸的问题。这些细节在学术论文中往往被美化,但实际部署时很容易翻车。

我的观点是,知天下融资后加速世界模型研发的方向是对的,但World Labs的成功不仅在于技术,更在于其与影视、游戏行业的深度结合。如果知天下只是复制3DGS的开源路线,而没有在数据效率、场景泛化性上做出实质突破,很可能陷入“技术Demo好看,落地难用”的困境。

这里抛两个问题供讨论:1)3DGS在自动驾驶场景中,如何解决远距离稀疏视角下的重建精度问题?2)除了NeRF和3DGS,还有哪些三维表示方法可能更适合实时生成型世界模型?

从行业格局看,空间智能赛道正在从学术验证走向商业落地,国内类似知天下的团队如果能解决工程鲁棒性和成本问题,可能比海外竞品更快在游戏和影视领域找到切口。但前提是,不要被资本催熟,先把技术债还清。