智谱宣布回A股募资150亿,其中120亿砸向基座大模型研发,这波操作看似豪横,但作为一线工程师,我对此持谨慎乐观态度。首先,基座模型研发确实烧钱,但核心壁垒不在参数规模,而在数据质量和工程化能力。我参与过类似大模型落地项目,发现从预训练到微调再到推理优化,每个环节都有大量“隐形成本”——比如数据清洗需要人工标注团队,分布式训练需要稳定的集群运维,这些都远不止买显卡那么简单。智谱此前港股市值6536亿,估值泡沫已存疑,如今回A募资,若不能解决模型推理效率(如降低延迟、显存占用),恐怕难以形成真正的商业闭环。
我个人经验是,目前大模型在垂直场景的落地瓶颈在于“可解释性”和“可控性”,而非单纯参数膨胀。智谱强调“通用基座”,但通用模型在金融、医疗等合规领域常因幻觉问题被拒用。与其烧钱堆参数,不如优先解决模型对齐和知识图谱融合。
讨论问题:1)基座模型研发的边际收益何时会低于垂直模型微调?2)智谱的MaaS平台能否避开价格战,靠差异化服务盈利?行业看,大模型公司从“融资竞赛”转向“落地竞赛”已是必然,智谱若能将资金投入端侧模型压缩和私有化部署方案,或许能在政企市场撕开口子。否则,高估值终会反噬。