智谱宣布回A股募资150亿,其中120亿砸向基座大模型研发。从一线工程师视角看,这笔钱能否解决实际落地中的‘算力-数据-推理’三角难题才是关键。基座模型研发确实烧钱,但智谱在港股市值已超6000亿港元,说明市场对其技术路线有认可。然而,我在实际部署智谱GLM-4时发现,尽管模型在通用任务上表现优异,但在垂直场景(如金融风控)中仍需大量微调,且推理延迟较高。这让我质疑:120亿研发资金会
否过于侧重预训练,而忽视工程优化?比如,能否通过稀疏化或量化技术降低部署成本?行业趋势上,大模型公司从‘融资-烧钱’转向‘上市-募资’,说明资本更看重商业化闭环。但智谱若不能解决模型落地时的显存瓶颈(如长上下文推理),这笔募资可能只是延缓而非解决根本问题。讨论:1)基座模型研发与工程优化的投入比例应如何分配?2)大模型公司上市后,研发效率会提升还是因财报压力而缩水?期待实战派分享经验。