智谱宣布回A股募资150亿,其中120亿砸向基座大模型研发,这个数字让我这个在AI行业摸爬滚打多年的老手都倒吸一口凉气。从技术角度看,基座大模型的研发确实是个无底洞:单次训练成本动辄数千万美元,更别提数据清洗、分布式训练优化、推理加速等配套投入。智谱目前市值6000亿,其GLM系列在中文NLP任务上表现不俗,但与国际顶尖模型如GPT-4或Claude 3相比仍有差距。这120亿若真能落地,意味着他们可能在下代模型架构上押注稀疏化训练或MoE(混合专家)路线,而非单纯堆参数。个人经验看,不少企业融资后研发效率反降,因为资源冗余导致组织臃肿。我好奇的是:智谱如何平衡基础研究与商业化落地?MaaS平台20亿的投入是否足够支撑大模型降本增效?从行业格局看,此举可能加速国内大模型“军备竞赛”,但若研发成果无法突破算力瓶颈,高投入只会加剧估值泡沫。

技术分析 #实践经验