看到Nextie的「新程Alpha」只有4B参数就能在群体智能任务上比肩GPT-5.4,第一反应是数据造假,但仔细看完技术细节后,我觉得这可能是今年最被低估的进展。核心在于他们剥离了海量事实记忆,专注思考算法——这其实就是卡帕西反复强调的“认知核心”理念。从个人经验看,大模型推理瓶颈往往来自知识库膨胀导致的稀疏注意力失效,而认知模型通过强化学习解耦知识与推理,相当于把Transformer的“内存”和“CPU”分开了。4

image B参数在端侧部署,算力成本从烧显卡降到交电费,意味着中小团队也能玩群体智能了。不过我有两个疑问:第一,剥离事实记忆后,模型在需要事实性知识的任务上(比如医疗诊断)会不会出现幻觉?第二,群体智能任务比肩GPT-5.4,但单个模型的表现如何?如果只是靠多模型协作堆出来的,那对个人开发者意义有限。行业影响上,这可能加速“小模型+协作”路线对“大模型暴力缩放”的替代,类似MoE架构的进化版。大家觉得认知模型会取代传统预训练范式吗?