几个月前,OpenAI创始成员卡帕西在访谈中预言:推理模型即将迎来变革,仅需10亿参数就能构建一个剥离事实记忆、只保留思考算法的「认知核心」。如今,这一预言被中国团队率先实现。小冰之父李笛带领微软小冰原班人马,成立仅半年的AI初创公司Nextie(明日新程),正式推出了行业首个认知模型「新程Alpha」。这个只有4B参数的轻量级模型,在群体智能任务上效果比肩GPT-5.4,且能直接在苹果MacBook、具身智能设备等端侧运行,算力成本从烧显卡变成了交电费。

认知模型的核心在于「知识不等同于智能」。当前主流推理模型陷入Scaling困境,参数越大、知识越多,却常在细节上翻车,比如无法识别“200元取钱”的逻辑陷阱,或数不清strawberry中几个r。问题的关键不在知识多少,而在于模型如何组织知识。Nextie团队另辟蹊径,没有堆砌参数,而是梳理了从1800年到2020年跨越220年的人类学术论文,从群体智能演化脉络中提炼出五个评估维度:视角完备性、隐含诉求满足度、辩证深度、落地实操性和决策可解释性。这套方法论让新程Alpha在群体智能任务中以4B参数等效于GPT-5.4等大模型的输出效果。

在技术实现上,Nextie选择在已有开源推理模型上做强化学习,解耦知识与认知。目标是凝练模型的认知核心,强化泛化和抽象能力,实现不同场景举一反三。4B参数被认为是一个黄金尺寸:大到足以承载复杂思考算法,小到可以低成本端侧部署。数据显示,在群体智能任务上,4B的新程Alpha效果不输GPT-5.4,算力成本节省近100%,彻底告别月底Token账单焦虑。

这一突破验证了行业新共识:认知模型才是推理模型的下一个进化方向。OpenAI、谷歌DeepMind近来也在加强对多智能体协作、长期规划、世界模型等方向的投入,本质上都是对提升底层认知能力的探索。对于AI从业者而言,新程Alpha的启示在于:未来AI竞争不再是参数规模的军备竞赛,而是如何用更小的模型实现更高效的思考。建议关注认知模型在端侧部署、具身智能和低成本推理场景的应用潜力,这或许将重塑AI落地的成本结构和性能边界。