云知声发布原生Agent大模型U2，小参数撬动高性能

国产大模型赛道再添重磅玩家。今天，被誉为“港股AGI第一股”的云知声正式发布其自研通用大语言模型U2，这款模型基于快慢思考融合的MoE（混合专家）范式构建，一改传统大模型盲目堆参数、堆Token的内卷做法，实现了“小参数强能力、少Token高产出、低算力低成本”的突破性进化。这一发布不仅为AI从业者提供了新的技术选择，更可能重新定义大模型竞争的游戏规则。U2的核心创新在于其快慢思考融合机制。传统MoE模型通常依赖大量专家模块和庞大参数来提升性能，但U2通过引入类似人类认知的“快思考”与“慢思考”双系统，在保持模型能力的同时大幅降低了计算开销。具体来说，U2在处理简单任务时启用快速路径，仅需少量计算资源即可完成；面对复杂推理时则切换至深度路径，调用更多专家模块进行精细分析。这种设计使得U2在多项中文NLP基准测试中，以低于同级别模型30%的参数量，实现了与之相当甚至更优的准确率。例如，在C-Eval和MMLU等评测中，U2的得分分别达到78.5和72.3，接近GPT-4水平，但推理成本仅为后者的三分之一。从行业影响来看，U2的发布恰逢大模型应用从“炫技”走向“落地”的关键期。过去一年，许多企业因大模型高昂的部署成本和算力需求而望而却步，U2的低成本特性直接回应了这一痛点。云知声表示，U2的API调用价格仅为0.5元/百万Token，较主流模型降低近60%，同时支持私有化部署，企业可在单张A100显卡上完成推理。这意味着中小企业和垂直场景开发者也能以可负担的成本接入先进AI能力。此外，U2原生集成了Agent功能，可自主调用工具、执行多步任务，在智能客服、办公自动化等场景中展现出高效协同能力。对于AI从业者而言，U2的出现提供了一个值得关注的参考方向：大模型竞争不再唯参数论，而是转向效率与实用性的博弈。云知声作为港股AGI第一股，其技术路径的差异化选择，可能带动更多厂商探索类似MoE变体架构。未来，随着U2在金融、医疗、教育等领域的落地，我们有望看到更多“小模型大智慧”的应用案例。建议开发者重点关注其开源计划与生态合作动态，提前布局基于U2的Agent应用开发，以抢占下一波AI工具化浪潮的先机。

云知声发布原生Agent大模型U2，小参数撬动高性能

相关推荐

Claude Fable 5安全防线72小时被攻破

月之暗面发布Kimi K2.7 Code，编程Token消耗直降30%

YouMind 1.0发布：打破AI创作同质化困局

Claude Fable 5安全防线72小时被攻破

月之暗面发布Kimi K2.7 Code，编程Token消耗直降30%