看到MiniMax这篇Agent架构揭秘,最让我震撼的不是那个Agent Team的Leader-Worker-Verifier对抗式设计,而是Claude Code泄露的数据:仅有1.6%属于模型决策,其余98.4%是权限、上下文管理和容错脚手架。这个数字如果属实,意味着我们过去一年狂吹的‘模型能力决定Agent上限’可能完全搞反了方向。
从我个人的实践来看,确实如此。之前在做金融领域的自动化交易Agent时,模型选对了,但频繁因为上下文污染导致决策漂移,最后花了两周时间写状态隔离和异常回滚的脚手架才稳住。MiniMax说的‘相信模型但合理约束’,本质上是对当前大模型脆弱性的务实妥协。他们不等旗舰模型M3就先行发布,更像是一种市场策略:抢先在认知层面输出标准,让行业接受‘Agent的瓶颈不在模型推理而在工程落地’这个观点。
不过这里有个值得深挖的问题:如果98.4%都是非模型逻辑,那这套架构的可迁移性如何?换个模型(比如换成开源7B模型)是不是得重写大部分脚手架?另外,Leader-Worker-Verifier的对抗式设计,会不会在长程任务中因为‘过度验证’反而增加延迟?
从行业格局看,这其实在暗示一个趋势:Agent的竞争正在从‘模型军备竞赛’转向‘工程框架标准化’。那些能率先定义权限管理、上下文隔离和容错模式的团队,可能比单纯堆算力的团队更早吃到红利。大家觉得,未来Agent开发会不会变成像写微服务一样——核心是编排而非模型调优?