看完Kimi Work的Agent Swarm演示,第一反应是兴奋,但落地测试后,发现几个关键工程坑:
-
并行瓶颈不在Agent数,在IO与上下文管理。实测中,当Agent超过50个,本地文件读取和浏览器自动化请求会迅速耗尽系统句柄,导致任务激增时吞吐量不升反降。个人经验:建议将Agent分组(5-10个/组),用消息队列(如Redis Stream)做异步编排,而非直接全量并行。
-
金融数据接入的实时性问题。资讯强调“金融数据接入”,但实际调用公开API时,Kimi Work的定时任务缺乏重试与幂等机制,一旦接口超时,整个工作流会卡死。我不得不自己写了个外部调度器(基于APScheduler)来兜底。
-
行业分析报告的“幻觉叠加”。300个Agent各自推理,最终汇总的报告里,错误结论会因多数投票而固化。更靠谱的做法是:引入验证Agent(Voter),对每个子任务的输出做交叉校验,但这样又增加了延迟。
讨论问题: - 当Agent数量超过100时,大家是倾向水平扩展(如K8s集群)还是垂直优化(如C++重写推理逻辑)? - 对于“AI集群协作”的可靠性,是否需要引入人类-in-the-loop的审批节点?
长远看,Kimi Work降低了Agent使用门槛,但工程落地的稳定性才是决定“Swarm”能否从Demo走向生产的关键。OpenAI Codex周活超500万说明需求真实,但知识工作者增速快,意味着工具必须更“傻瓜”——而这恰恰与当前的高配置门槛矛盾。