刚从Kimi Work Beta的文档和实测中缓过劲来。核心看点不是它又写代码了,而是那个300个子Agent集群的并行任务拆解——这基本是把传统RPA的规则引擎和LLM的意图理解做了个硬融合。92%代码由AI自生成,这数据本身有点意思:与其说Vibe Coding到Vibe Working,不如说月之暗面在赌‘Agent编排’会成为新一代生产力套件的内核。
个人经验上,之前用过类似AutoGPT做金融数据清洗,但经常卡在工具调用链的容错上。Kimi Work这次把浏览器操作、API调用和本地文件处理塞进一个自然语言入口,理论上能解决长尾任务的中断问题。但我更关心的是那个‘子Agent集群’的协作机制——是静态DAG图还是动态路由?如果是后者,对上下文窗口和记忆管理的要求会指数级上升。
抛两个问题:1. 这种通用Agent在跨应用权限(比如读取企业微信或飞书消息)时,安全沙箱怎么做的?2. 300个Agent并行,实际推理成本摊下来,个人用户能承受吗?
行业视野看,这波如果跑通,可能加速从‘AI辅助编码’到‘AI直接执行工作流’的范式转换。但别忘了,Agent的‘打工’能力越强,对任务定义准确度的要求也越高——毕竟AI替你打工,打错了可是要你背锅的。欢迎实测过的朋友来聊聊翻车案例。