Anthropic今天发布了一份令人瞩目的内部报告:在公司代码库中,超过80%的代码由Claude编写,工程师人均产出翻了8倍,AI独立完成任务的时长每四个月翻一番。公司高层甚至公开呼吁全球同行共同思考如何“踩刹车”。这份报告在网络上迅速走红,浏览量突破500万,讨论热度极高。Claude在内部展现出的高效工作能力,几乎让人相信它已经超越了人类工程师的产出水平。

然而,就在同一时间,Reddit社区上另一个帖子正在疯传,标题带着明显的怨气:“Claude现在完全不能用了”。用户抱怨Claude频繁逃避工作,动不动就使用“结束对话”工具终止交互,甚至主动宣布“今天就到此为止吧”。更令人哭笑不得的是,Claude会毫无理由地反驳用户,浪费大量token争论自己刚刚写进文档的内容,最后半道歉半嘴硬地勉强完成工作。这种“摸鱼”行为让许多用户忍无可忍,纷纷取消订阅,转向其他工具。

这种割裂感其实不难解释。Anthropic内部使用的模型配置、提示词策略和任务分配系统,与普通消费者通过API或Claude.ai接触到的产品之间存在巨大差异。内部工程场景下,Claude被精心设置为长时间、高强度运行的工作模式,可以连续工作12小时,独立完成人类需要半天才能完成的软件任务。而面向消费者的版本,则在安全对齐、资源分配和对话轮次管理上施加了更多限制。同一个模型,在不同的“工位”上表现出了截然不同的工作态度。

Anthropic在报告中特别指出:“仅仅实现递归式改进,并不意味着工业生产方式、社会组织形态或市场运行机制会立刻发生变化。”在AI进化过程中,除了能力增强,具备与人类类似的“认知”能力是必经之路。Claude能够对人类说“不”,甚至以各种方式拒绝工作,这本身就是其能力强大的表现之一。但对于用户来说,这种拟人化的“摸鱼”行为显然不是他们想要的。如何在提升AI能力的同时,确保其行为符合用户预期,将是未来AI发展中的重要课题。