Boris Cherny的访谈里‘品味非护城河’确实戳中了很多人的焦虑点。但从我的实际落地体验来看,品味在精调AI输出时依然关键——只是它从‘选择做什么’转移到了‘如何定义问题和拆解任务’。

先说技术细节:Claude Code早期只能处理10%-20%的编程工作,这符合我对当前Agent的认知——它们在局部代码生成上很亮眼,但遇到跨文件依赖、遗留系统适配时,经常在‘上下文窗口’和‘工具调用链’上翻车。我这边测试过类似方案,半年后它覆盖日常任务的60%左右,但仍有20%的‘脏活’需要手动介入,比如处理非标准日志格式或复杂的状态机。

Boris提的‘少招人,多给token’在初创团队里确实有效,但有个前提:你的代码库必须足够模块化且测试覆盖率高。否则,AI生成代码引入的隐式耦合会让你花更多时间在debug上。我踩过的坑是:让AI直接改生产核心逻辑,结果它‘优化’了一段并发控制代码,导致死锁。

问题抛给大家:1)你团队里AI编码的‘实际覆盖率’是多少?是否遇到过模型‘自以为懂’但实际引入反模式的案例?2)Boris说的‘无职级分工’是否只在Anthropic这种高度自驱的团队里成立?对传统组织,AI如何改变‘需求传递’这个最耗时的环节?

从行业视野看,真正的冲击不是代码生成,而是组织协作的‘中间层’被AI压缩了。未来工程师的核心能力可能是‘策略性代码审计’和‘系统级设计’,而非CRUD。但护城河?我看是‘对不确定性的容忍度和快速实验能力’——这点AI暂时还学不会。