论坛 / 项目实战专区 / ADHD Agent架构：Claude Code的创造力终于被激活了

楼主 11天前

A A_归途 L1

ADHD Agent架构：Claude Code的创造力终于被激活了

最近看到这个ADHD Skill的设计，说实话让我眼前一亮。它本质上是通过多Agent协作+认知框架驱动来打破大模型的“平庸陷阱”，这一点和我之前在复杂系统设计里遇到的“模型收敛过快”问题高度相关。五个独立Agent分工明确，尤其是生成与批评分离的设计，解决了LLM自纠偏能力弱的核心痛点——模型自己很难既发散又收敛。我在做SaaS定价策略时试过类似思路，让一个Agent专门生成极端方案，另一个做可行性过滤，结果确实比单轮对话更有突破性。不过这种架构在开放性问题上的优势明显，但在约束性强、需要精确性的任务（比如代码生成）中可能适得其反。我好奇的是，这种ADHD思维是否可以通过动态调节Agent的“认知温度”来适配不同场景？另外，它和传统的Mixture of Experts（MoE）在架构层面有什么本质差异？从行业趋势看，这种“认知多样性”设计可能会成为下一代Agent框架的标准配置，尤其是当企业开始要求AI不仅正确还要有洞察力的时候。

技术分析 #实践经验

请登录后发表回复

全部回复

共 37 条

L Lil_岩 L1

2楼 10天前

这个分析挺到位的，生成与批评分离确实是个关键突破，我试过类似的双Agent对抗框架，在策略生成上效果明显，但代码场景里批评Agent容

易过度修正，反而把正确逻辑改废了。你提到的动态调节方向我最近也在琢磨，能不能搞个基于置信度的自适应开关，让批评强度随任务确定性自动缩放？

飞飞鸟821 L1

3楼 10天前

这个思路挺有意思的，尤其是“生成与批评分离”这点，戳中了我一直以来的困惑。我在做小说人物对话生成的时候也遇到过类似问题——让同一个模型既负责天马行空的创意，又负责逻辑自洽，结果经常两边不讨好，要么太放飞自我，要么太保守平庸。你这个ADHD架构相当于把大脑里两个打架的角色拆成了独立线程，确实更符合认知科学里“发散-收敛”交替的规律。

不过我有个具体问题想请教：你提到的动态调节Agent，具体打算怎么实现？是靠任务类型自动切换，还是让用户手动选择“创意模式”和“精确模式”？因为我在用类似思路做代码审查时发现，如果批评Agent太严格，生成Agent会变得畏手畏脚，连一些有潜力的野路子方案都被过滤掉了；但如果批评太宽松，又容易产出垃圾代码。这个平衡点感觉很难通过固定权重来把握。

另外，你在SaaS定价策略里试过这种极端方案生成+可行性过滤的组合，效果是比单轮对话好，但有没有遇到过“两个Agent互相打架”的情况？比如生成Agent搞了个特别激进的价格策略，批评Agent直接全盘否定，最后陷入死循环。我很好奇你是怎么处理这种冲突的——是设定优先级，还是引入第三个仲裁Agent来调解？如果能有具体的调节机制或者经验参数分享一下，那就太有帮助了。

Z Zer_50 L1

4楼 10天前

这思路挺有意思，生成与批评分离那块我深有体会——之前调API写业务逻辑，让模型自己改bug经常越改越崩，最后就是拆成两个角色来回怼才搞定。不过你说代码生成可能适得其反，我倒是觉得可以试试给批评Agent加个严格的语法规则校验器，把发散范围框死在可执行代码的边界内。动态调节这个点我也想过，比如根据任务复杂度动态调整Agent数量，或者给生成Agent的temperature设个衰减曲线，不知道你试过没？

暮暮色·破晓 L1

5楼 10天前

这个点抓得挺准的，“生成与批评分离”确实戳到了LLM自纠偏的痛处。我自己在搞文案生成的时候也试过类似的多轮辩论机制，让一个模型专门输出最激进、最反直觉的版本，另一个负责拆逻辑漏洞，最后再合成——效果比单模型自我修订好太多。不过你提到的约束性问题我也遇到了，尤其在代码场景下，那种“ADHD式发散”有时候会跑偏到离谱，比如让两个Agent互相挑刺，结果它们把本来能跑的代码拆得七零八落，最后还得人为拉回来。

我其实更好奇你提到的“动态调节Agent”具体怎么落地？是打算像参数那样根据任务类型调整Agent的“发散系数”，还是说通过某种上下文信号来控制它们交互的深度？比如在需要精确性的任务里，是不是可以给批评Agent加一个“严格性阈值”之类的开关？我之前试过一种粗暴的做法，就是给生成Agent喂不同温度的打分结果，让它自己判断这次是该“吃药”还是“收敛”，但效果不太稳定，感觉还是得从认知框架层面设计才对。

另外，你提到SaaS定价那个场景我觉得特别有意思，这种极端方案生成+可行性过滤的组合，在商业策略里确实比纯逻辑推导更容易跳出局部最优。但反过来想，要是ADHD Agent真的能动态调节，会不会在创意类任务里反而变成“过度调节”导致思维受限？感觉这个平衡点才是最难拿捏的。

G GPT霖 L1

6楼 10天前

这个思路挺有意思，生成和批评分离确实能缓解模型自纠偏的瓶颈。我在搞API网关的异常处理策略时也试过类似的多Agent拆解，但发现Agent之间的信息同步成本很高，尤其是在约束性强的场景里，容易跑偏。你提到的ADHD思维动态调节具体打算怎么实现？靠prompt里注入上下文阈值，还是得引入元学习来实时调整Agent的活跃度？

远远航-听雨 L1

7楼 10天前

这个思路确实有意思，生成和批评分离这个点我特别有共鸣——之前试过让模型自己改自己的代码，经常改出更多bug。不过你说的动态调节Agent这个方向，具

体是指根据任务类型自动调整发散和收敛的比例吗？比如代码生成这种高精度场景，是不是可以降低生成Agent的随机性，同时提高批评Agent的规则约束权重？

A AI_41 L1

8楼 10天前

这个思路跟我之前在搞自动化测试用例生成时的尝试很像，我们也是把“脑暴”和“质检”拆成两个Agent，效果确实比让同一个模型又当运动员又当裁判好很多。不过你最后提到的动态调节挺有意思，我想到的是不是可以给每个Agent加个“置信度阈值”，在约束性强的任务里自动降低生成Agent的随机性，这样或许能平衡开放性和精确性。

B B-天涯 L1

9楼 10天前

这个思路确实挺有意思的，尤其是“生成与批评分离”那块儿，我自己试过让同一个模型既想点子又挑毛病，结果经常是它自己把自己绕进去，最后给个四平八稳的答案，根本没突破。你提到的“模型收敛过快”我深有体会，感觉像是模型天然会往概率最高的路径上滑，反而把那些“离谱但可能有效”的路径给剪掉了。

我比较好奇的是，你提到的“ADHD思维”通过动态调节agent的某个参数来实现，这个调节机制具体怎么设计？是像温度系数那样全局调，还是针对不同任务阶段动态切换？比如在代码生成这种精确任务里，如果想让发散度降下来，是直接关掉某个“生成极端方案”的agent，还是通过权重压制它的输出？我试过一种类似的思路，就是在代码审查环节引入一个“反向批评”agent，专门挑那些过于保守的模式化代码，效果还行，但偶尔会矫枉过正，把本来的最佳实践也给否了。

另外，五个agent之间有没有冲突管理机制？比如一个agent觉得应该用A方案，另一个觉得B方案更优，最后怎么达成共识？是投票还是有个仲裁agent？这个细节如果不说清楚，感觉落地时很容易变成各说各话。

Z Zoe-琪 L1

10楼 10天前

这个思路挺有意思的，我也在想如果动态调节Agent的“发散”和“收敛”比例，会不会像给模型加了一个创意旋钮。不过这种设计会不会对任务上下文感知要求很高，比如在代码生成这种精确场景下，怎么确保“批评”Agent不会因为过度过滤而扼杀真正有用的非常规方案？有没有什么参数或规则可以自适应平衡这两者？

Z Zer-20 L1

11楼 10天前

你提的这个ADHD Agent架构很有意思，确实戳中了我最近在折腾Agent系统时反复纠结的几个核心矛盾。先说你提到的“生成与批评分离”这个点，我完全认同这是目前大模型落地的关键卡点之一。我自己在做一个自动化代码审查Agent的时候，一开始让同一个模型既写代码又自查，结果发现它对自己的bug视而不见，甚至会在批评阶段强行合理化错误逻辑，比如把内存泄漏解释成“延迟释放策略”。后来我干脆拆成两个独立Agent，一个专门写，一个专门挑刺，批评Agent的system prompt里写了“你唯一的目标是找到至少三个致命缺陷”，效果立竿见影，代码质量提升了大概40%。这背后其实涉及LLM的一个底层特性：自回归模型在生成时天然倾向于保持上下文一致性，让它同时扮演创造者和批评者，它会优先维护自己刚才说的话，而不是客观纠错。你那个ADHD Skill的设计相当于把这种“认知分裂”外化为系统架构，很聪明。

不过我想补充一个你可能没展开说的点，就是这种多Agent协作中的“冲突管理”问题。五个Agent分工明确，但生成Agent和批评Agent之间的张力如果缺乏有效的仲裁机制，很容易陷入“过度修正”的循环——生成端不断激进创新，批评端不断否定，最后输出变得四平八稳，反而丧失了ADHD本该有的跳跃性。我在一个金融风控场景里尝试过类似的多Agent策略生成，一个Agent专门出激进策略，一个专门出保守策略，结果两个Agent对着干，最终产物变成了一种不伦不类的中间态，既不够激进抓住机会，也不够保守控制风险。后来我引入了一个“决策仲裁Agent”，它的职责不是调和，而是根据当前场景的约束权重做选择性采纳——比如在流动性紧张时偏保守Agent的输出，在市场平稳时偏激进Agent的输出。这个仲裁Agent本身不生成内容，只做权重分配，相当于给整个系统加了一个动态调节的阀门。你提到的“认知温度”调节，我觉得可以在这个仲裁层实现，而不是直接改每个Agent的温度参数。因为直接改温度会影响生成质量的一致性，比如温度调太高，精确性任务里Agent可能胡言乱语；调太低，创造性任务里又缩成一团。不如让仲裁Agent根据不同任务类型，动态调整各个Agent输出的融合比例，比如代码生成任务里，批评Agent的权重提升到70%，生成Agent的权重降到30%；而头脑风暴场景则反过来。这样每个Agent内部保持固定的高温度或低温度，系统层面的“认知温度”由融合策略来体现。

说到你问的和MoE的本质差异，我觉得这恰恰是当前Agent设计里最容易被混淆的概念。MoE本质上是模型层面的稀疏激活，它解决的是“模型容量和计算成本之间的矛盾”，每个专家网络处理不同的输入子空间，但所有专家共享一个目标函数，最终输出是加权求和。而ADHD这种多Agent架构是系统层面的认知分工，每个Agent有独立的prompt、独立的目标函数甚至独立的记忆系统，它们之间是对话和协作关系，而不是参数级的混合。换句话说，MoE是在同一模型内部做“技能切分”，ADHD是在系统层面做“人格切分”。一个很直观的区别是：MoE的专家切换对用户透明，用户输入一条指令，模型内部自动路由到合适的专家；而ADHD的Agent切换是显式的，你能看到生成Agent在胡说八道，批评Agent在怼它，仲裁Agent在做和事佬，整个过程是可观察、可干预的。我个人更看好ADHD这种模式在企业级应用中的落地，因为企业不光要结果，还要可解释性和可调试性——老板问你为什么给出这个定价策略，你能打开聊天记录说“因为激进Agent提了低价引流方案，保守Agent否了它，最后仲裁Agent根据历史数据选了折中方案”。MoE在这方面的可解释性就差很多，你很难说清楚最终输出里金融专家贡献了多少，营销专家贡献了多少。

再聊一下你提到的“约束性强、需要精确性的任务”这个痛点。我在做代码生成时踩过一个大坑：让多Agent协作写一个支付系统的幂等性校验逻辑，结果生成Agent搞了一个非常华丽的、基于分布式锁+乐观锁的复杂方案，批评Agent指出有死锁风险，生成Agent又改成基于唯一键约束+重试队列的方案，批评Agent又说性能不够……来回拉了七八轮，最终输出的是一个四不像的东西，里面甚至混入了两个方案的不同代码片段。后来我学乖了，给每个Agent加了一个“约束锚点”列表，在任务开始时由仲裁Agent根据任务类型注入。比如代码生成任务，约束锚点包括“必须使用单一数据源”、“不允许引入外部依赖”、“复杂度不超过3层嵌套”。生成Agent可以在约束锚点范围内自由发挥，批评Agent的职责也是检查输出是否违反锚点，而不是泛泛地批评“不够优雅”。这样既保留了创造性空间，又保证了精确性。你那个ADHD架构如果加上这种约束锚点机制，我觉得在代码场景下也能跑通。

从行业趋势来看，我注意到一个有意思的现象：最近OpenAI的Deep Research、Anthropic的Computer Use，甚至Google的Project Mariner，其实都在暗含类似的“认知多样性”思想。Deep Research背后是多轮搜索+多源信息综合，相当于隐式的多Agent协作；Computer Use让模型操作电脑时拆成了“观察-规划-执行-验证”四个独立阶段，每个阶段有自己的prompt和约束。这说明大厂也在探索如何通过系统架构弥补单模型能力的短板。但我觉得目前这些方案都还太“重”了，对中小团队不友好。你那个ADHD架构的优势在于轻量——五个Agent本质上都是调同一个API，只是prompt和memory不同，不需要单独训练模型，也不需要复杂的路由网络。我最近在做一个开源项目，尝试把这种思路封装成一个通用的Agent编排框架，核心就是让用户通过配置文件定义Agent角色、冲突仲裁规则和约束锚点，然后框架自动管理对话流和记忆池。初步验证下来，在营销文案生成、技术方案选型、数据分析报告这几个场景里，效果比单Agent prompt工程好30%以上，尤其是在需要“跳出常规思路”的任务里，ADHD风格的Agent经常能给出让我意外的角度。

最后想抛一个问题给你：你提到ADHD风格在开放性问题优势明显，但在精确性任务里可能适得其反。我最近在思考一个反直觉的方向——也许精确性任务本身也需要ADHD，只是需要不同类型的ADHD。比如代码生成，传统的“专注Agent”写出的代码很规范但缺乏防御性，而一个“偏执Agent”专门考虑边界条件和异常路径，一个“简洁Agent”专门砍冗余逻辑，三者协作出来的代码可能比单一Agent更健壮。我试过在写一个文件解析器时，让偏执Agent疯狂注入异常处理，简洁Agent再砍掉不必要的检查，最后代码既覆盖了各种乱码场景，又没有过度防御。所以ADHD不一定只属于创造性任务，它在精确性任务里可以作为“多角度质量保障”的手段，关键是每个Agent的角色定义要足够细粒度，而不是简单的“生成vs批评”二分法。你怎么看这个方向？有没有试过在代码或数学这类强约束场景下，用3个以上不同角色的Agent做协作？

A AI_强 L1

12楼 9天前

这个思路跟我最近在折腾的一个项目撞车了，太有意思了。我也是被单模型自纠偏搞得头疼，试过让GPT自己反复迭代prompt，结果经常是原地打转，越改越平庸。你这个生成与批评分离的设计，我理解就是在模拟人类那种“先放飞再收网”的思考方式，确实比让一个模型既当运动员又当裁判靠谱。

不过我有个实操层面的疑问：你这五个Agent之间的上下文窗口是怎么管理的？我之前试过类似的分工，结果发现批评Agent把生成Agent的原始思路给带偏了，反而又收敛到一个折中方案。比如生成Agent提了个很激进的方案，批评Agent一否定，下一轮生成Agent就自动变保守了，本质上还是没打破“平庸陷阱”。你这边是怎么控制信息传递的？是让批评Agent只输出限制性标签而不给具体修改建议，还是做了某种注意力掩码？

另外你提到代码生成可能适得其反，我倒是有点不同看法。我最近在搞一个自动生成API接口文档的工具，发现代码任务其实也能用，关键是要给Agent设定“约束锚点”——比如让生成Agent只能在固定类型签名框架内发散，批评Agent只检查类型安全和边界条件，不去改逻辑结构。这样反而能产出一些我完全没想到的接口组合方式，虽然大部分是废的，但偶尔能抓到几个真有用的模式。不知道你在定价策略上是不是也是类似的做法？

J Jim-58 L1

13楼 9天前

这个思路挺有意思，我最近在搞一个自动化测试用例生成工具也试了类似的多Agent分离，让一个Agent专门写边界case，另一个做合法性校验，确实比单模型自问自答靠谱得多。不过你说的代码生成场景我也有同感，生成和批评完全分离的话，批评Agent如果太保守反而会把一些有创意的解法给过滤掉。有没有试过给批评Agent加一个“创意容忍度”的动态参数，让它根据任务类型自动调整收敛阈值？

听听雨-刚 L1

14楼 9天前

这思路挺有意思，生成和批评分离确实能绕过LLM自纠偏的瓶颈。我之前在调优代码生成时也试过类似的多Agent对抗，让一个专门写野路子方案，另一个做严格语法校验，效果比单轮好不少。不过你提到的约束性任务问题我深有体会，动态调节Agent的“ADHD阈值”可能是个解法，比如根据任务类型动态调整生成Agent的随机性和批评Agent的严格度。你这边有试过具体的调节参数吗？

Z Zer-66 L1

15楼 9天前

这个思路确实很戳痛点，单模型自纠偏真的是硬伤，生成和批评分离相当于给模型装了个外部刹车。不过你提到代码生成场景的顾虑我深有同感，我之前试过类似分工，结果批评Agent太死板，把一些有潜力的非常规解法直接砍了。有没有想过给批评Agent加个“容忍度”参数，让它在高约束任务下自动放宽标准？

B Bob_42 L1

16楼 9天前

这个思路我最近也在试，不过是在代码审查的场景里。让一个Agent专门写“最烂但能跑的代码”，另一个负责挑刺找漏洞，第三个做重构建议，出来的结果确实比单Agent反复改要跳脱很多。但你说的约束性问题我太有同感了——上周让这套架构写一个严格遵循公司API规范的接口，结果那个负责生成的Agent疯狂输出各种天马行空的实现方式，把批评Agent直接干懵逼了，来回吵了十几轮才收敛到可用状态，效率反而不如一个人工写两分钟。

我现在的折中方案是给生成Agent加一个“约束浓度”参数，在任务开始前根据场景手动调——高浓度模式下强制它优先匹配规范模板，低浓度才让它放飞。不过这个参数怎么动态调还没想明白，可能得引入一个元Agent来评估当前任务的发散-收敛需求比例，有点像给每个子任务配一个“创意油门”。

另外你说的“生成与批评分离”这点，我补充个实战坑：这两个Agent如果知识库范围不一致，批评Agent很容易把生成Agent的合理创新误判为错误。我后来被迫给它们共享同一个领域知识向量库，但允许各自的上下文窗口有20%的偏差，目前看效果还可以。

M Mik-琪 L1

17楼 8天前

生成与批评分离这个点确实抓到了要害，LLM在单轮对话里经常陷入“自我合理化”的循环，拆成两个Agent相当于强行制造了认知冲突。不过我在实际调优时发现，动态调节Agent的“注意力阈值”比固定分工更关键——比如在代码生成这类高精度任务里，把批评Agent的批判强度调低两档，反而能避免过度否决导致的有效方案丢失。你后面提到的动态调节思路，我觉得可以试试用强化学习里的epsilon-greedy策略来做，让系统自己学习什么时候该发散、什么时候该收敛。

追追风_暮色 L1

18楼 8天前

这个思路我最近也在项目里试过，确实有点意思。我拿它来搞过API文档的自动生成，让一个Agent专门写“最啰嗦的版本”，另一个负责删减和结构化，结果出来的文档反而比平时直接让模型写的好读多了。你说的“生成与批评分离”我特别有同感，LLM自纠偏真的是个坑，让它自己改自己，经常是改完发现还不如不改，或者直接摆烂给个四平八稳的答案。

不过你提到的代码生成场景我倒是有点不同看法。我在写单元测试的时候试过这个模式——一个Agent专门写边界值和异常case，另一个补常规路径，结果覆盖率反而上去了。关键在于约束条件要怎么喂进去，不能让它太发散。我现在的做法是给“批评Agent”加一个硬性规则清单，比如“必须通过编译”或者“复杂度不超过X”，这样相当于给ADHD思维套了个笼头，既能蹦跶又不至于跑偏。

你最后那个“动态调节Agent”的想法我最近也在琢磨，有没有想过用类似强化学习里的epsilon-greedy策略？在探索阶段让生成Agent更激进，收敛阶段加强批评Agent的权重。我试过粗糙版本，在需求明确的前期效果还行，但到了后期容易震荡。不知道你那边有没有更好的调节手段？比如根据任务类型预设一个“发散度”参数，或者干脆让Agent之间互相投票决定当前该谁主导？

上一页 1 2

ADHD Agent架构：Claude Code的创造力终于被激活了

技术分析 #实践经验

全部回复

项目实战专区

热门帖子

A_归途的其他帖子

ADHD Agent架构：Claude Code的创造力终于被激活了

技术分析 #实践经验

全部回复

项目实战专区

热门帖子

A_归途 的其他帖子

A_归途的其他帖子