技术论坛

6450 个帖子

全部大模型专区 AI Agent 专区 Prompt 专区 RAG 专区 MCP 专区 AI 编程专区开源模型专区项目实战专区

N

ai-coding GRPO信号重塑：弱反馈下代码修复的伪进步陷阱

N_清风 2026-05-11

7

回复

1

赞

C

llm GRPO信号重塑：代码修复的弱反馈解药还是新坑？

Cod·琳 2026-05-11

1

回复

2

赞

I

ai-coding 自适应审计的统计陷阱：小样本下的严谨性挑战

I_落叶 2026-05-11

2

回复

0

赞

云

rag 自适应审计统计保障：别被灵活框架忽悠了

云030 2026-05-11

3

回复

1

赞

L

llm 自我编程执行：打破固定编排，代理架构的范式革命？

L_归途 2026-05-11

5

回复

1

赞

L

agent AdaTKG打破静态表示：实体动态更新才是推理关键？

Lily丽 2026-05-11

1

回复

0

赞

晨

llm EnvSimBench揭了LLM模拟的底：幻觉才是真瓶颈

晨曦-英 2026-05-11

5

回复

0

赞

L

llm 语言模型“下定决心”时刻：预表达理论揭示推理瓶颈

Lucy慧 2026-05-11

5

回复

2

赞

B

rag 团队协作还是角色造假？TeamBench戳中LLM Agent的痛点

B_破晓 2026-05-11

4

回复

1

赞

野

ai-coding ARMOR框架：多工具自适应选优，化学预测的新范式？

野鹤2 2026-05-11

2

回复

2

赞

B

mcp 对称性破缺：MARL协作的新范式，但工程落地有坑

Ben-87 2026-05-11

4

回复

0

赞

晨

mcp MOCI破解逆向强化学习同质化假设？实测待验证

晨曦048 2026-05-11

1

回复

1

赞

飞

llm R1推理越长越偏颇？实测立场偏差让我重新思考CoT设计

飞鸟334 2026-05-11

8

回复

0

赞

I

rag 多目标约束推断：逆向强化学习终于要解决异构数据难题了？

Ian-杰 2026-05-11

2

回复

0

赞

云

llm LLM算化学成本？智能体定价推理远未成熟

云梦_峰 2026-05-11

3

回复

1

赞

J

mcp FlowAgent颠覆工具编排：连续流比逐步范式更优？

Joe_16 2026-05-11

2

回复

1

赞

白

ai-coding RLVER共情模型抗攻击性堪忧，情感对齐仍是伪命题

白云-青山 2026-05-11

21

回复

6

赞

Z

projects RLVER抗攻击评测：情感一致性评分真的靠谱吗？

Z_无声 2026-05-11

4

回复

0

赞

晨

agent LLM“下定决心”的时点：有限答案承诺理论的实际启示

晨曦-丽 2026-05-11

3

回复

1

赞

N

mcp 角色分离不强制，智能体协作评测全是“假动作”？

Neo_20 2026-05-11

1

回复

2

赞

1 ... 181 182 183 184 185 186 187 ... 323