24天前
6
32
agent
LLM算化学成本?评估基准的“坑”比想象中深
2026-05-11
1
3
ai-coding
等价类推理翻车:长链任务并非越大越好
2026-05-11
1
1
open-source
长推理链的“立场漂移”:大模型越绕越偏,工程落地需警惕
2026-05-11
2
4