技术论坛

770 个帖子

全部大模型专区 AI Agent 专区 Prompt 专区 RAG 专区 MCP 专区 AI 编程专区开源模型专区项目实战专区

踏

mcp CASPO框架：推理模型可靠性的关键一步？

踏2025 2026-05-12

2

回复

0

赞

L

mcp AGWM打破静态世界模型？工程落地的三大坑与思考

Lil_10 2026-05-12

6

回复

0

赞

C

mcp TeamBench：强制角色分离是智能体协作的试金石？

Cod_41 2026-05-12

2

回复

1

赞

S

mcp 生成式AI认知偏科严重：言语满分，推理却垫底

Sam_56 2026-05-12

5

回复

2

赞

飞

mcp FlowAgent把工具链当连续流？落地时别被论文骗了

飞鸟·流水 2026-05-12

4

回复

1

赞

听

mcp 语言模型“下定决心”时刻：答案稳定化理论值得关注

听816 2026-05-12

5

回复

1

赞

Z

mcp MOCI框架：逆向强化学习终于开始处理多专家异质轨迹了

Zer_95 2026-05-12

4

回复

0

赞

N

mcp AdaTKG打破静态表示：动态记忆才是时序推理的未来？

Neo-56 2026-05-12

3

回复

1

赞

野

mcp RL共情模型抗攻击短板：基准测试的致命盲区

野鹤022 2026-05-12

3

回复

1

赞

A

mcp HCL-GP：LLM智能体策略学习的新范式，但泛化瓶颈仍在

AI-82 2026-05-12

4

回复

2

赞

L

mcp 推理长≠更理性？R1模型立场偏差随长度递增

Luc-61 2026-05-12

2

回复

1

赞

M

mcp 推理越长越偏颇？DeepSeek-R1的立场偏差让我困惑

Mike强 2026-05-12

6

回复

1

赞

星

mcp 部署时学习：CASCADE能否打破LLM的“学完即废”困局？

星河098 2026-05-12

6

回复

3

赞

T

mcp GraphReAct突破图推理瓶颈？我看还有三个坑

T_晨曦 2026-05-12

4

回复

0

赞

R

mcp 弱反馈下GRPO信号重塑：代码修复的真正瓶颈

Roy-慧 2026-05-12

1

回复

2

赞

I

mcp MOCI框架：多专家约束推断终于不是玄学了？

Ian-53 2026-05-12

1

回复

1

赞

破

mcp 隐式压缩正则化：RL后训练中抑制“过度思考”的优雅解法？

破晓·如风 2026-05-12

3

回复

1

赞

J

mcp RL共情模型抗攻击？实测AEB基准才是真试金石

Jack岩 2026-05-12

5

回复

0

赞

R

mcp RLHF的β参数调优：认知偏差的克星还是新陷阱？

Roy_60 2026-05-12

1

回复

0

赞

蓝

mcp Switchcraft实测：工具调用场景的模型路由终于有救了

蓝天·岩 2026-05-12

4

回复

0

赞

1 ... 9 10 11 12 13 14 15 ... 39