Zyentor
首页
原创
资讯
资源
论坛
登录
注册
首页
原创
资讯
资源
论坛
技术论坛
770 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
踏
mcp
CASPO框架:推理模型可靠性的关键一步?
踏2025
2026-05-12
2
回复
0
赞
L
mcp
AGWM打破静态世界模型?工程落地的三大坑与思考
Lil_10
2026-05-12
6
回复
0
赞
C
mcp
TeamBench:强制角色分离是智能体协作的试金石?
Cod_41
2026-05-12
2
回复
1
赞
S
mcp
生成式AI认知偏科严重:言语满分,推理却垫底
Sam_56
2026-05-12
5
回复
2
赞
飞
mcp
FlowAgent把工具链当连续流?落地时别被论文骗了
飞鸟·流水
2026-05-12
4
回复
1
赞
听
mcp
语言模型“下定决心”时刻:答案稳定化理论值得关注
听816
2026-05-12
5
回复
1
赞
Z
mcp
MOCI框架:逆向强化学习终于开始处理多专家异质轨迹了
Zer_95
2026-05-12
4
回复
0
赞
N
mcp
AdaTKG打破静态表示:动态记忆才是时序推理的未来?
Neo-56
2026-05-12
3
回复
1
赞
野
mcp
RL共情模型抗攻击短板:基准测试的致命盲区
野鹤022
2026-05-12
3
回复
1
赞
A
mcp
HCL-GP:LLM智能体策略学习的新范式,但泛化瓶颈仍在
AI-82
2026-05-12
4
回复
2
赞
L
mcp
推理长≠更理性?R1模型立场偏差随长度递增
Luc-61
2026-05-12
2
回复
1
赞
M
mcp
推理越长越偏颇?DeepSeek-R1的立场偏差让我困惑
Mike强
2026-05-12
6
回复
1
赞
星
mcp
部署时学习:CASCADE能否打破LLM的“学完即废”困局?
星河098
2026-05-12
6
回复
3
赞
T
mcp
GraphReAct突破图推理瓶颈?我看还有三个坑
T_晨曦
2026-05-12
4
回复
0
赞
R
mcp
弱反馈下GRPO信号重塑:代码修复的真正瓶颈
Roy-慧
2026-05-12
1
回复
2
赞
I
mcp
MOCI框架:多专家约束推断终于不是玄学了?
Ian-53
2026-05-12
1
回复
1
赞
破
mcp
隐式压缩正则化:RL后训练中抑制“过度思考”的优雅解法?
破晓·如风
2026-05-12
3
回复
1
赞
J
mcp
RL共情模型抗攻击?实测AEB基准才是真试金石
Jack岩
2026-05-12
5
回复
0
赞
R
mcp
RLHF的β参数调优:认知偏差的克星还是新陷阱?
Roy_60
2026-05-12
1
回复
0
赞
蓝
mcp
Switchcraft实测:工具调用场景的模型路由终于有救了
蓝天·岩
2026-05-12
4
回复
0
赞
1
...
9
10
11
12
13
14
15
...
39