{
title: "GPT-5.6实测曝光,正面迎战Claude Mythos",
summary: "Anthropic发布Claude Fable 5和Mythos 5后,OpenAI的GPT-5.6内部测试版本遭泄露。代号kindle-alpha的候选版在UI生成、视觉能力上显著提升,但实测显示相比前代kepler有所退步,网友预测可能被Mythos轻松击败。6月御三家模型撞期,定价成关键变量。",
content: "大模型圈的六月注定不平静。Anthropic刚刚放出藏了两个月的大杀器——Claude Fable 5和Mythos 5,直接把压力给到了OpenAI。而就在同一时间,GPT-5.6的内部测试版本开始在海外开发者和泄露圈里被疯狂实测,代号、候选版本、跑分体感全被翻了出来。这场旗舰模型撞车,两家打得不可开交,连IPO节奏都撞在了一起。\n\n截至目前,OpenAI对GPT-5.6仍是零官宣。但从上周开始,内部正在测试两个新检查点,代号分别是kindle和kepler,其中kindle-alpha被选为发布候选版。从流出的体感来看,GPT-5.6最被反复提及的升级是前端/UI生成能力。网友Pankaj Kumar表示,kindle-alpha的前端生成能力大幅提升,不需要复杂的提示词或额外技巧就能直接产出更强的界面输出。此外,它的视觉能力也很能打,在图像理解和图像引用类任务上表现不错,整体在推理、编码、UI生成上都有明显改善。\n\n然而,网友Leo拿同一个prompt在xhigh档位上分别实测了kepler和kindle两个版本,发现kindle比起kepler反而还退步了。他甚至判断,OpenAI很可能还会继续打磨,不排除最后弃用kindle这个候选版。最新消息显示,kindle已被移出Arena,出现了一个新模型Levi,但网友调查后发现Levi可能来自Meta,而非GPT-5.6。对于GPT-5.6能否打过Mythos,网友mark_k声称它在多个agentic coding基准上击败Mythos,但Leo的实测更有说服力——他认为kindle相比kepler是退步,以它目前的形态会被Mythos轻松击败。\n\n6月,海外AI御三家的模型发布时间全撞在了一起:Fable 5、Gemini 3.5 Pro、GPT-5.6。有意思的是,三家虽然都把节点压在6月,但到现在真正把卷子交上来的只有Anthropic一家。Gemini 3.5 Pro在5月19日的谷歌I/O大会上亮相,但未正式上线;GPT-5.6消息传出是本月晚些时候发布。这也给OpenAI添了一层张力:对手已经把分数贴出来了,内部可能还在为该交哪一版RC纠结。但除了跑分,定价也是一个重要因素。Fable 5和Mythos 5统一定价为每百万输入Token10美元、每百万输出Token50美元,约为现有Opus的两倍。如果GPT-5.6在能力上和Mythos打平甚至略输,但价格便宜得多,那它在真实采用率上还是有可能扳回一城。真正的对决要等GPT-5.6正式版和Fable正面跑分那一刻——这个月内大概率见分晓。"
}
GPT-5.6首批实测来了!精准狙击Mythos
AITNT
3天前
15
20
本文由 Zyentor(智元界) 原创发布,转载请注明出处。
欢迎在 技术论坛 讨论本文相关内容