GPT-5.6首批实测来了!精准狙击Mythos

{ title: "GPT-5.6实测曝光,正面迎战Claude Mythos", summary: "Anthropic发布Claude Fable 5和Mythos 5后,OpenAI的GPT-5.6内部测试版本遭泄露。代号kindle-alpha的候选版在UI生成、视觉能力上显著提升,

AITNT 3天前 15 AI 大模型

Claude Fable 5首日实测,杀疯了…

{ title: "Claude Fable 5首日实测:性能翻倍,但代价惊人", summary: "Anthropic深夜发布Claude Fable 5,直接跃入Mythos神话级段位。实测显示,其在代码重构、3D世界构建、PS复刻等任务上表现惊艳,SWE-Bench Pro成功率从1

AITNT 3天前 11 AI 大模型

腾讯把Agent做成游戏:情感陪伴新玩法

腾讯推出多款情感陪伴Agent,其中Marvis将Agent可视化,模拟职场环境,甚至让Agent在电脑上玩《王者荣耀》。QClaw和WorkBuddy也加入游戏化元素,如MVP结算动画和盲盒收集系统。这种将效率工具游戏化的尝试,虽面临性能问题和实用性争议,但为AI Agent赛道提供了新的情感价值思路。

AITNT 3天前 11 AI 大模型

AI数错病毒序列90年?生物数据老城跑不动智能体汽车

Anthropic最新研究揭示,顶级AI智能体在生物数据库检索中频频翻车:Claude Sonnet 4同一查询三次结果分别为106、15、5条,而正确答案是266条。问题根源并非模型推理能力不足,而是生物数据库如同为“马车”修建的老城,缺乏机器可用的标准化接口。NCBI Virus网页隐藏的过滤逻辑让智能体每次“猜”着拼凑,导致错误率高达16.9%至91.3%,一条序列之差可能让疫情起点推算偏移数周。

AITNT 3天前 11 AI 大模型

Z Tech|专访中科大02年白寅岐:让隐式世界模型学会因果,做最快最省落地的世界模型

{ title: "中科大02后研究者突破:隐式世界模型学会因果推理", summary: "中科大白寅岐提出一种新型隐式世界模型,通过引入因果推理机制,在保持高效计算的同时,显著提升模型对物理世界的理解能力。相比传统显式世界模型,该方法在多项基准测试中实现性能与速度的双重提升,为AI向通用

AITNT 3天前 8 AI 大模型

AI评测遭遇算力天花板:分数之外,推理成本才是关键

OpenAI研究员Noam Brown指出,传统模型评测方式已无法准确反映大语言模型真实能力。随着模型在推理阶段消耗更多计算资源,单一基准测试分数掩盖了性能与推理预算之间的关键关系。Brown建议行业转向性能—推理计算量曲线,将token数量、运行时间和费用纳入评估体系。以GPT-5.5发布为例,其实际体验显著提升,但传统成绩表上分数变化有限,凸显评测框架的滞后性。在网络安全等复杂任务中,部分模型在消耗超过1亿token后性能仍在提升,传统平台期概念面临挑战。

AITNT 3天前 8 AI 大模型

开源插件让AI编程成本骤降98%,记忆跃升至3小时

一款名为context-mode的开源MCP插件,专为AI编程优化上下文,解决大模型在长周期开发中的“失忆”和Token高消耗问题。该插件能将AI编程成本降低98%,模型记忆力从30分钟提升至3小时。项目登顶GitHub Hacker News,获1.5万颗Star,已吸引逾24.3万名开发者接入,并被微软、谷歌、Meta、字节跳动等公司研发团队采用。通过虚拟沙盒机制,它有效降低Token消耗,实测中79.3KB文件读取成本降低87.7%。

AITNT 3天前 7 AI 大模型

AI独角兽门槛飙至100亿美元,21家巨头名单刷屏

Menlo Ventures合伙人Deedy Das发布了一份引发热议的名单,列出了21家估值超100亿美元且年收入超1亿美元的AI初创公司。从估值100亿美元的Crusoe到逼近万亿的Anthropic和OpenAI,这张榜单不仅展示了AI赛道的爆发力,更揭示了算力飞轮驱动的商业逻辑。Anthropic估值9650亿美元,年收入470亿美元;OpenAI估值8520亿美元,年收入240亿美元。榜单按赛道、出身和数字含金量分层,凸显了AI产业链从基础模型到应用场景的全面跑通。

AITNT 3天前 12 AI 大模型

Taste Skill:用名字引爆AI时代的产品传播

开源项目Taste Skill凭借精准命名在AI社区引发热议。它定位为“反废料前端框架”,专为AI Agent设计,解决AI生成界面千篇一律的痛点。项目创始人刘小排指出,在AI降低技术门槛后,产品定义力成为关键,而名字是定义的最小单元。Taste Skill通过将“Taste”(人类最后的审美壁垒)与“Skill”(AI可复用的模块)结合,创造荒诞张力,实现自传播。这一案例揭示了AI时代产品成功的新路径:先定义情绪,再开发技术。

AITNT 3天前 13 AI 大模型

AI视频悄然占领短视频平台,Seko无限画布成创作利器

AI生成视频已从新鲜感十足的实验性技术,逐渐融入抖音、视频号等主流平台的内容生态。商汤科技旗下Seko平台推出的无限画布功能,解决了AI视频创作中素材管理混乱、角色场景不一致等痛点,支持从剧本到分镜的自动生成与优化。用户只需输入灵感,即可在两小时内完成从文物照片到唐代生活场景视频的创作。这一工具将AI视频制作流程化,显著降低创作门槛,助力内容创作者高效产出高质量短片。

AITNT 3天前 12 AI 大模型

AI下半场:电力成新瓶颈,Token效率定生死

腾讯高管与AI科学家姚顺雨在公开对话中指出,AI竞争已进入模型、产品、场景、组织协同的新阶段,Token成本爆发式增长成为行业焦虑。更底层的问题在于,每个Token的生成都需GPU运算和电力消耗。国际能源署预测,2030年全球数据中心年耗电量将达950太瓦时,其中AI专用算力耗电465太瓦时,超过日本全年用电量。电力系统正从配套走向主体,高功率密度机柜(如英伟达Blackwell架构达130kW)对供电、散热和电网接入提出严峻挑战。

AITNT 3天前 6 AI 大模型

小米创始员工范典创业三年,打造AI睡眠灯挑战可穿戴

小米创始员工范典创业三年,推出AI睡眠床头灯Sleepal AI Lamp,定价449美元。该产品通过60GHz毫米波雷达、热阵列传感器等非接触方式监测睡眠,克服了可穿戴设备佩戴率低、干扰多等痛点。基于1022晚医院PSG数据验证,其睡眠分期准确率(κ=0.695)超过Apple Watch和Oura Ring。产品已在Kickstarter众筹,展现了AI硬件在细分场景的深度创新。

AITNT 3天前 7 AI 大模型

清华女博士做企业Agent,叫板千亿巨头

{ title: "清华女博士硬刚Palantir,企业Agent拿下21家央企", summary: "中数睿智创始人韩涵,一位清华女博士,带领团队在企业级AI Agent赛道突围,服务国家电网、中国移动等21家超大型央企,实现100%续约率和客户零流失。公司累计融资超4亿元,估值半年翻倍

AITNT 3天前 8 AI 大模型

清研精准获数亿元B2轮融资,打造物理AI工程化底座

清研精准完成数亿元B2轮融资,由星源资本领投,一汽富晟旗下吉晟资产、某央企产业基金跟投。本轮融资将推动公司从新能源物理智能闭环起步,逐步迈向更广泛的工业场景,致力于打造工业物理AI的工程化底座,深度布局具身智能领域。此举标志着物理AI在工业场景中的落地进入新阶段,为从业者提供了从理论到工程化的关键示范。

AITNT 3天前 2 AI 大模型

Codex连续跑22小时:AI编程的新标杆

自2026年Q2起,AI编程进入“定义完成”时代。开发者刘小排分享,其Codex任务已连续运行22小时,预计还需20小时,通过预先定义的需求文档和验收标准,AI自主执行、优化直至达标。文章强调,定义清楚需涵盖底层逻辑、技术边界、性能成本等关键要素,否则AI输出如同“抽卡”。这标志着Vibe Coding的终结,未来编程比拼的是精准定义能力。

AITNT 3天前 1 AI 大模型

「百奥几何」完成数亿元战略融资,打造生命科学「微观世界模型」丨早起看早期

{ title: "百奥几何获数亿元融资,生命AI模型GeoFlow引领分子设计革命", summary: "AI生物科技公司百奥几何完成数亿元战略融资,由多家机构联合领投。其自研的微观世界模型GeoFlow已迭代至V3版本,在原子级精度上实现蛋白质结构预测与从头设计统一,针对20多个靶点的

AITNT 3天前 1 AI 大模型

英伟达4亿美元收购Kumo AI,补全企业数据智能拼图

英伟达以至少4亿美元收购企业AI预测公司Kumo AI,旨在强化其在结构化数据领域的AI能力。Kumo AI成立于2021年,专注图神经网络技术,能在一秒内完成关系型数据库预测推理,无需特征工程。该收购填补了通用大模型在企业场景中的关键缺口,DoorDash、Reddit等为付费客户。英伟达近年通过收购Run.ai、Illumex等,逐步构建从算力到数据的全栈企业AI生态。

AITNT 3天前 0 AI 大模型

300美元跑通世界模型,具身智能断线起飞

X-Era Lab与星宸科技联合推出首款端侧世界模型解决方案,将世界动作模型VWA塞入指甲盖大小的芯片,实现感知-预测-控制全链路闭环。相比云端方案3000多美元的Thor-U芯片,成本降至300美元级别,砍掉90%。这一突破解决了延迟、带宽、成本和隐私四大痛点,让具身智能从依赖云端的“风筝”变成自主决策的“鸟”,为商业化落地扫清关键障碍。

AITNT 3天前 0 AI 大模型

Mira爆火:AI全自动科研,4小时产出论文初稿

科研助手Mira(前身SciClaw)经过万人内测正式上线,推出专家小队、科研画布、LLM WIKI三大核心能力,首次将「Vibe Researching」理念产品化。用户只需配置AI专家团队,即可自动完成文献检索、代码运行、结果分析等流程,4小时产出论文初稿。Mira旨在将科研人员从繁琐工具切换中解放,聚焦核心科学思考。

AITNT 3天前 0 AI 大模型

Anthropic发布Claude 5双版本,Mythos级模型终解禁

Anthropic今日正式推出Claude Fable 5和Claude Mythos 5两款模型,其中Mythos 5此前因安全顾虑被隐藏两个月,如今首次向公众开放。Fable 5主打创意写作与叙事能力,Mythos 5则在复杂推理与安全对齐上实现突破。据官方数据,Mythos 5在多项基准测试中表现超越前代,且通过更严格的对抗性测试。此举标志着AI安全研究进入新阶段,也为开发者提供了更丰富的模型选择。

AITNT 3天前 6 AI 大模型