AI 资讯

GPT-5.6首批实测来了！精准狙击Mythos

{ title: "GPT-5.6实测曝光，正面迎战Claude Mythos", summary: "Anthropic发布Claude Fable 5和Mythos 5后，OpenAI的GPT-5.6内部测试版本遭泄露。代号kindle-alpha的候选版在UI生成、视觉能力上显著提升，

AITNT 3天前 15 AI 大模型

Claude Fable 5首日实测，杀疯了…

{ title: "Claude Fable 5首日实测：性能翻倍，但代价惊人", summary: "Anthropic深夜发布Claude Fable 5，直接跃入Mythos神话级段位。实测显示，其在代码重构、3D世界构建、PS复刻等任务上表现惊艳，SWE-Bench Pro成功率从1

AITNT 3天前 11 AI 大模型

腾讯把Agent做成游戏：情感陪伴新玩法

腾讯推出多款情感陪伴Agent，其中Marvis将Agent可视化，模拟职场环境，甚至让Agent在电脑上玩《王者荣耀》。QClaw和WorkBuddy也加入游戏化元素，如MVP结算动画和盲盒收集系统。这种将效率工具游戏化的尝试，虽面临性能问题和实用性争议，但为AI Agent赛道提供了新的情感价值思路。

AITNT 3天前 11 AI 大模型

Anthropic最新研究揭示，顶级AI智能体在生物数据库检索中频频翻车：Claude Sonnet 4同一查询三次结果分别为106、15、5条，而正确答案是266条。问题根源并非模型推理能力不足，而是生物数据库如同为“马车”修建的老城，缺乏机器可用的标准化接口。NCBI Virus网页隐藏的过滤逻辑让智能体每次“猜”着拼凑，导致错误率高达16.9%至91.3%，一条序列之差可能让疫情起点推算偏移数周。

AITNT 3天前 11 AI 大模型

Z Tech｜专访中科大02年白寅岐：让隐式世界模型学会因果，做最快最省落地的世界模型

{ title: "中科大02后研究者突破：隐式世界模型学会因果推理", summary: "中科大白寅岐提出一种新型隐式世界模型，通过引入因果推理机制，在保持高效计算的同时，显著提升模型对物理世界的理解能力。相比传统显式世界模型，该方法在多项基准测试中实现性能与速度的双重提升，为AI向通用

AITNT 3天前 8 AI 大模型

AI评测遭遇算力天花板：分数之外，推理成本才是关键

OpenAI研究员Noam Brown指出，传统模型评测方式已无法准确反映大语言模型真实能力。随着模型在推理阶段消耗更多计算资源，单一基准测试分数掩盖了性能与推理预算之间的关键关系。Brown建议行业转向性能—推理计算量曲线，将token数量、运行时间和费用纳入评估体系。以GPT-5.5发布为例，其实际体验显著提升，但传统成绩表上分数变化有限，凸显评测框架的滞后性。在网络安全等复杂任务中，部分模型在消耗超过1亿token后性能仍在提升，传统平台期概念面临挑战。

AITNT 3天前 8 AI 大模型

开源插件让AI编程成本骤降98%，记忆跃升至3小时

一款名为context-mode的开源MCP插件，专为AI编程优化上下文，解决大模型在长周期开发中的“失忆”和Token高消耗问题。该插件能将AI编程成本降低98%，模型记忆力从30分钟提升至3小时。项目登顶GitHub Hacker News，获1.5万颗Star，已吸引逾24.3万名开发者接入，并被微软、谷歌、Meta、字节跳动等公司研发团队采用。通过虚拟沙盒机制，它有效降低Token消耗，实测中79.3KB文件读取成本降低87.7%。

AITNT 3天前 7 AI 大模型

AI独角兽门槛飙至100亿美元，21家巨头名单刷屏

Menlo Ventures合伙人Deedy Das发布了一份引发热议的名单，列出了21家估值超100亿美元且年收入超1亿美元的AI初创公司。从估值100亿美元的Crusoe到逼近万亿的Anthropic和OpenAI，这张榜单不仅展示了AI赛道的爆发力，更揭示了算力飞轮驱动的商业逻辑。Anthropic估值9650亿美元，年收入470亿美元；OpenAI估值8520亿美元，年收入240亿美元。榜单按赛道、出身和数字含金量分层，凸显了AI产业链从基础模型到应用场景的全面跑通。

AITNT 3天前 12 AI 大模型

Taste Skill：用名字引爆AI时代的产品传播

开源项目Taste Skill凭借精准命名在AI社区引发热议。它定位为“反废料前端框架”，专为AI Agent设计，解决AI生成界面千篇一律的痛点。项目创始人刘小排指出，在AI降低技术门槛后，产品定义力成为关键，而名字是定义的最小单元。Taste Skill通过将“Taste”（人类最后的审美壁垒）与“Skill”（AI可复用的模块）结合，创造荒诞张力，实现自传播。这一案例揭示了AI时代产品成功的新路径：先定义情绪，再开发技术。

AITNT 3天前 13 AI 大模型

AI视频悄然占领短视频平台，Seko无限画布成创作利器

AI生成视频已从新鲜感十足的实验性技术，逐渐融入抖音、视频号等主流平台的内容生态。商汤科技旗下Seko平台推出的无限画布功能，解决了AI视频创作中素材管理混乱、角色场景不一致等痛点，支持从剧本到分镜的自动生成与优化。用户只需输入灵感，即可在两小时内完成从文物照片到唐代生活场景视频的创作。这一工具将AI视频制作流程化，显著降低创作门槛，助力内容创作者高效产出高质量短片。

AITNT 3天前 12 AI 大模型

AI下半场：电力成新瓶颈，Token效率定生死

腾讯高管与AI科学家姚顺雨在公开对话中指出，AI竞争已进入模型、产品、场景、组织协同的新阶段，Token成本爆发式增长成为行业焦虑。更底层的问题在于，每个Token的生成都需GPU运算和电力消耗。国际能源署预测，2030年全球数据中心年耗电量将达950太瓦时，其中AI专用算力耗电465太瓦时，超过日本全年用电量。电力系统正从配套走向主体，高功率密度机柜（如英伟达Blackwell架构达130kW）对供电、散热和电网接入提出严峻挑战。

AITNT 3天前 6 AI 大模型

小米创始员工范典创业三年，打造AI睡眠灯挑战可穿戴

小米创始员工范典创业三年，推出AI睡眠床头灯Sleepal AI Lamp，定价449美元。该产品通过60GHz毫米波雷达、热阵列传感器等非接触方式监测睡眠，克服了可穿戴设备佩戴率低、干扰多等痛点。基于1022晚医院PSG数据验证，其睡眠分期准确率（κ=0.695）超过Apple Watch和Oura Ring。产品已在Kickstarter众筹，展现了AI硬件在细分场景的深度创新。

AITNT 3天前 7 AI 大模型

清华女博士做企业Agent，叫板千亿巨头

{ title: "清华女博士硬刚Palantir，企业Agent拿下21家央企", summary: "中数睿智创始人韩涵，一位清华女博士，带领团队在企业级AI Agent赛道突围，服务国家电网、中国移动等21家超大型央企，实现100%续约率和客户零流失。公司累计融资超4亿元，估值半年翻倍

AITNT 3天前 8 AI 大模型

清研精准获数亿元B2轮融资，打造物理AI工程化底座

清研精准完成数亿元B2轮融资，由星源资本领投，一汽富晟旗下吉晟资产、某央企产业基金跟投。本轮融资将推动公司从新能源物理智能闭环起步，逐步迈向更广泛的工业场景，致力于打造工业物理AI的工程化底座，深度布局具身智能领域。此举标志着物理AI在工业场景中的落地进入新阶段，为从业者提供了从理论到工程化的关键示范。

AITNT 3天前 2 AI 大模型

Codex连续跑22小时：AI编程的新标杆

自2026年Q2起，AI编程进入“定义完成”时代。开发者刘小排分享，其Codex任务已连续运行22小时，预计还需20小时，通过预先定义的需求文档和验收标准，AI自主执行、优化直至达标。文章强调，定义清楚需涵盖底层逻辑、技术边界、性能成本等关键要素，否则AI输出如同“抽卡”。这标志着Vibe Coding的终结，未来编程比拼的是精准定义能力。

AITNT 3天前 1 AI 大模型

「百奥几何」完成数亿元战略融资，打造生命科学「微观世界模型」丨早起看早期

{ title: "百奥几何获数亿元融资，生命AI模型GeoFlow引领分子设计革命", summary: "AI生物科技公司百奥几何完成数亿元战略融资，由多家机构联合领投。其自研的微观世界模型GeoFlow已迭代至V3版本，在原子级精度上实现蛋白质结构预测与从头设计统一，针对20多个靶点的

AITNT 3天前 1 AI 大模型

英伟达4亿美元收购Kumo AI，补全企业数据智能拼图

英伟达以至少4亿美元收购企业AI预测公司Kumo AI，旨在强化其在结构化数据领域的AI能力。Kumo AI成立于2021年，专注图神经网络技术，能在一秒内完成关系型数据库预测推理，无需特征工程。该收购填补了通用大模型在企业场景中的关键缺口，DoorDash、Reddit等为付费客户。英伟达近年通过收购Run.ai、Illumex等，逐步构建从算力到数据的全栈企业AI生态。

AITNT 3天前 0 AI 大模型

300美元跑通世界模型，具身智能断线起飞

X-Era Lab与星宸科技联合推出首款端侧世界模型解决方案，将世界动作模型VWA塞入指甲盖大小的芯片，实现感知-预测-控制全链路闭环。相比云端方案3000多美元的Thor-U芯片，成本降至300美元级别，砍掉90%。这一突破解决了延迟、带宽、成本和隐私四大痛点，让具身智能从依赖云端的“风筝”变成自主决策的“鸟”，为商业化落地扫清关键障碍。

AITNT 3天前 0 AI 大模型

Mira爆火：AI全自动科研，4小时产出论文初稿

科研助手Mira（前身SciClaw）经过万人内测正式上线，推出专家小队、科研画布、LLM WIKI三大核心能力，首次将「Vibe Researching」理念产品化。用户只需配置AI专家团队，即可自动完成文献检索、代码运行、结果分析等流程，4小时产出论文初稿。Mira旨在将科研人员从繁琐工具切换中解放，聚焦核心科学思考。

AITNT 3天前 0 AI 大模型

Anthropic发布Claude 5双版本，Mythos级模型终解禁

Anthropic今日正式推出Claude Fable 5和Claude Mythos 5两款模型，其中Mythos 5此前因安全顾虑被隐藏两个月，如今首次向公众开放。Fable 5主打创意写作与叙事能力，Mythos 5则在复杂推理与安全对齐上实现突破。据官方数据，Mythos 5在多项基准测试中表现超越前代，且通过更严格的对抗性测试。此举标志着AI安全研究进入新阶段，也为开发者提供了更丰富的模型选择。

AITNT 3天前 6 AI 大模型

GPT-5.6首批实测来了！精准狙击Mythos

Claude Fable 5首日实测，杀疯了…

腾讯把Agent做成游戏：情感陪伴新玩法

AI数错病毒序列90年？生物数据老城跑不动智能体汽车

Z Tech｜专访中科大02年白寅岐：让隐式世界模型学会因果，做最快最省落地的世界模型

AI评测遭遇算力天花板：分数之外，推理成本才是关键

开源插件让AI编程成本骤降98%，记忆跃升至3小时

AI独角兽门槛飙至100亿美元，21家巨头名单刷屏

Taste Skill：用名字引爆AI时代的产品传播

AI视频悄然占领短视频平台，Seko无限画布成创作利器

AI下半场：电力成新瓶颈，Token效率定生死

小米创始员工范典创业三年，打造AI睡眠灯挑战可穿戴

清华女博士做企业Agent，叫板千亿巨头

清研精准获数亿元B2轮融资，打造物理AI工程化底座

Codex连续跑22小时：AI编程的新标杆

「百奥几何」完成数亿元战略融资，打造生命科学「微观世界模型」丨早起看早期

英伟达4亿美元收购Kumo AI，补全企业数据智能拼图

300美元跑通世界模型，具身智能断线起飞

Mira爆火：AI全自动科研，4小时产出论文初稿

Anthropic发布Claude 5双版本，Mythos级模型终解禁