AI 资讯

全部 AI产业 AI产品 AI企业 AI商业 AI技术 AI政策 AI硬件 AI资讯 ai_dev news tools 云计算教程热点

AI时代，HTML才是你所需要的一切？！

刚刚，在X上Claude Code工程师Thariq的一篇分享——他几乎停止使用 Markdown，转而使用 Claude Code 生成 HTML 文件。在短短几个小时里，这篇帖子的浏览量就突破了 200 万。

AITNT 2026-05-09 9

AI在偷偷选「自己人」，这是2026最离谱的求职歧视

如果你这周自己写了求职信，你输给的并不是更好的候选人。你输给了一个更差的候选人，他花了 20 美元给 OpenAI。今年初，马里兰大学、新加坡国立大学和俄亥俄州立大学的三位研究者从 LiveCare

AITNT 2026-05-09 10

Claude狂印钞！Anthropic人均营收900万美元，吊打英伟达

Epoch AI最新数据：Anthropic人均年营收900万美元，远超OpenAI的560万和英伟达的510万。一家没上市的AI公司，人效已刷新硅谷全部历史纪录。

AITNT 2026-05-09 9

不更新参数就能强化学习！OpenAI翁家翌提出新范式：决策只需AI手搓一个.py 文件

没有训练梯度的AI，打破了Atari游戏满分纪录。OpenAI核心研究员翁家翌提出了一个强化学习新范式——启发式学习（Heuristic Learning, HL）。

AITNT 2026-05-09 10

业界首个视觉世界模型综述：迈向更高智能的视觉范式

为了理清视觉与世界模型之间的深层联系，并为该领域的未来研究提供一张清晰的脉络图，北京交通大学靳潇杰、魏云超、赵耀等学者联合新加坡国立大学、腾讯、字节等国内外研究机构知名学者，发布了首篇视觉世界模型长篇综述：From Seeing to Knowing the World: A Survey of Vision World Models。

AITNT 2026-05-10 10

OpenClaw太贵？QuantClaw帮你挑精度，成本砍掉21%，还能提速15%

华为联合新加坡国立大学和中国科学技术大学研究人员提出 QuantClaw。这是一款面向 OpenClaw 的即插即用动态模型精度路由插件，基于大规模低精度量化实证研究，让模型精度成为可动态分配的资源，实现服务质量不降反升、成本下降、延迟降低的三重收益。

AITNT 2026-05-10 10

AI突现首例自我复制！横跨4国160小时无限繁殖

最近，研究机构Palisade Research发布了一项令整个行业震惊的成果—— 研究员在终端只输入了4个单词，AI就完成了从黑客攻击到自我繁衍的全过程。这是AI通过黑客手段实现自我复制的首个纪录！

AITNT 2026-05-10 8

怎么判断大模型是真懂还是假懂？浙大x爱丁堡大学新指标NCB：给它的知识邻域也打分

当大模型看起来很自信时，它真的“相信”自己说的话吗？

AITNT 2026-05-11 9

告别Prompt抽卡和评分通胀：一个让AI游戏真正「机制化迭代」的框架

让大模型写一个小游戏，已经不新鲜了。它可以很快生成一个 Flappy Bird、一个塔防游戏、一个物理解谜页面，甚至还能补上按钮、分数和简单动画。但真正的问题是：这些游戏到底有没有新的玩法？它们是在创造，亦或只是把已有游戏换了一层皮？

AITNT 2026-05-11 9

深度拆解：AI 智能体 Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理，以及那些将“无状态”的大语言模型（LLM）转变为全能智能体（Agent）的底层机制。

AITNT 2026-05-11 9

大模型自信且短视！Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型常因只关注当前预测而显得短视。Next-ToBE通过调整训练目标，让模型在每一步预测时兼顾未来token分布，从而提升整体推理能力。

AITNT 2026-05-11 9

GENE-26.5 刷屏，堪称今年领域最震撼的demo！真的吗？

GENE-26.5 值得看的，是它背后的「具身智能版 Harness + 模型」。

AITNT 2026-05-11 8

浙大推出让AI会「导演」的角色扮演框架！四通道消息沉浸式交互｜ACL 2026

AI能实现真正的沉浸式扮演了。

AITNT 2026-05-11 7

压进我十年设计经验的 PPT Skills，迎来大波更新

上次开源 guizang-ppt-skill（github.com/op7418/guizang-ppt-skill）之后，大家都非常喜欢，短短几周 Github Star 来到了 6000 多。

AITNT 2026-05-11 9

具身智能来时路：谷歌RT1、2，SayCan作者Ted Xiao复盘机器人学习三大时代

你可能觉得今年人形机器人的 demo 已经看麻了。但 Ted Xiao 说，哪怕是最粗糙的那一条，放在两年前都能让全场研究者惊掉下巴，因为那时候没人相信这事真能成。

AITNT 2026-05-11 8

CVPR 2026 | 别卷推理了！当前大模型 STEM 短板在于「视觉感知」，代码才是破局关键

当多模态大语言模型（MLLMs）在面对科学、技术、工程和数学（STEM）领域的视觉推理题时频频「翻车」，一个根本性的问题摆在了所有研究者面前：大模型做不出理科题，究竟是因为「脑子笨」（推理能力受限），还是因为「眼神差」（视觉感知缺陷）？

AITNT 2026-05-11 8

Agent评测的下半场：为什么需要一个「活的」Benchmark？

Claw-Eval-Live提出「活的」benchmark概念，通过信号采集与任务筛选，确保评测内容紧跟企业实际痛点，而非固定不变的题库。评测不仅关注结果，还追踪执行过程，从数据调用到状态变更，全面验证Agent的真实能力。

AITNT 2026-05-11 7

ICML 2026｜拒绝大力出奇迹，PRISM框架让dLLM也能高效Test-Time Scaling

近年来，大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架，Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

AITNT 2026-05-11 7

具身大模型R1时刻：LIBERO终结者，99.9%背后的物理推理新范式

机器人拉个拉链，到底需不需要“脑子”？

AITNT 2026-05-11 7

让AI给林黛玉找个外国平替？大模型的文科推理有多离谱？

如果你让大模型给林黛玉找一个外国文学里的平替，它能给出令人信服的答案吗？这个脑洞的背后其实是当下人工智能最核心的软肋——“类比推理”能力。

AITNT 2026-05-11 7

1 ... 50 51 52 53 54 55 56 ... 66