腾讯Ardot公测:AI设计稿直转IDE,多人同屏评审
腾讯推出AI设计智能体平台Ardot,支持一句话生成可编辑UI设计稿、零成本导入Figma文件、一键转代码直通IDE,并实现多人实时在线评审。该平台流式生成页面,支持局部精准微调,通过MCP协议将设计变量结构化推送至CodeBuddy、Cursor等开发环境。公测期间注册可领1000 Credits免费额度,微信小程序即将上线,方便手机端协作。
谷歌Gemini Omni发布:AI视频的Nano Banana时刻
谷歌正式发布Gemini Omni,一个能接受任意输入并生成任意输出的多模态AI模型。它整合了图像模型Nano Banana、视频模型Veo及世界模型Genie,支持视频编辑、物理模拟和教学视频生成。用户可通过自然语言多轮编辑视频,实现风格调整、元素添加等操作。在物理模拟方面,Omni对动能、重力等物理现象的理解有了质的飞跃。与Seedance 2.0对比显示,Omni在特定场景表现更强,但整体稳定性仍有差距。该模型标志着AI视频生成进入可控交互时代。
Google I/O 2026亮点:Gemini 3.5 Flash发布,地图与YouTube接入AI
Google在I/O 2026大会上发布了Gemini 3.5 Flash模型,其编码和Agent能力超越上一代Pro版本,Terminal-Bench测试得分76.2%,输出速度比前沿模型快4倍,输入价格每百万token 1.5美元。同时推出Gemini Omni Flash多模态模型,支持视频片段编辑。Gemini App全新设计并引入限额功能,Google Maps和YouTube分别推出Ask Maps和Ask YouTube自然语言交互功能。
谷歌Gemini 3.5连夜发布,Flash模型碾压全场
谷歌在深夜发布会上推出Gemini 3.5系列,其中Gemini 3.5 Flash在多项基准测试中超越GPT-4o和Claude 3.5,成为新一代性能标杆。同时发布的Gemini Omni支持任意输入生成视频,Spark智能体实现7×24小时云端自动化。这场发布被视为谷歌对OpenAI和Anthropic的全面反击,AI竞争格局或将重塑。
突发: Karpathy 加入 Anthropic
{ title: Karpathy加入Anthropic,LLM前沿再添猛将, summary: 5月19日,AI领域知名人物Andrej Karpathy在X上宣布加入Anthropic,称未来几年LLMs前沿工作将具有重要塑造性。他计划重回研发一线,并承诺继续推进AI教育。这一动向引发行
AMD中国AI大会:苏姿丰押注智能体时代
AMD首次在中国举办AI开发者大会,CEO苏姿丰(苏妈)宣布未来几年全球AI活跃用户将超过50亿,并强调大语言模型正从“一问一答”向智能体(Agent)时代演进。她指出,每个人未来可能拥有5个、10个甚至100个智能体,而AMD正通过ROCm开源生态、八大实操工作坊和上海研发中心全力押注这一趋势。中国被定位为驱动AMD路线图的核心市场,上海研发中心已是AMD全球最大研发中心之一。
AI公司开始为结果买单:RaaS模式真能落地吗
当企业无法衡量AI的真实价值时,只能退而求其次用调用量代替产出。麦肯锡数据显示,88%的企业已常态化使用AI,但EBIT因AI提升超5%的不到6%。如今,一批公司开始尝试直接对结果收费:Sierra估值超150亿美元,覆盖40%的财富50强企业;国内零犀科技已实现盈利。红杉提出的RaaS(Result-as-a-Service)模式,正从概念走向商业验证。
国产GPU造世界:首个全栈具身智能仿真平台发布
摩尔线程发布国内首个全栈国产化具身智能仿真平台MT Lambda,首次实现从仿真到现实(Sim-to-Real)的完整真机验证。该平台打通大模型训练、仿真模拟、端侧部署全链路,集成物理、渲染、AI三大引擎,仿真吞吐效率提升30倍,图形渲染性能提升2.7倍。这标志着国产GPU企业开始构建物理AI训练的基础设施,为机器人行业提供低成本、可复现的虚拟训练环境。
Cursor新模型Composer 2.5:1/10成本媲美Opus 4.7
Cursor发布Composer 2.5模型,以仅1/10于Claude Opus 4.7的成本实现了接近其性能水平。该模型在Terminal-Bench 2.0、SWE-Bench Multilingual和CursorBench v3.1上均与Opus 4.7差距微弱(0.1%-1.5%)。Cursor首次公开采用Kimi模型作为基础,并额外投入85%算力进行自研训练和强化学习。同时,马斯克从之前的批评者转变为合作者,Cursor部分训练在Colossus 2超算上完成,并计划与SpaceX AI合作开发更大模型。
鲸跃动力获星海图数千万投资,打造即插即用机器人劳动力
鲸跃动力获星海图数千万元种子轮融资,推出基于「数据+模型+末端执行」闭环的Robo Labor解决方案,旨在让物理劳动力像AWS算力一样可订阅、弹性扩容。公司自研Ego-centric+UMI数据采集系统,实现亚毫米级位姿定位与百万小时级数据管线,专注To B市场,已与制造、物流行业多家头部企业合作。团队由前北京人形数据负责人李广宇领衔,兼具具身智能与自动驾驶实战经验。
袋袋AI专家市场上线,你的经验可7x24小时变现
全球首个AI专家市场「袋袋」正式上线,无需编程或提示词技巧,用户只需通过聊天就能将自身经验和判断力转化为数字分身,实现7x24小时自动变现。该平台主打“逻辑版税”模式,让专家的知识资产化,为AI从业者提供了全新的知识变现路径。目前平台已开放注册,支持多领域专家入驻,预计将重塑知识付费与AI应用的边界。
世界模型Agora-1首次实现多人FPS联机对战
AI初创公司Odyssey发布世界模型Agora-1,并推出多人FPS游戏《黄金眼》致敬版,支持最多4名玩家(人类与AI混合)实时对战。游戏没有传统引擎、物理规则或渲染代码,所有画面由世界模型实时生成。体验中玩家难以区分AI与真人,且世界模型能自动修复地图bug。该技术突破了传统游戏边界,展示了通用世界模型在复杂交互场景中的潜力。
Qwen3.7预览版突袭,阿里两代模型并行迭代加速
阿里Qwen团队突然发布Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview,在Arena榜单上表现亮眼。文本领域排名第13,视觉领域排名第16,均为国产模型第一。模型迭代节奏明显提速,从Qwen3到3.7仅用2-3个月,进入高频交付阶段。前负责人林俊旸离开后,团队依然保持高速创新,引发社区对正式版和开源的热切期待。
能量桥融资,超导输电补齐AI算力基建短板
能量桥科技完成新一轮融资,由Monolith砺思资本领投、中科创星跟投。公司核心团队拥有20余年高温超导电力系统工程经验,率先在国内实现公里级HTS商业化并网。其预制化超导能源模块可将数据中心配电损耗从6%-8%降至接近零,一根超导母线替代20根铜排。随着中国数据中心投资预计从2024年的1875亿元飙升至2027年的4826亿元,超导输电成为解决电力瓶颈的关键。能量桥计划在上海建设1MW级Demo,推动技术从实验室走向标杆工程。
27天10亿张图,ChatGPT图像生成在印度狂飙
Sam Altman 官宣,ChatGPT Images 2.0 上线仅 27 天,在印度市场已生成超过 10 亿张图像。这一数据由 TechCrunch 和第三方机构验证,显示 AI 生图正从工具演变为“视觉输入法”。然而,全球增长并不均衡,印度成为最大爆发点,背后是庞大的移动互联网用户、低成本的创作需求以及 OpenAI 本地化策略的推动。本文解析这一里程碑背后的技术、市场与行业意义。
Z Potentials| 梁芊荟,从MIT计算审美到华为计算摄影:一个研究美的建筑师用AI 重写种草逻辑
{ title: "AI闺蜜Viba:用计算审美重写消费种草逻辑", summary: "洛杉矶AI公司Viba推出以用户为主角的穿搭灵感生成产品,切入消费意图的源头。创始人梁芊荟从MIT计算审美研究到华为计算摄影,跨界打造AI时代生活方式入口。产品基于城市、社交场景和偏好生成个性化内容,冷
670亿美元并购:AI重塑美国电力版图
2026年5月18日,NextEra Energy以670亿美元收购Dominion Energy,创美国最大公用事业并购纪录。背后推手是AI数据中心对电力的饥渴需求——全球约70%互联网流量经过弗吉尼亚数据中心走廊,Dominion手握51GW数据中心合同。这笔交易标志着AI时代从算力竞争转向电网定价,NextEra赌注清洁能源与储能能力,但面临监管审查和消费者权益争议。
阿里云AI云份额飙升至38.1%,稳居中国第一
Omdia最新报告显示,2025年中国AI云市场规模达567亿元,阿里云以38.1%的份额稳居第一,较上半年提升2.3个百分点,超过二到四名总和。其在AI IaaS和MaaS-MPS两大子市场均位列榜首,凸显其在大模型与基础设施领域的领先地位。
三年AI内容创作方法论:从故事到流量
本文总结了作者在AI内容创作领域三年的实战经验,从零到近百万粉丝的历程中沉淀出核心方法论:内容本质是讲故事,而非信息搬运。通过获取信息、找角度、创作三步法,结合跨领域知识碰撞,才能产出有灵魂的作品。文章强调,单纯转述热点只是信息搬运,真正的创作需要将原料加工成消费者愿意买单的成品。
Agent狂飙:我用Claude Code和飞书CLI把工作量翻了10倍
一位AI从业者分享了自己重度使用Agent进行办公自动化的真实体验:通过Claude Code配合飞书CLI,他能在1小时内处理数十份文档,将日工作量提升10倍以上。文章详细描述了从合同处理、邮件撰写到数据爬取和可视化的全流程自动化,并回顾了AI办公工具从Jasper、Notion AI到Microsoft 365 Copilot的演进历程,最后指出CLI模式正在成为Agent与办公系统交互的新趋势。飞书CLI在GitHub上已获得超过1万星标,标志着Agent办公时代正式到来。