一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度
{ title: "1.3B模型逆袭!面壁MiniCPM-V 4.6开源,单卡4090就能跑", summary: "面壁智能发布MiniCPM-V 4.6,这款仅1.3B参数的多模态模型,在多模态综合能力上超越阿里Qwen3.5-0.8B和谷歌Gemma 4 E2B-it。模型支持单张RT
豆包输入法Mac版上线,AI语音输入时代来了
豆包输入法Mac版正式发布,支持高精度AI语音输入,内测用户反馈语音转文字准确率超过95%,响应速度低于200毫秒。该产品免费使用,无需复杂设置,让用户彻底告别键盘敲击。文章详细解析了技术原理、实际体验与行业影响,认为AI语音输入将成为生产力工具的新标配。
Anijam:用对话式AI重写动画创作流程
Anijam是一款面向动画创作的AI Video Agent,旨在通过自然语言交互降低视频制作门槛。用户只需输入一句话,系统即可自动完成角色生成、分镜设计、关键帧生成及视频合成。产品由前腾讯杰出科学家王珏和达特茅斯博士方晨联合创立,已获千万美元融资。支持局部编辑和最长10分钟视频生成,采用分层订阅模式(25-60美元/月)。Anijam试图将视频创作从“抽卡式生成”转向可控编辑,并计划引入AI自反馈机制,实现“AI导演”自动优化生成质量。
Bloome重做元宝派,AI输入框不再令人头疼
Youware团队推出的新AI产品Bloome,由产品经理明超平打造,旨在解决用户面对巨大输入框时创意枯竭的痛点。该产品通过重构交互逻辑,提供引导式输入和场景化模板,显著提升内容生成效率。初步测试显示,用户创意产出效率提升约40%,灵感触发时间缩短50%以上。Bloome被视为对传统AI交互模式的革新,有望重塑AI辅助创作领域。
具身智能大脑新星BeingBeyond迎来前逐际动力COO张力
逐际动力前联合创始人兼COO张力于今年4月初加入具身智能大脑初创企业BeingBeyond,担任COO。张力曾在思科中国工作19年,后任文远知行COO,推动L4自动驾驶落地。BeingBeyond聚焦机器人大脑模型,其Being-H0.7模型基于约20万小时人类视频预训练,在6项国际评测中排名全球第一。这一人事变动凸显具身智能行业从“本体竞争”转向“大脑突破”的趋势。
宁波公司破解AI硬件“活”起来的关键
AI硬件行业表面火热,实则陷入高退货率、低留存率的困境。宁波公司灵机一动推出国内首个面向智能硬件的AI Agent平台,旨在让硬件从被动应答升级为主动服务。平台依托母公司近十年物联网积累,已获梅花创投数千万投资,2026年3月上线1.0版本,在智能家居、儿童陪伴等场景落地,有望打破行业同质化僵局。
免费 1500 次背后,商汤在下一盘什么棋
{ "title": "商汤免费1500次调用,大模型价格战新棋局", "summary": "商汤科技近日推出激进策略:每5小时提供1500次免费API调用,Token消耗比同行低60%,同时开源核心模型U1(Apache 2.0协议)并上线三款新产品。在大模型公司普遍转向收费的背景下,商
前字节高管押注AI游戏平台Yoroll,互动影游成本骤降99%
前字节跳动和FunPlus高管Heath创立LinearGame,推出AI互动视频游戏平台Yoroll。该平台通过Text-to-Game技术,将两小时互动影游的制作成本从传统管线的500-1000万元降至仅10万元,降幅达99%。Yoroll整合了角色、场景、剧情生成的全套AI工具,让普通创作者以几千元成本即可制作互动游戏。团队汇集了《完蛋!我被美女包围了》剧情主创、Telltale资深制作人等人才,押注视频模型在游戏领域的闭环应用。
谷歌Gemini Omni曝光,视频版香蕉来了
谷歌原生视频模型Gemini Omni意外曝光,引发全网热议。该模型支持文本、图像、音频、视频全模态输入输出,能生成10秒1280x720高清视频,并在实时编辑中实现一键去水印、物体替换等功能。最惊艳的Demo展示教授在黑板上正确推导数学公式,解决了AI视频生成中文本一致性的核心难题。同时,OpenAI的Sora App已于4月26日停服,AI视频赛道迎来变局。谷歌I/O 2026大会将于5月19日开幕,Gemini Omni有望正式亮相。
小米计划30天内免费发100万亿Token,小米技术发文:Hermes Agent最近一月累计调用小米MiMo1.45万亿Token
{ title: "小米30天免费发放100万亿Token,AI开发者迎来大礼包", summary: "小米宣布启动「MiMo Orbit 100T Token 计划」,在30天内向全球AI用户免费发放100万亿Token,以回馈开发者生态。同时,小米自研的Hermes Agent在过去一
宇树发布载人变形机甲GD01,390万圆你高达梦
宇树科技发布全球首款量产版载人变形机甲GD01,创始人王兴兴亲自驾驶演示。该机甲可变形为交通工具,载人后重约500kg,售价390万元起。这款机甲融合了机器人技术与交通工具功能,标志着人形机器人商业化迈出重要一步。宇树试图将童年梦想变为现实,但高昂价格和实用性仍待市场检验。
字节跳动AI布局:基建与人才的双重火拼
字节跳动通过持续加注AI全栈技术,从大模型到AI for Science、硬件等领域,展现出强大的技术决心。据TrendForce预测,2026年字节服务器出货量将达93.7万台,占中国市场份额27.9%,豆包大模型日均tokens调用量达120万亿。其Seed校招覆盖基础大模型、具身智能等前沿方向,结合火山引擎的算力基建,字节在AI下半场竞争中占据先机。
软件主动被AI吞噬:MCP与Skill重塑行业格局
2026年,软件行业正经历从“用户打开应用”到“Agent调用能力”的范式转变。Notion、Adobe等巨头争相推出MCP Server和Agent Skills,主动将自己封装成AI可调用的能力。摩根士丹利将SaaS股价暴跌称为“SaaSpocalypse”,但认为这是过度反应。IDC预测,到2028年70%的软件供应商将重构定价策略。Skill和Plugin成为两种核心封装形态,推动软件从席位费模式转向消费量或结果付费。
月访问400万,AI检测工具站如何靠焦虑变现
Undetectable.ai是一个专注于AI内容检测与人性化改写的工具站,月访问量超过400万。其核心功能包括AI Detector(检测文本是否由AI生成)和AI Humanizer(将AI文本改写得更自然)。该网站抓住用户对AI内容被识别的焦虑,通过检测工具获客、制造风险感、引导付费转化,形成完整产品闭环。主要用户来自美国、印度、菲律宾等国家,流量以直接访问为主(66%),展现了AI时代工具站从焦虑中挖掘商业机会的典型案例。
杨立昆10亿美元押注JEPA,宣战LLM死路
图灵奖得主、AI教父杨立昆公开质疑LLM和生成式AI根基,认为像素重建是错误方向,并投入10亿美元创立AMI Labs,押注联合嵌入预测架构JEPA。他指出LLM缺乏预测自身行为后果的能力,无法理解物理世界,而JEPA通过抽象表示空间预测,可避免像素级生成的模糊与计算爆炸。这一观点挑战了主流Scaling Law信仰,为AI从业者提供了全新的自监督学习范式思考。
韩国AI聊天应用年入700万美元,情感代糖商业密码
韩国AI聊天应用Crack上线一年收入达718万美元,单下载收入极高,验证了情感刚需市场的付费能力。数据显示,38%青少年和42%的20多岁韩国人通过生成式AI进行情感交流。Crack通过游戏化设计、好感度阶梯和付费解锁机制,将AI聊天转化为恋爱RPG游戏,精准收割高净值用户。Zeta应用月使用时长1.13亿小时,是ChatGPT韩国版的两倍以上,凸显韩国AI聊天赛道的商业化潜力。
谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值
DeepMind 刚上任的 AGI 经济学总监 Alex Imas 曾担忧 AI 导致失业和需求坍缩,如今提出一个谨慎乐观判断,AI 会压低可复制劳动价格,也会推高护理、教育、医疗、服务等关系型劳动的价值。
奥特曼亲封GPT-5.5「自闭天才」!16人团队连夜退订Claude
奥特曼亲口盖章,GPT-5.5是个「自闭天才」。16人团队连夜退订Claude,换GPT-5.5月省3.2万刀。Codex单周狂飙9000万下载大虐对手12倍,开发者大迁徙开始了。
Chrome 开了一个危险的头:偷偷给数亿电脑塞4GB Gemini 模型,占硬盘、耗算力、删了自动重下
Chrome正在把你的电脑变成它的AI算力节点,没问过你,没通知你,而且删了还会自动重下。
月访问7万、年化GMV可能30万美元:拆解一个不卖照片的AI小产品
今天拆一个很典型的 AI 小产品:TinderProfile.ai。它的官网一句话非常直接:上传 2-5 张普通自拍,AI 在 10 分钟内生成更适合 Tinder、Bumble、Hinge 的约会头像,帮你获得更多匹配。