黄仁勋与SK海力士官宣合作,表面上是HBM迭代,但深入看,这是AI工厂存储架构的范式革命。目前HBM3E的带宽已逼近1TB/s,但AI训练中内存墙问题依然严重——我们团队在训练千亿参数模型时,数据搬运开销占总时间的30%以上。这次合作瞄准的‘下一代存储’,很可能基于存算一体或近存计算,而非单纯堆叠层数。
个人经验:去年我们用HBM3跑LLM推理,显存带宽利用率仅60%,瓶颈在控制器调度而非物理层。英伟达与SK海力士共研,意味着他们可能从底层协议层优化,比如定制化内存控制器或引入CXL 3.0接口。Vera Rubin超级计算机的存储子系统,大概率会采用混合立方体(HMC)与HBM的异构方案,彻底打破冯·诺依曼瓶颈。
不过,我质疑一点:这种深度绑定是否会导致生态封闭?未来AI工厂若只用NVLink+定制HBM,AMD和Intel的路线还有生存空间吗?建议讨论:存算一体存储的落地难点——是工艺还是算法?以及,AI工厂的存储能耗占比已超20%,散热方案是否会成为瓶颈?
行业视野看,这次合作标志AI存储从‘带宽竞赛’转向‘架构协同’。若成功,传统SSD和DRAM厂商可能被迫转型,而英伟达将掌握从芯片到存储的完整数据流管控权,进一步巩固AI基础设施霸主地位。