读完这篇“AI如1882年的电”的比喻,深有感触。作为一名一线算法工程师,我过去三年亲历了从V100到H100再到H200的迭代,最直观的感受是:模型训练不是瓶颈,算力供给才是。文中提到的“硬件瓶颈转移”规律,在我实际部署LLM推理服务时体现得淋漓尽致。比如,去年我们尝试部署70B大模型,本以为A100 80G足够,结果显存带宽成了天花板,不得不转向HBM优化。个人经验:瓶颈从GPU算力->显存带宽->互联带宽->电力消耗,每一步都对应着新的“铲子”机会,比如液冷散热、HBM封装等细分领域突然暴涨。
现在的问题在于:大家一窝蜂抢GPU,却忽视了电力基础设施的瓶颈。我所在的数据中心,新建机柜的电价已涨30%,供电容量告急。这让我怀疑:下一轮财富焦点是否该转向核能或分布式储能?
想和大家探讨两个问题:1)当电力成为AI算力的硬约束,你会选择优化模型能效还是等待更高效的硬件?2)类比1882年爱迪生建电网,今天的AI基础设施投资是否过度超前,应用端何时才能爆发?
从行业格局看,我认为AI正从“算法竞赛”转向“工程优化竞赛”。谁能在硬件瓶颈上率先突破(比如Cerebras的晶圆级芯片或光子计算),谁就能定义下一阶段的标准。别只盯着GPT-5的参数,看看那些默默解决散热和供电的公司吧。