AMD在拉斯维加斯的CES展会上发布了针对企业客户的Instinct GPU产品线关键更新和Helios机架级系统,直指GPU霸主英伟达在数据中心领域的主导地位。
1月6日,AMD公司发布了下一代Instinct MI500 GPU以及MI400系列的最新产品Instinct MI400X,专为处理本地AI工作负载而设计。AMD还展示了其Helios机架级系统的更多细节,该系统承诺在单个机架中提供3 AI exaflops的性能。
AMD CEO苏姿丰在主题演讲中表示:"随着AI应用加速普及,我们正在进入yotta级计算时代,这得益于训练和推理需求的前所未有增长。AMD正通过端到端技术领导力、开放平台以及与生态系统合作伙伴的深度协作创新,为AI的下一阶段构建计算基础。"
挑战GPU之王?
英伟达在AI部署领域享有主导地位,成为资金雄厚的超大规模云服务商的首选解决方案。最新报告显示,英伟达在数据中心GPU和AI加速器市场的份额超过90%。
但AMD希望通过专注于寻求在AI需求中平衡性能和成本的小型企业客户来削弱英伟达的GPU垄断。AMD的Instinct产品可以集成到现有机架中,为寻求增量升级的公司提供更具成本效益的选择。
Moor Insights & Strategy副总裁兼首席分析师Matt Kimball向Data Center Knowledge表示:"AMD能否竞争?我认为答案是肯定的。MI440X展示了AMD如何攻击AI的下一个重要前沿:商业企业市场。这可能是最佳的长期机会。"
AMD已经取得显著进展——公司报告称其EPYC云部署同比增长50%,谷歌、微软Azure、甲骨文、AWS等都有产品发布。在数据中心市场,Instinct GPU和EPYC CPU销售大幅增长,在最近几个季度中占AMD收入的近一半。
软件方面的竞争
AMD正在利用其开源ROCm软件对抗英伟达广受欢迎的CUDA。虽然AMD的ROCm正在获得关注,但CUDA仍然是主导解决方案。
Kimball说:"在软件方面,这是ROCm与CUDA的竞争。AMD选择拥抱开放性,如果它想推动采用,这是必须的。而英伟达走的是专有路线。总是有权衡——开源应该有助于推动生态系统支持和采用,而专有解决方案通常会带来更精细调优的系统,获得更好的性能。"
他补充说:"我不认为任何一种方法是错误的。AMD是挑战者,需要推动其平台的采用,而CUDA已经存在了几十年,在开发者社区中享有广泛支持。"
更大的野心
AMD的目标不仅仅是小型企业。Helios系统搭载72个MI455X芯片、EPYC CPU和Pensando Vulcano网卡用于横向扩展网络,将与英伟达的NVL系统竞争数据中心AI工作负载。
Kimball表示:"Helios是一个针对最大型组织的机架级解决方案。它面向超大规模云服务商和像超大规模云服务商一样运营的企业组织。它重约3.5吨,专为极大规模AI设计。"
公司还预览了下一代Instinct MI500 GPU,计划于2027年发布。AMD声称这些芯片将提供比其MI300X GPU产品线高达1000倍的AI性能。MI500 GPU基于下一代AMD CDNA 6架构、先进的2纳米工艺技术和HBM4E内存构建。
Kimball对Instinct MI500的消息评论说:"这是AMD工程和组件世代改进的结合。我更想看到实际性能表现如何。企业如何通过在所有功能中充分利用智能体AI来受益?"
Q&A
Q1:AMD Instinct MI400X GPU有什么特点?
A:AMD Instinct MI400X是MI400系列的最新产品,专为处理本地AI工作负载而设计。它可以集成到现有机架中,为寻求增量升级的企业提供更具成本效益的选择,主要针对需要在性能和成本间取得平衡的中小型企业客户。
Q2:AMD Helios机架级系统性能如何?
A:AMD Helios机架级系统承诺在单个机架中提供3 AI exaflops的性能,搭载72个MI455X芯片、EPYC CPU和Pensando Vulcano网卡。系统重约3.5吨,专为极大规模AI应用设计,主要竞争对手是英伟达的NVL系统。
Q3:AMD如何与英伟达的CUDA竞争?
A:AMD采用开源的ROCm软件对抗英伟达的专有CUDA平台。AMD选择开放性策略来推动平台采用和生态系统支持,而英伟达的专有解决方案虽然能提供更精细调优的系统性能,但AMD作为挑战者需要通过开源方式扩大市场份额。