AMD发布下一代人工智能芯片 OpenAI首席执行官萨姆·奥特曼出席发布会
【友财网讯】-美国超威半导体公司(AMD)周四公布了其下一代人工智能芯片Instinct MI400系列的新细节,该芯片将于明年上市。
AMD表示,MI400芯片将能够组装成一个名为Helios的完整服务器机架,这将使数千个芯片能够以一种“机架级”系统的方式捆绑在一起。
AMD首席执行官苏姿丰(Lisa Su)周四在加州圣何塞的发布会上表示:“这是我们第一次将机架的每个部分都设计成一个统一的系统。”
OpenAI首席执行官萨姆·奥特曼(Sam Altman)与苏姿丰一起出现在舞台上,并表示他的公司将使用AMD的芯片。
“当你第一次告诉我关于规格的时候,我觉得,不可能,这听起来太疯狂了。”奥特曼说,“这将是一件了不起的事情。”
AMD的机架规模设置将使芯片在用户看来像一个系统,这对大多数人工智能客户(如云提供商和开发大型语言模型的公司)来说很重要。这些客户希望人工智能计算机的“超大规模”集群能够跨越整个数据中心,并使用大量的电力。
苏姿丰将Helios与预计将于明年发布的英伟达(Nvidia)的Vera Rubin机架进行了比较,她说:“可以把Helios想象成一个真正的机架,它的功能就像一个单一的大型计算引擎。”
AMD的机架级技术也使其最新的芯片能够与英伟达的Blackwell芯片竞争,后者已经有72个图形处理单元(GPU)拼接在一起的配置。在开发和部署人工智能应用的大数据中心GPU领域,英伟达是AMD主要也是唯一的竞争对手。
芯片公司表示,OpenAI是英伟达的一个重要客户,一直在向AMD提供MI400路线图的反馈。凭借MI400芯片和今年的MI355X芯片,AMD计划在价格上与竞争对手英伟达展开竞争。一位公司高管周三告诉记者,由于功耗更低,这些芯片的运营成本更低,而且AMD正在以“激进”的价格削弱英伟达。
到目前为止,英伟达一直主导着数据中心GPU市场,部分原因是它是第一家开发出人工智能开发人员所需软件的公司,这些软件可以利用最初为3D游戏显示图形而设计的芯片。在过去的十年里,在人工智能繁荣之前,AMD专注于在服务器CPU方面与英特尔(Intel)竞争。
苏姿丰表示,AMD的MI355X可以胜过英伟达的Blackwell芯片,尽管英伟达使用其“专有”CUDA软件。
她说:“这表明我们拥有非常强大的硬件,这一点我们一直都知道,但它也表明,开放的软件框架已经取得了巨大的进步。”
到目前为止,AMD的股价在2025年持平,这表明华尔街尚未将其视为对英伟达主导地位的重大威胁。
AMD数据中心GPU总经理安德鲁·迪克曼(Andrew Dieckmann)周三表示,AMD的人工智能芯片将降低运营成本和购买成本。
迪克曼表示:“总的来说,我们在性能竞争优势的基础上增加了可观的购买成本,因此节省了两位数的百分比成本。
在接下来的几年里,大型云公司和国家都准备花费数千亿美元围绕GPU构建新的数据中心集群,以加速尖端人工智能模型的开发。其中包括仅今年就有3000亿美元来自大型科技公司的资本支出计划。
AMD预计,到2028年,人工智能芯片的总市场规模将超过5000亿美元,尽管它没有透露自己能在这个市场上占据多大份额——据分析师估计,英伟达目前占据了90%以上的市场份额。
两家公司都承诺每年发布新的人工智能芯片,而不是每两年发布一次,强调竞争已经变得多么激烈,前沿人工智能芯片技术对微软(Microsoft)、甲骨文(Oracle)和亚马逊(Amazon)等公司有多重要。
苏姿丰表示,AMD在过去一年中收购或投资了25家人工智能公司,其中包括今年早些时候收购的ZT Systems。ZT Systems是一家服务器制造商,为AMD开发了构建机架级系统所需的技术。
“这些人工智能系统正变得超级复杂,全栈解决方案真的很关键。”苏姿丰说。
*AMD现在在卖什么*
目前,从云提供商那里安装的最先进的AMD人工智能芯片是Instinct MI355X,该公司表示,该芯片已于上月开始投产。AMD表示,从第三季度开始,它将向云提供商出租。
为人工智能构建大型数据中心集群的公司希望能够替代英伟达,这不仅是为了降低成本和提供灵活性,也是为了满足日益增长的“推理”需求,即实际部署聊天机器人或生成式人工智能应用程序所需的计算能力,这些应用程序可以使用比传统服务器应用程序更多的处理能力。
“真正改变的是对推理的需求显著增长。”苏姿丰说。
AMD官员周四表示,他们相信他们的新芯片在推理方面优于英伟达的芯片。这是因为AMD的芯片配备了更高速的内存,这使得更大的人工智能模型可以在单个GPU上运行。
AMD表示,MI355X的计算能力是其前身的7倍。这些芯片将能够与英伟达的B100和B200芯片竞争,这两款芯片已于去年年底上市。
AMD表示,其Instinct芯片已被10大人工智能客户中的7家采用,包括OpenAI、特斯拉、xAI和Cohere。
AMD表示,甲骨文计划向其客户提供超过13.1万个MI355X芯片的集群。
Meta的管理人员周四表示,他们正在使用AMD的CPU和GPU集群来运行Llama模型的推理,并计划购买AMD的下一代服务器。
微软的一名代表表示,该公司使用AMD的芯片来支持其Copilot的人工智能功能。
*价格竞争*
AMD拒绝透露其芯片的价格——它自己不销售芯片,终端用户通常通过戴尔(Dell)或超微电脑(Super Micro Computer)等硬件公司购买芯片——但该公司计划让MI400芯片在价格上展开竞争。
这家位于圣克拉拉的公司正在将其GPU与2022年收购的Pensando的CPU和网络芯片配对,以构建其Helios机架。这意味着更多地采用其人工智能芯片也应该有利于AMD的其他业务。它还使用了一种开源网络技术来紧密集成其机架系统,称为UALink,而不是英伟达的专有NVLink。
AMD声称,MI355X每美元比英伟达的芯片多出40%的tokens(一种衡量人工智能产出的指标),因为它的芯片比英伟达的芯片能耗更低。
数据中心GPU每块芯片的价格可能高达数万美元,云计算公司通常会大量购买。
AMD的人工智能芯片业务仍然比英伟达小得多。该公司表示,其2024财年的人工智能销售额为50亿美元,但摩根大通(JP Morgan)分析师预计,今年这一类别的销售额将增长60%。