nvidia发布用于加速生成式ai的下一代以太网技术spectrum-凯发官网首页
nvidia近日宣布面向专注于人工智能的服务器推出下一代以太网网络技术,并表示,戴尔、hpe和联想将率先将这种技术集成到他们的产品中。
nvidia表示,此次推出的spectrum-x技术是专为ai工作负载设计的,能够为ai通信提供比传统以太网高1.6倍的网络性能。
戴尔、hpe和联想公布的新服务器产品将spectrum-x与nvidia最强大的h100 tensor core gpu以及ai enterprise和ai workbench软件相结合。据称,这些厂商将为那些想要实施最先进生成式ai模型的企业提供了完整的方案。
据nvidia称,spectrum-x将结合最新的spectrum-4以太网交换机高速性能与nvidia bluefield-3 supernic(如图所示),后者是一种新型网络加速器,旨在加速ai工作负载以及加速软件。据称,该技术是对nvidia bluefield-3数据处理单元的补充,这种数据处理单元是一种卸载、隔离、加速和保护数据中心服务的处理器,可以释放gpu资源以专注于ai处理。
nvidia表示,spectrum-4是首款每秒51太比特的以太网交换机,旨在确保大规模和高负载下尽可能高的数据吞吐量,以最大限度地减少网络拥塞。这么做是必要的,因为ai工作负载必须处理大量数据。通过添加微调的路由软件,它可以确保以最佳方式使用网络基础设施。
至于bluefield-3 supernic,它可通过融合以太网以高达每秒400 gb的远程直接内存访问速度连接集群内的每个ai服务器。nvidia表示,这将对ai训练和推理系统的性能产生显着影响。另一个好处是高安全性,因为bluefield-3 supernics创建了一个安全的多租户数据中心环境,可以隔离每个工作负载。
nvidia表示,戴尔、hpe和联想的新系统将于明年第一季度上市。
nvidia公司创始人、首席执行官黄仁勋强调了加速网络框架的重要性,称它是“nvidia领先服务器制造商凯发k8官网下载的合作伙伴新一波ai系统的催化剂,可加速向生成式ai时代的转变。”
hpe公司首席执行官antonio neri解释了这项新技术背后的想法,称生成式ai需要完全不同的网络架构来支持各种动态工作负载。他表示,为了让客户能够发挥ai的潜力,“hpe正在与nvidia合作,构建具有所需功能、效率和可扩展性的系统来支持这些应用”。
spectrum-x目前已经安装在nvidia israel-1超级计算机上,对于那些想要在本地环境中构建下一代ai系统的公司来说可以把这种超级计算机作为他们的参考架构。israel-1系统使用戴尔的poweredge xe9680服务器构建,支持nvidia的hgx 100平台,该平台具有8个gpu、bluefield-3 dpu和带有spectrum-4交换机的supernic。
戴尔公司董事长、首席执行官michael dell表示:“通过我们的合作,戴尔和nvidia正在为客户提供快速地、安全地从数据中提取情报所需的基础设施和软件。”
据称,戴尔的网络加速软件可以进一步提高性能,提供对cumulus linux、pure sonic和netq等软件开发套件以及位于bluefield芯片核心的nvidia doca软件框架的访问路径。ai enterprise打包了数十种主流的ai框架、预训练模型和开发工具,ai workbench则提供了用于在pc或工作站上自定义ai模型的工具。
- 2023/7/28
- 2023/7/12
- 2023/7/12