8月18日,中国算力大会在银川盛大开幕,在“智算无限 全栈智能 联想ai算力战略暨ai服务器新品发布会”上,联想重磅发布两款全新ai服务器产品——联想问天wa7780 g3 ai大模型训练服务器和联想问天wa5480 g3 ai训推一体服务器。
8月18日,中国算力大会在银川盛大开幕,在“智算无限 全栈智能 联想ai算力战略暨ai服务器新品发布会”上,联想重磅发布两款全新ai服务器产品——联想问天wa7780 g3 ai大模型训练服务器和联想问天wa5480 g3 ai训推一体服务器。
这两款服务器是基于ai导向打造的全新产品,能够助力构建更加绿色高效的人工智能数据中心,满足客户从训练到推理等多样的算力需求。
ai赋智,绿色赋能:打造ai导向的算力基础设施,领跑中国智能化变革
近年来,在“建设数字中国”的背景下,中国算力基础设施的“地基”快速发展,行业智能化转型迎来进一步深化。与此同时,据idc报告显示,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力,ai算力已成为算力发展的主要方向。
今年年初,联想发布了联想服务器的首个本地化品牌“联想问天”,以“本地创新、敏捷高效”为品牌内涵,更好地满足中国本土客户的个性化需求。联想通过ai导向的算力基础设施,加速人工智能进入千行百业、覆盖多元场景,最终实现普适、智慧相融合,引领算力行业走向普适、智慧和绿色的新未来。
会上,联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽表示:“在通用算力向ai算力发展的当下,联想问天wa7780 g3 ai大模型训练服务器和联想问天wa5480 g3 ai训推一体服务器两款新品将分别满足不同类型的ai应用场景需求。”
联想问天wa7780 g3 ai大模型训练服务器:性能强劲,灵活高效
联想问天wa7780 g3是一款专为ai大模型训练所打造的服务器。ai算力已成为企业训练开发使用人工智能的硬门槛。联想问天wa7780 g3 ai大模型训练服务器正是为打破ai算力供给困境而来,为训练提供强劲的算力支撑。
澎湃算力
联想问天wa7780 g3 ai大模型训练服务器基于第四代英特尔®至强®可扩展处理器。nvidia hgx h800系统配备8颗h800 nvlink® gpu,拥有高达640gb的hbm3高速显存,通过nvlink®, gpu间互联带宽高达400gb/s。将ai算力提升了3.44倍,至高可达32p flops ai算力。nvidia h800 gpu匹配第四代tensor core配合transformer引擎(fp8精度),与上一代产品相比,可为大模型ai训练速度带来高达9倍提升,可将大模型ai推理速度提升高达30倍。
灵活架构
联想问天wa7780 g3 ai大模型训练服务器, 为了满足ai超大模型训练场景下,gpu服务器间高速数据通信的需求,支持ib、roce等多种对外网络连接方案。最高可以支持8张rdma高速网卡,提供3.2tb/s聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。同时,在本地存储的设计上,采用了gpu direct storage (gds) 技术。通过gds技术,gpu与nvme实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。
节能高效
联想问天wa7780 g3 ai大模型训练服务器,在产品设计中采用了三重独立风道设计,针对不同部件的散热特征,进行了系统性的优化,有效降低了由风扇带来的散热功耗。相比同级别产品,联想问天wa7780 g3 ai大模型训练服务器功耗降低约10%。同时,为了满足未来智算中心对pue值更低的要求,本产品预留了液冷冷板设计,未来将支持液冷,这将大幅度节省在ai大模型训练过程中,因系统散热带来的额外能耗,pue值有望低于1.1。
联想问天wa5480 g3 ai训推一体服务器:多元丰富,稳定可靠
从机器视觉、推荐系统,自然语言处理,再到更为复杂的ai大模型,不同ai应用场景对于ai服务器有着不同要求。本次发布会一同亮相的联想问天wa5480 g3 ai训推一体服务器,是联想问天品牌中的一款4u机架式ai服务器,支持多元的算力和丰富的生态,能够为ai模型的训练推理提供极致可靠的算力,加速人工智能在千行百业的落地,从而推动各行业乃至整个社会的智能化变革进程。
多元算力
联想问天wa5480 g3 ai训推一体服务器采用2颗第四代英特尔®至强®可扩展处理器,支持最新pcie 5.0。通过pcie扩展,最多可以支持10张包括最新nvidia h800 gpu在内的,多类型、多品牌ai加速卡。可以灵活应用于ai通用模型训练、大模型推理、ai生成、云游戏、科学计算等多种应用场景,为ai的多样场景提供多元算力。
灵活拓扑
联想问天wa5480 g3 ai训推一体服务器在cpu-gpu互联的硬件设计上也充分体现了灵活多变的设计理念。联想问天wa5480 g3 ai训推一体服务器基于不同ai工作负载,可以为客户提供包括直通、balance、common多种cpu-gpu互联方式,避免了因为cpu-gpu数据通信方式单一与工作负载不匹配,带来的潜在性能瓶颈和系统效率下降。结合不同种类,不同数量的加速卡选择,真正实现了对ai各种复杂场景的完美匹配。
极致可靠
联想问天wa5480 g3 ai训推一体服务器充分考虑了设计冗余,为ai算力提供了安全稳定的运行环境。支持电源n n冗余,节点内电源间互为备份,对外可以连接双路市电,保障服务器24小时在线运行。支持cpu、gpu、内存等关键部件的功耗监测,整机功耗封顶调控,动态保障服务器运行在合理的功耗区间,保证性能的稳定,以及风扇n 1冗余等多种安全设计保障高环温无间断运行。
这两款ai服务器新品是“联想问天”品牌家族重要的组成部分,传承了联想服务器高性能、高可靠、高扩展、低功耗“三高一低”的特性,具备“本地创新、敏捷高效”的品牌内涵。未来,联想问天wa7780 g3 ai大模型训练服务器和联想问天wa5480 g3 ai训推一体服务器将与联想其它ai基础设施产品组合多向赋能,助力ai算力覆盖ai全域应用。同时,配合联想领先的液冷技术,联想ai导向的算力基础设施,将持续助力ai算力绿色赋能,为普慧算力铸造牢固的“基石”。