当前,云计算、5g、人工智能、虚拟客户体验等各类数字技术正在改变着我们的生活工作方式和企业的运营方式。在全新的数字经济环境下,无论是企业的研发设计、模拟仿真还是个人的图形处理、视觉优化,都对gpu性能有了更高的要求,企业需要更强劲的gpu性能让响应更加迅速、协作更加高效。
作为gpu的发明者和全球图形运算行业领袖,nvidia从推出第一代gpu架构开始,就在不断创新迭代,使gpu架构更加符合不同环境下的图形和可视化运算要求,从最早的kepler架构到maxwel、pascal、turing以及今年10月正式发布的ampere架构,nvidia为数百万艺术家、设计师和工程师带来了gpu的强劲性能提升。
“在过去20年里,nvidia在不同领域针对gpu进行优化,无论是软硬件设计,还是功能改进,使不同用户产生了性能飞跃。”日前,在gpu举办的线上媒体沟通会上,nvidia 中国区高级技术市场经理施澄秋进一步解读了全新ampere架构的gpu的技术特点和性能优势,并以实际应用案例诠释nvidia ampere架构gpu如何为用户带来应用体验飞跃和工作效率提升。
图 nvidia gpu架构发展路线图
性能突破,ampere架构下的非凡体验
基于ampere架构,nvidia发布了面向工作站的rtx a6000和面向服务器的rtx a40。两者均采用了最新的ampere架构,并在gpu 配置上保持一致性,即84个带有 ga102 gpu 的流式多处理器。唯一的区别在于前者是主动散热,而后者是被动。与上一代产品相比,施澄秋介绍nvidia ampere gpu架构的性能提升主要体现在以下三个方面:
图 nvidia ampere架构三大性能提升
首先,是在流式多处理器(sm)架构上,新一代最高可以提供39 tflops的fp32算力。由于目前fp32(单精度浮点)主要用于图形运算或者物理模拟,对于运算结果的精度要求并不高,例如在研发设计方面,以cad、cam的研发设计仿真精度权重并不是首位,fp32既可以满足需求。因此,nvidia针对新一代的流式多处理器架构进行优化,使其单精度浮点达到上一代turing架构的2倍。
其次,在rt (实时光线追踪)core上,nvidia在turing架构里首次引入了专门的光线追踪运算环境,通过bvx算法使用一个专门电路运算光线轨迹及当前画面里3d建模之间的光线反射、折射或更复杂的轨迹,例如镜面反射、漫反射等,让电脑画面更加逼真,达到照片级渲染精度。在新的ampere架构下,nvidia对bvx算法进行了优化,最高可提供2倍于上一代的吞吐量,以及并行光线追踪、着色和计算功能。
最后,在tensor core(张量计算核心)方面,我们知道由于总性能是一定的,精度提高时,运算量就会增加,性能自然也会降低。nvidia ampere 的tf32精度可以快速适应fp32精度,在吞吐量上达到上一代的5倍。此外,ampere架构支持全新tf32和bf16数据格式,结合稀疏运算特性提供10倍加速性能。值得一提的是,ddr6显存和pcie gen 4作为发展趋势,在全新的ampere架构下都得到支持。目前单个gpu可提供的最大内存以达到48gb。
多行业场景下的最佳实践
如今,人们对消费品的功能性和创新性期待日益增高,对于研发设计人员而言,其复杂性随之加大。施澄秋介绍日常生活中看似一个简单的商品,其背后经历了非常多的繁琐、冗长的步骤,例如选择何种材质、材质的牢固程度、材质的耐磨损程度、材质使用过程中的舒适程度以及美观程度,以及是否符合人体工学等等,涉及到多次模拟仿真和讨论修改,而nvidia就是要加速设计和创新过程,提升效率,让企业创新步伐迈的更快。
例如predator cycling,美国的一家碳纤维自行车制造商,其产品设计过程中应用了keyshot、ansys cfd、fusion360等诸多软件,通过nvidia rtx a6000加速每一个创作流程,其许多关键应用程序的性能提高了2到6倍,并让团队可以在视频会议中同时进行分析、建模和屏幕共享。
在建筑工程行业,全球最大的建筑事务所之一kpf(kohn pedersen fox associates)在中国有许多施工案例,如深圳第一高楼平安金融中心,上海曾经的第一高楼环球金融中心等。作为最早一批使用rtx a6000的公司,kpf表示该gpu能够将分辨率提高至原来的3倍,并加快复杂建筑模型的实时可视化。在kpf的可视化经理paul renner看来,nvidia rtx a6000的惊人之处在于能够将分辨率提高至原来的2倍或3倍,并显著加快城市景观中大型复杂建筑模型的实时可视化速度。
在传媒娱乐这种对图形渲染和视觉处理要求更高的行业,nvidia a6000的强大性能能够更快、更轻松地打造各种复杂、逼真的视觉特效,满足4k/8k图形、图像渲染、色彩空间变换、虚拟演播和hdr等专业领域中的显示处理要求。获得奥斯卡奖的视觉效果公司digital domain指出了创作数字人类时,nvidia的实时光线追踪和机器学习的重要性。digital domain数字人类团队主管darren hendler表示:“digital domain创作实时、照片级逼真数字人类的技术处于业内领先地位。我们与epic games和nvidia合作,不断突破技术的极限。全新nvidia rtx a6000让我们拥有了完全重新定义实时光线追踪和机器学习的可能。”
多工具工作流“一站式”解决,omniverse让协作更轻松
omniverse作为全球首个基于nvidia rtx的3d仿真模拟和协作平台,在今年10月初的gtc线上主题演讲中,nvidia创始人兼首席执行官黄仁勋揭露了其公测版的相关信息。黄仁勋表示:“物理和虚拟世界将会日益融合。omniverse让位于全球各地或居家办公的创作者团队,能够像编辑文档一样在同一个设计上轻松开展协作。”
施澄秋介绍nvidia目前包含很多技术应用,如光线追踪、物理模拟、vr/ar等,各种第三方工具软件也对其提供支持,例如ue虚幻引擎、autodesk revit、substance by adobe、unity、maya等。当用户在研发设计时,通常伴有跨软件平台的应用,如在不同平台之间进行材质设计、模型构建、贴图、组装等,这个过程不仅涉及到繁琐的数据资产存取、导入、导出,还可能存在数据转换,甚至引发中间工作流程所带来的冗余和混乱。
nvidia的omniverse平台能够让用户无论使用什么软件、工具和平台,都能以omniverse为入口进行分发协调工作、整合工作流程,让所有用户、设计师、科学家和工程人员都在同一个nvidia omniverse平台上完成分工和协作。
这其中的关键就是physx usd技术。施澄秋解释usd是一个通用的全局场景描述文件,能把数字资产解析成在不同软件平台、不同isv应用程序下都可以进行合作使用并统一存取的格式。此外,它还能够分层式管理数据资产,让大型团队的不同部门在同一个场景工作并共享数据,进行协同和发布。例如远程团队可以通过该平台同时开展项目协作,负责3d建筑设计迭代的建筑师、修改3d场景的动画师以及协作开发自动驾驶汽车的工程师,整个协作就像是在线上共同编辑文档一样简单。
因此,对于创意工作者和开发人员而言,omniverse的关键创新是仅需一键点击即可在autodesk revit、mcneel rhino或trimble sketchup之间切换。用户无需进行数据准备或抽样,就能使用兼容的照片级逼真的渲染软件浏览大型模型。这就避免了转化延迟和切换软件工具造成的错误,大量节省了时间和成本。
目前,omniverse获得了许多主要的软件领导者支持,例如adobe、autodesk、bentley systems、robert mcneel & associates和sidefx等。未来,施澄秋介绍nvidia还与其他领先的软件供应商合作,让所有艺术家和设计师都可以在自己选择的应用上通过omniverse开展协作。
nvidia gtc 中国线上大会注册正在火热进行,诚邀您线上参与这一年度重磅 ai 与图形技术大会。扫描下方海报二维码立即注册!