2019年12月16日-19日,nvidia gtc china在苏州国际博览中心隆重举行,作为nvidia每年在中国最重要的大会,今年的会议吸引了6100名科学家、技术工程师以及企业家参与。在18日的主旨大会演讲环节,nvidia创始人兼ceo黄仁勋展示了nvidia在图形、hpc、ai三大领域的各项创新与发展,以及nvidia在自动驾驶、游戏和医疗等多个行业的最新应用。
如今,nvidia已经在加速计算领域深耕25年。随着摩尔定律的终结,gpu加速计算将成为未来的发展方向,这一点已经得到业界公认。在黄仁勋看来,加速计算需要完整的堆栈工程,而出色的芯片只是起点。由于每个应用程序领域都需要特殊的数学内核、算法库和应用程序软件优化,因此nvidia一直致力于提供丰富的库、工具和应用程序。仅在去年,nvidia就发布了500多个sdk和库,其中既有全新内容,也有更新版本。通过不断提高gpu性能,深度学习训练在3年内提高了4倍,深度学习推理在1年内提高了2倍。在本次gtc china大会上,nvidia展示了一系列最新发布与更新,致力于将gpu、深度专业知识、计算堆栈、算法和生态系统集于一体形成合力,全面助力ai加速落地。
tensorrt 7:实现更加智能的ai人机交互
在演讲中,黄仁勋宣布 nvidia 发布突破性的推理软件 nvidia tensorrt 7。借助该软件,全球各地的开发者都可以实现会话式 ai 应用,大幅减少推理延迟。作为 nvidia 第七代推理软件开发套件,tensorrt 7为实现更加智能的ai人机交互打开了新大门,从而能够实现与语音代理、聊天机器人和推荐引擎等应用进行实时互动。
nvidia 发布tensorrt 7
tensorrt 7内置新型深度学习编译器。该编译器能够自动优化和加速递归神经网络与基于转换器的神经网络。与在cpu上运行时相比,会话式ai组件速度提高了10倍以上,从而将延迟降低到实时交互所需的 300 毫秒阈值以下。
黄仁勋表示:“我们已进入了一个机器可以实时理解人类语言的 ai 新时代。tensorrt 7 使这成为可能,为世界各地的开发者提供工具,使他们能够构建和部署更快、更智能的会话式 ai 服务,从而实现更自然的 ai 人机交互。”
开源自动驾驶深度神经网络 nvidia drive
在汽车与交通领域,黄仁勋宣布,nvidia 将在 nvidia gpu cloud (ngc) 容器注册上,向交通运输行业开源 nvidia drive 自动驾驶汽车开发深度神经网络。
nvidia drive 自动驾驶汽车开发深度神经网络
nvidia drive已成为自动驾驶汽车开发的行业标准,并且被汽车制造商、卡车制造商、自动驾驶出租车公司、软件公司和大学所广泛采用。如今, nvidia 向自动驾驶汽车开发者开源其预训练ai模型和训练代码。通过一套nvidia ai工具,nvidia生态系统内的开发者们可以自由扩展和自定义模型,从而提高其自动驾驶系统的稳健性与能力。
黄仁勋表示:“ai自动驾驶汽车是软件定义的汽车,它必须基于大量数据集才能在全球范围行驶。我们向自动驾驶汽车开发者开源我们的深度神经网络,并为他们提供先进学习工具,使他们能够根据不同的数据集对这些网络进行优化。通过这一方式,我们正在实现跨企业和国家/地区的共享学习,并保护数据所有权和隐私,最终加快全球自动驾驶汽车的落地。”
发布软件定义的自动驾驶平台orin
此外,黄仁勋还发布了用于自动驾驶和机器人的高度先进的软件定义平台——nvidia drive agx orin。该平台内置了全新 orin 系统级芯片,由 170 亿个晶体管组成,集成了 nvidia 新一代 gpu 架构和 arm hercules cpu 内核以及全新深度学习和计算机视觉加速器,每秒可运行 200 万亿次计算,几乎是 nvidia 上一代 xavier 系统级芯片性能的 7 倍。orin 可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了 iso 26262 asil-d 等系统安全标准。
nvidia drive agx orin
作为一个软件定义平台,drive agx orin 能够赋力从 l2 级到 l5 级完全自动驾驶汽车开发的兼容架构平台,助力 oem 开发大型复杂的软件产品系列。由于 orin 和 xavier 均可通过开放的 cuda、tensorrt api 及各类库进行编程,因此开发者能够在一次性投入后使用跨多代的产品。
与滴滴达成合作
在客户合作方面,黄仁勋宣布,nvidia 和全球领先的移动出行平台---滴滴出行达成合作,滴滴将使用 nvidia gpu 和其他技术开发自动驾驶和云计算凯发k8官网下载的解决方案。滴滴将在数据中心使用 nvidia gpu 训练机器学习算法,并采用 nvidia drive为其l4级自动驾驶汽车提供推理能力。滴滴在8月将其自动驾驶部门升级为独立公司,并与产业链凯发k8官网下载的合作伙伴开展广泛合作。
作为滴滴自动驾驶ai处理的一部分,nvidia drive 借助多个深度神经网络融合来自各类传感器(摄像头、激光雷达、雷达等)的数据,从而实现对汽车周围环境360度全方位的理解,并规划出安全的行驶路径。
nvidia gpu 为“双十一”提速
说起ai的力量,没有比阿里巴巴更生动的案例了。黄仁勋在演讲中宣布,阿里巴巴近期使用 nvidia gpu 大规模部署ai,在年度最大购物节日---“双十一”为客户提供服务。
在今年“双十一”购物节期间,阿里巴巴创造了 380 亿美元的销售额,相比于去年的 310 亿美元,增长了近四分之一,是“黑色星期五”和“网购星期一”的网购销售额总和的两倍多。
对于阿里巴巴和其他领先的网络零售商来说,推荐系统都是一个至关重要的应用程序。该系统可以向用户展示与其喜好相匹配的商品,从而提高点击率。而点击率在电商行业一直都是提高销售量的重要驱动力。点击率的每一次小幅提高都会直接影响用户的体验和商家的营收。使用能够实时大规模运行的先进推荐系统模型可使点击率提高 10%,目前这只能通过gpu实现。
阿里巴巴团队使用 nvidia gpu 支持资源分配、模型量化和图变换三项优化策略,从而提高吞吐量和响应性。这使得 nvidia t4 gpu 能够为阿里巴巴广泛、深入的推荐模型提供加速,实现每秒处理 780 个查询。这远远领先于基于cpu的推理---后者每秒只能处理3个查询。
更多精彩发布:
与腾讯合作推出start云游戏服务
在游戏方面,黄仁勋宣布了 nvidia 与腾讯游戏的一项将电脑游戏带入云端的合作,该举措进一步增加了 nvidia 在云游戏领域的影响力。
nvidia的gpu技术为腾讯游戏的start云游戏服务赋力,该服务已从今年初开始进入测试阶段。start使游戏玩家可以随时随地,即使是在配置不足的设备上也能玩aaa游戏。腾讯游戏计划将扩展其云游戏产品,为数百万玩家提供与本地游戏设备一致的游戏体验。
nvidia 通过助力start平台不断扩大在云游戏领域的足迹。今年初,nvidia宣布与日本 softbank 和韩国 lg u 公司合作开发云游戏凯发k8官网下载的解决方案。此外,nvidia 还在北美和欧洲部分市场提供 geforce now 云游戏服务,为全球的游戏玩家提供最佳的专属云端电脑游戏体验。
面向aec的omniverse
在今天的演讲中,黄仁勋还宣布了今年3月份发布的omniverse 3d制作流程协作平台omniverse的新进展——面向aec(建筑、工程、施工)的omniverse。面向aec的 omniverse 支持在 ae c的工作流中增加实时协作功能,并且支持如autodesk revit、trimble sketchup 和mcneel rhino等主流 aec 应用。
nvidia parabricks 基因组分析工具包
黄仁勋还发布了基于 cuda 加速的 nvidia parabricks 基因组分析工具包,可与用于发现变异并能产生与行业标准 gatk 最佳实践流程一致的结果,实现 30-50倍的加速。nvidia 正在与华大基因合作,使用 cuda 的生命科学超级计算机,以每天60个基因组的超大吞吐量改变着全基因组测序,同时还降低了成本。
max-q赋能游戏笔记本
对于许多游戏玩家而言,普通的移动pc不仅耗电量大且体积笨重。nvidia推出了max-q设计,将超过的gpu性能和总体系统优化集于一身,使功能强大的gpu可以使用于轻薄的笔记本电脑中。今年,中国的游戏笔记本发货量超过500万台,在5年内增加了4倍。通过与联想合作,nvidia帮助联想多款游戏笔记本在改善外观的同时,赋予了更强大的游戏性能。
max-q赋能游戏笔记本
更多支持rtx游戏发布
nvidia 和微软共同宣布《我的世界》将支持实时光线追踪(rtx)技术。当前nvidia rtx 技术已被多个业界最流行的渲染平台所支持。现场,黄仁勋宣布了6款支持 rtx 的游戏:(1)由上海钛核网络开发的《暗影火炬》;(2)由米哈游开发的《project x》(项目代号);(3)由腾讯北极光工作室群开发的《无限法则》;(4)由大宇资讯开发的《轩辕剑柒》;(5)由龙之力科技开发的《铃兰计划》;(6)由柳叶刀科技开发的《边境》。
更多支持 rtx 游戏发布