充满魔幻的电影《阿凡达》背后离不开庞大的计算渲染资源。13年前,《阿凡达1》剧组自己搭建了一个庞大的线下数据中心,光服务器就购买了4000台,用以进行动画渲染。
13年后,《阿凡达2》剧组没有选择继续搭建线下数据中心,而是选择了亚马逊云科技服务,依靠亚马逊云科技弹性计算资源进行动画渲染,在保证效果更精彩的同时,效率大幅提升,成本大幅降低。
12月20日,在2022 re:invent中国巡展活动中,亚马逊云科技大中华区产品部总经理陈晓建表示:“当你面临极端挑战时,必须选择专门定制、功能足够强大的工具和凯发k8官网下载的解决方案。对亚马逊云科技的数百万客户而言,在充满不确定性的时代快速敏捷地进行现代化应用开发,提升业务的敏捷性,意味着每个企业都要掌握最新的科技来满足自身业务的发展需求。”
在云计算发展上,亚马逊云科技始终处于引领者地位,源于其源源不断的创新。2022 re:invent上,亚马逊云科技公布了极致性能的自研芯片战略、极速构建的云原生应用、面向极限未来的hpc需求的三大类创新,让云计算这趟快马一骑绝尘。
1.10年的持续创新,形成了三条自研芯片的产品线
annapurna,一座在喜马拉雅山脉中海拔8091米的极高峰,也是亚马逊云科技自研芯片团队的名字。在过去10年,annapurna labs持续创新,形成了运马逊云科技三条自研芯片的产品线:
一是四代虚拟化定制芯片nitro。nitro虚拟化系统采用了专业定制芯片、独立的模块化设计。它包含:一个非常轻量级的hypervisor,性能损耗通常不到1%;硬件级别的安全机制,实现了网络、存储隔离的独立安全通道;同时在数据传输的所有环节都可以实现硬件级别加密,对用户数据进行保护。
nitro将架构演进与技术复杂性进行了解耦,类似于云原生架构的思想,服务原子化,封装功能到模块内部,接口标准化,从而大大降低了系统的复杂性,并且提升了系统的可扩展性。
amazon nitro系统的研发可以追溯到2012年,在过去10年间共发布了4代nitro芯片。每一代nitro都在性能和功能上不断超越,为客户提供更低的延迟,更高的吞吐量,更大每秒数据包处理能力,以及不断创新的功能。
初代nitro只能提供10gbps的网络吞吐,每秒120万的包转发能力;到第四代nitro网络性能已经提高到100gbps,每秒转发1500万个数据包。而新发布nitro v5的晶体管数量大约是上一代nitro芯片的两倍,每秒的数据包能力提高了60%,延迟减少30%,每瓦特性能提升40%。
目前,amazon nitro系统仍是业界领先的云服务器虚拟化引擎。
二是三代基于arm架构的通用处理器芯片graviton。在每年的re:invent上我们都可以见证graviton的最新进展。
在2021年的re:invent上,graviton 3第三代处理器发布,其配备领先的ddr5内存,与基于amazon graviton 2的实例相比,浮点性能提高2倍,加密性能提高2倍,机器学习工作负载性能提高3倍。
而在今年的re:invent上,新出炉的graviton 3e处理器专门为浮点和向量指令运算而优化,并在高性能计算工作负载中发挥重要的作用。
相比于graviton 3实例,graviton 3e在hpl(线性代数的测量工具)上性能提升35%,在gromacs(分子运动)上性能提升12%,在金融期权定价的工作负载上性能提升30%。
配备了新一代nitro v5和graviton 3e的amazon ec2 c7gn实例,在ec2网络优化型实例中具有最高的网络带宽和数据包处理性能,功耗更低;与当前一代网络优化型实例相比,提供高达200gbps的网络带宽和提高50%的数据包处理性能。
c7gn实例适用于网络密集型工作负载,如网络虚拟化设备(包括防火墙、虚拟路由器和负载均衡器等)和数据加密业务等。
为了方便用户采用graviton实例,亚马逊云科技已经将20多种托管服务运行在了graviton之上,且仍在持续增加,包括用户经常使用到的amazon rds、amazon aurora、amazon elasticache、memorydb、amazon opensearch、amazon emr,amazon eks和amazon lambda等多种服务,大幅降低了客户将应用迁移到graviton的复杂度,客户只需将工作负载转移到graviton实例即可实现高达40%的性价比。
三是用于训练的芯片trainium和用于推理的芯片inferentia。
机器学习芯片差不多每两年或每几年就会有一倍或数倍的提升,相比于通用计算硬件更快,但仍然跟不上机器学习训练模型复杂度的提升。
唯一的解决办法就是通过分布式多处理器,把一个模型通过多个节点和网络协同计算、协同训练的方式来解决。
亚马逊云科技在2022年10月宣布正式推出trn1实例,它是专为云中的高性能模型训练而构建。trn1实例最多可搭载16个由自研的trainium芯片提供支持的训练加速器,提供高达512gb的高带宽加速器内存和800gbps网络带宽。
以进行两周的gpt3训练为例,p3dn需要600个实例,p4d减少到128实例,而trn1n只需要96个实例。trn1是拥有最高性价比的深度学习训练服务,与基于gpu的类似实例相比,训练成本降低了50%。
另一个新发布的amazon ec2 trn1n是一款基于trainium的网络优化型训练实例。该实例将网络带宽增加一倍,每个trn1n实例支持1.6tbps efa网络带宽,强大的网络吞吐能力也使亚马逊云科技能够将超过1万个traniumn芯片构建在一个超大规模集群里,实现对超大模型的并行训练。
而新发布的推理实例amazon ec2 inf2基于最新款的inferentia2机器学习加速推理芯片,是目前唯一专门为大型transformer模型分布式推理建立的实例。在性性能上,与inf1实例相比,inf2提供高达4倍的吞吐量,降低多达10倍的延迟,与基于gpu的实例相比,每瓦性能提升高达45%,支持诸如gpt-3、mask-rcnn、vit等大型复杂模型。
2.极速构建事件驱动的云原生应用
云原生是构建现代化应用的核心技术,它帮助用户将业务快速推向市场,加快了从研发到生产的速度。
亚马逊云科技16年持续引领云原生应用构建,推出大量服务。2006年推出amazon sqs开始构建云原生服务,今天该服务仍然被大量的业务和应用所使用。2012年推出amazon dynamodb,业界第一款真正的云原生的数据库。2014年推出amazon lambda,业界第一款无服务器的计算服务。2017年推出了amazon fargate,一个适合容器的无服务器能力,被业界称之为改变游戏规则的一款新服务。2020年,amazon aurora serverless v2,在几分之一秒之内就可以把数据库工作负载从数百个拓展到数十万个,大大降低用户整个工作量。
云原生应用的构建是一段旅程,包括构建、治理和迭代3个阶段9个节点,每一步亚马逊云科技都提供对应的支持。
在云原生之旅的构建阶段,一切皆代码是指用代码来定义和管理所有类型的资源;在治理阶段,安全团队与开发和运营团队集成,避免安全成为流水线中的瓶颈;最后在持续迭代改进阶段,很多平台级服务如数据库、消息传递总线、排队系统、api网关、缓存系统、存储、测试、安全等可以发展为共享服务,供组织中的其他人使用。
陈晓建说,“我们为支持这三个阶段九个步骤提供了大量的服务和功能,这些服务和功能一直在不断的快速迭代创新。”
amazon lambda是业界首个serverless计算服务,月活用户超过百万,每个月函数调用次数超过10万亿次。lambda一直持续改进,上百项新功能帮助客户扩展lambda的应用场景。
而amazon lambda的一个改进是对冷启动的一个延迟优化。冷启动是lambda用户关心的问题,特别是使用java开发lambda函数的客户。新发布的亚马逊云科技lambda snapstart可以大幅降低java函数的冷启动延迟,并且没有额外成本。
以前客户需要使用多个分散的组件去构建、运维devops平台,甚至于一些第三方工具集成。而新发布的端到端开箱即用的devops企业级平台——amazon codecatalyst是一个端到端的、开箱即用的devops企业级平台,提供了完整的项目管理、自动化流水线、高效开发与调试集成和灵活协作。
利用新发布amazon application composer(预览版),用户可通过简单的拖拽来搭建应用程序的架构,和底层serverless能力整合。
3.满足hpc需求,提供更好的算例、网络协同和空间仿真技术
高性能计算(hpc)是一个国家科技水平的重要象征。目前,hpc的应用几乎触及我们生活的方方面面,而亚马逊云科技已经连续7年获得hpcwire评选的最佳hpc云平台的称号,让hpc变得更“平易近人”。
据介绍,客户对hpc的需求表现在三个层面:一是需要最适合hpc的计算实例;其次为了配合hpc还需要网络、存储等诸多方面配套资源支持;第三、需要有很强的资源编排系统、算力编排系统等支持hpc工作。
亚马逊云科技推出三款高性能计算实例,帮助客户应对三类不同负载:
一是hpc7g实例,应对计算和网络密集型负载。hpc7g实例是第一款基于graviton 3e的hpc实例,配备了200gbps带宽的低延迟efa(elastic fabric adapter,弹性结构适配器)网络,非常适合运行计算密集型hpc应用,如计算流体动力学、分子动力学和天气模拟。
二是hpc6a实例应对计算密集型负载。与同类的基于x86的计算优化实例相比,它的性价比高出65%,并为最广泛的isv凯发k8官网下载的合作伙伴凯发k8官网下载的解决方案集提供支持。
三是hpc6id实例,应对数据和内存密集型负载。6id实例旨在为数据和内存密集型hpc工作负载提供领先的性价比。
而srd是亚马逊开发的一种网络传输协议。与tcp不同,srd支持数据包乱序传输,同一个数据流可以利用多条路径并行传输,而不是千军万马过独木桥。这意味着超低的网络延迟和超高网络吞吐量,而这正是包括hpc在内的很多延迟敏感、数据密集型业务的迫切需求。
更新的srd协议不仅能用于高性能计算、存储,也能被用在通用网络传输上。通过srd协议,amazon ec2实例的单条数据流的最大带宽从5gbps提高到25gbps。
在模拟仿真应用方面,亚马逊云科技推出空间模拟仿真服务在不同行业得到广泛应用。
模拟仿真运算往往都涉及大量复杂的工作流,因此需要定制开发底层软件,用来把计算任务合理分配到多台服务器集群中。传统的仿真任务,如天气预报,采用简单的横向扩展方式就可以实现,但是现在有一种新兴的、更复杂的仿真模式,叫空间模拟仿真。
空间模拟仿真技术是用来模拟人和物等实体在多维度环境下的行为,这个过程会涉及数百万对象之间的实时交互,比传统的仿真更复杂。亚马逊云科技新发布amazon simspace weaver最大的好处是可以在云端进行大规模并行空间模拟,用户不用担心单个节点物理上的硬件限制。
在具体应用上,simspace weaver非常擅长模拟人群,如计划大型活动或计划建造像新体育场这样的基础设施,以及模拟智能城市包括车辆、居民和其他物体等。它的使用也非常便利,当用户在3d引擎里设计好模型后,只要点击几下,便可打包上传代码并配置好运算任务;simspace weaver会自动将模型中不同空间区域对应的计算单元,分配到不同的ec2实例上。同时模型中的实体对象可以跨区域自由移动,这样用户可以建模更大的活动空间,无须在模型大小、实体数量或者实时性能上做取舍。
另外simspace weaver支持用户使用sdk来集成unreal engine、unity等常见3d引擎,用户只需专注编写仿真运算的代码,和设计更优良的模型素材就行了。
陈晓建认为,亚马逊云科技快速推进三条自研芯片的研发,实现amazon ec2可持续的安全创新。同时亚马逊云科技也是云原生应用的先行者,更是云原生的真正践行者,不断推出容器、serverless、ci/cd等服务,加速客户的现代化应用改造,并且在更加复杂的空间仿真等hpc领域推出新服务,帮助客户“速赢”。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。凯发k8官网下载的联系方式:editor@e-works.net.cn tel:027-87592219/20/21。