基于arm的处理器提供真正的价值。这篇文章集中讨论了arm对超大规模公司的吸引力,大体上忽略了向it终端客户提供的引人注目的价值。aws的graviton、安培计算的altra、甚至nvidia的grace为云原生工作负载提供了一个几乎理想的环境。
arm是世界上最普及的处理器架构。你驾驶的汽车内很有可能装了多个基于arm的处理器,你携带的手机绝对也是如此。根据mercury research的数据,2022年第四季度里基于arm的处理器占所有售出pc的13%。而服务器市场则是arm取得最显著收益的地方,公共云供应商在这方面处于领先地位。
笔者最近与liftr insights的首席执行官tab schadt谈起arm在公共云市场的渗透情况。liftr insights对顶级公共云供应商提供的实例类型进行了一些最全面的跟踪。schadt先生告诉我,基于arm的公有云产品在2022年的增长达到惊人的290%。此外,基于arm的实例类型在2022年底增长到占公共云产品的6%以上,高于年初的4.6%。这是个很重要的势头。
arm业务
arm控股公司(arm holdings,ltd)控制着arm架构,但该公司实际上并不销售任何处理器。arm公司其实是管理架构的发展,并将旗下技术授权给处理器供应商。arm公司提供了各种许可模式。一些供应商将arm的ip块整合到他们的芯片中,而其他的一些供应商则是从头开始实施arm的架构,优化解决这个问题。
这可是一项利润丰厚的业务。arm控股公司在最近一个财政季度报告的总收入为7.46亿美元,同比增长28%。其中大部分收入(即4.46亿美元)来自市场上出货产品的版税,3亿美元来自许可活动。arm的授权业务同比增长了65%。其势头一时无两。
私募股权公司软银集团拥有的arm控股公司目前正计划在今年晚些时候进行ipo(首次公开发行股票)。该ipo计划是在nvidia收购失败后进行的,nvidia收购在几个国家的监管部门强烈反对下被取消。
arm的服务器之旅
arm为了在服务器市场上找到一席之地走过了一条漫长的道路,其中充满了失败的尝试。最早的两家基于arm的服务器处理器供应商cavium和calxeda出现时,都雄心勃勃怀着在通用服务器中取代x86的宏伟愿景。这两家公司今天都不存在了,cavium的知识产权则进了marvell的产品。marvell技术集团作为一家独立公司运营十年后在2018年收购了cavium。seamicro也是早期潜在的基于arm的服务器供应商,只是后来被amd收购并迅速抛弃。
导致arm缓慢升华为服务器的原因有几个。例如,在早期存在关于软件兼容性和生态系统赋能方面的实际问题。用于arm的服务器软件(包括应用程序和开发工具)直到最近才出现。企业it团队部署基于x86的服务器已经二十多年了,arm在这一块从未作为过。
arm在服务器领域面临的最实质性障碍根本不是技术问题。我最近与一个一级服务器制造商的副总裁交谈。这位高管非常坦率地解释说,制造基于arm的服务器的问题是根本无法扩大市场。基于arm的产品只是取代那些制造服务器的商家现有产品。那么为什么要花钱去做这件事呢?这是个现实问题。
云端arm
公共云服务提供商(csps)与传统的服务器oems的关注点不同。csp(如亚马逊网络服务(aws))是向it组织推销一种可以提高效率的业务和运营模式。底层的服务器技术虽然也很重要,但对于这些公司提供的便利和灵活性来说则是次要的。
csp最关心的是运营效率。利润的增减基于运营费用的说法是基本的会计学原理,但在超大规模的数据中心内,运营成本会迅速增加。一个超大规模数据中心最重要的运营费用是与电力和冷却有关的费用。
例如,微软公司的报告说,能源成本直接影响了旗下azure云业务的收入。微软截至2022年12月的10-q文件显示,其azure毛利率下降了约3个百分点,主要是由于能源成本上升导致的。
arm处理器架构的不同之处在于该架构能够以令人难以置信的高能效水平提供高性能。arm的能效故事导致了该架构在嵌入式和智能手机市场的主导地位。能源效率也使得苹果公司采用了自己设计的基于arm的处理器取代旗下所有基于英特尔的产品。因此,能源效率也是arm在云计算领域的一个关键驱动力,也是不足为奇。
aws graviton
亚马逊是第一家将基于arm的处理器推向市场的公司,尽管亚马逊只是将这些处理器卖给自己。aws在2018年底推出了内部设计的基于arm的处理器graviton,此后该公司几乎每年都会发布新一代的graviton。aws graviton提供了三个方面的价值:成本、能源效率和适合云原生应用的架构。
上面提到的能源效率是实打实的。例如,nec公司在2022年中期发表的一项研究表明,在由aws graviton处理器驱动的实例上构建5g核心基础设施比较类似的基于x86的处理器,功耗降低了72%。这种效率很可能对aws的电力和冷却费用产生巨大的影响;毕竟亚马逊并没有提起能源成本影响了旗下aws的利润。
csp的采购成本是另一个关键驱动因素。基于arm的处理器比英特尔和advanced micro devices(amd)提供的基于x86的同类产品更便宜。成本降低部分来自arm处理器供应商没有被大型竞争对手的臃肿成本结构所困扰。相反,减少的成本被转给了csp,csp再将节省的成本转给他们的客户。
aws通过设计和监督自己的graviton处理器的制造而拥有一个几乎理想的成本结构。垂直整合的处理器开发消除了本来要牺牲给处理器供应商的所有利润。aws面临的挑战从管理处理器的采购成本转移到管理设计处理器的工程团队的效率。毫无疑问,亚马逊是复杂环境中的效率大师。
graviton正在为亚马逊带来回报。根据liftr insights的最新数据,目前基于graviton的实例占aws提供的实例的近19%,比前一年增加了6%。
安培计算的崛起
在亚马逊展示了旗下graviton产品的成功,微软azure和alphabet的谷歌云团队则在开发他们自己的基于arm的竞争产品,一时间各种有模有样的传言满天飞。后来,一家名为安培计算(ampere computing)的小硅晶片公司开始发货提供基于arm的服务器处理器,这些传言才消停了一些。
安培计算成立于2018年,很快发货提供首个基于arm的ampere altra和altra max处理器。安培计算的主要客户是公有云超大规模公司。还是参考liftr insights的数据,安培计算2020年时在公有云中完全不存在,发展到今天占公有云实例类型的近2%。
微软azure提供最多基于安培的实例类型,占基于安培实例的69%以上。阿里巴巴云、谷歌云、甲骨文云服务和腾讯云也在提供基于安培的实例类型。到目前为止,安培计算公司是唯一一家成功向服务器市场提供基于arm的处理器的厂商。
竞争环境
aws graviton和安培计算的alta处理器的成功为更多竞争铺平了道路。此外,nvidia预计将在今年晚些时候发货提供旗下首个基于arm的grace服务器级处理器。虽然我预计nvidia的grace最初将用于nvidia自己的dpu和其dgx深度学习产品,而在更广泛的市场中存在太多的机会,nvidia无法忽视。
来自本土产品的竞争也将加剧。例如,阿里巴巴已经宣布正在部署其内部设计的倚天710处理器,该处理器提供189个与arm兼容的cpu内核。尽管一些提供商拥抱安培,但关于亚马逊的一些最接近的竞争对手正在进行内部开发工作的猜测仍在继续。
arm进入服务器领域的道路颇具讽刺意味,同时也为更多的替代架构铺平了道路。公共云生态系统采用arm,这表明基于arm的服务器是可行的。it组织已经调整了软件和操作工具链,使之与处理器无关。因此,进入一个新的处理器架构(如risc-v)的门槛就较低了。
risc-v不需要支付专利费和许可费,因此可以从价值链中去除更多的利润。另一方面,risc-v不是由像arm这样的中央机构控制,所以几乎不能保证不同的risc-v部件之间的互操作性。
这并不能阻止市场的尝试。ventana微系统公司已经出现,ventana计划用旗下的veyron处理器将risc-v引入服务器和嵌入式领域。对于risc-v和ventana来说,现在还是早期阶段,但务必继续关注这两家。其价值主张十分强大,ventana有合适的管理团队来推动其实现目标。
分析师的看法
基于arm的处理器提供真正的价值。这篇文章集中讨论了arm对超大规模公司的吸引力,大体上忽略了向it终端客户提供的引人注目的价值。aws的graviton、安培计算的altra、甚至nvidia的grace为云原生工作负载提供了一个几乎理想的环境。
x86处理器并没有离场的危险。英特尔和amd共同控制着行业内几乎所有的内部服务器产品以及超过90%的可用公共云实例类型。诸如arm和risc-v等替代架构的价值非常引人注目,这只会导致在公共云和超大规模领域的更多采用。
真正的问题是,服务器oem厂商是否会将arm纳入他们的内部部署产品和即服务的产品。如果像我被告知的那样,oem厂商真的看不到市场扩张的机会,那么也许oem厂商会听到客户要求提供基于arm的服务器的声音。今天几乎每个企业都在关注esg(环境、社会和公司治理(environmental,social,and governance)的英文缩写),基于arm的服务器将有助于缓解这些问题,同时悄悄地提供所需的性能。这么一说还真是精彩。