亚马逊云科技在2023 re:invent全球大会上,宣布推出五项新功能,帮助客户加速构建、训练和部署大语言模型和其他基础模型。随着模型不断改变各行各业的客户体验,amazon sagemaker让企业更轻松快速地构建、训练和部署支持各种生成式ai使用场景的机器学习模型。为了成功使用模型,客户需要先进的功能来高效管理模型的开发、使用和性能。这就是falcon 40b和180b、idefics、jurassic-2、stable diffusion以及starcoder等大多数业内领先的模型都在amazon sagemaker上训练的原因。
今天的宣布包括了一项新功能,进一步增强了amazon sagemaker的模型扩展能力并加速了模型的训练。此外,amazon sagemaker推出的另一项新功能,能够通过降低模型部署成本和延迟时间,优化了管理托管的机器学习基础设施。亚马逊云科技还推出了新的sagemaker clarify功能,可以让客户在负责任地使用ai的基础上,根据质量参数更轻松地选择正确模型。为了帮助客户在企业范围内应用这些模型,亚马逊云科技还在amazon sagemaker canvas中引入了新的无代码功能,让客户更快、更容易地使用自然语言指令准备数据。同时,amazon sagemaker canvas继续推动模型构建和定制的普及,让客户更轻松地使用模型提取洞察、进行预测和使用企业专有数据生成内容。这些创新均基于amazon sagemaker丰富的功能,帮助客户实现规模化机器学习创新。开始使用amazon sagemaker,请访问。
足够的可伸缩算力的就位、海量数据的爆炸,以及机器学习技术的快速进步,正在促使包含数十亿参数模型的兴起,使它们能够执行各种任务,如撰写博客文章、生成图像、解决数学问题、进行对话和根据文档回答问题。如今,成千上万的客户,例如3m、阿斯利康(astrazeneca)、法拉利(ferrari)、lg ai research、瑞安航空(ryanair)、汤森路透(thomson reuters)和先锋领航集团(vanguard)等,每月在amazon sagemaker进行超过1.5万亿次的推理请求。此外,像ai21 labs、stability ai和technology innovation institute等客户也正借助amazon sagemaker训练拥有数十亿参数的模型。随着客户从构建主要针对特定任务的模型转向构建支持生成式ai的大型通用模型,他们必须处理大量数据集并进行更复杂的基础设施设置,同时在这个过程中还要不断优化成本和性能。客户还希望能够构建和定制自己的模型,以创造独特的客户体验,体现企业的声音、风格和服务。自2017年推出以来,amazon sagemaker已经新增了380多个功能和特性,为客户提供了规模化构建、训练和部署可投入生产的大规模模型所需的一切。
"机器学习是近年来影响深远的技术变革之一,所有企业组织都对模型产生了浓厚的兴趣。这也给那些希望快速构建、训练和部署模型的客户带来了新的挑战。" 亚马逊云科技人工智能和机器学习副总裁bratin saha表示,"从加速训练、优化托管成本、降低延迟到简化基础模型的评估,再到扩展无代码模型的构建能力,我们的使命是让各种规模的企业平等地使用高质量、高成本效益的机器学习模型。今天,我们再次增强amazon sagemaker,通过全托管、专门构建的新功能帮助客户充分获得他们在机器学习方面的投资回报。"
新功能让客户更轻松快速地训练和操作模型,驱动生成式ai的应用
随着生成式ai的持续发展,许多新兴应用都将依赖于模型。然而,大多数企业在调整基础设施以满足新模型需求时存在困难,很难高效地实现规模化训练和操作。今天,amazon sagemaker增加了两项全新功能,旨在帮助减轻规模化训练和部署模型的负担。
amazon sagemaker hyperpod消除了为训练模型而构建、优化机器学习基础设施的繁重工作,将训练时间缩短了高达40%。amazon sagemaker hyperpod预置了amazon sagemaker的分布式训练库,使客户能够自动将训练工作负载分布到数千个加速器上,以便并行处理工作负载,提高模型性能。此外,amazon sagemaker hyperpod通过定期保存检查点以确保用户能够不间断地训练模型。当训练过程中发生硬件故障时,amazon sagemaker hyperpod会自动检测故障、修复或替换有故障的实例,并从最后保存的检查点恢复训练,无需客户手动管理这一过程,协助客户在分布式环境中进行数周或数月的训练而无需中断。
新功能能够帮助客户评估任意模型,并根据使用场景选择更适合的模型
现在,客户在为生成式ai应用程序挑选模型时有很多选择,他们希望能快速比较这些模型,并根据相关质量和负责任的ai参数(如准确性、公平性和鲁棒性)找到更适合的选择。然而,当比较执行相同功能(例如文本生成或摘要)或属于同一系列(例如falcon 40b与falcon 180b)的模型时,每个模型在各种负责任的ai参数上表现都不相同。即使是在两个不同数据集上微调相同的模型,性能也存在差异,这将很难确定哪个版本效果更佳。如要开始比较模型,企业必须先花费数天时间识别相关标准,设置评估工具并对每个模型进行评估。尽管客户可以访问公开可用的模型标准,但他们通常无法根据代表特定使用场景的提示词来评估模型的性能。此外,这些标准通常难以理解,也不适用于评估品牌声音、相关性和风格。另外,企业还需经过耗时的手动分析结果的过程,并对每个新使用场景或微调模型重复此过程。
amazon sagemaker clarify现在可以帮助客户根据所选参数评估、比较和选择适合特定使用场景的最佳模型,以支持企业负责任地使用ai。借助amazon sagemaker clarify的新功能,客户可以轻松提交自己的模型进行评估,或通过amazon sagemaker jumpstart选择模型。在amazon sagemaker studio中,客户可以选择要针对给定任务进行比较的模型,例如问答或内容摘要。然后,客户选择评估参数并上传自己的提示词数据集,或者从内置的公开数据集中进行选择。对于需要复杂人工判断的敏感标准或精细内容,客户可以选择使用自己的员工或由sagemaker ground truth提供的托管工作人员,使用反馈机制在几分钟内审查回复。一旦客户完成设置过程,amazon sagemaker clarify将会运行评估并生成报告,以便客户可以根据性能标准快速评估、比较和选择最佳模型。
全新的amazon sagemaker canvas增强功能使客户更轻松、更快速地将生成式ai集成到工作流程中
amazon sagemaker canvas帮助客户构建机器学习模型并生成预测,而无需编写代码。此次发布扩展了amazon sagemaker canvas现有的即用功能,帮助客户在无代码环境中使用模型来支持各种使用场景。
hugging face是一家领先的机器学习公司和开放平台,它为ai构建提供了开放的基础模型以及创建模型所需的工具。"hugging face一直在使用amazon sagemaker hyperpod创建重要的最新开放基础模型,如starcoder、idefics和zephyr,这些模型已被下载了数百万次。"hugging face产品负责人jeff boudier表示,"amazon sagemaker hyperpod专为高可用和性能构建的功能使我们的开放科学团队能够专注于创新,并改进基础模型的构建方式,而非管理基础设施。amazon sagemaker hyperpod能够检测到机器学习硬件故障,并快速替换有故障的硬件,且不会中断正在进行的模型训练。由于我们的团队需要快速创新,该自动化作业恢复功能帮助我们在基础模型训练过程中减少中断情况,让我们在一年内便节省了数百小时的训练时间。"
领先的人工智能客户关系管理(crm)平台salesforce,凭借数据、ai和crm,提高了生产力,创造了可信的客户体验。 "我们对基础模型采用了开放的方式,而amazon sagemaker是一个至关重要的组成部分,帮助我们扩展架构并加速市场推广。"salesforce工程副总裁bhavesh doshi表示,"利用新的amazon sagemaker推理功能,我们能够将所有模型放入单一的amazon sagemaker端点,该端点可以自动处理所有资源分配和计算资源共享,在提高性能的同时降低了基础模型的部署成本。"
汤森路透(thomson reuters)是一家领先的信息领域提供商,也是全球值得信赖的新闻机构之一。 "我们的工程师面临的一个挑战是在高峰季节有效管理客户呼叫资源,以确保雇佣合适数量的客服人员来处理激增的咨询。"thomson reuters人工智能、商业智能和数据平台副总裁maria apazoglou表示,"对包含呼叫量、等待时间、日期等关键指标的呼叫中心数据进行历史分析是一项耗时的任务。我们的团队正在利用amazon sagemaker canvas中新的数据准备和定制功能,对公司数据进行模型训练,从而识别影响高峰时段呼叫量的模式和趋势,这让我们使用自有数据构建机器学习模型变得非常简便。我们期待通过amazon sagemaker canvas增加对基础模型的使用,而无需编写任何代码。"
关于亚马逊云科技
自2006年以来,亚马逊云科技(amazon web services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过240项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及32个地理区域的102个可用区,并已公布计划在加拿大、德国、马来西亚、新西兰和泰国新建5个区域、15个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构,都信赖亚马逊云科技,通过亚马逊云科技的服务支撑其基础设施,提高敏捷性,降低成本。要了解更多关于亚马逊云科技的信息,请访问:。