浪潮信息发布源2.0基础大模型，千亿参数全面开源-凯发官网首页

凯发官网首页-凯发k8官网下载

凯发官网首页-凯发k8官网下载
- 业界动态 it要闻 e-works动态资讯记者观察新闻现场

» 凯发官网首页-凯发k8官网下载 » 资讯 » 正文

浪潮信息发布源2.0基础大模型，千亿参数全面开源-凯发官网首页

2023年11月28日来源：浪潮信息
关键字：

11月27日，浪潮信息发布"源2.0"基础大模型，并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

当前，大模型技术正在推动生成式人工智能产业迅猛发展，而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑，但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面，源2.0提出并采用了一种新型的注意力算法结构：局部注意力过滤增强机制(lfa：localized filtering-based attention)。lfa通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确、更人性，提升了模型的自然语言表达能力，进而提升了模型精度。

数据方面，源2.0通过使用中英文书籍、百科、论文等高质量中英文资料，降低了互联网语料内容占比，结合高效的数据清洗流程，为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据，我们清洗了从2018年至今约12pb的互联网数据，但仅获取到了约10gb的数学数据，投入巨大，收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集，源2.0采用了基于大模型的数据生产及过滤方法，在保证数据的多样性的同时也在每一个类别上提升数据质量，获取了一批高质量的数学与代码预训练数据。

算力方面，源2.0采用了非均匀流水并行的方法，综合运用流水线并行优化器参数并行数据并行的策略，让模型在流水并行各阶段的显存占用量分布更均衡，避免出现显存瓶颈导致的训练效率降低的问题，该方法显著降低了大模型对芯片间p2p带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。

源2.0作为千亿级基础大模型，在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试，测试结果显示，源2.0在多项模型评测中，展示出了较为先进的能力表现。

源2.0采用全面开源策略，全系列模型参数和代码均可免费下载使用。

责任编辑：

关键词阅读

相关资料

e-works
官方微信

掌上
信息化

排行榜

1

aveva剑维软件：构筑工业智能新范式

2

从新能源汽车高速增长，看消费行业数字化发展趋势

3

钉钉与g7易流科技达成战略合作，共建ai联合实验室

4

ptc：汽车软件大时代，如何提升软件工程创新力？

5

光谷湾区携手共创，企业现场签约落户

6

五大亮点抢先看！产品创新数字化年度盛会即将开启

7

惠普打印机秋季新品震撼登场

8

信通院发布《光计算技术与产业发展研究报告（2023年）》

9

ibm发布ai战略，展示大量客户ai应用成果

10

工信部：推进5g网络在工业企业、园区的深度覆盖

1

美擎以“数绿融合”助推工业园区转型升级

2

再访欧洲，问道智造，e-works举行第十二届德国-丹麦工业4.0考察

3

问道泉州，东南智能制造论坛成功举行

4

迈向智能制造，青云云易捷助力企业数字基础跃升

5

aveva剑维软件：构筑工业智能新范式

6

欢迎参加中国·光谷软件产业恳谈会，相约深圳腾讯总部大厦

7

从新能源汽车高速增长，看消费行业数字化发展趋势

8

e-works vip智库双十一超低折扣来袭！更有京东e卡免费拿！

9

全面拥抱向量检索能力,阿里云数据库智能助手全新亮相

10

2023云栖大会开幕致力于打造ai时代最开放的云

1

年度全球技术盛宴：future.industry 2023报名开启，了解仿真、hpc、人工智能及数据分析的精彩融合！

2

达索系统ceo访华，阐明未来十年战略主张

3

凸显价值引领，美云智数传递灯塔|数字工厂经验

4

ptc有史以来最大并购案，14.6亿美元收购servicemax

5

智能制造高质量发展高峰论坛中的海克斯康“表达”

6

智能制造“两会”在京盛大开幕

7

智能制造盛会圆满落幕，六大趋势揭示高质量发展之道

8

ptc：对cad市场发展趋势的五个预测

9

ibm创新方案助一汽-大众实现数据平稳、高效迁移

10

洞见智造未来，智能制造年度盛会揭示六大趋势

1

联想工程师登上中国冰雪之夜舞台，讲述冬奥“0故障”背后的故事

2

让it运维实现轻交付联想serviceforce突破行业难题

3

聚焦数字化变革，联想用“新it”赋能企业数字化转型升级

4

e-works网站vip社区e币规则

5

西部数据进一步扩展旗下智慧视频凯发k8官网下载的解决方案

6

角逐智能制造赛道，联想如何以新it引擎突围

7

守望相助不虚度,学习智造上智库

8

什么是数字化？有哪些成功案例？

9

用户即将告别个人信息泄密 “恐惧症”？

10

ptc 4.7亿美元并购onshape，布局工业软件云化时代

编辑推荐

浪潮信息发布源2.0基础大模型，千亿参数全面开源

文章推荐

博客推荐

视频推荐

: 2023/7/28

: 2023/7/12

: 2023/7/12